很快,我们可能就会在某些地方看到机器人,但实际上,短期内我们不会看到机器人穿行于街道,也不会看到它们游走在办公室。一个重要的原因就是机器人至今无法真正“看见”世界,在谈论机器人未来如何看见世界前,我们先要讨论一下“看见”的真正意思。
“我看见你”
大多数人有两只眼睛,它用来收集物体反射的光线。眼睛将光线转化为电信号,传送到视神经,大脑瞬间对信号进行处理。根据电脉冲和人的体验,大脑判断我们身边的物体是什么。它向我们呈现世界的模样,我们用它来导航,来捡起东西,用它来看见别人的脸,做其它无数的事。
研究人员发现,大脑最多会有50%参与到视觉处理中去。几乎世界上所有的动物都有眼睛,都能以某种方式观看。大多动物(尤其是昆虫)的大脑比人简单得多,但它们的视觉功能很好。
这说明一个事实:即使没有人脑一样强大的运算能力,以其它形式 “看见”仍然是可以的。在进化的过程中,“看”能力的出现无疑是一个重要的里程碑。
机器人视觉
许多机器人研究者预测,如果机器人能“看见”,它就可以迅速普及并最终成为人类的帮手,这恰恰是许多人期待的。
自从20世纪70年以来,机器人视觉工程师就一直在研究图像的特点,比如说角落和纹理可能就是线或者有趣的点。于是工程师编写算法去找到这些特征,从视频一帧一帧的图像中去追踪它。
一张图片有几千万像素,采用这种方法可以将海量的数据大幅削减,只需要掌握几百或者几千个特征就行了。
不久之前,计算能力还受到限制,现在有了很大的进步。工程师们开始思考机器人到底想看见什么,想做什么。他们编写软件建立识别世界的模式,帮助机器人理解它身边的一切。
本地环境
当机器人运行时,软件可能会为环境建立基本模式,它可能会将自己找到的特征和特征库匹配,最终找到自己想要的。
遗憾的是这样的系统仍然不太可靠,它无法防止机器人碰撞,无法投入到实际使用中去。最近媒体谈论的无人驾驶汽车就是用激光或者雷达来补充视觉系统的。
在过去5到10年里,一个新的机器人视觉研究社区开始形成。研究人员没有采用编程的方法展开研究,而是要让机器人学会如何自己观看。
他们开发了机器人视觉系统,其架构构思来自于科学家对动物视觉的认识。他们使用了一个名叫“神经元层”的概念,它和动物的大脑相似。工程师为系统架构编程,但没有开发运行系统的算法。算法交给机器人自己去解决。
这门技术就是所谓的“机器学习”,我们现在只要用付出合理的成本就能得到强大的计算力,正因如此“机器学习”技术才开始变得流行起来。大家对这门技术的投资正在加速。
分散学习
机器学习之所以重要,首先是因为它可以让机器人轻易分享学习成果。机器人没有必要像新生动物一样从头学起,将其它机器人的学习体验植入到新机器人中就可以了,在此基础上再提高。
某个机器人也许学会了观察猫,知道它是什么样的,它可以将自己的认知传授给其它机器人。例如,可以让一千个机器人观察不同的猫,彼此通过互联网分享数据,一起学习如何给所有猫分类。这就是分散学习的好例子。
实际上,未来的机器人分享、分散学习会造成深远的影响,它吓坏了一些人,也让一些人兴奋。
很可能你的信用卡现在正在被数据中心自动学习机器调查,它想看看你是不是骗子。系统可以发现人类发现不了的蛛丝马迹。此时,蜂群思维被用来做好事。蜂群思维是一种集体思维,是指由许多独立的单元高度连接而成的一个活系统。
真正的机器人进化
机器人的应用范围广阔,在我们的生活中几乎没有它不可以帮上忙的地方。它首先可能会用在劳动力短缺的行业,如建筑业,或者是天生就不讨人喜欢的行业,如危险行业。它还可以用于灾后搜救,可以将人撤离危险场所,或者用在受到限制、人难以进入的空间。
人很难保持长时间的注意力,在一些需要长时间保持高度注意力的地方,机器人可以派上用常如果机器人可以看见我们,未来家庭式机器人伙伴将大有用武之地。
在手术室,会观看的机器人能成为助理外科医生。机器人拥有超级视力,操作超级精准,手臂和手掌稳定,外科医生只要做好决策就行了。
当机器人医生的蜂群思维形成,人的决策能力也可能被替代。机器人将可以完全代表人做手术。