上周,在英特尔(Intel)开发者大会上,首席执行官布莱恩·科兹安尼克(Brian Krzanich)宣布,该公司正在与谷歌(Google)的“探戈项目”(Project Tango)合作给安卓智能手机带来深度感知能力。
台上的一个演示视频显示了配备英特尔RealSense摄像头的手机如何在短短几秒钟内完成对客厅的3D扫描。表现干净利落,甚至可能让英特尔有机会最终打入移动领域。
英特尔首席执行官布莱恩•科兹安尼克在2015国际消费电子展上介绍AscTec Firefly多旋翼无人机的避撞能力。这种无人机配备了英特尔RealSense摄像头。
但问题是,高通(Qualcomm)已经先人一步。几个月前,在谷歌的开发者大会上,高通为配备自己公司骁龙移动处理器的手机推出了自己的深度感知参考设计。
显然,英特尔和高通都认为计算机视觉领域很快将有大事发生。计算机视觉是指计算机如何处理和理解图像,该技术正在成为这两大芯片巨头之间的最新战场,双方都希望将自己的计算机视觉技术引入手机、机器人、无人机和他们能想到的其他所有东西。
多年来,英特尔一直在努力向PC制造商兜售其深度感知技术——先前叫做Perceptual Computing,后来更名为RealSense。该公司向PC制造商提供软件开发工具包和3D摄像头,好让PC拥有“感觉”。凭借RealSense技术,PC摄像头可以对周围环境进行细致的3D扫描,并学会很多东西,比如纵深。
这家芯片制造巨头已经成功地把RealSense技术引入了几款笔记本电脑和至少一款平板电脑。现在,依靠微软(Microsoft)近期发布的最新操作系统Windows 10,PC能够更好地利用计算机视觉技术,因为Windows 10提供了一项名为“Windows Hello”的功能,可以利用PC上的RealSense技术通过人脸识别来解锁电脑。
但到目前为止,RealSense并未风靡PC世界,原因不难理解。炫酷的PC深度感知和3D扫描技术被囿于用户的办公桌。“现在PC不是令人感兴趣的平台。”科技咨询公司Tirias Research创始人兼首席分析师吉姆·麦克格雷戈(Jim McGregor)说,“很难重新定义PC,使之派上新的用途。”
而在手机和无人机这类可以更加自由地四处移动的设备上,计算机视觉将大有可为。“在便携式手持设备上,深度感知技术的用例将多得多。”高通高级副总裁拉吉·塔鲁利(Raj Talluri)说,“而且现在手机比PC更多。”
作为杰出的移动芯片提供商之一,高通在移动领域大大领先于英特尔。麦克格雷戈表示,英特尔的计算机视觉技术与其说是关乎硬件,不如说是关乎软件。在大多数时候,英特尔试图让RealSense软件与该公司的一般用途中央处理器配合使用,而高通则拥有专门处理图像的芯片——数字信号处理器和图像信号处理器。这使高通的芯片在计算机视觉方面更有效率。
“进行图像处理时,你需要低功率、高性能的芯片,这就是我们在手机上做的事情。”塔鲁利说,“这些不是PC处理器。”
在上周的一次会议上,塔鲁利展示了一个骁龙开发电路板,集成了打造可以感知周围环境的无人机所需的所有部件。目前,无人机的处理器、摄像头、动作控制器、视频编码器、WiFi、GPS等部件通常来自于很多不同的供应商,而高通希望在一块整合了骁龙系统级芯片的电路板上实现所有的那些功能。这将使制造无人机变得更加简单和便宜,也让无人机制造商可以把计算机视觉引入他们的产品,使无人机在自动飞行过程中避免撞上其他物体。
不过,在把RealSense技术引入无人机方面,英特尔已经取得了一些进展。在今年1月英特尔的2015消费电子展主题演讲中,科兹安尼克宣布英特尔正与德国无人机制造商Ascending Technologies合作,为无人机开发避撞技术。随后,英特尔展示了一些配备英特尔RealSense摄像头的无人机,它们在讲台上飞来飞去,避免了彼此相撞。
分析师麦克格雷戈表示,除了手机和无人机以外,计算机视觉技术最激动人心的应用领域是汽车。随着汽车开始变得更加自动化,它们将需要具备处理图像和其他传感数据的能力,以便弄清楚周围有什么,无论是狗、人、卡车还是其他什么东西。
2014年,高通发布了骁龙602A车载芯片。它主要是为信息娱乐系统而设计,但计算机视觉显然处于高通雄心勃勃的进军汽车领域的路线图上。配备骁龙芯片的汽车应该会在明年的某个时候上市。
致力于计算机视觉的科技企业不是只有英特尔和高通两家。对于从芯片制造商到传感器制造商再到软件公司的很多科技企业来说,计算机视觉正在成为重要的业务领域。
英伟达(Nvidia)一直在努力将其图形处理器的深度学习能力应用于自动化汽车的图像识别。周一,微软公布了一个新的研究项目,试图把手机背后的2D摄像头变成3D扫描器,微软研究人员希望在不久后推出iOS、安卓和Windows手机应用。
塔鲁利指出,计算机视觉并非完全是新鲜事物。例如,用手机拍摄全景照片时,摄像头需要将影像匹配起来并防止抖动。自动驾驶的无人机在使用底部摄像头的时候也会做同样的事情,使自己保持平稳。现在几乎所有的数字摄像头都具备某种计算机视觉能力,摄像头需要明白光线怎样,应该如何设置曝光度,聚焦哪里。摄像头根据所获得的信息对周围环境进行推断。
如今不同的地方在于,计算机视觉技术正在不断进步,各公司正在寻找这项技术的更多用途。“那些家伙正在寻找新的市常”麦克格雷戈说。