让机器像新生儿的大脑一样进行自我学习和思考,这听上去不可思议的场景正在谷歌代号为“Google X”的秘密研发部转变为现实。
近日,Google科学家杰夫·狄恩(Jeff Dean)告诉《第一财经日报》记者,“Google X”实验室通过连接16000台计算机处理器,创建了一个机器学习的神经元网络系统。结果发现,这个系统自己学会了对猫的辨认。
去年夏天, Google X利用这一由16000多个处理器、10亿个内部节点组成的虚拟大脑,分析了1000万帧从Youtube上随机抓取的无标签视频剪辑图片,经过了10天时间的运转,“大脑”终于认识了什么是猫,并从接下来输入的2万张图片中准确找出了猫的照片。
和传统的机器视觉技术不同,它们是根据人类的指令进行学习,从而识别出某些特性。但在谷歌研究中,工程师们无需预先向机器输入某一概念,该系统就能在并未得到任何外在帮助的前提下“自学成才”。
“我们在训练的时候从未告诉过那是"猫",系统只是自行创建了猫这个概念。”杰夫·狄恩告诉记者,“大脑”是自己从未标记的YouTube静态图片中发现了猫是什么样子,这就是“自我学习”。
他向记者解释谷歌机器学习的理念:用众多的电脑模拟人脑中的“神经元”,形成一个“神经网络”。它不需要借助大批研究人员帮助电脑标明事物之间的差异,只要为算法提供海量的数据,“神经元”与“神经元”之间的关系将会发生变化,让数据自己说话,让组成“神经网络”的机器具备自动学习、识别数据的能力,在新的输入中找出与学到的概念对应的部分,达到识别的效果。
例如,在看过数百万张图片后,谷歌的虚拟大脑将自己构建出一张理想的猫的图片,利用不同层级的存储单元成功提炼出猫的基本特性。有科学家认为,这似乎是在控制论层面模拟了人类大脑视觉皮层的运作方式。
不过这一机器学习技术并不仅仅局限在图像方面。目前,Google正在将该虚拟人脑用于提升语音识别的准确率。杰夫·狄恩介绍,GoogleX团队曾和谷歌语音识别团队有过一次合作,5天内在800个机器上进行训练,就单字错误检出率而言,该系统已让Google的语音识别准确率提升了25%,这相当于研究语音识别20年的成果。
但目前,这一研发只有一年半的实验项目,距离商用或许还有不远的距离。杰夫·狄恩说,现在机器学习技术还未达到完美,有时出现劣质的转录文本、滑稽的翻译结果或者错误识别的图像,但相信在未来,机器学习可以变得更准确,越来越聪明。他预计,未来这项机器学习技术将用以帮助实现高质量的语音识别、实用型计算机视觉、拦截垃圾邮件,甚至应用于谷歌自动驾驶汽车。
有外媒报道,曾有加拿大蒙特利尔大学的一位研究机器学习的教授YoshuaBengio在看了谷歌的演示后表示,谷歌的虚拟人脑技术让人类离人工智能的终极目标又进了一步。“事实上,该系统的运行模式已经和哺乳动物甚至人类大脑的某些工作模式有些像了。Google的这个虚拟人脑有点类似于哺乳动物大脑中一个叫做视觉皮层的部位,能够通过视觉发现物体。” YoshuaBengio说。
这是否意味着出现了机器代替人脑的苗头?杰夫·狄恩给出的答案是:“谁也不能预测未来10~20年机器学习的发展方向。”他提到,目前谷歌机器学习仅限于认知类的简单工作,至于说帮助人们做规划、协调工作关系等等,恐怕需要另外一些能力。
从计算技术角度来说,神经网络成本非常昂贵。杰夫·狄恩并没有给出具体的数字,但介绍,通常机器学习领域使用的大多数网络中只使用了100万到1000万个连接。但谷歌现在正在积极扩展系统,以训练更大规模的模型。
“虽然现在还没有公认的方式将人工神经网络和生物大脑进行对比,但为了让大家大概地感觉到所谓的"更大规模",可以和人脑做一个很粗略的比较 —— 普通成人大脑大约有100万亿个连接。在这一领域,更大规模机器学习有着难以想象的发展空间。” 杰夫·狄恩说。