百度1月19日在首都体育馆召开2012年年会,CEO李彦宏指出百度未来四大业务方向中,移动云与LBS占据了半壁江山。而他宣布的另一个消息更值得引起注意:2013年百度将建立初期专注于Deep Learning(深度学习)的研究院,并命名为Institute of Deep Learning(简称IDL)。
Deep Learning
如何深度
“深度学习让机器执行人类的活动,如看、听和思考,为模式识别提供了可能性,促进了人工智能技术的进步。”这是出现在2012年12月29日《纽约时报》的头版报道。
“深度学习”源于传统的DNN(神经网络)技术,而“神经网络”最早可以追溯到20世纪五十年代后期。当时,弗兰克·罗森布拉特试图建立一种类似机械大脑的感知器,可以“感知,识别,记忆,像人的思维做出响应的机器”。在一定范围内这个系统能够识别一些基本的形状,如三角形和正方形。80年代后,神经网络一度发展,但成效不是太大。到2006年,神经网络才在“深度学习”的创新下取得突破进展:通过对特征空间按照层次分层建模,进行深入挖掘图像和语音特征,由此可以大幅提升识别率。
最近百度的语音和图像产品的崛起,正是受益于Deep Learning领域的技术突破。百度语音助手“语音指令、语音搜索、语音问答”等功能,正是通过深度神经网络技术来实现的。而在百度识图中,则借鉴的是认知学中的一些概念与方法,探索出了独特的相似度量学习方法来寻找图像的相似性和关联。得益于上述技术优势,这些上线不久的产品以后发姿态成功拿下用户。
但是很显然,这样的收获还仅仅是李彦宏理想目标的一个起步,否则IDL也不会在年会这样一个万众瞩目(鉴于百度工程师团队的人数,这个成语已经不是形容词了)的场合下亮相。从基础架构的意义上说,百度的整体产品群落都将从Deep Learning技术的进步中获益。在可以预见的未来,IDL的主管将会“牛仔很忙”。
Deep Learning
谁来学习
Deep Learning在全球互联网以及广义计算机产业的影响已经无需赘述,看看苹果的Siri、谷歌的街景视图,让用户觉得酷炫的,正是Deep Learning推动语音识别和计算机视觉这些方面产生的创新。
而把视线转回国内,百度是中国互联网企业中第一个把Deep Learning提到核心技术创新地位的企业。这个倒也不是很难理解。因为Deep Learning不仅依赖于云计算对大数据的并行处理能力,作为解决数据“抽象概念”问题的算法,它同样需要有足够学术意义和产业价值的研究方向作为依托。
云计算和大数据无疑是百度的看家本领。不久前,李彦宏参加“极客公园创新大会”时就曾透露,百度的人脸识别技术最初的设想是应用在百度自己的相册产品里。当他问为什么不应用到全网时,出身实验室的技术负责人的第一反应是“成本会很高,需要很多服务器”。但是,在百度的云计算实力面前,这个问题立刻不成为问题,百度以图搜图的准确率也由此从20%瞬间提升到80%。
2012年8月举行的第18届ACM知识发现与数据挖掘学术年会上,李彦宏就曾经向世界一流研发人员提出了“希望学术界解决的九大技术难题”,其中语音识别、图像识别都位居前列。2012年李彦宏成立百度多媒体部,挂帅的技术副总监余凯是国际会议ICML和NIPS的领域主席,这个部门的主管则是百度基础技术领域首席科学家、刚刚成为自然语言处理领域世界上影响力最大、也最具活力的国际学术组织之一ACL五十年历史上唯一华人主席的王海峰。并且百度在北航、南开等多所院校已早早建立联合实验室。
在李彦宏的眼中,百度IDL的目标是成为“AT&T-Bell labs,Xerox PARC这样的一流的研究机构”。如果真如李彦宏所描绘的,这将是新的“微软亚研院”,会对智能技术领域产生重要影响。
中国企业从需求导向开始向创新导向发展,科学研究的中心也将向企业转移,就像最早的基于电子计算机的语音识别系统就是1952年由AT&T贝尔实验室开发的Audrey语音识别系统,而乔布斯则因为从帕洛阿尔托的施乐公司帕克研究中心习得了视窗技术,长期被称为“盗火者”。IDL燃起的这把新火苗势必将在这个寒冬里点燃中国移动互联网的生机。