习大大曾说,人工智能是第三代技术。而麻省理工学院科技杂志,也将人工智能技术列为十大通用技术之首。人工智能主要指哪些技术?称从诞生的第一天起就是一家人工智能公司的百度,是如何进行“深度学习”的?百度大脑和百度Eye背后的逻辑是什么?
9月3日,在北京中国大饭店举办的“百度世界2014之大数据论坛”上,百度研究院副院长、深度学习实验室(IDL)主任【余凯】进行了题为“百度大脑:让连接更加智能”的演讲,分享其从事深度学习构建百度大脑的思考。详见——
百度,一家人工智能公司?
百度从诞生的第一天起就是一家人工智能公司。
一方面我们通过搜索引擎满足用户每天的搜索请求,产生大量的用户数据。另一方面我们提供服务,连接人和广告,让千千万万的商家能够找到他的客户资源。
这种资源从数据到价值之间有一个桥梁,这个桥梁在百度就是基于百度大数据人工学习,包括自然语言的理解,包括语音识别、图象识别等技术,使得百度能够把大量的海量数据转化成商业价值。
这是嘎纳每年都要发表的趋势表,显示出科技往前发展的趋势。HAK是什么意思?
比如说3D打印到现在有一个顶点。因为当前技术不是那么成熟,大家对它的期待会降低,但随着市场不断往前推进,技术不断推进的同时,技术也会逐渐推进,比如语音识别,图像识别。
这里面大量的技术,比如说语音识别、海量识别、智能推荐,都是跟人工智能有关。人工智能就是如此重要,包括前几天我们看到在美国的Google、Facebook,都相当重视人工智能。在中国,百度同样非常重视。据了解,在中国,我们的领导人习总说,人工智能是第三代技术。
人工智能取得最突破性的进展并且迅速在工业界产生影响,就叫深度学习。同样这也是麻省理工学院科技杂志将人工智能技术列为十大通用技术之首的原因。
百度是最早把深度学习做为公司的核心战略方向的高科技公司。去年初,百度宣布成立深度学习实验室即IDL。
这是百度历史上第一次宣布成立研究机构,今天早上百度高级副总裁王劲的演讲中也提到百度研究院,它共拥有三个实验室,都是在人工智能方向去往前拓展和发展。IDL的核心就是研究基于大数据的人工智能。
机器学习共分为两个阶段:第一阶段是浅层学习;第二阶段从2000年开始进行更深层的学习,包括中间的。
而深度学习最吸引人的一个原因是,它在很大程度上模拟了人脑的神经和结构。
目前,我们所知道的比如说对图像的处理,深度识别的网络,每一个神经元,跟对人的视觉提升神经元的结构惊人类似,我们同样发现人对听觉感知也有类似的情况。
深度学习,智能连接人和信息
首先当用户来到百度平台,表达搜索需求,这个搜索需求有可能是关键词,也可能是一段话,还可能是一段语音,就要靠百度自己识别,这个意义就在于精确识别。
这个结果就在于Rank用户这个搜索排序,我们在显著提高排序相关性,匹配用户需求。
第三就是广告和服务,我们通过大规模的深度学习,去估计和优化它的转化率,进而转化广告率。深度学习用在百度业务的方方面面,真正实现智能连接人和服务,智能连接人和信息。
深入百度大脑,百度大脑里用到的叫深度典型神经网络的模型。它是百度大脑用于自然语言去匹配query识别的相关性,可以说这是搜索引擎语意相关性,深度自然语言最相关的例子。
我们的凤巢系统,它背后基于机器学习的典型模型,从浅层的神经网络,到用更复杂的模型、更深的模型。
同样,大数据实际上给深度学习和人工智能带来很大的机会,拥有大数据、大知识、大积累,给我们带来了新的挑战。怎么样去处理?
我们最大规模的利用GPU学习,我们通过各种各样的数据变形,模型变形去处理这些海量数据。我们还可以支持,生成,配置针对不同的应用、不同的场景和不一样的网络结构。
目前,在中文语音移动搜索的方面我们现在做到了世界领先,这是跟我们国际上主要竞争对手的比较结果。
深度学习还可以像人一样读懂文字。比如我一个外国朋友在上海看到某个菜单,想知道这个菜单中是否满足他想要的菜品需求,他拍照用百度翻译,键入牛肉拉面,通过识别后翻译并有语音的生成。
不仅是中文,在英文识别方面,百度也都努力做到了世界领先。人不一定都认识的词句,但是我们的机器能够识别。百度拥有世界领先的基于内容的图像搜索技术,比如竞争对手比,在图像识别,搜索结果中我们是最为领先的。
两个礼拜前,百度推出了百度移动搜索APP百度5.5版本。这是世界上第一款基于深度学习的拍照搜索,拍书可以知道这个书的价格,知道它在哪里能够买到,小朋友拿着爸爸妈妈的手机,看着好玩的玩具直接下单,这是多么开心的一件事情。
比如你要是去街上看见朋友的衣服或者是包包非常好看,拍了直接可以下单。
百度大脑以前是获取互联网信息,然后做搜索做广告,所有一切都是在虚拟世界完成,但是现在所有的服务离现实世界越来越近,离人越来越近,所以我们通过自然交互,通过穿戴式,了解用户需求。
另外,物理世界比如商店、场景、街道等都跟人息息相关,我们通过识别推荐更加相关的识别。以前完成一个预测,完成一个建议,人去做,下一步机器能不能识别?
比如某一个人想吃披萨,是否能以最快的速度把这个披萨送到他家里。感知能力、决策能力还有不断学习的能力,机器人或者是无人驾驶等,未来的服务将会更智能。
智能穿戴,应该是人体功能的自然延伸
百度还能做哪些服务去影响人的生活?
现在每个人每天都会用移动设备进行大量拍照,移动摄像头已经往下延伸,比如说2014年后会发生什么事情,我们不断在思考,然后去延伸这款设备是这样一种形态。
过去在智能穿戴行业,智能眼镜成为智能穿戴设备的一个品类,大家都在探讨它的应用场景,应该怎么样往前,但我们觉得它可能是要纠正,它应该是自然延伸。在百度看来,这个“自然”非常非常重要。
这就是我们思考的一个结果。我们非常强调它是Eye,不是Glass。Eye是长在人身上的,Glass是附带的。
它就像一个助手一样,它真的知道你无时无刻在想什么东西,真的把互联网后台的服务变成你的大脑,让你看到和知道如何去更加精准决策。
比如百度Eye,有了这样一款设备,我们整个世界都将变成一个大的橱窗。