刚刚过去的2016年是人工智能和机器学习大放异彩的一年,《麻省理工科技评论》发表对2017年人工智能领域发展的预测,技术上看好强化学习、生成对抗网络,应用上强调语音识别,说到中国今年也许会成为人工智能产业的主力军,但“风口化”的炒作需要警惕。
更好的语言理解,人工智能在中国的爆发,还有……
刚刚过去的2016年是人工智能和机器学习的爆发之年,但是2017将会呈现给世人更多的内容。让我们来一起看看哪五个方面值得重点期待吧……
正向强化学习
AlphaGo战胜李世石不仅是人工智能产业的历史性成功,更使深度强化学习这项技术为人所知并大放异彩。
深度强化学习不是让机器通过一个程序或者一些设定好的案例进行学习的过程,而是通过实验设计和正向强化(positive reinforcement)来学习。正向强化这个概念本身已经存在了数十年(如生物、教育等领域),它与深度神经网络的完美结合使让机器完成下围棋这种高度烧脑的任务成为了可能。通过不断的实验和对之前围棋比赛的分析,AlphaGo靠自己探索出了一条成为围棋盖世高手之路。
下一步对于强化学习的期待是把它应用在更多的实际生活场景中。最近发布的几个模拟环境应该会对这一趋势提供动力,以帮助建立算法让机器通过强化学习掌握更多的技能。
在2017,我们有可能会看到强化学习在自动驾驶和工业机器人领域的尝试。谷歌宣称已经应用深度强化学习优化自己的数据中心,但是这个方案还处在试验阶段,而且还需要耗费大量时间去模拟,所以究竟它到底能达到多高效的程度还处在观望中。
“决斗”神经网络架构
在巴塞罗那举办的NIPS 2016大会上,重点讨论了一种新型机器学习工具,叫生成对抗网络。
这项成果是由OpenAI的科学家Ian Goodfellow发明的。生成对抗网络(GAN)由一个经过训练生成新数据的网络和另一个用于区分准确数据和错误数据的网络组成。当这两个网络同时工作,能产生非常逼真的合成数据。这种方法能用来生成计算机游戏的物理场景,让被像素化的视频更清晰,或者让设计更具时尚感。
Yoshua Bengio是机器学习领域的世界级专家,是Goodfellow在蒙特利尔大学的博士生导师。他在此学术会议上发言说,生成对抗网络使计算机有能力通过未标记的数据来学习。摆脱标记,被认为是使机器变得更智能的关键。
人工智能在中国的爆发
2017有可能是中国开始演变成人工智能产业主力军的一年。中国的科技企业不再止步于抄袭国外公司,而是积极地向人工智能自主研发大踏步迈进。
百度建立自己的人工智能实验室已经有一段时间了,并且已经在声音识别、自然语言处理、广告优化等领域有所建树。其他巨头公司也在向百度看齐:腾讯在2016建立了自己的AI实验室之后开始了大量招聘人才;滴滴也正在筹划建立一个实验室,用于无人车的研发工作。
中国的投资者现在在密切关注着人工智能领域的创业并大笔挥金。中国政府也释放出强烈的信号,承诺在2018年之前投资150亿美元,来共同推动人工智能领域的发展。
语言识别
如果你问一位AI研究者什么是下一个需要被攻克的目标,他们大多会说跟语言相关的。因为语言和图像识别的进步能够促进机器分析、产生自己的语言。
实现机器语言是一个漫长的目标,人们对机器和人类的互动和交流充满了遐想和期待。更好的语言理解能使机器更有用,但是考虑到语言的复杂性、微妙性、感染力,科学界所面临的挑战也是巨大的。
不要期待在短时间内你能和你的手机产生任何有实质交流的对话,但是已经有很多看得到的进展在不断发生,2017也将继续在语言领域带来好消息。
风口的反作用
除了一些实实在在的科技进展外,2016也经历了一些“被风口化”的炒作。尽管很多人对AI的科技价值有足够信心,但是在AI这个话题周围的报道有些铺天盖地且失去控制。
有些AI研究人员不可避免地会经常被骚扰。NIPS的学术研讨会就在开场为一个叫Rocket AI的假公司举行发布会,就是为了讽刺很多在学界围绕AI不务实、盲目夸大的现象。虽然这个活动本身的有效性有待商榷,但是它所反映的问题是真实的。
一个最真实的问题就是如果在科技上的突破没有想象中来的那么快,那之前“所谓的风口论”会将人们引向失望的边缘,就会看到估值虚高的创业公司大量死亡,投资源头走向枯竭。也许2017会反应出一些“风口化”的后坐力,也许回归本原也不是一件坏事。