导语:彭博社网站今天刊文称,利用深度学习技术,4名不懂日语的工程师开发出了一款日文手写识别软件。这表明了深度学习人工智能的潜力。
以下为文章全文:
现实世界的人工智能正在以出乎意料的方式呈现在用户眼前,而发展速度也要比人们想象中更快。
尽管AlphaGo赢得围棋比赛令人印象深刻,但机器学习技术的应用还有更多。在几个月时间里,4名完全不懂日语的工程师开发了一款软件,能准确识别日文的手写文字。
来自Reactive的这些程序员开发的应用识别准确率高达98.66%。这家位于东京的创业公司成立只有18个月。近期,全球开发者和投资者都在试图挖掘神经网络的潜力,将人工智能应用至更贴近现实的场景,而不仅仅是回答问题或赢得棋类游戏。
作为机器学习专业的博士生,大卫马尔金(David Malkin)表示:“几年前,只有真正的天才才能去做这件事。目前,聪明人都能开发出有用的工具。未来更多的是发挥想象力,将这一技术应用至真实的商业场景。”
神经网络通过模拟的多层神经元去“看到”信息,这一技术正越来越复杂,与人类的视觉神经类似。
人工智能的开发以往只属于谷歌、Facebook和其他科技巨头。目前,任何深度学习创业公司都可以使用云计算平台,而微软、英伟达和亚马逊将人工智能当作一种应用工具去销售。
Reactive的技术表明,在某个领域没有太多经验的小团队也能开发出复杂的应用。困难之处在于找到商业模式。关于这一问题,Reactive希望帮助日本的学校批阅试卷。日本目前的考试仍基本采用手写答卷,而这项技术有可能变革这一领域。
马尔金和他的同事,包括乔伊布拉德(Joe Bullard)、菲利普莱米(Philippe Remy)和菲利普伊里(Philip Irri)正迅速取得进展。布拉德今年早些时候在谷歌日本总部的聚会上向人工智能的爱好者展示了该团队的成果。软件表现得非常完美。
尽管英文的手写识别对深度学习技术来说难度不大,但日文的手写识别情况完全不同。这是由于,日文中包含日本汉字,需要单独处理。日文中常用的汉字达到2000多个,而这些汉字往往有多个笔画。Reactive的算法利用神经网络进行模式匹配,逼近最准确的结果。该公司用约180万个手写汉字对这一神经网络进行了训练。
富士通实验室项目负责人冈本青史(Seishi Okamoto,音)表示:“这项技术能在某个领域获得专业性,在商用的速度和可扩展性方面取得优势。”该实验室正在开发软件去识别中文。冈本青史表示:“用于手写中文识别的深度学习已达到人类的水平,很有可能即将超过人类水平。”
尽管Reactive的技术已经在谷歌等公司的活动上进行了公开展示,但数据尚未得到独立验证,或是获得同行业人士的评价。
与基于硬性规则的传统算法不同,深度学习人工智能技术模仿了人脑处理信息的方式。只要给予足够多的数据作为输入,并设定期望的输出结果,神经网络就能自动进行中间过程的处理,从而找到不同于传统方法的解决方案,例如语音表达和照片标记。
蒙特利尔大学计算机科学教授约书亚本吉奥(Yoshua Bengio)表示:“这涉及到多方面因素:高性能计算成为了廉价商品,大规模数据集成为了可能,而基础科学研究也在不断进步。工具的民主化帮助第二层用户更方便地开发新应用和新产品。”
所有这一切都在加速人工智能技术的开发。根据CB Insights的数据,2015年,专注于教育、零售和农业等领域的人工智能创业公司获得的投资达到了3.1亿美元,在5年时间增长了近7倍。