展会信息港展会大全

NLP技术发展无实质进步,注定无缘独角兽?
来源:互联网   发布日期:2020-09-03 07:38:25   浏览:21672次  

导读:2016 年,阿尔法狗打败了人类最顶尖的围棋棋手,一时间令科技圈对人工智能所展现出的巨大力量感到震动,自此也掀起了第三次 AI 浪潮。AI 已经可以在展现人类最高智慧之一的游戏 围棋中战胜人类了,但为什么它对语言的掌握却可能还不如小朋友?这是 NLP 所面...

2016 年,阿尔法狗打败了人类最顶尖的围棋棋手,一时间令科技圈对人工智能所展现出的巨大力量感到“震动”,自此也掀起了第三次 AI 浪潮。“AI 已经可以在展现人类最高智慧之一的游戏 围棋中战胜人类了,但为什么它对语言的掌握却可能还不如小朋友”?这是 NLP 所面临的现状,有些“尴尬”但确实存在。

现阶段,自然语言处理技术在发展过程中确实还存在不少技术难点和挑战。

一方面,NLP 技术对标注数据依赖性较高,难以在标注数据稀缺的任务、语言或领域内发挥作用。当前主流方法的效果取决于标注数据的规模和质量。为解决这一问题,可以采用基于大规模无监督数据的预训练模型,或者尝试半监督或无监督的方法,包括零样本学习(Zero-Shot Learning)或小样本学习(Few-Shot Learning)方法。

第二是轻量级优质模型问题。当前的主流模型需要消耗大量资源进行训练,这种趋势目前看来有增无减。如何得到轻量级的优质模型是一个挑战性问题。可能的解决方法对现有模型的裁剪甚至另辟新路提出新的模型。

第三也是个长期挑战,即如何让机器像人一样掌握自然语言。这是一个很复杂的综合问题,因为语言与认知是相关的。人类用语言表达自己的思维和逻辑,一个人的语言背后是一个智能个体的思维和知识体系。如果希望机器能够理解自然语言,那么它就需要拥有思维能力和自己的知识体系,在这一点上,可以说自然语言处理技术涉及到了人工智能的终极命题。而突破这个问题可能不会是一个单点的突破,它可能是被划分为非常多的点,例如如何让机器能够有自己的知识体系,如何让它产生自己的逻辑判断等等。另外一方面,现在同时也看到一些最新的庞大的预训练模型,它通过在非常大量的语料上进行训练,展示出了优秀的自然语言能力,能够进行翻译,写作,对一些开放式的问题进行解答,可以说它初步地展现了一种综合的语言能力。因此,也许未来这会是一个有潜力的突破方向。

真的缺乏独立的应用场景吗?

深度学习的发展对计算机视觉的影响远比对 NLP 大。深度学习使得很多计算机视觉任务突然具备了落地的可能,因此这些年来计算机视觉领域在商业化和落地方面取得了一些明显的进展。相对而言,NLP 技术一直在工业界平稳落地,不论是搜索、推荐、信息流、互联网金融还是社交网络,NLP 技术都在其中起着十分重要的作用,正是因为应用已经非常广,加上 NLP 技术本身处于底层支撑地位,给人的感官不明显,所以给人造成了落地、商业化进展很慢的假象。

梳理目前 NLP 在技术和应用的发展格局,不能忽视地是,尽管出现了一些挑战与瓶颈,但整体上纵观整个发展历程来看,NLP 处于快速发展阶段。在技术方面,大的技术突破可能出现在如何有效地利用知识(包括语法知识、领域知识、常识等等)对语言进行理解和推理,将知识融合到各项 NLP 任务中,比如基于知识图谱的问答;如何有效地融合多模态信息处理传统的 NLP 任务方面;此外大型的预训练模型这个趋势尽管已经持续了一段时间了,但在未来一段时间内应该还会是主流的方向,同时会向着多语种、多模态和轻量化三个大的方向演进。值得一提的是,多模态融合未来将是一个大趋势,也是必然趋势,人类能够听、说、看、写,机器人也需要这样的能力。

在应用方面,文本生成技术值得期待。随着文本生成技术的发展,在未来我们也许会看到生成技术被越来越多地用到现有的一些场景中来,同时可能也会出现一些以生成技术为支点的新场景出现。

文章部分素材源自:InfoQ

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港