人工智能时代,懂语言者"得天下",NLP作为人工智能的"掌上明珠",最新发展布局和未来发展趋势究竟如何?
8月25日,即七夕当天,以"掌握知识、理解语言、拥有智能"为主题的百度大脑语言与知识技术峰会以直播形式召开,百度CTO王海峰、百度集团副总裁吴甜、百度技术委员会主席吴华等大咖现身大会,向外界全面介绍了百度在语言与知识领域的整体布局、技术创新及产业实践,并重磅发布多项全新产品和技术等,希望携手学界、产业界合作伙伴推动语言与知识技术发展,为产业智能升级提供原动力。
在这场面对上百万人的极客大秀上,百度作为国内乃至全球NLP领域的"佼佼者",分享了很多重磅内容,可谓AI大佬在线"划重点"。他们到底说了啥?带来了哪些技术干货呢?
亮点一:百度已打造完整NLP技术布局,持续落地提升智能化水平
王海峰表示,"在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。"经过十余年的发展,百度已构建完整的语言与知识技术布局,包括知识图谱、语言理解与生成技术,以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的应用系统,而且百度语言与知识技术硕果正源源不断地以平台化的方式对外输出,在互联网、金融、医疗、教育等诸多领域发挥作用,提升了产业智能化水平。
细品一下,就是说百度语言与知识技术十年发展技术布局完善,实力硬核,这波秀肌肉值得满分!
百度语言与知识的技术实力业界有目共睹,国家科技进步奖等20多个奖项、30多项国内外竞赛冠军、2000多项专利等,成为了百度语言与知识技术实力最好的证明。
技术有多难,就有多重要。语言与知识技术的重要性不容小觑。在回顾完百度语言与知识技术的进程以及最新进展,王海峰引出了峰会中其他三大亮点,首先是百度语言与知识产品的重磅发布和全新升级,其次是数据共建和算力共享计划,最后是百度NLP"十年十人"的发布,进一步为技术和社会进步做出更大贡献!
亮点二:重磅发布3大新产品、6项全新升级,覆盖4大NLP领域重点研究方向
3、6、4这三个不起眼的数字,但对广大开发者来说,却一点也不普通。此次峰会,百度为进一步降低开发者应用语言与知识技术的门槛和成本,将多年来语言与知识技术沉淀凝聚成一系列技术平台和产品对外发布。
其中,3大新品包括语言理解方面的语义理解技术与平台文心ERNIE、一站式TextMind智能文档分析平台、以及机器翻译方面的AI同传会议解决方案;6项技术全面升级包括智能创作平台重磅推出的智能策划、智能采编、智能审校3大媒体场景方案,以及智能对话定制与服务平台UNIT平台带来更智能的任务式对话理解、极致便捷的表格问答、融合通用对话的新引擎三大新能力升级,这些全面覆盖理解、生成、对话、翻译4大NLP领域重点研究方向。
百度语言与知识技术多年深耕、布局全面,核心技术持续发展突破,为广大开发人员、业务应用者提供以语言与知识技术为核心驱动的系列产品,发挥应用价值。对此,吴甜也给出了一组数据:百度智能对话定制与服务平台UNIT自发布以来,已有2.7万多开发者积累下2.4亿个知识条目,支撑了超过10万个智能对话应用,与用户展开超过4200亿次交互。
亮点三:共建开源数据+豪掷亿元算力,要在世界范围建设中文信息处理影响力
数据、算力的缺乏,特别是相较英文下标准的中文开源数据集的匮乏,成为制约中文信息处理领域发展的瓶颈。
对此,王海峰指出,复杂知识表示和快速构建技术,知识与深度学习进一步融合,深度融合感知和认知的跨模态语义理解技术,模型可解释性和鲁棒性,这四大难题仍需要继续研究解决。但对于未来,百度充满信心。
会上,百度发布了"千言"数据共建计划和价值一亿元的算力共享计划。吴华介绍到,"千言"的目标是覆盖丰富的任务类型,从复杂知识构建、语义理解、知识融合、多模态融合等角度推动技术进步,同时提供能进行多维度综合评价的数据集从而评价模型的全面性、泛化性、鲁棒性。首期千言项目已涵盖了7大任务、20余个中文开源数据集。在未来3年中,百度计划面向超20个任务,收集和建设不少于100个中文自然语言处理数据集。
而语言与知识算力共享计划,是指百度将通过AI STUDIO平台,提供价值一亿元的算力支持,为语言与知识技术开发者助力。在未来,百度还计划邀请"千言"数据集的使用者,百度语言与知识开源开放用户以及更多的中文语言与知识技术开发者、研究人员免费使用这些算力。
百度希望通过共建中文自然语言处理开源数据及算力支持,与学界、产业界共同推进技术进步。看到这里,百度AI技术的开放共享,确实让开发者们感受到满满的中国科技实力的自豪感。
亮点四:十年征程,不忘初心
2010年,百度在国内最先成立专门的自然语言处理部,在前瞻技术与产业格局上不断引领、创新,十年间已成为中国NLP发展的一面旗帜。
十年征程,百度语言与知识技术发展历程中培养、吸引了大量全球顶尖人才。会上,百度推出以王海峰为代表的百度NLP"十年十人",十年坚守,不忘初心,秉持"技术信仰",勇攀技术高峰,矢志不渝致力于让机器更好地理解世界、更好地服务于人。
此次峰会,汇聚了百度语言与知识的技术积累和产业实践。不难看出,百度对整个语言与知识领域的布局是领先,且具有借鉴意义的。其实,百度的语言与知识技术实力不仅领先国内,在国际上也丝毫不逊色。以百度知识增强的语义理解框架ERNIE为例,去年年底ERNIE在国际权威的通用语言理解评估基准 GLUE 上首次突破 90 大关,超越人类三个点,获得全球第一。下图正是全球AI三巨头,从技术成果、研发力量、产品与服务三个维度展现了自身的语言与知识技术价值。
2020年,是百度深耕语言与知识技术的第十年,更是技术成果厚积薄发的一年,站在十年发展的新起点上,百度举办百度大脑语言与知识技术峰会,与产学研各界同仁分享NLP技术变迁和发展趋势,推动技术创新与产业实践,加速AI技术发展及智能社会建设,助力中国产业智能化转型。百度AI,实力引领,未来可期。