展会信息港展会大全

“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型
来源:互联网   发布日期:2023-05-11 14:39:45   浏览:5705次  

导读:每经记者:王郁彪每经编辑:刘雪梅 2023年的春天,AI迫不及待地破土了。 英伟达创始人黄仁勋说,我们正处于AI的iPhone时刻。言语间,难掩兴奋。根据瑞银分析,ChatGPT使用了约1万颗英伟达GPU来训练AI模型。而外界普遍预计,ChatGPT的商业化将需要应用超过3万...

每经记者:王郁彪每经编辑:刘雪梅

2023年的春天,AI迫不及待地“破土”了。

英伟达创始人黄仁勋说,我们正处于AI的“iPhone时刻”。言语间,难掩兴奋。根据瑞银分析,ChatGPT使用了约1万颗英伟达GPU来训练AI模型。而外界普遍预计,ChatGPT的商业化将需要应用超过3万颗。

此岸彼岸,AI持续澎湃。即便入局的门槛如此之高,大模型的应用与尝试,却还是像颗陨石一样溅落大洋,激起阵阵涟漪。

“AI引发新一轮生产力革命,主要源自多方面的进步。”京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士在接受《每日经济新闻》记者采访时表示,“包括硬件、摩尔定律和GPU等的进步,算力提升、数据迅速增加,还有像Transformer这样的模型结构的发明。”

两年前,何晓冬在接受记者采访时曾预判,“未来5年是AI落地产业化窗口期”。如今仅过去三年时间,新的想象便提前降临。5月6日,被誉为“中国智能科技最高奖”的吴文俊人工智能科学技术奖颁发,京东云旗下的言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”斩获科技进步奖,何晓冬获吴文俊人工智能科学技术奖杰出贡献奖。

“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型

言犀团队“任务型智能对话交互关键技术及大规模产业应用”获得吴文俊人工智能科学技术奖科技进步奖。 图片来源:企业供图

“今年的规划是要发布面向产业的言犀大模型,预计参数量千亿级,会在京东内部生态落地实践后再对外开放。”何晓冬透露。京东做的是生长在数智供应链上的产业AI,和所有人一道,共赴这场AI在春日的圆梦。

人机对话70年飞跃:从ELIZA到ChatGPT

新一轮AI革命的热潮由ChatGPT开启,就像是一场命运的定数。因为人工智能魔方的开启,也要从人机对话说起。

1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义,他提出了著名的“图灵测试”(注:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。)

受“图灵测试”启发,16年后,1966年,美国麻省理工学院人工智能实验室的约瑟夫维森鲍姆等人开发了最早的人机对话机器人ELIZA,关于聊天机器人的新时代就此来临。

但当时的ELIZA只是简单模仿人的行为,谈不上智能。到上世纪90年代,人机对话才进入了一个新的发展阶段,大家开始讨论怎么让计算机理解人类意图与执行命令。

记者注意到,2012年以来,苹果的Siri、谷歌的Google Assistant、微软小冰、亚马逊的Alexa等为代表的智能对话机器人走进“寻常百姓家”。这些机器人不但能完成人下达的任务,还能逐渐跟用户建立情感上的联系。

而伴随人机对话交互技术的成功应用,其也逐渐成为整个AI赛道绝对炙手可热的领域。

何晓冬从技术演进的角度回顾ChatGPT时表示,这几十年走过了一个比较长的周期,但在最近几年,迎来了爆发式增长。

“上个世纪50年代是基于规则,80年代是基于统计模型,到了本世纪深度学习崛起以后,开始向神经网络、替代模型崛起。特别是到了2017年Google的Transformer发表以后,之后又分出了一个系列,直到今天的GPT4。”何晓冬如此解释。

的确,在过去近10年时间里,人工智能模型经历了从小模型到以Transformer为代表的大模型的转变。

而指数级的增长,速度与规模的递进,更令人震惊。“三年前说大模型,这个‘大’是10亿级别的,现在则已经升至千亿级别。三年之内,关于大模型大的定义已经涨了100倍。”何晓冬表示。

多模态大模型将至 “AI的商业化路线已经清晰”

智能对话技术在过去70年有了巨大的飞跃,从“图灵测试”提出的设想,最后变成了一个真正的产品。

原因何在?何晓冬认为,过去往往是静态数据,都是小规模人工标注的。现在则是在特别复杂的交互场景下的动态数据,如ChatGPT过去四个月积累的数据。此外,过去更加关注单点算法和AI组件,现在则更加关注综合性AI系统、产品生态,以及关注技术能结合什么场景实现大规模落地。

“OpenAI公开表示用的就是Transformer,他并不介意。但他做到了别人做不到的高度,因为在后台完成了一系列的技术创新。多个模型有机结合,协同优化,导致最后呈现出一个非常领先的产品。”何晓冬补充说。

“我们现在讲大模型,更多的是谈语言模型,而在语音、图像、文本等不同模态,诞生了包括多模态数字人、AI艺术创作等多种应用。可以预见的是,大模型理念和技术正在迅速向多模态扩展。”

一次新技术变革不只带来一个工具,而是所有的商业模式都值得围绕技术突破进行重塑。人们从过去低效率地查阅黄页,过渡到搜索引擎时代,又从搜索引擎时代过渡到了智能交互时代,技术突破带来用户体验和商业模式的革命性变迁。

而围绕技术的突破,每一次新的跃动都潜在巨大的机遇。这是无数人为AI狂热的根本所在。

何晓冬告诉记者,就此,AI的商业化路线已经很清晰了。最先突破的是文本生成的商业化,图像会很快进入商业化,或者说某种意义上已经商业化。随后的视频、游戏、3D也会迅速跟上。

AI热潮的余波一轮轮震荡开来。越来越多的公司,预备从不同角度切入大模型的研发与应用尝试。有些抢速度,有些拼技术,甚至有些在入场门槛前徘徊,被资金、技术、人才等各类问题困住脚步。因为大家都知道,赶不上这趟车,可能就没下一列了。

向产业延伸 京东将发布千亿级大模型

ChatGPT爆火后,国内多个大厂相继躬身入局。京东是最早的一批,在言犀人工智能应用平台的基础上,京东云也曾发布过K-PLUG、织女等产业大模型。

在通用语言理解基础模型方面,京东探索研究院不久前曾对织女大模型进行了再升级,提出规模更大、性能更强、迁移性更好的Vega v2模型。应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务。

记者了解到,智能服务是京东云“产业AI”的首个落点。何晓冬告诉记者:“客服场景是一个很严肃、很深的任务型对话,我们需要解决真实世界的深度复杂问题,意味着它并不仅仅只是独立的对话。”

“哪怕最简单的对话,比如,你问客服昨天下单的苹果手机今天什么时候送达。意图清晰,但ChatGPT是回答不了的,因为它需要跟物流、订单等整个业务系统串联。”何晓冬说,“某种意义上,京东云做AI的优势,就是基于自身供应链复杂场景沉淀技术能力,再广泛服务产业生态。”

他进一步向记者举例,比如京东云正在做的智能政务热线,数据显示,AI将大同12345的呼入电话接起率提升至100%;智能热线提升了东莞市受理市民诉求办理满意率达到96.8%;

面对京东大模型的推进进程,何晓冬透露,今年的规划是要发布面向产业的言犀大模型,预计参数量千亿级,会优先在零售、金融行业落地,再泛化至其他产业。

AI不是现实世界的复刻,而是人类想象力的延伸。这是David Holz在创办Midjourney时定下的宗旨。

但现阶段,AI先要做好的仍是响应更多现实世界复杂真实的需求,而真正可以预期和进一步想象的空间延伸,也将来源于此。

每日经济新闻

赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港