面对ChatGPT刮起的风暴,国内科技巨头反应也十分迅速。
2月8日,南财快讯首发报道阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。阿里巴巴方面对21世纪经济报道记者表示,确实在研发相关产品,目前处于内测阶段,尚没有更多信息透露。
从2019年开始,AI大模型突然爆发,参数规模以指数级的快速增长。从2014年到2018年,AI模型参数规模还在一亿的数量级上下浮动,2019年2月,OpenAI的GPT-2达到了15亿参数规模;2020年6月,GPT-3达到了1750亿参数的规模;2021年1月,谷歌大脑推出了1.6万亿参数规模超级模型,再次刷新规模纪录。
而随着AI大模型技术的不断成熟,AIGC技术已经走出实验室,应用场景也已经从初始的文本生成发展到多模态领域。行业人士分析认为,ChatGPT类型产品须以底层数据作为基础,算法只是核心竞争力之一。
跨领域学习
事实上,对于AI行业来说,眼下最迫切的诉求在于扩大应用场景。
2022年9月,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。
“近十年来,AI的研究发展迅猛,但AI的应用始终是一大难题,使用门槛过高限制了AI的潜能。”阿里巴巴集团资深副总裁、达摩院副院长周靖人此前曾表示,AI模型较为复杂,尤其是要应用于行业场景,往往需要重新训练,这使得AI只掌握在少数算法人员手中,难以走向大众化。而魔搭社区提供众多预训练基础模型,只需针对具体场景再稍作调优,就能快速投入使用。
近年来,大模型表现出前所未有的理解与创造能力,且打破了传统AI只能处理单一任务的限制,让人类离通用人工智能的目标近了一步。但是,大模型在实现全模态和全任务的通用性上,仍存在许多技术难点,同时受算力资源限制,其训练与落地应用颇具挑战。
回顾AIGC(AI生产内容)的发展趋势,阿里研究院资深技术专家苏中认为,ChatGPT这一类现象级应用的横空出世与迅速爆红并不意外。“深蓝打败了卡什帕罗夫、AlphaGo战胜了李世石……对于业内人士来说,这些曾经轰动一时的现象级技术进步,仅仅是完成固定任务的弱人工智能。开发具有跨领域学习能力的强人工智能技术,才是人类努力的终极目标。”
在他看来,常识学习、跨领域模型迁移、小样本和零样本学习……一个个技术的拦路虎挡在通往强人工智能的技术道路上,而人工智能超级模型则成为重要的助力。
语音语义增速显著
此前,谷歌旗下的Deepmind公司推出了自主编程应用AlphaCode,在Codeforces举办的编程比赛中,超过了45.7%的人类参赛者;OpenAI开发的另一款图片生成应用DALLE-2,入选了时代杂志评选的2022年度最佳发明;英伟达开发了一款3D模型生成工具Magic3D,用户输入文本描述就可以自动生成结构极其复杂的3D模型;阿里巴巴达摩院多模态大模型M6,利用文本输入可以自动驱动人体3D模型的动作合成……
在图文创作、代码生成、3D模型设计、3D动画制作等领域,AIGC技术展示着深厚的潜力,其应用边界也将随着技术的进步与成本的降低扩展到更多领域。
阿里、百度等国内大厂也很早就加入到这一场AI技术竞赛中。阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目,同年6月推出3亿参数的基础模型。2021年1月,模型参数规模到达百亿,已经成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型正式投入使用。
得益于国内厂商的持续投入以及出色的商业化能力,未来国内的AIGC产品同样值得期待。
IDC发布的《2022H1中国AI云服务市场研究报告》显示,阿里AI在ChatGPT相关的语音语义领域已连续三年多在国内保持引领地位,市场份额达到31.98%,其中阿里对话式AI、语言AI、语音AI市占均为第一。
此外,百度在2月7日正式对外确认将发布类ChatGPT项目“文心一言”(ERNIE Bot)。该产品目前正在做上线前的冲刺,将于3月份完成内测,面向公众开放;百度搜索或将全线接入文心一言。
不过,阿里巴巴推出真正等待类ChatGPT产品仍需时日,躁动的资本市场已经开始收割红利。2月8日,内容社区知乎股价暴涨接近50%,创下历史新高。百度、寺库、云从科技在内的多家公司,股价也纷纷上扬。
值得注意的是,走在前列的百度得到了多位受访人士的肯定,其中有国产GPU开发商的市场部人士对21世纪经济报道记者表示,“百度未来可在中文大语言模型中和微软等国际龙头竞争,以英文为主的ChatGPT,在接受中文问题时,还是不太在行。”
目前,百度官网的介绍显示,这个大模型已经覆盖了自然语言处理、生物计算、视觉等领域。基于“文心大模型”推出的应用“文心百中”和“文心一格”分别是关于文本和图像的应用,均支持中文自然语言搜索,可以说是海外ChatGPT、DALLE的中文版竞品。
但是,对于巨头来说,每一项新的产品和创新仍然会围绕其主营业务。业内人士分析,阿里早前已部署用大模型技术探索电商跨模态搜索、AI虚拟主播、天猫精灵创作辅助等新场景,类ChatGPT技术在阿里内应用空间广泛,或将引发新一轮技术升级。