文/王慧莹
编辑/陈锋
今年5月,中国科学技术信息研究院发布了《中国人工智能大模型地图研究报告》,这份报告显示,截至5月28日,国内10亿级参数规模以上基础大模型,至少已经发布了79个。
这一“百模大战”的盛况,在这两天举办的2023世界人工智能大会(WAIC)上,得到了集中体现。
一方面,这届WAIC,堪称是大模型的主常据连线Insight观察,大会现场展出的大模型新品,超过了30余款。
另一方面,除了展出大模型之外,围绕大模型相关的前沿算法、智能芯片等基础设施,也成了另一个重头戏。
比如百度展示了文心大模型3.5版本、文心一言、业内首个一站式企业级大模型平台文心千帆,还重点展出了其全栈自研的AI大底座。
百度在展会现场展示AI大底座
从这届WAIC来看,业内“做不做”大模型的讨论已经告一段落了,新的焦点是,各家的大模型到底有哪些差异化?底层技术上到底怎么样?以及接下来他们将怎么布局?
值得注意的一点是,大会上发布的《2022 全球人工智能创新指数报告》指出,当前全球人工智能处于加速发展期,其中有两个趋势较为关键:
数据和算力基础设施建设持续推进;人工智能产业化进程明显加快。
不难发现,这两点趋势所指向的,正是当前大模型产业最为关键的两个问题:
第一是技术侧,支撑大模型能力的底层基础设施是否完善,决定着一家企业能否做出大模型、做好大模型的能力迭代;
第二是应用侧,大模型如何落地,如何赋能到千行百业、如何真正释放出产业化价值,决定着一家企业在大模型赛道的上限。
而真正值得讨论的是,在接下来的这场马拉松中,拥有怎样特质的企业,将持续成为领跑者?
1、WAIC成大模型“秀场”:“国家队”来了,秀产品也秀技术
大模型赛道到底有多热?这届WAIC是一个最佳的观察窗口。
连线Insight观察到,包括但不限于互联网/云计算大厂阵营的百度、华为等;运营商阵营的中国移动、中国电信等;知名AI企业阵营的商汤科技等;大模型初创企业阵营的澜舟科技、衔远科技等,都带来了大模型的最新产品及最新进度。
与此同时,在百花齐放的态势下,大模型“国家队”也确定了阵容。
7月7日的大会论坛上,国家标准委指导的国家人工智能标准化总体组,宣布我国首个大模型标准化专题组组长,由上海人工智能实验室与百度、华为、阿里等企业联合担任,现场进行了证书颁发并正式启动大模型测试国家标准制订。
这意味着,过去混沌的大模型格局,正在逐渐变得越来越清晰。
再综合来看,这届以大模型为绝对重心的大会上,呈现出了以下几个特征:
市场上几乎所有的大模型厂商都来了;
围绕大模型,厂商展出的重点,还包括了大模型底座、MaaS解决方案等;
通用大模型之外,面向垂直场景的行业大模型也不在少数,以及能够为客户提供私有化部署的大模型也不在少数。
基于这几点,这届WAIC实则为我们提供了一个观察大模型行业现状,及接下来发展趋势的最佳机会。
其中,作为大模型产业最具代表性的玩家之一,百度又是一个很好的观察切口它是最先探索将产品落地的AI企业之一,也是率先推出通用大模型产品的厂商之一。
除了展示了文心大模型的最新进展、大语言模型文心一言的最新进展外,百度还重点展示了业内首个一站式企业级大模型平台文心千帆、全栈自研的AI大底座。
文心千帆大模型平台,图源百度智能云微信公众号
自下而上层层拆解就不难发现,百度在这次大会上的动作,不仅仅是对外展示过去一段时间在大模型领域的最新成果,同样也在进一步向外界传达其大模型的布局思路。
一方面,通过AI大底座的展示,百度透露出一个信号,布局大模型,最关键的还是要看技术。
另一方面,重点展出文心大模型、大语言模型文心一言和一站式企业级大模型平台文心千帆的最新进展,这意味着,百度做大模型,最终的思路是通过底层的技术迭代以及开放的平台生态,推动大模型的场景落地。
其中逻辑在于,文心大模型是百度的基础大模型,文心一言是知识增强大语言模型,是文心大模型中的一种,而文心千帆平台要做的事情,就是将百度的这些模型以及第三方模型整合到一起,提供给客户使用,在这一基础上,文心千帆还提供覆盖全生命周期的大模型工具链,同时支持大模型定制开发。
对此,王海峰指出,在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
据百度透露,目前文心大模型已经在能源、汽车、政务、交通、金融等十余个行业率先落地。
透过百度,不难发现,在当下的大模型赛道,真正的角逐重心,首先是技术,紧接着是场景落地,可以肯定的是,这将是一场马拉松。
2、技术要够硬核,也要有长期主义
大模型时代到来后,IT技术栈也发生了根本性变化,即从芯片层(CPU为主)、操作系统层、应用层的三层架构,发展成为了四层架构:芯片层(GPU为主)+框架层+模型层+应用层。
赛道中的任何一家入局企业,都需要适应这一新的变化,在底层能力上持续进化、迭代。
百度是其中最有代表性的一家,从昆仑芯到飞桨深度学习框架,到文心大模型,再到上层的应用,在每一层技术栈都有布局和自研技术。百度也是全球为数不多的进行全栈布局的AI公司。
在大会现场,王海峰也指出,尤其是在框架层和模型层,百度的自研优势更加突出。
框架层,飞桨是我国第一个自助研发的产业级深度学习开放开源平台,在中国深度学习平台综合市场份额上连续两年位居第一。截至目前飞桨已凝聚 750万名开发者,这也是百度2023年以来首次对外披露飞桨生态最新数据。
模型层,王海峰在现场指出,文心大模型现在已经迭代至3.5,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升了50%,训练速度提升了2倍,推理速度提升了30倍。
而文心大模型的迭代,正是一个通过技术创新推动大模型能力迭代的范本。
在基础模型训练上,文心大模型3.5采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,这加快了模型迭代速度,同时提升了模型效果和安全性。
同时,文心大模型3.5采取了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,使模型效果及场景适配能力进一步提升。
此外,在知识增强和检索增强基础上,文心大模型3.5提出了“知识点增强技术”,提升了大模型掌握和运用知识的能力。
在推理方面,则是通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,提升了文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。
值得注意的是,文心大模型3.5 还新增了插件机制,默认的内置插件“百度搜索”,使得文心一言具备生成实时准确信息的能力;长文本摘要和问答插件“ChatFile”支持超长文本输入等等。
王海峰表示,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型,同时也将逐步开放插件生态,帮助开发者基于文心大模型打造自己的应用。
这一系列能力迭代背后,百度靠的是其在AI领域长期的投入和积累。
2013年开始,百度就开始布局AI相关技术,累计十年下来已经投入超过1000亿元,其中核心研发投入多个季度占比超过20%。截至2022年4月,百度全球AI专利申请已经超过2.2万件。
当然,所有的技术优势,最终都要转化为可落地的成果,在大模型赛道,这意味着,大模型能否落地,将价值最大化。
3、从技术中来,到产业中去
大模型热潮持续到现在,行业的竞赛将进入到更深一层,既拼技术,也拼场景落地。
不断探索大模型的能力边界,推动大模型在具体行业场景下的落地,也成了当前市场参与者的重中之重。
据连线Insight了解,4月17日,文心一言在百度内部全面应用在智能工作平台“如流”。百度此次在内部发布的智能工作工具,涵盖了文本和图片生成、代码推荐两大场景。
简单来说,文心一言在实际的办公、会议、编码等场景的表现,就像一个“超级助手”,帮助员工在日常工作中的思路构建、协作沟通、方案策划、代码编写等方面大幅提升效率。
王海峰也表示,凡是要跟语言文字或程序代码打交道的应用场景,都可能有文心一言的用武之地。他透露,目前在能源、金融、教育、办公、媒体等诸多领域,已经有很多在积极应用文心一言的场景。
在这之前,百度还曾展示了文心一言+电商的场景:你只需要把商品的信息告诉AI,AI就会自动生成多种风格的商品带货脚本和风格,再搭配数字人主播,就可以进行直播带货。
7月6日,百度智能云事业群总裁沈抖在2023中国国际数字和软件服务交易会上透露,目前已经有15万家企业申请接入文心一言测试这说明,文心一言的潜在落地场景,还在不断拓宽。
同样值得一提的还有文心一格,同样是百度依托于飞桨、文心大模型的一款,在“AI作图”方面的产品。
据悉,文心一格既能为画师、设计师等视觉内容创作者启发灵感,辅助艺术创作,又能为媒体、作者等文字内容创作者提供高质量、高效率的配图。用户就算完全没有绘画经验,也能在文心一格画出无限创意。
聚焦到企业客户,同样可以在文心一格体验到业界领先的文生图水平。
不过,相比起文心一言、文心一格正在不断释放的应用场景,百度探索大模型落地产业场景的思路,更值得被关注。
连线Insight 观察到,百度的大模型产业布局中,有两个信息尤为关键。
第一是一站式企业级大模型平台文心千帆的推出。
如我们上文所提及,文心千帆实质上是一个大模型的集约平台,百度将这一平台开放,结合自身完善的大模型工具链,通过公有云服务、私有化部署等方式提供给企业客户。
这一布局思路下,平台具备了易用性、全面性、安全性、高效、开放、易拓展等特点,进而帮助企业高效、低成本地获取大模型能力。
百度透露,截至目前,已有超过300家百度智能云生态伙伴参与到了“文心千帆大模型平台”内测,包括工业、金融、政务、互联网、运营商、教育等行业头部企业。
第二是百度飞桨深度学习平台,对大模型适配产业场景能力的提升。
一方面,为了让大模型产业落地更高效便捷,飞桨提供了全流程产业化工具与平台,包括大模型开发套件、场景模型生产线等,极大降低了应用门槛。“通过高效构建与快速迭代基于大模型的多样化场景模型,让大模型的落地像流水线一样高效”。百度如此表示。
另一方面,飞桨的开放属性也决定了,随着越来越多的开发者快速在这里实现AI想法、创新AI应用,飞桨作为基础平台支撑,更利于支撑越来越多行业实现产业智能化升级。
而将这些联系起来重新审视百度在大模型赛道的布局思路、落地方向,就不难发现,百度大模型的起点、转折点、未来的锚点,都集中在“技术”这两个字上。
回顾百度过去十年坚定的技术投入历程,我们很清楚地能看到百度对于技术的长期主义,以及这种坚守带来的成效。
但对百度而言,大模型的战事才刚刚展开,接下来在“大模型落地”这场马拉松中,如何继续保持领先,对百度而言极为重要。