每经记者:张蕊每经编辑:陈旭
5月25日,2023中关村论坛在北京开幕,论坛将持续到5月30日。
人工智能大模型发展论坛现场 每经记者 张蕊 摄
在本次论坛的“人工智能大模型发展”平行论坛上,百度首席技术官王海峰以《文心一言,读书破万亿》为题发表了主旨演讲,并通过演讲展示了百度全新一代知识增强大语言模型文心一言在知识问答、写文稿、作诗、生成视频、推理计算以及工作场景中智能总结等多方面的能力。
王海峰表示,得益于百度在人工智能技术领域的全面布局和技术积累,尤其是飞桨深度学习平台和文心大模型的联合优化,文心一言在一个多月时间推理性能提升了近10倍,效率更高,效果更好。目前,飞桨深度学习平台已凝聚了535万开发者,服务20万家企事业单位,基于飞桨创建了67万个模型,位居中国深度学习平台市场综合份额第一。
对于大模型产业化面临的挑战,王海峰认为,当前出现了类似芯片代工厂的模式,一些具有算法、算力和数据综合优势的企业可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
论坛上,王海峰回答了《每日经济新闻》记者关于影响AI模型效果的因素有哪些、大模型的核心竞争壁垒是什么、是否每个企业都需要构建自己的大模型的提问。
百度首席技术官王海峰 图片来源:主办方
王海峰告诉《每日经济新闻》记者,一个大模型要得到更好的效果,通常人工智能的算法、算力、数据方面都会起很大作用。“简单地说,算法有更好的算法,数据有更多的数据,或者有更多算力,但这还不够,更重要的是三者其实是在联合优化的。”
“就算力而言,刚才我说到4层架构,算力是基础,而算力很大程度上实际上是在跟框架平台这一层打交道。”王海峰说,比如像飞桨这样一个深度学习框架平台,它跟几乎所有国际或国内的主流芯片都有适配。“而算法当然是很核心的,很多进步最终还是靠算法。”他说,算法的进步效率更高,一个算法的改进可能就是多少倍甚至是成数量级的提升。
而数据意味着什么?在王海峰看来,数据很大程度上其实是意味着应用场景等。建构一个基础的预训练大模型时数据会特别多,这就意味着它有一个基本的通识知识了,但应用于各种场景时,每一个场景都会带来自己的数据,当一个场景要用这种大模型时,往往是针对这个场景的需求标注很好的数据,就会得到事半功倍的效果。
“所以我们如果说日常工作,其实这几方面都在优化,而且是在联合优化,不断地相互影响、互相迭代。”王海峰说。
每日经济新闻