10月30日,在“AI紫竹 数智赋能”2024发展论坛上,北京人工智能研究院院长王仲远发表主题演讲,介绍了智源研究院在人工智能大模型领域的最新进展,并探讨了未来AI技术的应用前景。
王仲远指出,当前人工智能正处在第三次浪潮的新拐点上,从以往的“弱人工智能”向具备通用性和泛化性的“强人工智能”迈进。2023年之后,大模型的兴起标志着人工智能逐步向通用人工智能方向发展。他提到,每一轮人工智能浪潮都依赖于模型参数、训练数据量和计算能力的大幅提升,如今大模型的参数量正在逐渐缩小与人类大脑神经元数量规模的差距,为人工智能达到类人智能水平提供了可能性。
关于智源研究院的研究成果,王仲远表示,智源研究院是国内最早投入大模型研发的机构之一。自2020年起,智源研究院便组建了百人规模的高水平人才队伍,专注于大模型的技术攻关,2021年发布了悟道系列2.0大模型,参数规模达1.75万亿,达到了全球领先水平。随着大模型技术的应用普及,智源研究院的技术和人才也孵化出多个国内领先的大模型企业。
王仲远表示,未来的人工智能应用将超越文本数据,进入多模态领域。目前的多模态模型,如文生图的Stable Diffusion、视频生成的Sora,以及实时对音频、视觉和文本进行推理的GPT-4o,虽然应用广泛,但因技术架构分裂,发展受限。他认为,AI技术的最终形态将是统一的多模态模型,这一模型不仅能理解、生成不同模态的内容,还能进行跨模态推理。智源研究院近期发布了全球首个原生多模态世界模型Emu3,在图像、视频的理解和生成能力上表现亮眼,赢得了国际同行的高度评价。
王仲远还谈到人工智能的未来应用,指出随着多模态大模型的成熟,人工智能将进入物理世界,促进“具身智能”技术方向的发展。在生物计算方面,智源研究院已将生成式AI应用于生命分子的建模,用于蛋白质结构预测和药物研发。智源研究院连续30个月在全球蛋白质结构预测竞赛中排名第一。
在支撑AI发展方面,王仲远强调了高质量数据和开源技术的重要性。智源研究院在国家发改委和中央网信办的指导下,牵头建设北京市人工智能数据运营平台,汇集了100多个数据集,数据规模达180TB,为AI研究提供强大支撑。同时,智源研究院已开源超过70个模型,总下载量超5亿次,是国内AI开源下载量最多的科研机构。
此外,智源研究院还在大模型评测领域取得突破。在今年5月的评测中,智源研究院对140个大模型进行了测试,涵盖语、数、英、物、化、史等多学科。王仲远指出,尽管全球顶尖大模型成绩优异,但依然不及海淀区考生平均水平,显示出AI的巨大提升空间。
作为推动AI技术发展的重要机构,智源研究院自成立以来已建立起广泛的国际学术合作网络。每年举办的智源大会成为全球AI领域的标志性活动,吸引了30多个国家和地区的学者参与。今年3月的北京首届AI国际对话,更是吸引了3位图灵奖得主,共同签署了“北京AI安全国际共识”,进一步推动了AI技术的安全发展。
王仲远最后表示,智源研究院将继续专注于前沿技术突破,推动大模型在多模态和具身智能领域的进展,并不断解决产业中的技术痛点,赋能各行各业。智源研究院的目标是引领人工智能技术的发展方向,为构建通用智能和社会进步做出贡献。
李仕静/文