要问当下人工智能领域什么最火?大模型绝对算一个,而且可能是最耀眼的那一个!
刚刚过去的2022世界人工智能大会(WAIC)期间,由中科院自动化所与华为基于腾AI联合打造的全球首个三模态大模型“紫东.太初”脱颖而出,在800多个角逐者中笑到最后,一举斩获WAIC最高奖项卓越人工智能引领者奖(Super AI Leader,简称SAIL大奖)。
除了领先大模型频繁登顶行业大舞台外,整个AI业界的大模型创新也层出不穷,国外OpenAI、谷歌、微软、亚马逊等公司的卡位布局自不用说,国内华为、阿里、百度、腾讯等也在积极耕耘,掀起了一波以人工智能基础大模型产业化推动AI产业化和产业AI化的新浪潮。
数据显示,自去年以来,国内产业界仅基于腾AI就先后推出了鹏程.盘古、鹏程.神农、紫东.太初、武汉.LuoJia、华为云盘古系列等有影响力的大模型,并陆续在互联网、智慧城市、生物医药、金融、农业等行业孵化出多个解决方案,加速推动AI在各行各业的应用落地。
大模型是个啥,为何广受青睐?大模型对AI产业化和产业AI化意味着什么?让我们以“紫东.太初”为引探个究竟。
大模型重塑AI,从“一专一能”迈向“多专多能”
众所周知,AI是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术以及应用系统的技术科学,核心要素包括数据、算力和算法。理论上数据越丰富,算力越强大,算法越先进,AI就越聪明。
但受数据量和算力成本等因素的制约,此前AI业界流行用特定领域有标注的数据“炼小模型”,“一专一能”通用性差,且存在“重复造轮子”的现象,系统的聪慧度也难以持续提升。大模型基于充沛算力,在大规模宽泛无标注数据上进行基础训练,再结合行业知识通过小样本学习微调,就可以满足多种下游应用任务的需要,变身“多专多能”。
尤其是像紫东.太初这样的千亿参数级三模态大模型,因其在图、文、音三个基础模型上加入跨模态编码和解码网络,开创性地实现了图像、文本、语音三模态数据间的统一表示与相互生成,更加接近人类真正的感情和思考,灵活性更高、通用性更强,更是加速了AI从“一专一能”向“多专多能”的转变,并为多模态人工智能行业应用提供创新基础,迈出向通用人工智能的重要一步。
一言以蔽之,大模型打破了传统专用模型解决专有任务的AI研发范式,具备更强的泛化能力,能够适配更多场景,可加速推动专用人工智能迈向通用人工智能。
大模型加速AI产业化,赋能千行百业智慧升级
当AI从专有小模型走向领域大模型,无疑会加速AI的产业化的进程。从中外主流市场看,发展大模型已成为产学研各界的共识,“炼大模型”已演变成新一轮AI竞赛。在应用层面,大模型也正在孵化行业应用,加速产业AI化,赋能千行百业智慧升级。
在各种发展路径中,中国市场涌现的“大模型产业联盟”模式表现亮眼。以紫东.太初为例,去年底30多家知名企业和组织基于它成立了国内首个多模态人工智能产业联盟,通过整合产学研用各方资源,打造多模态人工智能行业应用,探索通用人工智能产业化路径,取得了丰硕的成果。
资料显示,该联盟迄今已吸引了包括华为、新华社技术局、长安汽车、中国移动、爱奇艺、千博手语、三峡集团、湖南省马栏山计算媒体研究院等在内的40多家成员单位加盟。多个成员通过开源的多模态大模型快速进行自身业务AI融合创新,陆续孵化出多媒体信息检索、工业缺陷巡检、虚拟数字导游、手语教考一体机等丰富的场景化行业应用。
比如在新媒体领域,基于中科院自动化所“闻海”多模态媒体大数据和“紫东.太初”大模型核心技术积累,多方共同打造“全媒体多模态大模型”,实现了内容理解、图像生成、视频生成等方面性能提升,具备了高清图片生成、新闻续写和热点新闻的发现能力,并且将加速推动AI在如视频配音、语音播报、标题摘要、海报创作等更多元媒体业务场景的应用。
又如在智能制造领域的质检环节,中科院自动化所依托紫东.太初研发的虚拟人“小初”拥有视频生成、视频描述、图像生成、智能问答、语音识别等多个功能,能够通过“听”纺织机运行过程中的声音判断是否存在断经和断纬的情况,又通过摄像头“看”纺织机织出来布来判断是否有质量缺陷,语音图像融合识别支持70多种检测,验布速度达到人工的4倍,且精度大于90%(人工验布精度约为70-80%),大幅提高生产效率。
再如在社会公益领域,千博信息与中科院自动化所、华为三方联手,基于腾AI基础软硬件平台以及紫东.太初三模态大模型,利用思MindSpore原生支持大模型的能力打造出手语多模态模型并发布手语教考一体机,实现了手语动作与示意图片和文字的联动,让初学者更加方便地理解手语,帮助学生随学随练随考,高效学习,在解决手语师资短缺的同时,还能统一手语“方言”,推广手语标准,大幅改善了特殊人群的学习环境。
除了紫东.太初以及围绕其成立的多模态人工智能产业联盟外,去年同期产学研用各界还基于武汉.LuoJia大模型成立了智能遥感开源生态联盟,吸引数十家产业伙伴集聚,涌现出自然资源大脑、全场景类脑遥感矩阵、耕地保护自然监测平台、智慧农业SaaS服务平台等创新成果。
本次WAIC期间,中国商飞上海飞机设计研究院联合华为发布了业界首个工业级流体仿真大模型“东方.御风”,近30家全球头部流体力学高校、科研院所与龙头企业共同组建了智能流体力学产业联合体,将以腾AI等人工智能技术为基础,推动AI与流体力学的深度融合,为飞机、高铁、轮船等制造业提质增效。据悉,年内更多基于大模型的AI生物医药、智慧育种等产业联盟也将陆续面世,全面开启大模型加速AI产业化,赋能千行百业智慧升级的新浪潮。
腾AI全面使能,共筑中国大模型创新高地
细究中国AI大模型得以蓬勃发展的原因,除了政策牵引下大模型产业联盟这种产业聚集新模式的强力助推外,还有一个关键因素在于我们拥有全栈自主创新的腾AI基础软硬件平台(包括Atlas及伙伴系列硬件、异构计算架构CANN、全场景AI框架思MindSpore、腾应用使能MindX、AI应用使能ModelArts以及统一工具链MindStudio等)全面使能。
一方面,针对“炼大模型”对大算力的强需求,全国多个城市基于开放的腾AI基础软硬件平台规划建设了多个人工智能计算中心,并逐步连点成片构建中国算力网。借助这些人工智能计算中心中国算力网提供的超强AI算力打造AI大模型,可以突破算力瓶颈,大幅缩短模型训练时间。比如上面的紫东.太初,就是中科院自动化所携手华为以腾AI平台为基础,基于武汉人工智能计算中心的大算力打造的。
另一方面,天生就面向全栈全场景、有着鲜明产业导向的腾AI基础软硬件平台,在持续的技术迭代创新和产品工具完善中,形成了完整的大模型开发使能平台,可加速从基础模型开发,到行业应用适配,再到推理部署的全流程,让大模型易开发、易适配、易部署。
具体来说,在基础模型开发方面,基于思MindSpore的大模型开发套件,具备算法开发、并行计算、存储优化、断点续训重磅特性,可以支撑大模型的高效开发;在行业应用适配方面,基于MindX的大模型微调组件预置典型行业任务微调模板,可通过小样本学习等手段实现一键式微调和低参数调优,快速适配各种行业应用;在推理部署方面,MindStudio大模型部署套件可实现分布式推理服务化,模型轻量化和动态加密部署,大幅提升推理部署效率。
如此一来,基于腾AI全栈自主创新的坚实底座,产学研用各方深度拉通,形成了从大模型算力支撑,到大模型开发使能,再到大模型产业联盟生态式应用落地的产业正循环,共同构筑了中国大模型的创新高地。
综上,在大模型的语境下,AI研发规则和产业应用模式都迎来了深刻的变革。目前来看,中国拥有丰富的数据资源、强大的人工智能计算中心/中国算力网、全栈自主创新的AI开发使能平台,叠加先进的产业聚集模式,有条件在“炼大模型”这一轮AI竞赛中走在前列,加速推动AI产业化和产业AI化,赋能千行百业智慧升级,领跑智能时代。