“没有大数据,数字经济便是‘无米之炊’;没有智能算法,数字经济就不能‘创造价值’。”
在日前的2023世界人工智能大会(以下简称WAIC)“大模型生产与产业落地合作论坛”上,国务院参事、中国科学院虚拟经济与数据科学研究中心主任、中国科学院大数据挖掘与知识管理重点实验室主任石勇说。
近一年来,随着通用人工智能(AGI)与生成式人工智能(AIGC)的兴起,人工智能产业掀开了新的篇章AI对部分产业的颠覆开始加速,我们正在迎来一个属于AI的新时代。
纵观整个计算机科学历史,进入AI时代后,中国AI产业与国际先进水平之间的差距正在不断缩校但业界也清醒地认识到,中国AI产业的基础设施仍然有很大的提升空间。
正如石勇所言,在AGI时代,数据、算力以及算法、算法开发平台,都是中国AI产业发展壮大不可或缺的基础设施。
在今年的WAIC大会上,越来越多的专家、学者以及AI、芯片等领域的从业者们都开始关注到这一问题,并希望能从底层入手,夯实中国AI产业的“地基”。
01. AI产业需要什么样的基础设施?
随着AI技术进入大模型时代,AI产业对于数据、算力的需求急剧膨胀。
以ChatGPT为例,根据媒体报道及投资、咨询机构的分析,GPT-3时期的ChatGPT数据量达到了45TB,对于纯文本数据而言,这一数字堪称惊人。
与此同时,ChatGPT的算力消耗巨大,参与训练的算力在万张英伟达A100级别,单次训练成本就高达140万美元。此外,ChatGPT在运营过程中,用户的每次互动都会产生一定的算力成本。
而在数据、算力之外,AI从业者,特别是最核心的算法工程师,还需要大量的开发工具。
“算法工程师很多时候并没有真正研究算法,而是把时间浪费在了环境搭建的工作上。”在WAIC大会上,闪马智能创始人、董事长兼 CEO彭说:“我们希望人能更好地利用工具,而不是被工具利用。”
有AI从业者将AI训练调侃为“炼丹”,可靠的算法训练平台,可以有效减轻算法工程师的“炼丹”筹备时间。在这一背景下,越来越多的AI企业开始关注到AI开发平台,闪马智能便是其中之一。在WAIC上,闪马智能发布了新一代的ATOM AI生产力平台,希望通过更友好的开发平台,帮助算法工程师提升效率。
据悉,闪马智能的ATOM AI生产力平台构建了从标注、训练、测试到落地的全链路自动生产体系,可以实现模型快速生产、迭代与验证的一站式管理,保障技术成果积累和数据资产沉淀。
具体而言,ATOM AI平台支持跨云、跨集群灵活调度,基于DataExpress数据多级缓存与数据pipeline,可支撑千卡级大模型训练及各类场景微调模型的稳定运行。
ATOM AI生产力平台的前身,是闪马智能团队推出的ATOM深度学习平台。官方资料显示,该平台经多年迭代后,已成为1000余位算法科学家和数十所高校师生使用的AI模型开发工具。
02 视频大模型方兴未艾
与目前AI产业时下火热的ChatGPT、Midjourney不同,ATOM AI平台关注的是另一赛道。前两者通过大模型实现了文本、图片的AIGC,而后者则关注视频领域,希望打造出更多视频专属的AI模型。
在AI视觉领域,业界现有的模型大多基于静态图片。目前,针对人脸、车牌、敏感内容审查领域的AI模型已高度成熟。但在视频领域,特别是较长视频中的物体跟踪与行为检测,现有AI模型的表现仍然不够理想。
这背后的原因是,大部分视觉模型针对静态图片表现良好,但针对动态视频,模型需要根据时序模型,对单帧静态图片进行空间-时间建模,再提取视觉特征。这一过程的效率极低,且需要大量的算力支持。
此外,相较于图片数据,视频数据更稀缺、体积更大、标注也更加困难。因此,在整个AI产业,视频大模型仍处于方兴未艾阶段,增长潜力巨大。
针对视频模型开发的特殊需求,闪马智能的ATOM AI生产力平台提供了集成数据管理、标注、训练、优化和推理功能的一体化服务,并通过打通算力、数据资源的形式,帮助算法工程师专注于模型训练本身。
事实上,闪马智能自身也在持续投入模型开发。目前,闪马智能解决方案已经在智慧交管、智慧高速、智慧轨交、智慧建造、智慧电站和扬尘治理等业务场景中落地应用。
“大模型存在的意义一定是需要应用到实际场景中,为人们解决问题,赋能社会发展。”彭称,“对于大模型本身,我们是理智的不盲目投入极大参数LLM(大型语言模型),而是结合自身优势,基于视觉拓展做了感知大模型。”
例如,闪马智能日前发布的SupreMeta感知大模型,就融合了视觉、激光、雷达等多模态,对于目标及场景拥有更强的泛化能力,针对同一物体的不同视角、光照、遮挡,都能实现准确识别。
03 联合算力、算法,打造AI生产生态
作为一家AI企业,闪马智能以智慧交通解决方案为主营业务。对于ATOM AI开发平台,闪马智能更希望借此打造一个AI生态。
在WAIC大会上,闪马智能宣布与北京国科智算科技有限公司、北京国科未来科技有限公司联合成立“中科闪马”,意在借助更多资源,共同推广ATOM新一代异构人工智能计算平台和DataOcean新一代存储系统,打造主可控、软硬一体的人工智能计算与存贮设备,并为大模型的训练与实战提供可靠的计算平台。
中科闪马智能有限公司揭牌仪式
中国科学院虚拟经济与数据科学研究中心特聘研究员张影飞表示:“中科闪马智能有限公司具有三大优势:第一,强强联合、资源整合;第二,技术融合、拓展应用;第三,聚力发力、突破难点。期待与闪马智能共同推动自主可控的国产技术发展与创新。”
毫无疑问的是,在大模型时代,算力的意义变得无比重大。在日前的WAIC大会上,闪马智能便邀请了国产GPU及解决方案厂商沐曦加入ATOM产业生态。
在沐曦创始人陈维良看来,以GPU为代表的芯片产业已经成为了AI产业的发展瓶颈。AI产业旺盛的需求催生出了GPU的广阔市场,GPU未来的发展架构也将针对AI产业需求进行定义。
闪马智能的生态圈也在尝试将更多伙伴拉入自身的生态圈。例如,在WAIC上,闪马智能宣布将与3D互动内容创作和运营平台Unity中国合作,基于3D孪生技术和“AI+交通”的算法能力,打造实时全息的智慧交通系统与灵活弹性的渲染云平台。
闪马智能xUnity中国产业元宇宙战略合作签约仪式
以往,Unity大多被用于游戏开发,客户以游戏厂商为主。但近年来,随着科技业对于3D引擎需求的增长,越来越多的开发者开始将Unity用于非游戏领域的开发,如汽车智能座舱、数字孪生、元宇宙等等。特别是在汽车领域,包括闪马智能在内的众多厂商,都在使用Unity作为3D渲染工具。
而Unity也在积极拥抱AIGC。日前,Unity中国公布了其在AIGC相关领域的规划打造U3D Copilot开发者只需要使用自然语言下达需求,AI就可以通过大语言模型和用户更自然的交互界面,串起3D的AIGC模型,以及引擎内部能提供的包括资产库和程序化生成等这种工具。
U3D Copilot同时面向游戏和非游戏行业的开发者。在2023世界人工智能大会上,Unity中国CEO张俊波在接受36氪采访时表示,以U3D Copilot为代表的3D渲染AIGC工具,对于非游戏行业意义更大。与游戏开发者相比,这些开发者在3D渲染方面的经验有限,而AI则可以为他们提供更多助力。
不难看出从上游的算力、数据资源,到下游的行业应用,闪马智能结合自身业务,搭建起了一整套面向大模型开发的生态系统。从某种程度而言,闪马智能自身也成为了AI大模型产业基础设施的一部分。
如今,中国AI大模型正在蓬勃发展。根据科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》,据不完全统计,国内参数在10亿规模以上的大模型全国已发布了79个。
对于大模型的未来前景,彭给出的答案是,这条赛道如今从业者甚多,但并不拥挤,因为大模型赛道极其广阔:“今天,仍有很多领域的大模型甚至还没有完成定义。”
“所以,我们一定要拥有自己的GPU、自己的算力,有更多做模型、做算法、做平台的公司,这样,中国的大模型产业才能发展起来。”他进一步解释到。