作者:孙妍 来源:IT时报
ChatGPT开启了AI的下一个时代,行业普遍认为“大力出奇迹”,算力决定了市场竞争力。
在6月2日举行的临港新片区智算大会上,临港新片区发布了到2025年算力产业规模突破100亿元的行动方案,并成立智算产业联盟。商汤科技成为该联盟成员,也成为临港新片区智算产业链链主。
2023年4月10日,商汤科技推出“日日新SenseNova”大模型体系,自我定位是做大模型超市,同时,商汤AI大装置还能提供“大模型+大算力”的研发体系,直击AI大爆发时代的“算力焦虑”。
截至今年5月,商汤大装置已累计服务超40个核心客户,其中大模型客户10家以上,并已在超过20个落地场景中实现大模型交付。商汤科技董事长兼CEO徐立在大会上提到大装置在气象预测、自动驾驶、遥感、游戏以及大语言模型等多行业的最新进展。
商汤大装置为40多家企业“生产”大模型
目前临港新片区总算力超过3EFLOPS(FP32),约占上海市近20%。临港新片区计划到2025年,总算力超过5EFLOPS(FP32),AI算力占比达到80%,建成公共算力服务平台,算力产业总体规模突破100亿元。
商汤人工智能计算中心(AIDC)就坐落在上海临港,也是临港新片区智算产业链链主。商汤AIDC目前总算力达5000Petaflops,已有近3万块GPU,当前算力可支持20个千亿参数超大模型同时训练,其中国产化算力达500Petaflops。
也是在这个AIDC,商汤大装置正在为20多个落地场景、40多个企业“生产”大模型,涵盖智能驾驶、生物制药、芯片设计、智慧商业、高校科研等前沿领域。
在徐立演讲的开场视频中,临港三维场景呈现在观众们眼前,以往如此高精度的三维场景重建需要人工数周乃至数月才能完成渲染,如今在大算力和神经渲染技术加持下,只需要数小时就能完成。“在AGI时代,模型的能力可以用算力来衡量。在AI大模型时代,模型参数量将以指数级速率提升,而数据量随着多模态的引入也将大规模增长,由此带来了对算力需求的剧增。”徐立说道。
高效率、低成本、规模化,是每个企业对下一个AGI时代的共识。如何达成这一共识?除了输出算力外,商汤自动化数据标注服务可将智能标注效率提升百倍;大模型推理部署服务可将大模型推理效率提高600%;大模型并行训练服务支持单集群3200卡5000亿稠密参数模型训练;大模型增量训练服务能够将增量微调成本降低90%。商汤还开放模型及AI开发工具链,帮助开发者提升效率。
大模型到底是不是“大力出奇迹”的暴力美学?从ChatGPT这一代表来剖析,GPT-4只用了Open AI总数据集的1%,这意味着并不是把所有数据都喂给AI,AI就能聪明。更重要的是,Open AI用最优秀的科学家去做标注,这说明数据的有效性比数据量更重要。
“新二八定律是80%的AI大模型加20%的提示工程,”商汤科技联合创始人、大装置事业群总裁杨帆也认为,模型并非单纯的暴力美学,背后是大量的软件工程系统问题,商汤大装置长期沉淀了大量的专家认知和工具,具备端到端产品应用解决方案能力。AI产业即将迎来一个更加繁荣的大航海时代,商汤大装置将通过提供大规模、高效率、低成本的AI基础设施,让产业生态百花齐放。
“日日刷新”的AI大模型 跑出商汤速度
2023年,商汤在AI大模型领域跑出了“日日刷新”的速度,高潮是4月推出的“日日新”大模型。
在时下最火热的对话式自然语言处理大模型领域,“商汤商量SenseChat”在4月初发布后短短一个多月时间里,在多语言能力叠加表格生成处理能力、历史知识和归纳能力、多轮对话和长文本理解能力等多方面又获得显著提升,并在多个权威测试数据集和评价榜单中位居行业引领地位。商汤AI代码助手也通过快速迭代实现了619%的推理效率提升,这意味着可以在相同算力资源下支持6倍的用户数量,大大降低使用成本。
3月,商汤开源的“书生2.5”多模态大模型在检测、分割、分类三大主流视觉任务下二十多个权威数据集上全面领先,这为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。
4月,全球中期气象预报AI大模型“风乌”首次实现在高分辨率上对核心大气变量进行超过10天的有效预报,且在80%的评估指标上超越GraphCast模型。对于人工智能基础科学(AI For Science)而言,在气象气候预报任务中,全球中期天气预报是最重要的预测任务之一。得益于对高分辨率全球大气数据建模,“风乌”还可以模拟台风等极端气象,准确预测台风轨迹。
5月,商汤推出的SenseEarth 3.0遥感大模型不仅拥有业内最全的解译类别,且在解译效率、泛化能力、解译精度等众多指标上均实现了技术突破。
近日,商汤还联合提出了通才AI智能体GITM,能在紧密模拟真实世界的畅销游戏《我的世界》中做到像人类一样生存、探索和创造,并在主世界所有技术挑战上实现了100%的任务覆盖率,在标准任务“获取钻石”上,较目前最佳成绩提升47.5%。
此前,商汤构建的业界首个感知决策一体化的端到端自动驾驶解决方案UniAD,在多项关键数据集与指标上超越了SOTA方法,使车道线的预测准确率提升了30%,预测运动位移的误差降低了近40%,规划误差降低了近30%。
在大会上,商汤还与中国信息通信研究院联合预发布《新型AI智算基础设施白皮书》,《白皮书》提到,每在算力上投入1元,将带动34元的GDP增长,特别是在AI For Science领域,AI能将科研周期从数年降低至几天。