AI时代在2023年正式拉开了序幕。
根据Markets and Markets数据,2023年全球AI市场规模为1502亿美元,预计2023年至2030年复合增长率为36.8%。
托举起这个AI大时代不断向前的,是那些脚踏实地的企业它们坚持长期主义,深深地扎根于产业土壤,关注生产力的创新与颠覆式增长,持续探索、试错与实践,埋下时代变革的种子,并向阳而长。
商汤(00020.HK)正是其中最典型的一家。
2023年是商汤成立的第九年。对AI大时代的畅想与厉兵,坚实了商汤发展思路踏实打基础,落地找应用一方面,商汤通过打造新型AI基础设施“商汤AI大装置SenseCore”,打通算力、算法和平台;另一方面,商汤建立“日日新SenseNova”大模型及研发体系,以低成本解锁通用AI能力,推动AI创新和落地,打通商业价值闭环,解决长尾应用问题。
AI时代已至
全球顶尖科技巨头都在不遗余力地拥抱这个AI大时代。
就在11月初,马斯克发布了他新创办的AI 公司xAI 的首款产品Grok,这是一款对标ChatGPT 的聊天机器人,马斯克由此真正进入了生成式AI 这条目前最热门的赛道,与OpenAI、谷歌、Meta 同台竞技。
苹果据悉今明两年将豪掷数十亿美元采购AI服务器,力图追赶微软和谷歌的领先地位。此外,苹果计划最早在2024年年底将生成式AI技术融入iPhone和iPad,端侧AI应用落地接近转折点。
成立48年的微软借力OpenAI正重新成为全球最领先的科技公司。微软坚信下一代AI将重塑每个软件类别和每个业务,包括微软自己的业务。CEO萨蒂亚纳德拉在10月致公司股东的年度信中写到,非常看好AI,未来继续大力押注。
国内大厂也正在扑面而来的AI大潮中迎头赶上。仅仅是类ChatGPT技术方面,各大科技公司年内已推出的大模型数量超180个,还有数十个在研。赛迪顾问数据显示,今年1-7月,中国大模型发布量占全球比重达67.4%。
除了数量的爆发式增长,大模型的参数也在增长。GPT-2的预训练数据量为40GB、参数量仅有15亿个,GPT-3的预训练数据量达到45TB、参数量更是高达1750亿个,GPT-4则据称为1.8万亿参数量,13万亿训练数据。而目前的多模态大模型参数量普遍相对较大,多在千亿级以上。
随着企业数据的不断积累,算力基础设施不断完善,未来大模型的商业应用场景将越来越多,大模型赋能千行百业,中国AI市场规模也将持续扩大。赛迪顾问预计,2025年中国AI产业规模将超3000亿元,未来三年产业规模年均复合增长率达到18.8%。
商汤的AI理念
身处这个正被AI深刻改变的时代,商汤有着自己的发展理念。
AI的发展,需要大算力底座,需要基础设施,也需要能够结合产业应用落地。商汤坚持先打基础,再找应用。
商汤意识到,当前业界训练大模型,对大算力的需求非常旺盛,而真正好用的基础设施却十分稀缺。因此,商汤打造了新型人工智能基础设施商汤大装置SenseCore,打通算力、算法和平台。
据悉,大装置SenseCore拥有超30000张GPU,融合了AI、超算与大数据的核心能力,通过为AI优化的高性能计算、高性能存储及缓存、高性能网络,以存算分离、大规模弹性、容错调度等特征,支撑大模型在数千张卡、PB级存储上,完成万亿级参数大模型训练。
SenseCore AI平台产品则提供了模块化、全链条的数据、训练及推理能力,可实现百亿级数据管理及检索、人工标注服务,加速AI大模型研发效率。一键量化、一键部署、一键应用,提供了大模型快速上线验证的工具,加速创新。
“商汤大装置既是算力平台,也是数据型服务平台。未来技术发展当中,如果没有这样一个基础设施平台,创新科技几乎是不可能的。”商汤科技董事长兼CEO徐立表示。
目前,商汤大装置已累计服务超50个核心客户,其中大模型客户10家以上,涵盖智能驾驶、生物制药、芯片设计、智慧商业、高校科研等前沿领域,已在超过20个落地场景中实现大模型交付。
在大装置基础上,商汤构建了“商汤日日新SenseNova”大模型体系。
日日新SenseNova是国内首个综合能力超越GPT-3.5的大语言模型及文生图大模型,已服务上千家客户,模型相关业务规模已增长6倍。
“我们以商汤AI大装置SenseCore打造AGI(通用人工智能)时代的基础设施,并基于此将大模型体系命名为‘日日新’,寓意‘苟日新、日日新、又日新’,希望在模型迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”徐立称。
基于“商汤日日新SenseNova”大模型体系,商汤针对不同细分场景打造了系列生成式AI大模型应用,包括大语言模型应用商量SenseChat、图像生成平台秒画SenseMirage、数字人视频内容创作平台如影SenseAvatar、大场景3D内容生成平台琼宇SenseSpace、物体重建及营销服务平台格物SenseThings。
“目前的人工智能就是一门实践科学,训练一个大模型如同教育一个小孩,‘课程设计’是其中的关键。”徐立表示,商汤会专注于“课程设计”和高价值数据的构造,结合不同领域的Knowhow可以快速训练适用于行业的专用模型,实现行业落地。
商汤科技已将AI商业化赋能多个行业。在“商汤日日新SenseNova”大模型体系下,商汤正积极通过大模型的多模态能力组合赋能产业升级,并带来诸多引领行业的应用创新。
商汤凭什么?
数据、算力和算法是AI最底层的三大要素,亦是决定AI发展的重要基矗支撑商汤发展战略的,也是其自身在三要素领域独特的优势。
算法类似于AI模型的大脑,目前我国在AI算法基础理论研究方面与海外的差距已经缩小,同时由于AI算法的革新频率较快,未来在某些垂直领域的进展可能更为领先。
商汤很早开始探索计算机视觉领域,2017年布局决策智能,2019年开始涉足NLP(自然语言处理)领域,为大模型的研发和后续应用打下了坚实的算法基矗
另一方面,算法的本质是人才的力量。目前,商汤已组建成亚洲最大、水平最高的AI研究团队,核心团队具有20年的科研经验,不断探索最前沿的人工智能研究。截至2022年末,商汤研发队伍高达三千多人,占员工总数近70%,全年研发支出超40亿元。
算力为AI模型提供运行动力,没有足够的算力,AI模型就无法顺利进行训练、推理和应用。面对高速增长的算力需求,GPU等高性能算力资源紧缺是目前制约人工智能发展的主要因素之一。
商汤位于上海临港的人工智能计算中心(AIDC)2022年初正式启动运营,目前能够输出超过6000 Petaflops超大规模算力,拥有行业领先的算力输出能力、超大模型训练及大规模推理能力,是亚洲最大的智能计算平台之一。
近期,商汤位于重庆的人工智能计算中心正式“点亮”。据悉,商汤重庆AIDC首期建设以国产化算力为主,中长期规划建设算力1000 Petaflops。
数据的累积下沉和打通是一切人工智能模型运行和应用的基础,AI模型训练需要大量高质量数据作支撑,大模型的价值观和安全性也依赖于训练数据质量。
商汤在AI数据方面的优势源于其积累的原始语料数据体量已经非常大,而更加有壁垒的其实是提高数据的质量。
为提高数据质量,商汤投入了数百台服务器,搭载了千卡级的GPU计算资源,同时靠算法结合人工标注的方式,对原始语料数据做分门别类的精细化清洗。
“我们训练了大量的分类器,可以按照要求筛选出高价值的数据,也对一些特定类别数据进行了大量的人工标注。”商汤科技告诉第一财经,“商汤关注训练数据的每一个细节,确保其质量、安全性和价值观都符合要求。”