撰文/ 张贺飞
编辑/ 沈洁
首届“华为伙伴暨开发者大会”即将拉开帷幕。
按照早前披露的消息,“华为伙伴暨开发者大会”将承接“华为中国生态大会”开放共赢的理念和“HDC.Cloud”勇于创新的精神,既包括最新的业务应用场景和市场拓展,也将集中展示华为生态中产品创新和技术孵化的最新进展。
在千行百业的数字化转型进入到深水区,数字经济在GDP中的占比越来越高的背景下,“华为伙伴暨开发者大会”在某种程度上扮演了风向标的角色。特别是作为数字经济核心基础设施的计算产业,直接影响着数智转型的进程。
为了帮助大家抓住“华为伙伴暨开发者大会”上的焦点,不妨基于腾AI的发展过程和业务布局,在这里提前划一些重点。
01
继续深耕算力网络
人工智能行业一直流传着三要素的说法,即算力、算法和数据,其中算力和工业时代的水煤电一样,常常被视为经济增长的核心生产力。
为了满足人工智能的“算力自由”,腾AI在2018年就推出了全栈全场景AI解决方案,并积极推动人工智能计算中心的建设,先后在深圳、武汉、西安、成都、杭州、南京、青岛等城市推动人工智能计算中心的建设,通过配套公共算力服务平台、应用创新孵化平台、产业聚合发展平台、科研创新和人才培养平台的方式,将人工智能算力有序且高效开放给当地的企业、机构和高校,解决智能化转型过程中的算力需求和服务问题。
进入到2022年前后,人工智能计算中心正面临着新的形势:一是随着超大规模预训练模型的产业落地,对算力的需求持续攀升;二是在国家“双碳”战略下,计算中心需要不断提升利用率,进一步减排降耗。
其实在2021年的华为全联接大会上,深圳、武汉、西安、成都、上海等21个城市共同点亮“人工智能算力网络”,可通过“一网络”实现算力、数据、生态的“三汇聚”,以“大算力+大数据”使能大模型,促进产业发展。
2021年底的时候,在科技部指导下,鹏城实验室、华为、武汉人工智能计算中心、百度等近20家单位加入“人工智能算力网络推进联盟”,旨在整合业内资源并加强合作,让计算中心不再只是作为独立的系统发挥作用,而是逐步形成相互联接的算力网络,以满足网络化算力联通调度,促进大模型开发和跨区域应用落地。
打一个比方的话,人工智能计算中心就像是一座水电站,可以满足一个区域的用电需求,但发电能力和服务范围都有上限,为了平衡不同区域的用电需求,最常见的做法就是用高压线路将一个个独立的水电站连接成网。人工智能算力网络有着同样的道理,让算力、数据、模型和应用流动起来,既可以让算力的使用削峰填谷,还能够将算力资源利用效率最大化,不断降低全社会的算力使用成本。
国家也在2022年初正式出台了“东数西算”工程,在此背景下,算力网络就像电力网一样蕴含巨大的消费发展空间。当前,算力正在改变经济增长模式与科学创新模式,将对国家宏观经济发展、前沿科学研究产生重大影响,尤其是智能算力已成为其中的重要组成部分。
作为人工智能算力网络的先行者和中坚力量,腾AI势必会在算力协同、集约布局、交易流通、运营调度等方面继续深耕,挖掘算力网络的最大效率,并扩展应用和创新的空间,加速人工智能的科研创新、产业汇聚、人才培养、应用孵化。
02
继续构建大模型生态
一旦人工智能算力网络打破算力上的瓶颈,无疑为大模型的训练创造了天然有利的条件,注定会推动大模型的生态进程。
大模型确实是当前最为热门的技术名词之一,其中的原因离不开预训练技术的诱人前景:可以用自监督学习的方法让模型对海量无标注数据中的规律和知识进行提炼、学习,当面向任务和场景应用时,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型。
也就是说,大模型的应用可能改变现有的人工智能研究范式,成为不同领域的共性平台技术,将是人工智能走向通用型技术的重要一步。
腾AI可以说是国内探索大模型落地应用的先行者。思MindSpore在2021年推出的1.5版本中,就针对大模型的训练进行了一系列创新,并在思MindSpore1.6和1.7中围绕大模型进行了持续优化。
比如通过AI编译器实现了多维度混合并行,支持数据并行、数据切片预处理等七维混合并行算法,这是并行维度业界最多、模型切分支持结构最全、单机容纳模型参数业界最强的AI框架。进而实现开发并行代码量降低80%、系统调整时间下降60%,拥有512卡就能完成十万亿模型参数训练的超强能力。
不过,大模型的价值不在于有多少参数,而是能否进行产业落地,能否让大模型走出实验室、走进场景中。同时国内的大模型产业还处于走向应用的探索期,同一领域的大模型有多家企业、机构在做,存在缺少系统规划、重复开发的现象,甚至可能陷入盲目追逐参数规模的陷阱。
腾AI显然深谙此理。
基于腾AI基础软硬件平台,目前已出现全球首个三模态大模型紫东.太初、全球首个遥感影像智能解译深度学习专用框架武汉.LuojiaNet以及业界最大的遥感影像样本数据集武汉.LuojiaSet、全球首个两千亿稠密参数中文NLP大模型鹏程.盘古、面向生物信息研究领域的鹏程.神农平台等创新成果,并通过支撑伙伴成立多模态人工智能产业联盟、智能遥感开源生态联盟,开创了大模型产业落地的新模式。
针对当下大模型生态面临的问题,腾AI大概率会继续构建大模型生态,并且可能会在三个层面上下功夫:
一是联合产业界根据AI的发展方向进行大模型规划,并通过算力网络赋能大模型科研创新;二是深化大模型的开发工作,持续降低大模型的应用适配门槛;三是打通大模型的上下游产业链,持续推动大模型的产业落地应用。
03
继续推进产业生态
不管是算力网络还是大模型,腾AI的初心其实并不复杂,即通过赋能的方式加速人工智能在千行百业的落地。
而想要完成这样的目标,产业生态的重要性不言而喻。一个良性的生态绝不是独木成林,需要打造创新的土壤和环境培育幼苗,让他们有机会长成大树,当大树越来越多时,自然会形成一片片森林。于是在算力、AI框架、大模型等硬核技术外,腾AI的另一个重心就是开发者和合作伙伴。
首先是开发者的培养。为了打破人工智能人才短缺的束缚,腾AI 推出了一揽子的培养计划,譬如和高校联合培养人才、培育开发者生态、举办行业赛事甚至是走进线下和开发者进行面对面的交流。
可以找到的例子有很多。“腾AI开发者创享日”正在从西安起航进行全国巡回,为开发者提供了一个深度探讨与交流的平台;首届腾AI创新大赛已经启动,在国内划分出了15个赛区,通过比赛的方式促进人才培养;腾众智计划在2022年投入2亿元的激励基金,推出超过4000个任务……
然后是合作伙伴的使能。腾AI与全国各地的合作伙伴达成了深入合作,将腾AI的生态能力和伙伴们的禀赋融合,通过硬件开放、软件开源、使能伙伴的方式,不断释放“腾AI向上的力量”。
比如腾AI与合作伙伴联合打造的人工智能融合赋能平台,正在为城市、煤矿、电力、金融、公路等领域赋能,目前已经在深圳龙岗等地验证了智能化转型的新范式;再比如极目智能基于腾AI自主研发的智能驾驶方案,实现了市面上量产最高级别的智能领航辅助和智能泊车HPP功能,达到了L2+级别的智能驾驶。
结果或许超出了不少人的料想:目前腾AI的合作伙伴已经超过500家,联合孵化了1000多个解决方案;近百所高校已累计开设700多门腾AI相关课程;腾众智计划已经发布4000多个众智任务,和80多所高校和企业签约;同时开发者已经超过80万,思MindSpore社区的下载量已经超过166万次,开源了超过320个模型,服务了5000多家企业。
联想到“华为伙伴暨开发者大会”中鲜明的主语,腾AI很可能会继续推进产业生态,在产业合作、人才培养等方面拿出新的方案,不排除将和新的伙伴联合打造有价值的新产品和新方案。
04
写在最后
做一个总结的话,腾AI的焦点将集中在算力网络、大模型和产业生态上,通过汇聚伙伴和开发者的智慧与力量,加速人工智能产业的底层创新、行业应用和生态繁荣,不断释放腾生态的力量。
当然,最终的答案还要等到“华为伙伴暨开发者大会”现场揭晓,其中华为计算产品线总裁邓泰华在6月15日下午的演讲,将是洞察腾AI新动态、新思路、新价值的题眼,深度了解腾AI的第一手资料。
主理人 | 张贺飞(Alter)
前媒体人、公关,现专职科技自媒体
虎嗅、钛媒体、36kr、创业邦、福布斯中国等专栏作者