英伟达困局,中国AI芯片走出筑基期
芯师爷
2024-12-19 17:49发布于广东芯师爷官方账号
作者/质子
编辑/嘉嘉
来源/司库财经
近期,因涉嫌市场垄断,英伟达被国家市场监督管理总局立案调查。受此影响,英伟达、AMD、阿斯麦等美股半导体公司股价应声而下,其中在被立案调查当日,英伟达股价下跌近3%,市值蒸发掉6400亿元。
与海外半导体公司普遍下跌相比,中国AI半导体概念股集体上涨,寒武纪盘中涨超3%,海光信息涨超4%,景嘉微涨超5%……
作为AI加速芯片沙皇,英伟达掌握着全球90%的市场份额,H100、A100更是被全球AI公司跪求,在AI产业发展的关键期,对英伟达立案调查是否会影响中国AI大模型的发展?
其实完全不用担心,虽然在性能上,中国AI芯片企业跟英伟达还有较大差距,但在产业链生态上,中国AI企业已经度过了筑基期,正在加速发展。
【1】Open AI将英伟达送上王座
2022年11月30日,Open AI发布全新聊天机器人模型ChatGPT,产品上线五天,全球用户量就突破100万,宣告了AI技术取得重大突破。
这一天对黄仁勋来说,是英伟达的“iPhone时刻”此后全球成立的AI企业数量近3万家,其中仅生成式AI,国内企业数量就高达4500 家,这些企业对算力、AI芯片有着极强的渴求度。
据了解,2018年,Open AI发布GPT-1时,模型拥有的参数为1.17亿个,但到了2023年发布GPT-4时,其模型参数达到了1.8万亿个,五年时间参数量增幅超过一万倍。
更为重要的是,算力需求还在持续增长。华为预测数据显示,在2020年的算力基础上,2030年AI的算力要求将增长500倍,通用算力要求将增长10倍。
“数据结构发生变化,现在都是大量的非结构数据,都是图片、视频、语音,CPU处理能力很弱的数据”,在接受第一财经采访时,华为腾计算业务总裁张迪煊表示,海量的非结构性数据需要更高的算力支撑,这就需要英伟达的GPU。
与专注一件事的CPU不同,英伟达GPU专为并行计算而设计,它本来适用于对图形进行渲染,能同时处理数千个计算线程,极大提升了大模型的训练速度。
英伟达GPU在AI训练速度上有多强悍?看一组数据对比就知道了,以GPT-3基准测试为例,英特尔系统训练耗时67分钟,而英伟达系统只需要3.4分钟,英伟达在效率上完胜英特尔。
靠着AI算力需求的浪潮,英伟达达到了历史巅峰。天眼查数据显示:2023年,英伟达营收为609 亿美元,净利润更是达到297.6亿美,市值更是达到3.36万亿美元。
而要知道,在十年前,英伟达还是那个全年营收41亿,要给雷军站台才能拉来订单的IT边缘厂商。
生成式AI将英伟达送上了王座,但在大国角逐的舞台上,即便强如英伟达,依然受到波及。
【2】中国AI被打压
“中国的现状是一流的应用、二流的模型、三流的算力”,中金公司研究部计算机行业首席分析师于钟海在谈及中国AI产业发展时认为,算力是最为薄弱的环节,也是国内AI企业最重要的环节。
但想要国产替代谈何容易。
国内AI加速芯片最能打的型号是腾910B,该芯片采用采用7nm工艺,拥有496亿个晶体管,其FP16的运算性能约为320Tflops,整体性能达到英伟达A100的水平。
而英伟达目前最先进的AI芯片为GB200,该芯片采用4nm工艺,拥有2080亿个晶体管。
目前国内普遍认为:“H100性能是A100的2至3倍,Blackwell B200是H100的5倍”,我们可以换算出,一颗英伟达GB200相当于1015颗腾910B。
可以说英伟达要性能有性能,要生态有生态,要性价比有性价比,在这种综合能力打击下,英伟达垄断了国内90%的AI加速芯片,华为等AI芯片只能做点边缘业务。
(来源:英伟达)
历史是惊人的巧合,与光刻机、手机芯片等半导体产业一样,中国AI加速芯片转折点源于一次又一次的封锁和打压。
2022年9月,美国通过设置功率门槛和芯片之间通信速度门槛,限制英伟达A100 和 H100以及 AMD MI250出口。为了能供货,英伟达根据限制条件,研发出了“阉割”版本的A800和H800芯片。
2023年10月,为了进一步限制中国AI产业,美国升级限制力度,要求英伟达禁止向中国市场出售运行速度达到300 teraflops(即每秒可计算 3亿次运算)及以上的数据中心芯片。
这也意味着,此前“阉割”版的A800和H800也被禁止出售中国,为此,英伟达不得不再次“阉割”,推出HGX H20、L20 PCle、L2 PCle三款AI加速芯片。
据了解,“阉割”版在“阉割”后的HGX H20芯片,价格为11万一颗,但整体计算能力只有H100的15%,L20 PCle和L2 PCl其FP16稠密算力分别为8.8TFLOPS和4.4TFLOPS,只有H100的12%、6%。
这样的性能根本不能满足国内AI大模型厂商的算力需求。
确实,谁都知道AI是未来,是方向,但出口已经被美国封死压制,没有一点出路,留下的只有反抗。
【3】走过筑基期
正如《三体》中水滴对地球科技发展的锁死一样,美国政府对英伟达一而再,再而三的不断施压,中国AI企业从英伟达等国外厂商进口的AI加速芯片的通道已经被锁死。
“美国在AI芯片领域对中国的制裁长期不会取消,而中国半导体制造工艺由于也受美国制裁,将在相当长时间处于落后状态”,在华为全联接大会2024上,华为副董事长、轮值董事长徐直军直接挑明,“这就意味着我们所能制造的芯片的先进性将受到制约。这是我们打造算力解决方案必须面对的挑战。”
科技有国界,形势异常艰巨,核心基础技术卡脖子意味着将生存的命脉放在对方手中,中国AI企业必须放弃幻想,准备战斗,然而反抗的火种已经在各个产业悄然打响。
12月2日,美国商务部宣布了新的对华半导体出口管制措施,将140家中国企业列入实体清单。次日,中国互联网协会、中国汽车工业协会、中国半导体行业协会以及中国通信企业协会集体发表声明:美国相关芯片产品不再安全、不再可靠,建议国内企业谨慎采购美国芯片。
显然现在国内像华为、百度等AI加速芯片在性能上无法替代英伟达的高端芯片,但中国AI加速芯片已经初见成效,形成产业集群。
腾910B,寒武纪推出910B AI芯片,其FP16稠密算力达到128TFLOPS,超过英伟达A100;海光信息推出的海光2000 AI芯片,是国内首款基于5nm工艺的云端推理芯片;百度昆仑与飞桨及其他国产软硬件组合打造了国产化AI技术生态……
更为重要的是,在国产供给的同时,因为不满英伟达“阉割版”的“阉割版”的AI芯片性能,中国移动、百度等企业开始采购国内AI芯片。
2024年4月,中国移动智算中心(呼和浩特)投产使用,部署2万张AI加速卡,其中AI芯片国产化率为85%。但到了8月底,中国移动智算中心(哈尔滨)投入使用时,AI芯片国产化率100%。
外采变内购,在美国行政命令的限制下,英伟达只能向中国提供性能被大幅“阉割”的AI芯片,根本无法满足国内市场需求,但正是因为政策限制,反而推动了国产AI加速芯片研发生产。
曾经相似被卡脖子的困境我们也曾遇到。2019年,H公司无法获得7nm芯片,其消费电子业务被直接按下刹车键,但随着MATE60、三折叠屏手机的问世,华为内磐重生。
如今类似的境遇也发生在百度等AI大模型厂商身上,英伟达的大模型训练工具被断供,但好消息是,面对美国的不断封锁,中国AI加速芯片已经走过了筑基期,剩下的只需要耐心和等待。
2019年,对于中国制造光刻机,ASML首席执行官温彼得一脸傲慢:就算给你们全套图纸,中国也造不出光刻机。但四年后,面对同样的问题,温彼得颇为忧伤:中国有14亿人,而且聪明人很多,我们太自以为是了。
我们真心希望,光刻机、手机芯片发生的事情,四年后能AI加速芯片身上上演,这一定很难,但一定会实现。