集微网报道 (文/陈炳欣)中国AI大模型使用美国云服务训练或将受到限制。1月29日,美国商务部在联邦公报中正式公布《采取额外措施应对与重大恶意网络行为相关的国家紧急状态》提案。该提案明确要求美国IaaS(云服务)厂商在提供云服务时,要验证外国用户身份,限制外国行为者对美国IaaS产品的访问,并要求详细报告训练AI大模型的外国交易,保护美国的网络安全和利益。
美国商务部长吉娜雷蒙多也在1月26日表示,拜登政府将提议要求美国云计算公司确定外国实体是否正在访问美国数据中心以训练人工智能模型。要求亚马逊、微软、Alphabet旗下的谷歌等云服务提供商积极调查并公开在其平台上开发人工智能应用程序的外国客户,并要求披露外国客户的姓名和IP地址等详细信息。如果这一政策开始实施,美国政府可以利用这些要求切断中国公司访问数据中心和服务器的主要途径。
对此,外交部发言人汪文斌表示,人工智能发展治理攸关全人类命运,需要的是群策群力、协调应对,而不是脱钩断链、围栏筑墙。我们敦促美方不要违背科技发展的客观规律,切实尊重市场经济和公平竞争原则,为加强人工智能领域的国际协调合作创造良好条件。
近年来,受ChatGPT热潮推动,国内大模型数量激增。据统计,到去年底国内发布的AI模型数量超过200个。目前国内头部大厂的模型水平已逼近GPT3.5,各家厂商积极布局追赶GPT4。而每一个大模型训练的背后都意味着海量的算力投入。而且,从去年第四季度以来,随着上线产品的日活用户数稳定增加,导致推理需求也显著提升,包括有绘图、视频生成等的应用,推理端的AI算力需求也持续上升。
根据业内人士透露,对于头部模型厂商,一般均建设自有的算力平台。因此相关模型的训练大多采取混合模式,一部分在自有算力平台上完成,一部分采用云算力。部分国内大模型甚至已经开始基于腾等国产算力进行训练,如科大讯飞的星火大模型等。这样来看,美国商务部此次新规发布,对国内模型训练领域的影响短期内仍然相对可控。不过相关人士也指出,当未来模型向着更大规模参数如GPT5训练的时候,情况或许会有新的变化。
但是对于那些没有足够的资金自建AI计算中心的中小模型厂商来说,新规的出台将存在一定影响。由于美国对大模型训练所需的A100、H100等高算力GPU芯片严格的出口管制,国内AI大模型训练面临“缺芯”局面,算力缺口比较大。采用订购云服务方式获取AI模型训练所需的算力资源是一定途径。很多中小模型公司因为无力自建算力平台,甚至更倾向于采用云服务的模型,这样可以得到专业人员的支持。一旦新规生效预计会有一些采取这种方式获得算力的企业被美国商务部切断服务,影响大模型的训练进度。
但也要看到,这种规模的云服务租赁是相当昂贵的。例如,英伟达在GTC大会AI超级计算服务DGX Cloud的每个实例价格为3.7万美元/月,包含8个A100或H100加速卡,如果选择租用1万张(1250个实例)加速卡一年,就需要38亿元。而就国内云算力租赁市场来看,云算力的租赁价格相对去年10月份有10%到15%的上涨。目前8卡A100卡的服务器租金约为9万/月,大客户年付费会打6-7折(约为12万/p/年)。
此外,对一些涉及敏感数据、抑或影响国家安全的大模型训练,使用美国云服务也存在比较大的数据安全隐患。从这一点上看,不管美国是否限制,或者限制到多大程度,从长远角度而言,通过海外云服务获取计算资源可能都是不太可持续的。
采访中,也有业内人士指出,此次美国出口管制扩大,从长远角度来看,将使国内的云服务商受益,从而加速中国云服务出海进程。AIGC大模型时代的到来使得智能算力成为普遍需求,将加速云计算服务的发展。2022年全球云计算规模达到3566亿美元,预计2023年将突破4000亿美元。而根据IDC数据,亚马逊AWS、微软、谷歌、阿里巴巴和IBM占据了全球的51%以上的市场份额。AWS目前在中国的市场份额为8.6%(排在阿里云、华为云、天翼云和腾讯云之后)。
从这一数据来看,由于AWS等海外云服务商在中国本土市场的占有率并不高,因此新规实施对美国云服务商在华营收的影响可能也比较有限。但对中国云厂商来说,长远来看将是一个利好,不仅可以获得一部分海外云服务商“吐出”的国内云服务市场,对于那些中国的出海企业,原本选择AWS、Azure,未来有可能转而采用中国的云服务商,进而加速中国云服务出海进程。
当然,中国AI云算力的发展仍然是以AI芯片为基矗目前国内部分头部模型大厂已开始基于腾部署AI模型。据悉,腾910B卡的理论计算值接近英伟达A100,但在生态系统和产量方面还存在一定的不确定性。然而,在美国对华封锁加剧的背景下,以华为腾等为代表的国产算力有望进一步发展。