划重点
据称字节跳动正在自研两款AI芯片,分别用于模型训练和推理。
字节跳动计划与台积电合作,于2026年前实现两款自研芯片量产。
字节跳动计划采购数十万颗自研芯片,预计比从英伟达采购节省数十亿美元。
科技新闻讯 9月16日消息,据国外媒体报道,据知情人士透露,TikTok母公司字节跳动正加快自研人工智能芯片的步伐,意在提升在中国人工智能聊天机器人市场中的竞争优势。
两位知情人士证实,字节跳动计划与芯片制造巨头台积电合作,力争在2026年前实现两款自研半导体芯片的量产。这一举措可能会减少字节跳动在开发和运行人工智能模型过程中对昂贵的英伟达芯片的依赖。
对于字节跳动来说,降低芯片成本至关重要。与其他中国大型科技公司及众多初创企业一样,字节跳动已经推出了自家大语言模型,供内部使用和对外销售。然而,市场竞争异常激烈,导致包括阿里巴巴和百度在内的中国科技巨头纷纷将其模型使用价格大幅下调,降幅高达97%。
字节跳动去年发布了其首款人工智能聊天机器人“豆包”,该机器人提供了类似于OpenAI ChatGPT的文本和图像生成功能。今年,字节跳动又推出了一批低成本的大语言模型,其中部分产品的定价比OpenAI的同类产品低了高达99%。
与此同时,字节跳动在开发生成式人工智能模型方面的费用也在不断上升。据知情人士透露,今年,该公司已订购了超过20万颗英伟达H20芯片,这款芯片是美国出口管制下允许出售给中国的最先进英伟达芯片。该订单的总金额超过20亿美元,目前字节跳动仍在等待英伟达交付全部订单。
不过,字节跳动正计划从台积电订购数十万颗自家设计的训练和推理芯片。预计这些内部设计的芯片成本将比从英伟达购买芯片节省数十亿美元。然而,这些芯片目前仍处于设计阶段,因此字节跳动的计划可能会有所调整。
字节跳动和台积电均未对此事作出回应。
字节跳动的芯片研发工作遵循了谷歌、亚马逊和微软等公司近年来的做法,即在开发和运行人工智能模型方面减少对英伟达芯片的依赖。这些公司中的一些还为使用其云计算服务的客户提供了自家设计的芯片,作为对英伟达芯片的替代品。
与此同时,阿里巴巴和百度也在多年来致力于开发内部人工智能芯片。例如,百度正在为其生成式人工智能产品开发一款新的芯片昆仑芯3代。知情人士透露,该芯片已经进入设计的最后阶段,台积电即将开始生产。这一项目此前尚未被报道过。
推理 VS 训练
字节跳动正在开发两款芯片,其中一款旨在加速构建人工智能模型所需的大量数据计算,这种芯片被称为训练芯片;另一款则用于加速基于模型的预测和决策过程,称为推理芯片。
字节跳动多年来一直专注于推理芯片的研发,而此次将首次尝试设计训练芯片,这种芯片的设计难度更大,成本也更高。
知情人士表示,字节跳动涉及的芯片符合美国的出口限制,这些限制涉及对中国公司销售使用美国设备制造的芯片。这一合规性要求是字节跳动与台积电合作的前提。然而,由于美国政府可能每年更新这些限制,未来这些芯片仍可能面临合规风险。
此外,字节跳动计划于2026年推出的芯片设计采用了名为5纳米的先进制造工艺,这一工艺仅比台积电当前最前沿的技术落后一代。5纳米工艺是中国芯片制造商难以复制的技术,也是英伟达今年3月宣布的即将推出的旗舰AI芯片Blackwell所使用的工艺。
H20芯片的性能大约是英伟达H100芯片的四分之一,后者在2022年发布时是英伟达最先进的芯片。尽管H100已上市两年,但由于中国企业面临美国去年10月宣布的出口管制,该芯片的需求仍然旺盛。
由于单颗H20的计算性能低于美国云服务提供商使用的更常见的英伟达芯片,中国公司需要购买更多的H20芯片来组成具有相同计算能力的集群,这增加了他们的成本。虽然美国对单颗芯片的性能有出口限制,但集群系统不受此限制。集群将多颗芯片连接成一个系统,以实现更高效的数据计算。
一位了解字节跳动芯片开发情况的知情人士表示,中国芯片工程师可以通过其他方式提升芯片性能,例如加快集群中每个芯片之间的连接速度,或在访问高带宽计算机内存时提高性能。这些方法并不受美国制裁的限制。
例如,字节跳动希望其自家设计的芯片能够驱动集群,以大致相同的成本实现单颗H100芯片四倍的计算性能。H100芯片的价格最高可达3万美元。
路透社早些时候报道了字节跳动人工智能芯片工作的一些细节,包括其制造工艺和与台积电的合作关系。然而,关于正在研发的芯片数量、用途、订单规模和生产时间表的详细信息,此前尚未公开。(编译/金鹿)