展会信息港展会大全

李开复:正开发一种新的专有模型,手头芯片库存充足至少维持18个月
来源:互联网   发布日期:2023-12-28 19:11:21   浏览:8581次  

导读:划重点 1 李开复最近接受采访时预测,中国生成式AI行业正在经历一场预选赛,最终可能只会剩下几个大赢家。 2 中国的科技巨头和众多初创公司正处于大模型开发的技术验证阶段,需要证明自己有能力构建高质量模型。 3 通过技术验证的公司将进入下个阶段,开始考...

划重点

1

李开复最近接受采访时预测,中国生成式AI行业正在经历一场“预选赛”,最终可能只会剩下几个大赢家。

2

中国的科技巨头和众多初创公司正处于大模型开发的技术验证阶段,需要证明自己有能力构建高质量模型。

3

通过技术验证的公司将进入下个阶段,开始考虑如何实现商业化,增加收入和创造利润。

4

李开复透露,零一万物公司目前正在开发一种新的专有模型,参数超过1000亿。

科技新闻讯 12月28日消息,据外媒报道,风险投资家、谷歌中国前总裁李开复在接受采访时预测,中国生成式人工智能初创行业正在经历一场“预选赛”,在经历了行业大洗牌后,最终可能只会剩下几个大赢家。

李开复:正开发一种新的专有模型,手头芯片库存充足至少维持18个月

今年早些时候,李开复创立了零一万物(01.AI),这是一家总部位于北京,致力于开发大语言模型(LLM)的初创公司。上个月,该公司完成了最新一轮融资,估值高达10亿美元。

目前,中国的科技巨头如阿里巴巴、腾讯、百度和字节跳动,以及众多初创公司,都在开发自己的大语言模型。这场科技竞赛被媒体称为“百模大战”,各大公司都在争夺人工智能领域的领先地位。

在最近的一次采访中,李开复表示,这些公司正处于技术验证阶段,他们需要证明自己有能力构建高质量的模型。经过技术验证的公司将进入下一阶段,即如何实现商业化、增加收入和创造利润。

李开复预测:“在中国,我们最终会有几个大赢家,还有少数公司可以体面地退出,但大多数公司最终要么半途放弃,要么会转向更具体、更实际的目标,比如为特定行业开发应用程序和解决方案。”

零一万物成立于今年3月份,目前拥有100多名员工,大部分人在北京工作。上个月,该公司推出了第一个开源大模型YI-34B,但其未来的收入将不会依赖于此模型。相反,零一万物的商业计划是销售专有的大语言模型,主要面向中国市常据李开复透露,该公司目前正在开发一种新的专有模型,参数规模超过1000亿。

然而,在YI-34B迅速攀升到Hugging Face的开源大语言模型排行榜首位之后,这家初创公司遭遇了一些争议。有开发者调查发现,YI-34B使用了Meta的开源人工智能模型Llama,但并未在相关文档中提及此事。为此,零一万物最终对部分内容进行了重新命名,并感谢了Llama的贡献。李开复也对之前的疏忽表示了歉意。

最近,李开复在北京办公室接受了科技媒体The Information的视频专访,聊到了零一万物的未来、如何应对美国的芯片出口限制、中国人工智能产业的未来发展趋势以及中国人工智能公司如何在全球寻找机遇等话题。

以下为专访全文:

问:中国目前有数十家公司都在开发大语言模型,接下来会发生什么?

李开复:我想中国以前也曾出现过很多类似现象,比如团购及其模仿者、自行车租赁应用的兴起,以及计算机视觉和语音识别在深度科技领域的突破。当计算机视觉证明取得了突破性进展时,无数企业如雨后春笋般涌现,渴望在这个行业中分一杯羹。但现实是残酷的,大部分公司并没有坚持下来。中国市场的竞争尤为激烈,甚至比美国市场还要激烈。

当前,中国人工智能领域的竞争仍然处在预选赛阶段。首先面临的考验是:哪家公司能够率先构建出真正有价值的高质量模型?只有当模型表现卓越,才有可能在实际应用中崭露头角。否则,它只能被视为一个玩具,而不能真正解决实际问题。

那些通过预选赛的公司将进入下一阶段,这一阶段关乎如何增加商业价值。你们有明确的商业模式吗?你们是如何盈利的?很快,投资者将根据这些公司的损益表来评估其价值,提出的问题将与他们对云服务提供商、企业软件公司和消费者应用程序的关注点类似。如果企业无法回答这些问题,它们的增长将会受到限制。

在美国,OpenAI已经证明了其技术的领先地位,并且能够创造收入。由于它创造了足够的价值,人们愿意在其上构建应用程序并为之付费。

而在中国,我们最终会有几个大赢家,还有少数公司可以体面地退出,但大多数公司最终要么半途放弃,要么会转向更具体、更实际的目标,比如为特定行业开发应用程序和解决方案,而不是试图开发预训练大模型。随着时间的推移,开发这些模型的成本将不断攀升。

问:中国人工智能初创企业及其投资者表示,中国将为生成式人工智能模型和应用开发自己的生态系统。你对此如何看?

李开复:我们都不希望出现一个平行的宇宙。我们都更倾向于在全球范围内展开竞争,让真正出色的公司脱颖而出,这样效率才更高。然而,我们无法完全掌控自己的命运。

地缘政治问题尤其突出。如果我们想进入美国市场,虽然法规并未禁止我们进入,但由于目前美国市场对中国软件存在不公平的偏见,我认为我们很难获得大量的业务。这是我们不得不面对的现实。

我们对中国以外的商机持开放态度,但我们完全理解有些事情是不可能的。将我们的专有模型卖给美国的公司是不可能的,他们不会购买,我们也不会做无用功。

中国显然蕴藏着巨大的机会,但我不会将世界其他地区排除在中国公司可能进入的地区之外。总的来说,硅谷的做法是一刀切的。这或多或少地对Facebook和谷歌等公司的崛起起到了关键作用,并帮助美国获得了主导地位。但这一次不同,因为大语言模型是在数据方面进行培训的,而数据涉及到偏见、意识形态和价值观等问题。美国的价值观在某些国家并不受欢迎,甚至不被接受。中国不会是唯一这样做的国家。我认为,中东是另一个可能想要以不同方式思考问题的地区。这将促使各国希望更多地控制自己的模型。

我确实认为,为不同的国家构建不同的特殊模型是有可能的。但这是硅谷公司不愿意去做的事情,因为他们觉得自己的价值观就是正确的,他们希望更多的人能够接受并融入其中。而且,要为不同的市场制造不同的模型,需要大量的工程工作。因此,硅谷公司不愿意开发这类模型。而来自世界其他地区的公司,包括中国的公司,可能有机会研究这种模型。但显然,他们必须赢得用户和各国政府的信任。

问:有媒体报道,零一万物公司成功降低了YI-34B的人工智能培训成本。你们是怎么做到的?

李开复:我们拥有一支非常强大的基础设施团队,这也是我们公司规模最大的团队。我很早就告诉过员工,每增加一个建模人员,图形处理单元的负担就会加重一分。而每增加一名基础设施人员,图形处理单元的效率就会提升一分。当然,我们也需要强大的建模团队,但从一开始,我们的主要优先事项就是构建一个强大的基础设施团队。

基础设施团队的成员们就像无名英雄一样,默默地承担着处理硬件、软件和海量数据的重任。他们还需要处理图形处理单元、内存和网络,这三者中的任何一个都可能成为瓶颈。要知道,图形处理单元很难扩展到几千个以上。当你从2000个增加到8000个时,你不可能简单地通过软件搞定,因为随着你转向更大的模型和更大的数据集,网络需求也会发生巨大变化。

我们的基础设施团队里有数十名工程师,该团队也是目前零一万物最大的团队。他们的工作包括研究如何使用FP8(英伟达H100芯片的数据格式)来大幅减少计算量,还要弄清楚在哪里使用FP8,在哪里使用其他数据格式,以及如何无缝地转换它们。除了这些,他们还得处理一系列令人头疼的问题,比如我们应该使用什么网络协议、如何优化编译器以及如何处理出现故障的图形处理单元。实际上,图形处理单元出现故障的频率相当高。当一个图形处理单元出现故障时,可以热插拔吗?我们仍在努力解决这个问题。我们可以假设下:如果你拥有一个由上千个图形处理单元组成的计算集群,却因为一个图形处理单元出现故障而停止一小时的训练,那么能够进行热插拔将为你每天节省一个小时。这些时间会积少成多。

另一件相关的事情是弹性培训。这意味着,如果你有一个由2000个H100芯片组成的集群,并且你只需要其中500个来执行单独的任务,那么你可以在检查点(Checkpoints,大模型训练过程中保存模型参数的机制)之间移除它们,然后再添加回来吗?这些任务并不是人工智能研究人员该干的,而是属于网络工程师的职责。

如果把大语言模型的开发比作火箭科学,那么就像是没有工程师,火箭永远飞不起来一样。SpaceX的成功并不仅仅是因为其拥有大量研究人员,还因为它做了大量非常复杂的工程工作。

问:美国限制向中国出口先进的半导体技术,包括英伟达的关键芯片。零一万物是如何应对的?

李开复:我曾经公开说过,我们手头有足够的芯片库存,至少能够维持18个月。这些芯片基本上都是在美国出台限制措施之前购买的。我们当然正在努力研究如何使用中国的芯片。这不是件容易的事情。给它们编程并不是我们所熟悉的领域。但如果这是我们必须做的,那我们也会勇敢地迎接挑战。

英伟达的芯片非常出色,但有些人可能会认为,更简单的芯片可以用低得多的成本完成这项工作。然而,英伟达之所以如此强大,背后的一个主要因素是围绕其CUDA软件库打造了一个完整的生态系统,这使得编程变得相对容易。如果我们强迫工程师使用非英伟达的芯片,他们可能会强烈反对,因为他们的效率会大大降低。我们面临的困境要在18个月后才会显现,但我们必须更早开始行动。如果我们无法获得英伟达的芯片,我们将寻找更简单的芯片,更专注于转换器。然而,这将是一个痛苦的编程过程。但是,如果我们别无选择,那我们就只能这么做。

大家都知道,中国工程师有才华、有决心,他们可以出色地应对这种被认为艰巨的工程挑战。这与我之前所说的我们基础设施团队的工作有些相似。学习如何使用非常有限的库来编写新的、非标准的图形处理单元,也是一项繁琐的任务。

中国企业家是坚韧不拔的。中国的工程师都非常勤奋。他们不怕繁重的工作。我们确实面临着许多困难的挑战,甚至可以说它们是在浪费时间和精力。但这就是我们手中的牌,所以我们会尽最大努力打好这些牌。(编译/金鹿)

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港