在10月30日的FII Institute大会上,多位人工智能领域的领军人物齐聚一堂,其中包括创新工场董事长兼首席执行官、01.AI首席执行官李开复博士,You.com创始人Richard Socher,以及Stability AI首席执行官Prem Akkaraju。
伴随着大型语言模型在理解和生成人类语言方面取得了突破性进展。在此背景下,李开复分享了他对人工智能发展的独特见解。"这一次的AI发展是真实的,"李开复回顾道。作为见证人工智能起伏的资深专家,他分享了自己从大学时期就开始追逐AI梦想的经历。在经历了几次"AI冬天"后,约七八年前,深度学习的发展让他重新看到了AI创造巨大价值的可能。通过创新工场,他们成功孵化了12家AI独角兽企业。而如今,生成式AI的快速发展促使他从投资人转型为积极的参与者,从"后座"走向"驾驶座"。李开复对AI的未来持强烈的确信态度:"在2030年左右,只会存在两类公司:充分利用AI的公司,和已经破产的公司。“
在探讨中美科技竞争时,他指出了两国在AI发展上的独特优势:美国公司在创新和开创性技术上占据优势,而中国公司则在执行力、工程实现、应用开发和用户界面设计等方面表现出色。在这个"发现时代",虽然美国可能在技术创新上保持领先,但中国企业通过优秀的工程能力和解决方案交付,同样可以在AI浪潮中占据重要位置。
文稿整理主持人: 大家好,欢迎参加另一场关于人工智能的对话。我觉得我们关于这个话题的讨论还不够。在这里,我要特别感谢 Richard 和 FI 团队,今年他们大大推动了关于人工智能的讨论。我认为没有哪个话题能比这个更重要了,不论是在金融、领导力、教育还是医疗领域,人工智能正在改变我们的一切。今天我们有三位非常出色的 CEO,他们分别代表了人工智能发展中的不同领域。首先,我会请每位嘉宾用一分钟自我介绍,讲一讲他们的工作。然后,我们会探讨这个领域的未来发展速度、规模,甚至还会问问大家在 ChatGPT 之后,人工智能还会怎样发展。Prem,就从你开始吧。
嘉宾Prem Akkaraju: 好的,谢谢你,Peter。我是 Prem Akkaraju,Stability AI 的首席执行官。我们公司是全球领先的开源图像、视频和 3D 模型平台之一。至于 GPT 之后的发展嘛,图片确实胜过千言万语,而我们也在大量生成这些图片。事实上,去年 2023 年所有由 AI 生成的图像中,有 80% 是由我们的模型 Stable Diffusion 驱动的。
主持人: 非常棒!Richard,你呢?
嘉宾Richard Socher: 大家好,非常高兴来到这里。我是 Richard Socher,you.com 的创始人兼 CEO。you.com 是一个生产力引擎,它是继搜索和回答引擎之后的下一代产品。我们的目标是帮助各类组织提升生产力,从对冲基金、大学、公司到保险公司、新闻社等,几乎涵盖了各行各业。我还运营一个名为 ax Ventures 的风险基金,投资早期的人工智能公司和初创企业。在我任教于斯坦福大学时,我有幸遇到两位学生,他们创办了一个叫 Hugging Face 的公司。我在他们 500 万美元的估值时投资了,现在他们的公司已经达到 45 亿美元的市值,所以基金表现不错(笑)。
主持人: 你这可是实打实的炫耀啊(笑),我也希望我能像你一样。李博士,您来介绍一下。
嘉宾李开复: 大家好,我从事人工智能研究已经有 43 年了。我大学时才开始接触 AI,那时我才刚二十岁左右,可能比很多同行的年龄还小。我专注于机器学习领域,持有卡内基梅隆大学的博士学位,也曾在苹果、微软和谷歌工作。可能有些人通过我的书《AI超级智能》和《AI 2041》认识我。我的兼职工作是运营创新工场,这是一家全球性投资机构。而我的全职工作是管理 0. 这是一家生成式 AI 公司,我们构建了大型语言模型,目前在性能上排名第三,仅次于 OpenAI 和谷歌的顶级模型。我们的产品可以在全球访问,我们也积极参与开源项目。
AI生成电影主持人: 首先,我要说,李开复博士是全球 AI 领域的传奇人物,能够邀请到他非常荣幸。Prem,咱们先从你开始吧。你很有名的一件事就是成功招募了詹姆斯卡梅隆加入你的董事会。鉴于 Stability AI 正在创造视频、推动好莱坞的未来,我想问两个问题:第一,卡梅隆在《终结者》中描述的未来对了吗?第二,关于好莱坞的颠覆性讨论很多,未来 AI 是否会创作所有电影和内容?
Prem Akkaraju: 哈哈,那就让我们希望卡梅隆在《终结者》里描述的未来不会成真吧!不过那真是一部好电影,他还经常开玩笑说“我早就告诉你们这个未来会来,现在它真的来了”。他为什么会对 Stability 有兴趣呢?这是个好问题。我很幸运能够在我担任 Weta Digital CEO 时,与他一同制作了《阿凡达2》,那部电影花了四年多才完成,因为它是完全渲染出来的。如果我们快进到 5 到 10 年后,我认为绝大多数电影、电视和视觉媒体将不再需要渲染,而是直接生成。在《阿凡达》中,有些镜头花了六千到七千个小时的计算时间来渲染一帧画面,而现在这个过程可以缩短到几分钟。所以,卡梅隆希望能节省很多时间。电影制作的难题在于时间和资金,而他希望打破这些障碍,从渲染模式转变到生成模式。
主持人:那么,我们会不会看到 AI 根据每个人的喜好生成“量身定制”的电影呢?
Prem Akkaraju: 我个人希望不会吧(笑)。我认为创作过程应该由人类主导,人类需要利用这些工具来实现他们的故事。因此,我相信大家依然会喜欢听别人讲述的故事。
主持人: 那好,我们换个方向吧。未来我们会不会看到玛丽莲梦露等已故明星重新“回归”?既然 AI 能生成绝对逼真的演员和明星,是否还需要真人演员?
Prem Akkaraju: 其实在电影制作过程中,直接拍摄演员的表演反而更快捷,直接拍摄真实的摄影素材更有效。所以我认为 AI 会加强这种表演,但导演和演员之间的互动依然是创作过程的重要组成部分,这种物理性创作的部分不会很快消失。事实上,我经常思考哪些事物不会改变,就像我思考哪些会改变一样。
主持人: 不过我确实认为,在导演拍摄一遍后,他会说“我明白了”,因为他们可以像你所说的那样,通过操控表演来达到预期效果。在继续之前,我还有一个问题想问你:十年后,随着数字超级智能的发展,电影和电视会发生什么最剧烈的变化?你认为娱乐行业最疯狂的前景是什么?
Prem Akkaraju: 我认为我们会看到内容创作量呈现 5 到 10 倍,甚至 20 倍的增长。我们会看到时间形式的多样化,比如你可能希望在睡前花两分钟,或者二十分钟看一部电影。不同时间长度的内容将会出现爆发式增长,而且全球艺术家的数量也会大幅增加。
NLP发展方向主持人: 十年后我会回来看看你说的对不对(笑)。Richard,我们接下来谈谈你。你在神经网络应用于自然语言处理的早期阶段做了很多开创性工作。你觉得 NLP 的下一个前沿是什么?能否简单解释一下什么是 NLP,以及它未来的发展方向?
Richard Socher: 自然语言处理(NLP)过去是人工智能的一个子领域,但我认为它几乎影响了人工智能的所有其他领域。有许多不同的算法可以训练。2010 年我有一个疯狂的想法:训练一个通用的神经网络来处理所有 NLP 任务。到 2018 年,我们终于构建了第一个模型,开创了提示工程的概念,让人们可以通过一个模型回答所有问题。随着时间的推移,人们可以不仅仅通过文本提问,还可以通过图像提问。因此,我认为 ChatGPT 之后的答案之一就是我们会有更多的多模态模型,能够在图像、视频、声音、编程等不同输入输出模式间无缝转换。其中一个特别有趣但尚未广泛认识的领域是蛋白质。蛋白质本质上是生物学中的基本“积木块”,一切都由蛋白质主导。就像你可以让大型语言模型为你写诗一样,你也可以让它设计特定种类的蛋白质,比如只与 SARS-CoV-2 结合的蛋白质,或只针对脑部特定癌症的蛋白质。这将为医学带来巨大的突破。目前我们看到 DeepMind 的 Alpha Proteo 等项目已经展示了这一潜力。
主持人: 前些时候我们讨论过“智能上限”问题,但我没听到你的答案。我们刚刚在一次关于数字超级智能的讨论中提到这个问题。我们看到 AI 变得越来越智能。昨天我和埃隆聊天时,他说,到 2029 或 2030 年,AI 的智力将等同于全人类。你觉得智力会不断增长到百万倍、十亿倍,甚至兆亿倍吗?是否存在智能的上限?
Richard Socher: 这是个非常有趣的问题。说到 AlphaFold 和 Google 的研究,理解蛋白质如何折叠能帮助我们了解它们在体内的功能和相互作用。2020 年,我们在 Salesforce 的研究团队创造了第一个生成新蛋白质的模型,设计出的蛋白质与自然界已有蛋白质有 40% 的不同。我们在实验室中合成了这种蛋白质,它具有抗菌性质。至于智能上限,实际上要看智力的不同维度。比如语言智能、视觉感知、推理、知识提取以及物理操控等。以视觉智能为例,人类的视觉依赖于电磁频谱,而我们可以预见 AI 将来可以看到更宽的频谱,比如伽马射线频段。但最终我们会遇到物理极限,比如量子物理限制或光速限制。在某些方面,我们离这些上限非常遥远,但在某些领域,我们已经非常接近了。
主持人: 你提到工作效率是 you.com 的目标之一。那么,这是否意味着工作生产力也存在上限?随着 AI 代理人和机器人能够执行几乎所有任务、并自我改进,是否会出现某种“无限 GDP”呢?
Richard Socher: 在某些领域,AI 可以进入自我训练循环,只要有模拟环境,比如国际象棋或围棋,它们可以完美模拟,AI 能够自我训练,进行无数次博弈,解决该领域的所有问题。另一可完美模拟的领域是编程,编程语言的输出可以在计算机中模拟,因此 AI 可以在这个领域不断提升,达到超人级的编程能力。但是有一些领域是无法进行无限次模拟的,比如客户服务。你可能会遇到数十亿客户,他们会询问各种产品使用过程中遇到的问题。在这些领域中,限制因素将是数据的收集。你能否真正将一个流程完全数字化?我常开玩笑说,水管工大概是最安全的职业,不会被 AI 取代,因为还没有人去收集关于如何修水管的数据。想象一下,你要爬到某个地方接不同的管子,现在还没有人用 GoPro、3D 传感器和机器人手臂去收集这种数据,所以这种工作领域的变化将需要更长的时间。
在工作生产力方面,很多人将成为管理者。许多目前作为独立贡献者的员工将不得不学会管理 AI 以完成他们的工作。而管理也是一种技能,不是每个人天生就是好经理。你需要向 AI 解释如何做某种工作。以一家大型网络安全公司 mcast 为例,他们有 200 名用户使用他们的产品。我们与他们的不同团队进行了工作坊交流,向大家解释产品的功能。比如,有人来自市场部门,平时需要将长产品描述写成适合不同行业的邮件,然后再写三条推特和三条 LinkedIn 消息等。我们告诉他们可以直接向 AI 代理人描述这些需求,结果代理人可以为他们完成这些工作,他们感到惊讶,因为原本每两周花费 6 到 20 小时的工作量就这样被自动化了。我认为这种变化将影响几乎所有行业。
中美AI公司差异主持人: Kai-Fu,我可以向你提出很多不同的问题。首先,创新工场的基金规模有多少?
李开复: 我们管理着大约 30 亿美元的资金。
主持人: 你是最活跃的 AI 投资者之一。我有幸多次访问你在中国的公司,感谢你的热情款待。如今你不仅是投资者,还是一名企业家,经营着一家中国公司和一家美国公司。为什么要这样做?
李开复: 因为这一次 AI 发展是真实的,想象一下,这是我大学时的梦想。当时 AI 并不为人所知,但我觉得这是我应该做的事情。之后我们经历了几次“AI 冬天”,那时大家的热情消退,我也不得不做其他工作。大约七八年前,随着深度学习的发展,我意识到 AI 可以创造巨大价值。不过当时我还看不到通用人工智能的可能,所以我只是作为投资人。通过创新工场,我们成功培育了 12 家独角兽 AI 公司。
但这次生成式 AI 的发展速度令人难以置信,如果我仅仅投资,感觉就像是在“后座”上观望,我希望坐在“驾驶座”上亲自参与。我也希望在座的每个人都有同感。我相信,到2030年末只有两类公司,一类是充分利用 AI 的公司,另一类则是已经破产的公司。我深信这一点。
主持人: 你写了多本关于 AI 的书,比如《AI超级智能》。自那本书出版以来,全球 AI 竞赛发生了什么最大的变化?你认为现在是 AI 军备竞赛吗?
李开复: 可以说是,也可以说不是。因为中国的公司主要在中国市场上互相竞争,并不是在国与国之间竞争,而是公司之间的竞争。
主持人: 那么你怎么看中国公司的特点?
李开复: 在我的书《AI超级智能》中,我提到过,美国公司通常更具创新性,能够开创出新的东西,而中国公司在执行和细节上更胜一筹,擅长工程实现、应用开发、用户界面设计等方面。在移动互联网或深度学习领域,几乎所有技术都是美国发明的,但中国利用这些技术创造了巨大价值,甚至可能超过美国。现在在生成式 AI 领域,技术仍然是美国人发明的,而我们正处于一个特殊的时期,技术在美国及其他地区迅速自我革新。因此,现在依然是“发现时代”,美国有可能赢得这一领域的主导地位,但中国公司可以观察到这些创新,进行部分自我创新,并在工程方面表现得更好,交付解决方案。我正在打造的公司“o1”正在做的正是这一点。我们并不声称自己发明了一切,甚至大部分东西,但我们从硅谷巨头 OpenAI 和其他公司中学到了很多。我们专注于更扎实、更快速的执行。例如,我之前提到过,“o1”现在是全球第三大模型公司,在 UC Berkeley 的评估中排名第六。最令人惊讶的是,我们仅用 300 万美元训练了这个模型,而 GPT-4 的训练费用在 8000 万到 1 亿美元之间,GPT-5 传言则需要约 10 亿美元。我们并不否认规模法则的存在,但优秀的工程细节意味着不必花费十亿来训练出一个卓越的模型。
主持人: 这对在场的观众来说非常重要,因为世界上很多地方没有机会接触到 100,000 个 H100 集群。那么问题来了,我能不能在一个 GPU 资源有限的国家建立一个业务或产品?
李开复: 我认为 GPU 资源的限制确实迫使我们创新。作为一家中国公司,我们首先受限于美国的 GPU 供应管制,其次中国公司的估值远低于美国公司。资金少、GPU 获取困难,这让我深信“需求是创新之母”。在只有 2000 个 GPU 的情况下,我们的团队必须找到最优的使用方式,作为 CEO 的我也需要确定优先级。我们不仅要让训练快速进行,还要让推理过程变快。我们通过识别整个流程中的瓶颈,将计算问题转化为内存问题,建立多层缓存和专用的推理引擎,最终将推理成本降到每百万 tokens 仅 10 美分,这仅是可比模型费用的 1/30。
主持人: 那么,这个 10 美分的成本将带来什么影响呢?
李开复: 10 美分的成本意味着可以用更低的价格来构建应用程序。如果你想构建类似 you.com 或 Perplexity 的应用程序,可以选择支付 OpenAI 每百万 tokens 4.4 美元的费用,也可以选择我们的模型,只需 10 美分,使用我们的 API 只需 14 美分。我们的定价非常透明。
主持人: Richard,有一个叫做“蒸汽机悖论”的有趣现象源于工业革命时期。那时很多聪明人致力于提高蒸汽机的效率,以减少煤炭消耗,他们认为蒸汽机更高效后煤炭需求会减少,但实际上却是蒸汽机需求大幅增加。我认为现在我们正处于“智能悖论”之中,我们将把智能用在更多地方,每个人都会拥有自己的助手和医疗团队,这些助手可以完全理解个人需求,而不再受限于智能资源昂贵的问题。
Richard Socher: 我完全同意。我要澄清一下,我并不是说我们在减少固定的工作量,而是说我们在推动一个更大规模的工作负荷。
AI时代建议主持人: 在座的很多人都有子女或亲戚,那么对于 20 岁的年轻人,你们有什么建议?尤其是那些刚刚开始学业和职业生涯的年轻人,在人工智能迅速发展的今天你们有什么忠告?
Prem Akkaraju: 我认为不要浪费时间学习编程,因为未来的“编程语言”可能会是英语。我建议尽快学习所有关于 AI 的知识,找到自己的热情,然后选择一个特定的 AI 领域来帮助实现你的目标。
Richard Socher: 我不同意,我认为仍然应该学习编程。编程是理解技术基础的方式之一,可以让 AI 不再像“魔法”,而变成你可以修改和构建的工具。不过,需要将计算机科学和编程与其他兴趣结合起来,尤其是数学、物理和其他科学的基础知识。
主持人: 我要打断一下,我希望留给李博士最后发言的机会。
李开复: 其实我同时同意也不同意你们的观点。我认为人们应该跟随自己的内心。如果你梦想成为一名优秀的程序员,并且擅长编程,那么就听从 Richard 的建议;但如果只是为了赚钱而学编程,那么可以听从 Prem 的建议。
主持人: 女士们先生们,让我们为这三位出色的 CEO 鼓掌!谢谢你们!
素材来源官方媒体/网络新闻