因为工业革命迟迟没有改变我所成长的地方,我一直有些遗憾。所以我想找到一个可能超越工业革命的东西,让全世界的人都享受到工业革命曾给西方带来的福祉。
在2016年,我提到了3件让我兴奋的事情:混合现实、量子和人工智能。现在我对这3件事还是一样兴奋。
《连线》在采访时为微软CEO萨提亚纳德拉拍摄特写照片。
微软在生成式人工智能(AI)浪潮中风头正劲。作为微软AI战略的掌舵人,微软CEO萨提亚纳德拉(Satya Nadella)近日接受了美国科技媒体《连线》资深记者、专栏作家斯蒂文利维(Steven Levy)的专访,他说:“我的梦想是地球上80亿人每人都能拥有一个AI老师、一个AI医生、一个AI程序员,或者一个AI顾问。”
纳德拉出生于印度,1992年进入微软。自从2014年成为微软CEO以来,他带领该公司进行了一系列变革和创新,包括开源软件、收购知名公司、加强云计算服务等,使微软的市值达到了2万亿美元。他的深思熟虑和谦逊品质与前任比尔盖茨(Bill Gates)和史蒂夫鲍尔默(Steve Ballmer)形成了鲜明对比。
尽管如此,微软似乎从未完全重现上世纪90年代的辉煌,直到最近。当初创公司OpenAI开始开发生成式AI产品时,纳德拉很快意识到与该公司及其CEO山姆奥特曼(Sam Altman)的合作将使微软处于新的AI热潮中心。他带领微软与OpenAI建立了紧密的合作关系,尽管这种合作在最近被曝出存在一些矛盾。但不管怎样,微软推出了一些令人瞩目的生成式AI产品。纳德拉对AI技术进行迅速而广泛的应用,展现出了一种大胆态度,让人回想起微软早期的活力。现在,所有人都想知道他对这个世纪最重要的科技话题人工智能有什么见解。
以下为6月13日发表于《连线》的斯蒂文利维对纳德拉的专访实录,由澎湃科技(www.thepaper.cn)翻译,有删减:
为什么与OpenAI合作
斯蒂文利维(《连线》资深记者、专栏作家):你什么时候意识到人工智能的这个阶段会如此具有变革性?
萨提亚纳德拉(微软CEO):当我们从GPT-2.5过渡到GPT-3的时候。研究人员发现了一些新的功能,GPT-3开始展现出缩放效应(scaling effects)。研究人员没有专门训练它编程,但它却非常擅长编程。从那时起我就被折服了。我想,“哇,这真的很厉害。”
利维:是否有一瞬间,让你想全盘押注AI领域?
纳德拉:正是这种写代码能力促使我们创建了Copilot(副驾驶)。但是在2022年夏天,我第一次见到了现在被称为GPT-4的产品,那让我大开眼界。我可以举个例子作为参考:目前,机器翻译已经发展得很成熟,也有了很多优秀的成果,但它还不能把握诗歌中深层意义的细微差别。当我在印度海得拉巴长大时,我一直想读波斯诗歌特别是鲁米(Rumi)的作品,它总是先被翻译成乌尔都语,再被翻译成英语。而GPT-4不需要这么复杂,它可以直接将其翻译成英语。它不只是机器翻译,而是能够跨越两种语言边界且保留诗歌的本质。这真的很酷。
利维:几十年来,微软一直在AI方面进行投资你们没有自己的大语言模型吗?为什么需要OpenAI?
纳德拉:我们也有自己的一系列努力,包括一个名为“图灵”的语言模型,它嵌入在必应里,并在Azure(微软的云服务平台)和其他平台上提供。但我认为OpenAI和我们有着相同的愿景。所以我不想试着训练5个不同的基础模型,而是想要一个基础,让这个基础成为平台效应的支撑。所以我们合作了,他们选择了我们,我们选择了他们。他们负责基础模型,我们在他们的基础上做扩展工作,包括负责任的AI和AI安全工具。归根结底,我们是两家深度合作的独立公司,我们选择有条不紊地去做,而不是多个团队胡乱做事。我们拥有相同的目标,并提出,“让我们去实现这个目标,创造一件真正能吸引世界注意力的东西。”
利维:你是否尝试收购OpenAI?
纳德拉:我在微软的成长经历中,经常以各种有意思的方式与合作伙伴打交道。以前,我们和SAP(德国企业应用软件的市场领导者)密切合作,开发了SQL Server(微软的关系型数据库及数据管理与分析平台)。所以这种事情我并不感到奇怪。不过,OpenAI有一个特别的结构它是非营利的。
利维:这似乎是一个无法解决的问题,但你们和OpenAI竟然想到了一个复杂的解决方法。
纳德拉:他们创建了一个营利性实体,我们说,“我们可以接受。”我们有一个很好的商业合作关系。我们有一个长期稳定的协议。
利维:显然,这样的安排下,不仅OpenAI能够从你们的交易中获利,微软自己也能够获利。但你们的合作有一个利润上限,当你们达到了这个上限,就像灰姑娘的马车变成南瓜一样OpenAI就变成一个纯粹的非营利组织。到那时合作关系如何发展?OpenAI能否说,“我们完全是非营利性的,我们不想参与商业运营。”
纳德拉:我认为他们的博客已经解释了这一点。不过本质上,他们的长远目标是我们能实现超级智能。如果真的发生了,我想一切都会变得无法预测,是吧?
梦想80亿地球人拥有自己的AI老师、医生和顾问
利维:OpenAI CEO山姆奥特曼相信AGI(通用人工智能)超级智能的水平会成为现实,你是否同意他的观点?
纳德拉:我更在乎的是AGI(通用人工智能)能给我们带来什么好处。因为工业革命迟迟没有改变我所成长的地方,我一直有些遗憾。所以我想找到一个可能超越工业革命的东西,让全世界的人都享受到工业革命曾给西方带来的福祉。所以我不害怕AGI(通用人工智能)出现,或者出现得太快。这不是很棒吗?这意味着全球80亿人都能过上富裕的生活。这将是一个美好的世界。
利维:实现这一愿景的路线图是什么?你们现在把AI嵌入到了你们的搜索引擎、数据库、开发者工具中。可是那些需要帮助的人并不用这些东西。
纳德拉:这是个很好的问题。我们可以从开发者的前沿领域开始,我非常期待的一件事是开发会变得有意思起来。微软起初是一家以工具为主的公司,特别是开发者工具。但是随着时间的推移,软件开发的复杂性让开发者失去了原来的专注力和流畅度。而现在,我们用AI程序员Copilot它可以帮助编写一些平凡的代码,让程序员能够专注于更有难度的问题。现在,在GitHub上的1亿开发者可以享受编程的乐趣。随着AI改造了编程的方式,它可以扩大10倍1亿可以成为10亿。当你给一个大语言模型提供提示时,你就在对它进行编程。
利维:任何拥有智能手机并会说话的人都可以成为开发人员吗?
纳德拉:当然。你不用写方程式或者掌握语法或者代数。如果你认为输入提示就等于开发,那么学习起来会更容易。你甚至可以问,“开发是什么?”它将变得普及。
关于如何让这个技术服务全球80亿人。比如,我今年1月去了印度,看到了一个非常厉害的展示。印度政府有一个名为数字公共产品的计划,其中之一是文本转语音系统。在展示中,一个乡村农民用这个系统查询他在新闻上看到的一个补贴计划。系统向他介绍了这个计划和他可以填写的申请表单。一般情况下,系统会告诉他去哪里领取表单。但是有一个印度开发者用所有印度政府文件训练了GPT,所以系统自动帮他完成了表单,并且用另外一种语言。几个月前在美国西海岸诞生的东西,现在已经传播到了印度的一个开发者手中,他接着写了一个模块,让一个印度乡村农民可以通过手机上的WhatsApp(通讯软件)使用这项技术。我的梦想是地球上80亿人每人都能拥有一个AI老师、一个AI医生、一个AI程序员,或者一个AI顾问。
利维:这是一个美好的梦想。但生成式AI是一种新兴的技术,同时还有点神秘。我们并不清楚它内部是如何工作的。现在还存在一些偏见,有些人认为现在广泛使用还为时过早。例如,谷歌已经拥有了生成式AI技术多年,但出于谨慎,它一直进展缓慢。而你却把它应用到了必应上,并挑战谷歌也这么做,不管它有什么顾虑。你曾经说过一段话:“我希望人们知道,我们让谷歌随着我们的节奏跳舞。”而谷歌果然随着微软的节奏跳舞了,它改变了自己的战略,带着生成式AI搜索产品Bard进入了市常我不想说这是冒险,但是也可以理解为,由于你大胆地提前将AI嵌入必应,引发了一个由大大小小的竞争者不顾他们的技术是否成熟都要加入的恐慌循环。
纳德拉:在某种程度上,我们行业的魅力在于,它不在乎谁有能力,而在乎谁能把那种能力付诸实践,并把它变成有价值的产品。如果你想辩论这个问题,可以回顾施乐帕克研究中心(Xerox PARC)或者微软研究院,说他们开发的一切都应该被搁浅。问题是,谁能做出一些有益的东西,真正推动世界进步?这就是我认为我们应该做的。谁会料到搜索引擎还能再次变得有意思?谷歌在这方面已经做得非常好了,它以优秀的产品和分销占据了这个行业的主导地位。谷歌搜索是安卓的默认搜索引擎,是iOS的默认搜索引擎,是许多流行的浏览器的默认搜索引擎,等等。所以我说,“让我们去创新,改变搜索模式,让谷歌的10个蓝色链接显得像AltaVista!”
利维:你是说那个90年代的搜索引擎(AltaVista),它在谷歌的创新把它甩在后面的时候马上落伍了。这比喻太残忍了。
(编者注:AltaVista是全球最知名的网络搜索引擎公司之一,同时提供搜索引擎后台技术支持等相关产品,2003年被雅虎收购,2013年7月8日被雅虎关闭。)
纳德拉:事实上,在我用了必应聊天(Bing Chat)之后,就不想用别的了,就连以前的必应也不想用了。这完全没有道理。所以我很开心现在有了Bard和必应。让它们展开激烈的竞争,从而让人们体验创新的魅力。
利维:我想你一定很高兴终于推出了一项让人们关注到必应的搜索方面的创新。我还记得你在2009年经营必应时是多么沮丧,那时候看起来似乎你在追逐一个无法打败的竞争者。现在,有了人工智能,我们是否正处于转折点,行业位置被重新洗牌,原本稳占优势的赢家会变得不堪一击?
纳德拉:没错。从某个角度来看,每一次改变都让我们更接近万尼瓦尔布什(Vannevar Bush)的文章里描述的愿景(指1945年发表在《大西洋》月刊上的文章《我们可能会怎样思考》,最早展现了一个由计算机支配的信息天堂的图景),这就是我们的梦想。问题是,如何真正实现这种从布什到约瑟夫利克莱德(J. C. R. Licklider,1960年构想了“人类和计算机的共生”),再到道格恩格尔巴特(Doug Engelbart,发明了鼠标和视窗)和阿尔托(Alto,施乐帕克研究中心的图形界面个人电脑),再到个人电脑、互联网的一系列转折点的成功。这都是关于“能不能有一个更自然的界面,让我们作为人类能够提升我们的认知能力,做更多的事情?”所以这就是一个例子。Copilot是一个比喻,因为它是一个以人类为中心的设计选择。所以不要把我们的产品当成自动驾驶它是副驾驶。很多人都在说,“天啊,AI来了!”或者“你知道吗?AI已经无孔不入了。”其实,所有的行为定向(Behavior Targeting)都运用了很多生成式AI。它是一个内部结构未知的黑箱,你我只是被瞄准的对象而已。
依然看好混合现实
利维:在我看来,未来将是“副驾驶”和“自动驾驶”之间的拉锯战。
纳德拉:问题在于,人类如何驾驭这些强大的能力?一种途径是让模型本身符合我们所重视的核心人类价值观。这些不是技术层面的问题,而更多是社会文化方面的考虑。另一方面是根据具体情境进行设计决策和产品制造。这就要求确保这些模型应用的情境与安全性相协调。
利维:你对那些说“我们应该先停止继续研发人工智能6个月”的声音有耐心吗?
纳德拉:我非常尊重并且愿意花时间听任何人说“让我们认真思考所有关于对齐的困难挑战,并且确保我们不会出现失控的人工智能。”如果AI技术突飞猛进,我们最好掌控一切。回想一下蒸汽机首次部署和工厂创建的时间,如果我们同时考虑到童工和工厂污染的问题,我们是否能避免几百年的可怕历史? 因此,每当我们对一项新技术感到兴奋时,想想它可能带来的意想不到的后果是一件有益的事。不过,在现阶段,我不会只是说停止,我会说我们应该加紧做好创建这些对齐的工作。我第一天见到GPT-4的时候,我们没有马上用它启动Sydney(必应聊天机器人的内部代号),因为我们需要做很多工作来搭建一个安全保护装置。但是我们也明白,我们不能在实验室里完成所有的对齐工作。要让一个人工智能模型与世界对齐,你必须在真实世界中而不是在某个虚拟世界中让它对齐。
利维:所以你知道Sydney称爱上《纽约时报》记者凯文罗斯(Kevin Roose)这件事吗?
纳德拉:我们没想到有人会在发布后100小时内对Sydney进行荣格八维(人格测试)分析。
利维:你是否认为人工智能有可能毁灭人类?
纳德拉:如果出现完全失控的情况,那就是个问题,我们不应该允许它发生。我们有能力应对强大的技术。其实,电力也带来了一些意外的影响,我们保障了电网的安全,建立了规范,采取了防护措施。同样,对于核能,我们也解决了核扩散的危险。在这两个例子中,我们可以学习到如何处理强大的技术。
利维:目前,大语言模型的一个大问题是,它会产生幻觉,就像Sydney和其他语言模型那样,它们只是随意创造事情。这个问题有办法有效地解决吗?
纳德拉:其实有一些很实用的方法可以降低幻觉的发生。而且技术也在不断提高。肯定会有办法的。不过有时候幻觉也是“创意”的表现。人类应该可以选择他们想要用哪种模式。
利维:那将是一种改进,因为现在我们没有选择权。不过我想问一下另外一种技术。之前你对元宇宙赞不绝口。在2021年,你说混合现实是一个巨大的突破。但现在我们只谈论AI。这种热潮是否让元宇宙逐渐销声匿迹?
纳德拉:我依然相信(虚拟)存在的价值。在2016年,我提到了3件让我兴奋的事情:混合现实、量子和AI。现在我对这3件事还是一样兴奋。今天我们谈论人工智能,但我认为存在是最终的杀手级应用。然后,当然,量子加速了一切。
利维:现在,AI不仅仅是一个讨论话题。你已将微软置于这项变革性技术的中心。你是如何管理的?
纳德拉:我经常用一个类比来说明,当我们从蒸汽机换成电力时,你需要给工厂重新接线。你不能只是把电机放在蒸汽机原来的地方,其他的都不动。这就是斯坦利汽车公司和福特汽车公司之间的差别,福特能够改变整个工作流程。所以在微软内部,软件的制作方式在变化。这是微软内部基本工作流程的一个巨大改变,也是我们宣传我们成果的方式以及它如何改变每个学校、每个组织、每个家庭。
利维:该工具(AI Copilot)如何改变了你的工作?
利维:微软在你任期内表现良好,但你觉得你会因为AI的转型而被人记住吗?
纳德拉:由像你这样的人或其他人说出我将因什么而被记祝但是我对此很兴奋。微软已经有48年历史了。我不知道有多少这么老的公司还能保持与世界息息相关,不是因为他们在80年代、90年代或2000年代做了什么,而是因为他们在过去几年里做了什么。只要我们做到了这一点,我们就有生存的权利。而当我们没有做到时,我们就不应该被视为伟大的公司。