编者按:Meta Connect 2024 大会即将在下周举办,科技巨头 Meta 将带来他们在人工智能、增强现实(AR)、虚拟现实(VR)领域的最新进展。其中,被 CEO 马克扎克伯格用「无可挑剔」形容的全新 AR 眼镜 Orion,也有望在这场大会上迎来首秀。本周,扎克伯格作客 Acquired 播客,进行了一场将近 90 分钟的访谈,除了一些创业故事外,还谈到了对 AI、VR、AR 技术未来的看法。这仿佛是 Meta Connect 大会的「正餐」之前,小扎特意准备的一道「小菜」访谈中,他详细讲述了对于「智能眼镜」和未来平台的构思,以及 Meta 平台接下来的重点。以下为访谈的节选,内容经过编辑:
智能眼镜:终极数字社交体验和终极 AI 化身Q:请告诉我们(智能眼镜)如何诞生的故事扎克伯格:在 Meta,我们构建社交体验有 20 年了,最初它采用的是网站的形式,然后是移动 App。但我从未想过我们是一家「社交媒体公司」,我们是一家「社交联系公司」,我们正在做的是建设人类联系的未来。我认为我们的下一章节的重要主题之一是,构建我认为最理想的体验,而不仅仅只是在别人的平台上打造的体验。我认为你需要的不是一部让你低头看的手机,它会让你的注意力从周围的事物和人身上移开。我认为理想的形式是「眼镜」。眼镜可以看你所看,听你所听,因此可以成为完美的 AI 助手,因为它们知道你正在做什么事情。除此之外,眼镜还能将全息影像投射到世界上,这样你与其他人的社交体验就不会局限于手机屏幕上的那些小互动。
可以想象一下,遥远的未来,我们正在进行这样的对话,但也许我们其中的一个人甚至不在现场,就像全息影像。人们喜欢把一切知识化,但我们很多经验都是非常「身体」的体验。通过全息影像和眼镜,你就能在物理世界中与另一个人一起做事情,这种身体上的临场感不会让你离开正在做的任何事情。我认为这就是终极的数字社交体验,也是人工智能的终极化身。这是一个巨大的项目,我们已经为此努力了 10 年。我们需要为全息显示屏创造新的显示堆栈,再进行小型化,才能放入眼镜中。除此之外,眼镜还需要安装芯片、麦克风、扬声器、相机、眼动追踪等等来了解用户在做什么,电池需要持续一整天。我们已经为此努力了一段时间,我们非常接近能够展示我们所拥有的第一个原型机器,我对此感到非常兴奋。我们开发了很多新技术,但在外形上也需要考虑很多因素,因为眼镜也必须要好看。我们和 Ray-Ban 眼镜的生产商 EssilorLuxottica 合作,一起探索究竟能够把什么样的功能都塞进眼镜里,让它们尽可能有用。
Ray-Ban Meta 智能眼镜当我们实际上开始制作这些眼镜时,我觉得这几乎就是终极 AR 的一个实践项目。Q:所以在你们最初推出这些(Ray-Ban)眼镜时,ChatGPT 机器人和大模型还不是公众的热点,因此这些产品一开始并不是作为 AI 设备制造和推出的?扎克伯格:是的,几年前我预测 AR 全息影像会先于全面的 AI 出现,现在我认为可能会是另一种情况。我记得我打给了智能眼镜的运营负责人,我当时想,我们应该让这个产品做得更好,让 Meta AI 成为它的主要功能。然后我下周就去了他们的小组,他们做出了一个原型,我当时想,这将是一个非常成功的产品。Q:你认为贯穿公司始终,让公司不断获胜的 DNA 是什么?扎克伯格:我认为我们是一家专注于人际关系的科技公司,而不是特定类型的应用程序,所以我们从来没有把自己看作是一个网站或社交网络或类似的东西。对我来说,打造这种眼镜,让人们无论身在何处,都能感受到与另一个人在一起的感觉,是我们今天构建的那种应用程序的自然延续。开放和闭源Q:我想谈谈开源和开源技术对你们的重要性。我很好奇你是否会同意「Meta 一直是现代开源技术最大的受益者」。扎克伯格:我认为目前几乎所有的主要科技公司都主要使用开源堆栈,所以,是的。我的意思是,如果没有开源,我们不可能进行构建。我想,自上世纪 90 年代以来,这对于任何一家新公司都是如此,对我们来说,开源一直都很重要,也很有价值。Q:我的意思是,你们是第一家建立在 LAMP 堆栈上的大公司(LAMP 堆栈:一个开源软件平台,常用于构建动态网站和应用。)扎克伯格:它很棒,使快速开发和快速迭代变得容易。我们和它的关系也很有趣,因为从顺序上看,我们排在 Google 之后,Google 是第一家建立这种分布式计算基础设施的伟大公司,这对我们来说不是有优势,因为 Google 已经有了,所以我们还不如开放它。开放之后,整个社区的人都会围绕它展开工作。我们开放计算,让它成为行业标准,现在其他所有云服务平台基本上都在用开放计算,供应链围绕着我们的设计实现了标准化,这意味着供应量更大,生产成本更低。我们节省了数十亿美元,我们使用的产品的质量也会提高。所以,这就是双赢。我们希望确保我们能够使用领先的 AI 模型,我认为,就像我们想要构建硬件一样,这样我们就能在未来 20 年打造最好的社交体验。我认为,我们已经在其他平台上经历了太多,不可能完全依赖别人,而且我们现在已经是一家足够大的公司,也不必再依赖他人。我们可以建立自己的核心技术平台,不管是 AR 眼镜、混合现实还是人工智能,所以我认为我们必须这样做。但这些东西并不像软件那样是单一的,它们是生态系统,当别人使用它们时,它们也会变得更好,这对我们来说也很有好处。从哲学角度出发,这也符合我们的定位。我们有太多亲身经历,当我们试图在移动平台上构建东西时,平台会禁止我们,这非常让人沮丧。
Meta Llama 3.1 开源模型Q:谁是你们的竞争对手?扎克伯格:我们面临着很多竞争,我们所做的事情有很多方面。我的意思是,我们有社交媒体的竞争对手,有平台的竞争对手。我认为苹果会是我们一个比人们印象中更大的竞争对手。他们也在做很多不同的事情,但我并不清楚。我认为在接下来的 10 年、15 年里,那将是一种意识形态的战斗。下一组平台的架构会是什么?它们是否会成为苹果一直以来的封闭式、集成化的苹果模式?我的意思是,其实有很多种构建事物的好办法。我认为,如果你看一下不同时代的计算机、个人电脑、移动设备,它们都有某种封闭的集成版本和开放版本。iPhone 基本已经赢了,我知道现在市面上有更多的 Android 手机,但 iPhone 就像是智能手机的领导者。我认为存在一种「近因偏差」:可能因为这里几乎每个人都有一台 iPhone,就有一种观点认为这是更好的方式(指封闭)。但我并不认为这是理所当然的。在 PC 时代,开放生态系统的 Windows 是领导者。我在未来 10 年到 15 的目标是,构建下一代的开放平台,并让其获胜。我认为这将会带来一个更加充满活力的科技行业。这不仅仅是一场产品竞争,我认为在某些方面,这就像一场非常深刻的价值观驱动和意识形态竞争,围绕着科技行业的未来应该是什么,以及这些平台应该如何开放。无论是 Llama 大模型人工智能,还是智能眼镜或者其他东西,都应该让开发者,特别是个人,例如我这种在宿舍里起步的人,不需要征得允许就能打造出很棒的东西。关于未来:虚拟现实和 AIQ:你在 Reality Labs(Meta 的虚拟现实部门)上花了一大笔钱,让这么多人和资源去做这个项目,肯定是不合适的,我这里有点开玩笑。不过我很好奇,你为什么要如此特殊对待它?扎克伯格:当你达到我们现在的规模时,你会想,在未来的 10 到 20 年,做什么会是重要的?我们正在讨论如何创造自己的运气,我们可以对事情的发展有一个感性的认识。我敢肯定,眼镜和全息影像将会成为一种无处不在的产品。就像是以前每个人有手机,后面都换成了智能手机。如果我们能让世界上已经拥有眼镜的人,都升级到拥有 AI 的眼镜,那么这将成为世界历史上最成功的产品之一,而且我认为它会走得更远。一些早期的 Oculus(Meta 早期的 VR 头显设备)用户跟我说:「创造好(good)的东西和创造棒(awesome)的东西是不同的。」
好的东西就是好的,是有用的,是人们每天使用的东西,因为它为他们的生活增添了什么。但「awesome」是不同的,awesome 令人振奋和鼓舞人心,只会让你对未来更加乐观。所以我认为到目前为止,我们在社交媒体上所做的东西都非常「好」,超过 30 亿人几乎每天使用他们。而我现在考虑公司下一个阶段,未来 15 年,我希望我们除了好的东西之外,能够建造更多「棒」的东西,我认为它们都很重要。所以我认为,我们正在做的很多 Reality Lab 的工作都属于「棒」这个类别,我们正在做的很多 AI 的工作都将属于这个类别。应用程序中很多东西也会进入这个类别,但我不知道。