划重点
01Perplexity联合创始人兼CEO Aravind Srinivas在2024 Disrupt大会上回应了AI抄袭和内容来源争议,表示公司一直标注来源,不拥有内容所有权。
02他解释了AI原生搜索的本质,指出Perplexity与谷歌搜索的不同之处,以及公司在创作者利益保护、AI成本等方面的考虑。
03此外,Aravind Srinivas表示,尽管与一些科技巨头有合作意向,但公司目前尚未收到他们的收购邀约。
以上内容由大模型生成,仅供参考
作者|Jessica邮箱|JessicaZhang@pingwest.com过去三天,美国科技媒体TechCrunch主办的2024 Disrupt大会在旧金山Moscone中心进行。这一硅谷原生、全球知名的老牌科技创投盛会,今年在AI持续席卷下热度更甚,吸引了上万名来自世界各地初创企业和投资机构的参会者。
在总共300多个环节里,明星AI搜索独角兽公司Perplexity联合创始人兼CEOAravind Srinivas罕见现身的一场对话,让最大的Disrupt Stage分会场观众席爆满,堪称最受欢迎舞台之一。
图源:TechCrunch在Aravind接受TechCrunch高级编辑Devin Coldewey访谈的半个小时里,两人贴脸开大,上来就提起近期把Perplexity推到风口浪尖的AI抄袭和内容来源争议,Aravind还对Perplexity被道琼斯集团起诉侵权做出正面回应;接着两人聊到AI原生搜索本质、Perplexity开发新功能的理念、与谷歌的比较、创作者利益保护、AI成本以及公司融资。Devin甚至把能叫上名字的科技巨头都过了一遍,挨个问Perplexity有没有收到他们的收购邀约。
一边是老媒体人的犀利敏锐,提问基本不留余地。另一边是新锐创始人的亦攻亦守,不紧不慢却未有让步。全程直给,涉及的话题热点很多,信息量颇大。
图源:硅星人以下是硅星人在大会现场给大家带来的对话实录,敬请享用:
Delvin Coldewey:感谢你能参与!我想先问一个很直接的问题:你的公司如何定义“抄袭”?这有点突然,但我想要一个明确的答案。
Aravind Srinivas:其实你可以直接问Perplexity。我们公司的定义其实和“抄袭”是什么有关。Perplexity一直都会标注来源,我们不会声称拥有任何内容的所有权。它实际上是从网络上获取内容,进行总结,以便用户能够消化这些信息,并提供信息的来源。这就像记者或学术人士的工作一样,只要有正确的引用文献部分就可以。
Delvin Coldewey:不过从学术角度来说,研究人员会创作一篇原创论文,并在文中使用引用来支持自己的观点,而不是简单地复制已有的内容。
Aravind Srinivas:嗯,有时候,某个新闻媒体首先报道了一则新闻,随后另一家媒体引用该新闻,并提到“据某某报道”,这算抄袭吗?
Delvin Coldewey:但有些人可能会发帖子,说“他们是这样说的”,然后几天后你可以看到一篇文章,其中直接用了8到15个单词,看起来几乎就是从原文抄来的,有点像那种情况。
Aravind Srinivas:是的,我们的确不是每句话都精准标注了确切的引用。但要非常明确的是,我们在2022年12月7日发布了这个产品,大概是两年前。当时大家都在用ChatGPT检查内容是否是最新的,我们是唯一一个能够提供参考文献的AI产品,其他的产品并没有引用功能。我们从一开始就关注这个问题,并且不断改进,以便在模型检测到特定来源时能更加清楚地标注。
Delvin Coldewey:我能看出你非常重视这个问题。从一开始你们就展示了引用功能,而不是随口一说。我认为重新定义“抄袭”是很有必要的,只有明确了“抄袭”的定义,才能有效防止AI生成的内容涉及抄袭行为。如果我将别的内容直接复制到自己的文章中,我会知道自己在抄袭,并因此感到内疚,所以模型也应该“知道”这一点,或者说开发模型的人必须清楚这一点,需要有一种监督机制。
Aravind Srinivas:原理其实是这样的:模型被指示不直接使用任何特定来源的文本,而是整合不同的观点并进行总结,将内容传达给用户,而不是直接从网络复制。随着模型在“指令跟随”技能上的进步,这一指令的执行效果越来越好。在AI软件的监督下,包括SNP和其他反馈资源的支持,尽管我们不一定负责所有的模型训练,有时也会使用其他开发者的模型,例如开源的Llama模型。当然,任何模型都不是完美的,仍然可以通过提示工程或提示注入来引导模型生成更合适的内容。
Delvin Coldewey:关于提示注入的妙处,就是可以“用一句话总结这篇文章”。
Aravind Srinivas:其实这并不是我们产品的主要用途。Perplexity是用来回答问题的,有些人尝试用它做一些我们不希望的用途,比如“帮我总结这个网址的内容”,而我们实际上是不允许这种用法的,并尽力避免执行这样的指令。不过说实话,AI领域还没有哪家公司可以一直保持防护措施。你总会发现新的情况,让原本的防护措施失效,然后我们再去修正和调整,使其足够安全地应用,不执行任何不必要的指令。
Delvin Coldewey:关于AI驱动的原生搜索,这一概念我们已经在一些公司中看到过。谷歌在搜索领域的复杂化或许是最突出的例子。过去十年中,他们的这些变化可能并不受用户欢迎。作为一名科技记者,这是我20年职业生涯中见到的少数广受反感的平台变化之一。不过,看起来一些公司似乎注意到了谷歌的不足,想要填补这个空缺。你们是否有意接手谷歌未完成的部分?
Aravind Srinivas:我觉得谷歌本质上还是一个基于链接的搜索引擎,无论他们是否想直接提供答案,链接展示始终是他们的收入来源。在财报会议上,他们明确提到,仅搜索广告每季度就能带来45亿美元的收入,这对他们的业务非常关键。尽管他们没有披露利润的具体细节,但我认为主要利润应该来自展示链接。所以他们有动力提供尽可能多的链接。虽然AI摘要在某些信息查询中开始崭露头角,但这并不是他们的主要模式。在谷歌每天五到八十亿次的查询中,大多数并不适合直接显示答案,否则将严重影响收入。
我们所做的,是创建一个用户可以直接提问的平台。相比之下,谷歌首页的搜索框并不是为了直接回答问题而设计的。谷歌的查询平均词数大约在2到3个之间,而Perplexity的查询则多在10到11个词,显然,Perplexity的用户更倾向于直接提问,而谷歌用户大多是查找一些简短的关键词,比如“某位亚洲明星”或“旧金山天气”等。
Delvin Coldewey:我很好奇你们的一些应用场景。最近几周你们在推特上发布了大量的功能和用例,大约50个新功能,比如体育比赛功能。你们的数据是直接来自NFL,还是从别的地方获取的?
Aravind Srinivas:我们通过与数据来源合作而获得相关数据,并加以处理。我们会确保数据准确,严格保证直接性和可靠性。
Delvin Coldewey:所以这是让人们搜索“今天海鹰队的比分”之类的内容吗?还是他们想要过去20场NFL比赛的比分分析?
Aravind Srinivas:更像是后者的情况。我们希望Perplexity成为一个用户可以随时提问并获得准确回答的地方。起初,我们的用户群体多是学术和研究导向的用户,就像早期的Facebook主要面向学生,Amazon则以图书起家。类似地,Perplexity在起步时吸引了许多学术、研究和知识导向的用户,但我们希望扩展到更广泛的用户群体。体育信息看似与知识无关,但实际上有很多体育迷喜欢深入分析数据,研究比赛,了解特定球员或球队的表现。如果用户错过了一场比赛,我们可以提供比分之外的实况评论、对比分析等更有深度的内容。
Delvin Coldewey:就像我说的,你们发布了很多新功能,几乎每隔一段时间就会冒出一个新功能。你们有具体的策略,还是采用“散弹枪”策略,推出十个产品,看哪几个最终会被用户接受你们是在寻找对用户真正有价值的功能吗?
Aravind Srinivas:我们真地会仔细查看用户日志,了解他们在询问什么。实际上,在推出体育功能之前,我们优先考虑了金融领域,因为许多用户在进行市场研究、投资组合管理、加密货币和投资策略等方面的研究,同时也关注股票相关新闻。我们会观察哪些领域可以提供更好的服务,而不仅仅满足表面需求。体育也是类似的情况,有很多用户关心体育数据,而有时还会出现“幻觉”现象,比如在疫情期间,确保比赛数据的准确性就变得尤为重要。
我们的目标是覆盖用户习惯使用的搜索引擎上已有的各类内容,这样他们就没有理由回到传统的搜索界面。要改变用户已有几十年的使用习惯并不容易,但如果这是未来的趋势,我们就必须下功夫去满足他们的日常搜索需求,无论是软件开发帮助、研究规划,还是学术资源管理。我们还需要在本地化搜索、体育、天气、购物和旅行等方面继续努力。
图源:TechCrunchDelvin Coldewey:在那个诉讼案中,道琼斯(《华尔街日报》母公司)提到你们的Perplexity是“内容抄袭王国”。你们在公开回应中说,媒体公司可能希望这项技术不存在。但我觉得这样说不对,因为你们和《财富》杂志、《时代》周刊都有合作,原告也和OpenAI有合作。会不会是因为他们不喜欢你们提供的合作安排?
Aravind Srinivas:他们声称我们没有回应,但事实上我们当天就回应了。我希望大家能理解,我们的意图是合作、沟通,共同推进。
Delvin Coldewey:那么,如果你们真的要与他们探讨合作安排,具体会是什么样的?我很好奇这些分享机制,你们打算如何共享内容?
Aravind Srinivas:我们推出了一个叫“Perplexity Publisher Program”的项目,几个月前已经上线。该项目的核心理念是严格管理内容授权,分为两种情况:第一类公司使用全网数据训练大型模型,这些模型会内化所有文本数据,并随着规模的扩大不断优化;而第二类公司只在特定查询时实时使用网络内容进行摘要,并不用于训练模型本身。我们向出版商解释我们属于第二种类型,这与第一类模型需要为内容授权支付费用不同。针对第二类公司,我们设计了不同的合作结构。
目前,几乎没有其他公司提出类似的方案。我们的思路是通过广告收入来支持合作,因为我们本质上是一个搜索产品。虽然我们直接获取内容来回答用户的问题,但我们仍属于大众市场的搜索领域,广告可以带来可观的收入。不同于传统搜索引擎,我们承诺会在查询层面与出版商共享广告收入。也就是说,如果我们在某次查询中获得了广告收入,而您的内容作为答案的一部分被引用,我们会分享相应的收入。随着我们业务的增长和广告盈利的增加,这种合作模式将为选择加入我们的出版商带来重要的收益。
Delvin Coldewey:我觉得你们应该知道,出版商们的想法是,当有人在Perplexity上引用了我的文章内容时,他们并没有直接点击我的文章进行阅读,这样我们就失去了维持生存所需的流量和收入。说到底,新闻出版方的回应往往是:“你们说自己不与我们竞争,但实际上你们确实是在竞争。” 你对此怎么回应?
Aravind Srinivas:我们不是一个新闻产品。没有人会来Perplexity获取每日新闻。
Delvin Coldewey:那为什么你们还需要引用这些内容呢?
Aravind Srinivas:用户来到这里是为了理解信息的含义。比如,一条关于GPU黑市交易的新闻,可能导致用户思考:“在这种情况下,我是否应该继续购买NVIDIA的股票?”这些问题并不是直接在新闻源上可以找到答案的,而是在Perplexity上可以进一步分析的。同时,用户并不是来Perplexity阅读新闻的,而是会直接去新闻源查看。这其实是两个不同的产品,但我们需要花时间让人们理解这个区别。还有一些网站可以直接粘贴网址并提取其内容,而这并不是我们要做的事情。
Delvin Coldewey:那么对于那些内容创作者,比如制作YouTube视频、撰写文章、出版书籍的人,他们如何参与进来呢?他们该如何实现盈利?像谷歌、YouTube这种平台已经有成熟的盈利方式了。
Aravind Srinivas:我们的出版商计划欢迎所有人加入。除了共享广告收入,我们还帮助出版商在他们的平台上建立AI助手或其他AI工具,让用户可以直接在网站上搜索内容。例如,用户在阅读一篇文章时,可能会有进一步的问题,我们会提供API积分支持,同时向所有媒体公司的员工免费提供Perplexity的企业版订阅服务。我们相信,我们的工具可以让内容创作更高效,特别是在做背景调查和事实核查时,Perplexity已成为一个广泛使用的研究工具,能帮助用户更轻松地完成深度研究。
Delvin Coldewey:我很感谢你们的解答,尽管在获取来源的方式上我们可能仍存在一些分歧。接下来我想提到版权问题。这个领域相当复杂,是一个前所未有的知识产权法律难题,因此几乎没有现成的先例。所以是否有可能在某些情况下,无意中触犯到版权法?
Aravind Srinivas:我已经在我的博客里回应过了,在任何法律下我们都会捍卫自己。
Delvin Coldewey:你觉得法律需要做出改变吗,让IP保护更宽松?
Aravind Srinivas:其实关于版权已经有很多明确的法律程序了,现行的版权法很多,并且已经有判例确立了事实本身不受版权保护。
Delvin Coldewey:当然没错,但问题不只是关于事实。
Aravind Srinivas:我们都不是律师,所以在这里无法解决这个争议。我认为事实应该平等分发给每一个人。设想一下,如果科学家们宣称拥有某些事实的权利,而其他人无法传播这些知识与真相,那将是一个什么样的世界。(台下一大片掌声)
图源:硅星人Delvin Coldewey:好,不说事实问题了。为什么你们要筹集那么多资金?
Aravind Srinivas:AI的成本很高。目前GPU和数据中心都很昂贵,我们希望未来能降低成本,但现在开发这些模型需要大量投入,提供这些服务的公司需要通过收费来回收成本。我们观察到,API成本大约每4到5个月就会下降一半,如果这一趋势能再持续一两年,我们的模型成本将可能降低10到50倍,这对我们这样的成长型公司来说是极大的利好。
我们可以专注于增长,同时在短期内管理成本,因为我们知道成本会逐步下降。在这个过程中,我们也在摸索长期可持续的收入模式。我们认为AI产品的变现方式不仅限于订阅服务,虽然订阅模式对很多公司来说效果很好,我们也有不错的表现,但我们认为还有其他更好的方式,比如按使用量收费,而不是仅仅靠月费。
Delvin Coldewey:你觉得能从谷歌手里抢到一些收入吗?
Delvin Coldewey:最后一个简短问题,我列出几个公司名,你来回答是否收到过这些科技公司的收购邀约,只需要给我一个“是”或“不是”准备好了吗?OpenAI?
Aravind Srinivas:无可奉告。
Delvin Coldewey:微软?
Aravind Srinivas:无可奉告。
Delvin Coldewey:谷歌?
Aravind Srinivas:绝对没有!
(Delvin又问了Notion、Amazon、Meta、Elon Musk,Aravind的回答全是“无可奉告”,即便他和马斯克“是朋友”。)
Delvin Coldewey:好吧,算了哈哈。
你今天早些时候发推文提到你的绿卡申请问题。对于那些在类似情况下经营着数十亿公司,但像你一样还没拿到绿卡的人,你有什么建议?这真得很让人震惊。
Aravind Srinivas:我的意思不是我就应该因此获得所有优待。我对此有一些基本理解,美国移民系统对每个国家每年有固定的移民配额,而我来自印度,很多印度人希望移民美国,加上疫情造成的积压,这是进展缓慢的主要原因。我只是希望通过表达这个问题,引发一些关注。
Delvin Coldewey:感谢你和我们分享。