风靡全球的ChatGPT背后的公司OpenAI近日遭到起诉,该公司被指从互联网上窃取和挪用了大量个人数据和信息来训练AI工具。
当地时间周三,美国一家律师事务所在加州一家联邦法院向OpenAI提起集体诉讼。这份近160页的起诉状称,在未经过个人同意或对数据拥有者进行“补偿”的情况下,互联网上的一切信息它几乎都会拿去使用。该诉讼称,这种大规模的数据抓取模式是“前所未有”的。
要求支付“数据红利”
“通过收集数百万人个人数据,并将其用来开发不稳定的、未经测试的技术,OpenAI将每个人都置于不可估量的风险之中,即使对外宣称,无论采取任何负责任的数据保护和使用措施,这都是不可接受的,”克拉克森律师事务所的一位合伙人蒂莫西佐丹奴周三对媒体表示。
起诉书还声称,OpenAI产品在“在用户不知情的情况下,使用这些窃取来的信息,信息包括了从数亿互联网用户(包括儿童)这里收集来的个人的身份信息。”
这份诉讼要求暂时冻结OpenAI产品的商业化运用,同时要求公司向信息提供人支付“数据红利”,作为经济补偿。
新颖的法律理论
据《华盛顿邮报》报道,该诉讼旨在检验一种新颖的法律理论:OpenAI 在使用数亿互联网用户社交媒体评论、博客文章、维基百科文章和家庭食谱时侵犯了他们的权利。
该诉讼背后的克拉克森律师事务所此前就数据泄露和虚假广告等问题提起过大规模集体诉讼。该事务所管理合伙人瑞安克拉克森表示,该事务所希望代表信息被窃取何盗用的人们来发声,目前已经有了一批原告,事务所正在积极寻找更多的原告。
触及人工智能重大问题
这项起诉讼触及了“生成式人工智能工具”激增所面临的一个重大问题。Chatgpt的技术工作原理是从开放互联网中获取数十亿个单词,并在它们之间建立联系推理。在学习足够多数据后,就能产生能够写诗、进行复杂的对话并通过专业考试的“大型语言模型”。但写下这数十亿字的人从未同意让 OpenAI 使用它们来谋取私利。
不过一些人工智能开发人员认为,对互联网数据的使用应被视为“合理使用”。“合理使用”是版权法中的一个概念如果材料以“变革性”的方式进行更改,则可以被视为合理使用。
OpenAI去年年底公开推出了ChatGPT,该工具因能对用户提示生成令人信服的、人性化的响应而走红。ChatGPT的成功,引发了科技界一场人工智能军备竞赛,大大小小的公司现都竞相开发人工智能工具并将其引入到更多产品中去。