展会信息港展会大全

Facebook强大的AI大型语言模型LLaMa遭泄露
来源:互联网   发布日期:2023-03-08 14:44:41   浏览:3586次  

导读:3月8日 消息:Facebook的大型语言模型LLaMa通常只供获得批准的研究人员、政府官员或民间社会成员使用,现在已经泄露到网上供任何人下载。 据悉,目前在4chan 上已经有人在共享泄露的语言模型。上周,一名成员上传了 Facebook 工具 LLaMa((Large Language Mod...

3月8日 消息:Facebook的大型语言模型LLaMa通常只供获得批准的研究人员、政府官员或民间社会成员使用,现在已经泄露到网上供任何人下载。

据悉,目前在4chan 上已经有人在共享泄露的语言模型。上周,一名成员上传了 Facebook 工具 LLaMa((Large Language Model Meta AI))的 torrent 文件。这标志着一家大型科技公司的专有 AI 模型首次遭公开泄露。

迄今为止,谷歌、微软和 OpenAI 等公司最新模型都处于保密状态,只能通过消费者界面或 API 访问,据称是为了控制滥用情况。4chan 成员声称在他们自己的机器上运行 LLaMa,但此次泄漏的确切内容尚不清楚。

在一份声明中,Meta 也并没有否认 LLaMa 遭泄漏的说法,并强调了其在研究人员之间共享模型的方法。

“Meta 的目标是与研究社区的成员分享最先进的 AI 模型,以帮助我们评估和改进这些模型。LLaMA 是出于研究目的而共享的,这与我们之前共享大型语言模型的方式一致。虽然并非所有人都可以使用该模型,并且有些人试图规避批准程序,但我们相信当前的发布策略允许我们在责任和开放之间取得平衡,”Meta 发言人在一封电子邮件中写道。

据了解,与包括 OpenAI 的 GPT-3在内的其他人工智能模型一样,LLaMa 建立在大量单词或“标记”的基础上。只要在LLaMa 输入单词,就能预测下一个单词,并生成更多文本。

LLaMa 有多个不同大小的版本,其中 LLaMa65B 和 LLaMa33B 在1.4万亿token上进行了训练。该模型主要从维基百科、书籍、以及来自 ArXiv、GitHub、Stack Exchange 和其他网站的学术论文中收集的数据集上训练的。

报道称,Meta 似乎正在在线提交该模型的删除请求以控制其传播。

来源:站长之家


赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港