文本总结等方面超过 GPT-4，苹果披露 AFM AI 模型细节-人工智能动态-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

文本总结等方面超过 GPT-4，苹果披露 AFM AI 模型细节

来源：互联网发布日期：2024-07-31 09:59:19 浏览：4349次

导读：IT之家 7 月 31 日消息，苹果公司最新发布论文 [PDF]，分享了关于 Apple Intelligence 模型的相关细节，部分性能已经超过 OpenAI 的 GPT-4。模型简介苹果在论文中介绍了 Apple Foundation Model（下文简称 AFM）模型，共有以下两款： AFM-on-device：本地...

IT之家 7 月 31 日消息，苹果公司最新发布论文 [PDF]，分享了关于 Apple Intelligence 模型的相关细节，部分性能已经超过 OpenAI 的 GPT-4。

模型简介

苹果在论文中介绍了 Apple Foundation Model（下文简称 AFM）模型，共有以下两款：

AFM-on-device：本地运行，30 亿参数，可以在 iPhone、iPad 等设备上高效运行；

AFM-server：苹果尚未公布参数等细节。

训练数据来源

苹果表示训练数据集包括从出版商处获得授权的数据、经过策划的公开或开源数据集以及我们的网络爬虫 Applebot 抓取的公开信息组成。

苹果强调注重保护用户隐私，数据混合物中不包括苹果用户的私人数据。

据《纽约时报》报道，苹果公司在 2023 年底与 NBC、Condé Nast 和 IAC 等多家出版商达成了价值至少 5000 万美元的多年期协议，在出版商的新闻档案中训练模型。

苹果的 AFM 模型还在 GitHub 上托管的开源代码上进行了训练，特别是 Swift、Python、C、Objective-C、C++、JavaScript、Java 和 Go 代码。

论文称，为了提高 AFM 模型的数学技能，苹果公司特别在训练集中加入了来自网页、数学论坛、博客、教程和研讨会的数学问题和答案。

苹果利用了高质量、可公开获得的数据集（论文中未提及名称），这些数据集“拥有允许用于训练...... 模型的许可证”，并经过过滤以去除敏感信息。