OpenAI推出强化微调，CEO称是今年最大惊喜之一-人物报道-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

OpenAI推出强化微调，CEO称是今年最大惊喜之一

来源：互联网发布日期：2024-12-07 10:07:03 浏览：339次

导读：当地时间12月6日，OpenAI公布第二日活动主题：推出了强化微调（Reinforcement Fine-Tuning），帮助开发者和机器学习工程师打造针对特定复杂领域任务的专家模型。OpenAI CEO Sam Altman在X发帖称，强化微调的效果非常棒，是他今年最大的惊喜之一，期待看到大家利用这种功能的创造。该项目通过全新的模型定制技术，让开发者可以使用高质量任务集对模型进行微调，并利用参考答案评 ......

OpenAI推出强化微调，CEO称是今年最大惊喜之一

当地时间12月6日，OpenAI公布第二日活动主题：推出了强化微调（Reinforcement Fine-Tuning），帮助开发者和机器学习工程师打造针对特定复杂领域任务的专家模型。OpenAI CEO Sam Altman在X发帖称，强化微调的效果非常棒，是他今年最大的惊喜之一，期待看到大家利用这种功能的创造。

该项目通过全新的模型定制技术，让开发者可以使用高质量任务集对模型进行微调，并利用参考答案评估模型的响应，从而提升模型在特定领域任务中的推理能力和准确性。

OpenAI的研究员称，强化微调并不是只教模型模型输出，它的运作方式是，当模型发现一个问题的时候，研究者给模型空间区仔细思考这个问题，然后评估模型给出的最终解答，运用强化学习，研究者可以强化产生正确答案的思路，抑制产生错误答案的思路，只需要“几十个例子”甚至12个例子，模型就能以有效的新方式学习特定领域的推理。

OpenAI研究员演示，强化微调后的o1 mini测试通过率甚至比正式版o1高24%，比未强化微调的o1 mini提高了82%。

(本文来自第一财经)

相关热词： openai 首席执行官机器学习模型

OpenAI推出强化微调，CEO称是今年最大惊喜之一
来源：互联网发布日期：2024-12-07 10:07:03 浏览：339次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

OpenAI推出强化微调，CEO称是今年最大惊喜之一 来源：互联网 发布日期：2024-12-07 10:07:03 浏览：339次