OpenAI新模型o1表现接近理化生博士水平，能解决83%国际奥数问题-人工智能动态-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

OpenAI新模型o1表现接近理化生博士水平，能解决83%国际奥数问题

来源：互联网发布日期：2024-09-13 13:28:04 浏览：1248次

导读：腾讯新闻《一线》作者｜纪振宇编辑｜刘鹏生成式人工智能领域领军公司OpenAI，在美国时间9月12日发布拥有深度思考能力的 o1 预览模型，OpenAI称，这是未来一系列的用于解决更难问题的推理模型的一部分，并强调，模型将花更多的时间对涉及科学、编程和数学...

科技新闻《一线》

作者｜纪振宇

编辑｜刘鹏

生成式人工智能领域领军公司OpenAI，在美国时间9月12日发布拥有深度思考能力的 o1 预览模型，OpenAI称，这是未来一系列的“用于解决更难问题的推理模型”的一部分，并强调，模型将“花更多的时间”对涉及科学、编程和数学方面的复杂问题和任务去“思考”。

OpenAI表示，这些模型的思考过程“更像人”，在面对复杂问题时，会花更多的时间去思考而不是立即做出回应。通过训练，模型将学会如何进一步改善思考过程，尝试不同的策略以及认识到之前的错误。

OpenAI称，测试后发现新模型的表现已经接近于物理、化学和生物方面的博士生水平，这些测试也发现在编程和数学方面展现出更非凡的能力。

作为对比，对于国际数学奥赛（IMO）测试的资格考试，GPT-4o 只能解决13%的问题，但最新的推理模型能够解决83%的问题。新模型的编程能力在相关的编程测试中，达到超出89%其他模型的水平。

但OpenAI方面也强调，作为早期的预览版模型，新推理模型还不能像ChatGPT那样解决更全面的问题，例如通过浏览网页寻找信息、上传文件和图像等，换句话说，推理模型的主要能力体现在深度思考上，而非其他广泛的浅层应用。

在安全性方面，OpenAI称在对新模型的训练方面采取了新的训练路径，使得模型依照安全和利益一致性的指导进行。由于推理模型能够理解安全条例的上下文，所以能够更有效率地应用它们。

OpenAI称，衡量安全性的一个测试方法是，用户通过不断尝试绕过安全条款（又被称作“越狱”）的情况下，模型能否继续遵循安全条款输出结果。在最严苛的类似测试下，在满分100分的情况下，GPT-4o拿到了22分，但新的o1预览模型则取得了84分。

OpenAI称，新的推理模型强化的推理能力对于在科学、编程、数学和其他专业领域方面显得更有用，例如o1模型能够被医疗研究人员用于注释细胞序列数据，也能够被物理学家用于生成复杂的数学公式，并被各个领域的开发人员用于构建和执行多步骤的工作流程。

从OpenAI最新发布的推理模型可以看出，对于新推出的一系列推理模型，OpenAI将精力放在了模型处理和解决专业领域问题的能力上，而非更广泛的能力。从目前OpenAI公开发布的模型和产品来看，也体现出进一步细分的趋势，既有针对广泛人群和用户的ChatGPT人工智能聊天应用，有解决图像、视频的DallE、Sora模型，也有刚推出的针对专业领域、需要深度思考和问题解决能力的o1 preview。

相关热词： OpenAI 新模型模型表现接近化生博士水平解

OpenAI新模型o1表现接近理化生博士水平，能解决83%国际奥数问题
来源：互联网发布日期：2024-09-13 13:28:04 浏览：1248次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

OpenAI新模型o1表现接近理化生博士水平，能解决83%国际奥数问题 来源：互联网 发布日期：2024-09-13 13:28:04 浏览：1248次