展会信息港展会大全

OpenAI发布o1模型:错误率减少34%,速度提升50%,月付200美元Pro会员无限制调用 | 最前线
来源:互联网   发布日期:2024-12-06 12:51:26   浏览:246次  

导读:文 | 田哲编辑 | 苏建勋12月6日凌晨2点,OpenAI开启了12天工作日的首场直播。此次直播,OpenAI推出了o1模型,以及新的订阅服务ChatGPT Pro。自今天起,o1模型将取代o1-preview模型,ChatGPT Plus和Pro订阅用户均可使用。今年9月,OpenAI正式推出o1大模型,可针对科学、代码和数学等领域的复杂问题解答,不过,彼时仅推出o1-preview、o1 mini两个版本,未解锁o1模型的全部能力。 ......

文 | 田哲

编辑 | 苏建勋

12月6日凌晨2点,OpenAI开启了12天工作日的首场直播。此次直播,OpenAI推出了o1模型,以及新的订阅服务ChatGPT Pro。自今天起,o1模型将取代o1-preview模型,ChatGPT Plus和Pro订阅用户均可使用。

今年9月,OpenAI正式推出o1大模型,可针对科学、代码和数学等领域的复杂问题解答,不过,彼时仅推出o1-preview、o1 mini两个版本,未解锁o1模型的全部能力。而此次发布会推出的o1模型,在智能化、多模态输入、思考速度等方面均有所提高。

OpenAI联合创始人、首席执行官Sam Altman表示,相对o1-preview,o1模型的重大错误率相比o1-preview减少了约 34%,而思考速度提升了约 50%。

他介绍,o1之所以与众不同,是其每次在回答之前都会思考,这使得它能够提供比其他模型更详细、更正确的答案。

o1的智能化体现在数学等复杂问题具备更高的准确率。据悉,o1模型在解答AIME 2024数学竞赛、博士级科学问题的准确率分别达到78.3%、75.6%,比o1-Preview的准确率分别高出28.3%,1.5%。

回答速度方面,o1也有所提升。在离线测试情况下,o1的平均响应速度比 O1 预览版快了约 60%。OpenAI员工在直播中提出一个问题,分别要求o1、o1-Preview列举公元2世纪的罗马皇帝,并简述他们的生平。结果显示,o1只花了约14秒解答,而o1-Preview耗费33秒。

OpenAI还注意到模型之前对所有问题都有较长的相应时间,他们已经修复这一问题。现在,如果你提出一个简单的问题,o1会快速作答;如果提出了一个复杂的问题,它会花更长的时间思考。

此外,o1新增多模态输入能力,能同时处理图片和文本内容,并进行推理。

OpenAI展示了一张手绘草图的A4纸,画有太阳、冷却系统等物体,以及不同数值,拍照上传给o1。o1在没有任何提示的情况下,生成用户可能想问的问题,并自动解答。接着在不到10秒的时间,o1不仅成功理解了草图的问题要求,还意识到没有提供的参数,自我推理给出了正确答案。

考虑到用户希望不受调用限制使用模型的需求,OpenAI此次推出了新的订阅机制ChatGPT Pro,用户每月付费200美元即可无限制使用更强的o1模型o1 Pro。

OpenAI展示了o1-Prevew、o1、o1 Pro在数学竞赛、代码竞赛、博士级科学问题的回答差异,在每个问题询问四次后,o1 Pro的可靠准确率最高,分别为80.0%、74.9%、74.2%。

OpenAI发布o1模型:错误率减少34%,速度提升50%,月付200美元Pro会员无限制调用 | 最前线

来源:OpenAI

在直播中,OpenAI提出了一个o1-Preview回答错误的化学问题,要求o1 Pro找到符合特定标准的蛋白质。结果显示,o1 Pro仅耗费53秒完成答题,并允许用户查看思考过程。

OpenAI表示,他们计划让o1 Pro支持更多高计算密集型任务,允许处理更长和更复杂的任务。此外,o1 Pro还将新增网络浏览、文件上传和增强的API支持(例如结构化输出、函数调用和图像理解)功能。

赞助本站

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港