Openai有 发射 两种新的AI推理模型O3和O4-Mini旨在在回答之前暂停和解决问题。该公司在周三宣布发布会,使该模型可用于其Pro,Plus和Team Plans的订户。
O3被吹捧为OpenAI最先进的推理模型,在测量数学,编码,推理,科学和视觉理解能力的测试中,其前身的表现优于其前身。另一方面,O4-Mini在价格,速度和性能之间提供了竞争平衡。这两种模型均可使用CHATGPT中的工具(例如Web浏览,Python代码执行,图像处理和图像生成)生成响应。
新车型是Openai在全球AI竞赛中保持领先地位的努力的一部分,与像这样的公司竞争 谷歌,,,, 元, 和 人类。 O3在经过验证的SWE Bench上取得了最先进的表现,得分为69.1%,而O4-Mini得分为68.1%。 Openai以前的最佳型号O3-Mini在同一测试中得分49.3%。
Openai声称O3和O4-Mini是其第一个能够“使用图像思考”的模型。用户可以将图像上传到chatgpt,并且模型将在响应之前对其进行“经营链”阶段进行分析。这些模型还可以通过Chatgpt的Canvas功能直接在浏览器中运行Python代码,并搜索Web以查看当前事件。

除了CHATGPT外,这些模型还将通过OpenAI的面向开发人员的端点,聊天完成API和响应API提供。 O3的定价为每百万美元投入令牌10美元,每百万个产出代币40美元,而O4-Mini的价格为每百万个输入令牌为11美元,每百万个输出令牌为4.40美元。
OpenAI计划发布O3-Pro,该版本的O3版本使用更多的计算资源,在接下来的几周内专为Chatgpt Pro订户而言。首席执行官Sam Altman暗示O3和O4-Mini可能是该公司在GPT-5之前的最后一个独立的AI推理模型,GPT-5是一种结合了传统和推理模型的统一模型。