随着 OpenAI 宣布推出 OpenAI o1,人工智能又向前迈进了一大步,OpenAI o1 是其首款具备“推理”能力的模型,曾在臭名昭著的 Strawberry 模型中提到过。
被誉为备受期待的“草莓”模型的基础上,OpenAI o1 具有增强的解决问题能力,提供了更先进的方法来理解和回答多步骤问题。
除了 OpenAI o1,该公司还发布了 ChatGPT o1-mini,这是一款更实惠、更小的版本,适合需要更简单解决方案的用户。此次发布标志着 OpenAI 向其能够思考、推理和协助决策的 AI 系统愿景迈进的重要里程碑。
OpenAI ChatGPT o1 现已推出
OpenAI 的新款 OpenAI o1 的特别之处在于它的 处理复杂推理的能力,使其与之前的迭代区别开来,例如 GPT-4o。
与早期主要关注模式识别和模仿训练数据的模型不同,o1 使用强化学习逐步处理问题。这种方法通常被称为“思路”推理,使模型能够分解复杂的查询并提供准确、结构化的答案。
ChatGPT o1 最引人注目的方面之一是它能够在解决问题时解释其推理。在一次演示中 博客文章OpenAI的研究团队展示了ChatGPT o1如何一步步处理一道数学难题,并在30秒的思考后给出解决方案。
这个过程 反映了人类解决问题的方式,与人工智能进行更直观、更相关的交互。然而,OpenAI 很快澄清说,虽然该模型似乎在“思考”,但它的认知实际上并不具有意识或像人类一样。相反,该界面旨在让用户深入了解模型复杂的处理路径。
OpenAI o1 的优势和局限性
OpenAI o1 代表了重大进步,但它并不完美。OpenAI 承认,尽管推理能力有所提高,但该模型仍然难以应对幻觉,这是 AI 生成不正确或误导性信息的常见问题。
作为 杰瑞·特沃里克OpenAI 的研究负责人解释说:
“我们不能说我们解决了幻觉问题”。
尽管如此,OpenAI o1 在编写代码、解决数学问题等任务方面表现得更出色,并且在 Codeforces 编程竞赛等竞争环境中表现出色。
根据 OpenAI 的说法,ChatGPT o1 擅长完成需要复杂思考的任务, 例如:
- 编码
- 数学
- 科学问题
事实上,在测试中,它解决了国际数学奥林匹克资格考试中 83% 的问题,比 GPT-4o 的 13% 的成功率有了显著提高。这些结果表明,o1 有能力处理比其前辈更高级的任务,尽管它在常识或语言处理等领域的表现并不优于 GPT-4o。
自主代理及其他
OpenAI 的长期目标之一是构建自主 AI 系统或代理,可以代表用户做出决策并采取行动。OpenAI o1 模型被视为朝这个方向迈出的关键一步。与依赖于预测单词序列的当前模型不同,未来的 AI 代理将能够自主执行复杂任务,从研究到解决医学和工程等领域的问题。
鲍勃·麦格鲁OpenAI 首席研究官在 ChatGPT o1 发布时就强调了这一点,他表示:
“我们花了数月时间进行推理,因为我们认为这实际上是关键的突破”。
McGrew 和他的团队认为,解决推理难题是实现人工智能类人智能的基础。o1 背后的新训练方法反映了这一重点,因为该模型已针对超越简单模式识别的任务进行了优化。
对于那些有兴趣了解推理如何带来更先进的人工智能的人来说,McGrew 对人工智能代理的研究提供了令人着迷的见解。
ChatGPT o1 定价
然而,这些进步是有代价的。开发人员访问 OpenAI o1 需要付出高昂的代价: 每 100 万个输入代币收费 15 美元,每 100 万个输出代币收费 60 美元。
这使得它比 GPT-4o 贵得多,后者的输入和输出令牌成本分别为 5 美元和 15 美元。对于从事需要广泛推理能力的项目的开发人员来说,定价可能是一个障碍。话虽如此,OpenAI 将 ChatGPT o1 定位为“预览”,强调这仍是一个早期模型,预计在未来的迭代中会有更多的改进。
同时, ChatGPT Plus 和团队用户可以访问 ChatGPT o1-preview 和 ChatGPT o1-mini 从今天开始,企业用户和教育用户将于下周获得访问权限。
该公司还 计划向免费用户推出 ChatGPT o1-mini,但尚未公布具体日期。此次分阶段发布暗示了 OpenAI 的策略,即在向更广泛的受众全面推出该模型之前先评估用户反馈。
对于那些热衷于在编程中使用 OpenAI o1 的人来说,OpenAI 分享了一个 演示 展示模型的推理能力。
如何使用 ChatGPT o1
使用 ChatGPT o1,OpenAI最新增强推理能力的模型,步骤如下:
1. 访问 ChatGPT o1
- ChatGPT Plus 和团队用户:o1-preview 和 o1-mini 可立即使用。只需登录您的 ChatGPT 帐户,使用这些模型的选项就会出现在模型下拉菜单中。
- 企业和教育用户:您将于下周获得访问权限。
- 免费套餐用户:OpenAI 计划稍后推出 o1-mini。目前尚未公布具体发布日期。
2. 选择 o1 模型
登录后,您可以:
- 打开 ChatGPT 界面。
- 选择 OpenAI o1 预览版 或者 o1-迷你 从可用模型列表中(如 GPT-4、GPT-3.5 等)。
- 这 OpenAI o1-预览 是具有最大推理能力的完整版本,而 o1-迷你 是一种更轻、更快、更便宜的选择。
3. API 中的用法
如果你是一名开发者,使用 API 中的 OpenAI o1 涉及:
- 调整 API 调用以指定 o1-预览 或者 o1-迷你。
- 定价高于 GPT-4o, 每百万输入代币 15 美元 和 每百万输出代币 60 美元。
更多详情,请参阅 OpenAI 的 API 文档 了解如何整合新模型。
OpenAI o1 根据提示编写视频游戏代码。 pic.twitter.com/aBEcehP0j8
— OpenAI(@OpenAI) 2024 年 9 月 12 日
更大的图景
借助 ChatGPT o1,OpenAI 朝着实现其愿景迈出了一大步,即创建不仅可以回答问题而且可以推理复杂问题的人工智能系统。
尽管该模型并非没有局限性,但它引入了一种与人工智能互动的新方式,这种方式感觉更直观,有时甚至令人惊讶地人性化。通过专注于推理,OpenAI 为未来的进步铺平了道路,这些进步可能会对各个行业产生深远的影响。
随着基于推理的人工智能的发展,我们可以期待医学、工程甚至创意艺术等领域的进一步创新。
现在的问题不是人工智能能否帮助我们解决复杂问题,而是 我们能突破极限到什么程度 其能力。
图片来源: OpenAI