Openai有 引入 一种名为深入研究的新型人工智能工具,为用户进行广泛的在线研究,解决了从复杂的科学询问到个性化产品建议的任务。该服务可通过OpenAI的Chatgpt Chatbot向客户付款。
什么是深入研究?
Openai表示,深入的研究可以在短短五到30分钟内产生全面的报告,这项任务通常将用户“很多小时”。该工具分析了各种资源,包括文本,图像,PDF和使用用户的文件,以与研究分析师类似地合成信息。 OpenAI首席产品官Kevin Weil强调了其执行复杂任务的能力,将其绩效与人类研究人员的绩效进行了比较。
Openai推出了O3-Mini,比DeepSeek R1昂贵
此次发布是在Openai介绍另一个名为Operator的AI代理之后的,该代理商有助于预订航班和管理杂货订单等任务。这两种服务均专门用于订阅每月200美元的ChatGpt Pro计划的用户,这表明战略关注付费订阅服务以资助这些高级功能。
模型 | 准确性 (%) |
---|---|
GPT-4O | 3.3 |
Grok-2 | 3.8 |
克劳德3.5十四行诗 | 4.3 |
双子座思考 | 6.2 |
Openai O1 | 9.1 |
DeepSeek-r1* | 9.4 |
Openai O3-Mini(中)* | 10.5 |
Openai O3-Mini(高)* | 13.0 |
Openai深入研究 ** | 26.6 |
该工具体现了AI行业的更广泛趋势,可以开发能够以最少的监督执行多步骤任务的代理商。包括Microsoft Corp.和Anthropic在内的竞争对手也正在探索类似的技术,以期提高个人和专业任务的生产率。
Openai首席执行官Sam Altman表示,此类代理商的发展可能代表人工智能的重大突破。这一进步的紧迫性是通过像DeepSeek这样的中国人工智能公司的竞争加剧了,这些公司很快就在该行业发展。
尽管具有功能,Openai还是警告了与深入研究相关的潜在局限性。该工具可能会产生捏造的信息,并经常将可信的来源与谣言混淆。用户可能会遇到限制,例如在初始推出期间每月无法提交100多个查询。
在华盛顿举行的一项活动中展示了深入研究的发布,该活动成功地汇总了有关阿尔伯特·爱因斯坦的信息,包括为假设的国会听证会引起相关问题。 Deep Research产生的报告还包括引用,尽管不准确是由AI中称为“幻觉”的现象引起的。
盖亚 | 1级 | 级别2 | 级别3 | avg。 |
---|---|---|---|---|
以前的sota | 67.92 | 67.44 | 42.31 | 63.64 |
深入研究(通过@1) | 74.29 | 69.06 | 47.60 | 67.36 |
深入研究(CONS@64) | 78.66 | 73.21 | 58.03 | 72.57 |
OpenAI计划将来扩大对深度研究的访问,以订阅其优势,团队和企业计划的用户为目标。该工具利用了公司最新推理技术OpenAI O3的版本,该技术专门针对Web浏览和数据分析进行了优化。
Deep Research的培训结合了需要浏览和推理功能的实际任务。它还采用强化学习技术,增强其有效浏览和合成信息的能力。最近的评估表明,该模型在复杂的研究任务中实现了前所未有的准确性。
Openai报道说,在评估人类的最后一项考试中,为深入研究提供动力的模型得分为26.6%,这是AI系统在各种科目中解决专家级问题的显着成就。此外,在Gaia公共基准下,该工具通过证明需要推理和多模式流利度的功能来超越先前的性能记录。
尽管该工具目前非常密集,但OpenAI预计会改进,以使其随着时间的流逝而更加高效和用户友好,并计划未来迭代,可以增强其功能和可访问性。
ChatGpt用户在周日提供了深入的研究,预计将来的增强功能将在移动和桌面平台上推出。 OpenAi设想扩大工具的功能,包括访问更专业的数据源,从而丰富其输出的上下文和个性化。
Chatgpt深入研究值得吗?
是的,如果:
- 您需要快速,全面的研究: 深入的研究可以在5到30分钟内产生详细的报告,从而节省了数小时的手动工作。如果您经常需要快速,合成的信息,则此工具是改变游戏规则的。
- 您处理复杂的任务: 该工具旨在执行多步骤任务,非常适合需要分析数据,编译报告或在各个领域进行深入研究的专业人员。
- 您是Chatgpt Pro订户: 如果您已经为每月200美元的Chatgpt Pro计划付费,那么您将可以访问深入的研究和其他高级功能,例如操作员,使其成为工具包的宝贵补充。
- 您重视AI驱动的生产力: 如果您希望利用AI在个人和专业环境中提高生产率,那么深入的研究就与AI代理商在最小的监督下执行复杂任务的更广泛趋势保持一致。
- 您在一个竞争领域: 对于Microsoft和Anthropic开发类似工具的竞争对手,使用先进的AI研究工具保持领先地位,可以使您获得优势。
不,如果:
- 您的预算紧张: Chatgpt Pro计划每月200美元是一项重大投资。如果您不需要高级AI工具,则成本可能无法证明福利是合理的。
- 您担心准确性: 深入的研究有局限性,包括产生捏造信息或将可信来源与谣言混淆的潜力。如果您的工作需要100%的准确性,则此工具可能不够可靠。
- 您超过查询限制: 在最初的推出期间,用户每月限制100个查询。如果您的研究需要超过此限制,则可能会发现工具限制性。
- 您更喜欢手动研究: 如果您喜欢或需要对研究过程进行动手控制,那么依靠AI工具可能与您的工作流或偏好不符。
- 您不需要高级功能: 如果您的研究需求简单或很少见,那么深入研究的高级功能可能会过大,并且您可以使用更多的基本工具来实现目标。
特色图片来源: Openai