OpenAI 有 推出 Operator 的研究预览,这是一种通用人工智能代理,能够通过控制网络浏览器独立执行任务。此功能首先通过 ChatGPT 的 200 美元 Pro 订阅计划向美国用户提供,并计划在未来扩展到其他用户级别。
OpenAI 操作员解释
操作员可以自动执行各种任务,包括预订旅行住宿、预订餐厅和在线购物。用户可以在操作员界面中从购物、送货、餐饮和旅行等类别中进行选择。激活后,会弹出一个专用的网络浏览器窗口,向用户显示操作员执行的操作以及解释。当 Operator 在自己的浏览器环境中运行时,用户可以保持对屏幕的控制。
AI 代理由计算机使用代理 (CUA) 模型提供支持,该模型将 GPT-4o 模型的视觉功能与高级推理相结合。 CUA 与网站前端交互,无需以开发人员为中心的 API。此功能允许它像人类一样使用按钮、导航菜单和填写表单。 OpenAI 与 DoorDash、eBay、Instacart 和 Priceline 等多家公司合作,确保 Operator 遵守他们的服务协议条款。
OpenAI 表示,CUA 模型旨在在完成具有外部影响的任务(例如提交订单或发送电子邮件)之前要求用户确认。尽管其功能强大,OpenAI 警告说,CUA 可能无法在所有场景中可靠地执行,并且难以处理复杂的任务,例如创建详细的幻灯片、管理复杂的日历或导航非标准 Web 界面。
对于银行交易等敏感任务,需要用户监督。运营商不会收集或截图用户数据,并且要求对电子邮件和金融服务等特别敏感的网站进行直接监督,使用户能够及时解决任何错误。
运营商有一定的局限性。 OpenAI 强制执行速率限制(每日和任务相关),并指定出于安全原因拒绝某些任务,例如发送电子邮件或删除日历事件。 OpenAI 计划在未来修改这些限制,但没有提供具体时间表。https://www.youtube.com/watch?v=m0Cjiq8P6iU
操作员还可能会遇到复杂的 Web 界面、密码字段和验证码检查的困难,提示用户此时进行干预。 OpenAI 承认与可以在网络上采取行动的人工智能系统相关的安全风险,强调有必要防止恶意行为者的潜在利用。
OpenAI 实施了多项安全措施。代理在敏感交易期间请求用户控制输入,并在重大操作之前进行用户确认。运营商拒绝特定的高风险任务,并要求对敏感平台进行直接监管。调查措施包括谨慎导航以防止迅速注入、在可疑活动期间暂停操作的监控系统以及用于更新防护措施的自动检测管道。
OpenAI 的 Operator 是什么?它是如何工作的?
Operator 是一种通用人工智能代理,可以使用专用浏览器在网络上自主执行任务。它通过单击按钮、导航菜单和填写表单与网站进行交互。
Operator 与 Siri、Alexa 或 Google Assistant 等其他人工智能工具有何不同?
与传统助手不同,Operator 不仅仅处理信息;还处理信息。它可以通过直接与网站交互来在网络上执行操作,例如预订住宿或订购杂货。
操作员可以自主执行哪些任务?
它可以处理重复性任务,例如预订旅行、订餐、预订和在线购物。
为什么 Operator 首先作为研究预览版推出?
研究预览版允许 OpenAI 收集反馈、提高安全性并在更广泛部署之前完善工具。
什么是计算机使用代理 (CUA) 模型?它如何使操作员能够与网站交互?
CUA 将 GPT-4o 的视觉功能与高级推理相结合,使操作员能够查看按钮和表单等图形用户界面并与之交互。
Operator 可以执行创建幻灯片或管理日历等复杂任务吗?
还没有。操作员在复杂的界面和专门的工作流程中苦苦挣扎。
使用 Operator 的速率限制或任务限制是什么?
Operator 具有动态的每日和特定于任务的使用限制,并且无法执行发送电子邮件或处理验证码等任务。
操作员如何处理银行业务或输入付款详细信息等敏感任务?
它需要用户监督敏感操作,例如输入付款或登录详细信息,并且不存储此类数据。
OpenAI如何保证算子的安全可靠?
Operator 设计有保护措施,包括用户确认、敏感输入的接管模式以及恶意活动监控。
有哪些保障措施可以防止操作员犯错误或被滥用?
它在完成重要操作之前要求用户确认,并在检测到可疑活动时使用监控系统暂停任务。
运营商如何处理隐私问题,用户可以选择退出数据收集吗?
用户可以通过操作员界面选择退出数据收集、删除浏览数据以及控制隐私设置。
如果运营商遇到网络钓鱼尝试或恶意网站,会发生什么?
它经过训练可以检测和忽略恶意输入,如果发生可疑情况,监控系统可以暂停任务。
谁可以使用 Operator,费用是多少?
目前,美国用户可以通过 ChatGPT 的 200 美元 Pro 订阅计划使用 Operator。
Operator 何时可以在美国以外地区(尤其是欧洲)使用?
OpenAI 计划在全球范围内推广,但出于区域考虑,欧洲可能需要更长时间。
Operator 最终会包含在所有 ChatGPT 订阅级别中吗?
是的,OpenAI 计划将访问权限扩展到 Plus、Team 和 Enterprise 级别。
开发人员将来是否能够使用 CUA 模型构建自定义工具?
是的,OpenAI 计划在 API 中发布 CUA 模型,供开发人员创建自己的代理。
OpenAI 与哪些公司合作运营 Operator,这对用户有何好处?
OpenAI 正在与 DoorDash、Instacart 和 Uber 等公司合作,在尊重服务条款的同时优化 Operator 的功能。
特色图片来源: 开放人工智能