谷歌的“Project Jarvis”曾被传言是该公司对微软 Copilot 的回应,但当它短暂出现在 Chrome 网上应用店时,意外得到了证实。
贾维斯计划, 喜欢 微软的副驾驶,旨在成为一种提高生产力的人工智能,它可以超越简单的命令来完成多步骤、基于网络的任务。几个月来,有迹象表明谷歌正在开发一款先进的自主人工智能助手,它可以控制用户的 Chrome 会话,执行购物和预订旅行等任务,并以最少的用户输入进行研究。
这个意外的揭露(现在已删除)在 Chrome 网上应用店 证实 贾维斯确实是真实存在的,而且很可能正在发布中。
贾维斯计划带来了什么?
与 Microsoft 的 Copilot 与 Office 集成类似,Jarvis 旨在简化和自动化需要多个步骤的复杂任务。据 The Information 报道,Jarvis 将由谷歌的 Gemini 2.0 人工智能模型提供支持,使其能够处理顺序工作流程和复杂的推理。
贾维斯不仅仅是提供响应,还可以自主执行操作,控制 Chrome 选项卡并通过捕获和分析屏幕截图与网站界面进行交互。这项技术更像是一个可以独立行动的同事,而不是一个简单的助手。
超越语音助手的功能
贾维斯不是典型的虚拟助理。 Copilot 旨在导航 Word、Excel 和 Teams 等软件,而 Jarvis 则扩展到跨网站执行复杂的操作。将其视为能够“查看”网页、解释表单或按钮等元素并根据其理解做出决策的数字助理。
它可以“单击”按钮、填写数据字段,甚至可以比较不同站点上的项目——这些任务通常需要多个用户步骤。 Jarvis 基于屏幕截图的导航使其可以在各种 Web 布局和表单上工作,甚至是那些变化很大的网页布局和表单,尽管这种方法确实会降低其速度,使其需要几秒钟来分析每个步骤。
隐私受到质疑
与深度集成到 Office 环境中的微软 Copilot 一样,贾维斯提出了有关隐私和安全的问题。
该助手依赖屏幕截图来解释网页,这意味着它可能会捕获敏感信息。 Google 承诺测试 Jarvis 的安全性和数据完整性对于维护用户信任至关重要。鉴于贾维斯对用户设备的控制程度,强大的保护措施对于避免未经授权的访问或破坏至关重要。
人工智能与生产力合二为一
谷歌的 Project Jarvis 和微软的 Copilot 都是自主、注重生产力的人工智能代理日益增长的趋势的一部分。随着这些技术的成熟,它们有望重塑用户处理数字工作流程的方式,从而有可能减少常见数字任务中的手动输入。 Jarvis 将如何直接与人工智能驱动的生产力工具进行比较还有待观察。
随着 Jarvis 即将发布官方预览版,该工具可以让我们了解集成人工智能工具的未来,将强大的任务自动化直接带到用户的浏览器中。
目前,我们将密切关注谷歌在人工智能竞赛中的最新表现。