谷歌详细介绍了 Chrome 新人工智能代理的安全护栏

谷歌详细的 Chrome 浏览器中代理功能的安全方法，可以代表用户执行操作。该公司此前于 9 月份预览了这些功能，并将在未来几个月内进行更广泛的推广。该公司已经实施了观察者模型和用户同意机制来管理这些代理行为。该策略解决了潜在的安全风险，其中可能包括与此类功能相关的数据丢失或财务影响。谷歌采用多种模型来监控代理行为。它开发了由 Gemini 提供支持的 User Alignment Critic，用于评估规划器模型为特定任务生成的操作项。如果批评者模型认为建议的任务与用户的目标不一致，它会指示规划器模型修改其策略。评论家模型仅访问建议操作的元数据，而不访问实际的网络内容。为了防止代理访问未经授权或不可信的网站，Google 使用代理源集。这些集将模型限制为指定的只读和读写源。只读源允许 Gemini 消费内容，例如购物网站上的产品列表，同时排除横幅广告等不相关元素。同样，代理只能与页面上的特定 iframe 进行交互。

图片：谷歌

该公司在博客文章中表示：“这种划分强制要求代理只能使用来自有限来源的数据，并且这些数据只能传递到可写的来源。” “这限制了跨源数据泄漏的威胁向量。这也使浏览器能够强制执行某些隔离，例如甚至不向模型发送可读集之外的数据。” Google 还使用另一个观察者模型来监控页面导航，该模型会仔细检查 URL。此机制旨在防止导航到有害的模型生成的 URL。对于敏感任务，Google 需要用户许可。当代理尝试访问包含银行或医疗信息的网站时，它首先提示用户同意。对于需要登录的网站，Chrome 会请求用户允许使用密码管理器，以确保代理的模型不会访问密码数据。该公司还将在进行购买或发送消息等操作之前寻求用户的批准。此外，谷歌还有一个即时注入分类器来防止不必要的操作，并不断测试其针对研究人员开发的攻击的代理能力。其他人工智能浏览器开发商也将注意力集中在安全性上； Perplexity 本月早些时候发布了一种新的开源内容检测模型，以应对针对代理的即时注入攻击。

特色图片来源