谷歌 详细的 Chrome 浏览器中代理功能的安全方法,可以代表用户执行操作。该公司此前于 9 月份预览了这些功能,并将在未来几个月内进行更广泛的推广。该公司已经实施了观察者模型和用户同意机制来管理这些代理行为。该策略解决了潜在的安全风险,其中可能包括与此类功能相关的数据丢失或财务影响。谷歌采用多种模型来监控代理行为。它开发了由 Gemini 提供支持的 User Alignment Critic,用于评估规划器模型为特定任务生成的操作项。如果批评者模型认为建议的任务与用户的目标不一致,它会指示规划器模型修改其策略。评论家模型仅访问建议操作的元数据,而不访问实际的网络内容。为了防止代理访问未经授权或不可信的网站,Google 使用代理源集。这些集将模型限制为指定的只读和读写源。只读源允许 Gemini 消费内容,例如购物网站上的产品列表,同时排除横幅广告等不相关元素。同样,代理只能与页面上的特定 iframe 进行交互。
图片:谷歌该公司在博客文章中表示:“这种划分强制要求代理只能使用来自有限来源的数据,并且这些数据只能传递到可写的来源。” “这限制了跨源数据泄漏的威胁向量。这也使浏览器能够强制执行某些隔离,例如甚至不向模型发送可读集之外的数据。” Google 还使用另一个观察者模型来监控页面导航,该模型会仔细检查 URL。此机制旨在防止导航到有害的模型生成的 URL。对于敏感任务,Google 需要用户许可。当代理尝试访问包含银行或医疗信息的网站时,它首先提示用户同意。对于需要登录的网站,Chrome 会请求用户允许使用密码管理器,以确保代理的模型不会访问密码数据。该公司还将在进行购买或发送消息等操作之前寻求用户的批准。此外,谷歌还有一个即时注入分类器来防止不必要的操作,并不断测试其针对研究人员开发的攻击的代理能力。其他人工智能浏览器开发商也将注意力集中在安全性上; Perplexity 本月早些时候发布了一种新的开源内容检测模型,以应对针对代理的即时注入攻击。





