美国地方法院法官阿米特·梅塔(Amit Mehta)已命令Google与竞争对手分享其专有搜索数据,这是该公司在在线搜索中非法维持其垄断的裁决后的地标补救措施。该订单迫使Google使竞争对手访问其有价值的Web索引和用户点击数据,但该决定还为消费者造成了重大隐私风险。
数据共享是如何旨在帮助竞争对手的
该裁决的结构是降低试图构建自己的搜索引擎的小型公司的入口障碍。根据该订单,Google必须提供两种关键类型的数据:
- 其搜索索引的一次性副本: 数十亿个网页的大量目录是任何搜索引擎的基础数据库。
- 访问其点击记录: 日志用户搜索的内容,单击的链接,在页面上停留多长时间以及是否返回搜索结果。
此点击询问信息被认为是最有价值的资产。它提供了有关用户满意度的直接反馈循环,该循环是Google用来不断完善其算法并实现市场优势的相同机制。加州大学伯克利分校的高级科学家乔纳森·斯特雷(Jonathan Stray)将此数据描述为“极为重要的信息”,因为它提供了搜索引擎是否成功回答用户查询的有力信号。
用户的明显隐私风险
尽管目标是促进竞争,但分享用户搜索行为详细日志的要求使隐私倡导者感到震惊。他们认为这些数据非常个人化和敏感。电子边界基金会的米奇·斯托尔茨(Mitch Stoltz)指出:
“我们告诉搜索引擎的事情我们不会告诉浪漫的伴侣或医生。”
主要问题是“重新识别”的风险,可以将匿名数据追溯到特定个人。 Mehta法官以假设的例子是从一个小镇上寻找罕见的健康状况,从而在他的裁决中承认了这种危险。即使没有名称,特定的上下文和地理信息也足以识别该人。数据集中的IP地址的存在,通常可以将其链接到物理位置,进一步增加了这种风险。 Google本身以前曾警告过这些危险。在去年的博客文章中,一位公司高管认为,搜索查询通常很敏感,如果以较低的安全性转移到第三方,可能会被滥用。在整个审判过程中,Google的律师坚持认为,任何法院命令的数据共享都会对用户隐私构成不可避免的风险。
过程将如何管理
竞争对手将不会立即或不受限制地访问数据。整个过程将由一个由五人组成的技术委员会监督六年。该委员会由司法部,Google和参与诉讼的各州以及两名独立专家组成,将负责:
- 确定哪些公司有资格接收数据。
- 建立接收公司必须实施的安全保障措施。
- 监视Google遵守法院命令。
该委员会还将决定数据的技术格式以及适用哪些保障措施,例如不包括少于十个用户进行的任何搜索查询以降低重新识别风险。但是,专家警告说,达到正确的平衡将很困难。正如Mitch Stoltz所指出的那样,尚不清楚数据是否存在数据既保护用户隐私,又对训练竞争对手搜索引擎有用。
法律背景以及接下来会发生什么
司法部的案子认为,Google的独家合同是苹果和三星非法窒息竞争的设备上的默认搜索引擎。这些交易锁定了竞争对手,阻止他们收集建立竞争产品所需的大规模用户数据。数据共享疗法旨在打破这种自我增强周期。该统治迫使两个公共利益之间的直接冲突:刺激数字市场中的竞争并保护用户隐私。如果两者要冲突,尚不清楚哪个目标将优先考虑。人们普遍期望Google对垄断裁决和具体补救措施提出上诉,这可能会大大延迟数据共享计划的实施。同时,辩论已转向监督委员会将如何应对其“矛盾的授权”,以及是否可以有效地管理深刻的隐私问题。




