一个盗版激进组织提取了 Spotify 的整个音乐目录,并通过点对点网络发布了约 300 TB 的音频文件和元数据。安娜的档案 记录在案 周四的泄漏涉及 8600 万个音频文件和 2.56 亿行曲目元数据,约占该平台上所有收听活动的 99.6%。 Spotify 对未经授权的访问进行了调查。一位发言人告诉 广告牌,“对未经授权的访问的调查发现,第三方抓取了公共元数据,并使用非法策略规避 DRM 来访问该平台的一些音频文件。我们正在积极调查和缓解这一事件。”该回应概述了泄露的方法,其中涉及将公开可用的数据与绕过数字版权管理保护的技术相结合。安娜档案馆是一个通常保存书籍和学术论文的组织,该组织将此次发布描述为音乐的“保存档案”。该组织表示,这一努力符合其保护人类知识和文化的使命。该合集显着超越了之前的努力,包含比 MusicBrainz 多 37 倍的独特录音,MusicBrainz 是之前最大的开源音乐数据库,拥有约 500 万个独特的国际标准录音代码 (ISRC)。泄露的元数据覆盖了 Spotify 2.56 亿首曲目的 99.9%,其中包括 1.86 亿个独特的 ISRC。 Anna’s Archive 使用 Spotify 自己的流行度指标对文件进行优先级排列,并捕获截至 2025 年 7 月可用的歌曲。这种优先级排列可确保流媒体最多的曲目首先出现在分发过程中。该小组正在分阶段发布数据以管理数据量。元数据已经可供下载,而音乐文件则按照流行程度在点对点网络上分发。这种分阶段的方法允许更广泛的传播,而不会压垮初始服务器。为媒体公司开发法律工具的初创公司 Third Chair 的首席执行官兼联合创始人 Yoav Zimmerman 对泄露数据的可访问性发表了评论。他在 LinkedIn 的一篇帖子中写道,“理论上,现在任何人都可以创建自己的个人免费版本 Spotify(2025 年之前的所有音乐),并拥有足够的存储空间和像 Plex 这样的个人媒体流服务器。唯一真正的障碍是版权法和对执法的恐惧。”齐默尔曼强调,这些数据已经在点对点网络上流通,并补充道,“无法将其放回潘多拉魔盒。”齐默尔曼还谈到了泄漏的更广泛的应用。他观察到,这一违规行为使得人工智能公司大规模训练现代音乐模型变得更加容易,而版权法和执法威慑是主要障碍。





