据《纽约时报》和《每日新闻》的律师称,OpenAI 无意中删除了与该公司针对未经授权使用其内容而提起的版权诉讼相关的关键数据。 TechCrunch 报告。该事件发生之前,OpenAI 同意提供其训练数据集的访问权限,以帮助原告验证其受版权保护的材料的使用情况。
该诉讼称,OpenAI 在未获得训练其模型的许可的情况下,从《纽约时报》和《每日新闻》上抄袭了文章。作为对诉讼的回应,OpenAI 提供了两台虚拟机,供出版商的律师在其培训数据中搜索受版权保护的内容。自 11 月 1 日起,法律团队投入了 150 多个小时进行此次搜寻。然而,正如美国纽约南区地方法院提交的文件中指出的那样,11 月 14 日,OpenAI 工程师错误地删除了其中一台虚拟机上存储的所有搜索数据。
OpenAI 恢复已删除数据的尝试大多是成功的,但文件夹结构和文件名的丢失导致恢复的数据无法用于跟踪原告文章包含在 AI 训练中的位置。原告律师提交的信函强调,他们必须重建工作,耗费大量资源和时间。
尽管删除了数据,但律师澄清说,没有迹象表明该事件是故意的。他们对 OpenAI 非常适合搜索自己的数据集表示担忧,表明有义务协助调查潜在的版权侵权行为。
OpenAI 通过 ChatGPT 应用程序支持让 macOS 变得更加智能
OpenAI 认为,使用公开数据来训练其模型属于“合理使用”。该公司坚称,它不需要对这些内容进行许可或补偿,即使它从其人工智能产品中获利。尽管如此,OpenAI 已与多家出版商签订了许可协议,其中包括美联社和金融时报等知名出版社。虽然这些交易的具体条款尚未披露,但据报道,合作伙伴之一 Dotdash 每年至少获得 1600 万美元的收入。
OpenAI 尚未就该事件或其对与原告关系的影响发表声明。
特色图片来源: 乔纳森·肯珀/Unsplash