2 月 21 日消息,本周 meta 在法庭文件中声称,尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型,但公司员工已采取措施,确保在下载过程中未对任何文件进行“种子分享(seeding)”。在文件共享术语中,“种子分享”指在下载文件时(或下载完成后)将文件共享给其他用户。由于文件共享是基于点对点网络系统,每个下载文件的用户都可以将文件的一部分上传给其他用户。
meta 的律师表示,目前没有任何事实表明 meta 在下载过程中分享了原告的书籍。这意味着 meta 的辩护策略主要依赖于目前缺乏证据证明其在下载过程中共享了相关资料。尽管 meta 声称没有证据表明其进行了种子分享,但 meta 负责项目管理的高管迈克尔・克拉克(Michael Clark)在证词中提到,他们所使用的配置设置经过调整,“以尽可能减少种子分享的发生”。然而,在被问及为何要减少种子分享时,克拉克以律师-客户特权为由拒绝回答。
克拉克的声明表明,meta 确实试图减少种子分享,但尚未提供证据表明其完全阻止了版权资料的共享。此外,meta 研究员弗兰克・张(Frank Zhang)的一条内部消息可能暗示公司试图掩盖其服务器上可能的种子分享行为,以避免“追踪种子分享者 / 下载者的风险”回到 Facebook 服务器。
meta 的辩护似乎主要围绕缺乏证据证明其在下载大量数据时进行共享这一事实展开。如果 meta 的辩护成功,证明下载版权内容本身并不违法,而只有分发才是违法的,这可能会对未来的版权侵权和未经授权的版权内容分发案件产生深远影响。此外,meta 将辩护重点放在种子分享上,可能是为了在法律上制造混淆,进一步模糊其涉嫌明知违法仍下载受版权材料的指控。
meta 尚未对是否知晓其在下载过程中共享数据的指控作出回应。版权材料的作者声称,meta 是“非法点对点盗版网络的知情参与者”,并指责 meta“绕过合法获取方式,参与非法点对点盗版网络”。
注意到,类似的案件并不罕见。2023 年,OpenAI 曾被小说家起诉,而《纽约时报》也因“数百万”篇新闻文章被抄袭而起诉 OpenAI 和微软。随着越来越多与大型语言模型相关的诉讼不断涌现,meta 的这一案件可能只是冰山一角。