热点资讯
新闻动态
为训练AI不择手段!Meta被曝下载数十TB盗版电子书
发布日期:2025-03-06 06:12 点击次数:164
快科技 2 月 9 日消息,据媒体报道,一名图书作者对 Meta 提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其 AI 模型。
最新泄露的邮件显示,Meta 承认下载了一个有争议的大型数据集 LibGen,其中包括数千万本盗版书籍。
根据法庭文件,Meta 通过名为"安娜的档案"(Anna's Archive)的渠道下载了至少 81.7TB 的数据,其中包括来自知名盗版网站 Z-Library 和 LibGen 的至少 35.7TB 的内容,Meta 还被指此前从 LibGen 下载了额外的 80.6TB 数据。
作者指出,Meta 的这一行为构成了非法的电子书库种子下载,且这一数字可能只是其盗版行为的冰山一角。
作者估计,这些盗版电子书库可能仅占 Meta 盗版版权作品总量的 0.008%,这表明 Meta 的盗版规模可能远超目前所揭露的。
邮件还显示,Meta 公司员工也意识到其行为的法律风险,2023 年 4 月,Meta 的研究工程师尼古拉 · 巴什利科夫在邮件中表示:"用公司的笔记本电脑下 BT 感觉不妥。"
到 2023 年 9 月,巴什科夫加大了抗议力度,并咨询了法律团队,他指出,使用 Torrents 意味着对文件进行"播种",即对外共享内容,这在法律上是不允许的。
但 Meta 仍决定继续,并试图通过将数据集下载到非 Meta 服务器来避免被追溯的风险。