你的位置:福利彩票10元一包多少钱 > 新闻动态 > >为训练AI不择手段!Meta被曝下载数十TB盗版电子书
热点资讯
新闻动态

为训练AI不择手段!Meta被曝下载数十TB盗版电子书

发布日期:2025-03-06 06:12    点击次数:164

快科技 2 月 9 日消息,据媒体报道,一名图书作者对 Meta 提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其 AI 模型。

最新泄露的邮件显示,Meta 承认下载了一个有争议的大型数据集 LibGen,其中包括数千万本盗版书籍。

根据法庭文件,Meta 通过名为"安娜的档案"(Anna's Archive)的渠道下载了至少 81.7TB 的数据,其中包括来自知名盗版网站 Z-Library 和 LibGen 的至少 35.7TB 的内容,Meta 还被指此前从 LibGen 下载了额外的 80.6TB 数据。

作者指出,Meta 的这一行为构成了非法的电子书库种子下载,且这一数字可能只是其盗版行为的冰山一角。

作者估计,这些盗版电子书库可能仅占 Meta 盗版版权作品总量的 0.008%,这表明 Meta 的盗版规模可能远超目前所揭露的。

邮件还显示,Meta 公司员工也意识到其行为的法律风险,2023 年 4 月,Meta 的研究工程师尼古拉 · 巴什利科夫在邮件中表示:"用公司的笔记本电脑下 BT 感觉不妥。"

到 2023 年 9 月,巴什科夫加大了抗议力度,并咨询了法律团队,他指出,使用 Torrents 意味着对文件进行"播种",即对外共享内容,这在法律上是不允许的。

但 Meta 仍决定继续,并试图通过将数据集下载到非 Meta 服务器来避免被追溯的风险。



上一篇:以媒:以色列与哈马斯开始就停火第二阶段谈判
下一篇:3月下旬, 这四大属相紫气东来事事顺利, 人脉宽广运势旺盛