首页

软件资讯

正文

为训练AI不择手段！Meta被曝下载数十TB盗版电子书

02-10 09:39:25 来源：互联网

2月9日消息，据媒体报道，一名图书作者对meta提起诉讼，指控该公司未经授权下载了大量盗版电子书，用于训练其AI模型。

最新泄露的邮件显示，meta承认下载了一个有争议的大型数据集LibGen，其中包括数千万本盗版书籍。

根据法庭文件，meta通过名为“安娜的档案”（Anna"s Archive）的渠道下载了至少81.7TB的数据，其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的内容，meta还被指此前从LibGen下载了额外的80.6TB数据。

作者指出，meta的这一行为构成了非法的电子书库种子下载，且这一数字可能只是其盗版行为的冰山一角。

作者估计，这些盗版电子书库可能仅占meta盗版版权作品总量的0.008%，这表明meta的盗版规模可能远超目前所揭露的。

邮件还显示，meta公司员工也意识到其行为的法律风险，2023年4月，meta的研究工程师尼古拉·巴什利科夫在邮件中表示：“用公司的笔记本电脑下BT感觉不妥。”

到2023年9月，巴什科夫加大了抗议力度，并咨询了法律团队，他指出，使用Torrents意味着对文件进行“播种”，即对外共享内容，这在法律上是不允许的。

但meta仍决定继续，并试图通过将数据集下载到非meta服务器来避免被追溯的风险。

相关攻略

如何通过CRM系统提升企业客户关系管理效率，优化销售和服务流程

02-10 09:48:15

支持 API 调用，国家超算互联网平台上线 DeepSeek-R1 满血版

02-10 09:46:40

为训练AI不择手段！Meta被曝下载数十TB盗版电子书

02-10 09:39:25

冯提莫户外直播遭遇暴雨，全身湿透竟成怎样的一场“挑战”？

02-10 09:37:20

欧美无人区码AAAAA在智能设备和自动化领域的应用前景如何？

02-10 09:37:18

酷狗音乐破解版如何影响你的听歌体验？安全与隐私是否值得担忧？

02-10 09:37:16

9.1免费版九妖动漫：畅享无限动漫资源的理想选择

02-10 09:30:19

深蓝 DEEPAL OS 3.0 系统将接入 DeepSeek 模型，预计一季度所有车型推送

02-10 09:29:04

如何利用成品视频CRM999提升企业营销效果并节省时间成本？

02-10 09:27:20

如何选择适合自己的9.1成人免费资源？你需要了解的几点小技巧！

02-10 09:19:35

返回顶部