36kr-科技 10月11日 12:45
苹果AI侵权案:非法使用盗版书籍训练模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

苹果公司因在训练AI系统“Apple Intelligence”时非法使用数千本受版权保护的书籍而被两名学者起诉。原告苏珊娜·马丁内斯-孔德和斯蒂芬·麦克尼克指出,苹果使用了来自“影子图书馆”的盗版图书数据,包括著名的“Books3”数据集,其中包含原告的著作。苹果虽拥有部分书籍的合法销售授权,但其AI部门却使用了盗版副本进行训练,反映出版权管理上的双重标准。原告要求苹果停止侵权并支付赔偿,此举引发行业对AI训练数据版权问题的关注。

📚 苹果公司被两名学者起诉,指控其在训练AI系统“Apple Intelligence”时非法使用了数千本受版权保护的书籍,包括原告的著作。

🖥️ 原告指出,苹果使用了来自“影子图书馆”的盗版图书数据,特别是“Books3”数据集,其中包含通过私人BitTorrent追踪器获取的超过18.6万本图书。

📖 尽管苹果拥有部分书籍的合法销售授权,但其AI部门却使用了盗版副本进行训练,反映出版权管理上的双重标准,原告认为这侵犯了版权。

💰 原告要求法院判令苹果停止使用受版权保护的作品,并支付赔偿金,根据美国版权法,故意侵权最高可按每部作品15万美元处罚。

🌐 此案引发行业对AI训练数据版权问题的关注,此前已有其他科技巨头如OpenAI、微软、Meta等面临类似集体诉讼。

10月11日消息,苹果公司近日在美国加州联邦法院被两名学者起诉,被控在训练新一代人工智能系统“Apple Intelligence”时,非法使用了数千本受版权保护的书籍。

提起诉讼的是纽约州立大学下州健康科学大学的神经科学教授苏珊娜·马丁内斯-孔德(Susana Martinez-Conde)和斯蒂芬·麦克尼克(Stephen Macknik)。他们在诉状中指出,苹果使用了来自“影子图书馆”的盗版图书数据来训练其AI模型。

盗版书库成训练素材

诉状披露,苹果在2024年4月讨论其OpenELM语言模型时,曾披露使用了名为“The Pile”的英文数据集,其中包含著名的盗版书库“Books3”。

该书库在被下架前,收录了通过私人BitTorrent追踪器Bibliotik获取的超过18.6万本图书,其中就包括原告的著作《错觉冠军:令人费解的图像和神秘脑谜背后的科学》和《思维的魔术:魔术的神经科学揭示了我们的日常欺骗》等。

“由于原告的版权书籍是Books3的一部分,苹果在未经授权的情况下完整复制了这些作品用于模型训练,直接侵犯了版权。”诉状中写道。

颇具讽刺意味的是,苹果旗下的Books服务拥有《思维的魔术》一书的合法销售授权,但其AI部门却使用了该书的盗版副本进行训练。原告认为,这反映出苹果在版权管理上存在双重标准。

苹果或面临巨额赔偿

原告要求法院判令苹果停止使用其受版权保护的作品,并支付赔偿金。根据美国版权法,故意侵权最高可按每部作品15万美元处罚。

诉状中还特别提到,在Apple Intelligence发布次日,苹果市值单日暴涨2000亿美元,创下公司历史纪录,以此强调AI业务对苹果的巨额商业价值。

行业维权浪潮延续

这是近期又一起针对科技巨头AI训练数据版权的法律纠纷。上月已有另一批作者对苹果提起类似诉讼,而OpenAI、微软、Meta等公司也面临来自作家、新闻机构和音乐厂牌的集体诉讼。

今年8月,Anthropic同意支付15亿美元,就作者对其AI模型Claude训练数据的版权诉讼达成和解。不过值得注意的是,在该案中,法院认定使用图书训练AI模型本身属于“合理使用”,侵权争议焦点在于模型是否会“记忆”并复现受版权保护的内容。

截至目前,苹果公司尚未对此次诉讼发表评论。

本文来自“腾讯科技”,作者:金鹿,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

苹果公司 AI侵权 盗版书籍 版权诉讼 科技巨头
相关文章