苹果AI侵权案：非法使用盗版书籍训练模型

10月11日消息，苹果公司近日在美国加州联邦法院被两名学者起诉，被控在训练新一代人工智能系统“Apple Intelligence”时，非法使用了数千本受版权保护的书籍。

提起诉讼的是纽约州立大学下州健康科学大学的神经科学教授苏珊娜·马丁内斯-孔德（Susana Martinez-Conde）和斯蒂芬·麦克尼克（Stephen Macknik）。他们在诉状中指出，苹果使用了来自“影子图书馆”的盗版图书数据来训练其AI模型。

盗版书库成训练素材

诉状披露，苹果在2024年4月讨论其OpenELM语言模型时，曾披露使用了名为“The Pile”的英文数据集，其中包含著名的盗版书库“Books3”。

该书库在被下架前，收录了通过私人BitTorrent追踪器Bibliotik获取的超过18.6万本图书，其中就包括原告的著作《错觉冠军：令人费解的图像和神秘脑谜背后的科学》和《思维的魔术：魔术的神经科学揭示了我们的日常欺骗》等。

“由于原告的版权书籍是Books3的一部分，苹果在未经授权的情况下完整复制了这些作品用于模型训练，直接侵犯了版权。”诉状中写道。

颇具讽刺意味的是，苹果旗下的Books服务拥有《思维的魔术》一书的合法销售授权，但其AI部门却使用了该书的盗版副本进行训练。原告认为，这反映出苹果在版权管理上存在双重标准。

原告要求法院判令苹果停止使用其受版权保护的作品，并支付赔偿金。根据美国版权法，故意侵权最高可按每部作品15万美元处罚。

诉状中还特别提到，在Apple Intelligence发布次日，苹果市值单日暴涨2000亿美元，创下公司历史纪录，以此强调AI业务对苹果的巨额商业价值。

这是近期又一起针对科技巨头AI训练数据版权的法律纠纷。上月已有另一批作者对苹果提起类似诉讼，而OpenAI、微软、Meta等公司也面临来自作家、新闻机构和音乐厂牌的集体诉讼。

今年8月，Anthropic同意支付15亿美元，就作者对其AI模型Claude训练数据的版权诉讼达成和解。不过值得注意的是，在该案中，法院认定使用图书训练AI模型本身属于“合理使用”，侵权争议焦点在于模型是否会“记忆”并复现受版权保护的内容。

截至目前，苹果公司尚未对此次诉讼发表评论。

本文来自“腾讯科技”，作者：金鹿，36氪经授权发布。