Anthropic被指AI训练侵权，其应用端创收已过百万美元

2024-08-23 14:22:23 来源： 21世纪经济报道

　　记者肖潇实习生韩佳序北京报道

　　当地时间8月19日，被视为OpenAI头号竞争对手的Anthropic被发起侵权起诉，三位作家指控公司在未经许可的情况下，“窃取”了数十万本书籍用于旗下大模型Claude的训练。

　　诉讼书中，作家们将Anthropic的行为形容为“大规模的版权盗窃”，并指责公司“故意下载已知的盗版书籍，制作副本并将其输入大模型中”。

　　本月早些时候，Anthropic曾在接受采访时承认，使用了一个名为the Pile的开源数据集来训练其大模型。而作家们现在认为，该数据集可能包含了一个庞大的盗版电子书库，包括斯蒂芬·霍金等作家的作品，也包括本次三位起诉作家——安德里亚·巴茨、查尔斯·格雷伯和柯克·华莱士·约翰逊的书籍。

　　the Pile数据集的版权问题，已经让多家AI公司卷入版权战火中。该数据集最初由非营利机构收集，用于学术目的，OpenAI、英伟达、苹果等巨头都曾在研究论文中详细描述如何使用the Pile的数据训练大模型。但就在上个月，the Pile被发现抓取了上万个YouTube视频字幕，而YouTube平台规则明确禁止爬虫抓取。上述明星AI公司因此陷入了偷录YouTube视频的侵权争议中。（详见：OpenAI“偷录”YouTube视频训练AI？一百多名创作者决定集体起诉）

　　起诉书还指出，Anthropic的成功是建立在侵权行为之上的。公司预计2024年的收入将超过8.5亿美元，并计划从亚马逊和谷歌等科技巨头那里筹集76亿美元的资金。

　　作者们认为，Claude大模型不仅侵犯了他们的版权，还威胁了写作生计——因为该模型可以轻易生成本应由作家创作并销售的内容。因此，他们要求Anthropic赔偿损失，并永久禁止其继续滥用作者的作品。

　　对此，Anthropic发言人周二表示，公司正在评估诉讼，但考虑到诉讼尚未结束，拒绝进一步置评。

　　Anthropic由OpenAI前员工于2021年创立，当时他们因为担忧AI安全问题而离开OpenAI，而创建Anthropic的目标是构建安全、可靠的AI系统。Claude也是首个承诺“合宪性人工智能”的大模型。

　　Claude今年上线了移动应用，根据移动应用统计公司Appfiguers的最新数据，根据Appfigures最新数据，Claude应用端的收入在16周内突破了100万美元。不过，该应用的下载量仍远低于其主要竞争对手ChatGPT，后者在美国市场的总下载量排名首位。

　　值得注意的是，这并非Anthropic首次卷入版权纠纷。去年10月，环球音乐集团等多家大型音乐出版商起诉Anthropic“盗用”歌词文本来训练Claude。诉讼书指出，无论用户是否故意要求，Claude都能几乎逐字输出受版权保护的歌词。

　　Anthropic曾以多种理由请求法院驳回该诉讼，比如“已经采取了额外的防护措施”；没有实际证据能证明，第三方用户可以让Claude逐字输出歌词副本等。目前该案件还在审理中。

关注同花顺财经（ths518），获取更多机会

0人

《黑神话》出圈国产游戏全球化步伐加快

人形机器人“脑力”“体力”升级

Anthropic被指AI训练侵权，其应用端创收已过百万美元

网站地图