Anthropic被指AI训练侵权,其应用端创收已过百万美元

2024-08-23 14:22:23 来源: 21世纪经济报道

  记者肖潇 实习生 韩佳序 北京报道

  当地时间8月19日,被视为OpenAI头号竞争对手的Anthropic被发起侵权起诉,三位作家指控公司在未经许可的情况下,“窃取”了数十万本书籍用于旗下大模型Claude的训练。

  诉讼书中,作家们将Anthropic的行为形容为“大规模的版权盗窃”,并指责公司“故意下载已知的盗版书籍,制作副本并将其输入大模型中”。

  本月早些时候,Anthropic曾在接受采访时承认,使用了一个名为the Pile的开源数据集来训练其大模型。而作家们现在认为,该数据集可能包含了一个庞大的盗版电子书库,包括斯蒂芬·霍金等作家的作品,也包括本次三位起诉作家——安德里亚·巴茨、查尔斯·格雷伯和柯克·华莱士·约翰逊的书籍。

  the Pile数据集的版权问题,已经让多家AI公司卷入版权战火中。该数据集最初由非营利机构收集,用于学术目的,OpenAI、英伟达、苹果等巨头都曾在研究论文中详细描述如何使用the Pile的数据训练大模型。但就在上个月,the Pile被发现抓取了上万个YouTube视频字幕,而YouTube平台规则明确禁止爬虫抓取。上述明星AI公司因此陷入了偷录YouTube视频的侵权争议中。(详见:OpenAI“偷录”YouTube视频训练AI?一百多名创作者决定集体起诉)

  起诉书还指出,Anthropic的成功是建立在侵权行为之上的。公司预计2024年的收入将超过8.5亿美元,并计划从亚马逊和谷歌等科技巨头那里筹集76亿美元的资金。

  作者们认为,Claude大模型不仅侵犯了他们的版权,还威胁了写作生计——因为该模型可以轻易生成本应由作家创作并销售的内容。因此,他们要求Anthropic赔偿损失,并永久禁止其继续滥用作者的作品。

  对此,Anthropic发言人周二表示,公司正在评估诉讼,但考虑到诉讼尚未结束,拒绝进一步置评。

  Anthropic由OpenAI前员工于2021年创立,当时他们因为担忧AI安全问题而离开OpenAI,而创建Anthropic的目标是构建安全、可靠的AI系统。Claude也是首个承诺“合宪性人工智能”的大模型。

  Claude今年上线了移动应用,根据移动应用统计公司Appfiguers的最新数据,根据Appfigures最新数据,Claude应用端的收入在16周内突破了100万美元。不过,该应用的下载量仍远低于其主要竞争对手ChatGPT,后者在美国市场的总下载量排名首位。

  值得注意的是,这并非Anthropic首次卷入版权纠纷。去年10月,环球音乐集团等多家大型音乐出版商起诉Anthropic“盗用”歌词文本来训练Claude。诉讼书指出,无论用户是否故意要求,Claude都能几乎逐字输出受版权保护的歌词。

  Anthropic曾以多种理由请求法院驳回该诉讼,比如“已经采取了额外的防护措施”;没有实际证据能证明,第三方用户可以让Claude逐字输出歌词副本等。目前该案件还在审理中。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 深圳华强
  • 四川长虹
  • 优博讯
  • 共进股份
  • 中电港
  • 世纪鼎利
  • 常山北明
  • 浩云科技
  • 代码|股票名称 最新 涨跌幅