科技魔方

作家联合控告 Meta、微软和彭博的 Llama 2、BloombergGPT 模型侵犯版权

大模型

2023年10月20日

  包括前阿肯色州州长 Mike Huckabee 和畅销的基督教作家 Lysa TerKeurst 在内的一组作家已在纽约联邦法院提起诉讼,指控 Meta、微软和彭博在未经许可的情况下使用他们的作品来训练人工智能系统。

  这起拟议中的集体诉讼于周二提起,指称这些公司使用了备受争议的「Books3」数据集,作家们称其中包含数千本盗版书,用于教导他们的大型语言模型如何回应人类提示。

  诉讼还指控人工智能研究组织 EleutherAI 侵犯版权,据称该组织提供了用于训练这些公司系统的数据,其中包括 Books3。

  彭博发言人周三表示,该公司没有使用 Books3 来训练其大型语言模型 BloombergGPT 的商业版本,尽管它使用了该数据集来训练其研究模型。

  微软的发言人拒绝置评,而 Meta 的代表没有立即回应有关诉讼的请求。

  作家的律师在周三的一份声明中表示:「太多公司一直在通过一切手段推进人工智能系统和大型语言模型的发展,包括窃取我们作者的书籍。我们不反对创新,我们反对创新背后的窃取行为。」

  近期,包括视觉艺术家和其他作家在内的版权持有者还对大型科技公司未经授权使用其内容来训练生成式人工智能系统提起了诉讼。人工智能公司辩称,他们对数据的使用受到美国版权法中的公平使用原则的保护。

  许多作者的诉讼都集中在 Books3 上,据称该数据集包含从非法互联网「影子图书馆」中获取的数千本书的文本。Huckabee、TerKeurst 以及作家 David Kinnaman、Tsh Oxenreider 和 John Blase 告诉法庭,他们的书是该数据集的一部分,被滥用来训练 Meta 的 Llama 2 大型语言模型,该模型是与微软合作开发的,以及 BloombergGPT。

  这些作者表示,这些公司从他们的书中「非法获取了大量价值」。他们要求法庭给予他们未经许可使用他们的作品的金钱赔偿,并下令制止对他们作品的滥用。

+1

来源:站长之家

延展资讯