版权商准备和微软、谷歌、OpenAI打官司！训练AI模型，也得付钱？

2023/03/23 10:12

“我们的内容有价值，是真正的人类辛苦劳动的成果，却不断被用来为其他人创造收入，我们必须得到补偿。”

AI聊天机器人凭借其出色的能力，成为环球市场的焦点，让互联网公司之间掀起了新一轮“军备竞赛”。

但是，用于训练人工智能的数据，如新闻、书籍等，许多都是有版权归属的，AI公司该为使用这些内容付费吗？

据媒体报道，近期，出版行业的高管，已经开始审查其内容在多大程度上被用于“训练”ChatGPT等AI聊天机器人，应该如何获得补偿，以及如何从法律上采取行动。

新闻媒体联盟 (News Media Alliance) 执行副总裁兼总法律顾问Danielle Coffey表示：

“我们的内容有价值，是真正的人类辛苦劳动的成果，却不断被用来为其他人创造收入，我们必须得到补偿。”

据知情人士向媒体透露，美国内容社区Reddit已经与微软就其内容在AI训练中的使用进行了商议。

此外，拥有《华尔街日报》、《纽约邮报》、《巴伦周刊》等媒体的美国新闻集团也正计划采取行动。

首席执行官Robert Thomson在最近的一次投资者会议上表示，他已经“开始与某一方进行讨论。”

Robert Thomson认为：

“很明显，他们在使用独家内容——我们肯定该得到一些补偿。”

除了出版商，图片作品的版权方也在向AIGC公司讨要授权费。今年2月，在线图库Getty Images已起诉AIGC领域独角兽Stability AI，称其侵犯了Getty Images的版权。

AI公司是否有权从互联网上抓取内容，并把这些数据输入他们的训练模型，是一项模糊不明的法律问题。

在中国、美国、日本、欧盟等地的法律中，均有“合理使用”条款，允许个人、公司在某些情况下未经许可使用受版权保护的材料。

许多AI公司也援引这一条款为自己申辩，但出版商则认为，大量使用受版权保护的内容训练AI，是对这一特许权利的滥用。

并且，人工智能工具可能会让他们的网站上损失流量和广告收入。在搜索引擎时代，用户还需要点进网页找资料，但现在，大部分时候，搭载GPT-4引擎的Bing都能直接帮你生成答案，几乎不需要再查阅网页。

此前，OpenAI首席执行官Sam Altman在谈到版权问题时表示，ChatGPT是根据两年前的数据进行训练的。他还表示，OpenAI也在积极和内容公司合作，获得授权，表示公司愿意为特定领域的高质量数据支付高价。

比如，去年，OpenAI与在线图库Shutterstock达成了协议，Shutterstock给OpenAI提供数据，OpenAI给Shutterstock提供技术。与此同时，Shutterstock还设立了一个基金，那些作品被用于AI训练的艺术家提供补偿。

现在的问题是，AI工具仍处于进入商业应用的早期，如果真的要让AI公司为大规模复制作品支付许可费用，在实践中也很难完成。对版权问题，整个行业还没有形成固定的准则。

我们此前提到，设计软件公司Adobe是解决AI版权问题的先行者。它在最近推出新工具"Firefly" (萤火虫) ，致力于让AI生成作品安全地商用，同时让艺术家自主选择，要不要把作品交给AI训练。Adobe希望能塑造行业的新标准，但这一切，都需要时间。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。