一文看懂 AIGC 的版权问题

伴随着 AIGC 技术的强势出圈,大家在惊叹 AI 技术强大的同时,也有越来越多的人开始讨论关于由此带来的版权问题:我们通过 AI 生成的图像属于平台还是个人?目前 AI 作品版权在法律上是如何界定的?又该如何避免引起 AI 版权的纠纷?

今天我想和大家聊聊关于当前 AIGC 作品版权的问题,希望能给大家带来一点思考。

一、AI作品的版权如何界定?

目前关于 AI 版权归属问题主要有2 种看法:持保守观点的认为 AIGC 只是从海量数据库中选择元素进行拼接,初始的创意和付出都源自原艺术家,因此版权应该属于数据库中的原作者和开发 AI 技术的平台。而另一种观点认为,在 AI 作品生成过程中创作者也经过调试编辑,通过多次迭代才生成最终图像,所以AI 创作者同样持有作品的版权。

实际情况是怎样的呢?我们再来看看平台方在这方面的规定。根据 Midjourney 在平台规则手册中标注的信息中,明确标注了除非是高收入的公司用户,正常情况下付费会员制作的 AI 图像是拥有完全所有权的,可以自由使用创作的图片。这表明了Midjourney作为开发者方自主放弃了生成图像的所有权。

一文看懂 AIGC 的版权问题

图像来源:Midjourney 服务条款-用户权益

从平台声明来看,似乎创作者可以完全放心的使用 Midjourney 生成的 AI 作品,但是事实真的如此吗?

近期就有 3 位艺术家代表美国加州艺术家群体起诉Stability AI、Midjourney及DeviantArt公司的 AIGC 技术,控诉他们未经原创作家许可,便贸然使用网络上的 50 亿张图像进行 AI 训练。

艺术家 Karla Ortiz 在评论中说到:我很自豪能成为这起集体诉讼的原告之一。我很自豪能与同行一起做这件事,我们将为可能受到影响的数千名艺术家发声。我很自豪在公共领域而且在法庭上为我们的权利而战!

二、AI可能导致的侵权风险

想要真正理解事情的发展缘由,需要了解 AI 绘图创作过程中可能会产生侵权问题的行为,目前主要有 2 个阶段会引起版权争议的问题:分别是模型训练阶段和图像输出阶段。

首先,AI 技术想要发展和提升必须有体量极度庞大的数据库进行模型训练,这个过程中数据库会不可避免的包含很多受版权保护的作品。可能大家对数据在 AI 领域的重要性并不太清楚?可以这么说,数据是一切人工智能的基础。体现在很多行业中,数据都是影响企业竞争的重要壁垒之一,比如特斯拉在自动驾驶领域的数据积累和科大讯飞在智慧教育领域的题库积累等。

以 ChatGPT 为例,根据 OpenAI 公司的透露,他们在训练过程中使用45TB的数据,包含近1万亿个单词,这个数字差不多抵得上牛津词典单词量的 1300 倍。根据麻省理工大学的Pablo Villalobos等6位计算机科学家就预测,到2026年,ChatGPT等大型语言模型的训练就将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。

一文看懂 AIGC 的版权问题

图片来源:OpenAI 官网 ChatGPT训练模型

目前AI模型的数据来源包括以下几类:公共数据集、公共网站、自有数据、众包数据、合成数据等。除了合成数据没有版权争议外,其他数据都是通过采集互联网获得,而合成数据目前还处于初步发展阶段,没办法大规模应用到当前市场中。

比如著名的 AI绘图工具Stable Diffusion,它的模型训练数据源是包含了上亿图像的LAION-5B数据库,该数据库本身并不储存网络图像本体,而是作为各类版权作品的在线索引,在训练模型时需要先将作品下载到本地储存为副本,那这个下载过程本身就包含了对版权作品的使用。

一文看懂 AIGC 的版权问题

图像来源:LAION-5B 官网《开放大规模多模态数据集的新时代》,作者 Romain Beaumont

接着在图像输出阶段, AI 模型会将数据库中的资源进行算法解析,组合生成新的图像。目前 AI生成绘画图像 主要有 3 种方式:图片滤镜、笔触临摹和关键词模态转化。

  1. 图片滤镜:将参考画作和目标图片进行分层比对,并不断的叠加融合,最终得到带有参考画作风格的目标图片。
  2. 笔触临摹:通过算法模拟参考画作的笔触,和真人作画过程类似,将其分解为一系列真实的笔触序列,再组合成新的目标画像。
  3. 关键词模态转化:将文本关键词和数据库中的图像进行关联,组合生成最符合的图像。

但是不管是通过哪种方式生成的 AI 图像,必然会包含数据库中版权作品的部分特征,考虑到最终生成图像和原版权作品的相似性,是有可能对原创作品产生抄袭嫌疑的。

这时候有人可能会说,AI 的训练数据数以亿计,担心最终生成的图像和其中几张相似也太过于杞人忧天了。然而在最新一项以Stable Diffusion等AI扩散生成模型为研究对象的实验中,马里兰大学和纽约大学的联合研究团队指出:利用Stable Diffusion模型生成的内容与数据集作品相似度超过50%的可能性达到了1.88%。此外,考虑到实验中样本量只使用了 1200 万张图片和全世界庞大的用户使用量,AIGC 作品的侵权行为很可能比我们想象中要大得多。(信息来源:腾讯研究院)

去年年底,国外艺术作品平台 ArtStation 上的画师们发起了联合抵制 AI作品的活动,集体在官网打出“NO TO AI GENERATED IMAGES” 的标语。作为职业画师社交网站,它的存在本身就是为了展示绘画创作者的创意和技法,提升自己的行业影响力,但是 AI 作品的出现打破了这种行业平衡。

三、AI侵权行为的判定标准

去年,纽约艺术家 Kashtanova 利用 Midjourney 创作了一份有 18 页组成的漫画书《Zarya of the Dawn》,并在 9 月为此申请了版权。然而到今年 2 月份的时候,美国版权局在了解到 K女士详细的制作过程后进行了回信并进行了详细说明,回信中的内容总结来说就是:由 Midjourney 生成的作品并不由人类直接创作,所以不受版权保护。但是创作过程中的文字、收集的素材、元素排版、整理等工作内容受版权的保护。

在回信中,美国版权局为此还进行了详细说明:首先 AI 生成图像是随机的,整个过程不像传统创作那样完全被创作者掌控。在创作过程中人类只是从AI生成的图像中选择了一个最合适的,期间并没有人类主体创作的过程,虽然最后 K 女士有使用 Phootoshop 进行修正,但是修改的内容太少,也不属于版权保护的范围。此外用来生成图像的关键词本身也不具备版权保护。

在这个案例中我们可以发现目前来看国外官方对于 AI 版权的态度并不是全盘否定的,对于人类参与创作的部分还是保持肯定的。那我国目前在 AI 作品上是如何判定版权的呢?

根据李宗辉老师(南京航空航天大学网络与人工智能法治研究院副院长)刊登在2022年第3期《版权理论与实务》的杂志文章《论人工智能绘画中版权侵权的法律规制》中所述,目前我国版权法采用的是“思想与表达二分法”的基本原则,来作为判断 AI 绘画是否构成侵权的指导依据。

打个比方,前面我们提到 AI 绘画的 3 种方式时,其中对绘画特征的提取、笔触序列的提炼或者作品表达的情感这些还未落实成图像的算法内容,还是属于作品的思想阶段,并不会被判定为归原作者版权所有。但是当实际的图像生成时,如果判断AI 画作是否与某一部作品构成实质性相似适宜采用部分比对法,与多部作品进行判断时则应当采纳整体观感法。而一旦比对结果构成实质性相似,即应被认为构成复制侵权行为。

此外在生成图像的使用用途上,也会检测是否造成侵权。比如是完全商用还是适度饮用,是否会和原作品正常使用造成冲突,有没有损害原作者的合法权益等。

我们综合国内外的解释来看,目前的法律条文对于 AI 作品的版权界定主要停留在对创作者参与创作的比例以及相似度的主观判断上,对于参与多少可以受版权保护、相似度差异达到多少阈值的时候会判定为不侵权等问题还没有非常具体的判断条例。

这种情况也很正常,毕竟 AI 技术的发展过于迅速,当前的法律条文还未来得及覆盖人工智能领域的作品。但是我们作为 AIGC 技术的使用者需要意识到,在未来这段时间内通过 AIGC 生产的内容都存在对其他作品侵权的可能,同时自己的 AI 作品也不受版权保护,随时可能被其他人拿去使用。

不过我们也大可不必忽视 AIGC 的价值,完全抵制 AI 技术带来的生产力革新,我们更应该思考的是如何避免自己的 AI 作品产生侵权风险,以及保障自己作品的合法权益。

四、如何合理使用AIGC

考虑到前面对侵权行为的判定标准,未来我们在使用 AIGC 的过程中可以注意以下几点:在工作中如果需要对 AI 作品商业化,需提前了解AI 工具平台方相关的使用手册或用户协议等文件,明确产出内容的所有权范围和用途,避免后期产生法律纠纷。

此外不要直接的将 AI作品 作为自己的最终成果,而是将 AIGC 技术作为实现目的工具,在其中尽可能增加自己的创作痕迹和想法,比如先用Midjourney 等 AI 工具生成众多风格的效果图,快速验证自己的灵感和产品方向,再以此为参考进行设计。这样既保证了作品的原创比例,同时也是体现设计师作为设计主体的核心价值。

此外,如果想彻底杜绝被原作者举证 AI 创作侵权的可能性,可以提前了解创作AI 模型的采集数据源,在使用参考图创作后标注原作来源或提前获得原作者的授权。

以上是我们作为 AI 技术的使用者需要了解的一些事项。而 AI 技术的开发者和平台方作为 AIGC 的最大受益者,更是需要担负起人工智能侵权行为的主要责任。他们是 AI 技术控制权的主体,应该主动公开说明使用过程中可能产生侵权风险的行为,并对产生侵权行为的算法漏洞及时维护和修补,只有这样才能真正保证 AIGC 技术做到互惠互利,持久发展。

五、总结

以上就是关于 AI 作品版权问题的现状和给大家的一些建议。虽然目前 AI 侵权相关的法律条文还不成熟,需要经过多方考量和求证,但是未来针对 AIGC 作品的具体规范文件出台是大势所趋。我们既要肯定 AIGC 技术带来生产效率上的巨大提升,同时我们也要保证创作者的合法权益,毕竟版权保护的是每一位原创作者的劳动成果和智慧结晶,而不是人工智能本身。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63498.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

集体罢工!超200位Stack Overflow版主怒控ChatGPT将引发「垃圾内容」洪水

视学算法报道 编辑:编辑部 【导读】大反转来了?Stack Overflow「ChatGPT禁令」突然松动,而版主们不得不联名罢工表示抗议,血泪控诉LLM生成的垃圾内容将充斥整个社区。截至发稿前,公开信上已有227位用户签名。&#x…

大模型论文阅读神器来了!5秒翻译67页论文,直接截图提问,网页可试玩

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 就在昨晚,网易有道“子曰”教育大模型正式发布。 这个大模型“不整虚的”,发布即可用——所有人都能玩那种,例如有道翻译桌面端,就已经全部上线了大模型的AI Box功能。 这其中比较有意思的…

2023最新ChatGPT商业运营版网站源码+支持ChatGPT4.0+GPT联网+支持ai绘画(Midjourney)+支持Mind思维导图生成

本系统使用Nestjs和Vue3框架技术,持续集成AI能力到本系统! 支持GPT3模型、GPT4模型Midjourney专业绘画(全自定义调参)、Midjourney以图生图、Dall-E2绘画Mind思维导图生成应用工作台(Prompt)AI绘画广场自定…

GPT提示词系统学习-第二课-使用GPT帮你“填表格”

开篇 前面我们说到了GPT的提示词使用的好不好对你可以得到精准的答案是至关重要的。今天我们来看看,GPT中如何使用提示词来帮助我们填一个表格。 参照样本让GPT制作可填表格 请阅读以下销售邮件。删除任何可用于识别个人身份的信息 (PII),并用相应的占位符替换它。 例如,…

2001-2020年沪深A股上市公司管理者短视主义指标数据

2001-2020年沪深A股上市公司管理者短视主义指标数据 1、时间:2001-2020年 2、包括所有沪深A股所有上市公司 3、指标包括: 证券代码:以上海证券交易所和深圳证券交易所公布的证券代码为准。 证券简称:以上海证券交易所和深圳证…

【毕业设计】大数据股票分析与预测系统 - python LSTM

文章目录 0 前言1 课题意义1.1 股票预测主流方法 2 什么是LSTM2.1 循环神经网络2.1 LSTM诞生 2 如何用LSTM做股票预测2.1 算法构建流程2.2 部分代码 3 实现效果3.1 数据3.2 预测结果3.2.1 项目运行展示3.2.2 开发环境3.2.3 数据获取 4 最后 0 前言 🔥 Hi&#xff0…

pytorch_LSTM预测股票行情

7.8 用LSTM预测股票行情 7.8.1 导入数据 # Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程 import tushare as ts cons ts.get_apis()#获取沪深指数(000300)的信息,包括交易日期(…

如何评估券商分析师预测股票涨跌的准确性?

上篇我们已经讲过如何从新浪财经上获取券商分析师的评级数据, 那么我们接下来就可以来分析哪些分析师推的股票比较靠谱哪些分析推荐的股票比较拉跨?(注:后来有对分析师收益率排名,如有同名分析师看到,纯属…

python应用(3)svm模型预测股票涨跌

最近接了一个私活,指导学妹完成毕业设计。核心思想就是利用SVM模型来预测股票涨跌,并完成策略构建,自动化选择最优秀的股票进行资产配置。 在做这个项目的过程中,我体会到想成为一个合格的数据分析或者数据挖掘工程师不仅技术要过…

利用随机森林预测股票大盘涨跌

本文仅从实战角度去观察,利用机器学习算法中,随机森林模型预测股票市场指数涨跌的准确率。 适合入门玩家 首先,我们导入所需要的模块 import numpy as np import pandas as pd import talib as ta #金融数据计算 import datetime,pickle …

随机森林——股票涨跌预测模型搭建

多因子模型搭建 1.引入之后需要用到的库 import tushare as ts # 股票基本数据相关库 import numpy as np # 科学计算相关库 import pandas as pd # 科学计算相关库 import talib # 股票衍生变量数据相关库 import matplotlib.pyplot as plt # 引入绘图相关库 from sk…

案例分析:股票涨跌预测

目标和背景 采用逻辑回归方法,使用过去 5 天的收益率 X 来预测未来一天的涨跌 Y, 并依据涨跌概率大小来构建多空投资组合。 解决方案和程序 拟合模型:将其中 450 天数据作为训练样本,拟合一个逻辑回归模型,得 到参数估…

股票预测pythonlstm_LSTM预测股票涨跌--结合技术分析视角(一)

LSTM处理股票数据的一般流程: image.png 2.在先工作的基本思路: (1).为利用沪深300前100天的收盘价预测下一天的收盘价。从结果来看,LSTM对未来20天的预测基本上是对过去100天收盘价变化的趋势的总括,因此最终的预测结果以及回测结果都不是很理想。 之后尝试增加了feature…

基于长短期记忆网络(LSTM)对股票价格的涨跌幅度进行预测

完整代码:https://download.csdn.net/download/qq_38735017/87536579 为对股票价格的涨跌幅度进行预测,本文使用了基于长短期记忆网络(LSTM)的方法。根据股票涨跌幅问题, 通过对股票信息作多值量化分类,将股票预测转化成一个多维函…

R语言逻辑回归Logistic回归分析预测股票涨跌

最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出。 视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例 ,时长06:48 本文回…

预测股票涨跌看什么指标,如何预测明天股票走势

通达信精准预测股价主图指标公式 是不是可以去了未来 如何用公式将当日股票上涨幅度在M-N之间的股票当天及前几天的行情统计出来。 70 如何知道或者预测一个股票次日的开盘价? 。 在短线操作中,对目标个股次日的买入卖出价的测算是很重要的&#xff…

基于支持向量机SVM的沪深300股票预测股票涨跌方向

结果参考:https://www.bilibili.com/video/BV1nY411z7Kk/?spm_id_from=333.999.0.0 附完整代码+数据

以预测股票涨跌案例入门基于SVM的机器学习

SVM是Support Vector Machine的缩写,中文叫支持向量机,通过它可以对样本数据进行分类。以股票为例,SVM能根据若干特征样本数据,把待预测的目标结果划分成“涨”和”跌”两种,从而实现预测股票涨跌的效果。 1 通过简单…

GPT2中文新闻标题生成

向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 项目描述 本项目是一个带有超级详细中文注释的基于GPT2模型的新闻标题生成项目。本项目参考了GPT2-Chinese、GPT2-chitchat、CDial-GPT、GPT2等多个GPT…