山东大学学报
本文拟刊发于《山东大学学报(哲学社会科学版)》2023年第4期,已在中国知网网络首发,欢迎转发与转载!转载请注明来源!
作者:丛立先,华东政法大学知识产权学院教授,法学博士;李泳霖,华东政法大学知识产权学院博士研究生。
摘要
经过长期且广泛讨论,主流观点认为人工智能是人类创作作品的工具,并应当从客观结果上判断其生成内容是否构成作品,该观点也被司法裁判采纳。未来研究的重点应是,以ChatGPT为代表的生成式AI的作品认定与版权归属的特殊性问题。生成式AI作品版权的数字化、强需求性和高生成效率三大特点,要求我们在尊重作品版权私权性的同时,对其挖掘文本与数据的行为以及对其生成作品的使用,持更为开放的态度。为适应生成式AI产业需求和未来应用场景,可以在既有版权规则基础上探索建立版权共享模式。同时,在版权归属上,注重作品创作的实质性智力投入并侧重投资激励,扩大合作作品的适用空间。
【关键词】
生成式AI;作品认定;版权归属
虽然人工智能生成内容的作品认定与版权归属问题由来已久,但ChatGPT(全称Chat Generative Pre-trained Transformer)作为人工智能发展阶段里程碑式的应用场景,为这两个问题赋予了新的讨论意义。ChatGPT在GPT-3.5语言模型的加持下,已经能够进行文字翻译、文案撰写以及代码撰写等工作,GPT-4.0模型的问世不仅保留了GPT-3.5的文字创作功能,而且可以根据指令生成美术和音乐等多种类型作品,不难预见,其将在金融、法律、教育等行业开辟出广阔的发展前景。微软公司联合创始人比尔·盖茨甚至直言,ChatGPT是他一生中遇到的两项革命性技术之一。但技术的发展总与风险相伴。ChatGPT因其在算法、算力和数据领域的巨大优势引发了有关信息、数据与知识产权问题的讨论,著名语言学家乔姆斯基甚至认为ChatGPT是高科技剽窃。而且,随着ChatGPT、文心一言等生成式AI应用领域的扩大,不难预见,既有的版权制度与生成式AI产业发展需求之间的碰撞还会愈发激烈。
笔者认为,一切制度的建立均由其所属的时代规定。在生成式AI多元耦合的学习与应用背景下,对其生成内容的作品认定与版权归属这两个问题的解决,应当以“开放”为作品保护的基本态度,以“知识共享”为作品使用的基本模式,以“投资激励”为版权归属的中心策略,建立起“投资—机器学习—作品生成—再投资”的版权创造正向循环,并依托国内国际双循环的总体政策安排,适度打通国内国外的机器学习资源,推动生成式AI版权产业的迭代创新。
一、生成式AI的作品认定
当前阶段的生成式AI在本质上仍是人类创作作品的工具,在不构成版权例外等特殊情况,且满足作品构成条件下,应认定其生成内容构成作品。而对于其文本与数据的挖掘需求,则应从版权规则完善的角度提供合规出路。
(一)生成式AI作品形成中的特殊工具属性
人类从必然王国迈向自由王国的必要条件是生产力的高度发展。社会发展史表明,社会生产力的每一步发展,都离不开生产工具的进步。人类从最初使用石块、树枝等作为生产工具,到工业社会直接操作机器生产,人类的生产关系不断发生变革。经济基础是社会生产关系的总和,上层建筑由经济基础决定,版权法作为上层建筑的组成部分,其发展样态和现状同样与印刷机技术、声光电传播技术以及互联网传播技术相呼应。美国版权作品新技术应用国家委员会在报告中,将计算机同照相机、打印机以及其他创作工具对比,认为照片的作者是使用照相机的人,计算机“创作作品”的作者就是这些使用计算机的人。所谓计算机“创作作品”,是指利用信息技术在计算机上创作并在显示屏上显示,或者以其他拷贝形式存在的作品,其中计算机程序是被动性协助创作的工具。生成式AI正是计算机技术在内容生成领域的最新应用成果,其凭借强大的存储能力和算力弥补了人类在信息记忆等方面的短板,并帮助人类生成所需要的内容。正如ChatGPT自己所承认,作为一个语言模型,其主要目的是协助用户获取和创建信息,为用户提供有价值的帮助。因此,生成式AI是人类创作作品的工具,本质上与纸笔、树枝等工具无异,生成式AI的作品也就是人利用技术工具创作形成的作品。
有观点认为,ChatGPT生成的作品并非人的创作成果,人工智能也不可能受到版权法的激励。因此,人工智能生成的内容不可能属于受版权法保护的作品。但笔者认为,以ChatGPT生成的作品为代表的生成式AI作品就是人的智力成果。ChatGPT与此前传统人工智能的主要区别之一,在于其经历了基于人类反馈强化学习(RLHF)的训练,在RLHF的训练过程中,ChatGPT为每一个prompt生成多个输出,标注者将这些输出从最佳到最差进行排序,从而建立一个新的标签数据集。这些新数据用于训练奖励模型,并根据该模型调整输出结果。这就使得ChatGPT生成的内容融入了人类的主观偏好,属于人类的智力成果。在美国版权局发布的公告中,也并未否认人类作者利用计算机或者其他设备作为辅助工具而生成的内容构成作品。另外,生成式AI作为人类的工具,可以帮助人类节约大量的时间和精力来创造更高质量的作品,反而有利于激励人类创作。
(二)生成式AI作品形成中的版权合规
生成式AI本质上作为自然语言模型需要学习在先的文本与数据,这些文本与数据可以分为三类:第一类是他人的思想。不过版权法仅保护表达,而不保护思想、工艺、操作方法或数学概念等类似内容。所以,如果生成式AI的作品与某位著名教授观点相同,但表达不同,则并未侵犯该教授的版权。第二类是已经超过保护期、进入公有领域的作品。这类作品虽然不受著作财产权保护,但受著作人身权保护。例如,如果生成式AI在作品中使用了鲁迅(1881-1936)创作的作品,此时虽然无须获得授权,但不得侵犯原作者的署名权等人身权。第三类是仍处于保护期内的作品,这类作品的版权保护程度最高,不仅要保护其作者的著作人身权,还应当保护其作者的著作财产权。例如,在不构成合理使用与法定许可等例外情况下,如果使用者通过信息网络传播他人的作品,则必须经过版权人的许可。然而,对于这类作品的使用很难符合我国当前合理使用与法定许可规则的要求。首先,生成式AI挖掘数据与文本的过程涉及复制行为。挖掘数据的过程一般包括信息抽取、语义分析、关系计算及知识发现四个步骤。无论是将这些数据读入系统还是进行格式转换和数据分析,均涉及受版权人控制的复制行为。其次,还可能涉及改编行为。生成式AI在原样复制被挖掘数据的同时,还需要对目标文本进行识别和转码。转码行为是改变、编排目标对象的表达形式,从而形成新的研究样本,这就还可能落入改编权的控制范畴。再次,现有的合理使用与法定许可规则很难适用于生成式AI作品的生成过程。最后,传统的作品授权许可模式难以落地实施。生成式AI为了生成作品,需要使用数量庞大且权属复杂的在先作品,如果坚持原有的授权许可模式,则不仅要准确识别每部作品的权利人,而且还要一一获得授权。但生成式AI数据训练对作品数量的需求,远远超出著作权集体管理组织所能调控与规制的范畴,集体管理组织制度同样面临适用的失灵。在这种情况下,如果坚持我国《著作权法》的既定规则,则可能产生两种情况:第一是人工智能研发者放弃生成式AI领域,转向其他行业。第二是坚持生成式AI领域,但使用免费数据进行训练。第一种情况可能阻碍人工智能技术和产业的发展,与科技进步规律相违背。第二种情况可能因训练数据的不足而引发算法模型偏见等不良后果。因此,无论是从激励作品创作的角度,还是保护产业发展的角度,都应该为生成式AI学习作品提供版权合规出路。然而,尽管现有研究对于文本与数据挖掘例外进行了一定探索,但存在将主体限制在非营利性机构,或将目的限制在非商业科学研究,且不得将挖掘结果作商业用途的要求。笔者认为,这仍是在“重保护轻共享”这一传统版权保护模式下的探索,尚未对生成式AI的商业模式予以足够重视。长此以往,会更加固化我国在国际知识产权领域跟随者与接受者的角色模式。因此,更为可行的做法是,在文本与数据挖掘例外中不排除商事主体和商业使用目的,同时也针对生成式AI作品建立起相应的使用例外,具体内容将在下文阐述。
(三)生成式AI作品认定中的结果主义标准
财产法只关注财产形态是否符合法律的要求,而不必追问财产的来源。只要客观上作品的表达并非“必然如此”,就具备独创性,无论作品通过何种方式得来。主张生成式AI无法生成作品的历史主义观以中文屋测试为哲学基础,并通过中文屋测试指出,机器的形式转换能力并不是理解力,只要程序是根据由纯形式定义的元素进行计算操作来定义的,就表明了这些操作本身同理解没有任何意义的联系。然而,一方面,尽管生成式AI作品的生成过程有算法参与,但版权法并不否认算法的版权地位。相反,某些网络平台因使用算法被要求承担版权侵权责任的案例,至少说明算法具有版权法地位。既然算法的被动应用被赋予了版权法地位,那么作品生成过程中的算法也应当具备版权法上的意义。另一方面,人类不是为生成式AI仅提供了运行规则才让运行程序产生了相应的结果,而是还在RLHF模型的训练中融入了人类的主观色彩。也就是说,中文屋测试当前已经面临了巨大的现实挑战,即人工智能不再是一种纯粹的运算,而是已经融入了人类的主观价值标准。在“腾讯诉盈讯”案中,法院就正确认定了人工智能生成的内容构成作品。在该案中,盈讯科技未经许可,在其运营网站中发布了腾讯机器人Dreamwriter自动撰写的文章《午评:沪指小幅上涨0.11%报2671.93点 通信运营、石油开采等板块领涨》。法院认为,从涉案文章的外在表现形式与生成过程来分析,该文章的特定表现形式及其源于创作者个性化的选择与安排,并由Dreamwriter软件在技术上“生成”的创作过程,均满足《著作权法》对文字作品的保护条件,进而认定涉案文章属于我国《著作权法》所保护的文字作品。可见,在该案中,法院从外在表现形式认定人工智能撰写的文章构成作品。因此,如果生成式AI作品在形式上与没有生成式AI参与下人类创作的作品完全一致,以至于如果该作品是人类创作完成,则毫无疑问可以被授予版权时,那么人工智能作品完全可以满足独创性的要求,并在同时满足作品的其他构成条件下构成作品。
而且,当前ChatGPT的语言模型已经从GPT-3.5进化到了GPT-4,这将为内容生成提供多模态模型,例如影片和音乐等。按此发展下去,不难预见,以ChatGPT为代表的生成式AI将创造更多类型的作品,甚至在特殊条件下还可能生成现有作品类型以外的作品。
(四)生成式AI作品版权保护的例外
人工智能生成的内容具有可版权性,但并非人工智能创作的所有具有独创性和可复制性的内容都是版权法上的作品,构成版权法的例外情况在这里仍然适用:人工智能生成的单纯事实消息、历法、通用数表、通用表格和公式,以及人工智能生成的唯一性的独创性思想表达,不能成为版权法保护的作品。“单纯事实消息”是我国《著作权法》第3次修改后新增加的内容,修改前的表述为“时事新闻”。之所以修改了表述,是因为“时事新闻”这一表述容易产生歧义,很多时事新闻并非对客观事实的单纯记录,而是经过了记者、编辑等主体的独创性加工,甚至构成文字作品,对于构成文字作品的内容当然在版权法的保护范围内。判断是否构成时事新闻的关键在于对单纯事实消息的认定。《伯尔尼公约》第2条第8项规定:本公约所提供的保护不得适用于日常新闻或纯报刊消息性质的社会新闻。《伯尔尼公约指南》对这一规定的解释为:公约之所以不保护纯粹消息或繁杂事实,也不保护对这些消息或事实的单纯报道,是因为这些材料不具备可以被称为作品的必要条件。另外,如果新闻报道者和记者在报道或评论新闻时所用的表达方式具有充分的智力努力,则可以作为文学艺术作品受版权法保护。受此影响,《著作权法》第三次修改时直接将“时事新闻”修改为“单纯事实消息”,增加了语义的透明度。所以,生成式AI如果仅仅对客观事实进行了记录,那么其生成内容不在版权法的保护范围内。但如果在文章中对事实进行了整理、加工和评论,则应当属于新闻作品而非单纯事实消息。与此同时,唯一表达虽然不属于思想范畴,但之所以不能受到版权法保护,是因为一旦将唯一表达赋予版权保护,那么所有这一领域的创作者都必须获得在先作者的授权,这将极大限制特定领域作品的创造。例如,基于人工智能计算出的竞技类的唯一最优路径结果,就应该成为唯一表达的例外而不能得到版权保护,像AlphaGo形成的竞技棋谱就是这种例证。
二、生成式AI作品的版权内容
基于生成式AI作品版权的数字化、强需求和高生成效率等特点,一方面,仅为生成式AI的作品提供部分著作人身权保护即可。另一方面,要探索建立著作财产权的开放共享模式,形成版权创新链的融通开放。
(一)生成式AI作品版权的特殊价值属性
在数字时代,数字技术的加持使得内容创作者和消费者之间的界限越来越模糊。这使得内容的消费者可以对内容进行再加工和再传播,换句话说,消费者也变成了创作者。近几年,短视频和公众号等传播内容和形式的出现,将专业生成内容(PGC)成功推向了用户生成内容(UGC),主流创作者的圈子之外出现了越来越庞大的业余创作者群体。而以ChatGPT为代表的生成式AI将UGC模式开始推向人工智能生成内容(AIGC)模式,进入了“只要能打字就能创作”的时代。
生成式AI作品的生成过程看似简单,但实际发挥的作用和潜在的版权价值却不容小觑。从PGC到UGC,再到AIGC,作品创作呈现从专业化到普遍化再到数字化的趋势,生成内容的数量不仅呈指数级增长,而且类型和风格也更加包容和多元。相较于生成式AI,自然人个体受学习能力的限制,即使穷尽一生也不可能学习完所有领域的知识,遑论成为全知全能的集大成者。但事物发展遵循从量变到质变的规律,缺少量的积累难以实现质的超越。而以ChatGPT为代表的生成式AI,恰好可以凭借其海量的信息存储、低成本传播和精确复制在极大程度上解放人类的生产力,帮助人类节约更多时间和精力用于立意、风格、构思等各方面的创新。从这个意义上说,生成式AI的作品可以解放人类的低价值重复劳动,赋予普通用户更多的创作自由,并帮助人类开拓难度更大且更具价值的领域,符合全社会对生成式AI迭代进步的期待。据报道,ChatGPT的用户量已经破亿,未来还将持续增长。此外,ChatGPT还能凭借其庞大的芯片数量实现高效率创作。而且GPT-4模型应用后,ChatGPT不仅可以生成文字作品,还能够生成美术作品、视听作品等多种类型的作品,甚至可能随着升级迭代生成有名作品以外的其他作品。在强大的芯片支撑下,生成式AI可以大大缩短人类创作相同或类似作品的时间,提高创作效率。因此,赋予生成式AI作品以版权保护,有利于满足人工智能产业本身的发展需求。
不过,生成式AI作品终归不是人独立创作的作品。尽管其并非有学者所认为的文字工业品,但如果对生成式AI的海量作品全部赋予财产权保护,那么作品的使用数量越大,使用者需要获得授权的负担越重。并且事实表明,在传统版权框架下一一获得授权的模式已经行不通。对于某些特殊作品,由于其权利归属较为复杂,获得其使用授权的难度还会继续提升。与此同时,对于著作人身权的保护也应当以具备保护的现实可能性和需要为前提。例如,如果用户基于作品创作的需求必须对作品加以修改,那么此时没有必要为生成式AI的作品赋予修改权保护。
(二)生成式AI作品版权的私权性与开放性
生成式AI作品作为民事权利的客体,享有版权这一私权保护既符合《民法典》的规定,也是版权规则的既定要求。从保护私权的视角出发,任何人如果想使用生成式AI作品,除了符合合理使用、法定许可等特殊规则外,都应当获得权利人的授权。然而,语言模型的知识产权问题是一个较为复杂的伦理和法律问题,需要在保护创作者权益和鼓励知识传播之间找到平衡。一方面,版权过强保护会降低版权产品的社会传播,威胁到人们的社会实践。在互联网时代,信息网络技术的出现逐步动摇了版权法既有的利益平衡格局,版权法对大量可能的网络侵权束手无策。据报道,美国超过八成的大学生在使用ChatGPT写作业,2023年1月每天使用ChatGPT的独立用户超过千万,当前ChatGPT的用户已经突破1亿。这些用户是否实施了版权侵权行为难以受到监管更难以被控制和追责。另一方面,将印刷技术条件下形成的版权规则套用于网络传播又可能阻碍公众的创作表达自由。当前,创作者、使用者、消费者、竞争者全被纳入了日益严苛的知识产权管制网络,新技术发展在某种程度上瓦解了知识产权内在的平衡原则,从对国家一小部分创造力实施一小部分管制,转变为对所有创意程序所进行的大规模管制,后现代主义者甚至宣告版权之死。不难预见,随着ChatGPT为代表的生成式AI的更新迭代,坚持绝对的私权保护模式必将使权利人面临巨大的成本负担,全面的控制甚至会损毁因特网的创新。
信息天然就具有经济价值和自由流动的双重属性。尽管信息的生产需要耗费一定成本,同时也具有一定的稀缺性,但信息天生是非竞争性的。在版权领域,为实现作者和公众之间的平衡,允许生成式AI开放使用已存在的作品,同时允许社会公众在一定程度上共享生成式AI的作品,是AIGC可持续发展的必然需求。知识共享以开放存取为主要模式。开放存取伴随1665年英国《伦敦皇家哲学会刊》的问世而出现,在生成式AI产生以前,对于版权开放获取的讨论,大多集中在运用版权政策谋求学术出版与学术信息交流中利益关系的平衡。不过在数字时代,版权开放的要求已不仅仅是纸质媒介与数字媒介之间的开放,而是延伸到了数字媒介内部本身的开放。例如,用户在百度百科上共同编辑和免费浏览词条内容,就属于相对固化的版权开放模式的代表。由于开放的数据和文本是生成式AI的作品之母,也即生成式AI无法避免使用他人的在先作品,但每个人同时又都是生成式AI作品的潜在受益者。因此,对其施以版权保护应当以有利于传播为宗旨,只有多元化的知识创新激励制度体系,才能适应信息时代激励知识创新的需要。此前有学者提出,可以用公共基金支付报酬的制度替代现行著作权体制,而公共保存和类似于美国《医疗创新奖励法案》的“奖赏作者”计划,就是上述方案的变种。笔者认为,对于生成式AI作品,知识共享模式是知识产权制度的替代或补充,并可以借助知识产权法律规范存在于现有制度体系之内。如果说,在人工智能尚不发达的初期,还有学者认为开放获取仅存在于法律制度之外的伦理层面,那么如今有必要重新考虑这一安排,并将知识开放模式作为互联网时代版权法发展的一种可能模式,通过弥补既有知识产权制度的不足,使其针对不同产业形态都能发挥激励创新功能。
(三)生成式AI作品的具体版权内容
面对数字技术的进步,立法者应当分析版权法,以继续维持接近作品和创作作品的经济激励之间的平衡。在具体的版权内容上,我国《著作权法》为版权人设立了16项有名权利和1项兜底权利。在多媒体时代,笔者认为不能沿用过去单一处理方式,而是不得不处于双轨化形态,将现有作品按照是否有生成式AI的参与分成两类,并通过打标签等方式加以区分。第一类是与生成式AI无关的作品,例如,作家莫言(1955-)的作品《生死疲劳》仍受到现有版权规则的保护。第二类则是在生成式AI的辅助下生成的作品。对于第二类作品,在制度上的具体做法是淡化版权的私权性,使版权制度内部向着双轨化发展。在著作人身权上,《著作权法》规定了发表权、署名权、修改权和保护作品完整权。其中,除了署名权和保护作品完整权,剩下两项著作人身权无必要赋予版权人。发表权是决定作品是否公之于众的权利,修改权是修改或者授权他人修改作品的权利。在没有生成式AI参与创作的时代,自然人创作作品往往需要花费相对更多的时间和精力,有些作品虽然已经完成,但作者还需要反复打磨完善才能发表公开,否则一经公开便难以再次修改。修改权也是如此,如果未经作者许可修改了其创作的作品,则可能使大众误认为修改后的内容是作者本意,给原作者带来不必要的心理负担。然而,当前阶段的生成式AI作品一经完成,在没有人类重新发出修改等指令的情况下,生成式AI不会自动修改作品。而且,目前尚未出现生成式AI或者生成式AI的开发者与训练者拒绝将作品公之于众的情况。相反,生成式AI的作品只有在传播中才更具价值。与此同时,当前阶段的生成式AI还仍然是人类创作作品的工具,人类创作者在生成式AI作品的基础上加以修改完善是创作的通常做法。并且,即使为生成式AI作品提供发表权与修改权的保护,也难以实现对这两项权利的控制。著作人身权中的署名权和保护作品完整权则不然。无论生成式AI的作品归属于哪一主体,这些主体要么付出了相当程度的智力劳动,要么付出了巨大的经济成本。对相关主体彰显作者之名是对作者智力或开发者经济投入的表彰,能够起到激励更高质量创作和更多投资的积极效果。保护作品完整权是保护作品不受歪曲、篡改的权利。生成式AI虽然自己还不具备人类一样的主观感受,但毕竟是在人类工程师的训练下才具备了当前的能力,而且人类利用生成式AI作为辅助工具所创作的内容,也融入了人类的选择、安排、取舍和加工,与人类创作者的人格相联系。如果允许歪曲和篡改生成式AI的作品,极有可能降低该作品的公信力。因此,在著作人身权上仅为生成式AI提供署名权和保护作品完整权的保护,是更为务实的做法。在著作财产权上,任何一项财产权都可能弱化数字网络环境下的作品传播,而且以出租权为代表的权利的适用空间越来越小甚至趋近于零。因此,笔者认为,较为可行的做法是,通过前期的政策引导,利用合同改变原有的版权利益实现机制。在社会公众逐渐适应版权开放的使用模式后,通过立法对版权开放的使用模式加以确认。需要说明的是,版权开放模式并非颠覆性创设法律规则,而是对既有的规则作出适应性调整。例如,在《我的世界》这款游戏中,为了解决因用户创作产生的版权纠纷,游戏提供者要求所有用户按照“知识共享”协议中的“署名—非商业性使用—相同方式分享”3.0版(CC BY-NC-SA 3.0)部分的要求,放弃主张因创作产生的版权。笔者在本文的版权合规部分,提出了为机器的文本与数据挖掘建立不排除商事主体和以商业使用为目的的版权保护例外,这两项例外同样适用于社会公众对生成式AI作品的使用。这是因为,作品的版权保护虽然依旧重要,但人们对于使用作品的需求更为迫切,重保护轻共享的版权理念只会加剧数据孤岛效应。不过需要注意的是,无论是文本与数据挖掘的学习阶段,还是作品的使用阶段,被学习与共享使用的作品范围应区分对待。对于涉及国家秘密的作品应禁止学习与共享,涉及商业秘密和个人隐私等敏感内容的作品也须经权利人同意才能学习与共享。
三、生成式AI作品的版权归属
明确各主体之间的版权归属是促进生成式AI作品有序使用的前提。版权归属应在坚持实质贡献、投资激励和利益平衡三大基本原则的基础上,立足版权作品生成过程中各主体的重要影响,并充分重视合作作品的成立可能性。
(一)生成式AI作品版权归属的基本原则
实质贡献原则是确立版权归属的首要原则。美国法院在Burrow-Giles Lithographic Co. v. Sarony案中,提出了“如果不是”的规则。在生成式AI的作品生成过程中,如果没有人类的参与,那么生成式AI本身不可能自动、独立生成作品。因此,尊重作者权利并视其为一种基本人权的观念是版权制度建立的基石。作品作为智力成果的产物,无论是否兼顾投资者利益保护和创作激励的政策,都应当以人的智力投入作为作品生成的实质贡献。换言之,在没有生成式AI的辅助下,作品的创作无非是在创作效率等方面受到一定影响,但人终归还是能创作出作品。但是,如果仅摆放了冷冰冰的机器,而没有人的参与,当前阶段机器的存储空间再大、算力再强,都不可能自动生成作品。在我国台湾地区,知识产权被称作“智慧财产权”就充分凸显了作品作为财产保护的独特之处。作者用自己的劳动创作了作品,当然拥有作品中的自然权利。
虽然版权法授予的专有权并非建立在作品的商业化基础之上,但版权在鼓励作者对其作品享有权利的同时,允许投资者从作品商业化中获得现实的利润是刺激投资的经济动因。经济理性人假设认为,每个人都试图从与经济有关的活动中获得经济利益。传统作品的创作方式往往无须大量资金投入,也不必须依赖技术的加持。然而,资金是ChatGPT的生命之源。美国市场研究机构TrendForce在2023年3月1日的报告中测算称,处理1800亿参数的GPT-3.5大模型需要的GPU芯片数量高达2万枚。未来GPT大模型商业化所需的GPU芯片数量甚至超过3万枚。对生成式AI运营厂商来说,AI算力和大模型需要面临高昂的硬件采购成本、模型训练成本以及日常运营成本。如果让个人投入巨额资金并承担投资风险并不现实。在1903年美国最高法院裁判的Bleistein v. Donaldson Lithographing Co.案中,法人和其他组织被视为作者也首次得到了司法承认。因此,在确保为作品创作付出了实质性智力投入的自然人享有版权法保护的同时,还应当以促进产业发展为目标保护投资,激励更多的高质量版权创造。从这个意义上说,对作者的报酬甚至是第二位的。此外,赋予投资者以版权保护可以促使更多投资者投入生成式AI的研发活动,或者投入更多的资金支持研发,进而有利于实现社会总体福利最大化目标。
版权法本身就是一种平衡的设计。作者与投资者等主体在版权归属上的利益分歧,需要通过版权法的利益平衡机制加以调和。其利益平衡的价值目标,是使得被调整主体的利益关系处于相互协调的和谐状态,这涉及作者与其他版权人自身的权利与义务平衡。尤其在因特网的发展需求中,版权法的利益平衡作用不可忽视。生成式AI作品版权归属中的利益平衡,在于人工智能投资者与使用者、程序创设者(程序设计者和训练者)等自然人利益的平衡。笔者认为,虽然人在生成式AI作品生成中的作用不容小觑,但生成式AI作品的质量受算法、算力和数据的影响较大,而这些方面的提高几乎完全依赖资金投入。并且,随着语料、图片等数据库的持续膨胀,对于资金投入的需求还将不断增长。因此,在利益平衡的考量上应适当倾斜于投资者的利益保护。
(二)生成式AI作品版权归属的一般规则
作品的版权归自然人、法人或非法人组织享有。以ChatGPT为例,参与生成式AI创作的自然人主要包括:人工智能的程序创设者和人工智能使用者。生成式AI作品的版权归属,应当以是否从事了实质性智力贡献为标准。对于用户输入简单指令就生成的作品,用户在该作品中既没有贡献艺术性的实质技能或劳动,也没有为生成物的最终产生作出必要的安排,因而其无法被视为版权法意义上的作者。相反,ChatGPT生成的内容得益于创设者在RLHF模型训练中基于打分模型的训练,在这一训练过程中,训练者的偏好集成到了内容生成过程,并产生了训练者想看到的结果。在英国的Nova Productions Ltd v. Mazooma Games Ltd案,以及美国的Williams Electronics Inc. v. Artic International Inc案中,也都将电脑游戏画面的版权归属于游戏软件的编程设计者。可能有观点认为,生成式AI的作品虽然包含了训练者的主观色彩,但实际生成的内容只不过是所有可能的内容之一,并不完全处于训练者的控制之下,因此并非版权法意义上的创作。笔者认为,生成式AI作为人类创作的工具,只要能够协助人类实现创作目的即可,人类独自创作也仅仅是从多种可能的结果中择其一而已。因此,对于用户向生成式AI发出简单指令就生成的作品,其程序创设者与电脑游戏画面的编程设计者相似,都付出了本质上相同或类似的智力劳动,其版权应归属于程序创设者所有。但如果用户也在生成式AI的作品中投入了一定的智力活动,且生成式AI的作品带有用户的主观意志,就可能出现用户与程序创设者创作合作作品的情况,具体内容将在下文阐明。另外,在多数情况下,如果生成式AI的作品代表了法人或者非法人组织的意志,例如,如果用于训练ChatGPT的奖励模型由程序创设者按照公司的意志建立,该作品又同时满足法人作品的其他构成条件,在此种情形下,ChatGPT生成作品的版权就可能归属于相关法人或非法人组织所有。
(三)生成式AI作品版权归属的特殊规则
除了归属于自然人、法人或非法人组织这种一般情况之外,生成式AI作品如果属于特殊类型作品则归属于特殊主体。我国《著作权法》规定了七类特殊作品,分别是演绎作品、合作作品、汇编作品、视听作品、职务作品、委托作品,以及美术作品与摄影作品在转移作品原件情况下的展览权归属。其中,演绎作品和汇编作品的版权归属,仍遵循上述版权归属的一般规则,也即根据程序创设者与使用者的智力投入进行判断。对于视听作品中的电影作品和电视剧作品,相对而言它们要占用更多的算力和数据,也需要更多投资,所以其版权归属投资者较为合理。其他视听作品的版权由当事人约定,没有约定或者约定不明的也归投资者所有。如果生成式AI被用于创作作品是为了完成法人或者非法人组织的工作任务,则可能构成职务作品。我国《著作权法》将职务作品分为一般职务作品和特殊职务作品两类。对于我国《著作权法》第18条第2款规定的工程设计图、产品设计图等特殊职务作品,法人或者非法人组织享有除署名权之外的其他著作权。而对于特殊职务作品之外的一般职务作品,同样按照上述一般规则分配权属。但法人或者非法人组织有权在业务范围内免费使用。作品完成两年内,未经单位同意,作者也不得许可第三人以与单位使用的相同方式使用该作品。如果用户受他人委托,使用生成式AI创作作品,在用户付出了实质性智力投入的情况下,版权归属有约定的从约定,无约定则属于用户和程序创设者共同享有。如果用户未付出实质性智力投入,那么版权归程序创设者享有。至于美术作品和摄影作品原件转让情况下的版权归属问题,在生成式AI中难以适用,因为生成式AI的美术和摄影作品不存在原件与复制件之分。即使将数字内容实体化,例如输入相应指令便能立即获得相关的实体美术和摄影作品,此时原件也与复制件无异。较为特殊的是合作作品。合作作品通常是指由两个以上的作者共同创作,且其创作成果不可分割的作品。判断是否构成合作作品的核心标准之一,是各创作者之间是否具有合作创作作品的意图。尽管有观点认为,由于程序创设者与用户之间没有达成创作特定作品的合意,因此不构成合作作品。但笔者认为,出售程序的设计者当然希望用户出于创作目的来执行程序,而执行程序的用户显然也是希望通过设计者设计的程序来进行创作,因此,在没有其他相反证据证明的情况下,应当认定用户与程序创设者之间具有创作合意。同时,如果满足合作作品的其他构成要件,例如付出了创造性智力劳动等,则可能构成合作作品,此时版权归程序创设者与用户共同享有。
四、结 语
ChatGPT的出现标志着弱人工智能时代向强人工智能时代的过渡,传统版权规则的科学性与合理性在这一历程中被不断挑战且重新审视。事实证明,传统版权框架下的作品使用规则以及版权归属上的部分观点,已经无法满足现阶段生成式AI的应用需求。但正如诺贝尔经济学奖获得者托马斯·萨金特所言,人工智能其实就是现代统计学。生成式AI还尚未发展到具有独立自主意识的超强人工智能阶段。所以笔者认为,以ChatGPT为代表的生成式AI作为人类创作作品的工具,对于其带来的版权问题应警惕两种思维方式。一种是过于保守的不予保护的思维,试图让版权规则轻视或者无视创作能力强大的生成式AI。另一种是追求人工智能领域的规则创新,试图颠覆既有的法律规则,让版权规则屈从于尚未达到高深莫测境界的生成式AI。前者的一味否定只会成为进步的阻碍,而后者则背离了人工智能的发展现状,超越了人工智能的工具属性。
但不可否认的是,超强人工智能时代距离我们也越来越近。如果人工智能真的发展到了超强人工智能时代,由于人工智能具有了自主意识,形成了完全独立于人类的感知、学习、分析和处理能力,则可能引发人工智能是否属于适格版权主体等一系列讨论,甚至对既有的立法规则提出挑战。因此,更为科学合理的方式是,在清晰界定现阶段的人工智能还是人类创作工具的前提下,认可并保护人工智能创作的符合法律要件的作品。同时,顺应人工智能的技术发展趋势,并正视既有版权规则在生成式AI作品应用场景下的创新需求,根据生成式AI创作作品的新情况,依法确定该类作品的版权归属。以期在超强人工智能时代来临后的机遇和挑战中,实现版权规则的顺利接续。
排版 | 尹传宾
编辑 | 郝云飞
审核 | 魏 建
点击“阅读原文”,查看更多