作者简介:冯晓青,北京大学法学博士,中国人民大学法学博士后;现任中国政法大学民商经济法学院二级教授、博士生导师,中国政法大学国际知识产权研究中心执行主任;兼任中国法学会知识产权法学研究会副会长,中国知识产权研究会副理事长,最高人民法院知识产权司法保护研究中心研究员等。 当前,人类迎来了第四次信息产业革命。特别是人工智能技术的发展正深刻地改变着人们的工作和生活方式,世界各国和地区也就此展开了激烈竞争,对包括知识产权制度在内的现行法律制度带来了极大挑战。近几年来,国内外涉人工智能数据训练、人工智能生成作品的著作权侵权纠纷不在少数。我国现行《著作权法》缺乏对人工智能生成作品著作权制度方面的规定,亟待加以研究和探讨。 人工智能数据训练及其著作权侵权风险 随着人工智能技术的迭代更新,人工智能服务平台不断升级,用于预训练和训练的数据量呈几何级数增长。从著作权保护的角度来说,这些 数据 或 文本 ,很大一部分属于受著作权保护的作品。基于交易成本巨大以及其他市场失败原因,人工智能开发者也无力一一获取使用授权。国外即有多起著作权所有者基于人工智能开发者进行数据训练时未经许可地使用了其享有著作权的作品而提出著作权侵权之诉。例如,近年美国微软和OpenAI公司都被纽约时报指控使用的训练数据侵害了其著作权。在另一起Getty Images诉Stability AI,Inc.案中,被告被控其人工智能模型使用了原告1200多万张图片、配套注释、元数据等。 从我国情况看,涉及人工智能数据训练方面鲜有著作权侵权纠纷案件发生,学界对于人工智能数据训练对是否应取得著作权人许可也存在不同认识。在此,不妨结合我国相关规定,明确对待人工智能数据训练的态度。 按照《生成式人工智能服务管理暂行办法》第7条规定,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,应当使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权。又依照《互联网信息服务深度合成管理规定》第14条第1款规定,深度合成服务提供者和技术支持者应当加强训练数据管理,采取必要措施保障训练数据安全;训练数据包含个人信息的,应当遵守个人信息保护的有关规定。上述法律文件尽管属于部门规章范畴,但也彰显了人工智能数据训练的合法合规要求,而非不受任何限制地抓取数据、输入数据和进行数据训练。其原因在于,尽管人工智能开发者模拟人工神经网络进行数据预训练和训练可以不对外公开,但训练的目的是为了日后通过生成作品等形式的使用。如果训练中采集了违法违规的有害内容,就会实质性地造成生成内容的不合法性。当然, 不得侵害他人依法享有的知识产权 是否意味着一定需要事先获得著作权人的同意仍值得探讨。无论如何,人工智能开发者在进行数据训练时存在著作权侵权风险。例如,近期有小说平台将作者文章 投喂 人工智能,就被质疑是否存在人工智能作者洗稿剽窃问题。 人工智能生成作品及其公开传播的著作权侵权问题 人工智能生成作品的著作权问题,和前述人工智能数据训练涉及的著作权问题有所不同。前者既涉及人工智能生成作品本身是否符合受著作权保护条件的问题,也涉及人工智能生成作品侵害在先作品著作权的问题。当然,在承认人工智能生成物的作品属性后,还会涉及该作品著作权被侵害及其法律救济问题。就人工智能生成物是否受著作权保护的问题而言,尽管我国学界存在争议,但主流观点仍然持肯定态度,笔者亦是如此,近年来的相关司法实践也同样如此,如深圳市南山区人民法院一审的腾讯案和北京互联网法院一审的文生图第一案都承认人工智能生成物受著作权保护。故而,研究的重点之一是人工智能生成作品是否侵害在先作品著作权。 目前,我国《著作权法》未涉及人工智能领域著作权问题。关于人工智能生成作品的著作权规范,见于2023年7月国家互联网信息办公室联合国家六部委发布《生成式人工智能服务管理暂行办法》等部门规章。例如,该规章第3条规定,提供和使用生成式人工智能服务,应当 尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为 。该规定为人工智能服务提供者和使用者不得侵害他人知识产权提供了基本的原则和规范。从著作权法原理和理论来说,通过人工智能生成的作品,只要其与在先享有著作权的作品构成实质性相似,就存在著作权侵权风险。这里的 在先享有著作权的作品 应当是特定人工智能平台在进行数据训练时未经许可使用的作品。若人工智能生成作品前并未事先 接触 在先作品,根据通常的界定著作权侵权的 实质性相似 加 接触 原则即可排除著作权侵权之虞。实际上,这里也体现了对于人工智能生成作品在著作权法中的平等保护问题。 需要指出,涉及人工智能生成作品侵害他人在先作品著作权问题,在实践中还有一个前提条件,即该人工智能生成作品在生成后通过一定形式公开和传播。以用户为例,如果通过输入主题词、调整参数和反向排除等手段获取了人工智能生成作品与某在先的享有著作权的作品构成实质性相似,但仅限于用户个人欣赏或者学习、研究之用,并未公开,他人就无法感知,也不存在侵害他人利益的问题。这与一般情况下因未公开使用和传播而不构成侵害著作权的原理一样。 我国近年确实发生过的涉及人工智能生成作品侵害他人在先作品著作权的案例。例如,2024年2月,广州互联网法院对全球第一例人工智能平台侵害著作权案作出判决。该案中,法院认为被告某人工智能公司在进行人工智能模型训练时未经许可使用了享有著作权的美术作品 奥特曼 ,并认定通过该平台用户获得的图片和原告主张著作权保护实质相似,进而认定被告侵害了原告作品的复制权和改编权。由此可见,人工智能生成作品著作权侵权认定标准和侵权责任需要相关法律予以明确。 人工智能生成作品著作权侵权认定及责任划分 人工智能生成作品著作权侵权认定和著作权法的一般原理与规定本质上一致,只因作品创作、使用和传播的场景不同而具有一定特殊性。如前所述,著作权侵权以实质性相似加接触作为判定标准,在判定实质性相似方面,需要运用思想表达二分法,排除不受著作权保护的公有领域。 在当前流行的生成式人工智能背景下,在人工智能生成作品著作权侵权判定中,用户通常通过不断输入和调整提示词、修改参数与排除主题词的方式获取自身所需要的最终成品。这种情况下,所生成作品的著作权问题具有一定复杂性,此类 人机互动 或 人机协作 所生成的作品,其作者和著作权人属于谁存在一定争议。对此,可以从人工智能服务提供者和使用者的角度判定著作权侵权问题。假设使用者(用户)借助于人工智能服务所生成的作品构成对在先作品著作权的侵害,此时应由谁承担著作权侵权和损害赔偿责任? 从人工智能平台实践看,用户在使用时需要接受平台合同约束,而合同通常将所生成的作品著作权指定由用户享有。此时,用户对于生成作品侵害他人作品著作权承担停止侵权责任应当没有疑问。至于其是否应承担损害赔偿责任,则取决于其主观上是否存在过错,因为知识产权侵权损害赔偿以侵权人存在过错作为前提。一般而言,人工智能服务平台使用具有开放性,用户借助于人工智能平台生成作品具有合理性,难以认定其主观上具有过错。但也应注意,用户并非在任何情况下都不存在过错。如果用户通过故意诱惑或者其他非正当形式获取侵害他人著作权的作品,则应当承担损害赔偿责任。用户通过反复输入和调整提示词获取目标作品,并且以著作权人名义公开,那么基于权利义务一致性原则,用户也应当对侵害他人著作权的行为承担停止侵害和赔偿损失的法律责任。人工智能服务提供者也不可因为格式合同将生成作品著作权约定给用户而完全不承担著作权侵权责任。现有研究认为,人工智能服务提供者对于著作权侵权发生存在一定注意义务,而且还应当采取一定的技术手段或者措施防止用户利用其平台生成侵害著作权的作品并予以传播。 应对人工智能挑战的著作权制度变革与完善 如前所述,我国《著作权法》尚未涉及人工智能生成著作权问题。人工智能技术及其产业化迅猛发展以及司法实践中不断出现的典型案例无不呼唤建立人工智能生成作品著作权制度,以强化对著作权保护,并促进我国人工智能产业发展。笔者认为,我国人工智能生成作品著作权制度应重视以下内容的规范: 其一,明确人工智能生成作品受著作权保护的条件,肯定其在著作权保护中的地位。随着生成式人工智能技术发展,会有越来越多的人工智能生成作品涌入市场,著作权法需要给予保护。同时,在著作权保护期限方面作出限缩性规定,如不超过发表后十年,以便实现这类作品著作权人和社会公众利益之间的平衡。 其二,明确人工智能系统开发中文本与数据挖掘合理使用例外规定,为我国人工智能技术开发和产业化提供宽松的法律环境。实际上,近年来国外著作权立法已有相关规定。例如,日本《著作权法》在修改后增加了涉及人工智能数据训练的 计算机信息处理 的合理使用方式,欧盟《数字单一市场版权指令》也有类似规定,值得我国借鉴。 其三,明确人工智能生成的作品的强制署名义务。人工智能生成作品在外观上与自然人创作作品并无实质性区别。为避免人工智能生成作品冲击人类作品市场,需要建立人工智能生成作品强制署名制度。 其四,在著作权侵权责任制度中,明确人工智能生成作品著作权侵权这一新型类型,赋予人工智能服务提供者和使用者相应的注意义务,以及著作权侵权豁免制度(如类似避风港原则),以便为人工智能生成作品著作权侵权判定及其责任承担建立裁判规则。
# 前沿 | 人工智能生成物著作权侵权风险与对策
近年来,人工智能技术的飞速发展引发了广泛的讨论和关注。特别是在文学艺术领域,人工智能已经可以生成各种文本内容,包括小说、诗歌、散文等。然而,随之而来的问题是,这些由人工智能生成的作品是否享有著作权?如果享有著作权,其权利归属如何界定?如果不享有著作权,又该如何保护原创作者的权益?本文将从著作权法的角度,对人工智能生成物的著作权侵权风险进行分析,并提出相应的对策。
## 一、人工智能生成物的著作权认定
根据我国著作权法的规定,作品是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。从这个定义可以看出,作品必须具备两个构成要件:一是独创性,即作品必须是作者独立创作完成的,而不是抄袭、剽窃他人的成果;二是可复制性,即作品必须能够以一定的有形形式表现出来,并可以被他人复制、传播。
对于人工智能生成物而言,其是否具备独创性和可复制性是认定其是否享有著作权的关键。
### (一)独创性的认定
对于人工智能生成物的独创性认定,目前主要存在两种观点:一种观点认为,由于人工智能是根据预设的算法和模板生成文本,其创作过程缺乏人类的创造性思维和灵感,因此不具备独创性;另一种观点则认为,虽然人工智能的创作过程是基于算法和数据的,但这种过程本身也是一种创造性的表现,只要其生成物体现了一定的个性和创造性,就应当认定其具备独创性。
### (二)可复制性的认定
对于人工智能生成物的可复制性认定,也存在一定的争议。一种观点认为,由于人工智能生成物是由计算机程序自动生成的,其本身并不具有有形载体,因此不具备可复制性;另一种观点则认为,虽然人工智能生成物本身没有有形载体,但可以通过将其转化为数字化形式,并存储在计算机硬盘、光盘等介质中,实现对其的复制和传播。
## 二、人工智能生成物的著作权侵权风险
如果认定人工智能生成物享有著作权,那么其权利归属将成为一个重要的问题。根据我国著作权法的规定,著作权属于作者。对于由自然人创作的作品,著作权当然属于作者;但对于由法人或者其他组织主持、代表法人或者其他组织意志创作,并由法人或者其他组织承担责任的作品,则著作权归法人或者其他组织所有。
对于人工智能生成物而言,如果是由自然人创作的,那么其著作权应当属于创作者本人;如果是由法人或者其他组织创作的,则其著作权应当归属于该法人或者其他组织。然而,在实际操作中,由于人工智能生成物的创作过程往往涉及到多个主体的参与和协作,包括算法开发者、数据提供者、模型训练者等,因此对于其权利归属的界定可能会存在一定的困难。
如果认定人工智能生成物不享有著作权,那么其在使用过程中就不会产生侵权风险。但需要注意的是,即使人工智能生成物不享有著作权,其创作者仍然享有一定的权利,包括对其创作过程中所使用的算法、数据等的知识产权。如果他人未经授权使用这些算法、数据等进行商业开发,也可能构成侵权行为。
## 三、对策与建议
为了应对人工智能生成物著作权侵权风险,我们可以采取以下对策和建议:
### (一)完善相关法律法规
我国现行的著作权法对于人工智能生成物的著作权问题并没有明确的规定,因此需要进一步完善相关法律法规,明确人工智能生成物的著作权归属、侵权责任等问题。同时,还需要加强对人工智能生成物的监管,防止其被用于侵权行为。
### (二)明确算法、数据的知识产权归属
在人工智能生成物的创作过程中,算法、数据等是非常重要的组成部分。因此,需要明确算法、数据等的知识产权归属,防止其被他人非法使用。
### (三)建立合理的授权机制
为了保护原创作者的权益,需要建立合理的授权机制,允许原创作者对其作品进行授权使用,并获得相应的报酬。同时,也需要规范人工智能生成物的使用方式,防止其被滥用。
### (四)加强行业自律
人工智能行业需要加强自律,制定相关的行业标准和规范,防止其生成物被用于侵权行为。同时,还需要加强对人工智能生成物的质量控制,确保其符合相关的法律法规和道德标准。
## 四、结论
综上所述,人工智能生成物的著作权侵权风险是一个亟待解决的问题。为了保护原创作者的权益,促进人工智能技术的健康发展,我们需要完善相关法律法规,明确算法、数据的知识产权归属,建立合理的授权机制,加强行业自律等措施。同时,也需要加强对人工智能生成物的监管,防止其被用于侵权行为。只有这样,才能实现人工智能技术与著作权法的良性互动,共同推动文化产业的繁荣发展。