撰文:
近期,ChatGPT 的热度席卷全球。与过去的 AI(Artificial Intelligence,人工智能)相比,ChatGPT 的“智能化”、“个性化”、“互动性”完全超出预期,其能够理解用户的定制化需求,提供问题回答、文章创作、代码创建、诗歌创作等服务。更重要的是,ChatGPT 嵌入了人类反馈强化学习(RLHF)技术,使其能够通过人类的反馈深度学习,并不断升级迭代其内容输出质量。可以说,ChatGPT 代表了今天最为先进的 AIGC(Artificial Intelligence Generated Content,人工智能生成内容)技术之一。
1950 年,图灵提出了著名的“图灵测试”,即判定“机器是否智能”的核心在于机器能否在智力行为上表现得和人类无法区分并与人类进行交互。70 多年后的今天,AIGC 爆火出圈,技术界、产业界和投资界都看到了 AIGC 无限的生产力潜能。Web3 时代对于内容生产的数量、质量、创意、速度均有较高需求,而传统的 UGC 和 PGC 的内容生成方式难以匹配扩张的需求;目前 AIGC 在多个领域展现了其接近“人类智能”的能力,恰恰可以提供内容生成解决方案,因此,我们可以将 AIGC 视作 Web3 时代 / 加密领域的生产力工具。
产业层面上,AIGC 已经深入到文字、语音、绘图、视频、代码、3D 模型 / 场景、游戏等产业领域。从产出来看,AIGC 在处理文字、语音、绘图方面的产出能力基本达到一般创作者的水平,但在视频、3D 模型 / 场景等媒介程度较高的领域仍处于早期发展阶段,且 AIGC 在文本上的细节准确度尚待加强,仅能作为人类的辅助工具而无法完全依赖。从用户创作门槛来看,AIGC 工具极大地降低了用户的内容创作门槛,使得用户在不具备较高创造水平的情况下,也能使用 AIGC 工具完成创作。
图:The Genrative AI Application Landscape (Sequoia Capital)
需求层面上,AIGC 为构建 Web3 时代的虚拟场景、加密领域的产品提供了生产力工具。以 GameFi 为例,开发团队在 AIGC 的辅助下无需花费较多时间在搭建大量虚拟场景阶段,AIGC 对于物理世界的复制、映射、还原能力更快,还原程度更高,因此 AIGC 可以极大提高开发效率,降低开发成本。数字孪生城市的构建也同样如此。此外,部分 NFT 项目也使用了 AIGC。BAYC 项目最早创作的 10000 件 NFT 是通过 AIGC 技术完成的;而 Art Blocks,作为一个生成随机艺术品的平台,只需创作者预先在 Art Blocks 上部署好生成艺术脚本,收藏者购买 / 铸造作品时,便根据随机获得的哈希值执行脚本即可获得随机生成的 NFT,创作者的艺术风格、生成算法和收藏者的铸造时机共同决定了铸造出什么样的 NFT。
图:Art Blocks 的 NFT 制作过程
我国对于 AIGC 的整体监管初步倾向于从严监管,要求深度合成服务提供者从用户注册、算法机制机理审核、科技伦理审查、信息发布审核、数据安全、个人信息保护、反电信网络诈骗、应急处置等方面提供制度保障。
2023 年 1 月 10 日生效的《互联网信息服务深度合成管理规定》(《深度合成规定》)是 AIGC 领域最为核心的监管规定。
「深度合成技术」是指利用以深度学习、虚拟现实为代表的生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术,包括文本转语音、音乐生成、人脸生成、人脸替换、图像增强等技术。因此,AIGC 属于《深度合成规定》的监管范围。
《深度合成规定》明确,深度合成服务提供者应当采取技术或者人工方式对深度合成服务使用者的输入数据和合成结果进行审核,此外,提供智能对话、合成人声、人脸生成、沉浸式拟真场景等生成或者显著改变信息内容功能的服务的,应在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示深度合成情况。
2022 年 9 月,深圳公布了全国首部人工智能产业专项立法《深圳经济特区人工智能产业促进条例》。上海也随即通过了《上海市促进人工智能产业发展条例》,指出当前人工智能应用价值落地与升级受限的核心因素在于相关制度的缺失,需探讨人工智能相关制度的基础建设,以期推动人工智能在经济、生活、城市治理等领域的规模化应用。
中国实践
《著作权法》规定“中国公民、法人或者非法人组织的作品,不论是否发表,依照本法享有著作权。”因此,我国著作权法体系仅认可人(自然人、法人或非法人组织)可以作为享有作品著作权的主体,而 AI 无法成为作者享有著作权。
在(2018)京 0491 民初 239 号判决书中,北京互联网法院否定了 AI 在著作权法下的法律主体地位。该法院指出「虽然随着科学技术的发展,计算机软件智能生成的此类‘作品’在内容、形态,甚至表达方式上日趋接近自然人,但根据现实的科技及产业发展水平,若在现行法律的权利保护体系内可以对此类软件的智力、经济投入予以充分保护,则不宜对民法主体的基本规范予以突破。故一审法院认定,自然人创作完成仍应是著作权法上作品的必要条件。上述分析报告的生成过程有两个环节有自然人作为主体参与,一是软件开发环节,二是软件使用环节。软件开发者(所有者)没有根据其需求输入关键词进行检索,该分析报告并未传递软件研发者(所有者)的思想、感情的独创性表达,故不应认定该分析报告为软件研发者(所有者)创作完成。同理,软件用户仅提交了关键词进行搜索,应用“可视化”功能自动生成的分析报告亦非传递软件用户思想、感情的独创性表达,故该分析报告亦不宜认定为使用者创作完成。综上,软件研发者(所有者)和使用者均不应成为该分析报告的作者。分析报告系威科先行库利用输入的关键词与算法、规则和模板结合形成的,某种意义上讲可认定威科先行库‘创作’了该分析报告。由于分析报告不是自然人创作的,因此,即使威科先行库“创作”的分析报告具有独创性,该分析报告仍不是著作权法意义上的作品,依然不能认定威科先行库是作者并享有著作权法规定的相关权利。”
美国实践
AI 学家 Stephen Thaler 于 2018 年向美国版权局提交了一幅画作的版权申请,该画作由 AIGC 工具创作,美国版权局于 2019 年以「作品缺乏人类的作者身份”、“未提供足够证据证明人类对该作品有足够创造性的投入」为由首次驳回了该申请。2022 年 2 月,美国版权局再次拒绝了 Stephen Thaler 提交的复议请求,重申美国版权法的司法实践要求作品需要包含人类作者身份。实际上,美国版权法未对“作者”这一法律概念进行明确定义,但司法实践中认定“非人类身份”创作的作品不受版权法保护。
美国最高法院在 1884 年 Burrow-Giles Lithographic Co. v. Sarony 案中表示:「作者」是完成科学或者文学作品的源头,著作权是对人类智识构思的成果赋予专属权利的制度。在 1973 年 Goldstein v. California 案中,最高法院阐明人类心智和创造性表达间的关联性,引用前述案例关于“作者”的解释,认定作品是作者对其思想的有形表达,只有具原创性、建立在思想创造基础上的「作品」或者「智力劳动的成果」才可以获得保护,再次认定「人类创作」的作品是著作权保护的基本要件。在 2018 年 Naruto v. Slater 案中,法院认为:猴子不能对其自拍照取得著作权,因为著作权法提到“作者”的“子女、遗孀、孙子”等法条用语都代表了「人类」,从文义解释上「作者」必然排除了「动物」。
一般而言,AI 作品是否符合作品的条件需要具体问题具体分析。AI 作品目前基本上属于“排列组合式创新”,尽管在形式上非常接近人类的创作内容,但实际上不太拥有真正的创造力。
《著作权法》规定「作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。」故我国著作权法意义上的作品需要满足下列构成要件:属于文学、艺术、科学领域;具有独创性;能以某种形式复制以及属于智力成果。
作品的一大特征就是因人而异,体现个性化和独创性。以 ChatGPT 为例,其模型是根据人类的指令,将其收集整理的信息进行适当的排列组合,并给出尽量接近于自然语言且具有逻辑性的答案;尽管面对同样的问题,ChatGPT 在明天给出的答案可能与今天给出的答案不一样,但本质上其并未创造真正具有独创性的作品。
值得注意的是,实践中的裁判案例存在出入。在(2019)粤 0305 民初 14010 号案件中深圳南山区法院认可了 AIGC 的作品地位,法院认为「本案中原告主创团队在数据输入、触发条件设定、模板和语料风格的取舍上的安排与选择属于与涉案文章的特定表现形式之间具有直接联系的智力活动。从整个生成过程来看,如果仅将 D 软件自动生成涉案文章的这两分钟时间视为创作过程,确实没有人的参与,仅仅是计算机软件运行既定的规则、算法和模板的结果,但 D 软件的自动运行并非无缘无故或具有自我意识,其自动运行的方式体现了原告的选择,也是由 D 软件这一技术本身的特性所决定。如果仅将 D 软件自动运行的过程视为创作过程,这在某种意义上是将计算机软件视为创作的主体,这与客观情况不符,也有失公允。因此,从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。」法院首先认可 AIGC 具有独创性,进而论证 AIGC 的独创性是由人类的个性化安排与选择决定和导致的,但事实上没有回答 AI 是否具备独创能力这一问题。
一般而言,AI 作品是否符合作品的条件需要具体问题具体分析。AI 作品目前基本上属于“排列组合式创新”,尽管在形式上非常接近人类的创作内容,但实际上不太拥有真正的创造力。
如果 AIGC 工具数据库中的数据包含 AIGC 服务商未取得著作权或著作权授权的作品,无论该等数据是 AIGC 服务商手动收集还是通过爬虫技术获得,AIGC 都存在侵犯著作权的风险。因此,AIGC 服务商应当注意甄别、筛选训练数据,从源头上避免 AIGC 侵犯第三方著作权。
以 AI 绘画为例,如果 AI 绘画的创作是基于数据库的学习,仅在稍微调整参数的基础上直接生成相同风格的画作,则 AI 绘画可能构成与现有作品构成实质性相似,进而侵犯现有作品的著作权。如果 AI 绘画是依据算法随机性生成,且生成的 AI 绘画与现有作品存在明显不同之处,则较难构成著作权法意义上的实质性相似。
我国著作权法中的合理使用制度并无兜底式或开放式规定,因此只有著作权法规定的十三种情形可以被认定为合理使用,而 AIGC 中的“文本数据挖掘”过程并不属于合理使用的情形之一,因此需要取得现有作品的授权。
随着 AIGC 内容的指数级增长,用户逐步发现 AIGC 特别是 ChatGPT 的内容可靠性目前存在较为严重的问题。ChatGPT 生成的内容乍一看似乎内容翔实、有理有据,实则存在事实错误、逻辑错误、文字错误、结论错误等问题,无法直接作为结论。如果用户在向 ChatGPT 提问前并不知道问题的正确答案,那么用户也没有判断 ChatGPT 的答案是否正确的能力,这样一来,ChatGPT 之类的 AIGC 工具只能沦为人类消遣玩乐的工具,无法真正承担生产力工具的重任。比如,王迁教授在昨日的知识产权讲座中展示了他曾向 ChatGPT 提出了图中的问题,显而易见,ChatGPT 给出的答案属于「一本正经的胡说八道」。
图:王迁教授在讲座中分享其使用 ChatGPT 的场景
AIGC 的数据库可能包括个人信息、个人敏感信息,进而可能导致输出内容泄露个人数据。此外,对于 AIGC 的恶意使用可能造成个人身份盗用、冒用,进而造成用户的经济损失。
根据《个人信息保护法》,个人信息处理者收集个人信息,均应遵守知情同意原则。AIGC 服务商应做到(1)公开个人信息处理规则,明示处理的目的、方式和范围;(2)处理个人信息应当具有明确、合理的目的,并应当与处理目的直接相关;采取对个人权益影响最小的方式,获取的个人信息限于实现处理目的的最小范围。
算法是 AIGC 的核心技术之一,2022 年 3 月 1 日生效的《互联网信息服务算法推荐管理规定》(《算法推荐规定》)要求算法推荐服务提供者应当建立健全算法机制机理审核,应当定期审核、评估、验证算法机制机理、模型、数据和应用结果等,不得设置诱导用户沉迷、过度消费等违反法律法规或者违背伦理道德的算法模型。此外,《算法推荐规定》要求算法法推荐服务应当向网信部门完成备案:具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
关于 AIGC 的算法伦理问题,目前已有研究显示,GPT-3 生成的内容中会出现明显的性别歧视和宗教偏见;AIGC 图像生成也存在一定的歧视现象,研究人员发现 DALL-E2(OpenAI 公司推出的人工智能图像生成器)展现出性别偏见和种族偏见,即倾向于生成男性、白色人种的人类图像。
国家新一代人工智能治理专业委员会于 2021 年 9 月 25 日发布了《新一代人工智能伦理规范》,从人工智能的管理、研发、供应和使用等角度规范人工智能行业。具体而言,在数据采集和算法开发中,加强伦理审查,充分考虑差异化诉求,避免可能存在的数据与算法偏见,努力实现人工智能系统的普惠性、公平性和非歧视性;在算法设计、实现、应用等环节,提升透明性、可解释性、可理解性、可靠性、可控性,增强人工智能系统的韧性、自适应性和抗干扰能力,逐步实现可验证、可审核、可监督、可追溯、可预测、可信赖。
十年前,我们就在讨论 AI 是否会取代律师工作。十年后,纵使 AI 技术升级迭代,我们依然在激烈讨论 AIGC 是否会取代律师工作,不敢妄下结论。笔者认为,在可预见的未来,AIGC 不太可能完全取代律师职业。虽然律师行业的部分重复性、碎片化的工作可以交由 AI 来完成,以此来提高工作效率和避免低级错误,但律师的核心价值在于具有「人性」,进而具有在复杂法律案件中所需的灰度决策能力、利益取舍能力,而 ChatGPT 等 AIGC 工具目前尚不具备该等能力。
在 2023 特拉维夫全球网络技术会议上,以色列总统 Isaac Herzog 成为全球首位用 ChatGPT 撰写发言稿的国家领导人。他在致辞中表示「让我们铭记,正是人性使我们真正与众不同。决定我们命运的不是机器,而是我们为全人类创造更美好明天的心灵、思想和决心」。其中,「让我们铭记,正是人性使我们真正与众不同」这句,正是由 ChatGPT 撰写。笔者认为,这也是 ChatGPT 对于人类的理解,正是人性的存在,使人类与机器不同。
关于 AIGC,想象空间很大,也有许多法律问题尚待立法和司法层面予以进一步明确。我们期待强人工智能时代的到来,更期待 AIGC 为 Web3 时代、加密领域提供源源不断的创意和生产力。
参考
[1] 《腾讯研究院 AIGC 发展趋势报告 2023》,腾讯研究院。
[2] 《AIGC-Web3 时代的生产力工具》,国盛证券。
[3] 《人工智能生成内容(AIGC)白皮书》,中国信通院。
[4] https://mp.weixin.qq.com/s/dU92RSw9gWkGEzwQAQnzEg,量子位。
[5] https://36kr.com/p/1897488641091713?channel=wechat,36 氪。
[6] https://www.sequoiacap.com/article/generative-ai-a-creative-new-world, Sequoia。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。