当前位置:首页 > 科技资讯 > 正文

退出机制:虚假选择与版权保护的挑战

编者按

随着生成式人工智能的迅猛发展,如何合法合规地使用海量数据训练模型已成为核心争议。在此背景下,一种名为“退出机制”的方案被提出,旨在默认允许AI公司使用所有公开数据,仅当版权所有者主动提出反对时才将其排除在外。然而,这一机制看似赋予了创作者选择权,实则更像一个在技术洪流下难以兑现的“虚假的选择”。

其“虚假性”源于AI发展的几个内在趋势:数据抓取已从简单的网络爬虫扩展到智能眼镜等现实捕捉设备,使得基于网址或元数据的传统“退出”手段完全失效;模型训练的一次性、超前性以及合成数据的再利用,意味着事后的“退出”无法抹去作品在前期训练中的贡献,实为对历史侵权的默许;更重要的是,该机制将本应由AI企业承担的“授权”责任逆向转嫁给了数量庞大且分散的个体创作者,要求他们完成追踪无数AI系统的“不可能任务”。

在人工智能日益渗透各行各业的今天,一个真正尊重创新源头、鼓励公平合作的治理框架,不应建立在如此脆弱的基础之上。推动建立在“选择加入”前提下的透明授权与合作,而非寄望于无效的“退出”,才是引导AI产业健康、可持续发展的正途。

一、法律根基动摇:“退出”颠覆版权“授权”本质

根据《版权法》,版权所有者享有对其受版权保护作品的专有使用权,并有权授权他人使用,本质上是一种选择加入机制。除非存在适用的法律例外情况允许用户在未经版权所有者许可的情况下使用受版权保护的作品(例如合理使用),否则用户必须事先获得版权所有者的授权。

通常,授权以版权所有者与用户之间的许可协议形式存在。寻求许可的责任理应落在用户身上,之后由版权所有者决定是否授予该用户使用该作品的许可。因此,人工智能公司在使用版权作品前必须获得版权所有者的许可。

然而,许多人工智能公司并未这样做。他们提出的选择退出机制,实际上赋予了它们随时随地以任何方式使用受版权保护作品的权利,想要颠覆版权的自愿性和专有性。

二、技术鸿沟难越:现有工具无法阻止作品“隐形”使用

人工智能模型和系统种类繁多,普通版权所有者根本不可能了解每种人工智能模型和系统的所有退出机制。要求版权所有者识别所有退出机制并在每部作品目录中启用退出功能无疑是一项巨大的负担。

即使版权所有者采取了退出措施来阻止未来通用人工智能抓取其受版权保护的作品,全面退出也是无法实现的。因为受版权保护的作品通常存在于互联网上的多个位置,这使得版权所有者几乎不可能为作品的每个副本都添加退出标识。

此外,要让用户选择退出非法复制的版权作品几乎是不可能的。因为人工智能公司会抓取、复制并使用从非法来源非法获取的盗版创意作品来训练其通用人工智能模型。即使版权所有者能够选择退出其作品的每个合法副本,这些盗版作品仍然存在。

三、现实困境重重:海量系统与衍生副本令退出形同虚设

目前已有技术工具和正在开发中的工具理论上可以帮助版权所有者阻止人工智能机器人和爬虫访问和抓取其受版权保护的作品。然而,这些现有技术工具存在显著局限性。

(i) 它们只有在用户选择退出机制得到认可、尊重且不被规避的情况下才能有效;

(ii) 这些工具并非为解决人工智能数据抓取问题而创建,因此实际使用时可能弊大于利。

事实上,在许多情况下,人工智能公司、开发者和其他用户部署的机器人和爬虫经常绕过或无视这些技术工具。

四、利益天平失衡:“二元选择”扼杀合作

大多数选择退出机制都因其固有的二元性而受到限制:作品要么可以使用,要么不能使用。除非版权所有者和人工智能公司就创意作品的使用达成协议,否则双方没有机会协商使用条款。

但根据现行版权法,他们已经可以通过许可协议来实现这一点。目前,由行业主导的创新技术解决方案正在不断开发和探讨,以构建更加灵活的机制。

五、选择退出机制违反了国际条约义务

在通用人工智能领域实施选择退出机制的法律制度可能违反《伯尔尼公约》规定的国际条约义务。

<伯尔尼公约》规定,版权保护不得受制于形式主义。选择退出机制是一种形式主义。

六、严格执行透明度和追责机制

无论退出机制在通用人工智能的采集和训练中可能具有何种效用,如果没有相应的透明度标准或强制执行退出机制并追究人工智能公司责任的义务,那么它将完全失效。

提供退出机制的人工智能公司并没有真正对版权所有者承担确保这些系统有效运行的义务。对人工智能公司施加透明度义务至关重要。

出路在于授权:从“虚假退出”转向“透明许可”

选择退出并非解决之道。真正的解决之道在于尊重创作者和版权所有者的权利,以及他们是否以及如何行使这些权利。这并非损害这些权利,而是鼓励通过版权许可来开发和训练生成式人工智能模型。