一、問(wèn)題的提出
在數(shù)字化浪潮席卷全球的時(shí)代,新質(zhì)生產(chǎn)力已經(jīng)成為推動(dòng)社會(huì)創(chuàng)新進(jìn)步與科技發(fā)展的重要力量,作為其主要代表的生成式人工智能憑借自身超強(qiáng)的內(nèi)容生成能力,逐漸融入經(jīng)濟(jì)、文化、社會(huì)發(fā)展等各個(gè)領(lǐng)域,給人們的工作和生活帶來(lái)極大的便利。然而,任何新技術(shù)的發(fā)展往往都會(huì)伴隨一系列的挑戰(zhàn),生成式人工智能的普遍應(yīng)用既使得版權(quán)風(fēng)險(xiǎn)逐漸顯露,也給傳統(tǒng)的版權(quán)法律體系帶來(lái)巨大的沖擊,加大了版權(quán)保護(hù)的難度。生成式人工智能的完整加工體系包含數(shù)據(jù)收集、機(jī)器學(xué)習(xí)與內(nèi)容輸出三大環(huán)節(jié),每個(gè)階段均涉及海量數(shù)據(jù)處理,但是各環(huán)節(jié)的數(shù)據(jù)處理目標(biāo)與方法存在顯著差異。在生成式人工智能的大規(guī)模數(shù)據(jù)處理與階段性差異影響下,模型訓(xùn)練、數(shù)據(jù)輸入、內(nèi)容生成等環(huán)節(jié)均存在不同程度的版權(quán)風(fēng)險(xiǎn)隱患。文章通過(guò)深入分析生成式人工智能各運(yùn)行階段的技術(shù)原理,系統(tǒng)揭示了其中潛在的版權(quán)法律風(fēng)險(xiǎn),并基于分層視角,針對(duì)不同階段的具體版權(quán)問(wèn)題提出了專項(xiàng)研究框架。例如,在數(shù)據(jù)收集階段如何才能保證不侵犯原作者的版權(quán)?在生成階段所形成的產(chǎn)物應(yīng)該如何認(rèn)定才能實(shí)現(xiàn)對(duì)其最大化保護(hù)的目標(biāo),從而平衡技術(shù)的發(fā)展和傳統(tǒng)版權(quán)保護(hù)對(duì)象之間的沖突?針對(duì)以上問(wèn)題,文章結(jié)合各階段的運(yùn)作特性針對(duì)性地提出規(guī)制對(duì)策。
二、生成式人工智能概述
(一)生成式人工智能的內(nèi)涵
第一,人工智能的概念?!叭斯ぶ悄堋钡母拍钭钤缬捎?guó)數(shù)學(xué)家圖靈在1950年提出,他通過(guò)“圖靈測(cè)試”這一標(biāo)準(zhǔn),用以判斷機(jī)器是否具備獨(dú)立思考能力,并將人工智能定義為:能輸出與人腦別無(wú)二致的內(nèi)容的機(jī)器。到1956年,達(dá)特茅斯會(huì)議正式將人工智能作為一個(gè)學(xué)科的正式命名,并開(kāi)啟了人工智能的研究歷程[1]。自此,人工智能經(jīng)歷了幾次興衰,分別被稱為“寒冬”和“熱潮”。目前,我們正處于第三次人工智能熱潮,也被稱為“深度學(xué)習(xí)革命”[2]。深度學(xué)習(xí)是一種可以處理復(fù)雜的非線性問(wèn)題,能夠?qū)崿F(xiàn)端到端學(xué)習(xí)的方法,其利用多層神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)表達(dá)和學(xué)習(xí)?;诖耍恼驴蓪ⅰ叭斯ぶ悄堋倍x為新興的技術(shù)科學(xué)領(lǐng)域,主要致力于研究和開(kāi)發(fā)用于模擬、延伸及增強(qiáng)人類智能的理論方法、技術(shù)體系及其應(yīng)用系統(tǒng)。該學(xué)科旨在探索智能的本質(zhì)特征,研發(fā)能夠模擬人類智能活動(dòng)并作出類人反應(yīng)的智能系統(tǒng),其典型應(yīng)用包括機(jī)器人技術(shù)、生物特征識(shí)別以及智能對(duì)話系統(tǒng)等。
第二,生成式人工智能的概念。生成式人工智能屬于人工智能的一個(gè)特定分支,其技術(shù)基礎(chǔ)主要建立在機(jī)器學(xué)習(xí)等人工智能技術(shù)體系上。生成式人工智能的核心原理植根于深度學(xué)習(xí)技術(shù),尤其以神經(jīng)網(wǎng)絡(luò)的應(yīng)用最為典型。其核心思想在于使用變分自編碼器(VAE)、生成對(duì)抗網(wǎng)絡(luò)(GAN)、大型語(yǔ)言模型(LLM)等訓(xùn)練模型,通過(guò)多層次的神經(jīng)網(wǎng)絡(luò)模塊來(lái)理解和模擬數(shù)據(jù)的分布,從而生成與訓(xùn)練數(shù)據(jù)相似但又獨(dú)特的新數(shù)據(jù),實(shí)現(xiàn)創(chuàng)造性的內(nèi)容生成[3]。與只能對(duì)已知的模式進(jìn)行重復(fù)利用的普通人工智能相比,生成式人工智能的優(yōu)越性在于:其能夠在對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行模擬和分類后,利用其已經(jīng)學(xué)習(xí)到的模式自主地生成文本、音頻、視頻等各種類型的新內(nèi)容。生成式人工智能的核心技術(shù)體現(xiàn)在基礎(chǔ)模型,典型代表包括美國(guó)OpenAI開(kāi)發(fā)的ChatGPT,以及國(guó)內(nèi)研發(fā)的文心一言、訊飛星火等主流產(chǎn)品。生成式人工智能的出現(xiàn)是人工智能時(shí)代創(chuàng)造性和創(chuàng)新性的重大突破,為各種領(lǐng)域帶來(lái)了新的可能性與機(jī)遇,同時(shí)也帶來(lái)了技術(shù)、倫理、法律等各方面的挑戰(zhàn)。
(二)生成式人工智能的特征
生成式人工智能與普通的人工智能有所不同,其基于開(kāi)發(fā)者預(yù)先設(shè)計(jì)的應(yīng)用程序,依托人類主體提供的數(shù)據(jù),以多樣化的方式歸納社會(huì)生活中人們對(duì)各種事務(wù)的處理規(guī)則,自主地對(duì)所采集的數(shù)據(jù)進(jìn)行加工重構(gòu),進(jìn)而產(chǎn)出人類主體希望獲得的創(chuàng)造性結(jié)果[4]。結(jié)合以上不同點(diǎn),文章歸納了生成式人工智能的主要特征。第一,自主創(chuàng)造性。生成式人工智能無(wú)須人工干預(yù),在接收用戶指令后,能夠基于內(nèi)置算法和海量數(shù)據(jù)集,通過(guò)分析數(shù)據(jù)特征實(shí)現(xiàn)跨模態(tài)融合,自主生成超越現(xiàn)有內(nèi)容的全新創(chuàng)作成果。第二,高效可控性。一方面,用戶對(duì)生成過(guò)程與結(jié)果具有可控性。用戶可通過(guò)對(duì)大模型發(fā)出指令來(lái)調(diào)整生成數(shù)據(jù)的內(nèi)容和結(jié)構(gòu),準(zhǔn)確滿足自我需求;另一方面,生成式人工智能生成效率和質(zhì)量較高。當(dāng)收到用戶的指令時(shí),生成式人工智能可在短時(shí)間內(nèi)迅速檢索自身的數(shù)據(jù)庫(kù),快速產(chǎn)出高質(zhì)量的數(shù)據(jù)內(nèi)容,這在節(jié)省大量人力物力的同時(shí)提升了生產(chǎn)效率。第三,可解釋性。其一,生成式人工智能為用戶深入了解其模型提供了路徑。當(dāng)生成物產(chǎn)出后,大模型能夠依照用戶的需求提供生成數(shù)據(jù)的來(lái)源與依據(jù),使用戶清晰理解其內(nèi)部機(jī)制和決策過(guò)程,從而提高生成結(jié)果可信賴度和可解釋性。其二,用戶可通過(guò)人機(jī)交互判斷生成物的質(zhì)量和可用性。例如,當(dāng)用戶要求生成式人工智能“撰寫交通事故案例匯編文書(shū)”時(shí),系統(tǒng)生成的內(nèi)容可能包含國(guó)家權(quán)威案例庫(kù)的官方數(shù)據(jù)與社交平臺(tái)用戶的非正式回答。通過(guò)對(duì)比數(shù)據(jù)來(lái)源,用戶通常會(huì)更傾向于采信權(quán)威機(jī)構(gòu)提供的案例,因其在專業(yè)性和可靠性方面更具優(yōu)勢(shì)。第四,侵權(quán)特殊性。生成式人工智能在無(wú)法合理處理其收集的數(shù)據(jù)內(nèi)容來(lái)源或生成不具有創(chuàng)造性的作品時(shí),會(huì)產(chǎn)生侵權(quán)的可能性。一方面,侵權(quán)客體具有特定性和特殊性。生成式人工智能的侵權(quán)問(wèn)題主要涉及人格權(quán)與著作權(quán)兩大領(lǐng)域,這一特性使其面臨的法律風(fēng)險(xiǎn)具有相對(duì)可控性。另一方面,侵權(quán)結(jié)果的發(fā)生具有依附性。生成式人工智能雖可能生成虛假內(nèi)容或與既有作品構(gòu)成實(shí)質(zhì)性相似,但實(shí)際侵權(quán)責(zé)任通常源于用戶的傳播行為[5],且侵權(quán)所造成的損害程度和影響范圍往往也和用戶傳播這些內(nèi)容的方式緊密關(guān)聯(lián)。
三、生成式人工智能的版權(quán)風(fēng)險(xiǎn)
隨著科技的不斷更迭發(fā)展,生成式人工智能逐漸成為技術(shù)創(chuàng)新、生產(chǎn)力提升和產(chǎn)業(yè)升級(jí)的重要驅(qū)動(dòng)力量,國(guó)家也高度重視數(shù)字經(jīng)濟(jì)發(fā)展,2023年中央經(jīng)濟(jì)工作會(huì)議對(duì)此作出重點(diǎn)部署,大力發(fā)展數(shù)字經(jīng)濟(jì),加快發(fā)展人工智能[6]。生成式人工智能的運(yùn)行并非單一過(guò)程,其主要包括數(shù)據(jù)收集、學(xué)習(xí)和輸出三個(gè)階段。在數(shù)據(jù)收集階段,生成式人工智能主要通過(guò)對(duì)其他作品的收錄編輯形成自己的數(shù)據(jù)庫(kù);在學(xué)習(xí)階段,生成式人工智能通過(guò)分析先前所收集的大量數(shù)據(jù),使用最優(yōu)算法搭建模型,并對(duì)模型開(kāi)展質(zhì)量評(píng)估;在輸出階段,生成式人工智能模型可根據(jù)用戶的指令生成具有創(chuàng)造性的人工智能生成物。由此可見(jiàn),生成式人工智能的運(yùn)作是一條完整且各環(huán)節(jié)密不可分的鏈條,一旦其中某一環(huán)出現(xiàn)誤差,將導(dǎo)致后續(xù)步驟無(wú)法成功運(yùn)作。正是基于其這一技術(shù)特性,生成式人工智能易引發(fā)一系列版權(quán)風(fēng)險(xiǎn),這些版權(quán)風(fēng)險(xiǎn)貫穿于生成式人工智能運(yùn)作的整個(gè)過(guò)程。
(一)數(shù)據(jù)收集階段的版權(quán)風(fēng)險(xiǎn)
擁有大量的版權(quán)作品和數(shù)據(jù)內(nèi)容是保障生成式人工智能得以有效運(yùn)行和不斷發(fā)展的重要基石,數(shù)據(jù)收集階段作為生成式人工智能復(fù)雜系統(tǒng)運(yùn)作的開(kāi)端,需要將現(xiàn)有的海量作品轉(zhuǎn)換成人工智能可以識(shí)別的數(shù)據(jù)類型,以便于下一階段的數(shù)據(jù)處理,故其合法性和合規(guī)性至關(guān)重要。然而,由于該階段的基礎(chǔ)性和特定運(yùn)作機(jī)制,數(shù)據(jù)采集過(guò)程常涉及侵權(quán)問(wèn)題,可能引發(fā)著作權(quán)侵權(quán)風(fēng)險(xiǎn),并進(jìn)一步波及后續(xù)學(xué)習(xí)與輸出環(huán)節(jié),形成連鎖性法律風(fēng)險(xiǎn)。實(shí)踐中,該類侵權(quán)主要源于人工智能的開(kāi)發(fā)者未獲得版權(quán)所有人的授權(quán)許可,如采取通過(guò)爬蟲(chóng)程序獲取數(shù)據(jù)、未經(jīng)版權(quán)人許可直接扒竊數(shù)據(jù)庫(kù)或個(gè)人數(shù)據(jù)、未經(jīng)授權(quán)將他人非數(shù)據(jù)作品數(shù)字化等一系列手段[7]。因此,如何在現(xiàn)行法律體系下合理協(xié)調(diào)數(shù)據(jù)庫(kù)建設(shè)與著作權(quán)保護(hù)之間的平衡,確保對(duì)人類智力成果的充分尊重,已成為業(yè)界亟須解決的關(guān)鍵問(wèn)題。
(二)學(xué)習(xí)階段的版權(quán)風(fēng)險(xiǎn)
生成式人工智能的學(xué)習(xí)階段可能會(huì)引發(fā)改編權(quán)侵權(quán)的風(fēng)險(xiǎn)。改編權(quán)指改變作品,創(chuàng)作出具有獨(dú)創(chuàng)性的新作品的權(quán)利,其包括在原作品上進(jìn)行改編和形成新的作品兩個(gè)構(gòu)成要件。
生成式人工智能的學(xué)習(xí)階段實(shí)質(zhì)上為機(jī)器學(xué)習(xí),主要是將其收集到的數(shù)據(jù)進(jìn)行加工處理,并構(gòu)建自己獨(dú)有且全面的數(shù)據(jù)庫(kù)。然而,處理加工的過(guò)程往往會(huì)涉及將所收集的原作品進(jìn)行拆解、改裝、重組的情況,因此,有學(xué)者將這個(gè)階段的學(xué)習(xí)分為非表達(dá)型機(jī)器學(xué)習(xí)和表達(dá)型機(jī)器學(xué)習(xí)。非表達(dá)型機(jī)器學(xué)習(xí)本身不具備主觀創(chuàng)作意圖,僅對(duì)輸入數(shù)據(jù)進(jìn)行客觀分析和特征提取。由于其所處理的內(nèi)容通常不構(gòu)成著作權(quán)法意義上的作品,這類技術(shù)可以自由使用相關(guān)素材,從而避免了潛在的版權(quán)侵權(quán)風(fēng)險(xiǎn)。表達(dá)型機(jī)器學(xué)習(xí)則主要以輸出表達(dá)為內(nèi)容,并且可根據(jù)作品作者來(lái)源是否具有唯一性和針對(duì)性進(jìn)一步將其分為“普通的表達(dá)型機(jī)器學(xué)習(xí)”和“特殊的表達(dá)型機(jī)器學(xué)習(xí)”[8]。普通的表達(dá)型機(jī)器學(xué)習(xí)指不以特定作者為學(xué)習(xí)對(duì)象,而是從海量現(xiàn)存作品數(shù)據(jù)庫(kù)中提取符合條件的內(nèi)容進(jìn)行訓(xùn)練;特殊的表達(dá)型機(jī)器學(xué)習(xí)以特定創(chuàng)作者為學(xué)習(xí)對(duì)象,如通過(guò)分析某位作家的文學(xué)風(fēng)格,進(jìn)而生成具有該作家典型特征的新作品。前者提取各種類型的作品中所需的數(shù)據(jù)部分,對(duì)其加工處理,產(chǎn)生的作品具有創(chuàng)造性和新穎性,能夠構(gòu)成著作權(quán)法定義的“作品”,不易侵犯他人的版權(quán)。后者由于提取的作品具有針對(duì)性且為特定作者所著,在生成過(guò)程中毫無(wú)避免地可能引發(fā)侵犯原作者改編權(quán)的風(fēng)險(xiǎn)。因此,在生成式人工智能處理原作品數(shù)據(jù)的過(guò)程中,用戶需要特別關(guān)注表達(dá)型機(jī)器學(xué)習(xí)的具體應(yīng)用形式,避免其在學(xué)習(xí)和生成環(huán)節(jié)侵犯原作者的改編權(quán),從而引發(fā)版權(quán)爭(zhēng)議。
(三)輸出階段的版權(quán)風(fēng)險(xiǎn)
經(jīng)過(guò)數(shù)據(jù)收集和機(jī)器學(xué)習(xí)兩個(gè)關(guān)鍵環(huán)節(jié)后,系統(tǒng)最終生成新作品的階段,即為生成式人工智能的輸出階段。在此階段,系統(tǒng)首先利用訓(xùn)練好的模型和輸入的上下文提示,通過(guò)概率統(tǒng)計(jì)方法預(yù)測(cè)并選擇最優(yōu)的文本或視覺(jué)元素來(lái)生成內(nèi)容。隨后,系統(tǒng)會(huì)對(duì)生成內(nèi)容進(jìn)行多維度評(píng)估,包括語(yǔ)法正確性和語(yǔ)義相關(guān)性等方面的檢測(cè)與優(yōu)化,最終輸出高質(zhì)量且準(zhǔn)確的結(jié)果[9]。然而,生成式人工智能的輸出內(nèi)容是基于用戶指令,對(duì)數(shù)據(jù)庫(kù)的信息進(jìn)行定向篩選和重組后生成的結(jié)果,可能導(dǎo)致以下著作權(quán)風(fēng)險(xiǎn):一是生成內(nèi)容缺乏足夠的獨(dú)創(chuàng)性;二是可能包含對(duì)原作品的實(shí)質(zhì)性復(fù)制或過(guò)度模仿。這種情況可能涉及侵犯原作者的復(fù)制權(quán)、信息網(wǎng)絡(luò)傳播權(quán)、發(fā)行權(quán)及改編權(quán)等多項(xiàng)著作權(quán)。總的來(lái)說(shuō),這一階段最大的爭(zhēng)議主要集中于生成物的版權(quán)歸屬問(wèn)題上。具體而言,當(dāng)生成內(nèi)容涉嫌侵犯大模型所采集的受版權(quán)保護(hù)作品的權(quán)益時(shí),應(yīng)如何準(zhǔn)確界定該版權(quán)作品的合法權(quán)利人?這一問(wèn)題不僅引發(fā)了學(xué)術(shù)界的關(guān)注,同時(shí)也使司法實(shí)踐深受困擾。實(shí)際上,版權(quán)歸屬爭(zhēng)議主要涉及生成式人工智能的開(kāi)發(fā)者、運(yùn)營(yíng)者和使用者三方主體,因此合理界定三方的權(quán)責(zé)關(guān)系是解決此類問(wèn)題的關(guān)鍵。
四、生成式人工智能版權(quán)風(fēng)險(xiǎn)的規(guī)制路徑
生成式人工智能的出現(xiàn)是數(shù)字化經(jīng)濟(jì)時(shí)代的一大創(chuàng)新突破,實(shí)現(xiàn)了從語(yǔ)言分析世界向創(chuàng)造世界的偉大飛躍,標(biāo)志著人工智能迎來(lái)了一個(gè)更加鼎盛的新時(shí)期,其能夠更加充分探索和利用人類的信息環(huán)境,實(shí)現(xiàn)信息多元化、創(chuàng)造性結(jié)合,更有利于產(chǎn)業(yè)鏈升級(jí)和價(jià)值觀的塑造。然而,生成式人工智能作為新興技術(shù)領(lǐng)域,其涉及的技術(shù)特性和潛在風(fēng)險(xiǎn)超出了傳統(tǒng)法律規(guī)制的預(yù)期范圍,導(dǎo)致從數(shù)據(jù)采集到內(nèi)容生成的全流程都存在法律適用的空白與挑戰(zhàn)。在我國(guó)現(xiàn)行法律體系中,人工智能相關(guān)規(guī)制分散于多部法律法規(guī)中,如《中華人民共和國(guó)電子商務(wù)法》《中華人民共和國(guó)個(gè)人信息保護(hù)法》《中華人民共和國(guó)數(shù)據(jù)安全法》,無(wú)法形成一個(gè)完整周延的法律規(guī)范體系。立法部門只有在第一代生成式人工智能運(yùn)行時(shí)對(duì)現(xiàn)存問(wèn)題采取實(shí)質(zhì)性的應(yīng)對(duì)措施,解決根本,才可筑牢根基,保證各類生成式人工智能大規(guī)模商業(yè)化落地時(shí)能穩(wěn)步運(yùn)行,確保產(chǎn)業(yè)智能化升級(jí)和和現(xiàn)代化進(jìn)程順利進(jìn)行[10]?;诖?,文章將結(jié)合國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合印發(fā)的《生成式人工智能服務(wù)管理暫行辦法》,綜合考慮生成式人工智能運(yùn)行的獨(dú)立性、各個(gè)運(yùn)行階段的工作和特征,針對(duì)其存在的版權(quán)法律問(wèn)題,提出相關(guān)切實(shí)可行的規(guī)制路徑,為生成式人工智能引發(fā)的法律風(fēng)險(xiǎn)解決方案提供相關(guān)建議。
(一)筑牢生成式人工智能發(fā)展的基石
建立數(shù)據(jù)內(nèi)容廣泛且來(lái)源合法的儲(chǔ)備庫(kù)是生成式人工智能得以穩(wěn)定運(yùn)行和高質(zhì)量高效率工作的重要前提。針對(duì)生成式人工智能在收集數(shù)據(jù)階段可能引發(fā)侵犯原作者復(fù)制權(quán)的問(wèn)題,當(dāng)前的研究主要存在以下四種觀點(diǎn)。一是引入法定許可,采用報(bào)酬支付或補(bǔ)償金制度;二是將該階段的數(shù)據(jù)收集納入合理使用范疇;三是采取類型化區(qū)分,從而適用著作權(quán)的合理使用,將該范圍限定在公共領(lǐng)域、科研內(nèi);四是絕對(duì)否認(rèn)該階段侵犯復(fù)制權(quán)[11]。在數(shù)據(jù)收集階段,數(shù)據(jù)庫(kù)僅對(duì)現(xiàn)有作品及信息進(jìn)行采集與整合,將內(nèi)容存儲(chǔ)于數(shù)據(jù)庫(kù)中。文章認(rèn)為,根據(jù)著作權(quán)法“固定性 + 可復(fù)制性”的判定標(biāo)準(zhǔn),由于該過(guò)程未實(shí)際實(shí)施傳播行為,因此不構(gòu)成著作權(quán)侵權(quán)。但是,基于數(shù)據(jù)庫(kù)是生成式人工智能進(jìn)行學(xué)習(xí)、產(chǎn)生生成物的基礎(chǔ),立法部門應(yīng)當(dāng)在該階段對(duì)數(shù)據(jù)收集進(jìn)行限制一一優(yōu)先使用公共領(lǐng)域數(shù)據(jù)或授權(quán)數(shù)據(jù),避免直接抓取受版權(quán)保護(hù)的作品;在涉及存在知識(shí)產(chǎn)權(quán)的數(shù)據(jù)抓取上,與數(shù)據(jù)提供商簽訂合法協(xié)議以確保數(shù)據(jù)來(lái)源可追溯,從而在源頭上降低侵權(quán)風(fēng)險(xiǎn)[12]。同時(shí),生成式人工智能開(kāi)發(fā)者須嚴(yán)格遵守著作權(quán)法的規(guī)定,結(jié)合《生成式人工智能服務(wù)管理暫行辦法》第九條“提供者應(yīng)當(dāng)依法承擔(dān)網(wǎng)絡(luò)信息內(nèi)容生產(chǎn)者責(zé)任,履行網(wǎng)絡(luò)信息安全義務(wù)。涉及個(gè)人信息的,依法承擔(dān)個(gè)人信息處理者責(zé)任,履行個(gè)人信息保護(hù)義務(wù)?!钡囊?guī)定,通過(guò)與著作權(quán)人簽訂授權(quán)協(xié)議,明確數(shù)據(jù)采集范圍和使用方式、利用經(jīng)合法授權(quán)的開(kāi)源數(shù)據(jù)庫(kù)、限定收集公共領(lǐng)域作品內(nèi)容等措施,有效規(guī)避數(shù)據(jù)收集環(huán)節(jié)的復(fù)制權(quán)侵權(quán)風(fēng)險(xiǎn)。同時(shí),在第七條將獲得原作者授權(quán)的合法作品納入數(shù)據(jù)庫(kù)的基礎(chǔ)上,立法部門應(yīng)明確對(duì)著作權(quán)違禁作品、違法作品及通過(guò)爬蟲(chóng)程序等侵權(quán)手段獲取的內(nèi)容采取禁止性規(guī)定。此外,立法部門還應(yīng)強(qiáng)調(diào)生成式人工智能服務(wù)提供者的注意義務(wù)。對(duì)此,立法部門可借鑒“廣州法院判決AI生成奧特曼侵權(quán)案”法院裁判的判決意見(jiàn),即生成式人工智能服務(wù)提供者通過(guò)采取關(guān)鍵詞過(guò)濾等管控措施,確保即使用戶輸入與特定作品相關(guān)的提示詞,系統(tǒng)也不會(huì)生成與該作品構(gòu)成實(shí)質(zhì)性相似的文本或圖片內(nèi)容。
(二)確保學(xué)習(xí)階段的嚴(yán)格性
若想確保生成式人工智能輸出階段不再侵犯原作者的復(fù)制權(quán)、信息網(wǎng)絡(luò)傳播權(quán)、表演者權(quán)等版權(quán),生成式人工智能開(kāi)發(fā)者需要保證其運(yùn)行的前面的各個(gè)階段符合相關(guān)要求,不能存在侵犯原作者版權(quán)的行為。在學(xué)習(xí)階段,生成式人工智能開(kāi)發(fā)者要特別重視生成式人工智能的特殊的表達(dá)機(jī)器學(xué)習(xí)類型可能面臨侵犯原作者的改編權(quán)的問(wèn)題。在此階段,開(kāi)發(fā)者應(yīng)當(dāng)在模型訓(xùn)練和優(yōu)化時(shí)謹(jǐn)慎處理所收集的數(shù)據(jù)內(nèi)容,防止其所采用的技術(shù)和手段直接復(fù)制和濫用原作者的創(chuàng)作成果,構(gòu)成侵權(quán)。為兼顧法律適用的穩(wěn)定性與人工智能技術(shù)的良性發(fā)展,我國(guó)可在現(xiàn)行著作權(quán)法框架下,將生成式人工智能使用作品的行為納入合理使用范疇,同時(shí)設(shè)定以下限制條件:其一,使用目的不得構(gòu)成惡意競(jìng)爭(zhēng)或損害權(quán)利人利益;其二,對(duì)用于商業(yè)用途的生成內(nèi)容,需要通過(guò)“三步檢驗(yàn)法”評(píng)估其合理使用邊界;其三,參照歐盟《人工智能法案》建立素材來(lái)源披露機(jī)制,確保訓(xùn)練數(shù)據(jù)的可追溯性。這一制度既能為生成式人工智能的發(fā)展提供法律保障,又能維護(hù)著作權(quán)法的核心價(jià)值,同時(shí)促進(jìn)原創(chuàng)作品的合法傳播,實(shí)現(xiàn)文化知識(shí)的良性擴(kuò)散。
(三)明確人工智能生成物的版權(quán)歸屬
針對(duì)生成式人工智能生成物的版權(quán)歸屬,國(guó)內(nèi)外一直存在爭(zhēng)議。法國(guó)、德國(guó)、意大利等歐盟國(guó)家以及美國(guó)均不支持人工智能生成物的可版權(quán)性,認(rèn)為著作權(quán)制度的中心應(yīng)為人類,并非人工智能系統(tǒng),且美國(guó)版權(quán)局在其發(fā)布的美國(guó)聯(lián)邦法規(guī)第202部分《版權(quán)登記指南》中明確規(guī)定了人工智能生成的作品不受版權(quán)法的保護(hù)。
我國(guó)理論界對(duì)此問(wèn)題也展開(kāi)了激烈的探討。張平教授從著作權(quán)法視角出發(fā),指出權(quán)利主體不僅限于自然人,還包括法人及非法人組織等非自然人主體,因而主張應(yīng)采用客體判斷標(biāo)準(zhǔn),即以生成內(nèi)容是否具有獨(dú)創(chuàng)性作為認(rèn)定其構(gòu)成著作權(quán)法保護(hù)作品的實(shí)質(zhì)要件。馮曉青教授與韋之也贊同此觀點(diǎn),他們認(rèn)為,人工智能生成物是經(jīng)人類提示的具有思想性的產(chǎn)物,只要通過(guò)查重等手段證明其具有獨(dú)創(chuàng)性就可被認(rèn)定為作品。孫遠(yuǎn)釗教授、丁曉東教授與李琛教授主張采取主體判斷標(biāo)準(zhǔn),認(rèn)為人工智能不符合著作權(quán)法規(guī)定的創(chuàng)作主體和權(quán)利主體資格要件。
文章認(rèn)為,若人工智能生成內(nèi)容滿足著作權(quán)法規(guī)定的“獨(dú)創(chuàng)性”要求,即應(yīng)被認(rèn)定為受保護(hù)的作品,其著作權(quán)應(yīng)歸屬生成式人工智能的使用者。一方面,技術(shù)開(kāi)發(fā)者與提供者通過(guò)模型商業(yè)化應(yīng)用已獲取經(jīng)濟(jì)效益,而生成內(nèi)容則是使用者在基礎(chǔ)指令框架下,通過(guò)持續(xù)調(diào)整優(yōu)化形成的個(gè)性化智力成果,應(yīng)視為使用者的獨(dú)創(chuàng)性表達(dá);另一方面,現(xiàn)行《中華人民共和國(guó)民法典》和《中華人民共和國(guó)著作權(quán)法》確立的法律框架明確將著作權(quán)主體限定為自然人、法人及非法人組織等平等民事主體,其立法目的在于保護(hù)創(chuàng)作者對(duì)作品享有的財(cái)產(chǎn)權(quán)益,基于維護(hù)法律體系內(nèi)在統(tǒng)一性的要求,當(dāng)前司法實(shí)踐不宜將生成式人工智能認(rèn)定為適格的著作權(quán)主體。此外,生成式人工智能根據(jù)使用者的指令和設(shè)定條件所產(chǎn)生的內(nèi)容,本質(zhì)上屬于人類提升信息處理效率的工具性產(chǎn)物,完全服務(wù)于使用者的特定需求,故其著作權(quán)應(yīng)歸屬于生成式人工智能的使用者。
(四)構(gòu)建全方位監(jiān)管體系,促進(jìn)生成式人工智能的成長(zhǎng)
生成式人工智能通過(guò)大數(shù)據(jù)算法完成內(nèi)容生成后,將產(chǎn)出具有創(chuàng)造性的生成內(nèi)容。相關(guān)主體不僅需要界定此類內(nèi)容的法律屬性與權(quán)利歸屬,更需要建立有效的監(jiān)管機(jī)制以防范潛在的版權(quán)爭(zhēng)議。
首先,相較其他主體,生成式人工智能的開(kāi)發(fā)者對(duì)生成式人工智能模型享有最大的控制權(quán),也對(duì)其擁有全面的了解。雖然人工智能生成內(nèi)容的著作權(quán)歸屬于使用者,但是開(kāi)發(fā)者仍須承擔(dān)首要監(jiān)管責(zé)任,以持續(xù)優(yōu)化生成模型,推動(dòng)技術(shù)創(chuàng)新發(fā)展。生成式人工智能開(kāi)發(fā)者可通過(guò)以下方式履行其監(jiān)管責(zé)任:出具相關(guān)的版權(quán)聲明文件以及數(shù)據(jù)來(lái)源公開(kāi)文件,采取水印、特征提取和比對(duì)、自動(dòng)監(jiān)管系統(tǒng)等手段[13],同時(shí)定期核查數(shù)據(jù)來(lái)源的合法性,及時(shí)處置未授權(quán)內(nèi)容,從源頭降低版權(quán)侵權(quán)風(fēng)險(xiǎn)。
其次,生成式人工智能使用者作為技術(shù)應(yīng)用的指令發(fā)出方和生成內(nèi)容的著作權(quán)人,自指令輸入至內(nèi)容產(chǎn)出的全過(guò)程均須承擔(dān)主體責(zé)任,其生成內(nèi)容是否構(gòu)成侵權(quán)將直接影響自身合法權(quán)益。因此,生成式人工智能使用者也應(yīng)當(dāng)被納進(jìn)監(jiān)管生成式人工智能的主體隊(duì)列中。其應(yīng)當(dāng)在發(fā)布指令時(shí)嚴(yán)格限定發(fā)布條件,不得濫用其主體權(quán)利損害他人的版權(quán);在作品生成完成后,要及時(shí)采取審查措施,判斷其中是否存在侵犯他人版權(quán)的情形,確認(rèn)無(wú)任何侵權(quán)風(fēng)險(xiǎn)后再將作品公開(kāi)發(fā)行或營(yíng)利使用。
最后,政府機(jī)構(gòu)應(yīng)當(dāng)承擔(dān)作為公權(quán)力機(jī)關(guān)的社會(huì)責(zé)任。一方面,政府機(jī)構(gòu)應(yīng)充分發(fā)揮公信力優(yōu)勢(shì),積極開(kāi)展知識(shí)產(chǎn)權(quán)普法宣傳,面向社會(huì)公眾系統(tǒng)性地普及知識(shí)產(chǎn)權(quán)知識(shí),提升全民知識(shí)產(chǎn)權(quán)保護(hù)意識(shí),促進(jìn)形成尊重和保護(hù)知識(shí)產(chǎn)權(quán)的社會(huì)氛圍,從而從源頭上減少版權(quán)侵權(quán)行為的發(fā)生。另一方面,為有效監(jiān)管生成式人工智能的版權(quán)問(wèn)題,相關(guān)政府管理部門應(yīng)當(dāng)與生成式人工智能開(kāi)發(fā)者建立協(xié)同配合的監(jiān)管體系,通過(guò)實(shí)施政府引導(dǎo)與企業(yè)自律相結(jié)合的雙重監(jiān)管機(jī)制,切實(shí)降低生成式人工智能引發(fā)版權(quán)糾紛的可能性。
五、結(jié)語(yǔ)
生成式人工智能的出現(xiàn)掀開(kāi)了強(qiáng)人工智能時(shí)代的序幕,相較普通人工智能而言,其在使用算法技術(shù)分析數(shù)據(jù)的基礎(chǔ)上增加了條件接收和生成反饋的環(huán)節(jié)[14]。這一變革在為科技和人類生活帶來(lái)便利的同時(shí),也給傳統(tǒng)版權(quán)體系帶來(lái)巨大的沖擊和挑戰(zhàn)。在分層視角下,文章提出,在數(shù)據(jù)收集階段,相關(guān)主體應(yīng)采取“數(shù)據(jù)抓取先后原則與技術(shù)人員責(zé)任加強(qiáng)并舉”措施,以遏制源頭侵權(quán)現(xiàn)象的發(fā)生;在學(xué)習(xí)階段,相關(guān)主體應(yīng)采取“合理使用版權(quán)作品、提升改編、復(fù)制生成素材的透明度”措施,以降低侵權(quán)概率;在權(quán)利歸屬階段,相關(guān)主體應(yīng)采取“確定生成物原則上歸屬于使用者”的權(quán)利主張。各責(zé)任主體承擔(dān)相應(yīng)的監(jiān)管責(zé)任,共同促進(jìn)人工智能健康升級(jí)發(fā)展與版權(quán)保護(hù)之平衡,進(jìn)而在實(shí)現(xiàn)生成式人工智能技術(shù)創(chuàng)新和進(jìn)步的同時(shí),最大化地達(dá)到著作權(quán)法的立法目的,保護(hù)作者對(duì)其作品的合法權(quán)益,促進(jìn)技術(shù)進(jìn)步與人類思想深度挖掘的同步實(shí)現(xiàn)。
[參考文獻(xiàn)]
[1]譚鐵牛.人工智能的歷史、現(xiàn)狀和未來(lái)[J].智慧中國(guó),2019(Z1):87-91.
[2]三劍定乾坤.人工智能:發(fā)展現(xiàn)狀和應(yīng)用前景[EB/OL].(2023-11-09)[2025-05-05].https://mp.weixin.qq.com/s/QMj8AODIkgma-psDSR ZJ3g.
[3]Ai腦洞.什么是生成式人工智能[EB/OL].(2023-08-18)[2025-05-05].ttps://b23.tv/DWigY3m.
[4]韓雨瀟.生成式人工智能作品版權(quán)歸屬問(wèn)題研究[J].揚(yáng)州大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2023(04):52-64.
[5]王利明.生成式人工智能侵權(quán)的法律應(yīng)對(duì)[J].中國(guó)應(yīng)用法學(xué),2023(05):27-38.
[6]中央財(cái)辦有關(guān)負(fù)責(zé)同志詳解中央經(jīng)濟(jì)工作會(huì)議精神[EB/OL].(2023-12-18)[2025-05-05].https://www.gov.cn/zhengce/202312/content_6920788.htm.
[7]詹愛(ài)嵐,田一農(nóng).生成式人工智能機(jī)器學(xué)習(xí)中的著作權(quán)風(fēng)險(xiǎn)及其化解路徑[J].電子知識(shí)產(chǎn)權(quán),2023(11):4-14.
[8]李安.機(jī)器學(xué)習(xí)作品的著作權(quán)法分析:非作品性使用、合理使用與侵權(quán)使用[J].電子知識(shí)產(chǎn)權(quán),2020(06): 60-70.
[9]張金平.論人工智能生成物可版權(quán)性及侵權(quán)責(zé)任承擔(dān)[J].南京社會(huì)科學(xué),2023(10):77-89.
[10」張欣.生成式人工智能的數(shù)據(jù)風(fēng)險(xiǎn)與治理路徑[J].法律科學(xué)(西北政法大學(xué)學(xué)報(bào)),2023(05):42-54.
[11]施小雪.重塑復(fù)制權(quán):生成式人工智能數(shù)據(jù)訓(xùn)練的合法化路徑[J].東方法學(xué),2024(06):70-83.
[12]張偉君.論大模型訓(xùn)練中使用數(shù)據(jù)的著作權(quán)規(guī)制路徑[J].東方法學(xué),2025(02):79-92.
[13]崔原,連鵬飛,任曉,等.生成式人工智能知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)及應(yīng)對(duì)思路[C」//中國(guó)家用電器協(xié)會(huì).2023年中國(guó)家用電器技術(shù)大會(huì)論文集.青島海爾科技有限公司;數(shù)字化家電國(guó)家重點(diǎn)實(shí)驗(yàn)室,2023.
[14]劉霜,張瀟月.生成式人工智能數(shù)據(jù)風(fēng)險(xiǎn)的法律保護(hù)與規(guī)制研究:以ChatGPT潛在數(shù)據(jù)風(fēng)險(xiǎn)為例[J].貴州大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2023(05):87-97.