摘要:人工智能在開發(fā)階段面臨訓(xùn)練數(shù)據(jù)來源的著作權(quán)合法性問題。在制度層面上,體現(xiàn)為作品使用新方式的出現(xiàn)對傳統(tǒng)合理使用規(guī)則的沖擊問題;在法理層面上,體現(xiàn)為著作權(quán)人與公眾的利益分配問題。鑒于人工智能的數(shù)據(jù)使用行為是非傳統(tǒng)復(fù)制行為,考慮到人工智能產(chǎn)業(yè)發(fā)展對于大規(guī)模訓(xùn)練數(shù)據(jù)的實(shí)際需求與確保公眾對作品的適當(dāng)接近、促進(jìn)文化藝術(shù)繁榮的公共利益需求,有充分理由將人工智能使用作品進(jìn)行訓(xùn)練的行為視為一種轉(zhuǎn)換性使用行為,從而納入合理使用范疇。同時,為作者提供配套的名譽(yù)補(bǔ)償機(jī)制及人工智能生成內(nèi)容實(shí)質(zhì)性侵權(quán)的救濟(jì)路徑;倡導(dǎo)企業(yè)建立共享數(shù)據(jù)資源庫以達(dá)成企業(yè)經(jīng)濟(jì)效益與社會責(zé)任的平衡。
關(guān)鍵詞:合理使用;人工智能;訓(xùn)練數(shù)據(jù);功能主義;轉(zhuǎn)換性使用
一、問題的提出
人工智能模型的訓(xùn)練過程高度依賴于數(shù)據(jù)驅(qū)動。數(shù)據(jù)是實(shí)現(xiàn)迭代和優(yōu)化的基礎(chǔ),人工智能模型通過分析大量的訓(xùn)練數(shù)據(jù)來提取特征、建立規(guī)律。數(shù)據(jù)量越大,越能發(fā)掘潛在的復(fù)雜規(guī)律,進(jìn)而提高人工智能模型的性能和質(zhì)量。同時,豐富的數(shù)據(jù)也有助于人工智能模型在面對未曾見過的情況時表現(xiàn)出較好的泛化能力,即能夠有效應(yīng)用于未知場景,實(shí)現(xiàn)從特定領(lǐng)域人工智能向通用人工智能的轉(zhuǎn)化。因此,如果無法使用大量數(shù)據(jù)進(jìn)行訓(xùn)練,人工智能模型的性能、泛化能力和實(shí)用性將受到嚴(yán)重制約,進(jìn)而對人工智能技術(shù)在各個行業(yè)領(lǐng)域中的應(yīng)用造成負(fù)面影響。
當(dāng)前,關(guān)于人工智能所涉著作權(quán)問題的討論焦點(diǎn)集中在由人工智能產(chǎn)出內(nèi)容的作品性質(zhì)認(rèn)定及其權(quán)利歸屬之上。這一焦點(diǎn)主要處理的是輸出階段的著作權(quán)問題,但也要注意到,在人工智能輸入階段與訓(xùn)練數(shù)據(jù)相關(guān)的著作權(quán)問題同樣亟待解答,在某種意義上甚至是更為根本的問題。未經(jīng)適當(dāng)授權(quán)或不符合知識產(chǎn)權(quán)法律法規(guī)的訓(xùn)練數(shù)據(jù)的使用,可能會導(dǎo)致后續(xù)輸出內(nèi)容合法性基礎(chǔ)的缺失,從而動搖整個人工智能產(chǎn)品的法律根基,對作品著作權(quán)人和訓(xùn)練人工智能的相關(guān)企業(yè)或科研院所的權(quán)益造成損害。
根據(jù)既有的著作權(quán)理論,著作權(quán)侵權(quán)通常涉及未經(jīng)許可復(fù)制受保護(hù)的作品,或者以某種方式利用作品而未獲得原作者授權(quán)的行為。我國《著作權(quán)法》第三條規(guī)定的九種作品類型中,大多數(shù)類型皆可以作為人工智能訓(xùn)練的對象。人工智能不像人類那樣能夠從作品中自主學(xué)習(xí),而是必須通過使用作品來進(jìn)行訓(xùn)練。這意味著,在構(gòu)建訓(xùn)練數(shù)據(jù)集時,無論是完整收錄還是部分提取特征,都不得不對受著作權(quán)保護(hù)的文字、美術(shù)及視聽作品等進(jìn)行復(fù)制,從而直接觸及著作權(quán)人的權(quán)利。我國《計(jì)算機(jī)軟件保護(hù)條例》和《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》僅對特定臨時復(fù)制行為進(jìn)行豁免,無法涵蓋人工智能訓(xùn)練過程中對作品的復(fù)制情形。由此引發(fā)使用受著作權(quán)保護(hù)的作品來訓(xùn)練人工智能是否侵犯其相關(guān)權(quán)益的問題。
如果要規(guī)避著作權(quán)侵權(quán)風(fēng)險,那么在利用相關(guān)作品進(jìn)行訓(xùn)練之前,需要事先取得各權(quán)利人的許可。然而,實(shí)踐中,人工智能訓(xùn)練所需求的巨大數(shù)據(jù)量引致了所涉作品權(quán)利主體眾多、權(quán)利狀態(tài)不清晰、許可程序繁瑣等問題,使得這一規(guī)避侵權(quán)風(fēng)險的安全途徑難以實(shí)現(xiàn)。數(shù)據(jù)作為人工智能的驅(qū)動力,直接影響著人工智能產(chǎn)業(yè)發(fā)展的廣度與深度。目前的法律制度尚未適應(yīng)這一新興需求,法律上的不確定性將在一定程度上抑制人工智能技術(shù)的研發(fā)與應(yīng)用。若嚴(yán)格禁止未經(jīng)授權(quán)使用受著作權(quán)保護(hù)的作品,則可能阻礙人工智能技術(shù)的開發(fā)與應(yīng)用,這與《著作權(quán)法》鼓勵創(chuàng)新的初衷相悖。
本文從人工智能使用作品進(jìn)行訓(xùn)練之行為定性與利益衡量兩條主線展開,首先分析在目前的法律框架下,人工智能使用作品進(jìn)行訓(xùn)練在行為定性上存在的著作權(quán)侵權(quán)風(fēng)險以及作者、企業(yè)各自潛在的經(jīng)濟(jì)損失;隨后結(jié)合人工智能使用作品行為的技術(shù)特點(diǎn),闡明其與傳統(tǒng)復(fù)制行為的區(qū)別與轉(zhuǎn)換性使用的實(shí)質(zhì),并對多方利益進(jìn)行再考量;最后運(yùn)用功能主義方法論,從解釋論視角證成基于《著作權(quán)法》立法目的,將人工智能使用作品進(jìn)行訓(xùn)練這一行為納入合理使用范圍是可行之道。
二、人工智能訓(xùn)練之著作權(quán)侵權(quán)風(fēng)險檢視
在我國《著作權(quán)法》的框架下,人工智能訓(xùn)練過程中對作品的使用行為引發(fā)的法律問題呈現(xiàn)出多維度特征。本章圍繞兩條主要線索展開,分別從行為的法律屬性分析與經(jīng)濟(jì)利益考量兩方面探討人工智能訓(xùn)練活動對原作品著作權(quán)相關(guān)權(quán)益的影響;隨后討論著作權(quán)權(quán)利限制機(jī)制在人工智能訓(xùn)練場景下的適用可能性。
(一)人工智能訓(xùn)練行為對著作權(quán)相關(guān)權(quán)益的影響
1. 行為屬性分析
(1)復(fù)制權(quán)
有學(xué)者認(rèn)為,在以作品的有形形式作為傳播手段的時代,復(fù)制權(quán)是著作權(quán)制度中具有原初性、基礎(chǔ)性地位的重要權(quán)利。復(fù)制權(quán)使得著作權(quán)人有權(quán)授權(quán)他人復(fù)制其作品,或者禁止他人未經(jīng)許可復(fù)制其作品。這一權(quán)利可以追溯至18 世紀(jì)末、19 世紀(jì)初歐洲國家開始實(shí)施版權(quán)法律時,主要是為了保護(hù)書籍和藝術(shù)作品不受非法印刷和復(fù)制品的影響。1886 年簽訂的《伯爾尼保護(hù)文學(xué)和藝術(shù)作品公約》(以下簡稱《伯爾尼公約》)在第九條第一款中明確承認(rèn)作者對其作品享有復(fù)制權(quán),成員國必須確保作者有權(quán)授權(quán)或禁止任何種類的復(fù)制行為。這一誕生于傳統(tǒng)紙質(zhì)出版時代的權(quán)利在進(jìn)入數(shù)字時代后進(jìn)行了擴(kuò)張。復(fù)制的概念不僅限于物理形式的翻印、復(fù)印,還包括將作品轉(zhuǎn)換成數(shù)字形式存入電子設(shè)備的過程。1996 年簽訂的《世界知識產(chǎn)權(quán)組織版權(quán)條約》(WCT)第一條指明《伯爾尼公約》第九條所規(guī)定的復(fù)制權(quán)及其所允許的例外,完全適用于數(shù)字環(huán)境,尤其是以數(shù)字形式使用作品的情況。換言之,在電子媒體中以數(shù)字形式存儲受保護(hù)的作品,構(gòu)成《伯爾尼公約》第九條意義下的復(fù)制?!杜c貿(mào)易有關(guān)的知識產(chǎn)權(quán)協(xié)定》(TRIPs)第十一條進(jìn)一步鞏固了這一權(quán)利,要求成員方應(yīng)當(dāng)給予文學(xué)和藝術(shù)作品的作者防止未經(jīng)授權(quán)而復(fù)制其作品的有效保護(hù)。我國《著作權(quán)法》第十條第五項(xiàng)以半開放的形式列舉了八種復(fù)制方式,其中“數(shù)字化”方式為2020年修改之時新增,體現(xiàn)出立法者對作品在網(wǎng)絡(luò)空間內(nèi)傳播和使用情形的關(guān)注,反映了其對數(shù)字時代著作權(quán)保護(hù)的敏銳回應(yīng)。
2023 年 9 月, 美 國 作 家 協(xié) 會( AuthorsGuild)向法院遞交起訴狀,對OpenAI 發(fā)起集體訴訟,指控OpenAI 在未經(jīng)授權(quán)的情況下,將作者的版權(quán)作品大量復(fù)制并用于訓(xùn)練其大ww型語言模型。同年12 月,《紐約時報》(TheNew York Times)對OpenAI 和微軟提起訴訟,指控二者未經(jīng)許可使用了其數(shù)百萬篇文章來訓(xùn)練包括ChatGPT 在內(nèi)的AI 聊天機(jī)器人?!都~約時報》聲稱,OpenAI 和微軟的這種行為侵犯了其新聞報道的版權(quán),因?yàn)槠湮淳褪褂眠@些作品進(jìn)行人工智能模型的訓(xùn)練達(dá)成許可協(xié)議。
當(dāng)人工智能在訓(xùn)練階段使用受版權(quán)保護(hù)的作品時,無論是將文本、音樂、圖像還是其他類型的作品納入訓(xùn)練數(shù)據(jù)集,都需要先將作品復(fù)制到存儲介質(zhì)中。在現(xiàn)行法律制度下,這種復(fù)制行為如果沒有得到版權(quán)所有者的授權(quán),便構(gòu)成了對復(fù)制權(quán)的侵犯。即使這種復(fù)制是在系統(tǒng)內(nèi)部進(jìn)行,且不直接向公眾展示,但它是人工智能學(xué)習(xí)過程中的必要步驟,如果未獲得權(quán)利人許可,依然可能觸及復(fù)制權(quán)保護(hù)的邊界。除非適用特殊豁免條款(例如合理使用、法定許可等),否則此類行為存在被認(rèn)定侵犯復(fù)制權(quán)的風(fēng)險。
(2)改編權(quán)
改編權(quán)是指著作權(quán)人依法享有的將原作品改編成具有獨(dú)創(chuàng)性的新作品的權(quán)利。在人工智能的語境下,如果人工智能在進(jìn)行訓(xùn)練后,不僅僅是機(jī)械地復(fù)制或簡單反映原作品的內(nèi)容,而是通過對原作品的理解、分析,產(chǎn)出與原作品有相同主題、敘述線或關(guān)鍵元素,在表達(dá)上有所變化,且具有創(chuàng)新性的新內(nèi)容,那么這種過程可視為對原作進(jìn)行了某種程度的改編。
由ING 荷蘭國際集團(tuán)提供資金支持,智威湯遜廣告公司(J. Walter Thompson 機(jī)構(gòu)) 主導(dǎo),微軟、代爾夫特理工大學(xué)和倫勃朗故居博物館提供相關(guān)資源支持的微軟和荷蘭國際銀行的“下一個倫勃朗(The Next Rembrandt)”項(xiàng)目,收集了倫勃朗的所有作品數(shù)據(jù)來訓(xùn)練人工智能,進(jìn)而創(chuàng)作出類似倫勃朗風(fēng)格的新畫作。這一過程即涉及對倫勃朗作品的改編,因?yàn)樗趯υ髌返挠?xùn)練最終產(chǎn)生的新內(nèi)容體現(xiàn)了原作者的風(fēng)格和具體要素。由于倫勃朗已經(jīng)逝世數(shù)百年,他的作品已經(jīng)進(jìn)入了公共領(lǐng)域,在這種情況下,利用其作品進(jìn)行訓(xùn)練的行為并不存在侵權(quán)風(fēng)險。然而,人工智能訓(xùn)練過程中涉及大量仍處于著作權(quán)保護(hù)期限之內(nèi)的作品,當(dāng)人工智能輸出的內(nèi)容與原作品之間形成了具有創(chuàng)造性關(guān)聯(lián)的新內(nèi)容(特別是在保留了原作品的基本表達(dá)要素的基礎(chǔ)上形成的新內(nèi)容)時,如果未經(jīng)授權(quán),仍然存在改編權(quán)的侵權(quán)風(fēng)險。
(3)信息網(wǎng)絡(luò)傳播權(quán)
根據(jù)我國《著作權(quán)法》的規(guī)定,信息網(wǎng)絡(luò)傳播權(quán)是指著作權(quán)人有權(quán)決定是否允許他人通過有線或無線方式將其作品向公眾提供,使得公眾能夠在其選定的時間和地點(diǎn)獲得該作品的權(quán)利。
從使用行為上來講,人工智能在訓(xùn)練階段使用的通常是大量的訓(xùn)練數(shù)據(jù)集,這些數(shù)據(jù)集可能包含受版權(quán)保護(hù)的完整作品或作品片段。在訓(xùn)練即內(nèi)部使用階段,如果僅僅是算法模型在封閉環(huán)境中學(xué)習(xí)和分析數(shù)據(jù),并未將原始作品公之于眾或通過信息網(wǎng)絡(luò)提供給公眾下載或?yàn)g覽等,理論上并不構(gòu)成對信息網(wǎng)絡(luò)傳播權(quán)的直接侵犯。然而,有學(xué)者指出,在實(shí)踐中,機(jī)器學(xué)習(xí)等行為通常要求數(shù)據(jù)在網(wǎng)絡(luò)上傳輸或存儲在云端服務(wù)器上,這一步驟可能構(gòu)成對原作品的“向公眾傳播”。另一方面,當(dāng)人工智能生成新內(nèi)容時,如果其中包含了對原作品實(shí)質(zhì)性的引用或復(fù)現(xiàn),導(dǎo)致生成內(nèi)容與原作品存在實(shí)質(zhì)上的相似性,那么在后續(xù)的公開傳播中將可能侵犯原作品的信息網(wǎng)絡(luò)傳播權(quán)。即使目的并非直接公開展示作品,但只要是通過技術(shù)手段使作品可以被公眾通過信息網(wǎng)絡(luò)傳播方式獲得,哪怕只是間接地觸及了作品的存取和使用,也有可能觸犯信息網(wǎng)絡(luò)傳播權(quán)。
2. 經(jīng)濟(jì)利益考量
(1)個人的抵抗情緒
作者之所以反對自己的作品未經(jīng)同意就被用于訓(xùn)練人工智能,主要是出于對眼下經(jīng)濟(jì)利益和未來職業(yè)發(fā)展的悲觀考量。
在經(jīng)濟(jì)利益方面,作者可能喪失潛在的收入。換言之,作者可能失去通過授權(quán)使用作品獲得報酬的機(jī)會。許多作者依靠許可作品的使用來獲取收益,比如出版、二次創(chuàng)作、改編等。作品未經(jīng)許可被用于人工智能訓(xùn)練,將減少作者通過授權(quán)獲得的經(jīng)濟(jì)效益。另一方面,即使使用其作品進(jìn)行訓(xùn)練的相關(guān)企業(yè)愿意支付許可費(fèi)用,費(fèi)用也可能難以恰當(dāng)反映作品的真實(shí)價值。
進(jìn)一步講,作者不僅關(guān)注眼前的實(shí)際經(jīng)濟(jì)損失,更擔(dān)憂未來的職業(yè)前景。人工智能生成內(nèi)容(AI Generated Content,AIGC)的逐漸成熟,在一定程度上替代了原有作者的市場生態(tài)位。早在2014 年,就有利用人工智能撰寫新聞稿件的事情發(fā)生,如今的大語言模型更能生成與人類作者難以區(qū)分的內(nèi)容,沖擊了由人類作者進(jìn)行創(chuàng)作的傳統(tǒng)商業(yè)創(chuàng)作模式,并對作為訓(xùn)練數(shù)據(jù)的原作品產(chǎn)生難以忽略的競爭威脅,這一現(xiàn)實(shí)引發(fā)作者被替代的擔(dān)憂。2024 年4 月,200余名音樂家通過藝術(shù)家權(quán)利聯(lián)盟發(fā)布了一封公開信,呼吁人工智能開發(fā)者、技術(shù)公司、平臺和數(shù)字音樂服務(wù)商停止使用人工智能侵犯和貶低人類藝術(shù)家的權(quán)利。信中提到,一些最強(qiáng)大的技術(shù)公司正在利用其作品來訓(xùn)練人工智能模型,這些行為正在用大量人工智能創(chuàng)作的“聲音”和“圖像”取代人類藝術(shù)家的作品,這些聲音和圖像大大稀釋了支付給藝術(shù)家的版稅,而這對于許多音樂家、藝術(shù)家和詞曲作家來說,將是災(zāi)難性的。
(2)企業(yè)的違規(guī)風(fēng)險
從人工智能企業(yè)的角度來看,使用他人作品來訓(xùn)練人工智能也將面臨一系列《著作權(quán)法》上的侵權(quán)風(fēng)險,一旦被認(rèn)定侵權(quán)將招致經(jīng)濟(jì)損失。
一方面,企業(yè)在灰色地帶運(yùn)作可能會面臨侵權(quán)糾紛。當(dāng)前法律法規(guī)對于人工智能訓(xùn)練過程中使用作品的相關(guān)規(guī)定尚不明確,一旦敗訴,企業(yè)會面臨支付巨額賠償金的情形,品牌形象也可能因此受損,甚至被迫更改商業(yè)策略,相應(yīng)的市場也因此收縮。如前所述,雖然在某些情況下,在人工智能的訓(xùn)練過程中對仍在著作權(quán)保護(hù)期內(nèi)的作品的使用可能以合理使用進(jìn)行侵權(quán)抗辯,但這一點(diǎn)在法律界尚未達(dá)成一致意見。合理使用抗辯通常需要滿足一定的條件,如非商業(yè)用途、適量引用等,而商業(yè)使用和大規(guī)模的數(shù)據(jù)抓取顯然更具爭議性。未經(jīng)授權(quán)而使用他人作品作為訓(xùn)練數(shù)據(jù),可能導(dǎo)致對原權(quán)利人復(fù)制權(quán)、改編權(quán)以及其他相關(guān)權(quán)利的侵犯,企業(yè)始終面臨潛在的不合規(guī)風(fēng)險。另一方面,企業(yè)也面臨許可成本高昂的問題。如果要合法使用大量版權(quán)作品,企業(yè)可能需要支付高昂的版權(quán)許可費(fèi)用。有學(xué)者認(rèn)為,“事前授權(quán)”式使用付費(fèi)模式與海量的學(xué)習(xí)材料需求之間存在齟齬,會導(dǎo)致交易效率低下、交易成本增加等負(fù)面結(jié)果。
(二)著作權(quán)限制制度的適用困境
1. 法定許可與強(qiáng)制許可適用不能
一般而言,對著作權(quán)的限制制度主要包括法定許可、強(qiáng)制許可和合理使用三種。
法定許可制度是指在特定情形下,對未經(jīng)他人許可而有償使用他人享有著作權(quán)的作品的行為依法不認(rèn)定為侵權(quán)。但在人工智能訓(xùn)練場景下,訓(xùn)練數(shù)據(jù)集可能包含大量不同類型的作品,難以通過單一的法定許可機(jī)制處理所有類型的版權(quán)問題,處理起來十分復(fù)雜。且法定許可通常包含了向權(quán)利人支付費(fèi)用的規(guī)定,但對于人工智能訓(xùn)練數(shù)據(jù)而言,由于難以量化每個作品對最終模型的價值貢獻(xiàn),如何公平定價并進(jìn)行有效補(bǔ)償成為難題。且我國《著作權(quán)法》第二十五條對于法定許可所列明的適用場景并不涵蓋人工智能訓(xùn)練數(shù)據(jù)的使用。
強(qiáng)制許可多見于專利領(lǐng)域,但著作權(quán)領(lǐng)域也有相關(guān)機(jī)制的存在。它在特定條件下允許政府授權(quán)第三方無歧視地使用某項(xiàng)專利,并通常伴隨一定的補(bǔ)償機(jī)制。但強(qiáng)制許可通常是基于公共政策需求或緊急狀況而使用,公權(quán)力應(yīng)保持謙抑態(tài)度,并不適合用于為了商業(yè)用途的大規(guī)模數(shù)據(jù)收集情形。此外,我國現(xiàn)行法律中并未設(shè)立強(qiáng)制許可制度。
因此,法定許可與強(qiáng)制許可均難以適用于解決人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)侵權(quán)問題。
2. 合理使用存在適用空間
許多國家的版權(quán)法中,都有合理使用(FairUse/ Fair Dealing)的存在。合理使用允許在特定情況下未經(jīng)版權(quán)所有人許可使用受版權(quán)保護(hù)的作品。這是一種旨在平衡著作權(quán)人專有權(quán)利與社會公共利益的侵權(quán)豁免機(jī)制,以確保公眾在一定條件下能夠自由使用已發(fā)表的作品而不必取得著作權(quán)人的授權(quán),同時免除法律上的侵權(quán)風(fēng)險。
我國《著作權(quán)法》第二十四條列舉了合理使用的情形,并在2020 年完成了第三次修訂。盡管這次修訂對合理使用制度進(jìn)行了完善,但“列舉+ 其他情形”的半開放式立法模式為將訓(xùn)練人工智能而使用他人作品納入合理使用范圍所提供的制度空間有限,這一機(jī)制已無法適應(yīng)人工智能時代對作品的使用。人工智能利用作品進(jìn)行訓(xùn)練在文義上不符合《著作權(quán)法》第二十四條所具體列舉的前十二種合理使用類型。首先,第二項(xiàng)至第十二項(xiàng)所列舉的情形完全不適用于人工智能訓(xùn)練場景,因此無法為人工智能訓(xùn)練行為提供豁免;其次,第一項(xiàng)所列明的為個人學(xué)習(xí)、研究目的而使用他人已發(fā)表的作品只能涵蓋個人對于人工智能進(jìn)行訓(xùn)練的行為,而這是極少數(shù)情形,人工智能模型的開發(fā)通常需要團(tuán)隊(duì)協(xié)作,企業(yè)及科研院所進(jìn)行的人工智能訓(xùn)練,并不能適用這一豁免。
美國《版權(quán)法》第一百零七條列明了合理使用的四個考量因素,其開放式的合理使用制度構(gòu)建方式為人工智能訓(xùn)練提供了更為靈活和更具解釋空間的環(huán)境。實(shí)踐中,通過Campbellv. Acuff- Rose Music, Inc. 案發(fā)展出的轉(zhuǎn)換性適用規(guī)則,進(jìn)一步拓展了合理使用的使用范圍。
為消除文本與數(shù)據(jù)挖掘(Text and DataMining,TDM)在法律上的不確定性,促進(jìn)相關(guān)科學(xué)研究與商業(yè)發(fā)展,歐盟《數(shù)字單一市場版權(quán)指令》(以下簡稱《DSM 指令》)引入了“文本和數(shù)據(jù)挖掘例外”,為教育工作者和商業(yè)人工智能開發(fā)人員提供通過復(fù)制作品或數(shù)據(jù)庫從文本和數(shù)據(jù)中提取信息的便利。
綜上所述,合理使用顯示出一定的適應(yīng)性和靈活性,具有潛在的應(yīng)用空間,這能夠?yàn)槿斯ぶ悄苡?xùn)練使用受版權(quán)保護(hù)的數(shù)據(jù)提供合法路徑。借鑒域外經(jīng)驗(yàn),可以對我國的合理使用制度進(jìn)行解釋論上的調(diào)試,使其更適應(yīng)新形勢下的人工智能技術(shù)發(fā)展情況。
三、人工智能訓(xùn)練之著作權(quán)法律重釋與經(jīng)濟(jì)效益重構(gòu)
本章結(jié)合人工智能訓(xùn)練過程的技術(shù)原理,首先,論證人工智能使用作品進(jìn)行訓(xùn)練的行為與傳統(tǒng)著作權(quán)所規(guī)制的使用方式和市場交易方式存在本質(zhì)區(qū)別;其次,從利益衡量角度進(jìn)行分析,說明這一行為在個人層面并未實(shí)質(zhì)性侵蝕作品的原有市場及作者權(quán)益,在企業(yè)層面也存在基于成本收益對比的合理性。
(一)人工智能使用作品行為再解讀
1. 非傳統(tǒng)復(fù)制行為
對人工智能的訓(xùn)練過程進(jìn)行分階段考慮,可區(qū)分為數(shù)據(jù)收集階段、預(yù)處理階段、模型訓(xùn)練階段和輸出階段。有觀點(diǎn)認(rèn)為,機(jī)器學(xué)習(xí)的各個階段中數(shù)據(jù)的處理行為僅為對作品內(nèi)容的“非作品性使用”,因此并不構(gòu)成著作權(quán)侵權(quán)。
首先,作品在數(shù)據(jù)收集階段、預(yù)處理階段和模型訓(xùn)練階段中經(jīng)歷了多次轉(zhuǎn)化和抽象處理,而非簡單地復(fù)制。人工智能在這三個階段的訓(xùn)練過程中對數(shù)據(jù)的處理不同于傳統(tǒng)意義上的復(fù)制行為:它并非直接向公眾展示或分發(fā)復(fù)制品,而是通過學(xué)習(xí)、分析數(shù)據(jù)改善自身算法模型。特別是自然語言處理和計(jì)算機(jī)視覺等領(lǐng)域的深度學(xué)習(xí)模型,開發(fā)者會收集大量的數(shù)據(jù)集,包括但不限于文本、圖像、音頻、視頻等各類受版權(quán)保護(hù)的作品,這些作品通常要經(jīng)過清洗、標(biāo)注等預(yù)處理步驟,以轉(zhuǎn)換成易于處理的格式。在這個過程中,由原始作品轉(zhuǎn)換而來的數(shù)據(jù)雖被讀取和解析,但并未形成與原作相同或完全一致的復(fù)制品,而是將其轉(zhuǎn)化為模型可以理解的形式特征或編碼,且這些訓(xùn)練數(shù)據(jù)并未對外展示或傳播。
其次,在輸出階段,人工智能模型并沒有再現(xiàn)輸入數(shù)據(jù)的具體內(nèi)容。模型的功能在于學(xué)習(xí)后進(jìn)行分析、生成新內(nèi)容等,以“學(xué)習(xí)”數(shù)據(jù)的表現(xiàn)模式,形成一種抽象的知識表征,并不能生成原始作品的精確復(fù)制品,更像是對數(shù)據(jù)內(nèi)在規(guī)律的一種模擬或歸納。
綜上所述,數(shù)據(jù)在這里并不是簡單地被“復(fù)制粘貼”至另一個載體,而是作為一種手段被用于構(gòu)建和優(yōu)化人工智能模型本身。這種使用方式能否直接落入現(xiàn)行《著作權(quán)法》中“復(fù)制權(quán)”的規(guī)制范疇,仍有待商榷。
2. 事實(shí)本身不受版權(quán)保護(hù)
著作權(quán)并不保護(hù)作品中的基本數(shù)據(jù)、事實(shí)和概念。我國《著作權(quán)法》第五條將單純事實(shí)消息、歷法等排除在外。美國《版權(quán)法》也指明版權(quán)保護(hù)不適用于任何思想、概念、原理或者發(fā)現(xiàn)等本身。有學(xué)者指出,大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)對作品進(jìn)行復(fù)制,并不是為了使用受版權(quán)法保護(hù)的作品表達(dá),而是為了獲取不受版權(quán)法保護(hù)的,已由版權(quán)法賦予公眾的事實(shí)要素或組織結(jié)構(gòu)。
《著作權(quán)法》的立法目的之一在于保護(hù)具有獨(dú)創(chuàng)性的表達(dá),而非表達(dá)所內(nèi)含的事實(shí)本身。有學(xué)者認(rèn)為人工智能利用大量作品進(jìn)行訓(xùn)練,以學(xué)習(xí)其中具有獨(dú)創(chuàng)性的創(chuàng)作規(guī)律的行為屬于對著作權(quán)人之作品的侵權(quán)性使用。但其忽略了人工智能在當(dāng)前發(fā)展階段的工具性質(zhì),即人工智能仍是作為一種工具被人類所使用,其無法接觸到作品背后的獨(dú)創(chuàng)性。人工智能雖然能通過學(xué)習(xí)海量數(shù)據(jù)提取出統(tǒng)計(jì)上的規(guī)律,但這種規(guī)律是一種概率分布,并不代表它能夠理解人類作者的主觀意圖或情感表達(dá),而這正是作品的獨(dú)創(chuàng)性之根源。
人工智能訓(xùn)練的過程旨在挖掘訓(xùn)練數(shù)據(jù)集所蘊(yùn)含的規(guī)律性知識與普適性特征,而非簡單地模仿原始作品的創(chuàng)作表達(dá)手段。例如,大語言模型對文本資源的學(xué)習(xí)是為了通過對各類文學(xué)作品的系統(tǒng)性分析,提煉出語言結(jié)構(gòu)的特征與聯(lián)系,理解詞匯間的相互作用機(jī)制,從而輸出符合自然語言規(guī)律的結(jié)果。同樣,人臉識別技術(shù)的訓(xùn)練亦不關(guān)注攝影作品中作者的獨(dú)特視覺表達(dá)手法,而更多地聚焦在從人像攝影作品中提取人類個體面部特征的獨(dú)特性和普遍規(guī)律,以構(gòu)建、優(yōu)化人臉識別算法。換言之,這些人工智能模型的關(guān)注點(diǎn)在于從數(shù)據(jù)中抽象出來的客觀事實(shí),而不是作品的具體表達(dá)形式。
因此,在人工智能的訓(xùn)練過程中,如果僅利用了受著作權(quán)保護(hù)的作品中的非受保護(hù)元素(事實(shí)、數(shù)據(jù)和概念等),而非其表達(dá)形式,那么即便這些數(shù)據(jù)來源于受著作權(quán)保護(hù)的作品,這種使用也應(yīng)當(dāng)被認(rèn)為是合法的。
(二)人工智能預(yù)期市場利益再考量
利益平衡是民法精神的體現(xiàn)和社會公德的要求,也反映了人權(quán)思想和公共利益原則。本章第1 節(jié)已說明人工智能使用作品進(jìn)行訓(xùn)練的行為是否屬于《著作權(quán)法》上的侵權(quán)行為仍有待斟酌;本節(jié)將從個人與企業(yè)的利益角度進(jìn)行再次考量,說明作者之經(jīng)濟(jì)利益受到損害不是必然結(jié)果,企業(yè)更能從這一行為中獲益。
1. 個人層面:使用范圍超越作者預(yù)期
作者的著作權(quán)保護(hù)聚焦于作品在原有市場的價值實(shí)現(xiàn)和通常預(yù)期內(nèi)的經(jīng)濟(jì)利益,防止未經(jīng)授權(quán)的作品使用對創(chuàng)作者既有的市場地位造成實(shí)質(zhì)性替代和損害。然而人工智能使用作品進(jìn)行訓(xùn)練的行為具有非傳統(tǒng)性,探討人工智能訓(xùn)練與作品的關(guān)系時,應(yīng)當(dāng)考慮人工智能使用作品的目的及其對作品市場的影響。
人工智能創(chuàng)新會驅(qū)動產(chǎn)生新的市場,而這些領(lǐng)域的應(yīng)用,在作品創(chuàng)作之時并不能預(yù)見,也不是原作者所能實(shí)現(xiàn)的。文生文、文生圖、文生音樂和文生視頻等新興市場正是基于對既有作品的學(xué)習(xí)與訓(xùn)練才得以誕生和發(fā)展。在文生文領(lǐng)域,以ChatGPT、文心一言等為代表的大語言模型,不僅可以生成風(fēng)格各異的文章,滿足讀者的個性化需求,更可以在其他領(lǐng)域中發(fā)揮作用。如在教育領(lǐng)域可以通過語言大模型為使用者進(jìn)行在線輔導(dǎo),提供個性化的知識內(nèi)容,并對使用者的回答提供智能反饋,提高優(yōu)質(zhì)教育的可及性;在娛樂領(lǐng)域,游戲設(shè)計(jì)者可以利用大語言模型(以下簡稱LLM)為游戲角色定制對話內(nèi)容,豐富游戲劇情,甚至可以實(shí)時生成對話,提升玩家沉浸感;在商業(yè)領(lǐng)域,LLM 可以通過分析數(shù)據(jù)、總結(jié)信息等方式提供決策支持。文生圖、文生音樂和文生視頻等技術(shù),則可跨越傳統(tǒng)創(chuàng)作領(lǐng)域的界限,實(shí)現(xiàn)跨媒介的藝術(shù)融合與再生成。
在Campbell 案中,法院以“原創(chuàng)作品的作者是否會發(fā)展”來界定原有市場與潛在市場。在創(chuàng)作初期,作者難以預(yù)見到人工智能訓(xùn)練這樣的新型應(yīng)用場景會成為作品的潛在市場,這種使用方式超出了個人作者創(chuàng)作和傳播作品的一般能力和意圖,因此并未實(shí)際觸及作者通過發(fā)行、許可或授權(quán)作品而獲取收益的核心市場領(lǐng)域。在《著作權(quán)法》已對原有市場給予有力保護(hù)的情況下,對于像人工智能訓(xùn)練這樣涉及非傳統(tǒng)、難預(yù)見的潛在市場用途,不應(yīng)當(dāng)被自動歸類為侵犯著作權(quán)。因?yàn)樗⑽磳?shí)質(zhì)性擠占作品在傳統(tǒng)市場中的份額,也無損于作者創(chuàng)作活動的直接經(jīng)濟(jì)回報。如同工業(yè)時代機(jī)器對人的代替,工業(yè)制品的價格與手工制品的價格在市場上會呈現(xiàn)出明顯的區(qū)別,標(biāo)有“手工生產(chǎn)”的產(chǎn)品價格會比流水線生產(chǎn)的同類產(chǎn)品的價格更高。同樣,合理的人工智能訓(xùn)練還能通過技術(shù)創(chuàng)新間接促進(jìn)知識產(chǎn)品的多樣化,擴(kuò)大市場整體規(guī)模:一方面,降低知識獲取與內(nèi)容生產(chǎn)的門檻;另一方面提高優(yōu)質(zhì)創(chuàng)作者的收入,有可能為包括原作者在內(nèi)的更多創(chuàng)作者創(chuàng)造新的就業(yè)機(jī)會和經(jīng)濟(jì)收益。
2. 企業(yè)層面:合理使用提供顯著動力
從成本方面考慮,企業(yè)通過取得許可而利用作品進(jìn)行人工智能訓(xùn)練所面臨的成本極高。溫蒂·戈登(Wendy J. Gordon)指出適用合理使用制度對侵權(quán)行為提出抗辯的原因中,即包括尋求或取得權(quán)利人的許可代價十分高昂。作品取得著作權(quán)的普遍化與低門檻化導(dǎo)致作品總量激增,獨(dú)創(chuàng)性標(biāo)準(zhǔn)的降低導(dǎo)致大量無價值作品受到《著作權(quán)法》的保護(hù)。社交媒體上用戶隨手所發(fā)的日常生活內(nèi)容、對某一商品或服務(wù)的評價,都可能因其獨(dú)創(chuàng)性而成為作品。大量網(wǎng)絡(luò)作品的著作權(quán)歸屬不清晰,導(dǎo)致確定作品的真正權(quán)利所有人以及協(xié)商達(dá)成許可協(xié)議的過程異常復(fù)雜。作者本身可能對這些內(nèi)容的后續(xù)使用并不在意,但企業(yè)要逐一取得許可并進(jìn)行人工智能訓(xùn)練卻極為困難。這種現(xiàn)象不僅推高了企業(yè)的技術(shù)創(chuàng)新成本,更可能引發(fā)“反公地悲劇”。
從收益方面考慮,企業(yè)利用作品進(jìn)行人工智能訓(xùn)練的收益可觀。首先,企業(yè)可以利用人工智能激活存量市場,發(fā)掘增量市場。將作品用于人工智能訓(xùn)練不僅不會導(dǎo)致原作消費(fèi)者流失,反而可能借助技術(shù)創(chuàng)新催生新市場需求和商業(yè)模式。依托人工智能,企業(yè)可以開發(fā)出獨(dú)特的付費(fèi)內(nèi)容、訂閱服務(wù)等多種盈利路徑,進(jìn)一步拓寬企業(yè)的發(fā)展空間。其次,企業(yè)還能夠通過與其他企業(yè)、創(chuàng)作者開展跨界合作,構(gòu)建更為多樣化的產(chǎn)業(yè)生態(tài)。
四、人工智能時代合理使用制度之調(diào)試
如前所述,人工智能使用作品進(jìn)行訓(xùn)練的行為不應(yīng)被自動視為侵犯著作權(quán),但法律實(shí)踐復(fù)雜,這一行為在現(xiàn)有著作權(quán)制度下的侵權(quán)風(fēng)險也不容忽視。法律框架應(yīng)與國家經(jīng)濟(jì)發(fā)展政策相協(xié)調(diào),作品的使用越有助于公共利益的增加,法律越應(yīng)該提供相應(yīng)激勵。為消除法律不確定性帶來的風(fēng)險,應(yīng)結(jié)合法律原則、國際趨勢、社會利益等進(jìn)行綜合考量,采用對合理使用制度從功能主義視角進(jìn)行擴(kuò)張解釋的進(jìn)路提供相應(yīng)解決辦法。將人工智能使用作品進(jìn)行訓(xùn)練的行為納入合理使用制度中,雖然短期內(nèi)可能對著作權(quán)人的利益造成影響,但有助于促進(jìn)信息自由流動并為人工智能產(chǎn)業(yè)的發(fā)展提供廣闊可能。
(一)適應(yīng)技術(shù)發(fā)展的行為界定
1. 功能主義的內(nèi)涵及其適當(dāng)性
功能主義(Functionalism)關(guān)注行為的目的與社會功能,而非僅僅局限于行為的形式或表面規(guī)則,其核心在于理解和評價某種行為或制度的社會價值和實(shí)用效果,強(qiáng)調(diào)法律制度和規(guī)則應(yīng)當(dāng)服務(wù)于社會的特定功能和目的,以及法律變遷背后的實(shí)用性和功能性因素。萊因斯坦(Rheinstein)認(rèn)為,法律作為一種社會控制和組織的工具,要求人們探究具體法律規(guī)則以及法律制度所承載的社會功能。要證明法律規(guī)則和制度的合法性,就要從該規(guī)則與制度在當(dāng)前社會中承擔(dān)什么功能以及是否很好地承擔(dān)這一功能兩方面來考慮。在《著作權(quán)法》的語境下,這意味著不單純依據(jù)著作權(quán)人的專有權(quán)來評判某項(xiàng)使用行為是否侵權(quán),也要考察特定用途如何實(shí)現(xiàn)促進(jìn)公共利益、創(chuàng)新和知識積累等功能。換言之,從功能主義視角需考慮該行為是否有助于實(shí)現(xiàn)《著作權(quán)法》立法所欲實(shí)現(xiàn)的制度功能,即作者利益與公共利益的平衡,從而在一定程度上包容和支持那些雖有侵權(quán)風(fēng)險,但有助于增進(jìn)整體社會福祉的創(chuàng)新行為。
2. 功能主義視角下合理使用邊界之?dāng)U張
有學(xué)者指出,現(xiàn)行版權(quán)法以“作者中心主義”為主導(dǎo),而合理使用則被邊緣化?!吨鳈?quán)法》不應(yīng)當(dāng)成為技術(shù)革新的阻礙。從功能主義的視角對人工智能使用作品進(jìn)行訓(xùn)練的行為進(jìn)行審視,需要超越單純的著作權(quán)人利益考量,不局限于對法條字面含義的機(jī)械解讀。鑒于作品是提升人工智能模型性能不可或缺的原材料,在評估人工智能對作品利用的合法性時,需要充分考量技術(shù)發(fā)展所帶來的公共利益,不應(yīng)草率認(rèn)定其為侵權(quán)行為。
(1)商業(yè)使用:轉(zhuǎn)換性使用抗辯
美國通過法律和判例建立了開放式的合理使用制度,且未區(qū)分商業(yè)性質(zhì)的使用與非商業(yè)性質(zhì)的使用,為人工智能使用作品進(jìn)行訓(xùn)練提供了較大的解釋空間。其《版權(quán)法》第一百零七條規(guī)定了合理使用的四個要素,即使用目的與性質(zhì)、被使用作品的性質(zhì)、被使用部分的數(shù)量與質(zhì)量、對被使用作品潛在市場或價值的影響。另外, 轉(zhuǎn)換性使用(Transformative Use)也是美國合理使用制度中一個重要組成部分,是指如果一種新的使用對原有作品進(jìn)行了實(shí)質(zhì)性的轉(zhuǎn)化,賦予了新意義或產(chǎn)生了新的信息、美學(xué)、見解等,則有可能落入合理使用的范疇,從而不構(gòu)成侵權(quán)。自美國聯(lián)邦最高法院于1994年將該規(guī)則運(yùn)用于Campbell 案以后,該規(guī)則逐漸成為美國司法實(shí)踐中衡量某一作品使用行為是否構(gòu)成合理使用的重要認(rèn)定標(biāo)準(zhǔn)。
基于此,使用這四個要素及轉(zhuǎn)換性使用概念對人工智能使用作品進(jìn)行訓(xùn)練的行為進(jìn)行分析。第一,使用目的與性質(zhì):人工智能在訓(xùn)練過程中使用版權(quán)作品,如果這種使用使得經(jīng)過訓(xùn)練的人工智能可以生成具有獨(dú)立價值的新內(nèi)容,可被認(rèn)定為體現(xiàn)了轉(zhuǎn)換性,從而被視為合理。第二,被使用作品的性質(zhì):盡管作品受到版權(quán)保護(hù),但如果人工智能訓(xùn)練的過程并未直接向公眾展示這些原始作品,而是將其轉(zhuǎn)化為機(jī)器學(xué)習(xí)的數(shù)據(jù)輸入,那么這種使用體現(xiàn)出更側(cè)重于作品的知識內(nèi)容而非其表達(dá)形式的一面,從而在某種程度上減輕了對作品原創(chuàng)性表達(dá)的侵犯。第三,被使用部分的數(shù)量與質(zhì)量:不可否認(rèn),人工智能訓(xùn)練需要使用大量完整作品或作品片段。然而,在訓(xùn)練過程中,這些作品被分解成人類不可理解的數(shù)據(jù)形式,并混入龐大的訓(xùn)練數(shù)據(jù)集之中,單個作品在整個訓(xùn)練過程中的作用被極大稀釋,而且最終目的是實(shí)現(xiàn)算法的功能提升而不是直接再現(xiàn)作品本身。因此,只要使用的數(shù)量和質(zhì)量與其訓(xùn)練目標(biāo)相匹配,即使規(guī)模較大,也可滿足合理使用的條件。第四,對被使用作品潛在市場或價值的影響:人工智能模型經(jīng)過訓(xùn)練后產(chǎn)出的內(nèi)容與訓(xùn)練數(shù)據(jù)中的任何單一作品本身不同,因此,除非其生成的內(nèi)容直接替代了原作品的市場需求,否則很難說對原始作品的市場價值造成直接的競爭性損害。另外,如果人工智能的輸出增加了產(chǎn)品多樣性或開辟了新的市場領(lǐng)域,實(shí)際上會擴(kuò)大而非侵蝕原始作品市場的發(fā)展?jié)摿Α?/p>
歐盟《DSM 指令》第四(一)條將TDM豁免的范圍擴(kuò)展到基于商業(yè)目的而進(jìn)行TDM,商業(yè)人工智能系統(tǒng)開發(fā)人員可以復(fù)制作品或數(shù)據(jù)庫,以從文本和數(shù)據(jù)中提取信息,只要人工智能訓(xùn)練過程需要,其可以保留這些副本。但也保留了權(quán)利人通過協(xié)議、單方聲明等方式拒絕的權(quán)利。
日本《著作權(quán)法》早在2009 年就以“計(jì)算機(jī)信息分析”的名義規(guī)定了數(shù)據(jù)挖掘例外。2018 年的日本《著作權(quán)法》修訂中,又將這一條款中的使用條件拓展為“提供新的知識和信息”,且不對適用主體和目的進(jìn)行限制,為企業(yè)出于營利目的而訓(xùn)練人工智能的行為消除了法律風(fēng)險。甚至允許開展信息處理的主體將此類訓(xùn)練產(chǎn)物整理成作品集,在必要限度內(nèi)向社會公眾提供。
從比較法的角度看,美歐日等主要國家和地區(qū)在對待人工智能使用作品進(jìn)行訓(xùn)練這一問題上的立法態(tài)度和司法實(shí)踐,均體現(xiàn)為逐步擴(kuò)大對合理使用制度的解釋,以便包容并規(guī)范人工智能技術(shù)的發(fā)展?!吨R產(chǎn)權(quán)強(qiáng)國建設(shè)綱要(2021 - 2035 年)》中明確了知識產(chǎn)權(quán)作為國家發(fā)展戰(zhàn)略性資源和國際競爭力核心要素的地位,并要求知識產(chǎn)權(quán)回應(yīng)新技術(shù)、新經(jīng)濟(jì)、新形勢對知識產(chǎn)權(quán)制度變革提出的挑戰(zhàn)。也有學(xué)者建議在現(xiàn)行合理使用制度框架下增設(shè)“人工智能創(chuàng)作”的合理使用類型。中國在面對人工智能技術(shù)快速發(fā)展及其對作品使用的特殊需求時,可以借鑒國際上的法律經(jīng)驗(yàn)和司法實(shí)踐,對現(xiàn)有的合理使用制度進(jìn)行擴(kuò)張解釋,納入人工智能使用作品進(jìn)行訓(xùn)練的行為。
(2)非商業(yè)使用:科教領(lǐng)域數(shù)據(jù)挖掘例外
在非商業(yè)性質(zhì)的科教領(lǐng)域,將作品用于人工智能訓(xùn)練具有更強(qiáng)的合理性:這一情形下的使用服務(wù)于公共利益,促進(jìn)知識創(chuàng)新,且一般不會實(shí)質(zhì)性地?fù)p害版權(quán)作品的正常市場。各國通過立法手段設(shè)定例外,既符合國際版權(quán)協(xié)定的精神,也是對數(shù)字化時代科研需求的積極回應(yīng)。對在科教領(lǐng)域?qū)嵤┑腡DM 行為提供豁免,是國際版權(quán)制度演進(jìn)的趨勢。
歐盟《DSM 指令》第三條將TDM 例外的適用范圍限定于不具有營利性的大學(xué)、研究機(jī)構(gòu)及文化遺產(chǎn)機(jī)構(gòu),且權(quán)利人不可以拒絕此類非營利性的使用。
另外,存在于《伯爾尼公約》第九條第二款、TRIPs 第十三條、WCT 第十條等國際公約及我國《著作權(quán)法》第二十四條中的“三步檢驗(yàn)法”同樣可用于證成人工智能在科教領(lǐng)域使用作品屬于合理使用范疇的合理性:第一,對作品的使用限于某些特殊的情況:在科教領(lǐng)域,人工智能使用作品進(jìn)行訓(xùn)練通常是為了科學(xué)研究、學(xué)術(shù)分析等旨在促進(jìn)知識增長的目的,這些用途具有明顯的非營利性和公益性,與日常生活使用、商業(yè)性使用皆有不同。第二,不應(yīng)與作品的正常利用相抵觸:人工智能在科教領(lǐng)域?qū)ψ髌返氖褂貌⒉粫恋K作品在市場上的正常流通和使用。相關(guān)科研成果往往以新的理論構(gòu)建、技術(shù)創(chuàng)新等形式展現(xiàn),而不是以替代原作品的形式在市場上銷售或傳播,與原作品的正常使用方式并行不悖。第三,不得不合理地?fù)p害版權(quán)持有者的合法利益:在科教領(lǐng)域中,人工智能對作品的使用通常不直接影響作品的商業(yè)價值。這類使用所轉(zhuǎn)化的成果與原作品不屬于同一市場競爭領(lǐng)域,對作品的原本市場價值沖擊較小。
(二)考慮多方主體的利益平衡
以合理使用方式使用作品進(jìn)行人工智能的訓(xùn)練,確實(shí)有助于科技與產(chǎn)業(yè)發(fā)展,但作者的利益與感受不應(yīng)被忽視,應(yīng)尊重作者權(quán)益,以維護(hù)其創(chuàng)作積極性;另一方面,企業(yè)也可采取建立共享數(shù)據(jù)資源庫的方式進(jìn)行企業(yè)經(jīng)濟(jì)利益與社會責(zé)任承擔(dān)的平衡。
1. 個人層面:提供經(jīng)濟(jì)名譽(yù)雙保險
(1)明確侵權(quán)行為以提供維權(quán)路徑
盡管人工智能使用作品進(jìn)行訓(xùn)練的行為,出于社會公共利益的考慮應(yīng)被視為合理使用范疇,但也不能從訓(xùn)練行為中完全免責(zé)?;跈?quán)利與義務(wù)的一致性,人工智能在對著作權(quán)作品進(jìn)行寬泛合理使用的同時,也應(yīng)承擔(dān)與此相應(yīng)的更多責(zé)任。如果人工智能生成的內(nèi)容與原作品具有實(shí)質(zhì)上的相似性,那么應(yīng)當(dāng)承擔(dān)著作權(quán)侵權(quán)責(zé)任。
從保護(hù)原創(chuàng)性和激勵創(chuàng)新的角度出發(fā),如果不對人工智能生成的實(shí)質(zhì)性相似內(nèi)容加以約束,可能導(dǎo)致作者的創(chuàng)造性勞動成果被無償占用,無疑會打擊作者的創(chuàng)作熱情。根據(jù)“接觸+ 實(shí)質(zhì)性相似”的著作權(quán)侵權(quán)判定規(guī)則,如果人工智能最終輸出的內(nèi)容與之前所使用的數(shù)據(jù)作品存在實(shí)質(zhì)性相似,則同樣可能會侵害相關(guān)著作權(quán)益,其訓(xùn)練者或使用者應(yīng)當(dāng)承擔(dān)相應(yīng)的法律責(zé)任。結(jié)合后文提到的標(biāo)明數(shù)據(jù)來源義務(wù),可為侵權(quán)判定提供抓手。
(2)標(biāo)明數(shù)據(jù)來源以提供名譽(yù)補(bǔ)償
加強(qiáng)對數(shù)據(jù)來源和使用的監(jiān)管是目前的立法趨勢。國家網(wǎng)信辦等七部門聯(lián)合公布的《生成式人工智能服務(wù)管理暫行辦法》中就包括要求服務(wù)提供者履行訓(xùn)練數(shù)據(jù)來源的說明義務(wù)。標(biāo)明數(shù)據(jù)來源是企業(yè)踐行數(shù)據(jù)倫理、承擔(dān)社會責(zé)任的表現(xiàn),也是對創(chuàng)作者權(quán)益的尊重。
標(biāo)明人工智能訓(xùn)練數(shù)據(jù)的來源為用于訓(xùn)練模型的作品提供了公開曝光的機(jī)會,作者的名字及作品名稱得到傳播,有助于使作者獲得更多關(guān)注,從而提高其知名度與業(yè)界名譽(yù)。從作者自身視角來看,也能看到自己作品對技術(shù)進(jìn)步作出的貢獻(xiàn),從而提高自身價值感;從企業(yè)視角來看,公開承認(rèn)并尊重作品來源有助于建立其與作者之間的信任關(guān)系,企業(yè)可借此樹立尊重作者的良好形象,從而吸引更多作者參與。另外,也要考慮到作者出于個人隱私考慮而不愿意顯名的情況,可通過去標(biāo)識化等措施保障個人信息安全。
2. 企業(yè)層面:建立共享的數(shù)據(jù)資源
計(jì)算機(jī)軟件領(lǐng)域有“開放源代碼”運(yùn)動。受這一理念影響,知識共用理念進(jìn)入著作權(quán)領(lǐng)域,表現(xiàn)為知識共享協(xié)議(Creative Commons,以下簡稱CC 協(xié)議)。CC 協(xié)議可為著作權(quán)人提供作品使用之開放程度的選擇,從而增加作品的流通性,成為他人據(jù)以創(chuàng)作的基礎(chǔ)。目前,維基百科等社區(qū)已采用CC 協(xié)議等方式開放授權(quán),這些開放授權(quán)的海量作品已經(jīng)成為人工智能訓(xùn)練的重要數(shù)據(jù)來源。同樣有學(xué)者認(rèn)為,應(yīng)重點(diǎn)關(guān)注數(shù)據(jù)共享模式如何設(shè)計(jì),以促進(jìn)數(shù)據(jù)共享、數(shù)據(jù)協(xié)作和獲得無偏見的數(shù)據(jù)分析。
在法律風(fēng)險尚不明確的情況下,建立共享的數(shù)據(jù)資源庫有利于縮小中小企業(yè)與大型企業(yè)之間的數(shù)據(jù)資源差距,從而實(shí)現(xiàn)技術(shù)和知識的包容性增長。大型企業(yè)通常擁有充足的預(yù)算來獲取海量數(shù)據(jù),相比之下,中小型企業(yè)則在數(shù)據(jù)獲取上存在劣勢。通過數(shù)據(jù)共享行動,后者能以較低成本獲取原先難以獲取的數(shù)據(jù),從而消除因數(shù)據(jù)壟斷而帶來的不正當(dāng)競爭風(fēng)險,營造公平競爭的市場環(huán)境。
另外,共享的數(shù)據(jù)資源庫將涵蓋廣泛且多樣化的數(shù)據(jù)樣本,這對于消除因數(shù)據(jù)量不足或數(shù)據(jù)來源單一導(dǎo)致的算法歧視至關(guān)重要。如果數(shù)據(jù)分布不均勻、數(shù)據(jù)代表性不足,則可能導(dǎo)致人工智能的輸出結(jié)果帶有偏見與歧視。通過數(shù)據(jù)資源共享,可以使人工智能在訓(xùn)練過程中接觸到大量、多樣化的信息,減少因數(shù)據(jù)局限而產(chǎn)生的算法歧視現(xiàn)象。
五、結(jié)語
從行為定性上對人工智能使用作品進(jìn)行訓(xùn)練進(jìn)行再審視,可以提煉出其非傳統(tǒng)、變革性的使用特征,應(yīng)當(dāng)被視為對原作品的轉(zhuǎn)換性使用而落入合理使用的范疇。從利益衡量角度考慮,更可發(fā)現(xiàn)其促進(jìn)科技進(jìn)步、繁榮知識生產(chǎn)的一面。因此,消除人工智能使用作品進(jìn)行訓(xùn)練的著作權(quán)侵權(quán)風(fēng)險,有利于文化事業(yè)和文化產(chǎn)業(yè)的發(fā)展與繁榮。綜上所述,在功能主義視角下,人工智能使用作品進(jìn)行訓(xùn)練,如果滿足相應(yīng)條件,應(yīng)當(dāng)被納入合理使用范疇。
從根本上講,創(chuàng)新既是推動社會進(jìn)步的源泉,也是法律制度應(yīng)對時代挑戰(zhàn)、求變求新的內(nèi)在驅(qū)動力。合理使用制度隨著技術(shù)的進(jìn)步正經(jīng)歷著一場深刻的演變歷程。人工智能訓(xùn)練對作品的非傳統(tǒng)使用方式恰恰反映了技術(shù)進(jìn)步對傳統(tǒng)著作權(quán)邊界的挑戰(zhàn)。面對數(shù)據(jù)密集型的人工智能創(chuàng)新活動,合理使用制度需要積極適應(yīng)和調(diào)整,更好地成為融合多方權(quán)益的復(fù)合法律制度。法律制度在時代變遷中應(yīng)通過不斷地自我革新,秉持動態(tài)的、前瞻性視角,在科技與法律的交匯處,尋求尊重私人產(chǎn)權(quán)、鼓勵技術(shù)創(chuàng)新與維護(hù)公共利益之間的動態(tài)平衡。