摘要:智能出版視域下“接觸+實(shí)質(zhì)性相似”規(guī)則落入失效境地,表現(xiàn)為“接觸”要件虛置及“實(shí)質(zhì)性相似”要件失靈?!敖佑|”要件虛置表面上是因?yàn)橹悄堋白ト∨c分析”擴(kuò)大接觸可能,非外顯性利用增加“接觸”的識別難度;本質(zhì)上是因?yàn)閺摹肮_”到“事實(shí)接觸”的邏輯鏈條斷裂。“實(shí)質(zhì)性相似”要件失靈是因?yàn)榧扔械呐袛喾椒ù嬖诰窒?;碎片化使用淡化“?shí)質(zhì)性相似”的可訴性?;诖?,應(yīng)從兩方面入手推動變革:一方面,對“接觸”要件認(rèn)定適用舉證責(zé)任倒置;明晰智能出版時(shí)代“接觸”要件判定標(biāo)準(zhǔn),借此強(qiáng)化“接觸”要件的獨(dú)立價(jià)值。另一方面,以“市場替代”標(biāo)準(zhǔn)輔助“實(shí)質(zhì)性相似”標(biāo)準(zhǔn),同時(shí)弱化對“微量使用”行為的考量,以應(yīng)對“實(shí)質(zhì)性相似”要件失靈。
關(guān)鍵詞:智能出版;生成式人工智能;AIGC;接觸;實(shí)質(zhì)性相似
生成式人工智能(Generative Artificial Intelligence,簡稱GAI)的飛速發(fā)展為出版產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型提供了助力,人工智能生成內(nèi)容(AI-Generated Content,簡稱 AIGC)已經(jīng)運(yùn)用于選題、校對、發(fā)行等諸多環(huán)節(jié),傳統(tǒng)出版正在向智能出版快速邁進(jìn)。《新一代人工智能發(fā)展規(guī)劃》《關(guān)于加快推進(jìn)媒體深度融合發(fā)展的指導(dǎo)意見》《國家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》等文件的實(shí)施,為人工智能等新興科技應(yīng)用于出版領(lǐng)域提供了政策支持。但機(jī)遇與風(fēng)險(xiǎn)并存,生成式人工智能技術(shù)推動出版領(lǐng)域變革的同時(shí),也誘發(fā)了版權(quán)侵權(quán)新樣態(tài),甚至使“接觸+實(shí)質(zhì)性相似”規(guī)則陷入失效的危險(xiǎn)境地。因此,在探索人工智能與出版融合發(fā)展的同時(shí),需要及時(shí)分析“接觸+實(shí)質(zhì)性相似”規(guī)則失效的成因并提出有效的應(yīng)對措施,以促進(jìn)智能出版的規(guī)范化發(fā)展。
一、問題的提出:“接觸+實(shí)質(zhì)性相似”判定規(guī)則失效
智能出版是指以智能化的數(shù)字技術(shù)對作品進(jìn)行編輯加工后,經(jīng)過復(fù)制發(fā)行的新型出版。其核心特征之一是人工智能生產(chǎn)內(nèi)容逐步取代專業(yè)生產(chǎn)內(nèi)容。目前,人工智能參與創(chuàng)作活動已經(jīng)從設(shè)想成為現(xiàn)實(shí),甚至可能擺脫“工具地位”,成為創(chuàng)作主體。出版行業(yè)的目標(biāo)群體也從“人類讀者”拓寬至“機(jī)器讀者”。出版行業(yè)已經(jīng)經(jīng)歷了從紙質(zhì)化到網(wǎng)絡(luò)化再到數(shù)字化的發(fā)展階段,并最終實(shí)現(xiàn)智能化轉(zhuǎn)型。但與此同時(shí),生成式人工智能憑借其“涌現(xiàn)能力”改變創(chuàng)作領(lǐng)域的底層邏輯,并消解既有版權(quán)規(guī)則的適用價(jià)值。對出版行業(yè)而言,如何判斷其行為是否侵犯他人版權(quán)以及如何避免落入版權(quán)訴訟是亟待解決的問題。
“接觸+實(shí)質(zhì)性相似”規(guī)則作為版權(quán)侵權(quán)認(rèn)定的基本規(guī)則,為行為人檢視自身使用行為是否侵犯他人版權(quán)提供了基礎(chǔ)標(biāo)準(zhǔn),但該規(guī)則無法直接適用于智能出版領(lǐng)域。首先,智能出版以海量數(shù)據(jù)獲取為基礎(chǔ),若沿用司法實(shí)踐中既有的“接觸”標(biāo)準(zhǔn),智能“抓取與分析”將無一例外符合“接觸”要件,進(jìn)而引發(fā)“接觸”要件事實(shí)上被架空的風(fēng)險(xiǎn)。其次,生成式人工智能“創(chuàng)作”基于對基礎(chǔ)作品的“拆分與重組”進(jìn)行,“拆分與重組”的程度越高意味著“相似性”認(rèn)定難度越大。加之,既有的“實(shí)質(zhì)性相似”認(rèn)定規(guī)則以“自然人作品”為基礎(chǔ)設(shè)立,與“機(jī)器作品”及智能出版的運(yùn)行規(guī)則并不一致。由此來看,“接觸+實(shí)質(zhì)性相似”判定規(guī)則在智能出版領(lǐng)域的適用存在障礙,很難為智能出版提供有效指引。
基于此,本文從智能出版視域下“接觸+實(shí)質(zhì)性相似”規(guī)則失效的表現(xiàn)入手,探究“接觸+實(shí)質(zhì)性相似”規(guī)則失效的成因,并基于此提出應(yīng)對措施,以期實(shí)現(xiàn)理論引領(lǐng)實(shí)踐發(fā)展、預(yù)知并規(guī)制風(fēng)險(xiǎn)的效果。
二、智能出版視域下“接觸+實(shí)質(zhì)性相似”規(guī)則失效的表現(xiàn)
作為版權(quán)侵權(quán)認(rèn)定的基本規(guī)則,“接觸+實(shí)質(zhì)性相似”意義重大,但該規(guī)則在智能出版領(lǐng)域落入“失效”境地。從過程來看,生成式人工智能的“創(chuàng)作”分為兩部分,即智能“抓取與分析”和智能“拆分與組合”?!敖佑|+實(shí)質(zhì)性相似”規(guī)則失效與之密切相關(guān)。具體而言,表現(xiàn)在兩方面,一是智能“抓取與分析”普遍符合接觸標(biāo)準(zhǔn),最終導(dǎo)致“接觸”要件虛置;二是智能“拆分與重組”增加認(rèn)定難度,導(dǎo)致“實(shí)質(zhì)性相似”要件失靈。
(一)接觸要件虛置:智能“抓取與分析”普遍符合接觸標(biāo)準(zhǔn)
智能出版時(shí)代,出版社對人工智能的依賴性增強(qiáng)。生成式人工智能依托大數(shù)據(jù)采集和智能分析技術(shù),挖掘海量文本數(shù)據(jù),并對文本信息進(jìn)行多維度分析,從而為編輯人員提供輔助性決策信息。智能出版可以實(shí)現(xiàn)對海量素材的高效整合與加工處理,鑒于生存壓力,部分出版社已有所讓步,允許文學(xué)性較弱的稿件采用DGC(智能寫作)方式生成。面對AIGC潛在的版權(quán)侵權(quán)風(fēng)險(xiǎn)及倫理危機(jī),我國大部分出版社相對謹(jǐn)慎,但也有出版社率先行動,接受AIGC投稿并出版。《人人都能玩賺AI繪畫》《大模型時(shí)代:Chat GPT拉開硅基文明序幕》等由生成式人工智能“創(chuàng)作”的圖書已經(jīng)順利出版并引發(fā)關(guān)注。
與自然人相比,生成式人工智能的優(yōu)勢在于其數(shù)據(jù)抓取與分析能力極強(qiáng),并隨著技術(shù)進(jìn)步日益增強(qiáng)?;趯A(chǔ)作品的抓取與分析,生成式人工智能可以把握作品的語言特征和表達(dá)風(fēng)格,并將其運(yùn)用到具體的創(chuàng)作場景之中。人工智能曾通過獲取并分析倫勃朗作品的典型特征和表達(dá)風(fēng)格,最終“創(chuàng)作”出倫勃朗風(fēng)格的原創(chuàng)繪畫。
當(dāng)下,我國司法實(shí)踐中的“接觸”要件實(shí)際上是一種“接觸可能性”,而非“接觸事實(shí)”層面的要求。原告作品公開在先出版、在互聯(lián)網(wǎng)上公開傳播、享有較高知名度甚至在微信、微博賬號上公開等情形均被認(rèn)定為存在“接觸可能性”。這種認(rèn)定方式已經(jīng)使“接觸”要件面臨“被架空”的風(fēng)險(xiǎn)。而人工智能的“抓取與分析”能力遠(yuǎn)遠(yuǎn)超過人類,進(jìn)一步擴(kuò)大上述風(fēng)險(xiǎn)。數(shù)據(jù)抓取與分析能力增強(qiáng)意味著“接觸”行為泛化。換言之,版權(quán)侵權(quán)認(rèn)定過程中生成式人工智能的“抓取與分析”將無一例外符合當(dāng)下的“接觸”要件認(rèn)定標(biāo)準(zhǔn),最終導(dǎo)致“接觸”要件虛置。
(二)實(shí)質(zhì)性相似要件失靈:智能“拆分與重組”增加認(rèn)定難度
以往的“融?!毙袨闊o非是基于用戶需求獲取相應(yīng)素材,將已有的作品進(jìn)行拆分并重新組合,進(jìn)而產(chǎn)生新的“作品”,但這種所謂的“新”極有可能與原作品構(gòu)成實(shí)質(zhì)性相似。從形式上看,生成式人工智能“創(chuàng)作”本質(zhì)上是一種更高層次、更精細(xì)化的“融?!毙袨?,其基于大規(guī)模的數(shù)據(jù)獲取,進(jìn)行高密度拆分與重組,以技術(shù)支撐展開排列組合,進(jìn)而形成新的“作品”。甚至有學(xué)者指出,生成式人工智能是“智能搜索引擎+智能文本分析器+洗稿器”的結(jié)合。與傳統(tǒng)“融?!毙袨橄啾?,生成式人工智能對基礎(chǔ)作品的拆分和重組更為徹底。具體而言,生成式人工智能對海量基礎(chǔ)作品的學(xué)習(xí)與利用,可以細(xì)化或分散到每一個(gè)字,不會出現(xiàn)對在先作品甚至作品片段的直接復(fù)制。這意味著很難認(rèn)定AIGC存在對在先作品的實(shí)質(zhì)引用,亦很難認(rèn)定AIGC與基礎(chǔ)作品存在“實(shí)質(zhì)性相似”。
但AIGC的版權(quán)侵權(quán)風(fēng)險(xiǎn)并未因此消解。即便將生成式人工智能認(rèn)定為自然人的輔助工具,進(jìn)而將其數(shù)據(jù)抓取與利用行為認(rèn)定為自然人學(xué)習(xí)行為的延伸,AIGC仍有版權(quán)侵權(quán)之可能。生成式人工智能本質(zhì)上并不具備獨(dú)立思考的能力,其生成物仍舊是技術(shù)支撐下多項(xiàng)要素排列組合的結(jié)果?;诖?,存在AIGC與基礎(chǔ)作品截然不同的情形,也必然存在AIGC與基礎(chǔ)作品高度相似的情形,這僅僅是概率問題。這就導(dǎo)致了新的問題,一方面,AIGC版權(quán)侵權(quán)無法避免;另一方面,“實(shí)質(zhì)性相似”要件失靈,無法有效發(fā)揮作用。
三、智能出版視域下“接觸+實(shí)質(zhì)性相似”規(guī)則失效的原因探究
智能出版領(lǐng)域“接觸+實(shí)質(zhì)性相似”規(guī)則的失效表現(xiàn)已經(jīng)厘清,此時(shí),應(yīng)當(dāng)探析“接觸+實(shí)質(zhì)性相似”要件失效的成因,方能以此為基礎(chǔ)提出有效應(yīng)對措施。一方面,智能“抓取與分析”無限擴(kuò)大“接觸可能”,非外顯性利用也增加了“接觸”的識別難度,從“公開”到“事實(shí)接觸”的邏輯鏈條斷裂,共同導(dǎo)致“接觸”要件面臨虛置風(fēng)險(xiǎn)。另一方面,既有的實(shí)質(zhì)性相似判斷方法存在局限,碎片化使用淡化“實(shí)質(zhì)性相似”的可訴性,導(dǎo)致“實(shí)質(zhì)性相似”要件失靈。
(一)智能出版視域下接觸要件虛置的多重誘因
1.表層原因:智能“抓取與分析”無限擴(kuò)大“接觸可能”
當(dāng)下,生成式智能出版模式已經(jīng)基本成型,其優(yōu)勢在于智能“抓取與分析”,具體而言,體現(xiàn)在數(shù)據(jù)抓取與整合的高速率及邏輯性。以Chat GPT為代表的生成式人工智能依托于Transformer 等訓(xùn)練模型,極大提高內(nèi)容處理及反饋速度。人工智能獲取版權(quán)作品的能力遠(yuǎn)非人力可及。自然人即便窮其一生,能夠接觸的作品范圍也極其有限。而人工智能模型卻可以在短時(shí)間內(nèi)迅速獲取并學(xué)習(xí)人類社會以文字記載的所有內(nèi)容,且單個(gè)模型產(chǎn)品在14天內(nèi)便可以輸出相當(dāng)于人類全部印刷作品的內(nèi)容量。不僅如此,生成式人工智能依托于數(shù)據(jù)、算法和算力,AIGC中蘊(yùn)含的模仿、推理等思維能力甚至超出了大部分人類。
生成式智能出版的優(yōu)勢集中體現(xiàn)在兩方面:一是數(shù)據(jù)抓取與分析速率極高,可以在極短時(shí)間內(nèi)抓取用戶關(guān)心的核心話題與寫作素材,并進(jìn)行相對高質(zhì)量的初級創(chuàng)作。在設(shè)置既定算法和寫作規(guī)則的情況下,基本寫作內(nèi)容可以由生成式人工智能完成。筆神作文曾發(fā)表聲明稱,學(xué)而思通過“爬蟲”技術(shù)非法訪問、緩存其APP服務(wù)器數(shù)據(jù)多達(dá)258萬次。二是數(shù)據(jù)抓取與分析范圍極廣,幾乎所有在互聯(lián)網(wǎng)上公開的作品均會成為生成式人工智能的抓取對象?;ヂ?lián)網(wǎng)的開放性與共享性,為生成式人工智能數(shù)據(jù)抓取提供便利的同時(shí),也模糊了公共數(shù)據(jù)與個(gè)人數(shù)據(jù)的界限。智能“抓取與分析”行為可能涉及他人尚未公開發(fā)表的作品,繼而引發(fā)無意識版權(quán)侵權(quán),為后續(xù)使用行為埋下隱患。實(shí)踐中,與生成式人工智能數(shù)據(jù)抓取相關(guān)的訴訟層出不窮。X Corp近日對四個(gè)身份不明的實(shí)體提起訴訟,指控其數(shù)據(jù)抓取行為。Open AI也遭遇集體訴訟,被指從互聯(lián)網(wǎng)上竊取和挪用大量個(gè)人數(shù)據(jù)和信息訓(xùn)練AI工具。
綜上所述,生成式人工智能在數(shù)據(jù)獲取與分析方面有獨(dú)特的優(yōu)勢,數(shù)據(jù)抓取的速度與范圍都遠(yuǎn)超自然人,但這種技術(shù)優(yōu)勢也帶來新的問題。前文已經(jīng)提及,當(dāng)下我國司法實(shí)踐仍采用“接觸可能性”標(biāo)準(zhǔn),過于寬泛的“接觸可能性”認(rèn)定方式已經(jīng)使“接觸”要件面臨虛置風(fēng)險(xiǎn),而智能“抓取與分析”的速度與規(guī)模大幅度提升,使“接觸”要件虛置風(fēng)險(xiǎn)進(jìn)一步擴(kuò)大。
2.技術(shù)原因:非外顯性利用增加了“接觸”的識別難度
生成式人工智能的快速發(fā)展伴隨著“不可解釋性”,換言之,數(shù)據(jù)訓(xùn)練模型的更新迭代和底層電路芯片的復(fù)雜性,使人類無從解釋人工智能何以出現(xiàn)“創(chuàng)作”能力以及如何運(yùn)用“創(chuàng)作”能力。技術(shù)“黑箱”的存在,使用戶難以得知基礎(chǔ)作品將被如何處理,AIGC又將如何逐步生成。互聯(lián)網(wǎng)時(shí)代版權(quán)侵權(quán)行為的隱蔽問題已經(jīng)非常突出,版權(quán)人往往疲于應(yīng)付海量的UGC侵權(quán)內(nèi)容,但無論如何,UGC版權(quán)侵權(quán)仍可以從外觀層面進(jìn)行識別。而AIGC版權(quán)侵權(quán)不僅具有“海量”特征,外觀層面的可識別性也趨于淡化甚至徹底消失。權(quán)利人無法從外觀層面判斷其作品是否被用于智能模型訓(xùn)練,也意味著版權(quán)主體發(fā)現(xiàn)侵權(quán)行為的難度增加。
遵循既有的“接觸+實(shí)質(zhì)性相似”認(rèn)定規(guī)則,權(quán)利人主張人工智能訓(xùn)練模型侵權(quán)時(shí),應(yīng)當(dāng)提供訓(xùn)練模型“接觸”其作品的證據(jù)。但實(shí)際上人工智能模型訓(xùn)練具有非外顯性特征,版權(quán)人難以發(fā)現(xiàn)模型訓(xùn)練使用自己的作品,亦無法提供證據(jù)證明人工智能模型訓(xùn)練“接觸”其作品。大語言模型訓(xùn)練本質(zhì)上是一種機(jī)器內(nèi)部的、非外顯性作品利用行為,權(quán)利主體發(fā)現(xiàn)版權(quán)侵權(quán)行為存在現(xiàn)實(shí)難度。通常而言,只能通過AIGC內(nèi)容與基礎(chǔ)作品的對比,認(rèn)定存在實(shí)質(zhì)性相似,從而倒推出“接觸”行為及未經(jīng)許可利用行為。但由于模型訓(xùn)練“拆分與重組”程度較高,甚至通過學(xué)習(xí)可以“模仿”在先作品的風(fēng)格,導(dǎo)致侵權(quán)對比面臨現(xiàn)實(shí)困難,很難倒推“接觸”行為。
3.根本原因:從“公開”到“事實(shí)接觸”的邏輯鏈條斷裂
“接觸可能性”本質(zhì)上是一種“機(jī)會”,即閱讀、復(fù)制、演繹原告作品的機(jī)會。作為一種蓋然性推測,“接觸可能性”無法確證被訴侵權(quán)作品來源于原告作品。而“接觸”是一種事實(shí)行為,包括實(shí)際閱讀、使用等行為。其本質(zhì)要求是發(fā)生了事實(shí)上的接觸行為,從而排除“巧合創(chuàng)作”的情形。因此,“接觸可能性”無法直接等同于“接觸事實(shí)”。囿于司法實(shí)踐中要求當(dāng)事人證明被訴侵權(quán)人“接觸”過其作品的難度極高,“接觸”要件進(jìn)而被轉(zhuǎn)換為“接觸的合理可能性”要件。但“接觸的合理可能性”要求并非存在理論上的可能性即可,而是要求存在較大的可能性。換言之,“接觸的合理可能性”要求不能通過臆測、推斷或猜想認(rèn)定存在接觸行為,“接觸可能性”必須達(dá)到合理的程度,即基于既有的事實(shí)大概率可以推斷出行為人接觸過原告的作品。
事實(shí)上,“公開事實(shí)”與“接觸事實(shí)”之間并不存在必然聯(lián)系,二者之間仍需大量事實(shí)證據(jù)加以填補(bǔ),方能實(shí)現(xiàn)邏輯上的貫通,中間環(huán)節(jié)的缺失必然會導(dǎo)致說服力降低。從邏輯順序來看,“公開—接觸可能性—接觸的合理可能性—接觸事實(shí)”存在遞進(jìn)關(guān)系,“公開事實(shí)”僅能說明在先作品處于公開狀態(tài),并不能直接推導(dǎo)出行為人“接觸”在先作品。但實(shí)踐中不乏以“在先發(fā)表”或“網(wǎng)絡(luò)公開”等推定被訴侵權(quán)人存在接觸可能,進(jìn)而認(rèn)定“接觸”要件成立的情形。進(jìn)入互聯(lián)網(wǎng)時(shí)代后,此種情形更為嚴(yán)重。不少案件以“微博公開”“微信朋友圈公開”等作為“公開事實(shí)”,進(jìn)而直接推定接觸要件成立。智能出版領(lǐng)域,作品更新和傳播速度加快,數(shù)字化內(nèi)容以量級增多?;凇霸谙劝l(fā)表”或“網(wǎng)絡(luò)公開”直接認(rèn)定“接觸”要件成立將會遭受更多質(zhì)疑。
(二)智能出版視域下實(shí)質(zhì)性相似要件失靈的原因分析
1.既有的實(shí)質(zhì)性相似判斷方法存在局限
實(shí)踐中常用的“實(shí)質(zhì)性相似”判定方法包含四種,即“抽象分離法”“整體觀感法”“內(nèi)外部測試法”“普通觀察者測試法”。智能出版視域下,這四種方法存在不同程度的缺陷。首先,“抽象分離法”對作品進(jìn)行拆解,過濾作品中的思想部分,僅對表達(dá)部分進(jìn)行對比判斷。生成式人工智能的“創(chuàng)作”基于海量樣本進(jìn)行解析和運(yùn)算活動,但無法固定人工智能“創(chuàng)作”的特定規(guī)律并尋求特定的版權(quán)作品集進(jìn)行對比。其次,相較于“抽象分離法”而言,“整體觀感法”有助于從讀者視角出發(fā)整體識別AIGC與基礎(chǔ)作品的相似性,但其不足也很明顯?!罢w觀感法”的適用可謂“因人而異”,主觀性較強(qiáng),存在極大不確定性。此外,“整體觀感法”只能傳達(dá)一種模糊的感覺,無法確定AIGC與基礎(chǔ)作品的相似程度,進(jìn)而會導(dǎo)致司法裁判缺乏可量化的標(biāo)準(zhǔn)。再次,“內(nèi)外部測試法”作為上述兩種方法的結(jié)合,具備二者的優(yōu)勢,但仍存在一定不足。一方面,“內(nèi)外部測試法”仍未解決版權(quán)侵權(quán)認(rèn)定不確定的問題,這是因?yàn)閮?nèi)部測試中普通觀察者無法就相似性程度做出準(zhǔn)確判斷,外部測試中專家也很難抽象和分離出具有獨(dú)創(chuàng)性的“表達(dá)”并進(jìn)行對比。另一方面,“內(nèi)外部測試法”不僅會因法院的認(rèn)知偏差導(dǎo)致裁判標(biāo)準(zhǔn)不統(tǒng)一,也會因?qū)<遗c普通觀察者的視角差異導(dǎo)致內(nèi)部測試與外部測試結(jié)果矛盾。最后,“普通觀察者測試法”實(shí)質(zhì)上是在“整體觀察法”的判定方法基礎(chǔ)上,引入普通讀者、公眾的視角,因此其主觀性較強(qiáng)問題仍未解決。綜上所述,這四種方法均存在局限,無法在智能出版領(lǐng)域充分發(fā)揮作用。
2.碎片化使用淡化“實(shí)質(zhì)性相似”的可訴性
生成式人工智能的“創(chuàng)作”活動基于“智能抓取與分析”及“智能拆分與重組”展開,因此對大量基礎(chǔ)作品的零散化、碎片化使用是其基本特征,進(jìn)而導(dǎo)致AIGC對單個(gè)基礎(chǔ)作品的使用量相對較低。在智能出版視域下,生成式人工智能對基礎(chǔ)作品的碎片化使用將會增多,這意味著AIGC作品與基礎(chǔ)作品的“微量相似”問題亦會日益增多。
基于既有的“實(shí)質(zhì)性相似”認(rèn)定標(biāo)準(zhǔn),使用在先作品的數(shù)量與比例是版權(quán)侵權(quán)認(rèn)定中的重要考量因素之一。但“微量使用”因其危害性較小,通常被納入免責(zé)范疇。即便“微量使用”部分構(gòu)成實(shí)質(zhì)性相似,往往也不具備可訴性,法院通常會駁回訴訟請求。但當(dāng)下,“微量使用”在何種情形下滿足“實(shí)質(zhì)性相似”的可訴性標(biāo)準(zhǔn)并不明確。這將會導(dǎo)致法院在面臨大量“微量使用”行為時(shí),無力及時(shí)作出回應(yīng)和反饋。
“微量使用規(guī)則”(Deminimis Rule)本質(zhì)上是“實(shí)質(zhì)性相似”規(guī)則的例外,對基礎(chǔ)作品使用的“質(zhì)”與“量”是判斷“微量使用”行為的兩個(gè)層面。但智能出版領(lǐng)域,不僅人工智能貢獻(xiàn)的“質(zhì)”與“量”難以衡量,其使用基礎(chǔ)作品的“質(zhì)”與“量”亦無法衡量。從另一側(cè)面,這也意味著智能出版領(lǐng)域“實(shí)質(zhì)性相似”規(guī)則失靈問題將會日益突出。
四、智能出版視域下“接觸+實(shí)質(zhì)性相似”規(guī)則的優(yōu)化適用
新技術(shù)的革新與法律制度的完善是辯證統(tǒng)一的,技術(shù)變革要求法律制度更新迭代,法律制度的完善保證技術(shù)的長遠(yuǎn)發(fā)展。這一辯證思想為智能出版視域下“接觸+實(shí)質(zhì)性相似”規(guī)則之變革提供指引。
(一)強(qiáng)化“接觸”要件的獨(dú)立價(jià)值地位
我國司法實(shí)踐中大量存在以“實(shí)質(zhì)性相似”直接認(rèn)定侵權(quán)的案件,卻極少甚至不存在以“接觸”要件否定“實(shí)質(zhì)性相似”的案件。實(shí)際上,“接觸”要件考察作品是否存在故意抄襲的可能性,有其獨(dú)立的程序意義和實(shí)質(zhì)意義,不應(yīng)被誤讀為“實(shí)質(zhì)性相似”要件的附庸。不僅如此,亦不應(yīng)僅以“接觸可能性”作為“接觸”要件的認(rèn)定標(biāo)準(zhǔn),否則將會導(dǎo)致其保障創(chuàng)作自由的功能蕩然無存。
1.“接觸”要件認(rèn)定適用舉證責(zé)任倒置
一方面,智能出版時(shí)代,生成式人工智能可以接觸到數(shù)量龐大的作品,但僅以“接觸可能”認(rèn)定“接觸”行為會過猶不及,甚至導(dǎo)致“接觸”要件事實(shí)上被架空,不利于創(chuàng)作行為的可持續(xù)性;另一方面,鑒于人工智能“創(chuàng)作”行為的不可解釋性,要求權(quán)利人舉證證明存在“接觸”行為難度頗高。因此,可以嘗試通過舉證責(zé)任的分配平衡雙方當(dāng)事人的權(quán)利義務(wù)關(guān)系。
基于既有的“接觸+實(shí)質(zhì)性相似”認(rèn)定規(guī)則,如果能夠證明被訴侵權(quán)人接觸過(事實(shí)接觸)或有接觸原告作品的可能(原告作品公開出版時(shí)間在先、在互聯(lián)網(wǎng)上公開傳播、享有較高知名度等),并且能夠認(rèn)定雙方作品構(gòu)成實(shí)質(zhì)性相似,則可推定著作權(quán)侵權(quán)行為成立。在既有的證明責(zé)任分配標(biāo)準(zhǔn)下,“接觸”的證明責(zé)任由權(quán)利人承擔(dān),但權(quán)利人僅需完成“合理可能性”的證明責(zé)任即可。鑒于侵權(quán)行為認(rèn)定基于“推論”作出,當(dāng)然允許被訴侵權(quán)人提出反證,推翻侵權(quán)結(jié)論。從形式上看,為彌補(bǔ)“推論”可能導(dǎo)致的不確定性,允許“反證”推翻對被訴侵權(quán)人而言是公平的;從實(shí)質(zhì)上看,“反證”意味著舉證責(zé)任的轉(zhuǎn)移,要求被訴侵權(quán)人證明其并未接觸過權(quán)利人的作品,屬于“消極事實(shí)的證明”。基于此,未來可以進(jìn)一步嘗試將舉證責(zé)任倒置引入“接觸”要件認(rèn)定過程,要求模型訓(xùn)練平臺“自證清白”。具體而言,在“接觸”要件認(rèn)定過程中,可以要求被訴侵權(quán)方公開數(shù)據(jù)抓取與分析范圍。不能或不愿提供相關(guān)證據(jù)的,推定存在“接觸”行為。
2.明晰智能出版時(shí)代“接觸”要件判定標(biāo)準(zhǔn)
目前,司法實(shí)踐中關(guān)于“接觸”要件的認(rèn)定相對籠統(tǒng),缺乏統(tǒng)一的標(biāo)準(zhǔn)。在傳統(tǒng)版權(quán)時(shí)代,“接觸”通常是指觸及作品有形載體或者接觸實(shí)體智力成果。進(jìn)入網(wǎng)絡(luò)時(shí)代后,“接觸”要件被泛化為“接觸可能性”,既包含直接接觸,亦包含推定接觸。但智能出版視域下,“接觸”要件究竟以“接觸作品數(shù)據(jù)庫”為判定標(biāo)準(zhǔn),還是以“實(shí)質(zhì)性復(fù)制”為判定標(biāo)準(zhǔn)尚未有定論。
明晰智能出版時(shí)代“接觸”要件判定標(biāo)準(zhǔn),需要從兩方面入手。首先,明確“接觸”要件應(yīng)該考量的因素。司法實(shí)踐中通常基于權(quán)利人作品發(fā)表時(shí)間早于被控侵權(quán)行為發(fā)生時(shí)間認(rèn)定存在“接觸可能”。且版權(quán)法上的“發(fā)表”涵蓋范圍極廣,不僅包括紙質(zhì)出版、網(wǎng)絡(luò)發(fā)行、公開放映等形式,在微信朋友圈、微博等多媒體平臺宣傳也被認(rèn)定為發(fā)表行為。但應(yīng)當(dāng)注意,公開發(fā)表并不等同“接觸事實(shí)”或“接觸可能性”,仍應(yīng)結(jié)合“作品流傳度”“作者知名程度”進(jìn)行綜合判斷。此外,還應(yīng)當(dāng)重視作品間的證據(jù)性相似問題。在智能出版過程中,數(shù)字簽名、數(shù)字水印及其他帶有強(qiáng)烈個(gè)人印記的設(shè)定,均可作為“證據(jù)性相似”,佐證“接觸事實(shí)”的存在。其次,完成從“基本可能性”到“合理可能性”的轉(zhuǎn)變。在智能出版領(lǐng)域,即便生成式人工智能通過網(wǎng)絡(luò)爬取等途徑接觸到了權(quán)利人的作品,也未必在后續(xù)“創(chuàng)作”過程中實(shí)際使用。以“基本可能性”作為認(rèn)定標(biāo)準(zhǔn)過分加重了使用主體的負(fù)擔(dān)。而“合理可能性”標(biāo)準(zhǔn)僅要求權(quán)利人提供最低標(biāo)準(zhǔn)的“接觸”證據(jù),從而避免依據(jù)推測或猜想認(rèn)定“接觸”成立。
(二)“實(shí)質(zhì)性相似”要件失靈的應(yīng)對措施
1.以“市場替代”標(biāo)準(zhǔn)輔助“實(shí)質(zhì)性相似”標(biāo)準(zhǔn)
生成式人工智能通過海量數(shù)據(jù)學(xué)習(xí),可以產(chǎn)生與基礎(chǔ)作品風(fēng)格類似的內(nèi)容。囿于“智能拆分與重組”程度較高,“實(shí)質(zhì)性相似”認(rèn)定規(guī)則在智能出版領(lǐng)域失靈,無法準(zhǔn)確識別版權(quán)侵權(quán)行為。但無可置疑的是,與在先作品風(fēng)格類似的生成內(nèi)容會對基礎(chǔ)作品產(chǎn)生替代作用,損害版權(quán)主體市場利益,擠壓自然人作品的生存空間。
面對智能出版領(lǐng)域的新型版權(quán)侵權(quán)問題,“市場替代標(biāo)準(zhǔn)”有其優(yōu)勢。一方面,市場價(jià)值的損害雖然計(jì)算復(fù)雜,但卻能夠以可量化指標(biāo)呈現(xiàn),彌補(bǔ)了“實(shí)質(zhì)性相似”認(rèn)定中的主觀性和模糊性缺陷,能有效應(yīng)對新技術(shù)發(fā)展導(dǎo)致的版權(quán)侵權(quán)認(rèn)定難題。另一方面,適用“市場替代標(biāo)準(zhǔn)”可以在保護(hù)版權(quán)人利益與維護(hù)科技進(jìn)步之間實(shí)現(xiàn)平衡。避免版權(quán)的絕對保護(hù)對公眾接觸自由的影響。不僅如此,以“市場替代標(biāo)準(zhǔn)”輔助“實(shí)質(zhì)性相似”標(biāo)準(zhǔn)還順應(yīng)了版權(quán)司法實(shí)踐的發(fā)展趨勢,肯定了市場因素在版權(quán)侵權(quán)認(rèn)定中的重要地位。
從操作層面而言,在“實(shí)質(zhì)性相似”認(rèn)定過程中,首先應(yīng)當(dāng)適用既有的“實(shí)質(zhì)性相似判斷方法”(“抽象分離法”“整體觀感法”“內(nèi)外部測試法”“普通觀察者測試法”),對AIGC與基礎(chǔ)作品之間的相似性做初步判斷。其次,適用“市場替代標(biāo)準(zhǔn)”,判斷AIGC是否會對基礎(chǔ)作品產(chǎn)生替代作用,影響版權(quán)主體的市場利益,通過AIGC對基礎(chǔ)作品版權(quán)市場的侵占綜合判斷是否構(gòu)成版權(quán)侵權(quán)。市場替代程度與實(shí)質(zhì)性相似呈正比例關(guān)系,換言之,AIGC對基礎(chǔ)作品的市場替代程度越高,意味著其與基礎(chǔ)作品的實(shí)質(zhì)性相似程度越高。
2.弱化對“微量使用”行為的考量
司法實(shí)踐中認(rèn)定“實(shí)質(zhì)性相似”時(shí),通常會從“數(shù)量”與“質(zhì)量”兩個(gè)層面進(jìn)行考察。前者關(guān)注被訴侵權(quán)作品與版權(quán)作品的相同點(diǎn)是否達(dá)到“可訴”程度;后者則關(guān)注相同點(diǎn)是否屬于受著作權(quán)法保護(hù)的獨(dú)創(chuàng)性表達(dá)。在進(jìn)行侵權(quán)對比時(shí),應(yīng)當(dāng)過濾掉公共領(lǐng)域的素材以及常用的創(chuàng)作手段,剩余的部分即便被認(rèn)定為相似,但也可能因占比極少而不屬于“實(shí)質(zhì)性相似”了。
“接觸+實(shí)質(zhì)性相似”規(guī)則是我國版權(quán)侵權(quán)行為認(rèn)定的基本規(guī)則,即便基于該規(guī)則認(rèn)定版權(quán)侵權(quán)行為成立,行為人仍可能在合理使用之下獲得版權(quán)豁免。由此來看,“接觸+實(shí)質(zhì)性相似”規(guī)則實(shí)際上是合理使用原則的前置環(huán)節(jié)。從“實(shí)質(zhì)性相似”與“合理使用”的具體構(gòu)造來看,二者均涉及對使用“數(shù)量”和“質(zhì)量”的考察,從而產(chǎn)生規(guī)則層面的重疊。不僅如此,囿于司法實(shí)踐中對于“微量使用”缺乏明確的標(biāo)準(zhǔn),有可能會導(dǎo)致“微量使用”行為完全排除“實(shí)質(zhì)性相似”之認(rèn)定。
前文已經(jīng)提及,智能出版視域下生成式人工智能對基礎(chǔ)作品的使用大多數(shù)為“微量使用”,直接淡化了“實(shí)質(zhì)性相似”行為的可訴性。與此同時(shí),“實(shí)質(zhì)性相似”與合理使用在“數(shù)量”與“質(zhì)量”認(rèn)定方面存在重疊。既如此,可以直接弱化“實(shí)質(zhì)性相似”認(rèn)定階段對“數(shù)量”和“質(zhì)量”的考察,將其置于后續(xù)的“合理使用”認(rèn)定環(huán)節(jié)再做考量。此舉既緩解了“實(shí)質(zhì)性相似”失靈的尷尬局面,也有助于理順“接觸+實(shí)質(zhì)性相似”與合理使用原則之間的關(guān)系。
五、結(jié)語
生成式人工智能技術(shù)引發(fā)生產(chǎn)方式與傳播方式的變革,重塑出版各個(gè)環(huán)節(jié),推動出版邁入智能化時(shí)代。但AIGC是一把雙刃劍,在賦能傳統(tǒng)出版行業(yè)的同時(shí),也帶來了諸多亟待解決的難題。面對新型版權(quán)侵權(quán)樣態(tài),“接觸+實(shí)質(zhì)性相似”認(rèn)定規(guī)則陷入“失效”的尷尬境地。此時(shí),法律制度層面的既定規(guī)則應(yīng)當(dāng)有所調(diào)整,以順應(yīng)新技術(shù)和新業(yè)態(tài)的發(fā)展需求。在技術(shù)推動變革的時(shí)代,應(yīng)當(dāng)在維護(hù)法律安定性的同時(shí),積極推動法律與技術(shù)的良性互動。目前,智能出版尚處于起步階段,其轉(zhuǎn)型與升級過程中的問題有待進(jìn)一步研究。不斷反思智能出版領(lǐng)域的版權(quán)侵權(quán)問題并及時(shí)提供應(yīng)對措施,有助于加深對智能出版的認(rèn)識,亦有助于推動出版行業(yè)邁向新的發(fā)展階段。
The Transformation of the “Contact and Substantial Similarity”Rule from the Perspective of Intelligent Publishing
Abstract: In the perspective of intelligent publishing, the “contact and substantial similarity” rule falls into a state of failure, manifested as the virtual existence of the “contact” element and the failure of the “substantial similarity” element. The virtual appearance of the “contact” element is due to the expansion of contact possibilities through intelligent “grasping and analysis”, while non-explicit use increases the difficulty of identifying “contact”; Essentially, it is because the logical chain from “openness” to “factual contact” is broken. The failure of the “substantial similarity” element is due to the limitations of existing judgment methods; fragmentation dilutes the actionability of “substantial similarity”. Based on this, reform should be promoted from two aspects: on the one hand, the inversion of the burden of proof should be applied to the identification of “contact” elements; clarify the criteria for determining the “contact” elements in the era of intelligent publishing, thereby strengthening the independent value of the “contact” elements. On the other hand, the “market substitution” standard is used to supplement the “substantial similarity” standard, while weakening the consideration of “micro use” behavior to address the failure of the “substantial similarity” element.
Keywords: Intelligent Publishing; Generative Artificial Intelligence; AIGC; Contact Substantial Similarity