高雅文?來小鵬
【摘要】大模型技術(shù)驅(qū)動(dòng)生成式人工智能快速發(fā)展的同時(shí),基于大數(shù)據(jù)訓(xùn)練的語(yǔ)料數(shù)據(jù)引發(fā)了新的版權(quán)侵權(quán)風(fēng)險(xiǎn)。考慮到生成式人工智能研發(fā)者、服務(wù)提供者和權(quán)利人的利益平衡,應(yīng)將非商業(yè)目的的機(jī)器閱讀與文本訓(xùn)練納入合理使用情形,針對(duì)具有商業(yè)目的的版權(quán)語(yǔ)料數(shù)據(jù)輸入和利用行為構(gòu)建準(zhǔn)法定許可制度,通過多元化版權(quán)授權(quán)模式應(yīng)對(duì)輸入端語(yǔ)料數(shù)據(jù)的合法性風(fēng)險(xiǎn),探索避風(fēng)港規(guī)則在生成式人工智能平臺(tái)上的適用,從技術(shù)和法律兩個(gè)方面最大限度地發(fā)揮語(yǔ)料數(shù)據(jù)的價(jià)值和功能。
【關(guān)? 鍵? 詞】生成式人工智能;語(yǔ)料數(shù)據(jù);版權(quán)保護(hù);合理使用
【作者單位】高雅文,中央民族大學(xué)法學(xué)院;來小鵬,中國(guó)政法大學(xué)民商經(jīng)濟(jì)法學(xué)院。
【基金項(xiàng)目】科技部重大專項(xiàng)“知識(shí)產(chǎn)權(quán)司法保護(hù)與跨部門協(xié)同服務(wù)關(guān)鍵技術(shù)研究”(2022YFC3303000)階段性成果。
【中圖分類號(hào)】D923.41【文獻(xiàn)標(biāo)識(shí)碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.05.005
隨著ChatGPT、Midjourney等生成式人工智能的快速發(fā)展,關(guān)于人工智能生成內(nèi)容(AI-Generated Content, AIGC)的版權(quán)問題再次引發(fā)廣泛的關(guān)注和討論。AIGC不再僅僅作為創(chuàng)作工具或手段,且在外觀上與人類創(chuàng)作的作品難以區(qū)分,這為AIGC的可版權(quán)性帶來新的爭(zhēng)議,無論將生成物的版權(quán)賦予開發(fā)者、使用者還是產(chǎn)品所有者,都存在不可回避的問題和爭(zhēng)議。與此同時(shí),國(guó)內(nèi)外出現(xiàn)了一系列有關(guān)生成式人工智能(Generative AI, GenAI)語(yǔ)料數(shù)據(jù)獲取、處理和使用的版權(quán)訴訟案例。如2023年11月,北京互聯(lián)網(wǎng)法院首次判決人工智能生成圖片構(gòu)成作品的使用者享有版權(quán),雖然這種權(quán)利認(rèn)定有利于激勵(lì)利用人工智能進(jìn)行創(chuàng)作的行為,但也為GenAI語(yǔ)料抓取的合法性帶來更大的質(zhì)疑,GenAI的版權(quán)保護(hù)應(yīng)建立在前端語(yǔ)料數(shù)據(jù)輸入、處理和輸出的合法性探討之上。
一、生成式人工智能語(yǔ)料抓取版權(quán)問題
人工智能語(yǔ)料數(shù)據(jù)是生成式人工智能學(xué)習(xí)和訓(xùn)練的內(nèi)容主要來源包括兩部分:一是從外部獲取的語(yǔ)料庫(kù),由沒有權(quán)屬保護(hù)的信息、受保護(hù)數(shù)據(jù)(如受版權(quán)保護(hù)的作品)或兩者的混合數(shù)據(jù)構(gòu)成,二是從內(nèi)部獲取的在服務(wù)用戶使用過程中收集和輸出的信息。生成式人工智能的語(yǔ)料輸入是其訓(xùn)練模型和輸出內(nèi)容的基礎(chǔ),大模型AI產(chǎn)品的開發(fā)和訓(xùn)練依賴于海量數(shù)據(jù)的投喂,這也意味著侵權(quán)風(fēng)險(xiǎn)將持續(xù)增加。
1.區(qū)分語(yǔ)料的公共屬性與版權(quán)保護(hù)屬性
不同于傳統(tǒng)的基于規(guī)則或模板的簡(jiǎn)單內(nèi)容生成,生成式人工智能主要由 “深度學(xué)習(xí)” 技術(shù)[1]所驅(qū)動(dòng),該技術(shù)可以通過訓(xùn)練從語(yǔ)料數(shù)據(jù)中自動(dòng)學(xué)習(xí)結(jié)構(gòu)和模式,從而生成新的高質(zhì)量?jī)?nèi)容。OpenAI的聊天人工智能就是基于深度學(xué)習(xí)模型轉(zhuǎn)換器模型(Transformer)進(jìn)行訓(xùn)練,該模型為大規(guī)模數(shù)據(jù)訓(xùn)練提供了可能性[2]。大模型訓(xùn)練的特征之一就是學(xué)習(xí)的參數(shù)規(guī)模極大,通常達(dá)到百萬級(jí)甚至萬億級(jí),數(shù)據(jù)價(jià)值隨著數(shù)據(jù)規(guī)模的擴(kuò)大而提升,語(yǔ)料數(shù)據(jù)規(guī)模的擴(kuò)大有利于機(jī)器學(xué)習(xí)復(fù)雜問題,從而提高GenAI模型對(duì)各種場(chǎng)景需求的可應(yīng)用性[3]。高質(zhì)量的語(yǔ)料數(shù)據(jù)庫(kù)是GenAI快速發(fā)展的重要基礎(chǔ),如《人民數(shù)據(jù)》基于《人民日?qǐng)?bào)》及人民網(wǎng)的媒體資源優(yōu)勢(shì),開發(fā)了包含近3億條新聞數(shù)據(jù)、問答數(shù)據(jù)的語(yǔ)義語(yǔ)料庫(kù),回應(yīng)了大模型在語(yǔ)料方面的迫切需求。鼓勵(lì)此類公共屬性數(shù)據(jù)庫(kù)開發(fā),合理分配數(shù)據(jù)收益,是解決GenAI語(yǔ)料數(shù)據(jù)糾紛的重要途徑之一。
目前數(shù)據(jù)的分類方法主要有兩種:一種分為個(gè)人數(shù)據(jù)、企業(yè)數(shù)據(jù)與公共數(shù)據(jù),另一種分為原始數(shù)據(jù)、數(shù)據(jù)資源與數(shù)據(jù)產(chǎn)品[4]。數(shù)據(jù)資源是指可作為生產(chǎn)資料投入生產(chǎn)之中形成數(shù)據(jù)產(chǎn)品的數(shù)據(jù)的總稱,數(shù)據(jù)產(chǎn)品是指原始數(shù)據(jù)經(jīng)實(shí)質(zhì)性加工形成的衍生數(shù)據(jù)以及數(shù)據(jù)衍生產(chǎn)品[5]。生成式人工智能利用的語(yǔ)料數(shù)據(jù)中既有由公共領(lǐng)域內(nèi)容構(gòu)成的公共數(shù)據(jù),也有由企業(yè)所收集、生產(chǎn)的企業(yè)數(shù)據(jù)以及個(gè)人數(shù)據(jù)。語(yǔ)料數(shù)據(jù)本身即為一種數(shù)據(jù)資源,可以通過處理生成相應(yīng)的數(shù)據(jù)產(chǎn)品。對(duì)具有公共屬性的數(shù)據(jù)而言,允許公益性或必要性研究及經(jīng)營(yíng)使用、實(shí)現(xiàn)共享與開放比確認(rèn)權(quán)益歸屬更重要[6]。但企業(yè)數(shù)據(jù)及個(gè)人數(shù)據(jù)中不可避免地存在從網(wǎng)絡(luò)中收集的包含版權(quán)屬性的語(yǔ)料數(shù)據(jù),這部分?jǐn)?shù)據(jù)的授權(quán)與侵權(quán)問題需要單獨(dú)討論。
2.版權(quán)保護(hù)范疇語(yǔ)料抓取行為合法性認(rèn)定
生成式人工智能語(yǔ)料數(shù)據(jù)抓取的合法性,是指GenAI是否以合法正當(dāng)?shù)姆绞绞占Z(yǔ)料數(shù)據(jù),是否獲得著作權(quán)人授權(quán)許可。GenAI服務(wù)提供者應(yīng)保證訓(xùn)練數(shù)據(jù)來源的合法、真實(shí)、準(zhǔn)確、客觀[7]。
在關(guān)于AIGC版權(quán)確權(quán)與歸屬的爭(zhēng)論中,多數(shù)觀點(diǎn)基于激勵(lì)理論賦權(quán)人工智能的所有者或使用者[8]。然而,對(duì)OpenAI、谷歌、微軟、百度等人工智能研發(fā)企業(yè)來說,目前的獲利來源不是版權(quán),而是通過設(shè)置收費(fèi)版本、吸引流量和打造生態(tài)系統(tǒng)等方式變現(xiàn)[9]。在試圖通過版權(quán)賦權(quán)發(fā)揮產(chǎn)業(yè)促進(jìn)作用之前,對(duì)生成式人工智能語(yǔ)料數(shù)據(jù)合法性的探討更為緊迫。GenAI輸入端著作權(quán)糾紛的爭(zhēng)議主要集中在語(yǔ)料數(shù)據(jù)抓取他人作品訓(xùn)練是否侵犯著作權(quán)以及能否構(gòu)成合理使用,利用版權(quán)作品作為語(yǔ)料數(shù)據(jù)對(duì)人工智能進(jìn)行訓(xùn)練,可能被認(rèn)定為合理使用行為,也可能構(gòu)成版權(quán)侵權(quán)[10]。
對(duì)于抓取版權(quán)保護(hù)范疇語(yǔ)料行為的合法性問題,各國(guó)立法存在分歧。美國(guó)在人工智能的版權(quán)保護(hù)問題上采取相對(duì)保守的態(tài)度,尚未出臺(tái)具體的法律規(guī)范。出于推動(dòng)人工智能產(chǎn)品技術(shù)創(chuàng)新、防止法律阻礙技術(shù)進(jìn)步等審慎因素,美國(guó)采取“先產(chǎn)業(yè)發(fā)展后立法”的方式,短期內(nèi)依賴企業(yè)自覺、行業(yè)標(biāo)準(zhǔn)和行政機(jī)構(gòu)的回應(yīng)解決人工智能領(lǐng)域的版權(quán)爭(zhēng)議。2023年7月,美國(guó)七大AI企業(yè)與政府簽署協(xié)議,承諾自愿采取措施監(jiān)管AI技術(shù)開發(fā)的法律風(fēng)險(xiǎn),其中就包括為AIGC添加水印和制定知識(shí)產(chǎn)權(quán)保護(hù)政策。
英國(guó)對(duì)待生成式人工智能的態(tài)度相對(duì)開放。根據(jù)英國(guó)《1988年版權(quán)、外觀設(shè)計(jì)以及專利法(CDPA)》(以下簡(jiǎn)稱CDPA)的規(guī)定,允許為非商業(yè)性研究而進(jìn)行文本復(fù)制和數(shù)據(jù)挖掘。根據(jù)英國(guó)的版權(quán)例外制度,出版商和內(nèi)容提供商采取維護(hù)網(wǎng)絡(luò)安全或穩(wěn)定的措施,不應(yīng)阻止或不合理地限制研究人員進(jìn)行文本復(fù)制和數(shù)據(jù)挖掘,但規(guī)避版權(quán)所有者為防止盜版而采取的技術(shù)保護(hù)措施。英國(guó)政府網(wǎng)站發(fā)布的《在英國(guó)發(fā)展人工智能產(chǎn)業(yè)》報(bào)告中提到:商業(yè)公司使用AI對(duì)文本和數(shù)據(jù)挖掘有利于研究界和社會(huì)公共利益;因版權(quán)原因不能利用已公開作品作為訓(xùn)練數(shù)據(jù),這將限制AI在具有高潛在公共價(jià)值領(lǐng)域的使用,降低已發(fā)表作品和研究的可利用價(jià)值,政府在制定版權(quán)例外中應(yīng)考慮這一價(jià)值。這說明,英國(guó)允許非商業(yè)研究人員在一定程度上直接對(duì)文本和數(shù)據(jù)進(jìn)行復(fù)制和挖掘,盡管政府已經(jīng)考慮將商業(yè)行為納入版權(quán)例外制度,但是商業(yè)公司GenAI對(duì)版權(quán)語(yǔ)料數(shù)據(jù)的獲取還未獲得立法支持。
歐盟已有相當(dāng)一部分立法內(nèi)容涉及人工智能數(shù)據(jù)利用行為,歐盟委員會(huì)發(fā)布的《數(shù)字化單一市場(chǎng)版權(quán)指令》第3條規(guī)定,允許研究組織和文化遺產(chǎn)機(jī)構(gòu)以科學(xué)研究為目的對(duì)其合法獲取的作品進(jìn)行文本和數(shù)據(jù)挖掘而進(jìn)行復(fù)制和摘錄,第4條也允許著作權(quán)人對(duì)上述權(quán)利予以保留,第17條則要求網(wǎng)絡(luò)內(nèi)容提供者上傳內(nèi)容時(shí)必須獲得權(quán)利人的授權(quán)。此外,2024年3月,歐洲議會(huì)通過了歐盟《人工智能法案》,其中提出人工智能利用著作權(quán)作品的透明性要求,用于訓(xùn)練的內(nèi)容的詳細(xì)摘要。
我國(guó)立法方面,國(guó)家網(wǎng)信辦等七部門發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》要求“生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng),使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;不得侵害他人依法享有的知識(shí)產(chǎn)權(quán)”,目的是規(guī)范GenAI語(yǔ)料數(shù)據(jù)來源的合法性問題,但其中并未明確要求企業(yè)必須獲得版權(quán)許可。此外,《中華人民共和國(guó)著作權(quán)法》(以下簡(jiǎn)稱《著作權(quán)法》)第24條的合理使用條款列舉了12種適用情形,同時(shí)規(guī)定了兜底條款“法律、行政法規(guī)規(guī)定的其他情形”,但該條款中并未列入機(jī)器閱讀與文本訓(xùn)練行為,諸多學(xué)者已對(duì)此提出修改意見[11]。最高人民法院公布的相關(guān)文件中明確指出,在促進(jìn)技術(shù)創(chuàng)新和商業(yè)發(fā)展確有必要的特殊情形下,應(yīng)考慮作品使用行為的性質(zhì)和目的、被使用作品的性質(zhì)、被使用部分的數(shù)量和質(zhì)量、使用對(duì)作品潛在市場(chǎng)或價(jià)值的影響等因素,如果該使用行為既不與作品的正常使用相沖突,也不會(huì)損害作者的正當(dāng)利益,則可以認(rèn)定為合理使用。就當(dāng)前GenAI版權(quán)語(yǔ)料數(shù)據(jù)的使用情況來看,客觀上難以控制使用作品的數(shù)量和對(duì)原作品市場(chǎng)價(jià)值的不利影響,甚至可能損害原作者的正當(dāng)利益,故以此作為合法性依據(jù)存在一定的局限性。
結(jié)合目前我國(guó)及域外GenAI語(yǔ)料數(shù)據(jù)抓取的立法情況可以發(fā)現(xiàn),GenAI抓取版權(quán)范疇語(yǔ)料的合法性問題對(duì)版權(quán)和數(shù)據(jù)相關(guān)立法提出了新的挑戰(zhàn)。盡管英國(guó)和歐盟已經(jīng)開始通過人工智能立法支持特定情況下的數(shù)據(jù)抓取,但美國(guó)等國(guó)家仍舊保持相對(duì)保守的態(tài)度,尚未制定相關(guān)的法律法規(guī)。
3.版權(quán)保護(hù)范疇語(yǔ)料抓取能否構(gòu)成侵害復(fù)制權(quán)
版權(quán)語(yǔ)料被抓取后儲(chǔ)存在其他相關(guān)服務(wù)器中,只在訓(xùn)練時(shí)調(diào)取,該階段極易涉及復(fù)制權(quán)侵權(quán)問題,在語(yǔ)料數(shù)據(jù)抓取合法性引發(fā)爭(zhēng)議的同時(shí),GenAI訓(xùn)練大模型涉嫌侵犯作品復(fù)制權(quán)的糾紛不斷涌現(xiàn)。2023年1月,圖片提供商華蓋創(chuàng)意因未經(jīng)許可從其網(wǎng)站抓取數(shù)百萬張圖片起訴AI繪畫工具開發(fā)者Stability AI,另有3位藝術(shù)家對(duì)Stability AI、AI繪畫工具M(jìn)idjourney以及藝術(shù)家作品集平臺(tái)DeviantArt提起訴訟,認(rèn)為其未經(jīng)原作者許可從網(wǎng)絡(luò)獲取圖像用以大模型訓(xùn)練,侵犯了原創(chuàng)作者的權(quán)利。2023年12月,《紐約時(shí)報(bào)》起訴OpenAI和微軟,指控兩家公司未經(jīng)許可獲取其數(shù)百萬條文章內(nèi)容作為訓(xùn)練素材。這些案件中,原告主張被告未經(jīng)授權(quán)復(fù)制其文字、圖片等作品作為語(yǔ)料數(shù)據(jù)訓(xùn)練大模型,侵犯著作權(quán)中的復(fù)制權(quán),被告則引用合理使用條款進(jìn)行抗辯。
針對(duì)GenAI訓(xùn)練行為能否落入合理使用條款、是否構(gòu)成侵犯復(fù)制權(quán)的問題,各國(guó)在立法和解釋上持不同觀點(diǎn)。英國(guó)CDPA規(guī)定:非商業(yè)研究中的數(shù)據(jù)抓取和復(fù)制屬于版權(quán)例外;臨時(shí)、短暫復(fù)制文藝作品,這種復(fù)制是網(wǎng)絡(luò)傳輸技術(shù)過程不可或缺、并有合法使用目的且不具有獨(dú)立經(jīng)濟(jì)意義,則不侵犯版權(quán)?!度毡局鳈?quán)法》的權(quán)利限制條款中,具體列舉了可未經(jīng)著作權(quán)人許可而使用其作品的類型,在確??深A(yù)見性的同時(shí),設(shè)置權(quán)利限制條款的靈活要件。
我國(guó)立法方面,除《生成式人工智能服務(wù)管理暫行辦法》和相關(guān)意見外,關(guān)于版權(quán)語(yǔ)料抓取是否侵犯復(fù)制權(quán),《北京市高級(jí)人民法院侵害著作權(quán)案件審理指南》規(guī)定,未經(jīng)許可復(fù)制他人作品但未發(fā)行或者以其他方式傳播的構(gòu)成侵犯復(fù)制權(quán),未經(jīng)許可在被訴侵權(quán)作品中使用了原作品的表達(dá)但未形成新的作品屬于復(fù)制行為。由此,生成式人工智能在訓(xùn)練中未經(jīng)許可獲取版權(quán)范疇語(yǔ)料的行為,即便未形成新作品,未進(jìn)行發(fā)行或傳播,也會(huì)構(gòu)成復(fù)制行為。對(duì)此,我國(guó)司法實(shí)踐已有先例。2024年廣州互聯(lián)網(wǎng)法院審結(jié)的AIGC侵權(quán)案件中,被告經(jīng)營(yíng)的Tab(化名)網(wǎng)站具有利用AI對(duì)話生成繪畫的功能,法院認(rèn)為Tab網(wǎng)站生成的涉案圖片具有接觸原作品的可能性,“部分或完全復(fù)制了‘奧特曼這一美術(shù)形象的獨(dú)創(chuàng)性表達(dá)”,侵犯了原作者的復(fù)制權(quán)。但由于本案被告適用的是第三方研發(fā)而非自主研發(fā)的大模型,因此對(duì)于將涉案侵權(quán)素材從訓(xùn)練數(shù)據(jù)庫(kù)中刪除的訴訟請(qǐng)求,法院并未進(jìn)行認(rèn)定??梢?,我國(guó)法院目前在一定程度上支持GenAI語(yǔ)料抓取不適用于合理使用,認(rèn)為利用版權(quán)作品訓(xùn)練大模型屬于復(fù)制行為,構(gòu)成復(fù)制權(quán)侵權(quán),這對(duì)權(quán)利人來說是在生成式人工智能領(lǐng)域獲得版權(quán)保護(hù)的積極信號(hào)。
由此,完全利用公共領(lǐng)域語(yǔ)料的生成物一般不涉及版權(quán)侵權(quán)問題,但利用受版權(quán)保護(hù)作品作為訓(xùn)練素材的生成物一旦與現(xiàn)有作品構(gòu)成實(shí)質(zhì)性相似,則可能涉嫌著作權(quán)侵權(quán)。實(shí)際上,在不涉及輸出且不公開訓(xùn)練數(shù)據(jù)的情況下,很難辨別GenAI使用的語(yǔ)料數(shù)據(jù)是否只包含公共領(lǐng)域素材。如果認(rèn)定人工智能使用者或服務(wù)提供者對(duì)生成物享有版權(quán),根據(jù)權(quán)責(zé)一致原則,應(yīng)對(duì)其抓取版權(quán)保護(hù)范疇語(yǔ)料的行為是否侵犯復(fù)制權(quán)進(jìn)行分析。在沒有生成內(nèi)容時(shí),GenAI獲取他人作品作為語(yǔ)料數(shù)據(jù)訓(xùn)練大模型的過程,并不存在實(shí)際處理作品的行為,權(quán)利人也難以舉證由此造成的損失,根據(jù)我國(guó)現(xiàn)行法律規(guī)定很難直接認(rèn)定其侵犯原作品復(fù)制權(quán)。
二、生成式人工智能語(yǔ)料處理版權(quán)問題
版權(quán)語(yǔ)料數(shù)據(jù)的處理階段,也是大模型訓(xùn)練的核心階段,即通過學(xué)習(xí)將作品內(nèi)容中與關(guān)鍵詞相關(guān)的部分存儲(chǔ)在模型內(nèi)部,并通過一定算法進(jìn)行分析。
1.版權(quán)數(shù)據(jù)處理行為
就版權(quán)語(yǔ)料處理而言,一般涉及對(duì)作品內(nèi)容的修改、改編、制作、匯編、攝制以及翻譯行為,與GenAI的服務(wù)內(nèi)容以及使用者的具體需求相關(guān)。在上述版權(quán)數(shù)據(jù)處理行為中,不同來源的語(yǔ)料數(shù)據(jù)涉及不同的版權(quán)法律風(fēng)險(xiǎn)。其一,公共屬性的語(yǔ)料數(shù)據(jù)中包含公有領(lǐng)域的內(nèi)容,盡管不存在財(cái)產(chǎn)權(quán)侵權(quán)的風(fēng)險(xiǎn),但在修改、改編、制作等處理后,可能涉及署名權(quán)、修改權(quán)、保護(hù)作品完整權(quán)等問題。其二,由于GenAI數(shù)據(jù)處理結(jié)果的不可預(yù)見性,通過直接授權(quán)、集中授權(quán)獲得版權(quán)人許可或適用于合理使用獲取的語(yǔ)料數(shù)據(jù),已有授權(quán)可能無法囊括對(duì)語(yǔ)料全部的處理行為。其三,利用爬蟲技術(shù)獲取的語(yǔ)料數(shù)據(jù),其利用方式和目的受協(xié)議條款約束,商業(yè)產(chǎn)品開發(fā)目的的再利用一般會(huì)受到限制。
目前,人工智能對(duì)版權(quán)語(yǔ)料處理行為的屬性尚未達(dá)成一致,有觀點(diǎn)認(rèn)為無論何種處理都可能落入改編權(quán)的范疇。也有觀點(diǎn)認(rèn)為,處理行為可能落入版權(quán)權(quán)利內(nèi)容的兜底條款,即“應(yīng)當(dāng)由作者享有的其他權(quán)利”。甚至有觀點(diǎn)認(rèn)為,在模型內(nèi)部對(duì)作品的處理行為本質(zhì)上不屬于版權(quán)專有權(quán)利規(guī)制的行為范疇。由于在GenAI的作品處理過程中很難對(duì)所有行為進(jìn)行一一判斷,因此學(xué)界對(duì)其合法性在立法和法律解釋層面上尚未形成共識(shí)。
2.版權(quán)數(shù)據(jù)處理行為合法性的立法分析
關(guān)于GenAI版權(quán)數(shù)據(jù)處理行為是否符合法律規(guī)定,各國(guó)在數(shù)據(jù)和版權(quán)相關(guān)立法與政策制定方面都有嘗試。
2022年12月,中共中央、國(guó)務(wù)院發(fā)布《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,其中提出“數(shù)據(jù)產(chǎn)權(quán)”的概念,要求“建立數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)等分置的產(chǎn)權(quán)運(yùn)行機(jī)制”,指出數(shù)據(jù)采集、收集、加工使用、交易和應(yīng)用全過程中參與方均享有一定權(quán)益,包括不同數(shù)據(jù)形態(tài)的數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)和數(shù)據(jù)產(chǎn)品經(jīng)營(yíng)權(quán)。使用權(quán)能即權(quán)利人對(duì)數(shù)據(jù)進(jìn)行處理、多維度發(fā)掘和實(shí)現(xiàn)數(shù)據(jù)使用價(jià)值,收益權(quán)能即權(quán)利人有權(quán)通過數(shù)據(jù)交易或提供數(shù)據(jù)服務(wù)獲得經(jīng)濟(jì)收益[12]。在GenAI語(yǔ)料數(shù)據(jù)的處理階段,如果經(jīng)營(yíng)者就語(yǔ)料數(shù)據(jù)享有一定的數(shù)據(jù)權(quán)益,并且對(duì)版權(quán)范疇的語(yǔ)料數(shù)據(jù)進(jìn)行了修改、改編、制作、攝制、匯編以及翻譯等處理,其版權(quán)數(shù)據(jù)處理行為的合法性就應(yīng)建立在授權(quán)之上。但不可回避的是,在處理行為屬性沒有定論的前提下,涉及版權(quán)的權(quán)利范疇尚不明確,缺乏授權(quán)基礎(chǔ),大模型訓(xùn)練語(yǔ)料數(shù)據(jù)龐大,現(xiàn)有授權(quán)機(jī)制效率不高,可能對(duì)快速發(fā)展的GenAI產(chǎn)業(yè)產(chǎn)生負(fù)面效應(yīng)。因此,全球各國(guó)都在加速探索“合理使用”等版權(quán)例外制度在生成式人工智能處理語(yǔ)料數(shù)據(jù)方面的應(yīng)用。
我國(guó)部分學(xué)者參照著作權(quán)合理使用制度提出了“數(shù)據(jù)合理使用”規(guī)則,認(rèn)為人工智能開發(fā)者使用他人版權(quán)數(shù)據(jù)訓(xùn)練模型時(shí),如果與數(shù)據(jù)原本使用的目的或功能不同,且不影響該數(shù)據(jù)正常使用,沒有不合理地?fù)p害數(shù)據(jù)權(quán)利人的合法權(quán)益,此時(shí)對(duì)版權(quán)數(shù)據(jù)的使用行為屬于數(shù)據(jù)合理使用,可以不經(jīng)許可、不付報(bào)酬,但應(yīng)顯著標(biāo)識(shí)數(shù)據(jù)來源。然而,此處的版權(quán)數(shù)據(jù)“使用”,并未包含訓(xùn)練以外的修改、改編等其他處理方式。
國(guó)外部分國(guó)家已積極推進(jìn)GenAI語(yǔ)料數(shù)據(jù)處理的法律與政策制定。2023年1月,以色列司法部發(fā)布意見書,明確版權(quán)語(yǔ)料可以用于大模型機(jī)器學(xué)習(xí)環(huán)境,認(rèn)為機(jī)器學(xué)習(xí)屬于以色列版權(quán)法的合理使用范疇。日本為應(yīng)對(duì)數(shù)字化和網(wǎng)絡(luò)化發(fā)展中產(chǎn)生的新的作品使用形態(tài),于2019年《日本著作權(quán)法》修正案中引入“不以欣賞為目的”的適用規(guī)定,利用作品或數(shù)據(jù)進(jìn)行數(shù)據(jù)分析而不涉及人類感官感知作品中所表達(dá)的內(nèi)容,在其他非個(gè)人享受或引起他人享受該作品表達(dá)的思想或情感的情況下,可以任何方式和必要程度利用作品。該條款的解釋在日本法律界及學(xué)界引起爭(zhēng)議。有觀點(diǎn)認(rèn)為版權(quán)人從其作品中獲得的經(jīng)濟(jì)利益來自為滿足智力和精神需求的消費(fèi)者所支付,而AI收集查找分析版權(quán)作品不具有享受和感知作品表達(dá)的欣賞目的,它原則上不會(huì)損害權(quán)利人的利益,因此未經(jīng)權(quán)利人許可,AI可以使用其作品進(jìn)行信息分析和數(shù)據(jù)挖掘。也有觀點(diǎn)認(rèn)為應(yīng)慎重考慮該條款的適用,限制AI只能適用于經(jīng)過權(quán)利人許可的學(xué)習(xí)語(yǔ)料。因此,日本文化廳著作權(quán)課在《關(guān)于AI與著作權(quán)的觀點(diǎn)(草案)》中指出,生成式AI檢索包含版權(quán)的數(shù)據(jù)并匯總結(jié)果生成回答時(shí),盡管不適用于第30條之4,也可以在少量使用時(shí)適用于第47條之5。該草案甚至提出復(fù)制行為本身適用權(quán)利限制規(guī)定時(shí),即便未取得權(quán)利人許可也可以合法實(shí)施基于AI學(xué)習(xí)目的的作品復(fù)制。例如,以AI學(xué)習(xí)為目的,個(gè)人或在家庭內(nèi)或其他類似的有限范圍內(nèi)使用,根據(jù)該法第30條第1款(為了私人使用的復(fù)制)的規(guī)定可以復(fù)制作品。韓國(guó)在其2023年的經(jīng)濟(jì)工作計(jì)劃中提出推進(jìn)版權(quán)法修訂,允許對(duì)各種出版物進(jìn)行數(shù)據(jù)分析,以發(fā)展超大規(guī)模的人工智能產(chǎn)業(yè)。
生成式人工智能語(yǔ)料處理階段的版權(quán)問題涉及行為屬性界定、權(quán)利保護(hù)范疇以及激勵(lì)技術(shù)與產(chǎn)業(yè)發(fā)展等多重價(jià)值目標(biāo),如何合理適用版權(quán)例外規(guī)則,需要更加科學(xué)的制度設(shè)置。
3.解釋論視角的版權(quán)數(shù)據(jù)處理行為合法性分析
關(guān)于版權(quán)語(yǔ)料數(shù)據(jù)處理行為的司法實(shí)踐,廣州互聯(lián)網(wǎng)法院AIGC首案判決中,在認(rèn)定被告網(wǎng)站侵犯復(fù)制權(quán)的同時(shí),法院認(rèn)為生成的涉案圖片在部分保留奧特曼美術(shù)形象獨(dú)創(chuàng)性表達(dá)的基礎(chǔ)上,生成了包括插畫風(fēng)格的奧特曼,以及奧特曼與其他卡通形象的融合等新特征,構(gòu)成對(duì)原作品的改編,侵犯了原告作品的改編權(quán)。本案中被告生成的涉案圖片在原作品基礎(chǔ)上的改編行為被認(rèn)定為侵權(quán),進(jìn)一步證明目前我國(guó)司法實(shí)踐尚未在GenAI語(yǔ)料數(shù)據(jù)處理問題上考慮適用合理使用規(guī)則。
在GenAI未經(jīng)許可利用版權(quán)語(yǔ)料數(shù)據(jù)的域外訴訟中,被告通常引用合理使用條款進(jìn)行抗辯,如美國(guó)《版權(quán)法》規(guī)定,以復(fù)制品、錄音制品或其他方式用于批評(píng)、評(píng)論、新聞報(bào)道、教學(xué)、學(xué)術(shù)或研究等目的的數(shù)據(jù)處理行為不構(gòu)成侵犯版權(quán),該條款同時(shí)規(guī)定了合理使用需要考慮的四項(xiàng)要素,其中一項(xiàng)就是考慮使用目的是否具有商業(yè)性質(zhì)或用于非營(yíng)利教育目的,但截至目前尚未有引用合理使用抗辯成功的案例。在人工智能企業(yè)抓取版權(quán)作品行為的合法性尚未確定時(shí),賦予GenAI服務(wù)提供者版權(quán),將增加其利用版權(quán)語(yǔ)料數(shù)據(jù)行為侵權(quán)的可能性。
三、生成式人工智能語(yǔ)料輸出版權(quán)問題
如果說生成式人工智能的語(yǔ)料輸入和處理階段很難直接證明其版權(quán)侵權(quán)行為,那么在輸出階段這一問題則尤為明顯。
1.版權(quán)數(shù)據(jù)輸出行為
當(dāng)前常見的GenAI產(chǎn)品包括“文生文”“文生圖” “文生視頻”,通過對(duì)版權(quán)語(yǔ)料數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,人工智能產(chǎn)品依據(jù)用戶提示詞輸出的內(nèi)容極有可能與版權(quán)作品構(gòu)成實(shí)質(zhì)性相似,侵犯版權(quán)語(yǔ)料全部或部分內(nèi)容的發(fā)表、發(fā)行、展覽、表演以及信息網(wǎng)絡(luò)傳播等權(quán)利。即便利用開源數(shù)據(jù)訓(xùn)練,也不意味著侵權(quán)風(fēng)險(xiǎn)能夠完全規(guī)避,可能還會(huì)涉及署名權(quán)、修改權(quán)等人身權(quán)侵權(quán)行為。
GenAI的侵權(quán)情形主要有兩種:一是使用者知道輸入的指令可能讓大模型生成與在先作品相同或?qū)嵸|(zhì)性相同的內(nèi)容,此時(shí)用戶應(yīng)承擔(dān)直接侵權(quán)責(zé)任;二是大模型在利用版權(quán)語(yǔ)料數(shù)據(jù)訓(xùn)練后,在一般指令下生成與在先作品相同或?qū)嵸|(zhì)性相同的內(nèi)容,這種情況需要判斷服務(wù)提供者是否盡到合理注意義務(wù),能否適用避風(fēng)港規(guī)則。
2.版權(quán)數(shù)據(jù)輸出行為合法性的立法分析
GenAI開發(fā)者和服務(wù)提供者對(duì)版權(quán)范疇語(yǔ)料數(shù)據(jù)的輸出,一方面可能是取得了版權(quán)人的許可或是基于知識(shí)產(chǎn)權(quán)共享協(xié)議授權(quán),此時(shí)對(duì)版權(quán)語(yǔ)料數(shù)據(jù)進(jìn)行加工使用生成數(shù)據(jù)產(chǎn)品的行為是版權(quán)作品處理行為,應(yīng)遵循法律規(guī)定以及約定的作品處理規(guī)則[13];另一方面可能是基于法律法規(guī)的規(guī)定,如果服務(wù)提供者對(duì)版權(quán)語(yǔ)料的使用能夠落入版權(quán)例外的情形,對(duì)作品的處理就不需要征得權(quán)利人的同意,但前提是不能超越法定事由所確定的處理目的,即必須遵循合理使用原則。但是,當(dāng)輸出的生成物中包含版權(quán)作品時(shí),現(xiàn)有的版權(quán)例外規(guī)則很難直接適用,需要借助多元化授權(quán)模式解決其合法性問題。
就合理使用在語(yǔ)料數(shù)據(jù)輸出時(shí)的適用問題,《日本著作權(quán)法》第39條之4“不以欣賞為目的的合理使用”的“但書”條款規(guī)定,“但根據(jù)該作品的種類、用途及使用方式,不正當(dāng)?shù)負(fù)p害著作權(quán)人利益時(shí),不在此限”。這可以理解為,當(dāng)人工智能處理版權(quán)語(yǔ)料的行為可能與著作權(quán)人的作品使用相沖突,阻礙權(quán)利人的潛在市場(chǎng)渠道,且權(quán)利人已經(jīng)采取限制通過網(wǎng)絡(luò)爬蟲訪問作品等避免AI學(xué)習(xí)或修改、改編其作品的措施,就不再符合合理使用版權(quán)語(yǔ)料數(shù)據(jù)的情形。例如,使用GenAI來檢索包括版權(quán)作品在內(nèi)的語(yǔ)料數(shù)據(jù),將檢索結(jié)果總結(jié)歸納后生成答案,由于生成結(jié)果時(shí)會(huì)輸出已有作品中的一部分,此情形下對(duì)作品進(jìn)行的復(fù)制等即為以欣賞為目的的使用,不適用該法第30條之4。世界知識(shí)產(chǎn)權(quán)組織(WIPO)于2024年2月公布的《生成式人工智能:知識(shí)產(chǎn)權(quán)導(dǎo)航》指出,經(jīng)過訓(xùn)練的人工智能工具通常無法預(yù)測(cè)其輸出內(nèi)容,也無法確定訓(xùn)練數(shù)據(jù)中的某些部分是否會(huì)影響輸出結(jié)果,預(yù)測(cè)人工智能的行為十分具有挑戰(zhàn)性。
我國(guó)立法方面,《生成式人工智能服務(wù)管理暫行辦法》對(duì)生成式人工智能服務(wù)提供者提出了一系列要求,其中就包括GenAI平臺(tái)應(yīng)當(dāng)采取一定的技術(shù)性措施,避免輸出與權(quán)利人作品實(shí)質(zhì)性相似的內(nèi)容,同時(shí)應(yīng)當(dāng)盡到合理的注意義務(wù),包括建立投訴舉報(bào)機(jī)制、提示潛在風(fēng)險(xiǎn)、進(jìn)行顯著標(biāo)識(shí)等。盡管該條例沒有進(jìn)一步明確技術(shù)措施和注意義務(wù)的限度和范圍,但已經(jīng)為GenAI平臺(tái)語(yǔ)料輸出版權(quán)問題的解決提供了應(yīng)對(duì)建議。
3.解釋論視角的版權(quán)數(shù)據(jù)輸出行為合法性分析
我國(guó)首例AIGC侵權(quán)案中,涉及是否侵犯信息網(wǎng)絡(luò)傳播權(quán)以及服務(wù)提供者承擔(dān)注意義務(wù)的問題。法院判決認(rèn)為,考慮到已經(jīng)支持了復(fù)制權(quán)和改編權(quán)的主張,對(duì)于是否認(rèn)定侵犯信息網(wǎng)絡(luò)傳播權(quán)只涉及侵犯具體權(quán)利的認(rèn)定,不影響侵權(quán)行為的成立,“不會(huì)對(duì)權(quán)利人與社會(huì)公眾利益造成實(shí)質(zhì)性影響”,因此沒有進(jìn)行信息網(wǎng)絡(luò)傳播權(quán)行為的認(rèn)定。但事實(shí)上,并沒有立法和學(xué)理依據(jù)能夠支持在認(rèn)定侵犯復(fù)制權(quán)后再認(rèn)定侵犯信息網(wǎng)絡(luò)傳播權(quán)會(huì)構(gòu)成重復(fù)評(píng)價(jià),二者指向的是權(quán)利人不同的著作財(cái)產(chǎn)權(quán)內(nèi)容。本案中,Tab網(wǎng)站利用第三方大模型生成涉案圖片后通過網(wǎng)絡(luò)進(jìn)行傳播的行為符合信息網(wǎng)絡(luò)傳播權(quán)的規(guī)制范疇,應(yīng)當(dāng)構(gòu)成對(duì)權(quán)利人信息網(wǎng)絡(luò)傳播權(quán)的侵犯。同時(shí),被告由于未能完全阻卻繼續(xù)生成實(shí)質(zhì)性相似圖片,而被認(rèn)定為未盡到合理的注意義務(wù),判決中明確要求被告采取有效防范措施,即“用戶正常使用與奧特曼相關(guān)的提示詞,不能生成與案涉奧特曼作品實(shí)質(zhì)性相似的圖片”。盡管本案被告在被訴后已刪除涉案圖片,但是再次輸入“奧特曼”相關(guān)提示詞,大模型仍舊能生成新的實(shí)質(zhì)性相似圖片。如果參考網(wǎng)絡(luò)服務(wù)提供者適用避風(fēng)港規(guī)則的要求,則可能賦予GenAI服務(wù)提供者過高的注意義務(wù)。
盡管現(xiàn)有判例中尚未直接賦予人工智能平臺(tái)著作權(quán)法上的權(quán)利,但是北京互聯(lián)網(wǎng)法院在判決中確認(rèn)了使用者能夠享有生成圖片的版權(quán)。如果未來人工智能企業(yè)能夠獲取版權(quán)收益,那么對(duì)于輸出內(nèi)容中包含版權(quán)語(yǔ)料數(shù)據(jù)的行為,則要求其就輸出行為借助多種授權(quán)方式獲得許可,并在違反注意義務(wù)時(shí)承擔(dān)共同侵權(quán)責(zé)任,這將幫助生成式人工智能提供者達(dá)到成本與收益的平衡,更好地維護(hù)權(quán)利人、服務(wù)提供者和使用者三方的權(quán)益。
四、生成式人工智能語(yǔ)料版權(quán)困境化解建議
為應(yīng)對(duì)上述GenAI語(yǔ)料數(shù)據(jù)的版權(quán)侵權(quán)問題,本文從權(quán)利限制、授權(quán)規(guī)則和糾紛解決等方面提出完善建議。
1.?dāng)U張合理使用規(guī)則
要解決GenAI語(yǔ)料數(shù)據(jù)的合法性問題有兩種可行路徑:一是在開發(fā)與訓(xùn)練的前端,即數(shù)據(jù)抓取前就預(yù)先獲得版權(quán)人授權(quán);二是將抓取版權(quán)語(yǔ)料數(shù)據(jù)的行為納入合理使用條款,以避免作品復(fù)制權(quán)侵權(quán)行為。然而,企業(yè)想要獲得全部版權(quán)作品的授權(quán),往往難度很大,不僅需要付出極高的成本,還可能存在作品的版權(quán)人難以取得聯(lián)系或是作者身份不明的情況。在缺乏合理高效的授權(quán)機(jī)制時(shí),就會(huì)出現(xiàn)授權(quán)價(jià)格不明或因缺乏授權(quán)而導(dǎo)致侵權(quán)的情況,可能對(duì)科技創(chuàng)新造成負(fù)面影響。因此,在生成式人工智能領(lǐng)域引入合理使用規(guī)則,是解決語(yǔ)料版權(quán)困境的重要措施,相關(guān)部門應(yīng)結(jié)合生成式人工智能利用版權(quán)語(yǔ)料的不同情況完善合理使用規(guī)則。
對(duì)于非商業(yè)目的輸入已發(fā)表或公開傳輸?shù)淖髌纷鳛橛?xùn)練語(yǔ)料的行為,可在合理使用條款中增列一項(xiàng)“機(jī)器閱讀與文本訓(xùn)練行為”作為適用情形,同時(shí)必須符合合理使用的基本原則。此外,可借鑒歐盟《人工智能法案》對(duì)生成式基礎(chǔ)模型提供者披露版權(quán)訓(xùn)練數(shù)據(jù)的義務(wù),無論是否涉及語(yǔ)料數(shù)據(jù)的處理與輸出,都應(yīng)當(dāng)記錄并公開提供受版權(quán)保護(hù)的語(yǔ)料數(shù)據(jù)使用情況的詳細(xì)摘要。
2.構(gòu)建“準(zhǔn)法定許可”制度
著作權(quán)法中的“準(zhǔn)法定許可”制度是指允許作者通過事先聲明的方式保留其權(quán)利,即事先聲明不許適用的作品不能適用法定許可制度[14]。對(duì)于商業(yè)目的的版權(quán)語(yǔ)料輸入和不屬于合理使用范疇的行為,版權(quán)人應(yīng)就GenAI研發(fā)者和使用者的復(fù)制、改編、制作、翻譯等行為獲取合理報(bào)酬。然而,逐一授權(quán)或通過集體管理組織批量授權(quán)對(duì)海量語(yǔ)料數(shù)據(jù)來說成本過高,涉及的版權(quán)語(yǔ)料數(shù)據(jù)很難在同一個(gè)集體管理組織完成授權(quán),分類確定作品的數(shù)量、名稱等相關(guān)信息也需要大量時(shí)間和資金的投入。因此,生成式人工智能規(guī)則可以借鑒“準(zhǔn)法定許可”制度:商業(yè)目的的版權(quán)語(yǔ)料數(shù)據(jù)輸入和利用行為,包括復(fù)制、修改、改編、制作、匯編、攝制以及翻譯等,生成式人工智能的研發(fā)者和服務(wù)提供者應(yīng)當(dāng)在使用前公告作品、作者及付酬標(biāo)準(zhǔn),公告之日起30日內(nèi)著作權(quán)人不同意使用的,研發(fā)者和服務(wù)提供者不得進(jìn)行語(yǔ)料輸入和利用行為,已經(jīng)進(jìn)入語(yǔ)料數(shù)據(jù)的作品應(yīng)當(dāng)及時(shí)從數(shù)據(jù)庫(kù)中刪除,并支付使用作品期間的報(bào)酬。
3.建立多元化版權(quán)授權(quán)模式
生成式人工智能的技術(shù)創(chuàng)新依賴于海量數(shù)據(jù)投喂,建立多元化版權(quán)授權(quán)模式,能夠在合法性的基礎(chǔ)上提高版權(quán)語(yǔ)料的授權(quán)效率。
其一,通過集體管理組織獲得批量授權(quán)是當(dāng)前法律框架下解決版權(quán)語(yǔ)料數(shù)據(jù)問題的有效方式。目前生成式人工智能主要有三種類型:“文生圖”“文生音樂”“文生視頻”。我國(guó)現(xiàn)有文字、音樂、音像、攝影和電影五個(gè)著作權(quán)集體管理組織可以對(duì)特定作品的版權(quán)語(yǔ)料收集、利用及輸出傳播進(jìn)行集體授權(quán)。因此,AI開發(fā)者和經(jīng)營(yíng)者可以結(jié)合自身的具體需求通過著作權(quán)集體管理組織獲得某領(lǐng)域作品的批量授權(quán),按照人工智能產(chǎn)業(yè)特殊付酬標(biāo)準(zhǔn)支付使用費(fèi),同時(shí)提供使用作品的名稱、作者姓名及出處等相關(guān)信息。集體管理組織應(yīng)建立GenAI版權(quán)語(yǔ)料使用情況查詢系統(tǒng),供權(quán)利人及時(shí)查詢作品的使用和付費(fèi)情況,充分發(fā)揮集體管理組織的保障功能,提高授權(quán)效率,降低GenAI語(yǔ)料數(shù)據(jù)的合法性風(fēng)險(xiǎn)。當(dāng)作品作者不明或無法取得聯(lián)系時(shí),可以采取延展代理提存使用費(fèi)的方式,保障權(quán)利人利益。
其二,建立開放授權(quán)行業(yè)標(biāo)準(zhǔn),利用知識(shí)共享協(xié)議提高授權(quán)效率。開放授權(quán)機(jī)制是計(jì)算機(jī)軟件行業(yè)的一種開源許可證,通過知識(shí)共享協(xié)議(Creative Commons license)事先約定使用者的權(quán)利義務(wù),提高授權(quán)效率。獲得開放授權(quán)后,使用者可以在許可證允許范圍內(nèi)對(duì)文檔、圖片、音視頻等作品自由、免費(fèi)地使用和修改。當(dāng)然,開放授權(quán)一般會(huì)設(shè)立條款以強(qiáng)調(diào)尊重版權(quán),如為原作者署名、允許免費(fèi)的私人和商業(yè)使用、允許修改及發(fā)布等,版權(quán)人不承擔(dān)上述使用的風(fēng)險(xiǎn),并且違反開放授權(quán)條件時(shí)將不再享有相關(guān)授權(quán)。目前,多數(shù)人工智能產(chǎn)品采用開源許可,訓(xùn)練數(shù)據(jù)庫(kù)也多為開源資源,推動(dòng)版權(quán)語(yǔ)料數(shù)據(jù)通過知識(shí)產(chǎn)權(quán)共享協(xié)議開放授權(quán),能夠有效提高語(yǔ)料數(shù)據(jù)的授權(quán)效率。
4.探索避風(fēng)港規(guī)則的適用
生成式人工智能服務(wù)使用者在網(wǎng)絡(luò)平臺(tái)上輸入提示詞后才會(huì)輸出內(nèi)容,因此可以作為網(wǎng)絡(luò)服務(wù)提供者,在承擔(dān)侵權(quán)責(zé)任時(shí)考慮借用互聯(lián)網(wǎng)治理規(guī)則,即適用避風(fēng)港規(guī)則。在“奧特曼文生圖侵權(quán)”案中,法院認(rèn)為被告作為服務(wù)提供者沒有盡到合理的注意義務(wù),理由是缺少投訴舉報(bào)機(jī)制、欠缺潛在風(fēng)險(xiǎn)提示和顯著標(biāo)識(shí)。這為生成式人工智能服務(wù)提供者適用避風(fēng)港規(guī)則提出了要求——網(wǎng)絡(luò)服務(wù)提供者應(yīng)主動(dòng)采取措施篩查并及時(shí)響應(yīng)侵權(quán)通知?jiǎng)h除侵權(quán)內(nèi)容。
其一,服務(wù)提供者應(yīng)建立健全侵權(quán)投訴機(jī)制?!渡墒饺斯ぶ悄芊?wù)管理暫行辦法》第15條要求提
供者應(yīng)建立健全侵權(quán)投訴機(jī)制,以便及時(shí)受理公眾反饋的生成式人工智能服務(wù)的侵權(quán)問題。一方面,投訴平臺(tái)的快速響應(yīng)和積極反饋是生成式人工智能服務(wù)平臺(tái)通過避風(fēng)港規(guī)則規(guī)避侵權(quán)風(fēng)險(xiǎn)的有效措施;另一方面,服務(wù)提供者應(yīng)盡到合理的注意義務(wù),及時(shí)響應(yīng)通知?jiǎng)h除侵權(quán)內(nèi)容。由于服務(wù)提供者無法拒絕用戶指令中包含的可能侵權(quán)的提示詞,原則上不負(fù)有對(duì)提示詞和生成內(nèi)容的事先審查義務(wù)。
其二,在生成內(nèi)容的刪除環(huán)節(jié),收到權(quán)利人的投訴通知后應(yīng)及時(shí)刪除侵權(quán)內(nèi)容。如果對(duì)同一作品多次、反復(fù)收到侵權(quán)投訴,此時(shí)應(yīng)加大關(guān)鍵詞的屏蔽力度,從輸入端減少侵權(quán)可能性。
其三,因使用者公開生成內(nèi)容而導(dǎo)致的侵權(quán),由使用者承擔(dān)直接侵權(quán)責(zé)任,GenAI服務(wù)提供者滿足避風(fēng)港規(guī)則時(shí)則免除損害賠償責(zé)任,如未采取前述措施則構(gòu)成共同侵權(quán)。
五、結(jié)語(yǔ)
無論是輸入端還是輸出端,生成式人工智能都給版權(quán)制度帶來了新的議題。用于學(xué)習(xí)和訓(xùn)練的語(yǔ)料數(shù)據(jù)的版權(quán)合法性問題,本質(zhì)上是技術(shù)發(fā)展中個(gè)人利益與公共利益的沖突。人工智能技術(shù)的出現(xiàn),降低了作品創(chuàng)作和傳播的成本,增加了侵權(quán)風(fēng)險(xiǎn),現(xiàn)有版權(quán)和人工智能制度難以保障著作權(quán)人的合法權(quán)益??紤]到我國(guó)生成式人工智能技術(shù)發(fā)展尚處于初期,版權(quán)語(yǔ)料數(shù)據(jù)合法性規(guī)范有助于平衡研發(fā)者、使用者和權(quán)利人的利益,相關(guān)部門應(yīng)制定用于訓(xùn)練生成式人工智能的語(yǔ)料數(shù)據(jù)使用制度。
一是在立法上明晰抓取、處理和輸出行為合法性判斷標(biāo)準(zhǔn),將非商業(yè)性機(jī)器閱讀與文本訓(xùn)練行為納入合理使用條款,構(gòu)建版權(quán)語(yǔ)料數(shù)據(jù)準(zhǔn)法定許可規(guī)則。二是在司法上確立統(tǒng)一裁判標(biāo)準(zhǔn),明確生成式人工智能產(chǎn)品注意義務(wù)的標(biāo)準(zhǔn)和要求,考慮避風(fēng)港規(guī)則的適用。三是在行政上積極出臺(tái)政策,引導(dǎo)生成式人工智能產(chǎn)業(yè)尊重知識(shí)產(chǎn)權(quán),堅(jiān)持透明度原則。四是在行業(yè)上加大數(shù)據(jù)流通與利用,推廣開源語(yǔ)料數(shù)據(jù)庫(kù)建立,構(gòu)建知識(shí)產(chǎn)權(quán)共享協(xié)議和集體管理組織多元化授權(quán)模式,從技術(shù)和法律兩個(gè)方面最大限度地發(fā)揮語(yǔ)料數(shù)據(jù)的價(jià)值和功能。
|參考文獻(xiàn)|
[1]國(guó)家標(biāo)準(zhǔn)化管理委員會(huì). 信息技術(shù) 人工智能 術(shù)語(yǔ)GB/T41867-2022[S]. 北京:中國(guó)標(biāo)準(zhǔn)出版社,2022.
[2]哈爾濱工業(yè)大學(xué)ChatGPT調(diào)研報(bào)告[EB/OL].
(2023-08-27 )[2024-02-18]. https://it.sohu.com/a/715228544_121763615.
[3]劉金瑞. 生成式人工智能大模型的新型風(fēng)險(xiǎn)與規(guī)制框架[J]. 行政法學(xué)研究,2024(2):17-32.
[4]中共中央 國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見[EB/OL]. (2022-12-19)
[2024-02-25]. https://www.gov.cn/zhengce/2022-
12/19/content_5732695.htm.
[5]孫瑩. 論數(shù)據(jù)權(quán)益客體中的基本范疇[J]. 東方法學(xué),2024(1):24-37.
[6]程嘯. 論數(shù)據(jù)權(quán)益[J]. 國(guó)家檢察官學(xué)院學(xué)報(bào),2023(5):77-94.
[7]張凌寒,郭禾,馮曉青,等. 人工智能生成內(nèi)容(AIGC)著作權(quán)保護(hù)筆談錄[J]. 數(shù)字法治,2024(1):1-26.
[8]吳漢東. 人工智能時(shí)代的制度安排與法律規(guī)制[J]. 社會(huì)科學(xué)文摘,2017(12):76-78.
[9]王遷. 再論人工智能生成的內(nèi)容在著作權(quán)法中的定性[J]. 政法論壇,2023(4):16-33.
[10]丁曉東. 著作權(quán)的解構(gòu)與重構(gòu):人工智能作品法律保護(hù)的法理反思[J]. 法制與社會(huì)發(fā)展,2023(5):109-127.
[11]林秀芹. 人工智能時(shí)代著作權(quán)合理使用制度的重塑[J]. 法學(xué)研究,2021(6):170-185.
[12]張新寶. 論作為新型財(cái)產(chǎn)權(quán)的數(shù)據(jù)財(cái)產(chǎn)權(quán)[J]. 中國(guó)社會(huì)科學(xué),2023(4):144-163.
[13]王葉剛. 企業(yè)數(shù)據(jù)權(quán)益與個(gè)人信息保護(hù)關(guān)系論綱[J]. 比較法研究,2022(4):33-44.
[14]來小鵬. 知識(shí)產(chǎn)權(quán)法學(xué)(第四版)[M]. 北京:中國(guó)政法大學(xué)出版社,2019.