中圖分類號(hào):DF523;D913.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-8268(2025)02-0045-10
從ChatGPT到DeepSeek,隨著ChatGPT火爆全球,生成式人工智能技術(shù)不斷迭代創(chuàng)新,廣泛應(yīng)用于文本生成、圖像合成、音樂創(chuàng)作、程序代碼、工業(yè)設(shè)計(jì)等領(lǐng)域,正在成為打造新質(zhì)生產(chǎn)力的重要引擎。數(shù)據(jù)是訓(xùn)練生成式人工智能底層模型的基礎(chǔ),訓(xùn)練數(shù)據(jù)集是生成式人工智能技術(shù)應(yīng)用的基石。為實(shí)現(xiàn)高質(zhì)量的輸出,生成式人工智能的訓(xùn)練數(shù)據(jù)往往包含大量受著作權(quán)保護(hù)的作品和個(gè)人信息[1]87。在個(gè)人信息收集場(chǎng)景中,人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者可能由于數(shù)據(jù)收集過(guò)程的高度自動(dòng)化而不能及時(shí)與數(shù)據(jù)主體進(jìn)行交流,致使知情同意原則存在適用困境;也可能在獲取文本語(yǔ)料場(chǎng)景中,因未征得權(quán)利人許可復(fù)制、改編或者傳播而涉嫌侵犯他人知識(shí)產(chǎn)權(quán)[2]。傳統(tǒng)著作權(quán)法的強(qiáng)保護(hù)和“一對(duì)一”的授權(quán)交易模式,為生成式人工智能訓(xùn)練數(shù)據(jù)的合法使用帶來(lái)了挑戰(zhàn)。
2023年8月15日,我國(guó)《生成式人工智能服務(wù)管理暫行辦法》正式施行,明確提出實(shí)施“包容審慎”的監(jiān)管方式,要求提供和使用生成式人工智能服務(wù)應(yīng)尊重知識(shí)產(chǎn)權(quán),依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng)。目前學(xué)界較多學(xué)者支持通過(guò)“合理使用”制度調(diào)整新興技術(shù)和生成式人工智能產(chǎn)業(yè)產(chǎn)生的著作權(quán)問題,但卻忽視了我國(guó)現(xiàn)有合理使用制度與人工智能產(chǎn)業(yè)需求之間的不匹配,以及制度內(nèi)容無(wú)法涵蓋新情形等問題。對(duì)此,為充分發(fā)揮訓(xùn)練數(shù)據(jù)集的基礎(chǔ)性作用,促進(jìn)我國(guó)生成式人工智能產(chǎn)業(yè)的創(chuàng)新與發(fā)展,應(yīng)基于對(duì)生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的需求與挑戰(zhàn)的深人分析,探尋其合法性基礎(chǔ);進(jìn)一步澄清我國(guó)“合理使用”和“法定許可”制度在訓(xùn)練數(shù)據(jù)環(huán)節(jié)的適用條件,并挖掘法定許可制度的特點(diǎn)與優(yōu)勢(shì),科學(xué)設(shè)計(jì)和完善法定許可機(jī)制,以應(yīng)對(duì)訓(xùn)練數(shù)據(jù)利用作品過(guò)程中授權(quán)許可、成本與收益、市場(chǎng)競(jìng)爭(zhēng)等方面的難題;進(jìn)而針對(duì)產(chǎn)業(yè)發(fā)展的現(xiàn)實(shí)需要,實(shí)現(xiàn)法定許可利益平衡的制度設(shè)計(jì)初衷,優(yōu)化生成式人工智能領(lǐng)域著作權(quán)的權(quán)利限制與例外的規(guī)制框架。
一、生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的困境
人工智能創(chuàng)作以數(shù)據(jù)為基礎(chǔ)。數(shù)據(jù)的質(zhì)量在一定程度上決定人工智能創(chuàng)作成果的藝術(shù)價(jià)值[3],數(shù)據(jù)的完整性也在一定程度上決定人工智能系統(tǒng)是否有實(shí)質(zhì)性進(jìn)步[4]。我國(guó)《生成式人工智能服務(wù)管理暫行辦法》第7條要求提供者應(yīng)當(dāng)對(duì)生成式人工智能產(chǎn)品的預(yù)訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練數(shù)據(jù)來(lái)源的合法性負(fù)責(zé)。生成式人工智能訓(xùn)練所使用的數(shù)據(jù)涉及海量的他人作品,極易引發(fā)侵權(quán)風(fēng)險(xiǎn),始終面臨著獲得授權(quán)許可難、授權(quán)對(duì)價(jià)高、利益競(jìng)逐激烈以及易形成市場(chǎng)競(jìng)爭(zhēng)壁壘等多重挑戰(zhàn)。合理使用制度雖然在推進(jìn)生成式人工智能數(shù)據(jù)訓(xùn)練活動(dòng)方面存在積極作用,但不可否認(rèn)的是,其在訓(xùn)練數(shù)據(jù)領(lǐng)域的實(shí)際應(yīng)用中,仍存在立法、司法和守法等層面上的適用困難。
(一)訓(xùn)練數(shù)據(jù)利用作品取得授權(quán)難
《中華人民共和國(guó)著作權(quán)法》(以下簡(jiǎn)稱《著作權(quán)法》 ① )中并未明確規(guī)定人工智能訓(xùn)練數(shù)據(jù)利用作品的行為屬于著作權(quán)的限制與例外情形,相應(yīng)行為應(yīng)當(dāng)事先獲得著作權(quán)人的許可,否則構(gòu)成侵權(quán)②。生成式人工智能的開發(fā)和訓(xùn)練需要海量數(shù)據(jù),涉及的著作權(quán)人數(shù)量眾多,應(yīng)用的場(chǎng)景也各有不同。生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者很難一一獲得被利用作品著作權(quán)人的授權(quán)許可,為著作權(quán)“授權(quán)的可行性”和“授權(quán)的意義\"帶來(lái)挑戰(zhàn)。
以ChatGPT為例,盡管OpenAI并未公開 GPT-3.5語(yǔ)言模型數(shù)據(jù)量,但從公開數(shù)據(jù)來(lái)看,GPT-3語(yǔ)言模型由1750億參數(shù)訓(xùn)練而成[5]。盡管實(shí)用化后的大模型ChatGPT3.5“僅\"擁有200億參數(shù)[6],生成式人工智能系統(tǒng)的開發(fā)仍基于龐大的數(shù)據(jù)集,意味著研發(fā)者獲得法定授權(quán)的工作量巨大。同時(shí),生成式人工智能系統(tǒng)的訓(xùn)練數(shù)據(jù)具有時(shí)效性和實(shí)時(shí)性。隨著時(shí)間的變化,數(shù)據(jù)可能發(fā)生變化,影響數(shù)據(jù)訓(xùn)練的結(jié)果。同時(shí),數(shù)據(jù)在實(shí)踐應(yīng)用中的實(shí)時(shí)更新將對(duì)所訓(xùn)練模型能力的提高產(chǎn)生影響。如果訓(xùn)練數(shù)據(jù)對(duì)作品的利用需要在使用前與著作權(quán)人一一達(dá)成許可協(xié)議,那么確定并聯(lián)系權(quán)利人、進(jìn)行許可談判、支付許可費(fèi)用等程序耗費(fèi)的時(shí)間成本,可能使特定領(lǐng)域數(shù)據(jù)失去時(shí)效價(jià)值。這不僅會(huì)使研發(fā)或應(yīng)用無(wú)法正常進(jìn)行,也有損促進(jìn)技術(shù)創(chuàng)新和文化繁榮的公共利益[7]187。
從現(xiàn)有法律規(guī)范看,生成式人工智能訓(xùn)練過(guò)程對(duì)作品的使用未被合理使用的十二種法定情形所保護(hù),也難以進(jìn)一步將其解釋為被此十二種情形所周延。其商業(yè)屬性決定了訓(xùn)練數(shù)據(jù)利用作品的行為不屬于“個(gè)人學(xué)習(xí)”“教學(xué)或科研”“公共文化機(jī)構(gòu)”使用的情形,難以直接援引“合理使用”條款作為侵權(quán)抗辯。除此之外,訓(xùn)練數(shù)據(jù)利用作品的行為不屬于《著作權(quán)法》兜底條款和《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》規(guī)定的相關(guān)情形[8]。而從司法層面看,在我國(guó)司法實(shí)踐的個(gè)案中,已存在法院混用“三步檢驗(yàn)法”和“四要素標(biāo)準(zhǔn)\"來(lái)審查某個(gè)行為是否構(gòu)成合理使用,存在結(jié)果上的不確定性[9]。因此,合理使用制度難以為訓(xùn)練數(shù)據(jù)利用作品行為提供充分的依據(jù)。
在域外實(shí)踐中,人工智能訓(xùn)練數(shù)據(jù)利用作品行為是否符合著作權(quán)保護(hù)的例外情形,需要嚴(yán)格遵守法律的規(guī)定。在德國(guó)Kneschke訴LAION案中①,法院根據(jù)《德國(guó)版權(quán)及鄰接權(quán)法》第60d條,將“出于科學(xué)研究目的的文本和數(shù)據(jù)挖掘”例外適用于以人工智能訓(xùn)練為目的開展的文本和數(shù)據(jù)挖掘的非商業(yè)研究組織。但是,不免費(fèi)提供研究成果或與任何從研究中獲益的營(yíng)利性組織有關(guān)聯(lián)的組織,都可能被法院認(rèn)定為不符合著作權(quán)保護(hù)的例外條件。另外,日本于2018年修訂的《日本著作權(quán)法》增加了“柔性合理使用條款”。這使得人工智能訓(xùn)練數(shù)據(jù)利用作品的行為只有在符合使用目的、使用程度和獨(dú)創(chuàng)性表達(dá)概率要求的情況下,才存在適用\"非享受性使用作品(第30條之4)”“計(jì)算機(jī)附隨性使用(第47條之4)”“信息處理輕微利用(第47條之5)\"情形的可能性[10]。而2023年,日本政府為進(jìn)一步保持其在人工智能領(lǐng)域的競(jìng)爭(zhēng)力,公開表示未來(lái)日本的法律可能不會(huì)對(duì)人工智能訓(xùn)練中使用的數(shù)據(jù)實(shí)施著作權(quán)保護(hù)。在我國(guó)《著作權(quán)法》沒有明確規(guī)定的情況下,人工智能訓(xùn)練數(shù)據(jù)利用作品的行為需要通過(guò)明確的法律規(guī)定為行為合法性提供依據(jù),以避免司法實(shí)踐中可適用條款過(guò)于粗糙和籠統(tǒng)。
(二)訓(xùn)練數(shù)據(jù)利用作品授權(quán)成本高
任何生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者若需提前取得著作權(quán)人的許可,并覆蓋數(shù)據(jù)訓(xùn)練活動(dòng)所涉的全部作品,都將耗費(fèi)巨大的時(shí)間和金錢成本,因而難以確保所有訓(xùn)練數(shù)據(jù)利用作品的行為都具備合法性。
第一,生成式人工智能作品訓(xùn)練涉及的著作權(quán)人較為分散,因此識(shí)別和促成交易產(chǎn)生的成本十分高昂。而許可費(fèi)用的堆積也將導(dǎo)致許可費(fèi)用之和過(guò)高而難以開展商業(yè)活動(dòng)[11]。第二,質(zhì)量越高、越稀缺的數(shù)據(jù),所需成本可能更高;涉及醫(yī)療、金融等可能會(huì)受到法律法規(guī)限制的特定領(lǐng)域的數(shù)據(jù),所需成本可能更高。第三,在實(shí)踐中,可能出現(xiàn)針對(duì)作品使用者或使用企業(yè)的定價(jià)歧視,作品的使用者將不一定能夠通過(guò)公平的對(duì)價(jià)利用生成式人工智能研發(fā)所需的訓(xùn)練數(shù)據(jù)。如果生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者基于私人市場(chǎng)議價(jià)和當(dāng)事人信息成本交換完成著作權(quán)交易[12],那么訓(xùn)練數(shù)據(jù)所需的交易成本可能因著作權(quán)人的利益考量而難以負(fù)擔(dān)。同時(shí),針對(duì)個(gè)性化的定價(jià),中小型的初創(chuàng)企業(yè)可能因無(wú)法負(fù)擔(dān)相關(guān)的費(fèi)用,面臨著訓(xùn)練數(shù)據(jù)質(zhì)量低下、產(chǎn)品缺乏競(jìng)爭(zhēng)力的境況,而最終被市場(chǎng)淘汰。2024年6月24日,Suno和Udio兩家人工智能音樂初創(chuàng)公司被訴案件引發(fā)各界熱烈討論。如果法院最終裁定該音樂公司不能免費(fèi)使用主流唱片公司的作品進(jìn)行訓(xùn)練,那么簽署成本高昂的許可協(xié)議可能會(huì)成為這類初創(chuàng)公司的唯一選擇。這也將使擁有最雄厚資金的公司最終占據(jù)市場(chǎng)優(yōu)勢(shì)地位,阻礙人工智能技術(shù)和產(chǎn)業(yè)的創(chuàng)新和發(fā)展,限制初創(chuàng)公司的市場(chǎng)競(jìng)爭(zhēng)力[13]。
(三)訓(xùn)練數(shù)據(jù)利用作品利益難平衡
從被利用作品的權(quán)利人和作品使用者兩方來(lái)看,具有營(yíng)利性質(zhì)的生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者,更注重經(jīng)濟(jì)成本和最終效益,而著作權(quán)人則更注重自身的合法權(quán)益是否得到維護(hù)。缺乏支持創(chuàng)新的著作權(quán)機(jī)制,過(guò)度維護(hù)或削減著作權(quán)人的權(quán)利,都將導(dǎo)致訓(xùn)練數(shù)據(jù)利用作品的活動(dòng)中利益天平面臨失衡。
在新技術(shù)出現(xiàn)的情況下,技術(shù)提供者往往要求無(wú)阻礙地使用所有著作權(quán)作品,而作者對(duì)其作品的新技術(shù)使用模式也要求享有專有權(quán)[14]。生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者往往希望用更低的成本獲取更多可用的數(shù)據(jù),最大程度地實(shí)現(xiàn)時(shí)間和經(jīng)濟(jì)成本的優(yōu)化,推進(jìn)產(chǎn)品或服務(wù)的創(chuàng)新發(fā)展進(jìn)程。但是,被利用作品的著作權(quán)人有可能提出不同且價(jià)格偏高的付酬要求,進(jìn)而阻礙訓(xùn)練數(shù)據(jù)庫(kù)的建成和系統(tǒng)的優(yōu)化。除此之外,在很多情況下,由于訓(xùn)練數(shù)據(jù)規(guī)模過(guò)于龐大,研發(fā)人員也難以分辨哪些數(shù)據(jù)已經(jīng)涉及侵權(quán),往往在事后才被動(dòng)發(fā)現(xiàn)。
生成式人工智能訓(xùn)練數(shù)據(jù)環(huán)節(jié)不僅關(guān)乎系統(tǒng)的搭建和產(chǎn)業(yè)的發(fā)展,還將對(duì)生成式人工智能技術(shù)的社會(huì)可接受度產(chǎn)生重要影響。目前,針對(duì)生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的行為,一些學(xué)者主張適用“合理使用制度”方案,將其認(rèn)定為不構(gòu)成侵權(quán)的例外行為,排除《著作權(quán)法》對(duì)該行為的約束,著重強(qiáng)調(diào)合理使用制度在降低交易成本、避免市場(chǎng)失敗、避免損害重要法律價(jià)值等方面的積極作用。但是,這會(huì)使著作權(quán)人的合法權(quán)益未被兼顧,擁有質(zhì)量高、稀缺性和特定領(lǐng)域數(shù)據(jù)的主體的市場(chǎng)優(yōu)勢(shì)被犧牲。即便在短時(shí)期內(nèi),依靠合理使用制度能夠推進(jìn)生成式人工智能數(shù)據(jù)訓(xùn)練活動(dòng)的順利開展,但勢(shì)必會(huì)引發(fā)著作權(quán)人對(duì)適用合理使用制度的強(qiáng)烈反對(duì),甚至?xí)拗粕鐣?huì)公眾獲取優(yōu)質(zhì)數(shù)據(jù)和作品的機(jī)會(huì),激化生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者與著作權(quán)人以及社會(huì)公眾之間的矛盾。
(四)訓(xùn)練數(shù)據(jù)利用作品有競(jìng)爭(zhēng)壁壘
生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者對(duì)訓(xùn)練數(shù)據(jù)的價(jià)值把控,著作權(quán)人對(duì)個(gè)人合法權(quán)益的最大化維護(hù),以及社會(huì)公眾對(duì)獲取有效數(shù)據(jù)的需要,使得各方形成利益割據(jù),形成生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者和提供者內(nèi)部以及與個(gè)人之間的競(jìng)爭(zhēng)壁壘,進(jìn)而使個(gè)人與公共領(lǐng)域之間產(chǎn)生數(shù)據(jù)壁壘。
目前,生成式人工智能模型的訓(xùn)練數(shù)據(jù)主要來(lái)自網(wǎng)絡(luò)抓取的公開數(shù)據(jù),意味著作為搜索引擎入口的大型平臺(tái)有更多的機(jī)會(huì)獲取有價(jià)值的用戶數(shù)據(jù)集[15]。隨著掌握和處理相關(guān)數(shù)據(jù)的能力成為經(jīng)營(yíng)者在相關(guān)市場(chǎng)具有市場(chǎng)力量的重要表現(xiàn)[16],生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者出于對(duì)關(guān)鍵數(shù)據(jù)的把控和對(duì)商業(yè)利益、數(shù)據(jù)財(cái)產(chǎn)性權(quán)益的關(guān)注,極易獲得相關(guān)領(lǐng)域“數(shù)據(jù)監(jiān)控”與“數(shù)據(jù)獨(dú)裁”的隱形權(quán)力[7]108。這將對(duì)市場(chǎng)內(nèi)部和外部獲取高質(zhì)量數(shù)據(jù)形成限制,使得生成式人工智能訓(xùn)練和創(chuàng)作存在新型壟斷風(fēng)險(xiǎn)。例如,社交平臺(tái)Reddit 的聊天數(shù)據(jù)一直是生成式人工智能企業(yè)的數(shù)據(jù)訓(xùn)練素材,谷歌“Bard”的底層算法和OpenAI的ChatGPT都將Reddit平臺(tái)作為其訓(xùn)練數(shù)據(jù)來(lái)源。2023年4月,Reddit表示將向訪問其應(yīng)用程序編程接口的公司收費(fèi),不再愿意免費(fèi)提供平臺(tái)數(shù)據(jù),成為首批公開要求科技巨頭付費(fèi)使用數(shù)據(jù)的企業(yè)。2023年6月,Reddit進(jìn)一步提出對(duì)“每5000萬(wàn)次API訪問請(qǐng)求\"收取1.2萬(wàn)美元的收費(fèi)標(biāo)準(zhǔn),加劇了行業(yè)內(nèi)獲取此類企業(yè)高質(zhì)量數(shù)據(jù)的壓力和難度[17]。
二、建立生成式人工智能訓(xùn)練數(shù)據(jù)利用作品法定許可的優(yōu)勢(shì)
生成式人工智能的發(fā)展需要以大量的訓(xùn)練數(shù)據(jù)為基礎(chǔ),而訓(xùn)練數(shù)據(jù)包括受著作權(quán)保護(hù)的作品。根據(jù)現(xiàn)行《著作權(quán)法》的規(guī)定,生成式人工智能的研發(fā)者需要甄別可使用訓(xùn)練資料的范圍,并就受《著作權(quán)法》保護(hù)的作品向著作權(quán)人獲得授權(quán)。雖然,這對(duì)著作權(quán)人有利,但大大增加了機(jī)器學(xué)習(xí)的成本,阻礙生成式人工智能技術(shù)的發(fā)展與使用[18]。法定許可制度致力于調(diào)整新舊產(chǎn)業(yè)之間的利益沖突,以緩和新興技術(shù)與傳統(tǒng)制度矛盾為出發(fā)點(diǎn)。這更能滿足生成式人工智能訓(xùn)練數(shù)據(jù)的現(xiàn)實(shí)需求,決定了法定許可制度在規(guī)范生成式人工智能訓(xùn)練數(shù)據(jù)利用作品行為方面更具備合理性和優(yōu)勢(shì)。
(一)提供利用作品的合法性基礎(chǔ)
我國(guó)《著作權(quán)法》明確規(guī)定了四項(xiàng)直接依照法律規(guī)定即可使用他人作品的法定許可情形。除此之外,《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》還規(guī)定了扶助貧困地區(qū)的作品使用公告制度。相比其他國(guó)家,我國(guó)的法定許可內(nèi)容已較多,具有一定的制度基礎(chǔ)。與其他著作權(quán)制度一樣,我國(guó)著作權(quán)法定許可是當(dāng)初為加入國(guó)際公約而建立的制度,但產(chǎn)業(yè)支撐環(huán)境缺乏,且適用度不足[19]。但在歷次修法過(guò)程中,我國(guó)《著作權(quán)法》關(guān)于法定許可的制度與變化愈發(fā)關(guān)注新興產(chǎn)業(yè)的新需求,其概念的核心關(guān)鍵要素在于不經(jīng)許可,但須付報(bào)酬,以尊重權(quán)利[20],設(shè)立目的是使人們能夠適當(dāng)?shù)孬@得使用作品的機(jī)會(huì)[21]152,對(duì)著作權(quán)的限制弱于合理使用制度。
有些法定許可情形是考慮到某些使用行為已經(jīng)超出合理范圍,而作者又無(wú)法加以控制,才采取這種折中解決辦法,以使權(quán)利人能夠獲得合理報(bào)酬[22179。通常情況下,大模型在數(shù)據(jù)挖掘的過(guò)程中,通過(guò)爬蟲技術(shù)、非法獲取手段等構(gòu)建數(shù)據(jù)庫(kù)時(shí),易產(chǎn)生著作權(quán)侵權(quán)風(fēng)險(xiǎn)。且在實(shí)踐中,這種情形所涉的數(shù)據(jù)量更大、比重更高,訓(xùn)練數(shù)據(jù)利用作品的行為不完全在合理范疇之內(nèi),使得被利用作品的作者無(wú)法及時(shí)發(fā)現(xiàn)和遏制侵權(quán)行為,無(wú)法對(duì)利用其作品的訓(xùn)練行為進(jìn)行有效控制。法定許可制度下,作品使用的權(quán)利來(lái)源為法定授權(quán),使用行為為付費(fèi)使用,其非自愿性決定了著作權(quán)人與作品的使用人無(wú)法通過(guò)自愿的方式商定使用許可,而是通過(guò)法律明確規(guī)定,讓作品使用人可在無(wú)需獲得著作權(quán)人許可下使用有關(guān)作品,但應(yīng)當(dāng)支付報(bào)酬。這允許使用者以特定方式使用已經(jīng)發(fā)表的作品,弱化了著作權(quán)的排他性,但保留了著作權(quán)人獲得報(bào)酬的權(quán)利。
(二)提高利用作品的授權(quán)效率
生成式人工智能對(duì)模型的訓(xùn)練需要大量的數(shù)據(jù),其中就包括海量作品,這導(dǎo)致其在大量、重復(fù)地利用過(guò)程中,無(wú)法取得全部著作權(quán)人的授權(quán)。由于作品總會(huì)隨著技術(shù)的進(jìn)步和生產(chǎn)生活的需要產(chǎn)生全新的用途,為保護(hù)產(chǎn)業(yè)發(fā)展與競(jìng)爭(zhēng),不能將基于作品產(chǎn)生的全部?jī)r(jià)值賦予著作權(quán)人,否則會(huì)導(dǎo)致基于作品的壟斷,進(jìn)而產(chǎn)生許可費(fèi)用畸高、作品潛在市場(chǎng)縮小、市場(chǎng)失靈嚴(yán)重等一系列影響[23]。法定許可制度本質(zhì)上是對(duì)著作財(cái)產(chǎn)權(quán)專有性的一種限制,其立法價(jià)值并不旨在促進(jìn)權(quán)利人的許可收益,而是以一種非市場(chǎng)化的權(quán)利流轉(zhuǎn)模式克服事前協(xié)商所帶來(lái)的交易障礙。由于法定許可使用免去了事先取得著作權(quán)人同意,也就免除了對(duì)使用報(bào)酬進(jìn)行商談的手續(xù)[2]180,,進(jìn)一步提高了作品整體的傳播效率和交易效率[22]18]。法定許可制度可以擬制出一個(gè)政府管控的市場(chǎng),推進(jìn)權(quán)利高效流轉(zhuǎn),無(wú)需雙方單獨(dú)協(xié)商,而是采用統(tǒng)一的付費(fèi)標(biāo)準(zhǔn)[7]187,由法律法規(guī)作出規(guī)定,或者依行業(yè)協(xié)議、商業(yè)慣例確定,以保證著作權(quán)授權(quán)定價(jià)具有一致性。此時(shí),法定許可制度發(fā)揮了最高限價(jià)的作用,排除具有“權(quán)利劫持”意圖的著作權(quán)人,有助于提高交易效率,推進(jìn)權(quán)利流轉(zhuǎn)和資源分配[12]。法定許可制度還通過(guò)劃定合理定價(jià)區(qū)間,推進(jìn)雙方迅速達(dá)成合意,防正價(jià)格歧視和不理性定價(jià)降低交易的質(zhì)量和效率。
(三)避免支配過(guò)多作品的新壟斷產(chǎn)生
面對(duì)日益加劇的數(shù)據(jù)剝削和數(shù)據(jù)壁壘,法定許可制度既能夠防止科技巨頭利用市場(chǎng)優(yōu)勢(shì)形成數(shù)據(jù)霸權(quán),又能夠限制著作權(quán)人對(duì)作品的控制,切實(shí)維護(hù)生成式人工智能產(chǎn)品或服務(wù)研發(fā)訓(xùn)練的公平市場(chǎng)競(jìng)爭(zhēng)環(huán)境。
目前,生成式人工智能模型訓(xùn)練數(shù)據(jù)的來(lái)源大致可分為三種。第一種是來(lái)源于公有領(lǐng)域的內(nèi)容。第二種是通過(guò)簽訂合同獲得合法授權(quán)的內(nèi)容,即通過(guò)與權(quán)利人簽訂合同獲得有效授權(quán)而合法使用的相關(guān)數(shù)據(jù)和內(nèi)容。第三種是未經(jīng)授權(quán)的信息及內(nèi)容。大型科技公司為了壟斷訓(xùn)練數(shù)據(jù),很有可能利用其優(yōu)勢(shì)地位與被利用作品的著作權(quán)人簽訂排他性許可使用協(xié)議,通過(guò)支配大規(guī)模作品的著作權(quán),排除其他人工智能公司尤其是相對(duì)較小的公司再次使用這些訓(xùn)練數(shù)據(jù)的可能。法定許可能夠防止生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者利用優(yōu)勢(shì)地位交叉和循環(huán)使用相鄰市場(chǎng)數(shù)據(jù)助推“剝削效應(yīng)”、未經(jīng)著作權(quán)人同意強(qiáng)制收集數(shù)據(jù)、在與下游競(jìng)爭(zhēng)者競(jìng)爭(zhēng)時(shí)給予自我優(yōu)待的情形,避免基礎(chǔ)模型因“獲得用戶一獲取數(shù)據(jù)一提升模型—再獲得用戶”的正反饋模型形成數(shù)據(jù)壟斷和基于數(shù)據(jù)的壟斷[24]。同時(shí),法定許可制度限制了著作權(quán)人對(duì)作品的控制,但沒有因提高社會(huì)生產(chǎn)效率而對(duì)著作權(quán)人造成實(shí)質(zhì)性市場(chǎng)損失,反而能夠以相應(yīng)的報(bào)酬鼓勵(lì)著作權(quán)人的創(chuàng)作激情,在一定程度上減少了著作權(quán)人為獲取與作品價(jià)值相符合的對(duì)價(jià)而產(chǎn)生的高價(jià)追求。
(四)更好平衡多方利益
法定許可制度的初衷在于緩解新媒體傳播帶來(lái)的沖擊,降低交易成本,通過(guò)調(diào)和新舊產(chǎn)業(yè)之間的利益沖突來(lái)防止市場(chǎng)壟斷的出現(xiàn),旨在為傳播活動(dòng)提供便利,促進(jìn)公共利益和社會(huì)文化事業(yè)的發(fā)展。而合理使用制度是從“作品”角度出發(fā)[25],其設(shè)立初衷是促使大型內(nèi)容制作者補(bǔ)貼公共利益的資源再分配[26]。但互聯(lián)網(wǎng)和新興技術(shù)降低了傳統(tǒng)內(nèi)容創(chuàng)作和發(fā)行的門檻,導(dǎo)致合理使用制度難以適用于大多數(shù)人工智能創(chuàng)作行為,從而引發(fā)著作權(quán)侵權(quán)行為[27]。當(dāng)立法者認(rèn)為一種使用方式涉及重要的公共利益但不足以因此否定補(bǔ)償權(quán)時(shí),法定許可就成為實(shí)現(xiàn)利益雙方之間平衡的妥協(xié)方案[28]17。
第一,法定許可制度能夠?yàn)槿斯ぶ悄芟到y(tǒng)研發(fā)者提供支持技術(shù)創(chuàng)新和發(fā)展的生態(tài)環(huán)境,確保充足的數(shù)據(jù)集為人工智能系統(tǒng)的開發(fā)和完善提供基礎(chǔ)支持。這間接滿足了研發(fā)者盡可能利用高質(zhì)量數(shù)據(jù)進(jìn)行模型訓(xùn)練的希望,明確了訓(xùn)練數(shù)據(jù)的權(quán)源,通過(guò)合理、靈活的定價(jià)機(jī)制和許可類型滿足其開發(fā)需求,推進(jìn)生成式人工智能系統(tǒng)性能和生成效果的提升。第二,新興技術(shù)和產(chǎn)業(yè)的誕生不能忽視“人”的智力貢獻(xiàn)。法定許可制度能夠?yàn)楸焕米髌返闹鳈?quán)人提供權(quán)益保障,保留著作權(quán)人的創(chuàng)作意愿,允許使用者借助原始作品的精華創(chuàng)造更大的價(jià)值,也反饋給原始權(quán)利人以經(jīng)濟(jì)補(bǔ)償,通過(guò)交易性分配緩解權(quán)利人和使用者之間的矛盾[7]188。第三,法定許可制度的規(guī)定符合公眾利益。對(duì)于生成式人工智能而言,準(zhǔn)確、多樣、可信的訓(xùn)練數(shù)據(jù)有利于降低人工智能系統(tǒng)的偏見,能夠?yàn)楣娞峁┛尚诺纳蓛?nèi)容,建立廣泛的公眾信任。
三、生成式人工智能訓(xùn)練數(shù)據(jù)利用作品法定許可的制度路徑
為進(jìn)一步踐行我國(guó)生成式人工智能治理原則和監(jiān)管方案,推進(jìn)我國(guó)人工智能產(chǎn)業(yè)的創(chuàng)新與發(fā)展,實(shí)現(xiàn)著作權(quán)人與生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者以及社會(huì)公眾之間的利益平衡,有必要從立法、執(zhí)法以及知識(shí)產(chǎn)權(quán)制度價(jià)值等角度,構(gòu)建適合我國(guó)人工智能產(chǎn)業(yè)發(fā)展和知識(shí)產(chǎn)權(quán)制度體系的治理方案。
(一)通過(guò)人工智能專門立法創(chuàng)設(shè)法定許可
自1990年以來(lái),我國(guó)《著作權(quán)法》基本每十年修改一次(分別為2001年、2010年和2020年),與著作權(quán)有關(guān)的行政法規(guī)修改頻率也不高[29]?!吨鳈?quán)法》的修改也可能難以涵蓋所有訓(xùn)練數(shù)據(jù)利用作品的情形,甚至可能導(dǎo)致利益平衡機(jī)制失衡,損害其原有體系。2024年5月,國(guó)務(wù)院辦公廳關(guān)于印發(fā)《國(guó)務(wù)院2024年度立法工作計(jì)劃》的通知明確提出預(yù)備提請(qǐng)全國(guó)人大常委會(huì)審議人工智能法草案。人工智能法將被作為專門立法來(lái)調(diào)整人工智能技術(shù)所涉的各類法律問題。因此,考慮到修訂《著作權(quán)法》的周期較長(zhǎng)、難度較大,在生成式人工智能領(lǐng)域,更適宜在專門的綜合性立法中設(shè)置法定許可制度條款,創(chuàng)設(shè)例外情形以解決矛盾。
第一,將人工智能法定許可機(jī)制納入專門立法考量。通過(guò)專門人工智能立法,可以協(xié)同國(guó)家知識(shí)產(chǎn)權(quán)主管機(jī)關(guān),完善針對(duì)人工智能系統(tǒng)應(yīng)用的知識(shí)產(chǎn)權(quán)制度,確保立法能夠滿足人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展要求,調(diào)整新興技術(shù)和產(chǎn)業(yè)發(fā)展所帶來(lái)的個(gè)人利益與社會(huì)公益間的不平衡。在《人工智能示范法 2.0》(以下簡(jiǎn)稱《示范法》)中,人工智能領(lǐng)域知識(shí)產(chǎn)權(quán)制度被納入“促進(jìn)發(fā)展創(chuàng)新原則”的考量。《示范法》第10條規(guī)定:“國(guó)家鼓勵(lì)人工智能研發(fā)和應(yīng)用,依法保護(hù)人工智能領(lǐng)域知識(shí)產(chǎn)權(quán),建立與人工智能發(fā)展相適應(yīng)的知識(shí)產(chǎn)權(quán)法定許可制度。國(guó)家知識(shí)產(chǎn)權(quán)主管機(jī)關(guān)依法就人工智能法定許可制度制定配套規(guī)則,明確人工智能生成物的權(quán)益保護(hù)和收益分配機(jī)制?!盵30]《示范法》明確提出了將法定許可制度納人人工智能治理之中的立法思路,進(jìn)而規(guī)定由相關(guān)機(jī)關(guān)制定相關(guān)的配套制度。例如,鼓勵(lì)數(shù)字作品著作權(quán)登記和建立數(shù)字作品著作權(quán)信息區(qū)塊鏈存證標(biāo)準(zhǔn),以確保著作權(quán)確權(quán)、流轉(zhuǎn)、保護(hù)等工作可源;發(fā)揮著作權(quán)集體管理組織在協(xié)商方面的代表性和靈活性,進(jìn)一步提高確定定價(jià)比率的效率等[719。
第二,創(chuàng)設(shè)生成式人工智能作品訓(xùn)練的例外條款?;诩夹g(shù)發(fā)展對(duì)內(nèi)容產(chǎn)業(yè)及知識(shí)產(chǎn)權(quán)保護(hù)帶來(lái)的影響,歐盟通過(guò)《數(shù)字化單一市場(chǎng)版權(quán)指令》對(duì)人工智能訓(xùn)練數(shù)據(jù)利用作品行為作出回應(yīng),對(duì)文本和數(shù)據(jù)挖掘設(shè)置了“以科學(xué)研究為目的”和“不限制目的”的兩種例外情形,并以合法訪問權(quán)作為權(quán)利限制與例外的前提,以權(quán)利人可以表達(dá)禁止進(jìn)行數(shù)據(jù)挖掘的意愿為限制條件①。在我國(guó)立法體制下,《著作權(quán)法》近期修訂的可能性不大,而國(guó)家已有人工智能專門法的立法計(jì)劃,可以考慮通過(guò)專門立法的例外條款調(diào)整生成式人工智能系統(tǒng)應(yīng)用產(chǎn)生的特殊知識(shí)產(chǎn)權(quán)問題。我國(guó)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》是在互聯(lián)網(wǎng)迅速發(fā)展的背景下,針對(duì)權(quán)利人、網(wǎng)絡(luò)服務(wù)提供者和作品使用者之間的新問題,由《著作權(quán)法》授權(quán)制定的專門條例。其中,對(duì)利用信息網(wǎng)絡(luò)向農(nóng)村地區(qū)的公眾免費(fèi)提供作品這一特殊情形,該條例便規(guī)定了公告征詢著作權(quán)人意見并支付報(bào)酬的制度,創(chuàng)設(shè)了一種新型的用于扶助貧困群體的法定許可。該制度在設(shè)立之初有較大爭(zhēng)議,但在實(shí)踐中引發(fā)的著作權(quán)爭(zhēng)議卻非常罕見[31]509。相對(duì)于此,人工智能專門立法能夠避免需要上位法授權(quán)制定的問題,并能對(duì)產(chǎn)業(yè)的新發(fā)展形式作出制度內(nèi)容上的細(xì)化補(bǔ)充。
(二)同步規(guī)定合理使用并實(shí)現(xiàn)二者互補(bǔ)銜接
合理使用制度與法定許可制度既有根本區(qū)別,也存在一定相似之處,在適當(dāng)條件下能夠相互轉(zhuǎn)化。近年來(lái),學(xué)界也指出二者存在相互轉(zhuǎn)化的發(fā)展趨勢(shì)。
在使用目的上,二者存在根本不同。合理使用制度的設(shè)定完全是從教育、信息和文化方面的考慮出發(fā),僅限于非商業(yè)性使用;法定許可制度的目的是使人們能夠適當(dāng)?shù)孬@得使用作品的機(jī)會(huì)[21]152,具有商業(yè)性目的,對(duì)作者個(gè)人的權(quán)益只是稍加限制,以防止形成文化壟斷[32]。
從限制制度來(lái)看,二者之間卻存在新的發(fā)展趨勢(shì),即合理使用在一定范圍內(nèi)向法定許可使用轉(zhuǎn)變,免費(fèi)的合理使用制度與付費(fèi)的法定許可使用相互補(bǔ)充(或兩者并立,或三者共存)[21]163。一方面,新技術(shù)使傳統(tǒng)合理使用存在向法定許可使用轉(zhuǎn)變的趨勢(shì)。例如,20世紀(jì)70年代以來(lái),歐洲國(guó)家創(chuàng)立的公共借閱權(quán)規(guī)定,圖書館在出租圖書時(shí)應(yīng)向作者支付版稅,以及為個(gè)人使用目的而復(fù)制他人作品的應(yīng)向著作權(quán)人支付法定報(bào)酬。許多西方國(guó)家采用的新版稅制度已在部分復(fù)制、錄制領(lǐng)域內(nèi),使合理使用變成一種許可使用[21]155。另一方面,法定許可和合理使用制度都為非自愿許可,但法定許可制度在維系著作權(quán)人獲酬權(quán)的條件下,滿足了使用人對(duì)作品利用數(shù)量與方式的需要。例如《保護(hù)文學(xué)與藝術(shù)作品伯爾尼公約》中合理使用的方式還限于“復(fù)制\"這一特定的作品使用方式,而TRIPs協(xié)議則將合理使用的范圍擴(kuò)大到了權(quán)利人“專有權(quán)\"控制的所有使用方式[25]。因此,為促進(jìn)人工智能產(chǎn)業(yè)創(chuàng)新與發(fā)展,維護(hù)訓(xùn)練數(shù)據(jù)利用作品相關(guān)著作權(quán)人的合法權(quán)益,應(yīng)以治理目標(biāo)為導(dǎo)向,合理轉(zhuǎn)化著作權(quán)限制與例外的優(yōu)勢(shì),調(diào)和合理使用制度與法定許可制度的關(guān)系,明確二者不是非此即彼的矛盾關(guān)系,充分利用制度優(yōu)勢(shì)推進(jìn)技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展。
(三)科學(xué)設(shè)定法定許可范圍、條件和程序
法定許可是指特定情況下,作品使用者可以不經(jīng)著作權(quán)人同意而使用其已經(jīng)發(fā)表的作品的制度。因此,并不是所有的生成式人工智能研發(fā)階段使用作品的情形都能夠納入法定許可的范圍,因而需要進(jìn)一步考量可納入法定許可的情形、條件和程序。
對(duì)于限制與例外中要求的“某些特殊情形”,應(yīng)從“質(zhì)”和“量”兩方面考量。第一,在質(zhì)上應(yīng)該被明確確定。第二,在量上其范圍應(yīng)被限于狹窄的范圍[28]99。過(guò)于寬泛的數(shù)量標(biāo)準(zhǔn)可能導(dǎo)致應(yīng)被例外的情形被忽略,而占比較高的情形被認(rèn)定為特殊情形。有學(xué)者認(rèn)為,人工智能創(chuàng)作活動(dòng)暫時(shí)無(wú)法確定適用法定許可制度對(duì)應(yīng)的特定主體和特殊利益,因此只要一般自然人、法人和非法人機(jī)構(gòu)具備進(jìn)行智能創(chuàng)作研發(fā)和應(yīng)用的能力,就可以依照申請(qǐng)程序申請(qǐng)[7]19。雖然,這能夠較大程度上涵蓋生成式人工智能研發(fā)的主體,減少適格主體的認(rèn)定矛盾,但似乎違背了法定許可制度的初衷,并沒有將人工智能技術(shù)利用作品的場(chǎng)景和情形進(jìn)行進(jìn)一步劃分,也沒有區(qū)分研發(fā)者和提供者因能力差異對(duì)主體適格的影響。因此,可以綜合考量適用客體的標(biāo)準(zhǔn),進(jìn)一步根據(jù)生成式人工智能系統(tǒng)的風(fēng)險(xiǎn)或領(lǐng)域劃定適用范圍,明確區(qū)分研發(fā)者和提供者可申請(qǐng)法定許可的范疇。
為推進(jìn)法定許可制度更好地調(diào)整生成式人工智能產(chǎn)品或服務(wù)的數(shù)據(jù)訓(xùn)練行為,應(yīng)進(jìn)一步完善法定許可申請(qǐng)或著作權(quán)人申報(bào)的程序性條款。生成式人工智能法定許可制度在確保傳播效率提升的同時(shí),應(yīng)當(dāng)更側(cè)重于制定嚴(yán)格的法定許可申請(qǐng)程序性條款以及爭(zhēng)議解決機(jī)制,倒逼人工智能產(chǎn)業(yè)向著作權(quán)產(chǎn)業(yè)獲得授權(quán)許可或者法定許可[3]?;蚩蓞⒖紡?qiáng)制許可制度解決生成式人工智能訓(xùn)練數(shù)據(jù)集面臨的“許可使用”困境,建立著作權(quán)人申報(bào)程序,著作權(quán)人同意其作品被使用的,可以向主管部門進(jìn)行申報(bào),要求獲得相應(yīng)的補(bǔ)償金;不同意的,則可以要求主管部門裁定撤銷許可使用[1]100,以“選擇退出\"維護(hù)著作權(quán)權(quán)益。以英國(guó)為例,其政府計(jì)劃針對(duì)人工智能訓(xùn)練數(shù)據(jù)單獨(dú)采用“選擇退出”的機(jī)制,即允許科技公司默認(rèn)使用在線內(nèi)容訓(xùn)練人工智能模型,除非出版商和其他內(nèi)容創(chuàng)作者明確“選擇退出”[34]。由于在實(shí)現(xiàn)中難以知曉進(jìn)行數(shù)據(jù)挖掘活動(dòng)的公司的真實(shí)身份,出版商和其他內(nèi)容創(chuàng)作者質(zhì)疑“選擇退出”的現(xiàn)實(shí)可操作性,更傾向于“選擇加入”機(jī)制,以達(dá)成許可使用條款,進(jìn)一步保留對(duì)作品內(nèi)容使用方式的控制權(quán)。美國(guó)版權(quán)局則提出,影響“選擇加入”或“選擇退出”制度決策的核心因素是權(quán)利人的“交易成本”,取決于“選擇加人”的平均交易成本與“選擇退出”的平均交易成本的差異,以及權(quán)利人對(duì)作品被利用的態(tài)度,因而需要更多的實(shí)證研究作為支撐[35]。因此,僅在事后采用“選擇退出”機(jī)制是不充分的,政府更需要提前介人并實(shí)施嚴(yán)格的保障措施,根據(jù)權(quán)利人實(shí)際需求全面科學(xué)地設(shè)計(jì)法定許可的程序性條款。
(四)配套明確的法定許可定價(jià)標(biāo)準(zhǔn)和付酬機(jī)制
法定許可中,權(quán)利人不再享有許可的定價(jià)權(quán),轉(zhuǎn)而依靠政府確定的稿酬標(biāo)準(zhǔn)[31]628。由于法定許可制度排除了著作權(quán)人的控制權(quán),他人無(wú)需經(jīng)著作權(quán)人許可就可使用其作品,使得權(quán)利人喪失了討價(jià)還價(jià)的市場(chǎng)談判能力,獲得補(bǔ)償?shù)慕痤~往往低于市場(chǎng)談判價(jià)格。在法定許可情況下,著作權(quán)人的經(jīng)濟(jì)利益通常沒有獲得充分滿足[28]17。為彌合這一矛盾,生成式人工智能訓(xùn)練數(shù)據(jù)利用作品的法定許可制度設(shè)計(jì)應(yīng)進(jìn)一步完善配套保障機(jī)制,并強(qiáng)化技術(shù)支持。
第一,完善著作權(quán)集體管理機(jī)制。著作權(quán)集體管理制度的目的是彌補(bǔ)著作權(quán)人在信息獲取與維權(quán)能力方面的不足,降低使用者的交易成本、法律風(fēng)險(xiǎn)與許可費(fèi)用的負(fù)擔(dān)[36]。當(dāng)前我國(guó)著作權(quán)集體管理組織代表性顯著不足,在實(shí)踐中對(duì)著作權(quán)人和作品使用者的價(jià)值也不完全一致,仍存在法定壟斷地位下的集體管理組織被認(rèn)為存在服務(wù)意識(shí)不強(qiáng)、運(yùn)作效率低、公開透明度不足等問題[37]。但著作權(quán)集體管理組織在統(tǒng)一管理、利益分配和救濟(jì)維權(quán)方面具有一定的優(yōu)勢(shì),可以通過(guò)指定相關(guān)的著作權(quán)集體管理協(xié)會(huì)或新設(shè)國(guó)家人工智能主管機(jī)關(guān),就人工智能訓(xùn)練數(shù)據(jù)利用作品制定統(tǒng)一的付費(fèi)標(biāo)準(zhǔn),行使發(fā)放使用許可和轉(zhuǎn)付利用費(fèi)用的職能。美國(guó)《2018年音樂現(xiàn)代化法》就對(duì)音樂法定許可申請(qǐng)程序做出了改變,由按作品許可改為一攬子許可,許可費(fèi)用統(tǒng)一向集體管理組織繳納,極大地簡(jiǎn)化了法定許可手續(xù)。另外,也應(yīng)考慮吸納一部分權(quán)利人參與作品使用費(fèi)的定價(jià)協(xié)商,通過(guò)靈活的選擇吸引更多優(yōu)質(zhì)作品進(jìn)人“版權(quán)池”[38]。
第二,創(chuàng)新引入第三方付酬機(jī)制。在許可方面,有學(xué)者主張可以采用“先用后付、以收定付”原則[7]193。但我國(guó)法定許可制度中,尚無(wú)不按規(guī)定主動(dòng)支付報(bào)酬的懲罰措施。最高人民法院的個(gè)案甚至確認(rèn):“作品使用人在不損害著作權(quán)人獲得報(bào)酬權(quán)的前提下,‘先使用后付款’不違反法律規(guī)定。”①這導(dǎo)致使用人存有僥幸心理,拒絕主動(dòng)支付報(bào)酬。對(duì)此,可進(jìn)一步發(fā)揮知識(shí)產(chǎn)權(quán)局、法院、集體管理組織,乃至人工智能主管機(jī)關(guān)的統(tǒng)籌作用,引人第三方機(jī)構(gòu),推進(jìn)“先收款、后付款”的付酬機(jī)制,最大程度保障相關(guān)權(quán)利人的獲酬權(quán),確保訓(xùn)練數(shù)據(jù)高效應(yīng)用于系統(tǒng)開發(fā)。若單純依賴市場(chǎng)主體的自愿協(xié)商機(jī)制,則可能導(dǎo)致資本過(guò)度集中于頭部企業(yè);而通過(guò)法定許可制度,則能有效避免價(jià)格的失控。
第三,完善數(shù)字著作權(quán)登記溯源機(jī)制。由于生成式人工智能模型訓(xùn)練涉及海量數(shù)據(jù),在利用相關(guān)作品的過(guò)程中,往往難以確定每個(gè)作品的歸屬、使用場(chǎng)景和付酬情況,甚至還會(huì)有很多未經(jīng)標(biāo)注的作品在不同媒介中被傳播和利用,難被溯源并進(jìn)行利益分配。同時(shí),一旦訓(xùn)練數(shù)據(jù)庫(kù)被攻擊或盜取,就會(huì)導(dǎo)致數(shù)據(jù)泄露,對(duì)原始權(quán)利人造成的經(jīng)濟(jì)利益將難以計(jì)算。因此,可以充分發(fā)揮區(qū)塊鏈技術(shù)不可篡改的優(yōu)勢(shì),確保訓(xùn)練數(shù)據(jù)利用的作品可溯源、易追蹤,降低研發(fā)企業(yè)登記全部訓(xùn)練數(shù)據(jù)的成本,提升作品利用的證明力[7]96
第四,鼓勵(lì)大模型提高訓(xùn)練數(shù)據(jù)透明度??紤]到生成式人工智能的算法、模型和參數(shù)都具有商業(yè)秘密性和知識(shí)產(chǎn)權(quán)價(jià)值,可以采取由生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者創(chuàng)建模型卡的制度,對(duì)訓(xùn)練數(shù)據(jù)等關(guān)鍵性信息進(jìn)行登記和備案[39]。2023年11月,法國(guó)、德國(guó)、意大利發(fā)布《基于歐洲人工智能法案價(jià)值觀的創(chuàng)新友好型路徑》聯(lián)合聲明,提出由基礎(chǔ)模型的開發(fā)人員定義模型卡,在確保透明度和安全性的基礎(chǔ)上加強(qiáng)自我監(jiān)管。模型卡內(nèi)容應(yīng)包括但不限于基礎(chǔ)模型的參數(shù)數(shù)量、預(yù)期用途、潛在限制和偏見研究結(jié)果等。另外,也可以由人工智能主管機(jī)關(guān)提供標(biāo)準(zhǔn)模板,要求研發(fā)者遵守著作權(quán)要求,就生成式人工智能模型訓(xùn)練所用的內(nèi)容提供一份詳細(xì)的摘要,包括但不限于利用已公開的作品,并向社會(huì)公開,以此配合數(shù)字著作權(quán)登記溯源機(jī)制,提高大模型的透明度,輔助付酬機(jī)制落地,以形成完整邏輯閉環(huán)。
四、結(jié)語(yǔ)
生成式人工智能正在引發(fā)新一輪智能化浪潮,并已經(jīng)賦能至各行各業(yè),有效地提升了社會(huì)生產(chǎn)的效率,為人們的生活帶來(lái)諸多便利。相關(guān)的矛盾和爭(zhēng)議也應(yīng)運(yùn)而生。數(shù)據(jù)訓(xùn)練作為生成式人工智能開發(fā)階段中的關(guān)鍵一環(huán),其行為合法與否對(duì)后續(xù)的建模和部署階段也將產(chǎn)生影響。針對(duì)訓(xùn)練數(shù)據(jù)利用作品行為的著作權(quán)爭(zhēng)議,有必要厘清合理使用制度的局限性,發(fā)揮法定許可制度的優(yōu)勢(shì),通過(guò)專門立法創(chuàng)設(shè)適于生成式人工智能特性的法定許可情形,進(jìn)一步完善法定許可的配套機(jī)制,實(shí)現(xiàn)數(shù)據(jù)訓(xùn)練活動(dòng)“有法可依”。構(gòu)建完善的訓(xùn)練數(shù)據(jù)利用作品的法定許可制度,尚需學(xué)界和產(chǎn)業(yè)界的討論與磨合;特別是對(duì)于該情形下法定許可具體范圍、客體范疇、定價(jià)標(biāo)準(zhǔn)的界定,以及付酬機(jī)制、登記機(jī)制的運(yùn)行,均需結(jié)合產(chǎn)業(yè)實(shí)踐需要,作出細(xì)化規(guī)定。在此基礎(chǔ)上,通過(guò)充分發(fā)揮法定許可制度的獨(dú)特優(yōu)勢(shì),以滿足生成式人工智能產(chǎn)品或服務(wù)的研發(fā)者、提供者以及著作權(quán)人和社會(huì)公眾的多元利益需求。
參考文獻(xiàn):
[5]MARR B.GPT-4 Iscoming-what we know so far[EB/OL].(2023-02-24)[2024-04-17].htp://www.forbes.com/sites/ber-nardmarr/2023/02/24/gpt-4-is-coming--what-we-know-so-far/? sh=11045dd86c2d.
[6]SINGH M,CAMBRONERO J,GULWANIS,et al.Code fusion:A pre-trained difusion model for code generation[EB/OL].
(2023-10-26)[2024-02-18].https://arxiv.0rg/abs/2310.17680.
[7]何煉紅.人工智能知識(shí)產(chǎn)權(quán)保護(hù);挑戰(zhàn)及應(yīng)對(duì)[M].北京;法律出版社,2024.
[8]高陽(yáng),胡丹陽(yáng).機(jī)器學(xué)習(xí)對(duì)著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對(duì)[J].電子知識(shí)產(chǎn)權(quán),2020(10):21.
[9]李琛.論我國(guó)著作權(quán)法修訂中“合理使用”的立法技術(shù)[J].知識(shí)產(chǎn)權(quán),2013(1):16.
[10]鄭重.日本著作權(quán)法柔性合理使用條款及其啟示[J].知識(shí)產(chǎn)權(quán),2022(1):117-118.
[11]張吉豫,汪賽飛.大模型數(shù)據(jù)訓(xùn)練中的著作權(quán)合理使用研究[J].華東政法大學(xué)學(xué)報(bào),2024(4):29.
[12]蔣一可.數(shù)字音樂著作權(quán)許可模式探究——兼議法定許可的必要性及其制度構(gòu)建[J].東方法學(xué),2019(1):155.
[13]O'DONNELLJ.Training AI music models isabout to getveryexpensive[EB/OL].(2024-06-27)[2024-07-10].https://www.technologyreview.com/2024/06/27/1094379/ai-music-suno-udio-lawsuit-record-labels-youtube-licensing/.
[14]劉家瑞.論著作權(quán)法修改的市場(chǎng)經(jīng)濟(jì)導(dǎo)向——兼論集體管理、法定許可與孤兒作品[J].知識(shí)產(chǎn)權(quán),2016(5):47.
[15]張嚴(yán).生成式人工智能壟斷風(fēng)險(xiǎn)問題探析[J].科學(xué)決策,2024(9):205.
[16]殷繼國(guó).人工智能時(shí)代算法壟斷行為的反壟斷法規(guī)制[J].比較法研究,2022(5):187.
[17]ISAAC M.Reddit wants togetpaidfor helping toteach bigA.I.systems[EB/OL].(2023-04-18)[2024-10-06].https://www.nytimes.com/2023/04/18/technology/reddit-ai-openai-google.html.
[18]劉友華,魏遠(yuǎn)山.機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)問題及其解決[J].華東政法大學(xué)學(xué)報(bào),2019(2):76.
[19]熊琦.著作權(quán)法定許可制度溯源與移植反思[J].法學(xué),2015(5):72.
[20]李照東,郭謙.論著作權(quán)法定許可制度的完善——以《著作權(quán)法》第 23條為例[J].山東社會(huì)科學(xué),2018(2):159.
[21]吳漢東.知識(shí)產(chǎn)權(quán)基本問題研究[M].北京:中國(guó)人民大學(xué)出版社,2009.
[22]張今.著作權(quán)法[M].北京:北京大學(xué)出版社,2015.
[23]徐小奔,楊依楠.論人工智能深度學(xué)習(xí)中著作權(quán)的合理使用[J].交大法學(xué),2019(3):41.
[24]李希梁,張欽昱.生成式人工智能的反壟斷規(guī)制[J].電子政務(wù),2024(5):56.
[25]李明德,許超.著作權(quán)法[M].北京:法律出版社,2009:95.
[26] SOBEL B.Artificial intelligence’s fair use crisis[J].Columbia Journal of Law amp; Arts,2017(45) :85.
[27]華劫.合理使用制度運(yùn)用于人工智能創(chuàng)作的兩難及出路[J].電子知識(shí)產(chǎn)權(quán),2019(4):35.
[28]朱理.著作權(quán)的邊界:信息社會(huì)著作權(quán)的限制與例外研究[M].北京:北京大學(xué)出版社,2011.
[29]李銘軒.著作權(quán)法合理使用規(guī)則僵化的困境與出路[J].出版廣角,2022(11):53.
[30]周輝,李延楓.《人工智能示范法》釋義[M].北京:中國(guó)社會(huì)科學(xué)出版社,2024:24.
[31]崔國(guó)斌.著作權(quán)法原理與案例[M].北京:北京大學(xué)出版社,2014.
[32]張平.知識(shí)產(chǎn)權(quán)法[M].北京:北京大學(xué)出版社,2015:72.
[33]毛銘浩.音樂著作權(quán)法定許可制度的立法價(jià)值重塑[J].電子知識(shí)產(chǎn)權(quán),2023(1):57.
[34]GROSS A,THOMAS D.UK toconsult on“opt-out”modelfor AIcontent-scraping in blowto publishers[EB/OL].(2024-10-17)[2024-10-30].https://www.ft.com/content/26bc3de1-af90-4c69-9f53-61814514aeaa.
[35]BRENTLIdentifyingtheconomicimplicationsofatificialinteligene forcopyrightpolicy:Contextanddirectionforco-nomic research,U.S.Copyright Office,2025[R/OL].(2024-02-14)[2024-12-12].hps://www.copyright.go/economic-re-search/economic-implications-of-ai/dentifying-the-Economic-Implicationsof-rtificial-Inteligence-fr-opight-Policy-NAL.pdf.
[36]向波.著作權(quán)集體管理組織:市場(chǎng)功能、角色安排與定價(jià)問題[J].知識(shí)產(chǎn)權(quán),2018(7):69.
[37]張祥志.破解信任困局:我國(guó)著作權(quán)集體管理“信任機(jī)制”的法治關(guān)注[J].新聞與傳播研究,2019(3):53.
[38]張平.人工智能生成內(nèi)容著作權(quán)合法性的制度難題及其解決路徑[J].法律科學(xué)(西北政法大學(xué)學(xué)報(bào)),2024(3):30.
[39]肖紅軍,張麗麗.大模型倫理失范的理論解構(gòu)與治理創(chuàng)新[J].財(cái)經(jīng)問題研究,2024(5):25.
Statutory license for the use of works in generative artificial intelligence training data
ZHOUHui1,JIN Xiai2
(1. Institute ofLaw,Chinese Academy of Social Sciences,Beijing 10o72O,China; 2.Law School,University of Chinese Academy of Social Sciences,Beijing 1O2401,China
Abstract:The development of generative artificial inteligence(AI),suchas DeepSeek,especially DeepSeek,relies heavilyonhigh-quality training data,andusing worksfor training hassparkedaseries ofcopyrightdisputes.To ensure thehigh-qualitydevelopmentofgenerativeAI,itisurgenttoaddresspracticalissuessuchasdiffcultiesinobtainingauthorizationforworks,highauthorizationcosts,thechallengeofbalancing interests,andcompetitive bariers.While the fairuse systemcan helpresolveisuesrelated tothe dificultyofobtainingauthorization forworksand highutilization costs,it sacrifices the interests ofcopyright holdersandcertain public interests tosome extent.Relying solelyonthe fair use system cannot fullyaddressthe new copyright issues arising from the development of generative AI. Establishing a statutory license for using works to train generativeAIcan providealegitimate basis for using works,improveauthorizationeffciency,and prevent newforms ofmonopolies thatcould excludeorrestrictcompetitionin generativeAI bycontroling thecopyrightofacertainnumberofworks.Additionall,throughreasonable licensing fees,itcanprovidenecessarycompensationforcopyrightholders,achievingabeter balanceof interestsforallparties involved inthe innovative developmentof generativeAI.Theimplementationof astatutory licensing systemfor generativeAItraining worksrequires specializedAIlegislation tocreateaframework thatcomplementsandconnectswithfairuse.Thisshould involvethescientific establishment of the scope,conditions,and procedures of statutory licenses,along with clear pricing standards and compensation mechanisms.
Keywords:generative artificial intelligence; training data; fair use;statutory license;DeepSeek
(編輯:刁勝先)
重慶郵電大學(xué)學(xué)報(bào)·社會(huì)科學(xué)版2025年2期