【摘 要】AI大模型技術(shù)迭代發(fā)展加速了出版語料的野蠻使用,而針對AI大模型訓(xùn)練語料侵權(quán)的法律監(jiān)管則相對保守。面對新挑戰(zhàn),美國出版業(yè)明確表達(dá)了對邊界限制與過程透明的AI版權(quán)規(guī)制訴求,出版商通過司法訴訟與商業(yè)合作維護(hù)AI訓(xùn)練語料使用權(quán)益,并且發(fā)布退出AI訓(xùn)練使用選擇的版權(quán)聲明以減少灰色空間。我國出版業(yè)可通過堅持“先授權(quán)后使用”原則、完善“選擇—退出”機(jī)制、明確AI訓(xùn)練語料披露責(zé)任來推進(jìn)AI訓(xùn)練侵權(quán)的司法規(guī)制環(huán)境建設(shè),同時通過完善版權(quán)聲明和版權(quán)合同、提升技術(shù)對抗能力、建立系統(tǒng)維權(quán)機(jī)制來加強(qiáng)出版企業(yè)應(yīng)對AI訓(xùn)練侵權(quán)的維權(quán)能力。
【關(guān)" 鍵" 詞】AI訓(xùn)練;版權(quán);AI訓(xùn)練侵權(quán);出版語料;美國出版業(yè)
【作者單位】王志剛,中國海洋大學(xué)文學(xué)與新聞傳播學(xué)院;吳璨,中國海洋大學(xué)文學(xué)與新聞傳播學(xué)院。
【基金項目】國家社科基金一般項目“人工智能驅(qū)動下出版產(chǎn)業(yè)版權(quán)管理創(chuàng)新研究(24BXW089)”的階
段性成果。
【中圖分類號】G239.3 【文獻(xiàn)標(biāo)識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2025.02.011
在大數(shù)據(jù)技術(shù)與硬件算力顯著提升的協(xié)助下,以DeepSeek、ChatGPT、Sora為代表的人工智能(AI)能夠用人類標(biāo)準(zhǔn)實現(xiàn)文生文、文生圖和文生視頻,人類社會也從機(jī)器代替體力勞動時代加速進(jìn)入到機(jī)器代替腦力勞動時代[1]。充斥于網(wǎng)絡(luò)信息空間的各類AI生成物,在放大用戶生成內(nèi)容既有版權(quán)問題的基礎(chǔ)之上,也催生了AI大模型機(jī)器學(xué)習(xí)環(huán)節(jié)的訓(xùn)練侵權(quán)問題[2]。作為AI技術(shù)全球領(lǐng)先的國家,美國人工智能市場規(guī)模2024年達(dá)到501.6億美元,市場規(guī)模年增長率為28.30%,預(yù)計到2030年市場規(guī)模將達(dá)到2237億美元 [3]。斯坦福大學(xué)人工智能研究所(Stanford HAI)發(fā)布的《2024年人工智能指數(shù)報告》顯示,美國共有61個知名人工智能大模型,遠(yuǎn)遠(yuǎn)超過世界其他國家[4]。AI大模型領(lǐng)域的迅猛發(fā)展,讓美國率先面臨AI訓(xùn)練侵權(quán)等版權(quán)保護(hù)治理難題,《紐約時報》等出版機(jī)構(gòu)不斷對OpenAI等科技公司提起版權(quán)訴訟。然而,面對生成式人工智能帶來的版權(quán)沖擊,美國更多是借助判例法傳統(tǒng),秉持以市場為主導(dǎo)的“柔性規(guī)制模式”[5],讓傳統(tǒng)出版業(yè)與AI科技公司雙方博弈,期待二者在充分表達(dá)利益的基礎(chǔ)上實現(xiàn)合作途徑的創(chuàng)新。
這種AI版權(quán)規(guī)制思路雖然客觀上有助于美國AI大模型技術(shù)進(jìn)化和全球市場擴(kuò)張,但卻對美國出版業(yè)抵抗AI科技公司非法使用出版語料問題制造了現(xiàn)實困難。當(dāng)下的美國出版業(yè)既要面對科技公司AI大模型這一語料吞噬怪獸不斷張開的血盆大口,又要面對司法保護(hù)實踐的“猶抱琵琶半遮面”。本文以美國出版業(yè)抵抗AI訓(xùn)練侵權(quán)的相關(guān)案例和文本為分析對象,系統(tǒng)總結(jié)美國出版業(yè)的具體應(yīng)對措施,以期對我國出版業(yè)應(yīng)對AI大模型訓(xùn)練侵權(quán)問題有所鏡鑒。
一、美國出版業(yè)抵抗AI訓(xùn)練侵權(quán)的現(xiàn)實困境
美國AI技術(shù)的飛速迭代與訓(xùn)練數(shù)據(jù)需求的急劇增長如同熊熊火焰,不斷吞噬著版權(quán)保護(hù)的邊界,同時美國司法實踐對AI版權(quán)規(guī)制卻仍然堅持鼓勵技術(shù)創(chuàng)新的傳統(tǒng)法律慣習(xí),導(dǎo)致美國出版業(yè)面臨AI訓(xùn)練侵權(quán)的嚴(yán)峻挑戰(zhàn)。
1.AI大模型技術(shù)迭代發(fā)展加速了出版語料的野蠻使用
(1)AI大模型技術(shù)迭代需要訓(xùn)練數(shù)據(jù)集不斷拓展
研究表明,自2020年以來,用于訓(xùn)練大語言模型的數(shù)據(jù)增長了100倍,并且AI訓(xùn)練數(shù)據(jù)集的規(guī)模每年翻倍[6]。隨著AI技術(shù)的不斷發(fā)展和應(yīng)用場景的不斷拓展,AI大模型迭代更新速度加快,新的AI大模型不僅涉及文本生成、圖像識別、自然語言處理等多個領(lǐng)域,還涵蓋越來越豐富的多模態(tài)功能,如語音與視覺的結(jié)合、跨領(lǐng)域推理等,這使得訓(xùn)練數(shù)據(jù)集的更新和擴(kuò)展成為一個持續(xù)性任務(wù)。AI科技公司不僅要擁有海量語料庫,還要跟進(jìn)最新的知識和趨勢,不斷優(yōu)化和擴(kuò)展數(shù)據(jù)源,以提升AI大模型的功能,應(yīng)對更為復(fù)雜的任務(wù)。由于數(shù)據(jù)的數(shù)量與質(zhì)量被視為衡量AI大模型成功與否的重要指標(biāo),各大科技公司紛紛加碼研發(fā),通過不斷擴(kuò)大其數(shù)據(jù)集以提升模型的語義理解和生成能力,從而保持自身競爭力。這是大模型技術(shù)快速發(fā)展的關(guān)鍵,也是導(dǎo)致美國出版業(yè)遭受AI侵權(quán)訓(xùn)練的現(xiàn)實原因之一。
AI大模型的急速增長促進(jìn)了語料需求的增加,直接導(dǎo)致出版行業(yè)所面臨的版權(quán)問題。在眾多語料中,經(jīng)過知識沉淀的出版內(nèi)容成為AI大模型訓(xùn)練的優(yōu)選語料,尤其是一些學(xué)術(shù)出版物和專業(yè)書籍,因其數(shù)據(jù)密度和知識深度而備受許多AI科技公司訓(xùn)練模型青睞,大模型的迅速技術(shù)迭代更是加劇了對出版內(nèi)容的“掠奪”。
隨著新一代大模型的發(fā)布,其訓(xùn)練數(shù)據(jù)集的規(guī)模都要比前一代更大,因此對數(shù)據(jù)的獲取速度也加快。以GPT系類為例,GPT-4總共包含1.8萬億參數(shù),而GPT-3只有約1750億個參數(shù)[7],這種快速迭代和數(shù)據(jù)擴(kuò)展的需求對出版行業(yè)產(chǎn)生了深遠(yuǎn)的影響。由于傳統(tǒng)出版物的出版周期相對較長,而AI大模型的訓(xùn)練需要不斷吸收最新的內(nèi)容和知識。這就意味著出版商在這種高速發(fā)展的AI訓(xùn)練環(huán)境中處于被動地位——出版商不僅要面臨出版周期長和人工成本高的問題,還要應(yīng)對AI科技公司不斷擴(kuò)展訓(xùn)練數(shù)據(jù)集所帶來的侵權(quán)問題。
(2)AI大模型公司在技術(shù)優(yōu)勢掩護(hù)下對出版語料進(jìn)行非法使用
面對日趨膨脹的需求和日漸耗盡的數(shù)據(jù)資源,在AI大模型的訓(xùn)練過程中,美國部分科技公司為了低成本高效能擴(kuò)充數(shù)據(jù)集,在數(shù)據(jù)處理和去標(biāo)識化等技術(shù)的掩護(hù)下,選擇未經(jīng)授權(quán)的盜版網(wǎng)站或非法內(nèi)容源進(jìn)行數(shù)據(jù)抓取和模型訓(xùn)練。2023年10月,Meta的內(nèi)部通訊顯示,其在訓(xùn)練其AI大模型時使用了受版權(quán)保護(hù)的數(shù)據(jù)并試圖掩飾這一事實。Meta產(chǎn)品總監(jiān)索尼·特哈卡納特(Sony Theakanath)在發(fā)給AI研究副總裁喬爾·皮諾(Joelle Pineau)的電子郵件中表示,GenAI已獲準(zhǔn)使用LibGen(一家擁有海量盜版圖書和學(xué)術(shù)資源的網(wǎng)站)進(jìn)行訓(xùn)練。Meta公司內(nèi)部設(shè)立了一系列“緩解措施”,以減少這種數(shù)據(jù)可能帶來的法律和輿論風(fēng)險,其中包括刪除數(shù)據(jù)中明確標(biāo)注為侵權(quán)的內(nèi)容,避免公開承認(rèn)數(shù)據(jù)來源,并在必要時對大模型進(jìn)行全面風(fēng)險評估[8]。由此可見,雖然美國大多數(shù)AI科技公司聲稱其數(shù)據(jù)來源公開且合法,但實際上盜版內(nèi)容和未經(jīng)授權(quán)的資源在訓(xùn)練數(shù)據(jù)集中占據(jù)了重要地位。
AI科技公司依靠技術(shù)掩護(hù)對出版語料數(shù)據(jù)的非法使用行為,直接侵犯了出版商和內(nèi)容創(chuàng)作者的知識產(chǎn)權(quán),進(jìn)一步加劇了出版行業(yè)版權(quán)保護(hù)的困境。這種“數(shù)據(jù)掩飾”的手段使盜版內(nèi)容在數(shù)據(jù)集中變得“無痕跡”且不易識別,即使出版商意識到其內(nèi)容被盜用,往往也很難追蹤到AI訓(xùn)練數(shù)據(jù)集中的具體應(yīng)用,從而使得內(nèi)容維權(quán)變得更加復(fù)雜。出版商在訴訟過程中,常常因為無法證實特定內(nèi)容的非法來源,或缺乏足夠的證據(jù)支持,導(dǎo)致維權(quán)成本極高且效果有限。
此外,AI科技公司使用盜版網(wǎng)站內(nèi)容進(jìn)行AI大模型訓(xùn)練,不僅侵犯了版權(quán)持有者的經(jīng)濟(jì)利益,也對整個出版行業(yè)的健康生態(tài)構(gòu)成了威脅。由于出版商依賴版權(quán)收入來維持生計,當(dāng)這些潛在版權(quán)收入被非法使用的數(shù)據(jù)源和盜版內(nèi)容所侵蝕時,不僅會影響出版商的正常運營,也導(dǎo)致創(chuàng)作者失去創(chuàng)新的動力和收益,從而對整個版權(quán)運營鏈造成根本性破壞。
2.針對AI訓(xùn)練語料侵權(quán)的法律監(jiān)管相對保守
美國作為AI技術(shù)領(lǐng)先的國家,面對AI大模型的訓(xùn)練侵權(quán)行為并未采取嚴(yán)厲的版權(quán)規(guī)制措施,而是在立法、司法層面保持一個相對保守的態(tài)度。
(1)AI訓(xùn)練數(shù)據(jù)披露相關(guān)立法仍在襁褓之中
在立法層面,針對AI訓(xùn)練行為可能存在的風(fēng)險,美國有意識地引入人工智能法律監(jiān)管機(jī)制,相繼推出一系列強(qiáng)調(diào)AI大模型透明度的立法提案。如:2023年12月12日,《2023年AI基金會模型透明度法案》[9]提出,授權(quán)聯(lián)邦貿(mào)易委員會(FTC)要求基礎(chǔ)模型開發(fā)人員發(fā)布有關(guān)訓(xùn)練數(shù)據(jù)、算法和模型性能的信息;2024年11月26日,《人工智能網(wǎng)絡(luò)透明度和責(zé)任 (TRAIN) 法案》[10]提出,允許法院向模型開發(fā)者發(fā)出傳票,要求他們披露是否使用了版權(quán)持有者的內(nèi)容來訓(xùn)練模型,以協(xié)助版權(quán)所有者確定哪些受版權(quán)保護(hù)的作品已用于AI大模型的訓(xùn)練;2024年4月9日,《生成式人工智能版權(quán)披露法案》[11]從主體歸屬、程序化管理和算法透明的角度出發(fā),要求AI科技公司在發(fā)布新的生成式人工智能系統(tǒng)之前,必須向版權(quán)登記處提交一份包含用于訓(xùn)練數(shù)據(jù)所用的受版權(quán)保護(hù)作品的通知,以通過開創(chuàng)性立法的形式使相關(guān)公司在訓(xùn)練其AI大模型時保證完全透明。
以上立法提案表明,美國立法層面通過要求AI科技公司披露用于訓(xùn)練人工智能系統(tǒng)的數(shù)據(jù),有意識地保護(hù)受到人工智能浪潮沖擊的版權(quán)所有者。但是上述立法仍然處于提案階段,不具備真正的法律效力,只能從側(cè)面反映出美國立法者對于既存問題的態(tài)度,真正發(fā)揮司法規(guī)制效力的時間仍然難以確定。
(2)轉(zhuǎn)換性使用認(rèn)定標(biāo)準(zhǔn)延展了AI訓(xùn)練語料的合理使用邊界
從司法層面來看,嚴(yán)格的侵權(quán)責(zé)任認(rèn)定會對產(chǎn)業(yè)主體造成過度威懾[12],在價高者得的市場邏輯主導(dǎo)下,往往會誘發(fā)大型企業(yè)獨占相關(guān)作品進(jìn)行模型訓(xùn)練的反競爭效果[13]。在調(diào)和AI技術(shù)發(fā)展與版權(quán)關(guān)系的問題上,美國延續(xù)其版權(quán)合理使用制度中的轉(zhuǎn)換性使用策略,肯定文本數(shù)據(jù)挖掘的合理使用,對抓取數(shù)據(jù)用于AI大模型訓(xùn)練的態(tài)度較為寬松。
在20世紀(jì)90年代首次確立轉(zhuǎn)換性使用的坎貝爾訴阿卡夫—羅斯公司案中,法院認(rèn)為被告在使用原作品時增加了“新表達(dá)、新含義或信息”,應(yīng)視為轉(zhuǎn)換性使用,不構(gòu)成侵權(quán)[14]。在應(yīng)對“二次創(chuàng)作”的不斷變形中,轉(zhuǎn)換性使用的認(rèn)定標(biāo)準(zhǔn)逐步放寬,即使是不加變化的直接使用,只要使用目的不同,也可歸屬于合理使用,而無須考慮使用行為是否具備“營利性”[15]。如威廉姆斯、威爾金斯公司訴美國案中,科研人員未經(jīng)授權(quán)復(fù)制了出版商科學(xué)期刊中的照片,但僅供個人在科研工作中使用而未用于商業(yè)用途。法院據(jù)此認(rèn)定,該復(fù)制行為并未對原告產(chǎn)生嚴(yán)重不利影響,符合轉(zhuǎn)換性使用標(biāo)準(zhǔn),并判定科研機(jī)構(gòu)的使用行為不構(gòu)成侵權(quán)[16]。無獨有偶,在美國作家協(xié)會訴谷歌圖書館案中,法院允許谷歌制作未經(jīng)授權(quán)的、以數(shù)字副本形式呈現(xiàn)的版權(quán)作品,認(rèn)為其實現(xiàn)搜索功能并顯示作品片段的行為具有變革性,即使谷歌是在營利性目的驅(qū)動下利用其在圖書搜索方面的主導(dǎo)地位來鞏固自身競爭優(yōu)勢,由于涉及高度轉(zhuǎn)換性使用情況,也不妨礙合理使用的認(rèn)定[17]。
這些版權(quán)司法實踐表明,美國并未對轉(zhuǎn)換性使用標(biāo)準(zhǔn)中的商業(yè)性和非商業(yè)性要素作出嚴(yán)格要求,當(dāng)語料使用符合轉(zhuǎn)換性使用要求時,就可納入合理使用范圍。人工智能公司雖然出于營利目的訓(xùn)練AI大模型,但由于輸入階段的作品利用指向生成程序的形成,不會對原作品形成市場替代,具有認(rèn)定為合理使用的空間[18]。如果AI生成內(nèi)容顯著改變了原作品的表達(dá)方式或目標(biāo)受眾,或通過新的視角對原作品進(jìn)行批判性使用,那么AI訓(xùn)練行為的目的就可以被理解為催化知識生產(chǎn),或者被定義為更深遠(yuǎn)的公益目的,極可能在司法實踐中被視為一種延展的合理使用行為,從而成為科技公司繼續(xù)無償使用訓(xùn)練語料的抗辯武器。
二、美國出版業(yè)應(yīng)對AI訓(xùn)練侵權(quán)的主要措施
美國出版業(yè)作為全球出版行業(yè)的領(lǐng)頭羊,率先遭遇AI技術(shù)對出版產(chǎn)業(yè)版權(quán)保護(hù)的挑戰(zhàn)。在此背景下,美國出版業(yè)采取了一系列積極有效的措施來應(yīng)對AI訓(xùn)練中可能出現(xiàn)的版權(quán)侵權(quán)問題。
1.明確表達(dá)對AI訓(xùn)練的版權(quán)規(guī)制訴求
面對AI訓(xùn)練侵權(quán),美國出版業(yè)積極表達(dá)自身訴求,尋求建立一個語料使用邊界清晰、過程透明的AI版權(quán)規(guī)制環(huán)境。
(1)堅持邊界限定:拒絕未經(jīng)授權(quán)的使用行為
面對AI訓(xùn)練侵權(quán)方的“合理使用”抗辯理由,美國出版業(yè)要求在新的法律框架下重新確定合理使用邊界,以適應(yīng)AI技術(shù)對內(nèi)容創(chuàng)作和使用方式的改變。當(dāng)前,傳統(tǒng)的合理使用原則在面對AI技術(shù)時顯得力不從心:一方面,AI的“學(xué)習(xí)”和“創(chuàng)作”過程難以用傳統(tǒng)的“三步檢驗法”來界定其是否構(gòu)成合理使用;另一方面,AI生成的內(nèi)容可能與原作品高度相似,從而引發(fā)版權(quán)糾紛[19]。若支持原有合理使用制度的主張,現(xiàn)有條款就可能成為生成式人工智能規(guī)避支付許可費用的侵權(quán)工具,由此減少了版權(quán)所有者的正常許可收益。而實際上,不論是學(xué)習(xí)特定作品的表達(dá)進(jìn)行內(nèi)容輸出,還是學(xué)習(xí)海量作品的表達(dá)進(jìn)行內(nèi)容輸出,都是對版權(quán)作品的消費性使用,都理應(yīng)支付相應(yīng)的報酬。美國出版業(yè)認(rèn)為,如果人類不可以未經(jīng)授權(quán)使用作品,那么機(jī)器也不存在任何類似的借口,因此亟須明確合理使用邊界,以規(guī)制AI訓(xùn)練侵權(quán)。
美國出版業(yè)相關(guān)行業(yè)協(xié)會紛紛表達(dá)上述AI版權(quán)規(guī)制訴求。如美國出版商協(xié)會(AAP)堅持認(rèn)為,未經(jīng)許可攝入受版權(quán)保護(hù)的材料用于AI大模型訓(xùn)練不符合合理使用的條件 [20],科技公司在訓(xùn)練AI系統(tǒng)時,其所用的版權(quán)作品需要獲得版權(quán)所有者的同意或許可,過往未經(jīng)許可而使用的版權(quán)作品應(yīng)向版權(quán)所有者進(jìn)行賠償,不應(yīng)為人工智能公司創(chuàng)造法律豁免權(quán)[21]。美國新聞媒體聯(lián)盟(NMA)稱,版權(quán)法必須保護(hù)而不是傷害內(nèi)容創(chuàng)作者,合理使用原則并不能證明生成式人工智能產(chǎn)品未經(jīng)授權(quán)使用出版商內(nèi)容、檔案和數(shù)據(jù)庫是正當(dāng)?shù)?,未?jīng)許可的任何以前或現(xiàn)在使用的此類內(nèi)容均違反版權(quán)法[22]。美國作曲家、作家和出版商協(xié)會(ASCAP)也宣稱,堅決反對任何將受版權(quán)保護(hù)的內(nèi)容用于訓(xùn)練AI大模型在美國視為“合理使用”的建議[23]。相關(guān)行業(yè)協(xié)會的集體發(fā)聲,形成了抵抗AI訓(xùn)練侵權(quán)的巨大輿論場,為維護(hù)美國出版業(yè)的相關(guān)權(quán)益提供了有力支持。
(2)強(qiáng)調(diào)過程透明:監(jiān)督落實信息披露的義務(wù)
信息披露義務(wù)所帶來的使用透明度是實現(xiàn)雙方交易互信和版權(quán)所有者能夠維權(quán)的必要前提。只有履行信息披露義務(wù)、保持足夠的透明度,生成式人工智能使用者、版權(quán)所有者和相關(guān)監(jiān)管機(jī)構(gòu)才能判斷人工智能的可靠程度,確保生成式人工智能所提供的服務(wù)不會損害社會的利益[24]。
美國出版業(yè)強(qiáng)調(diào),AI科技公司在其產(chǎn)品和服務(wù)中使用人工智能時,必須履行信息披露義務(wù),確保所有用戶及相關(guān)利益方充分了解AI系統(tǒng)的運作方式及其影響。這一要求的核心目標(biāo)是保障公眾的知情權(quán),避免技術(shù)濫用,促進(jìn)出版行業(yè)的健康發(fā)展。美國新聞媒體聯(lián)盟(NMA)明確表示,出版商有權(quán)知道誰復(fù)制了其出版的內(nèi)容以及用于什么目的。生成式人工智能廠商應(yīng)對用戶透明,使用戶能夠明確辨識信息內(nèi)容的生成方式,即哪些文本段落是經(jīng)由AI自動生成的,并追溯至其原始的數(shù)據(jù)或信息源[25]。美國數(shù)字媒體許可協(xié)會(DMLA)認(rèn)為,“要確保所有訓(xùn)練內(nèi)容均通過合法途徑獲取,用于模型訓(xùn)練的素材必須具備較高透明度。具體而言,這些素材不僅要附有詳盡的可供隨時查閱的維護(hù)記錄,同時也要清晰標(biāo)識出模型訓(xùn)練過程中所使用的具體內(nèi)容。”[26]
對AI科技公司信息披露義務(wù)的監(jiān)管也成為美國出版業(yè)相關(guān)行業(yè)協(xié)會的關(guān)注焦點。美國新聞媒體聯(lián)盟(NMA)認(rèn)為,監(jiān)管機(jī)構(gòu)應(yīng)確保生成式人工智能產(chǎn)品的設(shè)計、部署和使用符合競爭法和原則,開發(fā)人員和部署人員應(yīng)盡最大努力確保生成式AI大模型不被用于反競爭目的[22]。美國出版商協(xié)會(AAP)的相關(guān)主張更為全面,其要求對AI在出版業(yè)的應(yīng)用進(jìn)行程序化管理,確保落實AI使用中的問責(zé)制以實現(xiàn)公平競爭,以及建立完善的侵權(quán)追溯和取證機(jī)制以確保有效識別和追溯AI生成的侵權(quán)內(nèi)容。同時,美國出版商協(xié)會(AAP)還對監(jiān)管主體提出,既要發(fā)揮企業(yè)在技術(shù)使用過程中自我糾察管理的能動性,又要發(fā)揮相關(guān)司法部門對AI規(guī)制的強(qiáng)制性力量,尋求建立包括知識產(chǎn)權(quán)、國家安全、隱私、消費者保護(hù)和人權(quán)等多種權(quán)益的前瞻性法律規(guī)則,保護(hù)相關(guān)者的權(quán)利不被侵犯[27]。
2.通過司法訴訟與商業(yè)合作維護(hù)AI訓(xùn)練語料的使用權(quán)益
除了表達(dá)對AI版權(quán)規(guī)制的訴求,在產(chǎn)業(yè)實踐中,美國出版企業(yè)還通過發(fā)起司法訴訟、商業(yè)合作等多種方式維護(hù)自身權(quán)益。
(1)提起司法訴訟維護(hù)權(quán)益
相比于立法和行政的“剛性”治理,司法以其參與性、協(xié)商性的“柔性”治理極大地緩解了社會利益沖突[28]。美國出版業(yè)應(yīng)對AI訓(xùn)練侵權(quán)行為的訴訟實踐在一定程度上體現(xiàn)了這一特點,司法在應(yīng)對美國出版業(yè)與AI科技公司的矛盾治理上扮演著關(guān)鍵角色。
傳統(tǒng)的出版業(yè)版權(quán)利益維護(hù)以“許可制度”為保障得以實現(xiàn),而AI大模型的出現(xiàn)打破了原有的版權(quán)許可模式,其訓(xùn)練所需的海量作品授權(quán)難題將使出版業(yè)面臨嚴(yán)重的市場收益損失。因此,出版業(yè)針對AI大模型的訴訟行為,實質(zhì)上是AI發(fā)展之下出版業(yè)和科技企業(yè)之間利益失衡所引發(fā)的對抗。
表1是近年來美國出版商訴訟AI科技公司的代表性案例匯總。從表1可知,美國出版商紛紛指控AI科技公司侵犯其版權(quán),尤其是通過抓取新聞文章、圖書內(nèi)容等受版權(quán)保護(hù)的內(nèi)容來增強(qiáng)AI產(chǎn)品的功能,而這些內(nèi)容應(yīng)由創(chuàng)作者或出版商授權(quán)使用。出版商在訴訟中強(qiáng)調(diào),AI科技公司在使用這些內(nèi)容時并沒有支付許可費用,也未提供相關(guān)補(bǔ)償,導(dǎo)致其未能從中獲得應(yīng)有的經(jīng)濟(jì)回報。這種做法不僅影響了出版商的權(quán)益,也使得AI科技公司以不公平的方式獲取競爭優(yōu)勢,需要司法介入以維護(hù)版權(quán)秩序。
表1中的部分案件還涉及AI生成內(nèi)容的誤用或錯誤歸屬問題,尤其是當(dāng)生成內(nèi)容包含虛假或錯誤信息時,出版商的品牌信譽(yù)可能因此遭受損害。因此,出版商通過訴訟手段力求維護(hù)其知識產(chǎn)權(quán)、經(jīng)濟(jì)利益及品牌聲譽(yù),以確保創(chuàng)作者的作品不被濫用,并尋求獲得合理的補(bǔ)償。通過法律途徑,出版業(yè)不僅回?fù)芰耸Ш獾陌鏅?quán)利益天平,而且推動了對AI技術(shù)合理使用的法律規(guī)范和倫理界限進(jìn)行界定的進(jìn)程。
(2)通過商業(yè)合作實現(xiàn)效益共享
在提起訴訟的同時,美國出版商也積極與以O(shè)penAI、Microsoft等為代表的頭部企業(yè)開展商業(yè)合作,以維護(hù)自身權(quán)益。合作的達(dá)成并非單方的“一廂情愿”,在某種程度上也體現(xiàn)了雙方的意愿。美國作家協(xié)會向版權(quán)局提交的意見表示,希望建立一個私人的、高效的、具有成本效益的集體許可制度,為AI科技公司提供適當(dāng)?shù)臋?quán)利,以換取公平的補(bǔ)償[29]??梢?,出版商與AI科技公司的矛盾具有協(xié)調(diào)的可能性,行業(yè)之間的磋商和合作將發(fā)揮關(guān)鍵作用。通過合作,出版商可以確保其作品在被AI使用時得到適當(dāng)?shù)氖跈?quán)和補(bǔ)償,AI科技公司也能夠通過合作獲得合法的訓(xùn)練數(shù)據(jù),為其技術(shù)的持續(xù)發(fā)展提供必要的資源。
表2是近年來美國出版商與AI科技公司合作的代表性案例匯總。從表2不難發(fā)現(xiàn),商業(yè)合作模式不僅能夠在一定程度上解決版權(quán)爭議,還能為整個出版產(chǎn)業(yè)的發(fā)展提供創(chuàng)新的解決方案。美國出版商與AI科技公司之間的合作雖然源于當(dāng)前的矛盾和沖突,但在共同推動技術(shù)創(chuàng)新的同時,也可為雙方創(chuàng)造長遠(yuǎn)的互利共贏局面。隨著版權(quán)法律和技術(shù)的不斷進(jìn)步,出版業(yè)與AI產(chǎn)業(yè)將形成更加緊密的合作關(guān)系。
(3)發(fā)布退出AI訓(xùn)練使用選擇的版權(quán)聲明,減少灰色空間
除了采取司法訴訟進(jìn)行維權(quán),美國出版商還在新書和重印書籍中發(fā)表聲明,明確提出不允許其作品用于AI訓(xùn)練。如企鵝蘭登書屋(PRH)的版權(quán)聲明規(guī)定:“不得以任何方式使用或復(fù)制圖書的任何部分用以訓(xùn)練人工智能技術(shù)或系統(tǒng)”[30],并且明確此聲明包含所有新書和任何重印的舊版書。除此之外,企鵝蘭登書屋還明確表示將通過具體的執(zhí)行細(xì)則來實施這一決策,以確保其作品不會被用于未經(jīng)授權(quán)的AI訓(xùn)練。美國作者許可和集體管理協(xié)會(ALCS)首席執(zhí)行官Barbara Hayes就此表示:“主要出版商在其印刷材料中采用新措辭,明確禁止在人工智能培訓(xùn)中使用受版權(quán)保護(hù)的作品,這是保護(hù)知識產(chǎn)權(quán)的關(guān)鍵一步,希望越來越多的出版商能夠跟隨企鵝蘭登書屋的腳步,也希望科技公司能夠了解這一版權(quán)新標(biāo)準(zhǔn)?!保?1]
美國出版商更新針對AI訓(xùn)練的版權(quán)聲明,意味著出版行業(yè)可以采取一種更加自主和靈活的版權(quán)管理方式,避免因缺乏清晰規(guī)定而導(dǎo)致的版權(quán)侵權(quán)風(fēng)險。這種在版權(quán)聲明中“選擇退出”AI訓(xùn)練使用的表達(dá),能夠有效減少AI訓(xùn)練語料使用中的版權(quán)灰色空間。通過退出AI訓(xùn)練使用的版權(quán)聲明,美國出版商能夠在技術(shù)變革的浪潮中主動保護(hù)自己的權(quán)益,避免陷入被動的法律糾紛。同時,這種自我約束的版權(quán)聲明作為一種司法管控之外的補(bǔ)充措施,避免了過度依賴立法和司法裁決的風(fēng)險,有助于出版商在技術(shù)發(fā)展的同時保護(hù)出版業(yè)的內(nèi)容生產(chǎn)版權(quán)生態(tài)。
三、美國出版業(yè)應(yīng)對AI訓(xùn)練侵權(quán)對我國的啟示
美國作為人工智能技術(shù)和出版產(chǎn)業(yè)領(lǐng)先的國家,其出版業(yè)在應(yīng)對AI訓(xùn)練侵權(quán)問題時所采取的策略和方法,對我國出版業(yè)應(yīng)對相應(yīng)問題有著一定啟示。
1.積極推進(jìn)AI訓(xùn)練侵權(quán)的司法規(guī)制環(huán)境建設(shè)
(1)堅持“先授權(quán)后使用”原則以杜絕出版語料的野蠻濫用
針對未經(jīng)授權(quán)使用出版語料的行為,“先授權(quán)后使用”原則的核心在于要求AI科技公司在使用任何版權(quán)作品之前必須合法地獲取授權(quán),不能通過技術(shù)手段或其他不正當(dāng)手段擅自獲取出版語料。踐行AI訓(xùn)練出版語料“先授權(quán)后使用”原則的途徑,包括但不限于基于訂閱行為獲取、基于許可協(xié)議獲取、基于作品在線免費提供獲?。?quán)利人作出保留聲明的除外)和基于國家發(fā)展需要或社會公共利益需要的獲取等[32]。
一方面,很多出版物、學(xué)術(shù)論文或新聞都已經(jīng)通過訂閱平臺提供給用戶,AI科技公司若想使用這些內(nèi)容,就應(yīng)當(dāng)通過合法的訂閱途徑獲取授權(quán)。特別是當(dāng)版權(quán)方明確要通過許可協(xié)議提供數(shù)據(jù)時,AI科技公司必須遵循約定的條款,在獲取數(shù)據(jù)的同時支付相應(yīng)的版權(quán)費用。
另一方面,若某些作品是基于在線免費提供的形式發(fā)布,AI科技公司也應(yīng)當(dāng)確保版權(quán)方?jīng)]有對其內(nèi)容作出保留聲明,確保自己所使用的作品是可以合法使用的。此外,雖然某些出版語料在促進(jìn)社會公共利益方面具有重要價值或處于公有領(lǐng)域,但AI科技公司在獲得這些出版語料時,也要兼顧版權(quán)方的利益與社會公共利益,在AI訓(xùn)練使用以及內(nèi)容生成時堅持遵守相應(yīng)的版權(quán)規(guī)定。
“先授權(quán)后使用”原則的意義,在于明確出版業(yè)獲取版權(quán)資源使用收益的法律地位,從而促使AI科技公司將其利用版權(quán)內(nèi)容而獲得的廣告收益進(jìn)行合理分配,保護(hù)出版商的權(quán)益。除此之外,考慮到AI科技公司獲取海量內(nèi)容版權(quán)許可的實際困難,也可以允許其在獲取授權(quán)成本較高時適用“通知屏蔽規(guī)則”,采用版權(quán)過濾技術(shù)以避免承擔(dān)侵權(quán)責(zé)任,促進(jìn)各方利益平衡。[33]。
(2)完善“選擇—退出”機(jī)制以實現(xiàn)技術(shù)變革下的版權(quán)利益均衡
為避免版權(quán)主體的利益受到過分侵害,應(yīng)完善作品“選擇—退出”機(jī)制,適當(dāng)提高出版業(yè)版權(quán)主體的議價能力。“選擇—退出”機(jī)制介于數(shù)據(jù)訓(xùn)練使用作品的授權(quán)模式和傳統(tǒng)合理使用模式二者之間,是人工智能時代加強(qiáng)版權(quán)所有者權(quán)利保護(hù)與促進(jìn)產(chǎn)業(yè)發(fā)展二者之間相互妥協(xié)的方案。引入作品“選擇—退出”機(jī)制,意味著允許權(quán)利人通過協(xié)議、聲明、單邊宣言等方式保留權(quán)利。換言之,版權(quán)所有者可以不允許基于文本與數(shù)據(jù)挖掘目的復(fù)制、提取其作品內(nèi)容,以及將其內(nèi)容用于AI訓(xùn)練的行為[34]。
“選擇—退出”包含兩種形式。一是版權(quán)所有者在其作品公開發(fā)表之前,針對將其作品用于AI訓(xùn)練的行為作出聲明,拒絕將其作品用于任何大模型的訓(xùn)練。此時,作為開發(fā)主體的AI科技公司應(yīng)當(dāng)尊重版權(quán)主體的聲明,主動回避該版權(quán)作品。二是版權(quán)所有者收到通知或在AI科技公司所搭建的平臺及版權(quán)作品檢索渠道中了解到其版權(quán)作品被使用時,可以在一定時間內(nèi)享有保留、刪除或屏蔽其作品的權(quán)利。版權(quán)所有者未在規(guī)定期限內(nèi)作出明確拒絕的,可以默認(rèn)其允許相關(guān)版權(quán)作品用于AI大模型的訓(xùn)練;版權(quán)所有者在規(guī)定期限內(nèi)作出明確拒絕的,開發(fā)主體應(yīng)當(dāng)及時刪除或屏蔽侵權(quán)內(nèi)容。
這一機(jī)制不僅保障了版權(quán)所有者的權(quán)利,從某種程度上也促進(jìn)了AI技術(shù)的發(fā)展創(chuàng)新。因為除非版權(quán)所有者主動行使“選擇—退出”權(quán),否則作品原則上可被用于數(shù)據(jù)訓(xùn)練而無須個別授權(quán),由此降低了版權(quán)許可的高昂成本,緩解了因獲得許可困難而導(dǎo)致的訓(xùn)練語料匱乏,以及因此加劇的算法偏見等問題。
(3)明確AI訓(xùn)練語料披露責(zé)任以實現(xiàn)版權(quán)知情和司法追溯
“對作者精神權(quán)利的承認(rèn)和尊重,是證立人工智能訓(xùn)練數(shù)據(jù)版權(quán)信息披露義務(wù)的一個重要法理邏輯。”[35]因此,要求模型提供者公開其訓(xùn)練內(nèi)容以提升數(shù)據(jù)訓(xùn)練過程的透明度尤為重要,即AI科技公司必須披露其訓(xùn)練數(shù)據(jù)的版權(quán)信息。強(qiáng)調(diào)信息披露責(zé)任,不僅能夠有效保障權(quán)利人對其作品使用情況的知情權(quán),也是權(quán)利人有效行使“選擇—退出”權(quán)的重要前提。換言之,只有權(quán)利人充分了解其作品被用于AI訓(xùn)練后,才能作出是否允許其作品被用于此類用途的決定。
此外,訓(xùn)練內(nèi)容的公開披露還有助于簡化輸出端可能出現(xiàn)的侵權(quán)判斷過程。當(dāng)監(jiān)督機(jī)構(gòu)或權(quán)利人需要判斷某一作品是否被非法地用于生成實質(zhì)性相似的表達(dá)時,公開的訓(xùn)練內(nèi)容將成為重要的參考依據(jù),由此大大降低了侵權(quán)判定的難度和復(fù)雜性。因此,模型提供者履行披露訓(xùn)練內(nèi)容的義務(wù),不僅是保障透明度和知情權(quán)的體現(xiàn),也是維護(hù)創(chuàng)作生態(tài)健康、促進(jìn)技術(shù)創(chuàng)新與版權(quán)保護(hù)和諧共生的關(guān)鍵一環(huán)。
值得注意的是,強(qiáng)調(diào)訓(xùn)練語料披露責(zé)任,并不意味著一刀切式地要求AI科技公司履行語料的披露義務(wù),否則要么失之于寬,要么失之于嚴(yán)。唯有寬嚴(yán)并濟(jì)地履行訓(xùn)練語料披露義務(wù),才能實現(xiàn)在保護(hù)出版業(yè)主體權(quán)利的同時促進(jìn)科技創(chuàng)新。因此,可以適當(dāng)放寬內(nèi)容披露標(biāo)準(zhǔn),即不要求提供詳細(xì)清單,僅要求綜合性的概要,允許敘述性披露。對于通過互聯(lián)網(wǎng)獲取的數(shù)據(jù)信息,可以對作品合法來源進(jìn)行限定性解釋,或要求使用者采取注明出處等措施。
2.提升出版企業(yè)應(yīng)對AI訓(xùn)練侵權(quán)的維權(quán)能力
面對AI技術(shù)的沖擊,我國出版企業(yè)必須在維權(quán)策略、維權(quán)機(jī)制等方面積極創(chuàng)新,以適應(yīng)這一新事物帶來的新要求。
(1)完善針對AI訓(xùn)練侵權(quán)的版權(quán)聲明與版權(quán)合同
為了更好地保護(hù)版權(quán),出版企業(yè)應(yīng)在版權(quán)聲明和合同條款中進(jìn)行關(guān)鍵性的修訂,確保其對出版內(nèi)容的占有權(quán),維護(hù)版權(quán)所有者和消費者的利益。
首先,出版企業(yè)應(yīng)在版權(quán)聲明中明確規(guī)定其作品能否被用于AI大模型的訓(xùn)練。出版企業(yè)可以在版權(quán)聲明中出具補(bǔ)充條款,對在AI訓(xùn)練中的使用范圍和條件進(jìn)行限制,包括允許用于訓(xùn)練數(shù)據(jù)的類別、訓(xùn)練的目的、使用的時長等。針對非表達(dá)型AI、大眾表達(dá)型AI、個人表達(dá)型AI等大模型訓(xùn)練,出版企業(yè)可以從自身企業(yè)利益的角度出發(fā)分梯度予以授權(quán)。此外,出版企業(yè)授權(quán)其作品用于AI訓(xùn)練時,還可以加強(qiáng)對訓(xùn)練數(shù)據(jù)的透明度要求。這意味著,出版企業(yè)可要求在使用其作品進(jìn)行AI訓(xùn)練時,必須披露訓(xùn)練數(shù)據(jù)的來源、范圍、使用方式以及處理過程。這不僅能夠保障作品的使用不侵犯版權(quán),也能幫助創(chuàng)作者了解其作品在AI訓(xùn)練中的實際應(yīng)用,避免其作品被誤用或濫用,維護(hù)版權(quán)所有者的權(quán)益。
其次,出版企業(yè)還應(yīng)針對AI訓(xùn)練的具體問題,完善與作者簽訂的合同條款。由于出版企業(yè)與作者簽訂的舊有合同往往不涉及AI版權(quán)內(nèi)容,也未明確作品在AI訓(xùn)練中的授權(quán)和賠償機(jī)制。因此,出版企業(yè)需要及時修訂作者授權(quán)合同,尤其是重點補(bǔ)充涉及AI生成內(nèi)容、模型使用以及數(shù)據(jù)處理等方面的條款,確保版權(quán)歸屬清晰公正。具體而言,出版企業(yè)應(yīng)明確規(guī)定在AI訓(xùn)練過程中,如果AI生成的內(nèi)容與原作品高度相似,或能夠追溯到原作品,出版企業(yè)是否應(yīng)與作者協(xié)商進(jìn)行收益分配,且如果AI生成內(nèi)容侵犯了第三方的版權(quán),版權(quán)責(zé)任將由哪一方承擔(dān),等等。這種明確的合同條款有助于避免因版權(quán)糾紛而產(chǎn)生的法律風(fēng)險,確保雙方在技術(shù)變革中共同獲益。
(2)提升針對AI訓(xùn)練語料侵權(quán)的技術(shù)對抗能力
面對科技公司對AI訓(xùn)練語料數(shù)據(jù)的瘋狂掠奪,出版企業(yè)要不斷提升技術(shù)對抗能力,創(chuàng)新和優(yōu)化反抓取技術(shù)、取證技術(shù)以及侵權(quán)監(jiān)控系統(tǒng)。其中,反抓取技術(shù)被視為針對AI訓(xùn)練侵權(quán)的首要防線。出版企業(yè)可在其網(wǎng)站和數(shù)字平臺上增加機(jī)器人協(xié)議(robots.txt)文件的應(yīng)用,限制AI訓(xùn)練系統(tǒng)或爬蟲對受版權(quán)保護(hù)的作品進(jìn)行自動抓取;通過監(jiān)控和分析流量模式來識別異常抓取行為,避免作品被非法用于AI訓(xùn)練。取證技術(shù)對于AI訓(xùn)練中的版權(quán)侵權(quán)行為追溯與維權(quán)也至關(guān)重要。出版企業(yè)可以使用數(shù)字水印或數(shù)字指紋標(biāo)記技術(shù)將版權(quán)信息嵌入文本、圖像或音頻內(nèi)容,為后續(xù)的侵權(quán)維權(quán)提供證據(jù),提升維權(quán)的效率和成功率。同時,出版企業(yè)還應(yīng)加強(qiáng)與技術(shù)提供商、專業(yè)法律團(tuán)隊的合作,建立完善的侵權(quán)監(jiān)測系統(tǒng),對AI訓(xùn)練侵權(quán)問題進(jìn)行常態(tài)性監(jiān)測。
技術(shù)對抗能力的提升不僅能夠保護(hù)出版企業(yè)的合法權(quán)益,還能推動出版行業(yè)版權(quán)保護(hù)標(biāo)準(zhǔn)的不斷提升,通過不斷創(chuàng)新和優(yōu)化反抓取技術(shù)、取證技術(shù)以及侵權(quán)監(jiān)控系統(tǒng),為版權(quán)持有者提供更加可靠的保障,讓出版企業(yè)在面對AI訓(xùn)練帶來的復(fù)雜版權(quán)問題時,能游刃有余地維護(hù)自己和創(chuàng)作者的利益,并確保在技術(shù)發(fā)展的洪流中掌握法律和經(jīng)濟(jì)的主動權(quán)。
(3)建立針對AI訓(xùn)練侵權(quán)的系統(tǒng)維權(quán)機(jī)制
由于傳統(tǒng)版權(quán)管理體系在面對AI快速發(fā)展時的適應(yīng)性較弱,出版企業(yè)必須通過創(chuàng)新和自我完善;建立一套既能快速反應(yīng)又能系統(tǒng)化管理的維權(quán)框架機(jī)制。圖1是出版企業(yè)應(yīng)對AI訓(xùn)練侵權(quán)維權(quán)機(jī)制的初步設(shè)想。
針對AI訓(xùn)練侵權(quán)行為,出版企業(yè)可以憑借自身掌握的技術(shù),監(jiān)控AI訓(xùn)練數(shù)據(jù)的使用情況,通過數(shù)字指紋、水印識別等技術(shù)手段實時監(jiān)測侵權(quán)行為。一旦發(fā)現(xiàn)侵權(quán),出版企業(yè)即可借助區(qū)塊鏈和時間戳技術(shù)進(jìn)行證據(jù)保全,記錄侵權(quán)細(xì)節(jié)以確保法律效力,同時向侵權(quán)方發(fā)送通知,要求其立即停止使用并刪除相關(guān)數(shù)據(jù)。如果侵權(quán)方積極配合,雙方可以開展協(xié)商談判,通過授權(quán)或補(bǔ)償協(xié)議建立合作關(guān)系,實現(xiàn)合作共贏;如果侵權(quán)方拒絕配合,出版企業(yè)可啟動法律訴訟程序,通過法庭舉證維護(hù)自身權(quán)益,爭取獲得相應(yīng)補(bǔ)償。行業(yè)聯(lián)合維權(quán)在這一過程中能發(fā)揮重要作用,出版企業(yè)可以通過共享侵權(quán)線索和分?jǐn)偩S權(quán)成本形成行業(yè)合力,降低單個企業(yè)的維權(quán)難度和成本。
系統(tǒng)維權(quán)機(jī)制的建立為出版企業(yè)提供了強(qiáng)有力的法律和技術(shù)保障,使出版企業(yè)可以有效應(yīng)對AI訓(xùn)練中的侵權(quán)行為。標(biāo)準(zhǔn)化的維權(quán)流程和行業(yè)聯(lián)合維權(quán),不僅提高了維權(quán)的效率和成功率,還降低了單個企業(yè)的維權(quán)成本,使得中小型出版企業(yè)也能夠參與維權(quán)行動,形成行業(yè)合力,推動行業(yè)制定統(tǒng)一的授權(quán)標(biāo)準(zhǔn)和補(bǔ)償機(jī)制。通過技術(shù)手段與法律手段的結(jié)合,出版企業(yè)能夠在AI時代更好地保護(hù)自身權(quán)益,推動行業(yè)的可持續(xù)發(fā)展,同時為其他內(nèi)容創(chuàng)作行業(yè)提供可借鑒的維權(quán)模式。
四、結(jié)語
在AI訓(xùn)練侵權(quán)的問題上,所有國家都面臨同樣的挑戰(zhàn)。美國作為AI技術(shù)革新和出版產(chǎn)業(yè)發(fā)展領(lǐng)先的國家,其出版商在應(yīng)對AI訓(xùn)練侵權(quán)問題時所采取的策略和方法,為其他國家提供了有價值的經(jīng)驗和啟示。盡管中美在AI技術(shù)發(fā)展階段和司法環(huán)境方面存在顯著差異,但在出版內(nèi)容方與平臺使用方之間的博弈上,雙方面臨的根本問題具有共通之處,即如何有效規(guī)制AI技術(shù)的使用,以保障創(chuàng)作者和版權(quán)持有者的合法權(quán)益。因此,我國出版業(yè)在應(yīng)對AI訓(xùn)練侵權(quán)問題時,可以參考美國在AI訓(xùn)練合法性爭議方面的相關(guān)經(jīng)驗,明確著作權(quán)人與技術(shù)開發(fā)者之間的利益分歧,積極推進(jìn)AI訓(xùn)練侵權(quán)的司法規(guī)制環(huán)境建設(shè),同時快速提升出版企業(yè)應(yīng)對AI訓(xùn)練侵權(quán)的維權(quán)能力,促進(jìn)生成式人工智能數(shù)據(jù)獲取與訓(xùn)練的規(guī)范化發(fā)展,營造適應(yīng)AI技術(shù)革新與出版產(chǎn)業(yè)發(fā)展的良好版權(quán)生態(tài)環(huán)境。
|參考文獻(xiàn)|
[1] 熊琦,張文窈. 人工智能生成內(nèi)容著作權(quán)規(guī)制的全球趨向與本土路徑[J]. 知識產(chǎn)權(quán),2024(11):59-76.
[2] 蔡元臻. 機(jī)器學(xué)習(xí)著作權(quán)法定許可的適用基礎(chǔ)與規(guī)則構(gòu)建[J]. 知識產(chǎn)權(quán),2024(11):77-93.
[3] STATISTA. Artificial Intelligence-United States[EB/OL].(2024-11-03)[2025-01-23]. https://www.statista.com/outlook/tmo/artificial-intelligence/united-states.
[4] STANFORD UNIVERSITY. The AI index report Measuring trends in AI[EB/OL]. [2024-11-07]. https://aiindex.stanford.edu/report/.
[5] 史鳳林,張志遠(yuǎn). 論人工智能的公法規(guī)制:美歐模式與中國路徑[J]. 理論月刊,2023(8):127-139.
[6]JONES, N. The AI revolution is running out of data. What can researchers do?[J]. Nature,2024(8042):290-292.
[7]SEMIANALYSIS. GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE//Demystifying GPT-4: The engineering tradeoffs that led OpenAI to their architecture[EB/OL]. [2025-01-23]. https://semianalysis.com/2023/07/10/gpt-4-architecture-infrastructure/#.
[8]MILES Klee. Zuckerberg Appeared to Know Meta Trained AI on Pirated Library[EB/OL]. (2025-01-14)[2025-01-23]. https://mena.rollingstone.com/culture/zuckerberg-appeared-to-know-meta-trained-ai-on-pirated-library/.
[9]CONGRESS. H. R. 6881 - AI Foundation Model Transparency Act of 2023[EB/OL].(2024-12-25). https://www.congress.gov/bill/118th-congress/house-bill/6881/text.
[10]CONGRESS. S. 5379 – TRAIN Act[EB/OL]. (2024-11-21)[2024-12-23]. https://www.congress.gov/bill/118th-congress/senate-bill/5379/text.
[11]CONGRESS. H. R. 7913 –Generative AI Copyright Disclosure Act of 2024 [EB/OL]. [2025-02-06]. https://www.congress.gov/bill/118th-congress/house-bill/7913/text.
[12] 徐偉. 生成式人工智能服務(wù)提供者侵權(quán)歸責(zé)原則之辨[J]. 法制與社會發(fā)展,2024(3):190-204.
[13] 黃玉燁,楊依楠. 論生成式人工智能版權(quán)侵權(quán)“雙階”避風(fēng)港規(guī)則的構(gòu)建[J]. 知識產(chǎn)權(quán),2024(11):37-58.
[14]CAMPBELL v. Acuff-Rose Music, Inc. , 510 U. S. 569, 579 (1994) [EB/OL]. [2025-02-07]. https://supreme.justia.com/cases/federal/us/510/569/.
[15]NETANEL, NEIL WEINSTOCK. Making sense of fair use[J]. Lewisamp;Clark Law Review,2011(15):715-771.
[16]WILLIAMS amp; WILKINS Co. v. United States,420 U. S. 376(1975)[EB/OL]. [2025-02
-07]. https://supreme.justia.com/cases/federal/us/420/376/.
[17]AUTHORS GUILD v. Google, Inc. ,No. 13-4829-cv(2d Cir. Oct. 16,2015) [EB/OL]. [2025-02-07]. https://www.copyright.gov/fair-use/summaries/authorsguild-google-2dcir2015.pdf.
[18] 韓榮. 生成式人工智能作品利用的“合理使用+單純獲酬權(quán)”模式探析[J]. 出版廣角,2024(19):75-80.
[19] 林秀芹. 人工智能時代著作權(quán)合理使用制度的重塑[J]. 法學(xué)研究,2021(6):170-185.
[20]EILEEN BRAMLET. Generative AI, Copyrighted Works, and the Quest for Ethical Training Practices[EB/OL]. [2025-01-25]. https://copyrightalliance.org/generative-ai-ethical-training-practices/.
[21]AAP. Publishers Submit Reply Comments to Copyright Office in Artificial Intelligence Proceeding[EB/OL]. [2025-01-24]. https://publishers.org/news/publishers-submit-reply-comments-to-copyright-office-in-artificial-intelligence-proceeding/.
[22]STAFF. News/Media Alliance AI Principles[EB/OL]. [2025-01-25]. https://www.newsmediaalliance.org/ai-principles/.
[23]ASCAP. comments of the american society of composers, authors and publishers on artificial" intelligence and copyright[EB/OL]. [2025-01-24]. https://www.ascap.com/~/media/files/pdf/articles/2023/ascap-comments-to-us-copyright-office-on-generative-ai.pdf.
[24 VON ESCHENBACH, W. J. Transparency and the black box problem: Why we do not trust AI[J]. Philosophy amp; Technology,2021(4):1607-1622.
[25]STAFF. News/Media Alliance AI Principles[EB/OL]. [2025-01-25]. https://www.newsmediaalliance.org/ai-principles/.
[26]EILEEN BRAMLET. Generative AI, Copyrighted Works, and the Quest for Ethical Training Practices[EB/OL]. [2025-01-25]. https://copyrightalliance.org/generative-ai-ethical-training-practices/.
[27]AAP. Nobel Laureate Maria Ressa Headlines AAP’s Annual Meeting[EB/OL]. [2025-01-28]. https://publishers.org/news/nobel-laureate-maria-ressa-headlines-aaps-annual-meeting/.
[28] 肖啟賢. 大語言模型發(fā)展的版權(quán)掣肘及其治理:以美國版權(quán)集體訴訟的實踐為視角[J]. 電子知識產(chǎn)權(quán),2024(9):74-83.
[29] The Authors Guild. Comments of the Authors Guild Artificial Intelligence and Copyright[EB/OL]. [2025-01-26]. https://authorsguild.org/app/uploads/2023/10/Authors-Guild-Comments-AI-and-Copyright-October-30-2023.pdf.
[30]BELEN EDWARDS. Penguin Random House copyright pages will now forbid AI training[EB/OL]. [2025-01-27]. https://mashable.com/article/penguin-random-house-ai-protections-copyright-page.
[31]MUHAMMAD ZULHSN. PRH takes a stand: Copyright pages updated to ban AI training[EB/OL]. [2025-01-27]. https://techhq.com/2024/10/prh-moves-to-restrict-ai-training-with-new-copyright-statement/.
[32] 關(guān)春媛. 生成式人工智能訓(xùn)練版權(quán)合理使用探究:國際趨勢、本土發(fā)展與規(guī)則構(gòu)建[J]. 出版發(fā)行研究,2024(12):91-97.
[33] 孫靖洲. 人工智能訓(xùn)練的版權(quán)困境及其出路:模塊化許可機(jī)制探析[J]. 知識產(chǎn)權(quán),2024(11):94-111.
[34] 司曉,曹建峰. 歐盟版權(quán)法改革中的大數(shù)據(jù)與人工智能問題研究[J]. 西北工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2019(3):95-102.
[35] 李安. 人工智能訓(xùn)練數(shù)據(jù)的版權(quán)信息披露:理論基礎(chǔ)與制度安排[J]. 比較法研究,2024(5):136-152.