摘要:生成式人工智能大語(yǔ)言模型的訓(xùn)練和應(yīng)用在美國(guó)引起大規(guī)模版權(quán)集體訴訟,版權(quán)問題成為大語(yǔ)言模型發(fā)展的首要障礙。在風(fēng)險(xiǎn)類型上,大語(yǔ)言模型版權(quán)集體訴訟引發(fā)了伴生性的法律風(fēng)險(xiǎn)、經(jīng)濟(jì)風(fēng)險(xiǎn)以及創(chuàng)新風(fēng)險(xiǎn)。以公開聽證凝聚社會(huì)共識(shí),以能動(dòng)司法緩沖版權(quán)矛盾,以行業(yè)自治消弭版權(quán)風(fēng)險(xiǎn),是美國(guó)應(yīng)對(duì)大語(yǔ)言模型版權(quán)集體訴訟的三種重要策略,體現(xiàn)了創(chuàng)新優(yōu)先的治理思路。我國(guó)大語(yǔ)言模型正處于研發(fā)和應(yīng)用的關(guān)鍵階段,目前已面臨類似風(fēng)險(xiǎn)。美國(guó)經(jīng)驗(yàn)作為“前車之鑒”,對(duì)我國(guó)大語(yǔ)言模型版權(quán)治理具有重要的參照意義。我國(guó)的版權(quán)治理對(duì)策在宏觀層面應(yīng)當(dāng)堅(jiān)持“創(chuàng)新優(yōu)先”的價(jià)值導(dǎo)向,在中觀層面應(yīng)當(dāng)采取“多元協(xié)同”的治理模式,在微觀層面則應(yīng)當(dāng)引入“人工智能訓(xùn)練合理使用”類型。
關(guān)鍵詞:生成式人工智能;大語(yǔ)言模型;版權(quán)集體訴訟;美國(guó)經(jīng)驗(yàn)
一、引言
ChatGPT等生成式人工智能引發(fā)了新一輪知識(shí)革命,推動(dòng)知識(shí)生成由“智慧驅(qū)動(dòng)”向“數(shù)據(jù)驅(qū)動(dòng)”的邊界延展。1大語(yǔ)言模型是促成這一歷程的關(guān)鍵技術(shù),其以“大算力驅(qū)動(dòng)強(qiáng)算法處理大數(shù)據(jù)”2的方式學(xué)習(xí)現(xiàn)有知識(shí),從而獲得強(qiáng)大的自然語(yǔ)言處理能力,具備文本、圖片、音視頻以及代碼生成等功能。當(dāng)前,大語(yǔ)言模型已成為一種基礎(chǔ)設(shè)施,并以賦能一切行業(yè)的強(qiáng)勢(shì)表現(xiàn),展現(xiàn)出顯著的技術(shù)效用。然而,技術(shù)浪潮之下人類知識(shí)秩序也面臨著重構(gòu)的機(jī)遇和風(fēng)險(xiǎn),新舊秩序之間的協(xié)調(diào)成為現(xiàn)實(shí)而急迫的問題。3版權(quán)作為調(diào)整知識(shí)秩序的核心制度,首當(dāng)其沖成為新技術(shù)挑戰(zhàn)的領(lǐng)域。
近日,廣州互聯(lián)網(wǎng)法院審結(jié)了被媒體稱為“全球人工智能生成內(nèi)容(以下簡(jiǎn)稱AIGC)平臺(tái)侵權(quán)第一案”的奧特曼圖片版權(quán)糾紛。4該案原告為奧特曼系列作品的版權(quán)獨(dú)占授權(quán)人,被告則是提供人工智能圖片生成服務(wù)的公司,原告發(fā)現(xiàn)當(dāng)在被告經(jīng)營(yíng)的網(wǎng)站中輸入生成奧特曼圖片的相關(guān)指令時(shí),該網(wǎng)站所生成的圖片與原告享有版權(quán)的奧特曼圖片具有實(shí)質(zhì)性相似。法院最終判決被告侵犯了原作品版權(quán)人的復(fù)制權(quán)和改編權(quán)。與此同時(shí),小紅書旗下的人工智能繪畫產(chǎn)品Trik所生成的圖片因與平臺(tái)用戶的原創(chuàng)作品高度相似,而被多位創(chuàng)作者提起訴訟。5自大語(yǔ)言模型面世以來,美國(guó)大規(guī)模版權(quán)集體訴訟不斷發(fā)生,這些訴訟一致指向大語(yǔ)言模型訓(xùn)練和生成過程中對(duì)版權(quán)作品的擅自復(fù)制和利用。版權(quán)人和人工智能企業(yè)之間的紛爭(zhēng)愈演愈烈,版權(quán)風(fēng)險(xiǎn)成為大語(yǔ)言模型發(fā)展的首要障礙。我國(guó)大語(yǔ)言模型的研發(fā)和落地正處于關(guān)鍵時(shí)刻,以百度“文心一言”和阿里“通義千問”等為代表的大語(yǔ)言模型不斷涌現(xiàn),但總體而言與美國(guó)尚存在技術(shù)差距。美國(guó)大語(yǔ)言模型版權(quán)集體訴訟的困境具有重要的警示意義。我國(guó)版權(quán)制度如何因應(yīng)未來可能發(fā)生的類似糾紛,協(xié)調(diào)技術(shù)發(fā)展和版權(quán)保護(hù)的沖突,成為亟需回答的難題。美國(guó)經(jīng)驗(yàn)作為“他山之石”,可以為我國(guó)提供參照。
二、現(xiàn)實(shí)表征:大語(yǔ)言模型下版權(quán)集體訴訟的發(fā)生
集體訴訟(Class Action)是美國(guó)司法領(lǐng)域的一項(xiàng)重要制度,是指由一個(gè)或數(shù)個(gè)代表人為了集體全部成員的利益而代表集體成員提起的訴訟。6通過集體訴訟解決糾紛需要具備“代表性”和“典型性”兩項(xiàng)條件。7所謂“代表性”是指訴訟人數(shù)眾多,單獨(dú)提起訴訟不具有現(xiàn)實(shí)性,而集體代表人能夠較好代表集體成員的利益,有能力提起和參與訴訟?!暗湫托浴眲t指集體訴訟的請(qǐng)求是集體成員的典型主張,即使單獨(dú)提起訴訟也會(huì)提出類似請(qǐng)求。在集體訴訟程序中,如果集體成員未明確表示退出,則視為默認(rèn)其集體成員身份,訴訟的結(jié)果不僅對(duì)參與訴訟的代表人有效,也約束其他被代表的集體成員。通過分擔(dān)訴訟成本,共享訴訟利益的制度性設(shè)計(jì),集體訴訟最大程度發(fā)揮了規(guī)模效應(yīng),因而成為解決群體性利益糾紛的重要手段。自2022年以來,各類大語(yǔ)言模型紛紛發(fā)布并投入應(yīng)用,大規(guī)模版權(quán)抗議和訴訟亦紛至沓來。集體訴訟成為版權(quán)人解決大語(yǔ)言模型版權(quán)糾紛的重要手段。近一年時(shí)間里,美國(guó)境內(nèi)版權(quán)人對(duì)大語(yǔ)言模型開發(fā)者等提起了近10起版權(quán)集體訴訟,引起全球高度關(guān)注。從所代表的利益團(tuán)體來看,可以分為以下三類:
(一)代碼開發(fā)者代表的集體訴訟
2022年11月3日,兩名匿名代碼開發(fā)者在美國(guó)加州北區(qū)地方法院對(duì)GitHub、微軟及其人工智能技術(shù)合作伙伴OpenAI提起集體訴訟。8 GitHub是全球最大的開源代碼托管平臺(tái),代碼開發(fā)者可通過“通用公共許可證”(以下簡(jiǎn)稱GPL)的方式將其軟件作品在平臺(tái)上發(fā)布?;贕PL發(fā)布的軟件代碼允許他人學(xué)習(xí)、復(fù)制、修改和傳播且不收取許可費(fèi),從而鼓勵(lì)衍生軟件作品的開發(fā)。但GPL也具有一定的條件,當(dāng)復(fù)制或傳播該軟件時(shí)必須附載有關(guān)該軟件的某些信息:①在每份副本上顯著和適當(dāng)?shù)貥?biāo)注版權(quán)聲明和免責(zé)聲明;②完整保留所有涉及本GPL協(xié)議和無擔(dān)保聲明的通知;③向任何其他接受者提供本GPL協(xié)議的副本。GPL模式是一種介于嚴(yán)格版權(quán)保護(hù)和自由使用之間的折衷方案,旨在推進(jìn)軟件代碼的開源與協(xié)作。使用者違背GPL的許可條件進(jìn)行使用則不僅違反合同,也面臨侵犯版權(quán)的風(fēng)險(xiǎn)。9此外,還存在其他類型的許可證如MIT許可證和Apache許可證等,但均具有相似的功能。微軟于2018年收購(gòu)了GitHub,其后GitHub和OpenAI于2021年推出了人工智能編程模型Copilot以及Codex。Copilot由Codex提供支持,可以根據(jù)用戶輸入的文本提示,直接在程序員的代碼編輯器中生成和推薦代碼行。該起訴訟的原告是根據(jù)GPL等協(xié)議在GitHub上發(fā)布軟件作品的作者,其代表所有在美國(guó)具有相同情況的成員提起集體訴訟。起訴的主要理由是Copilot和Codex的訓(xùn)練使用了大量來自GitHub上公開可訪問的數(shù)據(jù),并將其中的代碼提供給用戶且未按照GPL規(guī)定的許可條件載明版權(quán)聲明等相關(guān)信息。該起訴訟被認(rèn)為是美國(guó)第一起挑戰(zhàn)人工智能系統(tǒng)訓(xùn)練和輸出的集體訴訟案件,涉及大規(guī)模的軟件盜版指控。
(二)視覺藝術(shù)家代表的集體訴訟
2023年1月13日,三名視覺藝術(shù)家在美國(guó)加州北區(qū)地方法院向AI繪圖軟件服務(wù)商Stability AI、Midjourney和DeviantArt提起集體訴訟。10被告分別是AI繪圖軟件Stable Diffusion、Midjourney和DreamUp的開發(fā)和運(yùn)營(yíng)企業(yè)。Stable Diffusion等大語(yǔ)言模型的訓(xùn)練需要龐大的圖片數(shù)據(jù)庫(kù)作為支持,原告認(rèn)為其訓(xùn)練數(shù)據(jù)庫(kù)大部分是通過網(wǎng)絡(luò)爬取而來,并且具有數(shù)十億張圖片的規(guī)模。當(dāng)用戶提示模型生成圖像時(shí),模型看似生成了新的圖像,但這些新圖像完全是基于訓(xùn)練圖像而來,是模型根據(jù)提示提取的特定圖像的衍生作品。因此,被告不僅擅自復(fù)制和使用了原告的作品進(jìn)行模型訓(xùn)練,而且模型生成的圖片與原告作品具有相似的風(fēng)格,對(duì)原告作品形成了市場(chǎng)替代。原告所代表的是版權(quán)作品被擅自用于模型訓(xùn)練的美國(guó)視覺藝術(shù)家群體。因此,起訴書在開篇即嚴(yán)厲指出AI圖像生成器是21世紀(jì)的拼貼工具,侵犯了數(shù)百萬藝術(shù)家的權(quán)利。實(shí)際上,早在2022年12月,AI繪圖軟件在全球爆火后就引起了藝術(shù)家群體的大規(guī)??棺h,原因是其訓(xùn)練圖片抓取自藝術(shù)家們的版權(quán)作品且未經(jīng)許可。與此同時(shí),全球知名圖片服務(wù)商Getty Images也在英國(guó)法院對(duì)Stability AI提起版權(quán)侵權(quán)訴訟,指控其在未經(jīng)許可的情況下使用Getty Images的圖像。美國(guó)該起版權(quán)集體訴訟引起了全球廣泛關(guān)注,其訴訟走向和結(jié)果將對(duì)后續(xù)案件的裁判產(chǎn)生深遠(yuǎn)的意義。
(三)文學(xué)作品作者代表的集體訴訟
自今年6月以來,美國(guó)作家群體提出了多起針對(duì)生成式人工智能大語(yǔ)言模型的版權(quán)集體訴訟。其中包括:美國(guó)喜劇演員兼作家Sarah Silverman等對(duì)Meta和OpenAI的訴訟;11暢銷書作家Paul Tremblay等12和普利策獎(jiǎng)得主Michael Chabon等13對(duì)OpenAI的訴訟;以及《紐約時(shí)報(bào)》記者等對(duì)谷歌的訴訟14。這些訴訟的被告均是美國(guó)目前實(shí)力最強(qiáng)的科技巨頭,Meta的“LLaMA”、OpenAI的“ChatGPT”以及谷歌的“Bard”代表了美國(guó)乃至全球大語(yǔ)言模型的最先進(jìn)水平。原告則是以美國(guó)知名作家為代表的文學(xué)作品作者陣營(yíng)。上述訴訟指出,雖然大語(yǔ)言模型是一個(gè)軟件程序,但它并不是由人類軟件工程師創(chuàng)造的,而是通過從不同來源復(fù)制大量文本并將這些文本輸入模型來“訓(xùn)練”的。訓(xùn)練數(shù)據(jù)庫(kù)則是通過網(wǎng)絡(luò)爬取或直接來自“Libgen”等盜版圖書網(wǎng)站,其中包含了原告的版權(quán)作品。在訓(xùn)練過程中,大語(yǔ)言模型復(fù)制訓(xùn)練數(shù)據(jù)庫(kù)中的每一段文本,并從中提取表達(dá)性信息。當(dāng)用戶輸入提示后,大語(yǔ)言模型不僅可以輸出原告作品的摘要或片段等內(nèi)容,還能夠?qū)υ孀髌愤M(jìn)行深入的分析。因此,原告認(rèn)為被告利用了其版權(quán)作品且擠占了其市場(chǎng)份額,構(gòu)成版權(quán)侵權(quán)。此外,被告還存在刪除原告作品名稱、書號(hào)、版權(quán)號(hào)、作者和版權(quán)人等版權(quán)管理信息的行為。書籍和報(bào)刊等文字作品是大語(yǔ)言模型訓(xùn)練的最重要原始材料,對(duì)于大語(yǔ)言模型的輸出質(zhì)量具有關(guān)鍵性的價(jià)值。因此,上述案件的裁判結(jié)果不僅牽涉大語(yǔ)言模型企業(yè)的利益,也將對(duì)相關(guān)技術(shù)的發(fā)展產(chǎn)生顯著影響。
三、影響機(jī)理:大語(yǔ)言模型下版權(quán)集體訴訟的風(fēng)險(xiǎn)
從社會(huì)系統(tǒng)理論的視角而言,科技創(chuàng)新實(shí)際上涉及三方社會(huì)子系統(tǒng)——科學(xué)系統(tǒng)、經(jīng)濟(jì)系統(tǒng)與法律系統(tǒng),系統(tǒng)之間相互刺激和互動(dòng)。15大語(yǔ)言模型版權(quán)集體訴訟實(shí)際上是顛覆性科技創(chuàng)新所引發(fā)的經(jīng)濟(jì)和法律風(fēng)險(xiǎn)的表征,并可能帶動(dòng)經(jīng)濟(jì)和法律系統(tǒng)的變革。在這一框架之下,大語(yǔ)言模型版權(quán)集體訴訟的風(fēng)險(xiǎn)可以細(xì)分為以下三個(gè)層面:
(一)法律風(fēng)險(xiǎn)
法律風(fēng)險(xiǎn)處于最表層,是版權(quán)集體訴訟本身所反映出的版權(quán)規(guī)則和制度困境。大語(yǔ)言模型所帶來的法律風(fēng)險(xiǎn)大部分屬于技術(shù)過程所伴生的結(jié)構(gòu)性風(fēng)險(xiǎn)。其與大語(yǔ)言模型具有共生性,無法通過技術(shù)的調(diào)整加以避免。從現(xiàn)實(shí)情況來看,大語(yǔ)言模型版權(quán)集體訴訟展現(xiàn)出的版權(quán)法律風(fēng)險(xiǎn)主要包括:
一是大語(yǔ)言模型訓(xùn)練過程中使用版權(quán)作品引發(fā)的版權(quán)侵權(quán)。無論使用何種方式訓(xùn)練模型,均需要建立訓(xùn)練數(shù)據(jù)集,重復(fù)訪問和讀取數(shù)據(jù),然后進(jìn)行分析以提取信息。16在這一過程中存在大量復(fù)制、改編、匯編等行為。二是大語(yǔ)言模型生成內(nèi)容中再現(xiàn)版權(quán)作品引發(fā)的版權(quán)侵權(quán)。研究表明,大語(yǔ)言模型存在“記憶現(xiàn)象”,即當(dāng)訓(xùn)練數(shù)據(jù)中某些特定的表達(dá)或作品出現(xiàn)的次數(shù)過多時(shí),導(dǎo)致大語(yǔ)言模型直接輸出該表達(dá)或作品的原始片段的現(xiàn)象。17在上述集體訴訟中,不少案件正是因?yàn)榇笳Z(yǔ)言模型的輸出結(jié)果復(fù)現(xiàn)了原作品或與原作品相似,引起版權(quán)人的不滿。三是刪除作者姓名、名稱以及作品版權(quán)管理信息等引發(fā)的版權(quán)侵權(quán)。作品信息以及版權(quán)管理信息不僅關(guān)系到作者署名權(quán)等人格利益,而且是確定版權(quán)歸屬的重要依據(jù)。大語(yǔ)言模型根據(jù)用戶的提示生成所需內(nèi)容,一般是直接使用版權(quán)作品,而沒有附隨相關(guān)信息。如果按照美國(guó)法院以往的觀點(diǎn),即“版權(quán)管理信息需要與作品一起傳播”,則大語(yǔ)言模型目前可能不符合《數(shù)字千年版權(quán)法》(以下簡(jiǎn)稱DMCA)的規(guī)定。18四是版權(quán)合理使用制度遭遇變革難題。美國(guó)學(xué)者指出,人工智能面臨“合理使用”危機(jī),因?yàn)闄C(jī)器學(xué)習(xí)模型可以創(chuàng)造出與人類版權(quán)表達(dá)大致相當(dāng)?shù)膬?nèi)容,因而無法滿足“非表達(dá)性使用”的要求。19大語(yǔ)言模型所輸出的內(nèi)容極有可能對(duì)人類作品造成市場(chǎng)替代,進(jìn)而影響原作品版權(quán)人的利益。
(二)經(jīng)濟(jì)風(fēng)險(xiǎn)
大語(yǔ)言模型版權(quán)集體訴訟實(shí)質(zhì)上是科技發(fā)展之下版權(quán)人和科技企業(yè)之間利益失衡所引發(fā)的集體對(duì)抗。在傳統(tǒng)上,版權(quán)利益以“許可制度”為保障而得以實(shí)現(xiàn)。任何傳播技術(shù)的應(yīng)用,須以對(duì)版權(quán)的尊重和許可收益的同步提高為前提。20大語(yǔ)言模型的出現(xiàn)打破了原有的版權(quán)許可模式,海量作品授權(quán)的難題將導(dǎo)致版權(quán)法面臨嚴(yán)重的市場(chǎng)失敗。動(dòng)輒代表數(shù)百萬版權(quán)人提起的版權(quán)集體訴訟則更能說明這一問題——版權(quán)許可模式難以滿足大語(yǔ)言模型海量作品使用的需求。以追求技術(shù)發(fā)展和傳播效率為目標(biāo),決定了大語(yǔ)言模型企業(yè)必須挑戰(zhàn)這一既有規(guī)則,才能獲得充分的發(fā)展空間。因此,目前大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)主要依賴于互聯(lián)網(wǎng)公開資源,其中包括了大部分的版權(quán)作品。
另一方面,隨著大語(yǔ)言模型性能的提升,更廉價(jià)、高效且優(yōu)質(zhì)的人工智能生成內(nèi)容逐漸成為用戶的首選,傳統(tǒng)作品的競(jìng)爭(zhēng)優(yōu)勢(shì)將蕩然無存。在多起訴訟中,原告均表示出對(duì)其技能和工作機(jī)會(huì)被AI替代的擔(dān)憂。世界經(jīng)濟(jì)論壇(World Economic Forum)于2023年9月發(fā)布的《未來就業(yè):大語(yǔ)言模型與就業(yè)》白皮書指出:“雖然大語(yǔ)言模型的應(yīng)用可能會(huì)顯著提高生產(chǎn)力和創(chuàng)造新的就業(yè)機(jī)會(huì),但也有可能取代現(xiàn)有的角色,加劇社會(huì)經(jīng)濟(jì)差距”21。大語(yǔ)言模型時(shí)代,AIGC成為內(nèi)容生產(chǎn)的新范式,一定程度上預(yù)示了專業(yè)生成內(nèi)容(以下簡(jiǎn)稱PGC)和用戶生成內(nèi)容(以下簡(jiǎn)稱UGC)的式微。無論是PGC還是UGC,其背后都是以作者為代表的版權(quán)人群體,他們首當(dāng)其沖成為內(nèi)容生產(chǎn)模式變革下最可能被取代的利益人群。
然而,AIGC需要以PGC和UGC的專業(yè)化和多元化內(nèi)容作為數(shù)據(jù)學(xué)習(xí)和模型優(yōu)化的資源。22這一方面顯示出新技術(shù)發(fā)展之下,經(jīng)濟(jì)利益分配的失衡;另一方面也體現(xiàn)了內(nèi)容生產(chǎn)模式演變的延續(xù)性和依賴性。因而版權(quán)人在大語(yǔ)言模型時(shí)代不得不抓緊“版權(quán)許可”這一救命稻草,并且奮力一搏。在版權(quán)集體訴訟中,原告的重要訴求之一便是要求被告使用版權(quán)作品必須經(jīng)過授權(quán),并支付費(fèi)用。版權(quán)產(chǎn)業(yè)是美國(guó)的支柱性產(chǎn)業(yè),美國(guó)從新千年以來版權(quán)產(chǎn)業(yè)就占GDP的11.07%以上,每年提供就業(yè)崗位超過1000萬個(gè),版權(quán)人群體的經(jīng)濟(jì)和社會(huì)影響不容小覷。23糾紛雙方的僵持局面對(duì)版權(quán)產(chǎn)業(yè)以及互聯(lián)網(wǎng)等新技術(shù)行業(yè)的發(fā)展存在諸多不利。
(三)創(chuàng)新風(fēng)險(xiǎn)
在大語(yǔ)言模型版權(quán)集體訴訟中,除了主張版權(quán)侵權(quán)損害賠償之外,另一普遍的訴求是“禁令救濟(jì)”(Injunctive Relief)。如在普利策獎(jiǎng)得主Michael Chabon等對(duì)OpenAI的訴訟中即提出:除非永久禁止被告的侵權(quán)行為,并停止繼續(xù)使用和分發(fā)(未經(jīng)許可利用原告版權(quán)材料訓(xùn)練的)GPT模型,否則不足以補(bǔ)救原告的損害。這一訴求存在三個(gè)方面的困難:一是除非整體上禁止該模型,否則不太可能在技術(shù)上將已訓(xùn)練完成的模型與原始數(shù)據(jù)剝離;二是即使技術(shù)上可以排除使用未經(jīng)許可的版權(quán)作品進(jìn)行訓(xùn)練,但可能影響模型的質(zhì)量,產(chǎn)生內(nèi)容偏見等現(xiàn)象24;三是版權(quán)許可的規(guī)模和成本過高,導(dǎo)致技術(shù)創(chuàng)新的“寒蟬效應(yīng)”。因此,版權(quán)法層面的嚴(yán)格限制可能會(huì)阻礙大語(yǔ)言模型這一關(guān)鍵技術(shù)的進(jìn)步甚至社會(huì)的整體發(fā)展。25從科技發(fā)展史來看,每一次新技術(shù)的出現(xiàn)必然伴隨著反對(duì)的聲浪。17—18世紀(jì)的工業(yè)革命進(jìn)程中,由于機(jī)器對(duì)工人的大規(guī)模替代,引發(fā)了工人反抗以及破壞機(jī)器的運(yùn)動(dòng)。這一浪潮的帶頭者是英國(guó)一位名叫盧德的工人,因此這些反對(duì)者被稱為“盧德派”。26在版權(quán)利益和工作機(jī)會(huì)急劇減少的情況下,版權(quán)人成為大語(yǔ)言模型時(shí)代的“盧德派”并扛起對(duì)抗技術(shù)創(chuàng)新的大旗,亦是可以預(yù)料的事情。已有美國(guó)科學(xué)家預(yù)測(cè),OpenAI可能會(huì)因?yàn)檫@些數(shù)據(jù)問題而被迫刪除部分模型。27正如美國(guó)版權(quán)學(xué)者所言,“我們正在經(jīng)歷一場(chǎng)生成式人工智能的技術(shù)革命,我們不知道它會(huì)采取什么形式,但有一件事是明確的——訴訟已經(jīng)開始蔓延了”28。
四、治理策略:大語(yǔ)言模型下版權(quán)集體訴訟的因應(yīng)
任何顛覆性技術(shù)創(chuàng)新的治理實(shí)際上均面臨著所謂的“科林格里奇困境”,即如果因?yàn)閾?dān)心不良后果而過早實(shí)施控制,那么技術(shù)很可能就難以爆發(fā),而如果控制過晚,已經(jīng)成為整個(gè)經(jīng)濟(jì)和社會(huì)結(jié)構(gòu)的一部分,就可能走向失控。29因此,技術(shù)治理的時(shí)間和手段對(duì)于一項(xiàng)新技術(shù)的發(fā)展和規(guī)制具有關(guān)鍵影響??傮w來看,美國(guó)應(yīng)對(duì)大語(yǔ)言模型版權(quán)集體訴訟的思路延續(xù)了拜登政府“保證創(chuàng)新優(yōu)先”30的一貫風(fēng)格。2023年7月13日,美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)首次對(duì)ChatGPT的開發(fā)商OpenAI開展風(fēng)險(xiǎn)調(diào)查。調(diào)查主要針對(duì)消費(fèi)者的隱私和數(shù)據(jù)安全問題,對(duì)ChatGPT訓(xùn)練數(shù)據(jù)的來源和訓(xùn)練方法等也有所涉及。此次調(diào)查也引發(fā)了反對(duì)的聲音,被認(rèn)為可能會(huì)帶來扼殺創(chuàng)新的后果。相比于其他領(lǐng)域,版權(quán)問題的處理對(duì)技術(shù)創(chuàng)新的影響更為深遠(yuǎn)。因此,美國(guó)政府在版權(quán)問題上并未急于介入,而是采取觀望的姿態(tài)。目前,美國(guó)版權(quán)行政部門、司法部門、學(xué)界以及相關(guān)行業(yè)等正處于一種磋商和共識(shí)建立的階段。其主要的應(yīng)對(duì)策略體現(xiàn)在以下幾個(gè)方面:
(一)版權(quán)聽證凝聚共識(shí)
從以往的經(jīng)驗(yàn)來看,以聽證會(huì)的形式確立人工智能公共政策的方向是美國(guó)政府的重要手段。2016年,美國(guó)政府圍繞“人工智能”主題共組織了五場(chǎng)研討會(huì),并以此為基礎(chǔ)形成了《國(guó)家人工智能研發(fā)戰(zhàn)略規(guī)劃》等重要文件。31面對(duì)大語(yǔ)言模型引發(fā)的大規(guī)模版權(quán)糾紛,美國(guó)版權(quán)局也采取了同樣的策略。2023年4月至5月期間,美國(guó)版權(quán)局接連舉行了四場(chǎng)關(guān)于“人工智能與版權(quán)”主題的公開聽證,包括“人工智能與文學(xué)作品”“人工智能與視覺藝術(shù)”“人工智能與視聽作品”以及“人工智能與音樂和錄音”四個(gè)分議題。參與聽證的代表來自律師行業(yè)、計(jì)算機(jī)與通信行業(yè)協(xié)會(huì)、版權(quán)聯(lián)盟、法學(xué)界、圖書館版權(quán)聯(lián)盟、作家協(xié)會(huì)、微軟公司代表等,研討的范圍涵蓋了版權(quán)侵權(quán)、合理使用、監(jiān)管策略、技術(shù)緩解措施等版權(quán)法律和政策問題。行政決策聽證的功能在于為理性論辯提供建制化空間以集結(jié)民意,制約行政決策。32美國(guó)版權(quán)局以公開聽證的形式為版權(quán)糾紛的各方利益代表提供了意見和情緒抒發(fā)的場(chǎng)所,同時(shí)又發(fā)揮了群策群力的作用,是一種“以商談求共識(shí)”的重要機(jī)制。在技術(shù)發(fā)展和應(yīng)用初期,行政權(quán)力保持謙抑和積累知識(shí)具有重要的意義,公開聽證則為此提供了保障。此外,公開聽證參與主體的代表性和廣泛性、議題設(shè)置的有效性、辯論和協(xié)商的深度性等也是版權(quán)聽證凝聚共識(shí)的重要基礎(chǔ)。
(二)能動(dòng)司法緩沖矛盾
“從現(xiàn)代民主國(guó)家治理的歷程來看,國(guó)家治理大致會(huì)經(jīng)歷從以立法為中心的治理到以行政為中心的治理的轉(zhuǎn)化,并最終轉(zhuǎn)向以司法為中心的社會(huì)治理?!?3美國(guó)的版權(quán)治理實(shí)踐在一定程度上體現(xiàn)了這一規(guī)律,司法在版權(quán)問題的治理上扮演著關(guān)鍵角色。近年來,由新技術(shù)引發(fā)大規(guī)模版權(quán)糾紛的最典型例子是“谷歌數(shù)字圖書館”系列案件。谷歌自2004年實(shí)施數(shù)字圖書館計(jì)劃,其與美國(guó)各大圖書館合作將館藏書籍進(jìn)行掃描和數(shù)字化,并匯編為一個(gè)巨大的數(shù)據(jù)庫(kù)以供后續(xù)的文本與數(shù)據(jù)挖掘(以下簡(jiǎn)稱TDM)。34由于谷歌的大規(guī)模復(fù)制行為,導(dǎo)致該計(jì)劃從一開始就遭到了普遍的反對(duì),并引發(fā)諸多訴訟。最終,美國(guó)法院力排眾議在多起判決中支持TDM屬于合理使用。35因此,學(xué)界認(rèn)為美國(guó)通過法院解釋版權(quán)法中的合理使用規(guī)則,為人工智能的發(fā)展開辟了空間。36相比于立法和行政的“剛性”治理,司法以其具有參與、協(xié)商與靈活特性的“柔性”治理緩沖了社會(huì)沖突,并為技術(shù)的發(fā)展提供了保障。
如果說TDM代表了分析式人工智能的技術(shù)特質(zhì),大語(yǔ)言模型則是生成式人工智能的技術(shù)基石。大語(yǔ)言模型版權(quán)集體訴訟也許只是“谷歌數(shù)字圖書館”系列案件在生成式人工智能時(shí)代的延續(xù)。因此,OpenAI和Meta等被告均提出了“合理使用”作為辯駁的依據(jù)。基于《美國(guó)版權(quán)法》上合理使用規(guī)則的開放性和靈活性,美國(guó)學(xué)者指出:“訴訟的影響將取決于法院選擇在多大范圍內(nèi)解釋作者提出的挑戰(zhàn)以及其他類似案件的結(jié)果。”37針對(duì)視覺藝術(shù)家群體對(duì)Stability AI、Midjourney和DeviantArt提起的訴訟,法官在一場(chǎng)聽證會(huì)中表示傾向于駁回藝術(shù)家們對(duì)人工智能公司提起的大部分訴訟,但也允許其繼續(xù)提起該類訴訟。原因是該案關(guān)于版權(quán)侵權(quán)的事實(shí)不夠清楚,是否存在“實(shí)質(zhì)性相似”也存疑。38雖然這些早期案件的結(jié)果還遠(yuǎn)未確定,但初步跡象表明,法院并沒有屈服于輿論炒作和原告的辭術(shù),而是對(duì)原告的主張抱以適當(dāng)程度的懷疑。39美國(guó)版權(quán)司法的能動(dòng)性是其司法社會(huì)功能發(fā)揮的基礎(chǔ),其優(yōu)勢(shì)在于以“柔性”的方式既貫徹了公共政策,又減小了劇烈社會(huì)沖突的可能性。
(三)行業(yè)自治消弭風(fēng)險(xiǎn)
在積極應(yīng)訴的同時(shí),OpenAI以及微軟等企業(yè)也通過行業(yè)對(duì)話等方式尋求合作。OpenAI在遭遇訴訟之后向媒體表示正在與世界各地的創(chuàng)作者和作家協(xié)會(huì)進(jìn)行富有成效的對(duì)話,并將繼續(xù)尋找互惠互利的方式,幫助作者們利用新技術(shù)。實(shí)際上,這一表態(tài)并非OpenAI一廂情愿,一定程度上也是作者群體的意愿。在美國(guó)版權(quán)局舉行的第一場(chǎng)公開聽證上,作家協(xié)會(huì)的首席執(zhí)行官明確表達(dá)并不希望阻礙人工智能的發(fā)展,只是希望“集體許可”能夠?qū)嵤匝a(bǔ)償作者利益。上述事實(shí)反映出訴爭(zhēng)雙方的矛盾具有協(xié)調(diào)的可能性,行業(yè)的磋商和合作將發(fā)揮關(guān)鍵的作用。此外,版權(quán)侵權(quán)的技術(shù)緩解措施是行業(yè)自治的重要手段。造成AIGC版權(quán)侵權(quán)的關(guān)鍵原因是記憶現(xiàn)象的產(chǎn)生,減少記憶現(xiàn)象的技術(shù)措施主要有兩種:一是合理設(shè)置模型的溫度(Temperature)參數(shù);二是清除訓(xùn)練數(shù)據(jù)中重復(fù)出現(xiàn)的作品。通過“人類強(qiáng)化反饋學(xué)習(xí)”以及“版權(quán)過濾”等技術(shù)的投入也可以大幅降低大語(yǔ)言模型輸出侵權(quán)內(nèi)容的概率。40版權(quán)人所要求的“選擇退出”(Out put)機(jī)制,也需要大語(yǔ)言模型企業(yè)予以技術(shù)支持。目前,已有不少企業(yè)表示可以進(jìn)一步研究和增設(shè)相應(yīng)技術(shù)措施,包括允許版權(quán)人排除其作品被納入訓(xùn)練數(shù)據(jù)庫(kù)等。
五、經(jīng)驗(yàn)啟示:大語(yǔ)言模型下版權(quán)集體訴訟的治理
隨著大語(yǔ)言模型的發(fā)展和應(yīng)用,大規(guī)模版權(quán)訴訟和抗議在我國(guó)爆發(fā)的風(fēng)險(xiǎn)不可忽視。目前,我國(guó)司法機(jī)關(guān)已逐步面臨AIGC版權(quán)侵權(quán)糾紛審理的難題。實(shí)際上,版權(quán)人與科技企業(yè)對(duì)抗的情況在我國(guó)互聯(lián)網(wǎng)發(fā)展史上亦多有發(fā)生,最為典型的是“百度文庫(kù)案”。2011年,賈平凹、劉心武、韓寒等50位知名作家共同簽署了《“三一五”中國(guó)作家討百度書》,劍指百度文庫(kù)未經(jīng)授權(quán)收錄作家作品(約278萬份),并向公眾免費(fèi)提供的行為。41雙方在后續(xù)進(jìn)行了相關(guān)談判,但未達(dá)成一致認(rèn)識(shí),最終演變?yōu)橐幌盗邪鏅?quán)訴訟。美國(guó)大語(yǔ)言模型版權(quán)集體訴訟作為“前車之鑒”,對(duì)我國(guó)新科技背景下的版權(quán)治理具有重要的參照意義。
(一)創(chuàng)新優(yōu)先的價(jià)值導(dǎo)向
人工智能領(lǐng)域目前已成為大國(guó)博弈的新邊疆,在國(guó)際權(quán)力結(jié)構(gòu)的重構(gòu)中發(fā)揮著決定性作用。42大語(yǔ)言模型作為新一代人工智能的底層技術(shù),具有基礎(chǔ)設(shè)施地位。從國(guó)家安全的角度而言,不發(fā)展才是最大的不安全。版權(quán)制度構(gòu)成人工智能發(fā)展的基礎(chǔ)性法律環(huán)境。從美國(guó)經(jīng)驗(yàn)來看,“創(chuàng)新優(yōu)先”是其版權(quán)治理的首要價(jià)值追求。研究指出,《美國(guó)版權(quán)法》在全球創(chuàng)新競(jìng)爭(zhēng)中提供了一種競(jìng)爭(zhēng)優(yōu)勢(shì),因?yàn)槠潇`活的合理使用規(guī)則允許研究人員對(duì)任何可以訪問的材料進(jìn)行計(jì)算機(jī)分析。43從谷歌數(shù)字圖書館案到大語(yǔ)言模型版權(quán)集體訴訟,《美國(guó)版權(quán)法》的合理使用制度很可能再次為其科技的發(fā)展創(chuàng)造條件。法官的能動(dòng)司法則體現(xiàn)在不固守成規(guī),在合適的時(shí)機(jī)創(chuàng)造新的合理使用類型,從而提供科技發(fā)展所必要的版權(quán)環(huán)境。另一方面,與歐盟對(duì)立法的狂熱追求相比,美國(guó)具有更強(qiáng)的戰(zhàn)略定性和務(wù)實(shí)性。在新技術(shù)發(fā)展的初期,面臨“科林格里奇困境”時(shí),美國(guó)立法、行政等剛性手段并不過早介入,以避免對(duì)新技術(shù)和新業(yè)態(tài)的不當(dāng)干擾。此舉為科技的發(fā)展提供了必要的自由度,充分體現(xiàn)了“創(chuàng)新優(yōu)先”的策略。當(dāng)前,我國(guó)與美國(guó)的情況高度相似,均處于生成式人工智能技術(shù)研發(fā)和應(yīng)用的第一梯隊(duì)。堅(jiān)持“創(chuàng)新優(yōu)先”的價(jià)值導(dǎo)向,不僅是促進(jìn)科技發(fā)展的需要,更是避免在中美科技競(jìng)爭(zhēng)中落入下風(fēng)的必要舉措。
(二)多元協(xié)同的治理模式
新技術(shù)具有高度專業(yè)性和復(fù)雜性,其治理需要多方主體的共同參與,包括政府部門、行業(yè)組織、標(biāo)準(zhǔn)組織、科研機(jī)構(gòu)以及公眾等44,即所謂“多元協(xié)同”的治理模式。從美國(guó)的情況來看,其并沒有將大語(yǔ)言模型版權(quán)集體訴訟的解決限制于司法領(lǐng)域,而是將其視為重要的社會(huì)問題加以治理。在治理手段上,通過公開聽證凝聚社會(huì)共識(shí),將版權(quán)管理部門、版權(quán)人群體及其組織、科技企業(yè)以及學(xué)術(shù)團(tuán)體等置于公眾的監(jiān)督之下進(jìn)行充分協(xié)商,為利益的再平衡提供了重要的民主機(jī)制。在具體問題的解決上,則又充分依賴于行業(yè)自治以及司法能動(dòng)性的發(fā)揮,將問題控制在發(fā)生的起點(diǎn)。無論是行業(yè)合作的達(dá)成還是技術(shù)緩解措施的應(yīng)用均具有復(fù)雜性,行業(yè)本身最具有解決問題的專業(yè)能力和現(xiàn)實(shí)意愿。2023年7月10日,國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》,其中第5條第2款指出:“支持行業(yè)組織、企業(yè)、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)、有關(guān)專業(yè)機(jī)構(gòu)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應(yīng)用、風(fēng)險(xiǎn)防范等方面開展協(xié)作。”該規(guī)定表明我國(guó)在政策層面對(duì)多元協(xié)同治理模式的認(rèn)可。但從實(shí)踐層面觀之,我國(guó)版權(quán)管理部門等所采用的政策工具則較為單一,缺乏深度了解行業(yè)訴求以及提供溝通平臺(tái)的措施。美國(guó)版權(quán)局通過公開聽證促進(jìn)行業(yè)協(xié)商合作,釋放社會(huì)意見及情緒的做法值得我國(guó)參考。
(三)合理使用制度的完善
我國(guó)大語(yǔ)言模型版權(quán)風(fēng)險(xiǎn)的治理,除宏觀層面堅(jiān)持“創(chuàng)新優(yōu)先”的價(jià)值導(dǎo)向以及中觀層面采取“多元協(xié)同”的治理模式之外,在微觀層面亦需要版權(quán)法律制度的配合。美國(guó)的合理使用制度采用“開放式”立法模式,即規(guī)定判斷合理使用情形的四個(gè)基本條件,允許法官根據(jù)該“四要素標(biāo)準(zhǔn)”自主判斷是否屬于合理使用。45我國(guó)《著作權(quán)法》第24條對(duì)合理使用的規(guī)定則屬于“封閉式”立法,除規(guī)定的13種法定情形之外,法官無權(quán)另行創(chuàng)設(shè)新的合理使用類型。因而,在大語(yǔ)言模型等人工智能訓(xùn)練過程中,對(duì)版權(quán)作品的利用無法由法官靈活作出合理使用認(rèn)定,版權(quán)侵權(quán)風(fēng)險(xiǎn)可能嚴(yán)重阻礙科技創(chuàng)新。從合理性來看,大語(yǔ)言模型訓(xùn)練中對(duì)版權(quán)作品的使用屬于“非表達(dá)性使用”,是將作品作為一種事實(shí)信息進(jìn)行的功能性利用,其結(jié)果并沒有再現(xiàn)原作品的藝術(shù)價(jià)值。46該種使用不會(huì)為版權(quán)人帶來市場(chǎng)替代,進(jìn)而影響其版權(quán)利益。因而,根據(jù)版權(quán)法的理論,該種使用不應(yīng)當(dāng)由版權(quán)人所壟斷,可以納入合理使用范圍。從比較法的角度而言,歐盟、日本等發(fā)達(dá)國(guó)家和地區(qū)均構(gòu)建了與人工智能訓(xùn)練相關(guān)的作品合理使用制度,體現(xiàn)了人工智能時(shí)代版權(quán)法對(duì)科技創(chuàng)新的一致態(tài)度。我國(guó)《著作權(quán)法》可借鑒相關(guān)立法經(jīng)驗(yàn),增設(shè)一項(xiàng)新的合理使用類型——“人工智能訓(xùn)練合理使用”,在制度上為大規(guī)模版權(quán)侵權(quán)的治理開辟出一條促進(jìn)創(chuàng)新的道路。而在人工智能內(nèi)容輸出階段,由于AIGC可能再現(xiàn)原作品的價(jià)值,則仍應(yīng)當(dāng)堅(jiān)持版權(quán)侵權(quán)認(rèn)定的基本規(guī)則,通過“接觸+實(shí)質(zhì)性相似”的方法加以認(rèn)定。
六、結(jié)語(yǔ)
版權(quán)作品是大語(yǔ)言模型獲取智能的最寶貴“糧食”,美國(guó)大語(yǔ)言模型版權(quán)集體訴訟提出了一個(gè)最根本的問題——究竟誰應(yīng)當(dāng)為科技的進(jìn)步“買單”?大語(yǔ)言模型的開發(fā)和應(yīng)用目前仍處在起步階段,對(duì)于一個(gè)國(guó)家而言,首要任務(wù)是促進(jìn)創(chuàng)新和發(fā)展產(chǎn)業(yè)生態(tài),以確保在全球競(jìng)爭(zhēng)中贏得優(yōu)勢(shì)。版權(quán)制度是科技創(chuàng)新的基石,堅(jiān)持“創(chuàng)新優(yōu)先”則是版權(quán)制度對(duì)時(shí)代需求的回應(yīng)。美國(guó)的經(jīng)驗(yàn)表明,“法律的不完備不是一種缺點(diǎn)”,相反,其可以為不同的價(jià)值理念和治理措施開辟空間。合理的版權(quán)政策、多元協(xié)同的治理架構(gòu)、靈活的版權(quán)規(guī)則共同構(gòu)成未來防范大語(yǔ)言模型下大規(guī)模版權(quán)糾紛的關(guān)鍵策略體系。
1基金項(xiàng)目:本文系重慶市社會(huì)科學(xué)規(guī)劃一般項(xiàng)目“美國(guó)經(jīng)濟(jì)制裁介入知識(shí)產(chǎn)權(quán)領(lǐng)域的影響與應(yīng)對(duì)”(課題編號(hào):2023NDYB35)的階段性研究成果。
作者簡(jiǎn)介:肖啟賢,西南政法大學(xué)博士研究生。
. 參見張新新:《生成式智能出版:知識(shí)生成原理、沿革與啟迪——從智慧驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)》,載《編輯之友》2023年第11期,第36-44頁(yè)。
2. 支振鋒:《生成式人工智能大模型的信息內(nèi)容治理》,載《政法論壇》2023年第4期,第34-48頁(yè)。
3. 參見高奇琦:《知識(shí)革命還是知識(shí)墮化——ChatGPT與知識(shí)生成秩序》,載《中國(guó)社會(huì)科學(xué)評(píng)價(jià)》2023年第2期,第8-13頁(yè)。
4. 參見廣州互聯(lián)網(wǎng)法院(2024)粵0192民初113號(hào)民事判決書。
5. 《多位創(chuàng)作者起訴小紅書偷畫師作品“煉”AI模型涉侵權(quán),已獲立案》,載微信公眾號(hào)“知產(chǎn)前沿”, 2023年11月30日上傳。
6. 參見孫放:《公地悲劇理論下集體訴訟的經(jīng)濟(jì)邏輯與制度構(gòu)建》,載《學(xué)術(shù)交流》2019年第7期,第74-83頁(yè)。
7. 參見郭雪慧、李志敏:《擴(kuò)散性利益保護(hù)訴訟制度研究——以訴訟保障為視角》,載《河北法學(xué)》2017年第6期,第88-100頁(yè)。
8. See DOE 1 v. GitHub, Inc., 4:22-cv-06823, (N.D. Cal.).
9. 參見何煉紅:《從Copyright到Copyleft:作者觀念的反思與超越》,載《甘肅社會(huì)科學(xué)》2005年第5期,第61-67頁(yè)。
10. See Andersen v. Stability AI Ltd., 3:23-cv-00201, (N.D. Cal.).
11. See Kadrey v. Meta Platforms, Inc., 3:23-cv-03417, (N.D. Cal.).
12. See Tremblay v. OpenAI, Inc., 3:23-cv-03223,(N.D. Cal.).
13. See Chabon v. OpenAI, Inc., 3:23-cv-04625,(N.D. Cal.).
14. See J. L. v. Alphabet Inc., 5:23-cv-03440,(N.D. Cal.).
15. 參見劉岳川:《科技創(chuàng)新的法律規(guī)制》,載《華東政法大學(xué)學(xué)報(bào)》2023年第3期,第37-46頁(yè)。
16. See Guadamuz Andres, A Scanner Gloomily: Copyright Liability and Exceptions inbound Artificial Intelligence Inputs and Outputs, at https://ssrn.com/abstract=4371204, last visited on August 22, 2024.
17. See Sag Matthew, Copyright safety for generative AI, Houston Law Review, Vol.61:295, p.310 (2023).
18. See Peter Henderson et al, Foundation Models and Fair Use, at https://arxiv.org/abs/2303.15715, last visited on August 22, 2024.
19. See Benjamin L. W. Sobel, Artificial intelligence's fair use crisis, Colum. JL amp; Arts, Vol.41:45, p.51 (2023).
20. 參見熊琦:《互聯(lián)網(wǎng)產(chǎn)業(yè)驅(qū)動(dòng)下的著作權(quán)規(guī)則變革》,載《中國(guó)法學(xué)》2013年第6期,第79-90頁(yè)。
21. See 2023 World Economic Forum,Jobs of Tomorrow:Large Language Models and Jobs,at https://www3.weforum.org/docs/WEF_Jobs_of_Tomorrow_Generative_AI_2023.pdf,last visited on August 22, 2024.
22. 參見何哲、曾潤(rùn)喜、秦維等:《ChatGPT等新一代人工智能技術(shù)的社會(huì)影響及其治理》,載《電子政務(wù)》2023年第4期,第2-24頁(yè)。
23. 參見余冬林:《2002~2012年美國(guó)版權(quán)產(chǎn)業(yè)發(fā)展變遷及其原因》,載《中國(guó)出版》2015年第10期,第57-61頁(yè)。
24. 參見劉艷紅:《生成式人工智能的三大安全風(fēng)險(xiǎn)及法律規(guī)制——以ChatGPT為例》,載《東方法學(xué)》2023年第4期,第29-43頁(yè)。
25. 參見朱鴻軍、李辛揚(yáng):《ChatGPT生成內(nèi)容的非版權(quán)性及著作權(quán)侵權(quán)風(fēng)險(xiǎn)》,載《新聞?dòng)浾摺?023年第6期,第28-38頁(yè)。
26. 參見於興中:《數(shù)字素養(yǎng):從算法社會(huì)到網(wǎng)絡(luò)3.0》,上海人民出版社2022年版,第4頁(yè)。
27. See Sharon Goldman, What Sarah Silverman's lawsuit against OpenAI and Meta really means, at https://venturebeat.com/ai/what-sarah-silvermans-lawsuit-against-openai-and-meta-really-means-the-ai-beat/, last visited on August 22, 2024.
28. See Guadamuz Andres, A Scanner Gloomily: Copyright Liability and Exceptions inbound Artificial Intelligence Inputs and Outputs, at https://ssrn.com/abstract=4371204, last visited on August 22, 2024.
29. 參見鐘祥銘、方興東、顧燁燁:《ChatGPT的治理挑戰(zhàn)與對(duì)策研究——智能傳播的“科林格里奇困境”與突破路徑》,載《傳媒觀察》2023年第3期,第25-35頁(yè)。
30. See Hodan Omaar, U.S. AI Policy Report Card,at https://www2.datainnovation.org/2022-ai-report-card.pdf, last visited on August 22, 2024.
31. 參見賈開、郭雨暉、雷鴻竹:《人工智能公共政策的國(guó)際比較研究:歷史、特征與啟示》,載《電子政務(wù)》2018年第9期,第78-86頁(yè)。
32. 參見薛冰、鄭萍:《以商談求共識(shí):行政決策聽證中公共意愿的形成》,載《北京行政學(xué)院學(xué)報(bào)》2011年第2期,第38-42頁(yè)。
33. 陳星儒、周海源:《司法參與社會(huì)治理的正當(dāng)性進(jìn)路分析》,載《湖北社會(huì)科學(xué)》2018年第4期,第170-176頁(yè)。
34. 參見張惠彬、肖啟賢:《人工智能時(shí)代文本與數(shù)據(jù)挖掘的版權(quán)豁免規(guī)則建構(gòu)》,載《科技與法律(中英文)》2021年第6期,第74-84頁(yè)。
35. 參見羅嬌、張曉林:《支持文本與數(shù)據(jù)挖掘的著作權(quán)法律政策建議》,載《中國(guó)圖書館學(xué)報(bào)》2018年第3期,第21-34頁(yè)。
36. 參見林秀芹:《人工智能時(shí)代著作權(quán)合理使用制度的重塑》,載《法學(xué)研究》2021年第6期,第170-185頁(yè)。
37. Max Zahn, Authors' lawsuit against OpenAI could 'fundamentally reshape' artificial intelligence,according to experts,at https://abcnews.go.com/Technology/authors-lawsuit-openai-fundamentally-reshape-artificial-intelligence-experts/story?id=103379209,last visited on August 22, 2024.
38. See Blake Brittain, US judge finds flaws in artists' lawsuit against AI companies, at https://www.reuters.com/legal/litigation/us-judge-finds-flaws-artists-lawsuit-against-ai-companies-2023-07-19/, last visited on August 22, 2024.
39. See Christopher J. Valente et al, Recent trends in generative artificial intelligence litigation in the united states,at https://www.klgates.com/Recent-Trends-in-Generative-Artificial-Intelligence-Litigation-in-the-United-States-9-5-2023,last visited on August 22, 2024.
40. See Sag Matthew, Copyright safety for generative AI, Houston Law Review,Vol.61:295, p.338 (2023).
41. 參見林凌:《百度文庫(kù)侵權(quán)案引發(fā)的思考》,載《編輯學(xué)刊》2011年第4期,第29-32頁(yè)。
42. 參見余南平、張翌然:《ChatGPT/生成式人工智能對(duì)教育的影響:大國(guó)博弈新邊疆》,載《華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)》2023年第7期,第15-25頁(yè)。
43. See Michael W. Carroll,Copyright and the Progress of Science: Why Text and Data Mining Is Lawful,UC Davis Law Review,Vol.53:893, p.893 (2019).
44. 參見郭小東:《生成式人工智能的風(fēng)險(xiǎn)及其包容性法律治理》,載《北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》2023年第25卷第6期,第93-105頁(yè)。
45. 根據(jù)《美國(guó)版權(quán)法》第107條的規(guī)定,四要素包括:(1)使用的目的與特點(diǎn),包括該使用是具有商業(yè)性質(zhì)還是為了非營(yíng)利的教學(xué)目的;(2)該版權(quán)作品的類型;(3)被使用的作品部分與整個(gè)作品的比例;(4)該使用對(duì)版權(quán)作品之潛在市場(chǎng)或價(jià)值所產(chǎn)生的影響。
46. 參見焦和平:《人工智能創(chuàng)作中數(shù)據(jù)獲取與利用的著作權(quán)風(fēng)險(xiǎn)及化解路徑》,載《當(dāng)代法學(xué)》2022年第4期,第128-140頁(yè)。
The Copyright Constraint and Governance of the Development of Large Language Model——From the Practice of Class Copyright Action in the United States
Abstract: The training and application of generative artificial intelligence large language models have caused large-scale copyright collective lawsuits in the United States and other regions, and copyright issues have become the primary obstacle to the development of large language models. In terms of risk types, the copyright class action lawsuit of the large language model has triggered accompanying legal risks, economic risks, and innovation risks. The three important measures taken by the United States to respond to collective lawsuits over copyright in large language models are to consolidate social consensus through open hearings, buffer copyright conflicts through active judiciary, and eliminate copyright risks through industry autonomy, reflecting the innovative governance approach of prioritizing innovation. The big language model in our country is currently in a critical stage of research and application, and is facing similar copyright risks. The experience of the United States serves as a valuable reference for copyright governance in China’s large language models. Our country’s copyright governance measures should adhere to the value orientation of “innovation first” at the macro level, adopt a governance model of “diverse collaboration” at the meso level, and introduce the type of “reasonable use of artificial intelligence training” at the micro level.
Keywords: Generative Artificial Intelligence; Big Language Model; Copyright Collective Litigation; Innovation Priority
電子知識(shí)產(chǎn)權(quán)2024年9期