摘要:人工智能和互聯(lián)網(wǎng)時(shí)代,機(jī)器訓(xùn)練日益成為知識(shí)傳播和交流的重要方式。語料是影響人工智能能力和水平的關(guān)鍵因素,作品是不可替代、高質(zhì)量訓(xùn)練語料,但面臨大量侵權(quán)指控和糾紛,缺乏針對(duì)性和明確的處理規(guī)則。機(jī)器訓(xùn)練過程中,復(fù)制行為是必要行為和爭議焦點(diǎn)問題。當(dāng)前TDM例外規(guī)則、合理使用規(guī)則、法定許可規(guī)則等難以妥善應(yīng)對(duì)訓(xùn)練行為、對(duì)象和目的及后續(xù)行為的復(fù)雜性。本文源于訓(xùn)練成本高、糾紛多的現(xiàn)實(shí)問題,嘗試以技術(shù)過程、創(chuàng)新激勵(lì)和數(shù)據(jù)公平為視角,在比較相關(guān)規(guī)則適用性基礎(chǔ)上,聚焦訓(xùn)練中的復(fù)制行為,主張按照被訴行為過程、作品類型、訓(xùn)練方式并結(jié)合后續(xù)行為進(jìn)行分步驟、綜合性評(píng)價(jià)。
關(guān)鍵詞:人工智能;機(jī)器訓(xùn)練;著作權(quán);合理使用;作品性使用;轉(zhuǎn)換性使用
一、引言
人工智能(AI)技術(shù)革新與產(chǎn)業(yè)發(fā)展,創(chuàng)造了新商業(yè)模式和競爭規(guī)則,催生了新利益主體和權(quán)利格局,引發(fā)了新制度調(diào)整和法律需求。15世紀(jì)的紡織技術(shù)進(jìn)步和新航路貿(mào)易擴(kuò)張,引發(fā)了“羊吃人圈地運(yùn)動(dòng)”,深刻改變了生產(chǎn)關(guān)系。21世紀(jì)的“數(shù)據(jù)驅(qū)動(dòng)的人工智能”技術(shù)和產(chǎn)業(yè)模式創(chuàng)新,引起了機(jī)器訓(xùn)練與作品著作權(quán)之爭,甚至引發(fā)“數(shù)據(jù)圈地運(yùn)動(dòng)”和AI產(chǎn)業(yè)“非法興起”之疑慮。據(jù)報(bào)道,因?yàn)闄C(jī)器訓(xùn)練涉嫌侵犯作者權(quán)利,美國2024年1月出現(xiàn)了13起集體訴訟和3起其他訴訟,好萊塢的編劇群體、演員工會(huì)和廣播電視藝人聯(lián)合工會(huì)相繼發(fā)起了大罷工。同時(shí),OpenAI等AI企業(yè)則堅(jiān)持認(rèn)為機(jī)器訓(xùn)練構(gòu)成合理使用。而法國競爭管理局已經(jīng)就谷歌公司利用新聞平臺(tái)數(shù)據(jù)進(jìn)行機(jī)器訓(xùn)練行為開出了2.5億歐元的罰單。世界知識(shí)產(chǎn)權(quán)組織(WIPO)2024年2月的報(bào)告顯示,世界各地都有未決訴訟有待確定使用作品訓(xùn)練AI是否構(gòu)成知識(shí)產(chǎn)權(quán)侵權(quán);并提到合理使用、文本和數(shù)據(jù)挖掘(TDM)以及臨時(shí)復(fù)制等例外規(guī)則缺乏協(xié)調(diào),且對(duì)AI的適用性尚不明確。因此,機(jī)器訓(xùn)練是否侵犯在先作品著作權(quán)問題是AI產(chǎn)業(yè)面臨的普遍性和基礎(chǔ)性問題,需要回歸機(jī)器訓(xùn)練技術(shù)原理,立足激勵(lì)創(chuàng)新、合理設(shè)定規(guī)則,以規(guī)范經(jīng)營模式、促進(jìn)產(chǎn)業(yè)發(fā)展。
二、回歸技術(shù)原理:機(jī)器訓(xùn)練中作品使用行為
AI大模型搭建后需要通過大量語料來訓(xùn)練,稱為AI訓(xùn)練、機(jī)器訓(xùn)練或機(jī)器學(xué)習(xí)。
(一)機(jī)器訓(xùn)練是形成參數(shù)的過程
人類學(xué)習(xí)是通過視覺、聽覺等感官器官獲取信息,通過語言和邏輯等標(biāo)記和映射客觀世界,通過生物神經(jīng)系統(tǒng)分析和反思并形成記憶的過程。機(jī)器訓(xùn)練是通過AI軟硬件模擬人類學(xué)習(xí)過程而進(jìn)行獲取、處理和存儲(chǔ)的過程,并非簡單地、機(jī)械地復(fù)制和存儲(chǔ)過程,形成參數(shù)就是形成機(jī)器記憶。
首先,AI標(biāo)記原理是通過自然語言技術(shù)以詞向量技術(shù)映射世界。語言是承載人類智能的載體,語言規(guī)律在很大程度上體現(xiàn)了客觀規(guī)律,機(jī)器訓(xùn)練是通過語言學(xué)習(xí)來映射世界,主要依靠自然語言處理技術(shù)(NLP)中的“詞向量”給世界打標(biāo)簽?!霸~向量”是標(biāo)記在單詞上的長串?dāng)?shù)字列,可以體現(xiàn)單詞之間關(guān)聯(lián)。例如,“踢”通過詞向量與“足球”關(guān)聯(lián),一般不與“鉛球”關(guān)聯(lián)。詞向量越復(fù)雜,關(guān)聯(lián)性越全面,詞預(yù)測越準(zhǔn)確。
其次,AI運(yùn)算原理是通過人工神經(jīng)網(wǎng)絡(luò)以數(shù)學(xué)運(yùn)算方式模擬思考。人工神經(jīng)網(wǎng)絡(luò)是從信息處理角度對(duì)人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象并建立的系統(tǒng)或網(wǎng)絡(luò),本質(zhì)上是一種數(shù)學(xué)模型或計(jì)算模型。數(shù)學(xué)是AI的基礎(chǔ)和運(yùn)行方式,模型是人類理解世界規(guī)律和聯(lián)系的橋梁。從1943年麥卡洛-皮茨神經(jīng)元嘗試通過數(shù)學(xué)和邏輯來解釋生物神經(jīng)元開始,科學(xué)家將統(tǒng)計(jì)學(xué)、概率論、微積分、線性代數(shù)等數(shù)學(xué)應(yīng)用于AI,出現(xiàn)了多種數(shù)學(xué)應(yīng)用模型,例如前饋神經(jīng)網(wǎng)絡(luò)處理直接信息流,卷積神經(jīng)網(wǎng)絡(luò)則擅長圖像處理,循環(huán)神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)適合序列數(shù)據(jù),另外生成對(duì)抗網(wǎng)絡(luò)、變分自編碼器、自組織映射、徑向基函數(shù)網(wǎng)絡(luò)等各有所長。
最后,AI記憶原理是通過信息權(quán)重值變化以形成記憶參數(shù)。構(gòu)成人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型由大量的節(jié)點(diǎn)(人工神經(jīng)元)相互連接構(gòu)成,每個(gè)節(jié)點(diǎn)代表一種特定的輸出函數(shù),每兩個(gè)節(jié)點(diǎn)間的連接存在信號(hào)權(quán)重。在機(jī)器訓(xùn)練時(shí),神經(jīng)網(wǎng)絡(luò)根據(jù)語料的結(jié)構(gòu)和模式調(diào)整連接權(quán)重值形成結(jié)構(gòu)化數(shù)據(jù),類似人腦的“記憶”。經(jīng)過訓(xùn)練獲得的信號(hào)權(quán)重?cái)?shù)量被稱為參數(shù)量,可以體現(xiàn)大模型的能力。這些信號(hào)權(quán)重?cái)?shù)量被稱為參數(shù)量,例如OpenAI的GPT-1有1.17億個(gè)參數(shù),GPT-2增加到15億個(gè)參數(shù),GPT-3有1750億個(gè)參數(shù),GPT-4參數(shù)規(guī)模已經(jīng)達(dá)到1.8萬億,參數(shù)量越大則代表越“見多識(shí)廣”、功能越強(qiáng)。
因此,機(jī)器訓(xùn)練以自然語言技術(shù)為信息載體,以人工神經(jīng)網(wǎng)絡(luò)為運(yùn)行方式,以信息參數(shù)變化為記憶存儲(chǔ)方式,并非對(duì)語料進(jìn)行簡單的復(fù)制和歸類,而是將文字、圖像等語料數(shù)據(jù)化和結(jié)構(gòu)化,在人工神經(jīng)網(wǎng)絡(luò)中用信息權(quán)重的方式提取和排列參數(shù),做到對(duì)語料“了然于胸”,并憑借巨大存儲(chǔ)實(shí)現(xiàn)“過目不忘”,同時(shí)根據(jù)新語料調(diào)整參數(shù)以實(shí)現(xiàn)“與時(shí)俱進(jìn)”。
(二)作品是訓(xùn)練語料的重要來源
如果認(rèn)為“在機(jī)器訓(xùn)練領(lǐng)域,權(quán)重便是一切”,那么語料就是養(yǎng)料和能源。狹義的語料指被預(yù)處理過、機(jī)構(gòu)化的“被用于訓(xùn)練機(jī)器訓(xùn)練模型的標(biāo)注或者基準(zhǔn)數(shù)據(jù)集”,簡稱為訓(xùn)練數(shù)據(jù)。而廣義的語料是指“對(duì)行為、事實(shí)或者信息的數(shù)字表現(xiàn)形式以及對(duì)此類行為、事實(shí)或者信息的任何匯編,包括以聲音、視覺或音像記錄的形式”,既包含訓(xùn)練數(shù)據(jù),也包括非數(shù)據(jù)形式存在的內(nèi)容,例如文本、圖片、音頻、視頻、代碼以及其他經(jīng)過傳感設(shè)備收集的信息或內(nèi)容。
質(zhì)量高的語料往往獲取難、成本高且數(shù)量有限。有研究發(fā)現(xiàn),到2026年高質(zhì)量數(shù)據(jù)(包括圖形)即將消耗殆盡,而低質(zhì)量語料不僅需要耗費(fèi)更多的資源進(jìn)行處理,更可能造成“垃圾進(jìn)、垃圾出”的AI發(fā)展死局。作品是在一定期限內(nèi)具有獨(dú)創(chuàng)性的智力成果表達(dá),是人類智慧的智力成果,其中小說、教科書、歷史記錄等圖書內(nèi)容是知識(shí)最密集、質(zhì)量最高的語料,是AI最為理想的訓(xùn)練對(duì)象,也幾乎是唯一的長文本語料?;ヂ?lián)網(wǎng)上電子化內(nèi)容是最容易獲得和處理的語料,新聞文本和音視頻是確保AI新鮮度的關(guān)鍵語料,但這些語料均容易引發(fā)基于作品的著作權(quán)糾紛。在美國,OpenAI面臨包括代表創(chuàng)意行業(yè)工會(huì)Verdi、DGB以及攝影師、設(shè)計(jì)師、記者和插畫家協(xié)會(huì)、泰勒·布蘭奇和史戴西·希夫在內(nèi)的美國作家、《紐約時(shí)報(bào)》等主體針對(duì)其未經(jīng)許可使用作品訓(xùn)練的控訴。2024年廣州互聯(lián)網(wǎng)法院作出了一例AIGC奧特曼圖片侵權(quán)的案例,盡管該案并未認(rèn)定機(jī)器訓(xùn)練中侵犯他人復(fù)制權(quán),但可以推斷出機(jī)器訓(xùn)練過程中學(xué)習(xí)了原告的奧特曼圖片。
(三)作品復(fù)制是訓(xùn)練的核心問題
機(jī)器訓(xùn)練有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)三種模式,監(jiān)督學(xué)習(xí)是人類強(qiáng)行地“用規(guī)則教”,無監(jiān)督學(xué)習(xí)是機(jī)器自主地“用語料學(xué)”,強(qiáng)化學(xué)習(xí)是實(shí)踐性地“用問題練”。其中,無監(jiān)督學(xué)習(xí)是AI語料訓(xùn)練的主要過程,也是引發(fā)作品侵權(quán)糾紛最多的訓(xùn)練方式。
在無監(jiān)督學(xué)習(xí)過程中,以訓(xùn)練提取參數(shù)的不同,可以分為表達(dá)型機(jī)器訓(xùn)練和非表達(dá)型機(jī)器訓(xùn)練。自然語言處理、人臉面部識(shí)別、TDM等非表達(dá)型機(jī)器訓(xùn)練,關(guān)注和提取的內(nèi)容并非人類“思想”呈現(xiàn)和固定下來的“表達(dá)”,而是作品中具有統(tǒng)計(jì)、挖掘意義的信息,因此該訓(xùn)練不是著作權(quán)法意義上的使用作品的過程。而表達(dá)型機(jī)器訓(xùn)練,會(huì)通過特定算法保持和捕捉作品表達(dá)本身的特點(diǎn)和風(fēng)格,例如提取主謂賓順序、語序和重復(fù)特點(diǎn)、格式化而得到的魯迅文風(fēng)、瓊瑤風(fēng)格參數(shù),用于生成類似風(fēng)格的文字型人工智能生成物(AIGC);再如通過特定技術(shù)捕捉個(gè)人音色、語言節(jié)奏、面部表情、色彩關(guān)聯(lián)風(fēng)格等參數(shù),用于生成以假亂真的音頻和視頻AIGC。
在具體訓(xùn)練時(shí),機(jī)器訓(xùn)練大致分為三步:訪問內(nèi)容,提取、復(fù)制內(nèi)容,挖掘文本、數(shù)據(jù)。在后兩步中,可能涉及與作品相關(guān)的機(jī)器行為包括:(1)復(fù)制行為,主要指為了學(xué)習(xí)而進(jìn)行的包括翻錄、翻拍、數(shù)字化等方式將作品制作一份或者多份的行為,既包括永久性或長期性復(fù)制行為,也包括臨時(shí)性復(fù)制行為。(2)改編和匯編行為,例如通過關(guān)鍵詞提取、內(nèi)容摘要等方式對(duì)在先作品進(jìn)行改編、匯編行為,這些行為并非機(jī)器訓(xùn)練的必要行為,相對(duì)于普通改編或匯編行為沒有特異性,可以按照現(xiàn)有著作權(quán)法進(jìn)行處理。而復(fù)制行為是其他行為的前提和基礎(chǔ),也是現(xiàn)實(shí)中著作權(quán)爭議最為集中、各國立法共同關(guān)注的行為,因此本文建議將復(fù)制行為作為機(jī)器訓(xùn)練合法性問題的核心問題進(jìn)行討論。
三、立足激勵(lì)創(chuàng)新:降低語料獲得成本的必要性
機(jī)器訓(xùn)練是AI技術(shù)和產(chǎn)業(yè)發(fā)展的關(guān)鍵環(huán)節(jié),既涉及作品權(quán)利人權(quán)利保護(hù),也涉及AI提供者的開發(fā)運(yùn)營成本和效率,還關(guān)系到AI產(chǎn)業(yè)健康發(fā)展。AI占有的語料越多、質(zhì)量越高,功能越強(qiáng)大,對(duì)產(chǎn)業(yè)和社會(huì)來講意義可謂“數(shù)據(jù)圈地運(yùn)動(dòng)”。當(dāng)前,機(jī)器訓(xùn)練成本居高不下。據(jù)報(bào)道,OpenAI的GPT-4的訓(xùn)練成本約為7800萬美元,GPT-4o大模型訓(xùn)練花費(fèi)約1億美元,而谷歌的Gemini Ultra則花費(fèi)了1.91億美元。而且隨著算力提升和算法完善,以及互聯(lián)網(wǎng)內(nèi)容的爆炸式增加,AI對(duì)語料的需求不斷提升,相關(guān)成本還將繼續(xù)加大。巨大成本對(duì)后發(fā)國家、初創(chuàng)企業(yè)而言成為不可跨越的高墻。
(一)語料的全面性程度關(guān)系數(shù)字公平
首先,機(jī)器訓(xùn)練逐漸成為提升知識(shí)傳播和利用的關(guān)鍵行為。作為人類通過智力活動(dòng)創(chuàng)造或發(fā)現(xiàn)的成果,知識(shí)只有被傳播、使用和更新才能實(shí)現(xiàn)促進(jìn)社會(huì)整體進(jìn)步的價(jià)值,應(yīng)當(dāng)允許每一代作者和創(chuàng)作者都可以像他們的前輩一樣,“使用已有作品作為積木來搭建新作品”。當(dāng)前,AI已經(jīng)改變了人類獲取信息的方式,內(nèi)容聚合平臺(tái)憑借強(qiáng)大的信息抓取和統(tǒng)計(jì)匯總能力,使用戶省去了點(diǎn)擊和瀏覽原始資料的麻煩,實(shí)現(xiàn)了從“提供信息”到“呈現(xiàn)答案”的轉(zhuǎn)變。據(jù)調(diào)查,通過搜索引擎、社交媒體看新聞的歐洲人中,47%的人不會(huì)點(diǎn)擊原鏈接而僅僅是瀏覽摘要。這使得機(jī)器訓(xùn)練不再是少量的、補(bǔ)充的、特殊的或狹窄的,已經(jīng)逐漸成為海量的、主流的、普遍的使用形式。
其次,機(jī)器訓(xùn)練也是創(chuàng)造獨(dú)立數(shù)據(jù)價(jià)值的重要環(huán)節(jié)。數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字化、網(wǎng)絡(luò)化、智能化的基礎(chǔ)。機(jī)器訓(xùn)練本質(zhì)是對(duì)分散信息、作品等知識(shí)相關(guān)內(nèi)容的數(shù)據(jù)化和要素化,是產(chǎn)生高質(zhì)量數(shù)據(jù)的過程。在此基礎(chǔ)上,AI生成內(nèi)容(AIGC)也將成為知識(shí)加工和傳播的重要渠道,有研究預(yù)期2026年AIGC將占據(jù)未來互聯(lián)網(wǎng)內(nèi)容的90%。這種背景下,機(jī)器訓(xùn)練的過程日益成為知識(shí)數(shù)據(jù)化的價(jià)值創(chuàng)造過程的重要階段,日益具備獨(dú)立的社會(huì)生產(chǎn)價(jià)值。同時(shí),機(jī)器訓(xùn)練的合法性認(rèn)定也將是盤活數(shù)據(jù)要素的突破口。例如,美國、以色列等對(duì)TDM使用作品持寬松態(tài)度的國家更容易吸引到AI產(chǎn)業(yè)的投資,進(jìn)而進(jìn)一步擴(kuò)大數(shù)據(jù)要素市場。
再者,機(jī)器訓(xùn)練是追求和構(gòu)建數(shù)字公平的重要前提。海量數(shù)據(jù)不僅對(duì)于AI的訓(xùn)練與發(fā)展具有重要作用,而且對(duì)于其AI公平性與社會(huì)治理也具有重要意義。例如,全面的語料有利于減少語料差異導(dǎo)致的數(shù)據(jù)資本壟斷和權(quán)力私化。AI提供者具有實(shí)施壟斷的天然傾向,如果在機(jī)器訓(xùn)練中出現(xiàn)“作品城堡”,就會(huì)出現(xiàn)資金充裕、算力強(qiáng)大的大型AI企業(yè)通過著作權(quán)許可甚至是獨(dú)家許可來獲取作品,進(jìn)而對(duì)中小研發(fā)企業(yè)形成實(shí)質(zhì)上的資源壟斷,形成贏者通吃的壟斷局面。與此同時(shí),在“代碼即法律”的時(shí)代,“技治主義”使得數(shù)據(jù)科技巨頭在社會(huì)治理、公共管理、政府決策等方面取得實(shí)質(zhì)性的權(quán)力。歐盟《人工智能法案》第60g條明確要求對(duì)于小微型企業(yè),包括初創(chuàng)企業(yè),可以在控制成本、進(jìn)行簡化方式處理版權(quán)問題,也是基于數(shù)據(jù)公平的考慮。
最后,機(jī)器訓(xùn)練也是國家科技和產(chǎn)業(yè)競爭的基礎(chǔ)環(huán)節(jié)。AI技術(shù)正在潛移默化地改變著世界格局底層運(yùn)行邏輯。聯(lián)合國秘書長古特雷斯曾表示,AI很可能會(huì)加劇全球不平等 。2024年世界經(jīng)濟(jì)論壇《首席經(jīng)濟(jì)學(xué)家展望報(bào)告》顯示,近75%的受訪經(jīng)濟(jì)學(xué)家預(yù)計(jì),AI將進(jìn)一步擴(kuò)大不同經(jīng)濟(jì)體之間的經(jīng)濟(jì)和技術(shù)鴻溝。一方面,機(jī)器訓(xùn)練通過語料控制會(huì)從底層影響AI的文化傾向。據(jù)報(bào)道,ChatGPT的訓(xùn)練語料集96%來自英語文本,甚至我國國內(nèi)的某大模型會(huì)在輸入“土耳其”(Turkey)時(shí)會(huì)出現(xiàn)“火雞”(turkey)圖片,在輸入“仙鶴”(crane)時(shí)會(huì)輸出“起重機(jī)”(crane)圖片。這正如英偉達(dá)的黃仁勛提出的“主權(quán)人工智能”概念,并認(rèn)為“每個(gè)國家都需要擁有自己的AI,因?yàn)樗梢跃幾胝麄€(gè)國家的文化、社會(huì)智慧、常識(shí)、歷史等各類數(shù)據(jù)”。另一方面,通過語料控制的AI已經(jīng)成為意識(shí)形態(tài)和國家競爭的重要工具。從2023年七國集團(tuán)聯(lián)合聲明以價(jià)值觀劃線來阻止中國參與AI等技術(shù)標(biāo)準(zhǔn)的制定,到Chatgpt限制中國使用,在一定程度上是降低某國文字和文化在機(jī)器訓(xùn)練時(shí)代的分量,進(jìn)而壓縮話語權(quán)和影響力。
因此,數(shù)據(jù)訓(xùn)練的范圍和效率已經(jīng)成為AI時(shí)代企業(yè)、產(chǎn)業(yè)、國家、文化競爭的關(guān)鍵。歐洲和部分亞太地區(qū)的國家的立法規(guī)定,盡管都考慮到了數(shù)字環(huán)境下TDM技術(shù)和產(chǎn)業(yè)發(fā)展問題,但在行為主體、行為性質(zhì)、行為目的、行為對(duì)象、行為類型和限制條件等具體規(guī)則方面還存在區(qū)別。這些差異,實(shí)質(zhì)上是對(duì)AI企業(yè)和在先權(quán)利人的利益平衡,是本國AI治理政策的體現(xiàn)。如果限制了在先權(quán)利人的保留權(quán)利自然有利于AI企業(yè),但如果像歐盟明確賦予權(quán)利人確保作品完整性和安全性權(quán)利,或?qū)Ψ强茖W(xué)研究目的的TDM聲明保留的權(quán)利,則可能影響歐盟AI企業(yè)發(fā)展或處于“戰(zhàn)略劣勢”。美國、以色列等對(duì)文本與數(shù)據(jù)挖掘使用作品持寬松態(tài)度的國家更容易吸引到AI產(chǎn)業(yè)的投資。
(二)語料的合法性成本影響數(shù)字競爭
實(shí)現(xiàn)語料的全面性需要巨大成本。除了大模型的構(gòu)建和運(yùn)營,機(jī)器訓(xùn)練成本比例越來越高。有研究認(rèn)為,TDM成本涉及語料的接入成本(版權(quán)許可費(fèi)用)、交易成本(挖掘許可費(fèi)用)、進(jìn)入成本(技術(shù)開發(fā)成本)和人員及架構(gòu)成本。除此之外,實(shí)際上還需要承擔(dān)發(fā)現(xiàn)和收集、提煉和整理、更新和糾錯(cuò)、監(jiān)管和侵權(quán)等各方面的成本。主要包括:其一,解決語料分散的成本,包括人與人、人與物、人與計(jì)算、物與物(物聯(lián)網(wǎng)、區(qū)塊鏈等)、思想與思想(腦機(jī)接口)等方面的信息收集和互通。其二,解決語料質(zhì)量的成本。數(shù)據(jù)處理需要大量成本,在收集到各類型數(shù)據(jù)之后,需要通過質(zhì)量過濾、冗余去除、隱私消除、詞元切分等幾個(gè)步驟對(duì)數(shù)據(jù)進(jìn)行處理;即使是知識(shí)密集、質(zhì)量相對(duì)較高的教材、論文、百科等科學(xué)文本,由于專業(yè)性強(qiáng)、數(shù)據(jù)特點(diǎn)差異大,需要專業(yè)人員對(duì)公式、化學(xué)式等采用特定的符號(hào)標(biāo)記進(jìn)行預(yù)處理,工作量和難度均較大。其三,解決語料滯后的成本。AI不知道學(xué)習(xí)之后的情況,總是存在滯后性,機(jī)器訓(xùn)練也存在學(xué)無止境、與時(shí)俱進(jìn)的現(xiàn)實(shí)需求。
最為復(fù)雜的是解決語料合法的成本,即機(jī)器訓(xùn)練合法性成本。在個(gè)人信息保護(hù)、數(shù)據(jù)爬蟲、著作權(quán)等領(lǐng)域,現(xiàn)行立法在具有其自身合理性的同時(shí),對(duì)AI訓(xùn)練所需的大數(shù)據(jù)形成帶來了不少挑戰(zhàn)。傳統(tǒng)立法依存于契約社會(huì),規(guī)范的是人類的個(gè)別行為,強(qiáng)調(diào)的是權(quán)利主體的自決。但在大數(shù)據(jù)時(shí)代,存在作品類數(shù)據(jù)許可市場總體上處于失靈狀態(tài),存在規(guī)模過大、主體不明、機(jī)制困難等系列問題,AI提供者無法就數(shù)以萬億計(jì)的訓(xùn)練數(shù)據(jù)逐個(gè)、事先取得許可合約。尤其在著作權(quán)領(lǐng)域,獲得每項(xiàng)作品的著作權(quán)許可極其困難,需要陷入大量的迷宮般的許可協(xié)議談判;很多作品的作者難以直接聯(lián)系到,還有很多“孤兒作品”則可能完全找不到作者,但事后又存在侵權(quán)指控的風(fēng)險(xiǎn)。有調(diào)查顯示,為實(shí)施挖掘行為而從出版商處獲得授權(quán)占據(jù)了研究者近62%的時(shí)間。在處理糾紛時(shí),訴訟成本或禁令威脅往往遠(yuǎn)高于版權(quán)許可費(fèi)。另外,市場上許多數(shù)據(jù)提供商收集并提供的數(shù)據(jù)集也會(huì)存在侵權(quán)風(fēng)險(xiǎn)。例如,ChatGPT利用BookCorpus免費(fèi)開源數(shù)據(jù)集進(jìn)行訓(xùn)練,該數(shù)據(jù)集聲稱所有電子書都是“尚未發(fā)表的免費(fèi)書籍”,但事實(shí)上囊括了很多已發(fā)表的書籍,且并未獲得相關(guān)作者授權(quán)。
(三)作品作為語料需要調(diào)整保護(hù)邊界
傳統(tǒng)權(quán)利保護(hù)思路是私法思考模式,以傳統(tǒng)契約社會(huì)為基礎(chǔ),以個(gè)人權(quán)益的合意變動(dòng)為基本遵循。而數(shù)字經(jīng)濟(jì)背景下,數(shù)據(jù)治理體系則是尊重?cái)?shù)據(jù)特征和數(shù)據(jù)運(yùn)作模式,以發(fā)揮數(shù)據(jù)要素潛能為目的,平衡權(quán)利保護(hù)與數(shù)據(jù)利用的綜合制度體系,不能將負(fù)載在先權(quán)利的數(shù)據(jù)視為完全的私有權(quán)益,并由此導(dǎo)向“私權(quán)絕對(duì)”的保護(hù)模式。弱化個(gè)人控制,強(qiáng)化數(shù)據(jù)資源屬性,調(diào)整作品的絕對(duì)性保護(hù)成為時(shí)代需求和發(fā)展趨勢。在著作權(quán)制度不斷完善過程中,合理使用制度、法定許可制度、“轉(zhuǎn)換性使用”規(guī)則等,均是以實(shí)現(xiàn)公共利益為核心,推動(dòng)著作權(quán)主體保護(hù)與促進(jìn)知識(shí)廣泛傳播的雙向平衡。
在數(shù)據(jù)圈地運(yùn)動(dòng)背景下,機(jī)器訓(xùn)練合法性制度的建構(gòu),也要尊重?cái)?shù)據(jù)特征,突破傳統(tǒng)立法范式,以追求數(shù)據(jù)要素作用發(fā)揮為目標(biāo)。過于強(qiáng)調(diào)和加強(qiáng)原創(chuàng)作者權(quán)利保護(hù),不可避免的會(huì)降低機(jī)器訓(xùn)練效率,增加交易成本,不僅影響公共利益,還會(huì)帶來更多的社會(huì)矛盾和糾紛,出現(xiàn)“權(quán)利人的市場利益得以保全,但以剝奪社會(huì)收獲更明顯的價(jià)值為代價(jià)”的結(jié)果。
不管主觀愿意如何,作品權(quán)利人和社會(huì)可能需要在以下幾方面進(jìn)行理解和調(diào)整:一是作者和著作權(quán)人需要加大對(duì)作品被復(fù)制的理解和容忍。今后,網(wǎng)頁瀏覽、數(shù)據(jù)處理、機(jī)器訓(xùn)練均不可避免地對(duì)作品進(jìn)行復(fù)制以達(dá)到呈現(xiàn)、處理和分析的目的,即在數(shù)字技術(shù)下臨時(shí)復(fù)制具有不可避免性,在機(jī)器訓(xùn)練過程中更是如此。二是作者和著作權(quán)人要逐步接受作品被非作品性使用的方式。在大數(shù)據(jù)時(shí)代,無論是否意識(shí)到,人人都是信息和數(shù)據(jù)提供者,不僅有隱私權(quán)、知識(shí)產(chǎn)權(quán)等保護(hù),也有貢獻(xiàn)信息和數(shù)據(jù)的義務(wù)。尤其是隨著TDM、人工智能的廣泛適用,作品超出預(yù)期表達(dá)范圍的深度挖掘或利用,應(yīng)當(dāng)予以許可。三是整個(gè)社會(huì)要有利益格局調(diào)整和重新定位的預(yù)期和應(yīng)對(duì)。技術(shù)發(fā)展引發(fā)產(chǎn)業(yè)變革,人的勞動(dòng)技能和工作狀態(tài)也在不斷發(fā)生變化,新的產(chǎn)業(yè)與工作崗位不斷涌現(xiàn),手工勞動(dòng)者逐漸變?yōu)闄C(jī)器操作者,蒸汽機(jī)車讓許多馬車夫可以成為火車司機(jī)。AI可能讓許多創(chuàng)作者的原有利益受到損失,甚至工作崗位發(fā)生變化,但不是直接導(dǎo)致其喪失勞動(dòng)機(jī)會(huì)和生活來源,而是要積極適應(yīng)和利用人工智能進(jìn)行創(chuàng)作和盈利的新模式。否則,在人工智能加持下搜索和提供作品模式下,拒絕人工智能可能意味著放棄作品收益。
四、比較不同模式:現(xiàn)有規(guī)則制度的適用性分析
以保護(hù)智力成果的方式激勵(lì)創(chuàng)新,是知識(shí)產(chǎn)權(quán)法尤其是著作權(quán)法的立法目的。在處理機(jī)器訓(xùn)練中的著作權(quán)問題時(shí),當(dāng)前主流的立場也是堅(jiān)持對(duì)在先作品的必要保護(hù)?!恫疇柲峁s》第9條所規(guī)定的復(fù)制權(quán)及其所允許的例外,同樣適用于數(shù)字環(huán)境。歐盟《單一數(shù)字市場版權(quán)指令》在規(guī)定文本和數(shù)據(jù)挖掘(TDM)例外的同時(shí),也提出了互聯(lián)網(wǎng)平臺(tái)盡最大努力獲得版權(quán)方的許可,重申其版權(quán)保護(hù)立場。中國在《生成式人工智能服務(wù)管理暫行辦法》和《生成式人工智能服務(wù)安全基本要求》等法律法規(guī)和行業(yè)標(biāo)準(zhǔn)中明確提出機(jī)器訓(xùn)練要尊重在先知識(shí)產(chǎn)權(quán)的規(guī)定。但學(xué)術(shù)理論和立法及司法實(shí)踐中,針對(duì)AI技術(shù)和互聯(lián)網(wǎng)環(huán)境下作品保護(hù)的必要范圍和方式,出現(xiàn)了大量理論爭論和實(shí)踐差異。
(一)主張構(gòu)成侵權(quán)的觀點(diǎn)
該觀點(diǎn)認(rèn)為,著作權(quán)法是通過保護(hù)成果的方式激勵(lì)創(chuàng)新,機(jī)器訓(xùn)練中對(duì)他人作品復(fù)制并商業(yè)使用的行為,不僅違反現(xiàn)有著作權(quán)法律規(guī)定,也與著作權(quán)立法目的背道而馳。在侵犯著作權(quán)權(quán)項(xiàng)認(rèn)定方面,包括復(fù)制權(quán)、改編權(quán)、翻譯權(quán)、匯編權(quán)等;也有學(xué)者認(rèn)為出于驗(yàn)證挖掘與學(xué)習(xí)結(jié)果、開展關(guān)聯(lián)合作研究以及幫助開展非相關(guān)研究等目的,還可能通過信息網(wǎng)絡(luò)向不特定的多數(shù)人傳播作品復(fù)制件,進(jìn)而侵犯信息網(wǎng)絡(luò)傳播權(quán)、發(fā)行權(quán)或廣播權(quán)。實(shí)踐中,法國競爭管理局經(jīng)過多年的程序后于2024年對(duì)谷歌公司利用媒體平臺(tái)和新聞機(jī)構(gòu)的數(shù)據(jù)進(jìn)行訓(xùn)練的行為開出了2.5億歐元罰單。
筆者認(rèn)為,應(yīng)當(dāng)正視數(shù)據(jù)和數(shù)字時(shí)代發(fā)展需要和趨勢。傳統(tǒng)權(quán)利保護(hù)思路是以私法保護(hù)和契約自由為基礎(chǔ)的模式,公共利益讓位于個(gè)人權(quán)益,發(fā)展思維讓位于權(quán)利保護(hù)。事實(shí)上,著作權(quán)制度的發(fā)展和完善是在前述背景下逐步重視公共利益和發(fā)展思路的過程,合理使用制度、法定許可制度、轉(zhuǎn)換性使用規(guī)則等,均是以實(shí)現(xiàn)公共利益為核心,旨在推動(dòng)著作權(quán)主體保護(hù)與促進(jìn)知識(shí)廣泛傳播的雙向平衡。在數(shù)字經(jīng)濟(jì)時(shí)代,應(yīng)進(jìn)一步根據(jù)數(shù)字技術(shù)、人工智能等發(fā)展進(jìn)行調(diào)整,更加注重尊重?cái)?shù)據(jù)特征和數(shù)據(jù)運(yùn)作模式,以發(fā)揮數(shù)據(jù)要素潛能為目的,平衡權(quán)利保護(hù)與數(shù)據(jù)利用的綜合制度體系。在機(jī)器訓(xùn)練合法性問題上,更需要促進(jìn)數(shù)據(jù)要素作用發(fā)揮。因此,需要在一定程度上、在特定領(lǐng)域逐漸弱化個(gè)人控制,強(qiáng)化數(shù)據(jù)資源屬性。過于強(qiáng)調(diào)和加強(qiáng)原創(chuàng)作者權(quán)利保護(hù),不可避免的會(huì)降低機(jī)器訓(xùn)練效率,增加交易成本,不僅影響公共利益,還會(huì)帶來更多的社會(huì)矛盾和糾紛。而且,在許多國家和地區(qū)通過立法、司法確認(rèn)TDM例外、非作品性利用等規(guī)則的趨勢下,一刀切認(rèn)定機(jī)器訓(xùn)練構(gòu)成著作權(quán)侵權(quán)的做法已經(jīng)不能被時(shí)代接受。
(二)主張豁免或例外的觀點(diǎn)
該觀點(diǎn)目前占據(jù)主流地位,主張考慮到國際競爭、產(chǎn)業(yè)發(fā)展、版權(quán)保護(hù)、激勵(lì)創(chuàng)作和技術(shù)創(chuàng)新、公共價(jià)值和市場許可機(jī)制可行性等因素,機(jī)器訓(xùn)練應(yīng)當(dāng)給予豁免或例外對(duì)待。同時(shí),從著作權(quán)人利益角度出發(fā),認(rèn)為“生成式人工智能(GenAI)應(yīng)用對(duì)著作權(quán)人并未造成整體激勵(lì)的削弱,只是導(dǎo)致了激勵(lì)行為的結(jié)構(gòu)性調(diào)整,因而不需要將著作權(quán)保護(hù)延伸至數(shù)據(jù)訓(xùn)練來予以補(bǔ)償”。該觀點(diǎn)并不否認(rèn)機(jī)器訓(xùn)練中的復(fù)制等行為落入復(fù)制權(quán)等著作權(quán)權(quán)項(xiàng)范圍,但出于鼓勵(lì)技術(shù)和產(chǎn)業(yè)發(fā)展角度出發(fā),應(yīng)當(dāng)減輕甚至豁免機(jī)器訓(xùn)練中AI服務(wù)提供者的責(zé)任,其主要路徑可以分為合理使用路徑、TDM例外路徑、法定許可路徑等。
1.“合理使用”路徑
合理使用制度最早起源于英國普通法,理由在于“當(dāng)?shù)诙€(gè)作者以創(chuàng)造和創(chuàng)新的方式使用他人受保護(hù)的作品時(shí),其結(jié)果是學(xué)術(shù)的進(jìn)步而非剝削第一個(gè)作者”。目前,合理使用制度已經(jīng)被廣泛認(rèn)可和實(shí)施?!恫疇柲峁s》(1979年)第9條第2款規(guī)定了關(guān)于復(fù)制權(quán)項(xiàng)下合理使用的條件,類似的規(guī)定還可以在《與貿(mào)易有關(guān)的知識(shí)產(chǎn)權(quán)協(xié)定》(TRIPs)第13條和《世界貿(mào)易組織版權(quán)條約》第10條,其適用條件被稱為“三步檢驗(yàn)法”。其中,對(duì)“某些特殊情況”一般理解為要求不能濫用合理使用制度的原則性條款;作品的正常利用可以理解為欣賞、閱讀、研究等利用,而數(shù)據(jù)訓(xùn)練中的復(fù)制行為顯然不屬于該情形;而不得不合理地?fù)p害版權(quán)持有者的合法利益,一般指向?yàn)楣怖嫦拗浦鳈?quán),機(jī)器訓(xùn)練是否具備該要件存在較大爭議。在美國,其版權(quán)法第107條規(guī)定了合理使用制度,法院通過谷歌圖書館案和TVEyes案確立了“轉(zhuǎn)換性使用”的判例標(biāo)準(zhǔn)?;诖?,面對(duì)系列訴訟,OpenAI堅(jiān)持認(rèn)為數(shù)據(jù)訓(xùn)練行為構(gòu)成合理使用。
中國合理使用條款吸收了三步檢驗(yàn)法的精神實(shí)質(zhì),同時(shí)采取列舉和兜底條款的方式限制范圍,包括個(gè)人研究、適當(dāng)引用、新聞報(bào)道、時(shí)事和講話轉(zhuǎn)載、教學(xué)科研、執(zhí)行公務(wù)、陳列收藏、免費(fèi)表演、公共藝術(shù)、少數(shù)民族語言翻譯、去除閱讀障礙和其他法律、行政法規(guī)規(guī)定的其他情形。另外,上海知識(shí)產(chǎn)權(quán)法院審理在“《80后的獨(dú)立宣言》案”甚至引用了“轉(zhuǎn)換性使用”的概念并將其解釋進(jìn)合理使用條款。但對(duì)機(jī)器訓(xùn)練而言,其行為目的、主體、性質(zhì)、程度等因素使得難以直接適用前述條款,兜底條款“其他法律、行政法規(guī)規(guī)定的其他情形”有待于相關(guān)立法予以明確。例如,機(jī)器訓(xùn)練一般被定性為商業(yè)行為,為了防止AI偏見往往需要對(duì)作品進(jìn)行全文復(fù)制更非適當(dāng)引用。因此,多數(shù)觀點(diǎn)認(rèn)為我國現(xiàn)行著作權(quán)法的合理使用條款不能很好地適應(yīng)AI發(fā)展需要,主張應(yīng)當(dāng)單獨(dú)增設(shè)有關(guān)AI的合理使用的條款或是采取開放式的合理使用條款。
筆者認(rèn)為,當(dāng)前合理使用制度并不符合中國實(shí)際。首先,如前所述,現(xiàn)有法律規(guī)定沒有可以將機(jī)器訓(xùn)練解釋適用的空間。其次,轉(zhuǎn)換性使用思路也有明顯的問題,該規(guī)則源于美國判例,本身適用范圍尚未經(jīng)過更多情況案例的檢驗(yàn),在成文法國家的適用存在困難。同時(shí)轉(zhuǎn)換性使用在操作中存在標(biāo)準(zhǔn)不清晰的問題,何謂變革難以把握,更容易引起爭議。再次,在新技術(shù)、新產(chǎn)業(yè)和新利益背景下,鑒于機(jī)器訓(xùn)練的規(guī)模和重要性,應(yīng)當(dāng)賦予其正常使用或合法使用的定位。目前國內(nèi)外合理使用制度是以作者中心主義、私權(quán)絕對(duì)保護(hù)為前提。但隨著技術(shù)和產(chǎn)業(yè)發(fā)展,機(jī)器訓(xùn)練已經(jīng)逐漸成為海量的、主流的、普遍的使用形式,不宜再被稱為“例外”。
2.“TDM例外”路徑
TDM技術(shù)和概念出現(xiàn)于20世紀(jì)末,是指從大量信息中運(yùn)用技術(shù)以獲取模式、趨勢及其他有用的信息的過程,分為文本挖掘和數(shù)據(jù)挖掘。數(shù)據(jù)挖掘以數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)為對(duì)象,是抽取基本已知的或可預(yù)料的知識(shí)過程。文本挖掘以文本、圖片或音視頻等半結(jié)構(gòu)化或非結(jié)構(gòu)化材料為對(duì)象,是抽取事先未知的知識(shí)的過程。截至目前,歐盟、英國、法國、德國、日本、韓國和新加坡等國家和地區(qū)都在立法中明確了TDM例外規(guī)則。2014年修訂的《英國版權(quán)法》新增第29A條、歐盟《數(shù)字單一市場版權(quán)指令》第3條和第4條、歐盟《人工智能法案》第60i條和第60g條、德國著作權(quán)法第60(d)條等規(guī)定了TDM例外。我國現(xiàn)行《著作權(quán)法》的合理使用條款不包括明確的TDM相關(guān)內(nèi)容,但司法實(shí)踐走在了前面。在“讀秀網(wǎng)”案中,法院認(rèn)為被訴行為旨在為讀者了解圖書內(nèi)容和作者的基本思路、表達(dá)方式提供便利,極少量的正文閱覽未超過合理范圍,并沒有對(duì)原告作品市場價(jià)值產(chǎn)生任何負(fù)面的影響,也沒有對(duì)其作品的正當(dāng)使用產(chǎn)生任何不正當(dāng)?shù)膿p害,構(gòu)成合理使用。在制度完善方面,有觀點(diǎn)認(rèn)為應(yīng)當(dāng)以“法律、行政法規(guī)規(guī)定的其他情形”為依據(jù),通過《著作權(quán)法實(shí)施條例》等規(guī)定引入數(shù)據(jù)挖掘?qū)iT例外;有學(xué)者認(rèn)為應(yīng)當(dāng)明確引入“文本和數(shù)據(jù)挖掘”(TDM)例外規(guī)則并將機(jī)器訓(xùn)練納入該規(guī)則。
(1)TDM和機(jī)器訓(xùn)練的關(guān)系
有觀點(diǎn)認(rèn)為,TDM通常是機(jī)器訓(xùn)練的必需步驟,機(jī)器訓(xùn)練是數(shù)據(jù)挖掘的內(nèi)在技術(shù),如果為數(shù)據(jù)挖掘制定了相關(guān)例外,該例外也可以適用于機(jī)器訓(xùn)練。甚至有觀點(diǎn)認(rèn)為機(jī)器訓(xùn)練就是TDM,故機(jī)器訓(xùn)練應(yīng)完全適用TDM例外。另一種觀點(diǎn)認(rèn)為,AI機(jī)器訓(xùn)練和TDM并不完全相同,同時(shí)為了增加針對(duì)性,可以單獨(dú)設(shè)立AI訓(xùn)練作為合理使用的一種新增方式。
TDM與機(jī)器訓(xùn)練存在共同點(diǎn)和密切聯(lián)系。首先,兩者功能上互相支持。在TDM技術(shù)中,自然語言處理技術(shù)是文本挖掘的主要技術(shù)手段,可以增強(qiáng)TDM的質(zhì)量和效率。在機(jī)器訓(xùn)練中,TDM可以為機(jī)器訓(xùn)練提供豐富的結(jié)構(gòu)化數(shù)據(jù)。其次,兩者技術(shù)上互相融合。TDM的經(jīng)典算法中,C4.5、CART屬于典型的決策樹算法,k-Means是典型的神經(jīng)網(wǎng)絡(luò)算法,這些算法也是機(jī)器訓(xùn)練的常用算法。
但同時(shí),機(jī)器訓(xùn)練和TDM存在諸多區(qū)別:
一是功能和目的方面,TDM擅長提取和統(tǒng)計(jì),以服務(wù)智能決策為目的,在設(shè)定算法下進(jìn)行“挖掘”,以超越人工精度和效率的優(yōu)勢發(fā)現(xiàn)隱藏的模式、趨勢和規(guī)律,并利用數(shù)據(jù)庫技術(shù)進(jìn)行數(shù)據(jù)管理,例如通過廣泛或定向讀取社交平臺(tái)的內(nèi)容和評(píng)論實(shí)現(xiàn)輿情分析。而機(jī)器訓(xùn)練擅長吸收和學(xué)習(xí),以增強(qiáng)AI能力為目的,以訓(xùn)練機(jī)器模型或算法標(biāo)注數(shù)據(jù)的方法,通過量化數(shù)據(jù)中的最優(yōu)參數(shù)來提升機(jī)器模型完成任務(wù)質(zhì)量與效率。因此,TDM是挖掘語料得出隱藏的規(guī)律,機(jī)器訓(xùn)練是吸收語料實(shí)現(xiàn)模擬的目的。
二是行為和過程方面,有研究將TDM過程歸納為抽取、清洗轉(zhuǎn)換和加載數(shù)據(jù)倉庫的過程,細(xì)分為:關(guān)鍵詞提取和文本摘要、文本分類和聚類、生成主題、觀點(diǎn)抽取和情感分析。另外,為了存儲(chǔ)TDM形成的成果,還涉及TDM成果的存儲(chǔ)、公開等行為。在國外TDM例外規(guī)則中,除了共同涉及復(fù)制行為外,一些國家還涉及改編、匯編、公開和傳播等行為。從行為過程看,TDM涉及著作權(quán)問題的環(huán)節(jié)主要有數(shù)據(jù)收集和文本預(yù)處理階段和挖掘出內(nèi)容的利用階段。數(shù)據(jù)收集和文本預(yù)處理階段,主要涉及復(fù)制和匯編等行為,易引發(fā)TDM侵犯他人作品復(fù)制權(quán)等著作權(quán)的指控。挖掘出內(nèi)容的利用階段,例如,挖掘出的結(jié)論能否向公眾或特定第三方公開或提供等。而機(jī)器訓(xùn)練行為涉及的著作權(quán)問題主要集中在抽取、清洗轉(zhuǎn)換階段,一般不考慮利用和生成。這種過程和行為的差別,使得TDM例外規(guī)則中關(guān)于長期保存以及向獨(dú)立第三方公開等不適用于機(jī)器訓(xùn)練。
三是后續(xù)行為對(duì)作品權(quán)利影響的區(qū)別。盡管TDM也存在輸出內(nèi)容,但其輸出內(nèi)容往往以數(shù)據(jù)庫、簡單文本和數(shù)據(jù)的形式存在,一般不會(huì)影響著作權(quán)保護(hù)。在GenAI中,尤其是表達(dá)型機(jī)器訓(xùn)練的后續(xù)行為包括文本、圖片、視頻等內(nèi)容的輸出,極有可能出現(xiàn)與學(xué)習(xí)過的作品存在“實(shí)質(zhì)性相似”的問題。對(duì)于立法而言,歐盟等國家在主體、目的、行為等方面進(jìn)行了限定,但很明顯并未充分考慮機(jī)器訓(xùn)練的技術(shù)特點(diǎn),不少機(jī)器訓(xùn)練行為并未被TDM行為所涵蓋,這使得機(jī)器訓(xùn)練中表達(dá)型訓(xùn)練行為等存在立法空白。
3.“法定許可”路徑
該觀點(diǎn)認(rèn)為,基于互聯(lián)網(wǎng)共享共建的特點(diǎn)和數(shù)據(jù)資源互聯(lián)互通的需要,默示認(rèn)可將作品放入了一種不可控的狀態(tài),而要實(shí)現(xiàn)控制需要付出一定成本。尤其是在互聯(lián)網(wǎng)環(huán)境、機(jī)器訓(xùn)練大背景下,著作權(quán)從“未經(jīng)許可而使用即構(gòu)成侵權(quán)”轉(zhuǎn)變?yōu)椤白髌芬坏┥蟼鞯交ヂ?lián)網(wǎng)即推定允許爬蟲抓取和搜索索引,除非設(shè)置有技術(shù)措施”的狀態(tài)。法定許可制度允許可以不經(jīng)著作權(quán)人允許而匯編他人作品的行為,但限定了行為目的、范圍和方式,且規(guī)定了應(yīng)當(dāng)署名并支付報(bào)酬。相對(duì)于合理使用制度,法定許可更加尊重著作權(quán)人的財(cái)產(chǎn)權(quán)利。因此,有觀點(diǎn)認(rèn)為在AI機(jī)器訓(xùn)練中適用法定許可優(yōu)于合理使用制度,并認(rèn)為待區(qū)塊鏈技術(shù)發(fā)展到一定階段,機(jī)器訓(xùn)練訓(xùn)練素材的使用規(guī)則可以逐漸轉(zhuǎn)向法定許可。同時(shí),為了增強(qiáng)法定許可背景下收取費(fèi)用的可操作性,學(xué)者建議兩種途徑:其一,對(duì)TDM行為征稅,進(jìn)而通過財(cái)政支出的方式解決。其二,建立集體管理組織統(tǒng)一收費(fèi)來補(bǔ)償訓(xùn)練數(shù)據(jù)的著作權(quán)人,或建立一個(gè)類似于歐盟在《數(shù)據(jù)治理法》中設(shè)想的“個(gè)人數(shù)據(jù)共享中介機(jī)構(gòu)”。
筆者認(rèn)為,我國著作權(quán)法關(guān)于法定許可的規(guī)定顯然無法解釋和適用于機(jī)器訓(xùn)練行為。另外,盡管法定許可思路可以消除交流傳播壁壘,一定程度上降低交易成本,同時(shí)也能滿足著作權(quán)人的財(cái)產(chǎn)權(quán)益,但不可否認(rèn)的是一些著作權(quán)人可能擔(dān)心作品使用失去控制而損失利益,進(jìn)而選擇逃避而不將作品在互聯(lián)網(wǎng)公開,這必然會(huì)導(dǎo)致互聯(lián)網(wǎng)上高質(zhì)量內(nèi)容的減少或質(zhì)量下降,反而有悖于互聯(lián)網(wǎng)共享共建、互聯(lián)互通的初衷。
4.“數(shù)據(jù)權(quán)益”路徑
該觀點(diǎn)認(rèn)為,機(jī)器訓(xùn)練語料中數(shù)據(jù)占據(jù)主要部分,無論AI立法還是數(shù)據(jù)相關(guān)立法,都應(yīng)當(dāng)把數(shù)據(jù)的應(yīng)用場景作為立法研究的對(duì)象,進(jìn)而能夠使AI立法和數(shù)據(jù)立法更為科學(xué)化。類似的觀點(diǎn)認(rèn)為,應(yīng)打破著作權(quán)、隱私權(quán)等權(quán)利領(lǐng)域的限制,基于各項(xiàng)權(quán)利內(nèi)容數(shù)據(jù)化后的共性,設(shè)立訓(xùn)練數(shù)據(jù)獲取的有限許可豁免規(guī)則。甚至有觀點(diǎn)主張可以將“合法獲取”作為數(shù)據(jù)訓(xùn)練、流媒體翻錄等行為的合法要件。
筆者認(rèn)為,該路徑當(dāng)前缺乏操作性。暫不論數(shù)據(jù)相關(guān)制度的建立存在較大爭議,成熟實(shí)施之日尚不可期,該思路繞開了現(xiàn)有著作權(quán)制度,但難以和著作權(quán)制度進(jìn)行協(xié)調(diào),可能存在制度和法律沖突。另外,機(jī)器訓(xùn)練的對(duì)象不僅包括數(shù)據(jù),還包括大量非結(jié)構(gòu)化、非電子化的文本、音視頻等內(nèi)容,數(shù)據(jù)權(quán)益思路的適用顯然不具有通用性。
(三)主張不構(gòu)成侵權(quán)的觀點(diǎn)
主張不構(gòu)成侵權(quán)的觀點(diǎn)集中在認(rèn)為機(jī)器訓(xùn)練屬于“非作品性使用”。所謂作品的非作品性使用,也稱非表達(dá)性使用或非展示性使用,是指使用原作品的目的并非為了利用其具有獨(dú)創(chuàng)性的表達(dá),而是將其作為一種事實(shí)性信息進(jìn)行功能性利用,在使用結(jié)果上也未再現(xiàn)原作品。作品性使用,也稱表達(dá)性使用或展示性使用,則是利用作品獨(dú)創(chuàng)性表達(dá),再現(xiàn)了其藝術(shù)價(jià)值。實(shí)踐中,日本著作權(quán)法將使用作品區(qū)分為為了享受目的而使用作品和為了非享受目的而使用作品兩種形式,該法第30條第4款明確表述為“不以享受作品思想或感情為目的的利用”,在列舉的情形中包括:“用于信息分析的情形”和“在電子計(jì)算機(jī)信息處理過程中對(duì)作品表達(dá)所進(jìn)行的不被人類感知和識(shí)別的使用情形”。日本文化廳對(duì)此的解讀為:擴(kuò)大了對(duì)于著作權(quán)的限制,迎接以人工智能、物聯(lián)網(wǎng)和大數(shù)據(jù)為代表的第四次產(chǎn)業(yè)革命。
關(guān)于非作品性使用的與合理使用的關(guān)系。一種觀點(diǎn)認(rèn)為,將“非作品性使用”作為合理使用的一種情形。例如,除了日本著作權(quán)法也將非作品性使用作為合理使用的一種情形加以規(guī)定外,在“美國作家協(xié)會(huì)訴谷歌公司著作權(quán)侵權(quán)糾紛”一案中,法院認(rèn)定被訴性構(gòu)成轉(zhuǎn)換性使用,進(jìn)而援引其版權(quán)法中合理使用條款。另一種觀點(diǎn)則將其作為獨(dú)立的一種侵權(quán)抗辯理由,類似于商標(biāo)法領(lǐng)域的“非商標(biāo)性使用”,有學(xué)者建議著作權(quán)法宜明確規(guī)定復(fù)制權(quán)只控制出于欣賞作品的目的而進(jìn)行的復(fù)制行為,進(jìn)而排除非表達(dá)性使用過程中復(fù)制行為的違法性;有贊成該觀點(diǎn)的學(xué)者認(rèn)為,這種方案從權(quán)利范圍“直接排除”保護(hù)的方案總體上優(yōu)于“先進(jìn)后出”的合理使用方案。
關(guān)于“非作品性使用”是否適用于機(jī)器訓(xùn)練??隙ㄐ杂^點(diǎn)認(rèn)為,機(jī)器訓(xùn)練“既不關(guān)心作品的特定表達(dá),也不關(guān)心作品通過表達(dá)所傳遞的特定信息或者思想,是將作品的表達(dá)全面打碎之后,從中計(jì)算和分析人類語言的規(guī)律”;另外,從對(duì)作品價(jià)值影響角度看,即使控制相關(guān)數(shù)字化復(fù)制行為也不能起到促進(jìn)其與社會(huì)公眾對(duì)話交流的作用,對(duì)影響作品價(jià)值和市場收益營銷很小。
筆者認(rèn)為,機(jī)器訓(xùn)練中對(duì)作品的使用包括所謂“非作品性使用”,也包括“作品性使用”。正如前文分析, GenAI的機(jī)器訓(xùn)練可以分為非表達(dá)型和表達(dá)型機(jī)器訓(xùn)練,其中表達(dá)型學(xué)習(xí)會(huì)通過特定算法保持和捕捉作品表達(dá)本身的特點(diǎn)、風(fēng)格等,涉及對(duì)文學(xué)、藝術(shù)甚至是科學(xué)作品表達(dá)的作品性使用。因此,“非作品性使用”理由不完全適用于機(jī)器訓(xùn)練的全部行為,不足以將機(jī)器訓(xùn)練從侵權(quán)嫌疑中置身事外。
五、探索現(xiàn)行方案:機(jī)器訓(xùn)練合法性的判斷思路
無論是合理使用制度、TDM例外制度還是非作品使用制度,在AI機(jī)器訓(xùn)練中的適用均存在不完善之處。由于機(jī)器訓(xùn)練的技術(shù)復(fù)雜性、內(nèi)容特點(diǎn)的多樣性和證據(jù)取得困難性,難以建立統(tǒng)一、可操作性的機(jī)制或制度處理在先著作權(quán)問題。
(一)機(jī)器訓(xùn)練合法性判斷要點(diǎn)分析
1.區(qū)分永久復(fù)制和臨時(shí)復(fù)制進(jìn)行分別處理
復(fù)制行為是機(jī)器訓(xùn)練過程中主要被訴侵權(quán)行為。在機(jī)器訓(xùn)練過程中,除了收集階段之后可能出現(xiàn)的永久復(fù)制行為,在數(shù)據(jù)處理環(huán)節(jié)也存在臨時(shí)復(fù)制行為。對(duì)于永久復(fù)制行為的評(píng)價(jià),機(jī)器訓(xùn)練與其他復(fù)制行為并無差別,屬于著作權(quán)人的著作財(cái)產(chǎn)權(quán)控制范圍。問題主要集中在數(shù)據(jù)處理環(huán)節(jié)的臨時(shí)復(fù)制行為。
《伯爾尼公約》第9條所規(guī)定的復(fù)制權(quán)及其所允許的例外,同樣適用于數(shù)字環(huán)境。但其復(fù)制權(quán)的概念并不清晰。在1996年《世界知識(shí)產(chǎn)權(quán)組織版權(quán)條約》(WCT)議定過程中,美國和歐盟堅(jiān)持將臨時(shí)復(fù)制和永久復(fù)制同時(shí)明確納入其中復(fù)制權(quán)的范圍條款,但并未成功。因此,國際條約上的臨時(shí)復(fù)制行為是否具有永久復(fù)制行為相同的法律效果尚無明確標(biāo)準(zhǔn),而是交由各成員國自行決定,主要兩種方式處理:一是以歐盟為例將臨時(shí)復(fù)制權(quán)歸于著作權(quán)人,但通過例外或合理使用的制度給予豁免?!稓W盟議會(huì)和理事會(huì)關(guān)于協(xié)調(diào)信息社會(huì)中版權(quán)和相關(guān)權(quán)某些方面的指令》(又稱《信息社會(huì)版權(quán)指令》)明確將各種暫時(shí)復(fù)制排除在復(fù)制權(quán)范圍之外。第2條規(guī)定了作者就其作品享有授權(quán)或禁止直接地或間接地、臨時(shí)地或永久地以任何方式或形式全部或部分復(fù)制的專有權(quán),但第5條規(guī)定了如果是短暫的或偶然的[以及]是技術(shù)過程中必要的不可分割的組成部分,在特定目的下應(yīng)免除復(fù)制權(quán)。二是不將臨時(shí)復(fù)制權(quán)歸于著作權(quán)人,臨時(shí)復(fù)制行為不存在侵權(quán)問題。例如,英國1988年《版權(quán)、外觀設(shè)計(jì)和專利法》第28A條規(guī)定,臨時(shí)、短暫復(fù)制文藝作品,這種復(fù)制是網(wǎng)絡(luò)傳輸技術(shù)過程不可或缺,并有合法使用目的且不具有獨(dú)立經(jīng)濟(jì)意義,則不侵犯版權(quán)。
筆者認(rèn)為,在數(shù)字技術(shù)背景下,網(wǎng)頁瀏覽、數(shù)據(jù)處理、機(jī)器訓(xùn)練過程中均不可避免對(duì)作品進(jìn)行臨時(shí)復(fù)制以達(dá)到呈現(xiàn)、處理和分析的目的,即在數(shù)字技術(shù)下臨時(shí)復(fù)制具有不可避免性,在機(jī)器訓(xùn)練過程中更是如此。因此,根據(jù)現(xiàn)實(shí)技術(shù)需要,參考國外立法例,應(yīng)將明確排除機(jī)器訓(xùn)練過程中的臨時(shí)復(fù)制行為的侵權(quán)性。
2.根據(jù)作品類型和使用方式進(jìn)行具體分析
著作權(quán)法意義上的作品主要分為文學(xué)、藝術(shù)和科學(xué)作品。其中文學(xué)作品包括文字作品和口述作品,藝術(shù)作品包括音樂、戲劇、曲藝、舞蹈、雜技藝術(shù)作品、美術(shù)作品、建筑作品、攝影作品、視聽作品等,科學(xué)作品包括工程設(shè)計(jì)圖、產(chǎn)品設(shè)計(jì)圖、地圖、示意圖等圖形作品、模型作品以及計(jì)算機(jī)軟件等。對(duì)文學(xué)和藝術(shù)作品而言,使用者意在欣賞和享受的價(jià)值,獲取這種價(jià)值的方式是閱讀、觀看、聽取等感官方式;作者的著作權(quán)是基于欣賞和享受而獲取財(cái)物對(duì)價(jià)和精神自尊及商譽(yù)。而對(duì)于科學(xué)作品而言,使用者意在使用符合自然規(guī)律的設(shè)計(jì)價(jià)值,獲取這種價(jià)值的方式是閱讀并通過實(shí)施、模仿等再現(xiàn)方式使用;作者的著作權(quán)是基于這種實(shí)用性和科學(xué)性而獲取財(cái)物對(duì)價(jià)和精神自尊及商譽(yù)。
作者在提供各種作品的利益應(yīng)當(dāng)有邊界,這個(gè)邊界就是作者對(duì)其作品價(jià)值的預(yù)期利益,包括享受內(nèi)容、使用方式等。如果使用者通過特定方式在該預(yù)期中獲得價(jià)值,就應(yīng)當(dāng)獲取許可并支付對(duì)價(jià)。例如,文學(xué)和藝術(shù)作品通過閱讀獲得故事情節(jié)最終實(shí)現(xiàn)精神對(duì)話或感動(dòng),這種作品行使方式是著作權(quán)可以控制的方式;但如果對(duì)文學(xué)藝術(shù)作品通過數(shù)據(jù)分析、信息提取等方式進(jìn)行科學(xué)研究,就不是文學(xué)藝術(shù)作品的作者可以控制的方式,也可以稱為非作品性使用。
首先,對(duì)文學(xué)和藝術(shù)作品而言,其主要價(jià)值是被人類受眾欣賞和享受,作者或權(quán)利人的預(yù)期和權(quán)利邊界也應(yīng)當(dāng)限于此。如果機(jī)器訓(xùn)練過程中采取表達(dá)性訓(xùn)練,捕捉和提取其表達(dá)特征,例如文字的主謂賓特點(diǎn)、美術(shù)作品的色彩和線條特點(diǎn)、音樂作品的旋律關(guān)聯(lián)性、舞蹈作品的連續(xù)性動(dòng)作和標(biāo)志性動(dòng)作等,可能用于生成AIGC,該行為一般認(rèn)定為作品性訓(xùn)練或表達(dá)性訓(xùn)練,可能構(gòu)成侵權(quán)行為。如果僅進(jìn)行非表達(dá)訓(xùn)練,如對(duì)《紅樓夢》中人物數(shù)量、態(tài)度、行為、情節(jié)等信息進(jìn)行提取和統(tǒng)計(jì),則認(rèn)定為非作品性訓(xùn)練或非表達(dá)性訓(xùn)練,不宜認(rèn)定為侵權(quán)行為。
其次,對(duì)科學(xué)作品而言,圖形作品和模型作品的設(shè)計(jì)受功能性影響而設(shè)計(jì)和表達(dá)空間相對(duì)有限,其表達(dá)幾乎完全可以被機(jī)器模仿或重新排列組合。而對(duì)科學(xué)作品中的計(jì)算機(jī)軟件而言,鑒于計(jì)算機(jī)軟件的特殊性,一般無法區(qū)分作品性使用和非作品性使用。因此,科學(xué)作品的訓(xùn)練應(yīng)當(dāng)視為是作品性訓(xùn)練或表達(dá)性訓(xùn)練。
3.關(guān)聯(lián)復(fù)制行為與后續(xù)行為進(jìn)行綜合評(píng)價(jià)
永久或長期復(fù)制在機(jī)器訓(xùn)練中時(shí)常發(fā)生。在機(jī)器訓(xùn)練中,除了進(jìn)行正常訓(xùn)練外,還需要進(jìn)行驗(yàn)證,或者在強(qiáng)化訓(xùn)練階段通過互動(dòng)對(duì)已有參數(shù)進(jìn)行調(diào)整。這種技術(shù)客觀需求也得到了部分立法的支持。在與機(jī)器訓(xùn)練具有技術(shù)交叉關(guān)系的TDM例外規(guī)則中,歐盟、英國、德國、法國、日本、新加坡等已經(jīng)在TDM例外中明確將復(fù)制作為例外情形,且沒有明確區(qū)分永久復(fù)制和臨時(shí)復(fù)制,其中歐盟允許保留用于驗(yàn)證成果,也可以保留到必要時(shí)為止,德國甚至允許對(duì)數(shù)據(jù)庫作品“允許傳送給圖書館、檔案館、博物館及教育機(jī)構(gòu)進(jìn)行長期保存”。
在機(jī)器訓(xùn)練中,永久復(fù)制行為是否侵權(quán)應(yīng)當(dāng)結(jié)合其后續(xù)行為一并評(píng)價(jià)。有學(xué)者認(rèn)為,復(fù)制行為如果失去作為后續(xù)傳播的預(yù)判功能,本身已難以成為判定侵權(quán)的合理依據(jù)。也有學(xué)者認(rèn)為,如果在復(fù)制后產(chǎn)生了出售、展覽等變現(xiàn)行為獲取收益,才屬于著作權(quán)法所明令禁止的復(fù)制行為。甚至有學(xué)者主張,宜明確規(guī)定復(fù)制權(quán)只控制出于欣賞作品的目的而進(jìn)行的復(fù)制行為。中國司法實(shí)踐中已經(jīng)出現(xiàn)類似案例,在2013年“《鹽酸情人》案”中,作家王莘起訴稱谷歌公司的谷歌數(shù)字“圖書搜索”行為侵害了其對(duì)《鹽酸情人》一書的著作權(quán)。法院便將谷歌公司的復(fù)制行為視作合理使用的前置行為,不再單獨(dú)予以評(píng)價(jià)。在AI領(lǐng)域,有學(xué)者認(rèn)為,如果在生成內(nèi)容時(shí)發(fā)現(xiàn)對(duì)于在先作品的利用僅限于事實(shí)性,可以視為合理使用;而如果在生成內(nèi)容時(shí)發(fā)現(xiàn)機(jī)器提取其表達(dá),就是在以AI的名義對(duì)原始作品進(jìn)行簡單剪切和拼接,在先訓(xùn)練語料的行為也不能再視為合理使用。
作品被數(shù)據(jù)化“復(fù)制”行為更不宜單獨(dú)評(píng)價(jià)。如果臨時(shí)復(fù)制后并進(jìn)行長時(shí)間或永久保存,或進(jìn)行實(shí)質(zhì)性相似的呈現(xiàn),或生成內(nèi)容完全替代了原作品價(jià)值進(jìn)而導(dǎo)致作者利益受損,認(rèn)定后續(xù)行為與臨時(shí)復(fù)制行為均構(gòu)成侵權(quán)。而如果僅僅是出于機(jī)器訓(xùn)練目的,并未發(fā)現(xiàn)其他侵權(quán)行為或結(jié)果,則不宜單獨(dú)評(píng)價(jià)臨時(shí)復(fù)制行為。事實(shí)上,這種臨時(shí)復(fù)制行為也是難以被發(fā)現(xiàn)和舉證的,往往在后續(xù)行為出現(xiàn)侵權(quán)之后才可以推定或證明臨時(shí)復(fù)制行為的存在。所以,從應(yīng)然和實(shí)然角度來講,機(jī)器訓(xùn)練中的復(fù)制行為應(yīng)當(dāng)關(guān)聯(lián)后續(xù)行為進(jìn)行綜合評(píng)價(jià)。
(二)機(jī)器訓(xùn)練合法性判斷邏輯建議
第一步,根據(jù)證據(jù)判斷被訴行為的種類,包括復(fù)制行為和匯編行為、改編行為。對(duì)于匯編行為和改編行為按照普通著作權(quán)侵權(quán)進(jìn)行認(rèn)定,對(duì)于復(fù)制行為進(jìn)入下一步。
第二步,判斷復(fù)制行為是永久復(fù)制行為還是臨時(shí)復(fù)制行為,臨時(shí)復(fù)制行為不認(rèn)定為侵權(quán),永久復(fù)制行為問題進(jìn)入下一步。
第三步,對(duì)于永久復(fù)制行為,區(qū)分作品是文學(xué)作品、藝術(shù)作品和科學(xué)作品。對(duì)于科學(xué)作品,進(jìn)入下一步;對(duì)于文學(xué)和藝術(shù)作品,需要根據(jù)訓(xùn)練目的和訓(xùn)練行為判斷是作品性訓(xùn)練還是非作品性訓(xùn)練;對(duì)于非作品性訓(xùn)練,建議參考TDM例外規(guī)則或轉(zhuǎn)換性使用規(guī)則,明確其合法性;對(duì)于作品性訓(xùn)練行為而言,進(jìn)入下一步。
第四步,對(duì)于作品性訓(xùn)練行為,關(guān)聯(lián)復(fù)制行為與后續(xù)行為進(jìn)行綜合評(píng)價(jià)。
六、結(jié)語
機(jī)器訓(xùn)練合法性問題交織著稀缺性的爭奪,也存在權(quán)益的爭奪,需要在鼓勵(lì)創(chuàng)新和發(fā)展的“指揮棒”下平衡多方利益,尤其是著作權(quán)人應(yīng)當(dāng)適用人工智能和數(shù)字經(jīng)濟(jì)時(shí)代數(shù)據(jù)圈地運(yùn)動(dòng)背景下對(duì)著作權(quán)邊界的調(diào)整和生產(chǎn)關(guān)系的變更。在現(xiàn)有TDM例外規(guī)則、合理使用規(guī)則、法定許可規(guī)則等具有可借鑒之處,但缺乏對(duì)機(jī)器訓(xùn)練的貼合性和適用性。同時(shí),機(jī)器訓(xùn)練的行為、對(duì)象、目的具有多元性和復(fù)雜性,難以進(jìn)行一刀切的評(píng)判。應(yīng)當(dāng)根據(jù)行為對(duì)象、目的、性質(zhì)和作品類型以及對(duì)著作權(quán)人的利益沖擊等因素進(jìn)行合法性判斷。對(duì)于機(jī)器訓(xùn)練過程中的其他行為,應(yīng)當(dāng)按照普通著作權(quán)侵權(quán)規(guī)則處理。對(duì)于復(fù)制行為,大部分應(yīng)當(dāng)具有合法性,而侵權(quán)的認(rèn)定有賴于生成內(nèi)容的侵權(quán)認(rèn)定,進(jìn)而推斷出復(fù)制行為與生成行為關(guān)聯(lián)侵權(quán)。這既符合侵權(quán)行為結(jié)果作為侵權(quán)要件,也符合實(shí)踐中侵權(quán)證據(jù)發(fā)現(xiàn)的規(guī)律。
Legality Analysis of Artificial Intelligence Training Other People’s Works under the Background of Data Enclosure Movement——From the Perspective of Technological Process, Innovation Incentive and Data Equity
Abstract: In the era of artificial intelligence and the Internet, machine training has increasingly become an important way of knowledge dissemination and exchange. Corpus is a key factor affecting the ability and level of artificial intelligence. Works are irreplaceable and high-quality training corpus, but they are faced with a large number of infringement allegations and disputes, and lack of targeted and clear handling rules. In the process of machine training, copying behavior is a necessary behavior and the focus of controversy. The current TDM exception rules, fair use rules and statutory licensing rules are difficult to properly cope with the complexity of training behavior, object and purpose and subsequent behavior. Due to the practical problems of high training cost and many disputes, this paper tries to focus on the replication behavior in training from the perspective of technical process, innovation incentive and data fairness, and on the basis of comparing the applicability of relevant rules, advocating a step-by-step and comprehensive evaluation according to the process of the accused behavior, the type of work and the training method combined with subsequent behaviors.
Keywords: Artificial Intelligence; Machine Training; Copyright; Fair Use; Creative Use; Transitional Use