人工智能訓(xùn)練與著作權(quán)沖突的解決策略需兼顧技術(shù)創(chuàng)新與權(quán)利保護(hù),結(jié)合國內(nèi)外現(xiàn)有法律規(guī)范、技術(shù)手段與行業(yè)協(xié)作探索構(gòu)建綜合治理體系
生成式人工智能技術(shù)(AIGC)的快速迭代與場景滲透,正在對傳統(tǒng)版權(quán)制度形成系統(tǒng)性沖擊,傳統(tǒng)的版權(quán)制度也已給AIGC技術(shù)的快速發(fā)展帶來制約。為此,探討具有可操作性的兼容技術(shù)創(chuàng)新與版權(quán)保護(hù)制度性的解決方案,成為亟待解決的問題。
AIGC訓(xùn)練三階段潛在的版權(quán)風(fēng)險
AIGC作為人工智能的重要分支,通過分析數(shù)據(jù)分布特征生成新穎的合成內(nèi)容(如文本、圖像、視音頻等)。訓(xùn)練過程通常分為三個階段:一是數(shù)據(jù)準(zhǔn)備階段,收集海量數(shù)據(jù)并進(jìn)行清洗、標(biāo)注與分類;二是數(shù)據(jù)處理階段,依托文本與數(shù)據(jù)挖掘(TDM)實現(xiàn)結(jié)構(gòu)化轉(zhuǎn)換與特征提取;三是結(jié)果輸出階段,通過生成內(nèi)容驗證模型效果并迭代優(yōu)化。
數(shù)據(jù)準(zhǔn)備階段的侵權(quán)風(fēng)險
數(shù)據(jù)準(zhǔn)備階段離不開對海量數(shù)據(jù)作品的抓取與復(fù)制,“海量數(shù)據(jù)作品的抓取與復(fù)制”與著作權(quán)法之間的沖突,已成為當(dāng)前全球法律和技術(shù)領(lǐng)域的熱點問題。如GPT-4整合使用超1萬億的token語料(含1200萬版權(quán)圖片),數(shù)據(jù)量遠(yuǎn)超《日本著作權(quán)法》第30-4條TDM例外的“必要限度”,也突破了《伯爾尼公約》第9條“三步檢驗法”之“少量使用”原則。數(shù)字時代,復(fù)制權(quán)的內(nèi)涵已從傳統(tǒng)物理載體擴(kuò)展至虛擬形式。永久復(fù)制(如存儲于服務(wù)器供長期調(diào)用)因具備再現(xiàn)性與重復(fù)性被認(rèn)定為侵權(quán),而臨時復(fù)制(如內(nèi)存暫存)的合法性仍然存在法條空白。如我國《著作權(quán)法》第10條未明確RAM緩存的法律地位,與《WIPO互聯(lián)網(wǎng)條約》第11條技術(shù)措施義務(wù)形成解釋裂隙,導(dǎo)致司法實踐中分歧較大,使得AI訓(xùn)練面臨較大的侵權(quán)風(fēng)險。
數(shù)據(jù)處理階段的侵權(quán)風(fēng)險
數(shù)據(jù)處理階段通過數(shù)字化與結(jié)構(gòu)化轉(zhuǎn)換作品,可能觸發(fā)改編權(quán),甚至是翻譯權(quán)。業(yè)界學(xué)者通常采用“表達(dá)性使用”這一標(biāo)準(zhǔn)來判斷人工智能訓(xùn)練對作品數(shù)據(jù)的使用行為是否合法。人工智能訓(xùn)練一般被分為“表達(dá)型訓(xùn)練”和“非表達(dá)型訓(xùn)練”。非表達(dá)型訓(xùn)練是將獲取的數(shù)據(jù)作品僅用于人工智能系統(tǒng)內(nèi)部學(xué)習(xí),不涉及對外生成新表達(dá)性內(nèi)容。如人臉識別系統(tǒng),為訓(xùn)練完善人臉識別算法,技術(shù)人員從雅虎網(wǎng)站中收集整理了約50萬張新聞圖片并對其中的人臉人像進(jìn)行分析加工、整合為數(shù)據(jù)集,提供給相關(guān)開發(fā)主體使用。但這類訓(xùn)練使用并不涉及侵權(quán),其提取、使用的人臉面部特征不具有創(chuàng)造性,不涉及新聞圖片作品中具有獨創(chuàng)性表達(dá)的部分。而微軟的“下一個倫勃朗”項目,無論從訓(xùn)練資源還是生產(chǎn)結(jié)果,都極具針對性。系統(tǒng)完全以倫勃朗作品為訓(xùn)練資源進(jìn)行智能學(xué)習(xí),生成的畫作明顯帶有倫勃朗風(fēng)格。盡管技術(shù)中立觀點認(rèn)為算法處理不涉及表達(dá)繼承,但司法實踐強(qiáng)調(diào)結(jié)果導(dǎo)向——如果AI生成的畫作與某幅受版權(quán)保護(hù)的現(xiàn)代臨摹作品高度相似,可能構(gòu)成侵權(quán)。
結(jié)果輸出階段的信息網(wǎng)絡(luò)傳播權(quán)
傳播權(quán)是《著作權(quán)法》中的一項重要權(quán)利,包括信息網(wǎng)絡(luò)傳播權(quán)、廣播權(quán)、發(fā)行權(quán)等,控制作品向公眾傳播的方式。人工智能生成作品的傳播權(quán),目前各國法律體系尚未形成完全統(tǒng)一的規(guī)則。在我國,現(xiàn)行法律不保護(hù)純AI生成內(nèi)容(如2020年深圳AI生成文章案,法院認(rèn)定“無人類獨創(chuàng)性貢獻(xiàn)不構(gòu)成作品”)。但如果人類對AI生成內(nèi)容進(jìn)行了實質(zhì)性選擇、編排或修改,生成內(nèi)容可能受保護(hù),傳播需遵守《著作權(quán)法》。如全國首例“AI文生圖”著作權(quán)糾紛案,首次從司法裁判的角度確認(rèn)人工智能生成的內(nèi)容具有作品屬性,該案入選2024中國數(shù)字經(jīng)濟(jì)發(fā)展與法治建設(shè)十個重大影響力事件。今年3月,最高人民法院院長張軍在十四屆全國人大三次會議上作最高人民法院工作報告時提到:“依法妥善審理涉人工智能糾紛案件,支持人工智能依法應(yīng)用;懲治利用人工智能技術(shù)侵權(quán)行為,促進(jìn)規(guī)范有序發(fā)展?!睓?quán)利主張人也表示:“這個事情,核心價值還是給AI行業(yè)的開發(fā)者、創(chuàng)作者表達(dá)出一個中國司法態(tài)度,即法院是愿意也傾向于去保護(hù)新技術(shù)、新成果的。”即使AI生成內(nèi)容本身無版權(quán),但如果訓(xùn)練數(shù)據(jù)未經(jīng)授權(quán)使用受版權(quán)保護(hù)的作品,傳播AI生成內(nèi)容仍可能構(gòu)成侵權(quán)。
AIGC凸顯傳統(tǒng)合理使用規(guī)則的困境
生成式AI與合理使用的矛盾本質(zhì)是技術(shù)紅利與版權(quán)保護(hù)的利益沖突。目前法律尚未明確解決這一問題,但趨勢表明:完全依賴“合理使用”豁免AI訓(xùn)練的風(fēng)險正在不斷增加。
一是有關(guān)法律條規(guī)的滯后性?!叭綑z驗法”(three—step test)是知識產(chǎn)權(quán)領(lǐng)域,特別是《著作權(quán)法》中用于判斷某些行為是否構(gòu)成對著作權(quán)的限制或例外的關(guān)鍵標(biāo)準(zhǔn)。但AIGC的“學(xué)習(xí)”行為既非直接復(fù)制,亦非傳統(tǒng)轉(zhuǎn)換性使用,法律定性模糊。二是尺度失準(zhǔn)。傳統(tǒng)合理使用針對“少量作品”,而AI訓(xùn)練依賴全網(wǎng)數(shù)據(jù)爬?。ㄈ鏑ommon Crawl包含PB級數(shù)據(jù)),數(shù)據(jù)規(guī)模呈現(xiàn)爆炸式增長,“三步檢驗法”未預(yù)計預(yù)設(shè)此類規(guī)模。三是行為主體錯位。合理使用原為人類行為設(shè)計(如學(xué)者引用等),但AI訓(xùn)練是機(jī)器自動化過程,是否適用“合理使用”存在較大法理爭議。四是全球化與碎片化沖突。AIGC所需海量數(shù)據(jù)不再局限于一地一國,而是全球數(shù)據(jù)的歸集。世界各國對AI訓(xùn)練數(shù)據(jù)以及生成的產(chǎn)品是否侵權(quán),法律立場到目前為止還是各自表述解釋,尚未統(tǒng)一。如我國《生成式AI服務(wù)管理辦法》要求“尊重知識產(chǎn)權(quán)”,但未明確訓(xùn)練合法性。歐盟則傾向嚴(yán)格授權(quán)(如《數(shù)字單一市場指令》要求權(quán)利人可“選擇退出”AI訓(xùn)練)。美國各州相關(guān)法律也是不盡一致,部分案例支持合理使用。
探索AIGC與著作權(quán)之間沖突的解決方案
人工智能訓(xùn)練與著作權(quán)沖突的解決策略需兼顧技術(shù)創(chuàng)新與權(quán)利保護(hù),結(jié)合國內(nèi)外現(xiàn)有法律規(guī)范、技術(shù)手段與行業(yè)協(xié)作探索構(gòu)建綜合治理體系。
在立法層面應(yīng)建構(gòu)系統(tǒng)性規(guī)范框架,強(qiáng)化風(fēng)險全周期治理的制度設(shè)計。當(dāng)前各國人工智能立法普遍采用分散式路徑,如歐盟《人工智能法案》聚焦高風(fēng)險系統(tǒng)分級管控,美國各州立法側(cè)重“算法歧視”治理,我國現(xiàn)有法條多集中于數(shù)據(jù)安全環(huán)節(jié),暴露出分散立法模式在治理效能上的結(jié)構(gòu)性缺陷,缺乏對技術(shù)黑箱性、社會嵌入性等本質(zhì)風(fēng)險的制度響應(yīng)。建議立法機(jī)關(guān)盡快啟動體系化重構(gòu)工程,建立“風(fēng)險識別—過程控制—結(jié)果追溯”的全鏈條規(guī)制框架,既包含算法透明度、數(shù)據(jù)治理等微觀技術(shù)標(biāo)準(zhǔn),又要統(tǒng)籌產(chǎn)業(yè)發(fā)展、促進(jìn)國際競爭。
抓住全球AI立法競爭的關(guān)鍵窗口期,盡快修訂《著作權(quán)法》。在《著作權(quán)法實施條例》或司法解釋中增設(shè)AI相關(guān)條款,明確訓(xùn)練數(shù)據(jù)的合法性、生成內(nèi)容的權(quán)屬,解決侵權(quán)責(zé)任認(rèn)定困難。在保護(hù)創(chuàng)作者權(quán)益的同時,為技術(shù)創(chuàng)新提供清晰的法律框架,確保我國在AI時代的知識產(chǎn)權(quán)治理中占據(jù)主動地位。
(作者單位:浙江工商大學(xué)法學(xué)院)