引言
在信息化時(shí)代進(jìn)程中,人工智能已成為引領(lǐng)科技變革的核心驅(qū)動力,以ChatGPT、Sora為代表的生成式人工智能通過進(jìn)行數(shù)據(jù)模仿與訓(xùn)練,在醫(yī)療、教育等各個領(lǐng)域引起了巨大的變革。然而,在生產(chǎn)生活效率提升的同時(shí),人工智能也引發(fā)了諸多爭議,人工智能初期,并沒有較多的學(xué)習(xí)能力,打印機(jī)、電腦等要依靠人類的指令才能進(jìn)行下一步,但是生成式人工智能的出現(xiàn),展現(xiàn)出的學(xué)習(xí)能力,給著作權(quán)法帶來一定的沖擊,人工智能生成的內(nèi)容能否獲得著作權(quán)法的保護(hù)成為亟待解決的問題。
一,生成式人工智能運(yùn)行機(jī)制
生成式人工智能的核心是變換器架構(gòu),這是一種深度學(xué)習(xí)模型。變換器架構(gòu)摒棄了傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),采用注意力機(jī)制來處理序列數(shù)據(jù),使人工智能可以“關(guān)注”輸入序列中與當(dāng)前任務(wù)最相關(guān)的部分,計(jì)算每個詞與句子中其他詞的關(guān)系,從而理解上下文語義。
人工智能的訓(xùn)練過程分為兩個階段:預(yù)訓(xùn)練和微調(diào)。模型在大量的文本數(shù)據(jù)上進(jìn)行訓(xùn)練,學(xué)習(xí)語言的基本規(guī)律和模式[1],建立對語言的理解,然后對模型進(jìn)行進(jìn)一步訓(xùn)練。
其工作機(jī)制分為6個步驟:(1)輸入處理,用戶向人工智能提出問題或發(fā)送指令時(shí),其將輸入文本轉(zhuǎn)換成模型可以理解的形式,即轉(zhuǎn)換成一個固定大小的向量,并且捕捉單詞之間的語義關(guān)系;(2)上下文理解,通過自注意力和層間注意力,模型識別輸入文本中各部分之間的關(guān)聯(lián),從而理解問題或指令;(3)模型推理,利用其在預(yù)訓(xùn)練階段學(xué)到的知識,結(jié)合當(dāng)前的輸入,通過一系列變換器層來生成內(nèi)部表示;(4)響應(yīng)生成,一旦模型完成了推理過程,它就會將內(nèi)部表示轉(zhuǎn)換回文本形式,然后逐個生成響應(yīng)中的單詞;(5)優(yōu)化與采樣,在生成響應(yīng)時(shí),模型考慮多個可能路徑,選擇概率最高的路徑;(6)輸出,最終模型生成的文本被轉(zhuǎn)換回可讀的形式,并作為輸出返回給用戶,這個輸出旨在盡可能自然、準(zhǔn)確,并與用戶的輸入相關(guān)[2]。
二、生成式人工智能的著作權(quán)法律困境
(一)人工智能生成物的智力成果屬性問題
傳統(tǒng)主觀判斷標(biāo)準(zhǔn)認(rèn)為,著作權(quán)法里作品的創(chuàng)造是出于人類的有意識行動,但人工智能生成物的主體并非自然人,缺乏創(chuàng)作意圖、思想、感情等主觀因素,因此沒有資格成為著作權(quán)的受益者。但在人工智能背景下,必須結(jié)合人工智能的創(chuàng)作原理,認(rèn)定人工智能生成物獨(dú)創(chuàng)性時(shí),從字面意思出發(fā),“獨(dú)”即獨(dú)立完成,沒有其他人或者工具的幫助;“創(chuàng)”即和現(xiàn)有的作品有一定差異性表達(dá)。人工智能可以處理和分析大量的作品,通過深度學(xué)習(xí)并生成新的創(chuàng)作,且其輸出的詩歌、文字等作品的結(jié)構(gòu)、風(fēng)格和情節(jié)等都可能完全不同于操作者的初衷,這些反映了人工智能的獨(dú)特性和自主性。
一些學(xué)者認(rèn)為,憑借人與機(jī)器互相合作,進(jìn)而生成的智能成果,即為人工智能生成物,在著作權(quán)法領(lǐng)域,該生成物的基礎(chǔ)是人格主義,所以應(yīng)被歸類為作品。在現(xiàn)有法律中,拋開其主體性的限制,人工智能生成物無論是從外觀還是本質(zhì)上,都符合作品“獨(dú)創(chuàng)性”的要求,應(yīng)被認(rèn)定為作品。
對于人工智能生成內(nèi)容的著作權(quán)爭議,不僅僅存在于國內(nèi),2018年,Steven Thaler試圖將由其名為“CreativityMachine”的人工智能生成的作品注冊為職務(wù)作品,美國版權(quán)局拒絕了該申請,理由是其缺乏必要的人類作者身份,不能被認(rèn)定為職務(wù)作品。2023年,Thaler向哥倫比亞特區(qū)地方法院起訴版權(quán)局,地方法院也支持版權(quán)局,認(rèn)為人類作者身份是有效版權(quán)主張的基本要素。
(二)人工智能輸入階段
生成式人工智能相較于以往的技術(shù)有很大的不同,其自主性更高,且生成內(nèi)容具有高度的不可預(yù)測性,通過分析人工智能的運(yùn)行機(jī)制,會發(fā)現(xiàn)人工智能的自主性和靈活性依賴前期大量的數(shù)據(jù)收集,通過對足夠多的作品進(jìn)行分析從而進(jìn)行生成內(nèi)容。
通常,在實(shí)踐中認(rèn)定作品是否侵權(quán)主要考察兩個方面:(1)接觸作品;(2)構(gòu)成實(shí)質(zhì)性相似。接觸作品即意味著被告具有實(shí)施侵權(quán)的可能性,構(gòu)成實(shí)質(zhì)性相似則是侵權(quán)的客觀結(jié)果,證明其作品的創(chuàng)作力不足,無法成為“作品”。但在司法實(shí)踐中,會發(fā)現(xiàn)被告是否真正接觸到原作品且實(shí)施侵權(quán)行為往往比較隱蔽,難以證實(shí),且著作權(quán)法上也承認(rèn)相似作品的存在,只要證明獨(dú)創(chuàng)性即可。而剽竊主體很少公開實(shí)施侵權(quán)復(fù)制行為,直接證據(jù)往往難以獲得。
但是對于如今的大數(shù)據(jù)時(shí)代,人工智能技術(shù)為著作權(quán)侵權(quán)提供了技術(shù)支撐,其內(nèi)容生成需要大量的前期數(shù)據(jù),這些數(shù)據(jù)來源于整個互聯(lián)網(wǎng),勢必會有著作權(quán)侵權(quán)的風(fēng)險(xiǎn),即未經(jīng)授權(quán)復(fù)制他人具有著作權(quán)的作品,包括文本、圖片、聲音、視頻等各種形式。復(fù)制權(quán)是著作權(quán)法中的一項(xiàng)重要權(quán)利,信息輸入作為復(fù)制的一種方式,生成式人工智能侵權(quán)是必然的結(jié)果。2023年,美國藝術(shù)家起訴StabilityAI公司在未獲得合法授權(quán)的狀況下,擅自運(yùn)用那些受到版權(quán)法律保護(hù)的作品,以此來訓(xùn)練其人工智能模型,構(gòu)成對版權(quán)權(quán)益的侵犯。
(三)人工智能輸出階段
生成式人工智能在信息的輸出階段也面臨著著作權(quán)侵權(quán)的風(fēng)險(xiǎn),在全球首例AIGC平臺侵權(quán)案“奧特曼案”中,廣州互聯(lián)網(wǎng)法院判決AIGC網(wǎng)站因生成與“奧特曼”形象相似的圖片被判侵權(quán),法院認(rèn)定AI公司侵犯了原告的復(fù)制權(quán)和改編權(quán),并責(zé)令其停止侵權(quán)行為。接觸加上實(shí)質(zhì)性相似作為認(rèn)定作品侵權(quán)的要件,在判斷作品間是否存在實(shí)質(zhì)性相似時(shí),需對比受版權(quán)保護(hù)的元素與涉嫌侵權(quán)作品的對應(yīng)部分,評估文字作品的抄襲量和重要性,以及非文字作品在整體外觀和構(gòu)成上的相似度。
法院在本案中采用了兩種視角來評估作品之間的相似性:(1)普通大眾的視角;(2)專業(yè)領(lǐng)域的視角。在這兩個視角下,法院發(fā)現(xiàn),對于普通消費(fèi)者而言,兩幅美術(shù)作品在內(nèi)容展現(xiàn)、構(gòu)圖、色彩搭配以及結(jié)構(gòu)設(shè)計(jì)等方面具有高度的相似性。具體而言,當(dāng)一般消費(fèi)者在對這兩幅作品進(jìn)行觀察時(shí),他們憑借日常的觀察力難以察覺到兩者之間的明顯區(qū)別。這意味著,從市場受眾的直觀感受出發(fā),這兩幅作品在視覺上的相似度極高,以至于不足以使消費(fèi)者清晰地區(qū)分它們的不同之處。
在美國,確定兩部作品是否存在實(shí)質(zhì)性的相似性,不僅要考量它們的內(nèi)容是否雷同,還要評估相似之處的實(shí)質(zhì)性程度。涉及評估作品間相似部分的獨(dú)創(chuàng)性表達(dá),以及這些部分對整體作品的貢獻(xiàn)和重要性、所占的比重,以及它們對觀眾或讀者體驗(yàn)的影響。美國對于作品實(shí)質(zhì)性的判斷主要有3種方法:(1)普通觀眾測試法,以一般公眾的感受來判斷作品是否構(gòu)成實(shí)質(zhì)性相似,不要求技術(shù)上的區(qū)分思想和表達(dá),側(cè)重于考察作品在整體概念和感覺上的相似度;(2)抽象測試法,分為抽象、過濾和比較3個步驟,首先利用思想、表達(dá)二分法進(jìn)行層層抽象提煉,然后將作品中不屬于著作權(quán)法保護(hù)對象的部分過濾掉,最后將剩余的部分也就是具有獨(dú)創(chuàng)性的表達(dá)部分進(jìn)行比較,以確定是否構(gòu)成實(shí)質(zhì)性相似;(3)內(nèi)外部測試法,即抽象測試法與整體觀感法的結(jié)合,在美國判例中較為常見。
三、生成式人工智能著作權(quán)侵權(quán)規(guī)制路徑
(一)確定合法性的范疇
人工智能生成圖片或者文字需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練,生成的東西全部以現(xiàn)有的作品和成果為基礎(chǔ)[3]。捕捉到特定藝術(shù)作品或作者的風(fēng)格,并將其應(yīng)用于新作品的創(chuàng)作中,從而生成具有相似風(fēng)格的圖像或文本[4。由此可見,人工智能在簡單的指示下并無任何的特色,除非經(jīng)過多重的指示詞[5]。目前國內(nèi)法院對生成式人工智能的幾例判決,可以看出對于人工智能著作權(quán)已經(jīng)有了統(tǒng)一的看法,即人工智能生成物可以受到著作權(quán)法的保護(hù),但是簡單的內(nèi)容輸出除外,只有經(jīng)過多重指令,且指令經(jīng)過使用者思考且與其他作品表現(xiàn)出一定獨(dú)特性的輸出內(nèi)容才會成為“作品”。
作為中國首例StableDiffusion生成圖片著作權(quán)侵權(quán)案,在判決時(shí)法院對于繪畫大模型使用者在生成圖片上享有創(chuàng)作權(quán)益給出了首次認(rèn)可,法院認(rèn)為,原告雖沒有實(shí)際動手繪畫,也沒有向該模型描述應(yīng)該怎樣畫,但原告通過不斷增加提示詞、修改參數(shù),按照自已的想法不斷調(diào)整修正,最終獲得了涉案圖片,這一過程體現(xiàn)了原告的審美選擇和個性判斷。全國首例認(rèn)定人工智能生成文章構(gòu)成作品的生效案件中,原告團(tuán)隊(duì)人員運(yùn)用Dreamwriter軟件生成了一篇財(cái)經(jīng)報(bào)道的文章,法院認(rèn)為文章體現(xiàn)出對當(dāng)日上午股市信息、數(shù)據(jù)的選擇、分析、判斷;文章生成過程中,主創(chuàng)團(tuán)隊(duì)人員在數(shù)據(jù)輸入、觸發(fā)條件設(shè)定、模板和語料風(fēng)格的選擇上,有一定的取舍,表現(xiàn)出整個團(tuán)隊(duì)的文章寫作特色,具有一定的獨(dú)創(chuàng)性。北京互聯(lián)網(wǎng)法院審理的一起“AI文生圖”著作權(quán)案中,原告認(rèn)為被告劉某在百家號文章中所發(fā)布的借助人工智能大模型生成的圖片,侵犯了自身的署名權(quán)與信息網(wǎng)絡(luò)傳播權(quán),北京互聯(lián)網(wǎng)法院判定,涉案圖片包含原告獨(dú)特的智力創(chuàng)造元素,應(yīng)被認(rèn)定為美術(shù)作品。美國的判決與國內(nèi)的觀念具有相同之處,計(jì)算機(jī)科學(xué)家StephenThaler利用“CreativityMachine”生成一幅二維圖像,隨后就該圖像向美國版權(quán)局申請登記時(shí)遭到拒絕,美國當(dāng)局的立場,即完全由人工智能生成的作品因缺乏人類作者身份而不受版權(quán)保護(hù)。Sahni通過自攝的日落照片輸入RAGHAV(圖像生成型人工智能),然后將梵高《星空》的副本作為“風(fēng)格”輸入,并選擇一個“決定風(fēng)格轉(zhuǎn)移量的可變值”,從而生成“SURYAST”(涉案作品)。美國版權(quán)局認(rèn)為輸入基礎(chǔ)圖像、風(fēng)格圖像和“決定風(fēng)格轉(zhuǎn)移量的可變值”后,主要由人工智能決定如何根據(jù)風(fēng)格轉(zhuǎn)移值和風(fēng)格圖像進(jìn)行插值,Sahni先生并沒有控制這些元素,因此其作品不受保護(hù)。
(二)明確合理使用標(biāo)準(zhǔn)
人工智能在輸入和輸出階段都有侵權(quán)的可能性,在輸入階段,想要避免侵權(quán)可以從兩個角度考慮,即直接使用和授權(quán)許可使用作品?,F(xiàn)階段已經(jīng)有一些國家或者地區(qū)明確了生成式人工智能特定技術(shù)應(yīng)用的例外情況,比如,歐盟明確了特定數(shù)據(jù)訓(xùn)練行為的合法性,日本在法律當(dāng)中規(guī)定了計(jì)算機(jī)信息處理行為可以豁免著作權(quán)侵權(quán)責(zé)任,而美國則擴(kuò)大了本國合理規(guī)則的范圍,將生成式人工智能的輸入行為進(jìn)行例外??v觀各國相關(guān)規(guī)定,不難發(fā)現(xiàn)其規(guī)制重心幾乎均未直接針對人工智能的使用行為,且相關(guān)限制僅適用于文本挖掘技術(shù)領(lǐng)域。由于人工智能大模型在訓(xùn)練時(shí)使用的數(shù)據(jù)范圍較大,在事前逐個獲得當(dāng)事人的同意難度較高,因此,可以從合理使用角度允許生成式人工智能進(jìn)行數(shù)據(jù)收集,借鑒其他國家的做法,圍繞特定的技術(shù)應(yīng)用來讓輸入階段的侵權(quán)行為變得合法。人工智能可能侵權(quán)的是數(shù)據(jù)輸入階段為了進(jìn)行數(shù)據(jù)訓(xùn)練的保存及復(fù)制行為,輸出階段在他人作品上的“引用”行為,可以將這兩種行為均納入合理使用的范疇,允許人工智能不經(jīng)許可免費(fèi)使用互聯(lián)網(wǎng)中的數(shù)據(jù),并在生成作品后進(jìn)行合法的標(biāo)注。
(三)擴(kuò)大著作權(quán)人作品的授權(quán)
除了合理使用,授權(quán)許可人工智能使用作品更符合經(jīng)濟(jì)效益,不僅擴(kuò)大著作權(quán)人的許可范圍,增加其收益,還避免了生成式人工智能輸入輸出階段無合法著作權(quán)授權(quán)的侵權(quán)風(fēng)險(xiǎn)?;诖耍梢詣?chuàng)新著作權(quán)人授權(quán)模式,從事前授權(quán)和事后補(bǔ)充授權(quán)兩個階段,彌補(bǔ)現(xiàn)有人工智能生成物無著作權(quán)人授權(quán)的情形。
著作權(quán)人的作品在互聯(lián)網(wǎng)上一經(jīng)公開自動授權(quán)人工智能公司進(jìn)行使用,人工智能公司每年在特定時(shí)間交許可使用費(fèi),相較于合理使用,該方法更符合知識產(chǎn)權(quán)法的立法原則,激勵創(chuàng)作者的產(chǎn)出。且生成式人工智能需要的數(shù)據(jù)規(guī)模大、類型多,獲得所有著作權(quán)人的許可是一種最直接也最便捷的方法,但是也會出現(xiàn)許可使用費(fèi)“一刀切”情況的出現(xiàn),會有個別著作權(quán)人渾水摸魚。相對應(yīng)的,以授權(quán)許可合同的形式,與人工智能公司建立深度合作關(guān)系,生成內(nèi)容收益和風(fēng)險(xiǎn)按照比例分配會更合理,而為了解決授權(quán)量大的問題,可以由著作權(quán)管理組織出面解決[。根據(jù)生成式人工智能的特點(diǎn),對作品進(jìn)行分級分類。按照標(biāo)準(zhǔn)將作品授權(quán)許可劃分等級,不同等級下著作權(quán)人的收益和承擔(dān)的風(fēng)險(xiǎn)也不一樣。等級的選擇采取著作權(quán)管理組織劃分和著作權(quán)人自由選擇兩個方式相結(jié)合的方法,收益越高,風(fēng)險(xiǎn)越大[。
結(jié)語
在生成式人工智能迅猛發(fā)展的時(shí)代,著作權(quán)侵權(quán)隱患不容忽視。通過確定合法性的范疇、明確合理使用規(guī)則、拓寬著作權(quán)人授權(quán)范圍,在規(guī)范技術(shù)發(fā)展與保障知識產(chǎn)權(quán)之間達(dá)成平衡。這不僅是對創(chuàng)作者的尊重,更是為人工智能產(chǎn)業(yè)的長遠(yuǎn)發(fā)展鋪設(shè)基石,從而挖掘人工智能的潛能,為人類創(chuàng)造更大福祉。
參考文獻(xiàn):
[1]徐小奔,楊依楠.論人工智能深度學(xué)習(xí)中著作權(quán)的合理使用[J].交大法學(xué),2019,(03):32-42.
[2]馮玨.自動駕駛汽車致?lián)p的民事侵權(quán)責(zé)任[J].中國法 學(xué),2018,(06):109-132.
[3]姚志偉,人工智能生成物著作權(quán)侵權(quán)的認(rèn)定及其防范—以全球首例生成式AI服務(wù)侵權(quán)判決為中心[J].地方立法研究,2024,9(03):1-17.
[4]朱閣.“AI文生圖”的法律屬性與權(quán)利歸屬研究[J].知識產(chǎn)權(quán),2024,(01):24-35.
[5]崔國斌.人工智能生成物中用戶的獨(dú)創(chuàng)性貢獻(xiàn)[J].中國版權(quán),2023,(06):15-23.
[6]孫陽.生成式人工智能的侵權(quán)標(biāo)準(zhǔn)、價(jià)值辨析與規(guī)范應(yīng)對[J].社會科學(xué)動態(tài),2024,(10):42-49.
[7]錢葉會.淺議ChatGPT等生成式人工智能對職業(yè)教育的挑戰(zhàn)及應(yīng)對[J].公關(guān)世界,2025,(04):26-28.
(作者單位:鄭州商學(xué)院文學(xué)與新聞傳播學(xué)院)
(責(zé)任編輯:宋宇靜)