一、問(wèn)題的提出
文化遺產(chǎn)是中華優(yōu)秀傳統(tǒng)文化的瑰寶,承載著豐富的歷史記憶、文化底蘊(yùn)和民族精神,其保護(hù)與傳承不僅關(guān)乎中華文化的延續(xù)和發(fā)展,也直接關(guān)系國(guó)家文化軟實(shí)力和中華文化影響力的提升。習(xí)近平總書記指出,“我們要積極推進(jìn)文物保護(hù)利用和文化遺產(chǎn)保護(hù)傳承,挖掘文物和文化遺產(chǎn)的多重價(jià)值,傳播更多承載中華文化、中國(guó)精神的價(jià)值符號(hào)和文化產(chǎn)品”。然而,在現(xiàn)代化浪潮沖擊下,我國(guó)文化遺產(chǎn)保護(hù)面臨著諸多挑戰(zhàn),包括城市化發(fā)展、資金短缺、環(huán)境污染等。如何更好地保護(hù)與傳承文化遺產(chǎn),使其在新時(shí)代煥發(fā)新活力,成為文化建設(shè)的重要任務(wù)。
在此背景下,數(shù)字技術(shù)的迅速發(fā)展為文化遺產(chǎn)的保護(hù)與傳承提供了新的機(jī)遇。黨的二十大報(bào)告也明確提出“加大文物和文化遺產(chǎn)保護(hù)力度”“實(shí)施國(guó)家文化數(shù)字化戰(zhàn)略”,為文化遺產(chǎn)保護(hù)傳承指明了方向。當(dāng)前,生成式人工智能技術(shù)正快速發(fā)展,并逐漸應(yīng)用到包括文化遺產(chǎn)的各個(gè)領(lǐng)域,為文化遺產(chǎn)數(shù)字化保護(hù)傳承提供了新的可能。該技術(shù)利用神經(jīng)網(wǎng)絡(luò)、擴(kuò)散模型等先進(jìn)算法,能夠重建、修復(fù)甚至優(yōu)化文物、文獻(xiàn)以及歷史環(huán)境;通過(guò)綜合各種來(lái)源的數(shù)據(jù),生成式人工智能可以數(shù)字化修復(fù)受損文物,重現(xiàn)丟失的元素,并為教育和旅游提供沉浸式體驗(yàn)?!c此同時(shí),隨著其在文化遺產(chǎn)領(lǐng)域的應(yīng)用日益廣泛,訓(xùn)練數(shù)據(jù)的合法性、人工智能生成內(nèi)容的版權(quán)歸屬以及潛在的侵權(quán)風(fēng)險(xiǎn)等挑戰(zhàn)也逐步凸顯。鑒于此,本文將探討生成式人工智能在文化遺產(chǎn)保護(hù)中的具體應(yīng)用,分析其賦能過(guò)程中的版權(quán)挑戰(zhàn),并提出相應(yīng)的對(duì)策建議,以推動(dòng)文化與科技的深度融合,促進(jìn)文化遺產(chǎn)的可持續(xù)發(fā)展。
二、生成式人工智能在文化遺產(chǎn)保護(hù)中的應(yīng)用
生成式人工智能作為人工智能的一個(gè)重要分支,能夠使用生成模型形成文本、圖像以及其他各種形式的內(nèi)容,這些模型通過(guò)學(xué)習(xí)訓(xùn)練數(shù)據(jù)中的底層模式和結(jié)構(gòu),從而生成具有相似特征和特性的新數(shù)據(jù)?!啾葌鹘y(tǒng)人工智能,其具備更強(qiáng)大的數(shù)據(jù)處理、分析以及內(nèi)容生成能力,在文化遺產(chǎn)保存、展示、傳播和利用各個(gè)環(huán)節(jié)展現(xiàn)出廣泛的應(yīng)用前景,有助于提高數(shù)據(jù)采集、保存、管理、使用效率,推動(dòng)文化遺產(chǎn)的數(shù)字化轉(zhuǎn)型。
首先,在文化遺產(chǎn)修復(fù)與保存方面,生成式人工智能技術(shù)的應(yīng)用不僅顯著提升了文化遺產(chǎn)修復(fù)的效率和準(zhǔn)確性,還拓展了文化遺產(chǎn)修復(fù)的可能性。生成式人工智能基于現(xiàn)有數(shù)據(jù)可以生成高度詳細(xì)和精確的數(shù)字文化遺產(chǎn)模型以支持虛擬重建、研究、記錄,以及未來(lái)的修復(fù)工作。這不僅有助于物質(zhì)文化遺產(chǎn)的保護(hù),也可以應(yīng)用于非物質(zhì)文化遺產(chǎn)的數(shù)字化保存、再現(xiàn)和傳播?!词乖谖幕z產(chǎn)遭受嚴(yán)重?fù)p害或完全消失的情況下,生成式人工智能也可以輔助完整重建。例如,生成式對(duì)抗網(wǎng)絡(luò)作為一種新的深度學(xué)習(xí)方法,由生成器和判別器組成,前者目標(biāo)是生成與真實(shí)數(shù)據(jù)相似的數(shù)據(jù),后者目標(biāo)是區(qū)分生成器生成的數(shù)據(jù)和真實(shí)數(shù)據(jù),通過(guò)反饋循環(huán)不斷提高性能,最終生成具有高度真實(shí)性的數(shù)據(jù)樣本,‘目前已經(jīng)廣泛應(yīng)用于文化遺產(chǎn)保護(hù)中。在楚國(guó)墓葬紡織品圖像復(fù)原項(xiàng)目中,研究人員采用生成對(duì)抗網(wǎng)絡(luò)模型對(duì)紡織品文物的殘缺、瑕疵等問(wèn)題進(jìn)行圖像層面的補(bǔ)全修復(fù),實(shí)現(xiàn)了較好的復(fù)原效果,同時(shí)有效避免了直接接觸文物可能帶來(lái)的二次損毀風(fēng)險(xiǎn)。
其次,在文化遺產(chǎn)展示與傳播方面,生成式人工智能技術(shù)的應(yīng)用為文化遺產(chǎn)提供了更好的展示方式和傳播途徑,極大地豐富了公眾的文化體驗(yàn),進(jìn)一步提升了文化遺產(chǎn)傳播的廣度和深度。如上所述,生成式人工智能通過(guò)分析和學(xué)習(xí)大量數(shù)據(jù)可以生成高度精確的數(shù)字文化遺產(chǎn)模型,結(jié)合虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等技術(shù),可以打破傳統(tǒng)展示方式的時(shí)空局限,打造身臨其境的沉浸式體驗(yàn),使文化遺產(chǎn)得以更加生動(dòng)、直觀地展示,提升公眾的文化認(rèn)同感與參與感。此外,生成式人工智能憑借其強(qiáng)大的理解和響應(yīng)能力,為個(gè)性化導(dǎo)覽系統(tǒng)提供了更為有力的技術(shù)支撐。有學(xué)者研究了OpenAI開(kāi)發(fā)的大型語(yǔ)言模型——生成式預(yù)訓(xùn)練變換器(Generative Pre-trainedTransformer,以下簡(jiǎn)稱GPT)作為數(shù)字?jǐn)⑹碌墓ぞ?,通過(guò)訓(xùn)練和引導(dǎo),GPT能夠作為博物館指南和文化空間的推薦系統(tǒng),不僅可以為觀眾提供有關(guān)藝術(shù)品、歷史背景的個(gè)性化信息和講解,而且能夠根據(jù)用戶的偏好和歷史互動(dòng)記錄提供定制化建議,提升訪客體驗(yàn)并激發(fā)探索興趣?!ㄟ^(guò)創(chuàng)建可針對(duì)不同類型訪客定制的內(nèi)容與互動(dòng)活動(dòng),能夠精準(zhǔn)滿足觀眾的多元化需求,增強(qiáng)文化遺產(chǎn)的吸引力。與此同時(shí),生成式人工智能由單模態(tài)發(fā)展到多模態(tài),能夠同時(shí)處理并融合視頻、音頻、圖像、文本等多模態(tài)信息。多模態(tài)AI通過(guò)社交媒體等平臺(tái)進(jìn)行傳播,不僅可以提高信息的曝光度,還能夠增強(qiáng)信息的口碑效應(yīng)?!送猓延醒芯匡@示GPT4等大語(yǔ)言模型驅(qū)動(dòng)的生成式人工智能在中文、英文等高資源語(yǔ)言的文本翻譯方面,已經(jīng)能與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)機(jī)器媲美,并借助語(yǔ)境學(xué)習(xí)能力,通過(guò)優(yōu)化提示提升翻譯效果,進(jìn)而推動(dòng)文化遺產(chǎn)的跨文化傳播與交流。
最后,在文化遺產(chǎn)的活化利用方面,生成式人工智能技術(shù)的應(yīng)用能夠推動(dòng)文化遺產(chǎn)的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展,助力實(shí)現(xiàn)文化傳承和經(jīng)濟(jì)發(fā)展的雙贏。當(dāng)前,生成式人工智能基于深度學(xué)習(xí)、生成式對(duì)抗網(wǎng)絡(luò)、預(yù)訓(xùn)練模式等技術(shù)的進(jìn)步,已經(jīng)成為賦能文化創(chuàng)意產(chǎn)業(yè)發(fā)展的重要力量。在內(nèi)容創(chuàng)作環(huán)節(jié),生成式人工智能極大地提升了內(nèi)容創(chuàng)作效率與質(zhì)量。一方面,其既能有效降低內(nèi)容創(chuàng)作門檻,又能協(xié)助創(chuàng)作者處理部分重復(fù)性或繁瑣性任務(wù),進(jìn)而激發(fā)文化創(chuàng)新創(chuàng)造活力;另一方面,其根據(jù)用戶輸入的提示能夠生成文本、圖像、音頻等內(nèi)容,為創(chuàng)作者提供靈感與思路。在產(chǎn)品生成環(huán)節(jié),生成式人工智能不僅可以提高生產(chǎn)效率,也為文創(chuàng)產(chǎn)品的個(gè)性化、創(chuàng)新性發(fā)展注人了新的動(dòng)力。例如,生成式人工智能可通過(guò)分析大量用戶數(shù)據(jù),推斷用戶的審美偏好,并生成定制化設(shè)計(jì)方案,滿足用戶的個(gè)性需求。在銷售與消費(fèi)環(huán)節(jié),生成式人工智能可通過(guò)實(shí)時(shí)監(jiān)測(cè)和分析社交媒體、電商平臺(tái)等多渠道數(shù)據(jù),準(zhǔn)確預(yù)測(cè)市場(chǎng)趨勢(shì),優(yōu)化產(chǎn)品的營(yíng)銷和推廣策略,并通過(guò)個(gè)性化推薦、優(yōu)化用戶的消費(fèi)體驗(yàn),從而提升市場(chǎng)競(jìng)爭(zhēng)力。除文化創(chuàng)意產(chǎn)業(yè)外,生成式人工智能在文化遺產(chǎn)研究領(lǐng)域同樣發(fā)揮著重要作用。文化遺產(chǎn)活化利用應(yīng)當(dāng)堅(jiān)持價(jià)值導(dǎo)向、重視價(jià)值挖掘,‘生成式人工智能通過(guò)快速準(zhǔn)確地分析大量歷史數(shù)據(jù),可以識(shí)別出人類可能忽略的隱藏模式和聯(lián)系,從而有助于更深人的研究,提升對(duì)文化遺產(chǎn)價(jià)值的認(rèn)知。
總體而言,生成式人工智能已經(jīng)融入文化遺產(chǎn)保護(hù)全過(guò)程,能夠增強(qiáng)修復(fù)與保存能力、提高展示傳播和研究闡釋水平,助力活化利用的創(chuàng)新發(fā)展,為文化遺產(chǎn)的可持續(xù)發(fā)展提供了新路徑。
三、文化遺產(chǎn)保護(hù)中生成式人工智能應(yīng)用的版權(quán)挑戰(zhàn)
盡管生成式人工智能在賦能文化遺產(chǎn)保護(hù)傳承的過(guò)程中展現(xiàn)出諸多技術(shù)優(yōu)勢(shì),但是在實(shí)際應(yīng)用中面臨著一系列復(fù)雜挑戰(zhàn),其中版權(quán)問(wèn)題不可忽視。
(一)生成式人工智能訓(xùn)練數(shù)據(jù)的合法性困境
生成式人工智能的運(yùn)行主要分為數(shù)據(jù)收集與處理、模型訓(xùn)練和內(nèi)容生成三個(gè)階段,其中大規(guī)模高質(zhì)量訓(xùn)練數(shù)據(jù)的收集與處理,是實(shí)現(xiàn)人工智能高水平發(fā)展的前提。?換言之,如果訓(xùn)練數(shù)據(jù)缺乏多樣性和平衡性,生成式人工智能模型有可能延續(xù)和加劇訓(xùn)練數(shù)據(jù)中的固有偏見(jiàn)。在文化遺產(chǎn)領(lǐng)域,這種情況下生成式人工智能不僅可能對(duì)文化遺產(chǎn)產(chǎn)生不準(zhǔn)確、誤導(dǎo)或扭曲的表述,進(jìn)而損害原始資料的完整性和可信度,而且可能根據(jù)其在數(shù)據(jù)中的表述或可見(jiàn)性而偏袒或排除某些文化或群體,并傳播有害的敘述或?qū)ξ幕饬x的誤解。?因此,為了構(gòu)建或優(yōu)化適用于文化遺產(chǎn)領(lǐng)域的生成式人工智能模型,需要具有相當(dāng)規(guī)模、質(zhì)量和多樣性的數(shù)據(jù)進(jìn)行訓(xùn)練。在訓(xùn)練過(guò)程中,在初始階段要將受版權(quán)保護(hù)作品復(fù)制到存儲(chǔ)介質(zhì)中,以便進(jìn)行進(jìn)一步的數(shù)字化處理。然而,許多文化遺產(chǎn)相關(guān)數(shù)據(jù)都在版權(quán)保護(hù)的范圍內(nèi),諸如文物、遺址等文化遺產(chǎn)的攝影、攝像、三維建模、文獻(xiàn)資料等,未經(jīng)許可用于模型訓(xùn)練可能構(gòu)成復(fù)制權(quán)侵權(quán)。具言之,即使文化遺產(chǎn)機(jī)構(gòu)對(duì)其所收藏的作品及其數(shù)字資源也并不必然擁有版權(quán)。甚至對(duì)已經(jīng)進(jìn)入公共領(lǐng)域或獲得許可的作品,如果其數(shù)字化工作是由第三方機(jī)構(gòu)或與第三方機(jī)構(gòu)合作進(jìn)行的,那么數(shù)字化成果的使用也有可能受到合同的限制。此外,還有可能受到捐贈(zèng)者、繼承人、借貸機(jī)構(gòu)的協(xié)議、研究人員協(xié)議和網(wǎng)站政策的限制。雖然根據(jù)我國(guó)《著作權(quán)法》的規(guī)定,圖書館、檔案館、紀(jì)念館等單位為陳列或者保存版本的需要,復(fù)制本館收藏的作品屬于合理使用的范疇。但該條款的適用范圍較為有限,在使用主體、對(duì)象、目的和方式上有著嚴(yán)格限制。與此同時(shí),面對(duì)模型訓(xùn)練需要的海量數(shù)據(jù),要求文化遺產(chǎn)機(jī)構(gòu)逐一獲得許可顯然無(wú)法實(shí)現(xiàn)。因此,如何合法獲取和使用高質(zhì)量的訓(xùn)練數(shù)據(jù)成為生成式人工智能在文化遺產(chǎn)領(lǐng)域應(yīng)用的一大挑戰(zhàn)。
目前,學(xué)界對(duì)生成式人工智能未經(jīng)許可使用他人作品進(jìn)行模型訓(xùn)練是否構(gòu)成侵權(quán)展開(kāi)了熱烈探討,但遠(yuǎn)未達(dá)成共識(shí)。有學(xué)者認(rèn)為,生成式人工智能數(shù)據(jù)訓(xùn)練中的作品使用屬于“非作品性使用”,應(yīng)排除在版權(quán)權(quán)利范圍外;也有學(xué)者認(rèn)為,生成式人工智能訓(xùn)練對(duì)作品的使用具有轉(zhuǎn)換性,應(yīng)建立機(jī)器學(xué)習(xí)合理使用規(guī)則,以平衡版權(quán)保護(hù)與技術(shù)創(chuàng)新;還有學(xué)者提出對(duì)機(jī)器學(xué)習(xí)的復(fù)制行為增設(shè)一項(xiàng)法定許可?!疂撛诘陌鏅?quán)侵權(quán)風(fēng)險(xiǎn)使得文化遺產(chǎn)機(jī)構(gòu)在技術(shù)創(chuàng)新和版權(quán)保護(hù)之間難以權(quán)衡,尤其是考慮到文化遺產(chǎn)機(jī)構(gòu)作為文化和知識(shí)的守護(hù)者,為避免人工智能應(yīng)用可能導(dǎo)致的道德、準(zhǔn)確性和可靠性問(wèn)題,使其對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量有著更高的要求。
(二)人工智能生成內(nèi)容的版權(quán)歸屬及侵權(quán)風(fēng)險(xiǎn)
生成式人工智能通過(guò)從海量數(shù)據(jù)中學(xué)習(xí)模式和結(jié)構(gòu),以應(yīng)用其根據(jù)用戶指令生成文本、圖像、視頻等新內(nèi)容,這一過(guò)程也帶來(lái)了復(fù)雜的版權(quán)問(wèn)題。首先,人工智能生成內(nèi)容是否具有可版權(quán)性取決于創(chuàng)作中自然人的貢獻(xiàn)。正如我國(guó)首例“AI文生圖”版權(quán)糾紛案中法院所指出的,利用人工智能模型生成內(nèi)容本質(zhì)上仍是人利用工具進(jìn)行創(chuàng)作,只要人工智能生成內(nèi)容體現(xiàn)了人的獨(dú)創(chuàng)性智力投入,就應(yīng)當(dāng)被認(rèn)定為作品,從而推動(dòng)作品創(chuàng)作和人工智能技術(shù)的發(fā)展。在此基礎(chǔ)上,對(duì)于人工智能生成內(nèi)容的權(quán)利歸屬,學(xué)界仍存有較大分歧。有學(xué)者認(rèn)為人工智能生成內(nèi)容的版權(quán)應(yīng)歸屬于使用者,因其通過(guò)輸入指令、選擇參數(shù)等方式實(shí)際控制著創(chuàng)作過(guò)程,對(duì)最終生成的內(nèi)容具有直接的貢獻(xiàn)。‘有學(xué)者則主張人工智能生成內(nèi)容的版權(quán)應(yīng)歸屬于開(kāi)發(fā)者,因?yàn)樯蓛?nèi)容的過(guò)程依賴于算法和編程設(shè)計(jì),由人工智能的創(chuàng)造者或所有者主導(dǎo)。
由此可見(jiàn),上述分歧的核心在于對(duì)創(chuàng)作過(guò)程中不同主體貢獻(xiàn)的認(rèn)知差異,即如何衡量使用者對(duì)人工智能生成內(nèi)容的控制程度和智力投入,以及開(kāi)發(fā)者在算法設(shè)計(jì)和模型訓(xùn)練中的作用是否構(gòu)成創(chuàng)作性貢獻(xiàn)。因此,人工智能生成內(nèi)容的權(quán)利歸屬不能一概而論,需根據(jù)具體情況進(jìn)行個(gè)案判斷。為避免權(quán)利歸屬的不確定性,通過(guò)合同約定生成內(nèi)容的權(quán)利歸屬是當(dāng)前實(shí)踐中較為通行的做法。
在文化遺產(chǎn)領(lǐng)域,人工智能生成內(nèi)容的版權(quán)歸屬界定更加復(fù)雜,不僅關(guān)乎文化遺產(chǎn)資源的開(kāi)放共享,而且涉及道德、倫理問(wèn)題,通過(guò)合同約定明確生成內(nèi)容的版權(quán)歸屬及使用范圍,可以確保文化遺產(chǎn)的合理利用。其次,實(shí)證研究表明,大型語(yǔ)言模型可能會(huì)記憶訓(xùn)練數(shù)據(jù),甚至可能會(huì)逐字逐句地輸出訓(xùn)練數(shù)據(jù)中大段文本。在文化遺產(chǎn)領(lǐng)域,由于生成式人工智能依賴通常受版權(quán)保護(hù)的文化遺產(chǎn)相關(guān)數(shù)據(jù)進(jìn)行訓(xùn)練,并且可能生成與其相同或高度相似的內(nèi)容,由此引發(fā)了復(fù)制權(quán)、改編權(quán)等一系列版權(quán)侵權(quán)風(fēng)險(xiǎn)。
四、文化遺產(chǎn)保護(hù)中生成式人工智能應(yīng)用的版權(quán)對(duì)策
隨著生成式人工智能逐漸融入文化遺產(chǎn)保護(hù)的全過(guò)程,如何應(yīng)對(duì)其所引發(fā)的一系列版權(quán)挑戰(zhàn),推動(dòng)技術(shù)創(chuàng)新與文化遺產(chǎn)保護(hù)的協(xié)調(diào)發(fā)展,已成為亟待解決的現(xiàn)實(shí)問(wèn)題。
(一)我國(guó)合理使用制度的完善
版權(quán)法具有版權(quán)保護(hù)和維護(hù)公共利益的雙重目的,而合理使用制度正是平衡權(quán)利人和社會(huì)公眾利益的重要機(jī)制,以促進(jìn)文化和信息傳播、教育和科研等,因而在文化遺產(chǎn)領(lǐng)域發(fā)揮著重要作用。生成式人工智能通過(guò)學(xué)習(xí)海量作品的“表達(dá)”以提升創(chuàng)作能力,進(jìn)而智能生成特定內(nèi)容,顯然屬于作品性使用。為避免版權(quán)侵權(quán),人工智能開(kāi)發(fā)者需事先獲得授權(quán)或依法獲得豁免,但傳統(tǒng)許可模式難以支撐大規(guī)模訓(xùn)練數(shù)據(jù)需求,法定許可交易成本高昂、管理復(fù)雜,又難以有效實(shí)施。
因此,從制度靈活性、交易成本、利益平衡等角度來(lái)看,將訓(xùn)練數(shù)據(jù)納入合理使用范疇是更為可行的選擇,這也順應(yīng)了國(guó)際立法趨勢(shì)。目前已經(jīng)有許多國(guó)家和地區(qū)將人工智能文本與數(shù)據(jù)挖掘行為納入合理使用制度。歐盟于2019年通過(guò)了《數(shù)字化單一市場(chǎng)版權(quán)指令》,其中第3條規(guī)定,允許研究組織和文化遺產(chǎn)機(jī)構(gòu)為科學(xué)研究目的對(duì)其合法獲取的作品或其他內(nèi)容進(jìn)行復(fù)制與提?。坏?(3)條規(guī)定,允許在權(quán)利人沒(méi)有以適當(dāng)方式明確保留對(duì)上述作品或其他內(nèi)容的使用的情況下,以文本和數(shù)據(jù)挖掘?yàn)槟康?,?duì)合法獲取的作品或其他內(nèi)容進(jìn)行復(fù)制與提取。2024年歐洲議會(huì)通過(guò)了《人工智能法案》,明確指出《數(shù)字化單一市場(chǎng)版權(quán)指令》中的文本與數(shù)據(jù)挖掘例外規(guī)則適用于人工智能模型訓(xùn)練。日本于2018年修訂《著作權(quán)法》時(shí),在第30條之4確立了非享受目的使用版權(quán)例外,規(guī)定當(dāng)對(duì)作品的利用并非為了自己或他人享受作品所表達(dá)的思想或情感時(shí),則在必要范圍內(nèi)可以以任何方式利用作品,為生成式人工智能的發(fā)展提供了充分的支持。美國(guó)則主要通過(guò)合理使用四要素標(biāo)準(zhǔn)進(jìn)行靈活判斷,亦為人工智能訓(xùn)練數(shù)據(jù)保留了適用空間。
而就我國(guó)現(xiàn)有合理使用制度來(lái)看,其適用空間較為有限。對(duì)于如何構(gòu)建人工智能訓(xùn)練數(shù)據(jù)的合理使用規(guī)則,學(xué)界存在諸多不同觀點(diǎn),有學(xué)者主張?jiān)鲈O(shè)非營(yíng)利性生成式人工智能機(jī)器學(xué)習(xí)的合理使用情形,并引入開(kāi)放、靈活的兜底條款;也有學(xué)者建議借鑒日本規(guī)定,以非欣賞性使用目的作為生成式人工智能合理使用作品的判斷依據(jù)。盡管對(duì)整體規(guī)則構(gòu)建尚未形成共識(shí),但至少就文化遺產(chǎn)領(lǐng)域而言,考慮到文化遺產(chǎn)的公共利益屬性及其保護(hù)傳承的緊迫需求,有必要為人工智能訓(xùn)練數(shù)據(jù)提供一個(gè)較為寬松的環(huán)境,以促進(jìn)人工智能技術(shù)的應(yīng)用,提高文化遺產(chǎn)保護(hù)傳承水平。
具體而言,在使用主體方面,不應(yīng)過(guò)度限制,例如歐盟《數(shù)字化單一市場(chǎng)版權(quán)指令》中的文化遺產(chǎn)機(jī)構(gòu)被定義為向公眾開(kāi)放的圖書館、博物館、檔案館、電影或音頻遺產(chǎn)機(jī)構(gòu),較為寬泛,值得借鑒。此外,應(yīng)允許文化遺產(chǎn)機(jī)構(gòu)委托或與其他專業(yè)機(jī)構(gòu)合作,以減輕技術(shù)和資金壓力。在使用目的方面,不應(yīng)拘泥于科學(xué)研究目的,正如學(xué)者所言,無(wú)論訓(xùn)練數(shù)據(jù)中的作品使用是為了科學(xué)研究還是商業(yè)性應(yīng)用,都承載著極大的公共利益。尤其在文化遺產(chǎn)保護(hù)面臨較大資金壓力的背景下,合理的商業(yè)化應(yīng)用有助于推動(dòng)文化遺產(chǎn)的可持續(xù)發(fā)展。在使用對(duì)象方面,應(yīng)以合法訪問(wèn)的數(shù)據(jù)為限。在使用方式方面,亦無(wú)需過(guò)多限制,以適應(yīng)人工智能技術(shù)開(kāi)發(fā)需求,但以不損害權(quán)利人的合法利益為必要。
(二)文化遺產(chǎn)數(shù)字資源版權(quán)授權(quán)機(jī)制的優(yōu)化
訓(xùn)練數(shù)據(jù)的供給直接影響生成模型性能,然而具有相當(dāng)規(guī)模、質(zhì)量和多樣性,并且可以自由重復(fù)使用的數(shù)據(jù)集仍然稀缺,特別是在歷史和文化領(lǐng)域。為了推動(dòng)生成式人工智能在文化遺產(chǎn)領(lǐng)域的深人應(yīng)用,文化遺產(chǎn)數(shù)字資源版權(quán)授權(quán)機(jī)制至少有以下兩點(diǎn)可以優(yōu)化。
首先,對(duì)于已經(jīng)超過(guò)版權(quán)保護(hù)期限的文化遺產(chǎn)及其數(shù)字資源,可以引人“知識(shí)共享許可協(xié)議”。學(xué)界對(duì)已經(jīng)進(jìn)人公共領(lǐng)域的文化遺產(chǎn)及其數(shù)字資源的使用是否需要取得文化遺產(chǎn)機(jī)構(gòu)的授權(quán),一直存有分歧。有學(xué)者認(rèn)為,文化遺產(chǎn)機(jī)構(gòu)向公眾提供公有領(lǐng)域作品的高清數(shù)字版本完全可行,也符合版權(quán)法的要求。有學(xué)者則提出相反意見(jiàn),以博物館為例,其認(rèn)為博物館文化資源開(kāi)發(fā)實(shí)質(zhì)就在于博物館產(chǎn)權(quán)授權(quán),即使文物藏品歷史久遠(yuǎn),作品版權(quán)中的財(cái)產(chǎn)權(quán)益不再受保護(hù),但其相關(guān)的署名權(quán)、修改權(quán)、保護(hù)作品完整權(quán)等人身權(quán)益依然應(yīng)得到維護(hù)。知識(shí)共享許可協(xié)議為促進(jìn)文化共享與保障創(chuàng)作者和消費(fèi)者合法權(quán)益提供了平衡方案,能夠在為作者提供靈活性的同時(shí),保護(hù)使用或重新分發(fā)作品的人免受版權(quán)侵權(quán)風(fēng)險(xiǎn),有助于推動(dòng)文化遺產(chǎn)數(shù)字資源開(kāi)放共享,進(jìn)而促進(jìn)生成式人工智能的應(yīng)用。
其次,在授權(quán)方式上,可以充分依托數(shù)字版權(quán)服務(wù)平臺(tái),為相關(guān)方提供便捷的磋商渠道,同時(shí)提高文化遺產(chǎn)傳播力影響力,推動(dòng)版權(quán)授權(quán)流程的高效化和規(guī)范化。例如,敦煌研究院打造的數(shù)據(jù)資源共享平臺(tái)“數(shù)字敦煌·開(kāi)放素材庫(kù)”,利用區(qū)塊鏈、數(shù)字水印等版權(quán)保護(hù)技術(shù),創(chuàng)新了文物數(shù)據(jù)資源開(kāi)放、共享、共創(chuàng)模式。
(三)建立內(nèi)容審核和標(biāo)識(shí)機(jī)制
面對(duì)人工智能生成內(nèi)容的版權(quán)侵權(quán)及倫理風(fēng)險(xiǎn),文化遺產(chǎn)機(jī)構(gòu)必須建立嚴(yán)格的內(nèi)容審核和標(biāo)識(shí)機(jī)制,以確保生成內(nèi)容的真實(shí)性與合法性。首先,需要建立內(nèi)容審核體系。一方面,整合已有的版權(quán)數(shù)據(jù)庫(kù),運(yùn)用內(nèi)容識(shí)別與過(guò)濾技術(shù),對(duì)最終輸出內(nèi)容進(jìn)行對(duì)比,從而識(shí)別并及時(shí)阻止版權(quán)侵權(quán)內(nèi)容的傳播。僅依賴技術(shù)手段可能存在“誤傷”問(wèn)題,因此需要設(shè)立人工審核環(huán)節(jié),對(duì)不確定或存在爭(zhēng)議的內(nèi)容進(jìn)行復(fù)核,尤其對(duì)于關(guān)鍵任務(wù)或敏感場(chǎng)景,需設(shè)立專家審核團(tuán)隊(duì),確保生成內(nèi)容符合法律和倫理規(guī)范。另一方面,基于自然語(yǔ)言處理、知識(shí)圖譜等技術(shù),結(jié)合智能識(shí)別和自動(dòng)化事實(shí)驗(yàn)證技術(shù),對(duì)人工智能生成內(nèi)容進(jìn)行實(shí)時(shí)審核,確保其真實(shí)性與準(zhǔn)確性。其次,建立完善的內(nèi)容標(biāo)識(shí)機(jī)制。通過(guò)區(qū)塊鏈、數(shù)字水印等技術(shù)為人工智能生成內(nèi)容提供明確的來(lái)源、版權(quán)歸屬等標(biāo)識(shí),為內(nèi)容溯源和版權(quán)保護(hù)提供有力支撐。
五、結(jié)語(yǔ)
當(dāng)前,生成式人工智能技術(shù)與文化遺產(chǎn)領(lǐng)域的融合不斷深入,賦能作用日益凸顯,為文化遺產(chǎn)的保存、展示、傳播與利用提供了全新思路和方式,使文化遺產(chǎn)保護(hù)傳承中的諸多難題得以破解。然而,隨之而來(lái)的版權(quán)挑戰(zhàn)也不容忽視。為平衡版權(quán)保護(hù)與技術(shù)賦能的關(guān)系,亟需進(jìn)一步完善合理使用制度,優(yōu)化文化遺產(chǎn)數(shù)字資源的版權(quán)授權(quán)機(jī)制,并建立健全內(nèi)容審核與標(biāo)識(shí)機(jī)制,以更好地推動(dòng)生成式人工智能技術(shù)在文化遺產(chǎn)領(lǐng)域的創(chuàng)新應(yīng)用,助力中國(guó)式現(xiàn)代化建設(shè),促進(jìn)中華民族現(xiàn)代文明的發(fā)展與繁榮。
(作者易玲系中南大學(xué)法學(xué)院教授、博士生導(dǎo)師,中南大學(xué)文化遺產(chǎn)研究院執(zhí)行院長(zhǎng);紀(jì)孟汝系中南大學(xué)文化遺產(chǎn)研究院助理)
Abstract: As a cutting-edge development in the field of artificial intelligence, generative artificial intelligence, with its powerful data analysis and content generation capabilities, provides new technical support for improving the level of cultural heritage restoration and preservation, display, dissemination, research and interpretation, and enriching innovative utilization paths. It has been integrated into all aspects of cultural heritage protection and inheritance. However, while enabling the innovative development of cultural heritage protection, inheritance and inheritance, it also brings about issues such as the legitimacy of training data,the copyright ownership of Artificial Intelligence Generated Content, and potential infringement risks, which have become a major obstacle to the deep integration of generative artificial intelligence technology and cultural heritage protection and inheritance.To this end, we should further improve the reasonable use system, optimize the copyright authorization mechanism of cultural heritage digital resources,and establish a sound content review and identification mechanism to achieve a balance between copyright protection and technological empowerment, and help cultural heritage to rejuvenate.
Keywords: cultural heritage; generative artificial intelligence; Artificial Intelligence Generated Content; copyright protection