摘要:對生成式人工智能應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)的典型案例進(jìn)行調(diào)查,旨在發(fā)現(xiàn)生成式人工智能的使用方法與策略,推動(dòng)文化遺產(chǎn)保護(hù)機(jī)構(gòu)數(shù)字轉(zhuǎn)型的理論研究。通過案例分析,從項(xiàng)目背景、目標(biāo)、主體和成果四個(gè)方面對英國“邁向國家寶藏·虛擬利物浦雙年展”項(xiàng)目展開分析,解析我國文化遺產(chǎn)保護(hù)機(jī)構(gòu)使用生成式人工智能可參考的要點(diǎn)。由此提出:生成式人工智能應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)可在本土文化創(chuàng)新與全球視野下進(jìn)行應(yīng)用場景構(gòu)建、數(shù)據(jù)要素化導(dǎo)向下進(jìn)行文化數(shù)據(jù)資源建設(shè)、文化科技發(fā)展驅(qū)動(dòng)下進(jìn)行技術(shù)開放自主應(yīng)用以及產(chǎn)學(xué)研用聯(lián)動(dòng)框架下構(gòu)建協(xié)作機(jī)制。
關(guān)鍵詞:生成式人工智能 文化遺產(chǎn) 數(shù)字轉(zhuǎn)型 數(shù)據(jù)要素化 文化數(shù)據(jù)資源
Abstract: A typical case study on the applica? tion of generative artificial intelligence to cultural heritage protection organizations is conducted with the aim of discovering the methods and strategies of using generative artificial intelli? gence and promoting the theoretical research on the digital transformation of cultural heritage pro? tection organizations. Through the case study, the UK Towards a National Collection: Virtual Liv? erpool Biennial project is analyzed in terms of project background, objectives, subjects and out? comes, and the key points that can be referred to for the use of generative AI in cultural heritage protection organizations in China are analyzed. It is proposed that the application of generative AI to cultural heritage protection institutions can be carried out under the indigenous cultural innova? tion and global perspective for the construction of application scenarios, the construction of cul? tural data resources under the guidance of data elementalization, the open and autonomous appli? cation of technology driven by the development of cultural science and technology, and the con? struction of collaborative mechanisms under the framework of industry-university-research-ap? plication linkage.
Keywords: Generative artificial intelligence; Cultural heritage; Digital transformation;Data ele? mentization;Cultural data resources
近年來,人工智能應(yīng)用于文化遺產(chǎn)保護(hù)領(lǐng)域成為其數(shù)字轉(zhuǎn)型的重要方向。面向多樣化的人工智能技術(shù),如何選擇適用場景,對于文化遺產(chǎn)保護(hù)機(jī)構(gòu)而言同樣是關(guān)鍵議題。例如,第二屆進(jìn)博會(huì)“非物質(zhì)文化遺產(chǎn)暨中華老字號”展區(qū)設(shè)置了“非遺+ AI”區(qū)域。[1]巴黎圣母院的重建團(tuán)隊(duì)依托火災(zāi)前留存的數(shù)字掃描資料,利用最新的現(xiàn)實(shí)捕捉等技術(shù),創(chuàng)建了與火災(zāi)前的巴黎圣母院完全相同的3D模型。[2]隨著ChatGPT等生成式人工智能(Genera? tive Artificial Intelligence,GAI)在2023年引發(fā)一系列熱點(diǎn)議題,[3]文化遺產(chǎn)保護(hù)機(jī)構(gòu)的機(jī)遇與挑戰(zhàn)需要在原有探索基礎(chǔ)上進(jìn)一步明晰,以跟進(jìn)數(shù)字轉(zhuǎn)型的步伐。
研究層面,直接圍繞GAI應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)的討論較為有限。一是探討如何基于人工智能建設(shè)跨平臺的資源,以應(yīng)對圖書館、博物館等機(jī)構(gòu)都擁有大量資源數(shù)字轉(zhuǎn)換、連通、集成帶來的技術(shù)與工作量的挑戰(zhàn)。[4]二是從文化遺產(chǎn)保護(hù)流程出發(fā),研究人工智能如何優(yōu)化采集[5]、分類[6]、保存[7]與傳播[8]等環(huán)節(jié)。例如,探討人工智能在建筑文化遺產(chǎn)還原與活化中的應(yīng)用。[9]三是探討不同技術(shù)應(yīng)用的挑戰(zhàn),如文化遺產(chǎn)數(shù)字化產(chǎn)權(quán)保護(hù)與版權(quán)法律[10]等風(fēng)險(xiǎn)。四是探討數(shù)字轉(zhuǎn)型背景下文化遺產(chǎn)保護(hù)機(jī)構(gòu)的實(shí)踐策略,加大數(shù)字技術(shù)引入[11],推動(dòng)多方合作與公眾參與[12],針對特定的應(yīng)用場景打造多元的資源服務(wù)等[13]。現(xiàn)有研究顯示出推動(dòng)文化遺產(chǎn)保護(hù)與人工智能相融合已成為保護(hù)文化遺產(chǎn)的有效方式之一,對照實(shí)踐中GAI在人機(jī)交互、復(fù)雜數(shù)字內(nèi)容生產(chǎn)及高度擬人化等方面的顯著效果,研究層面的探索尚需跟進(jìn)與深入。
因此,本文將對英國“邁向國家寶藏”項(xiàng)目的子項(xiàng)目——“虛擬利物浦雙年展”項(xiàng)目(A Towards a Na? tional Collection Project:Virtual Liverpool Biennial Project)展開分析。[14]這是因?yàn)樵擁?xiàng)目是當(dāng)下使用GAI的前沿與典型實(shí)踐。本文將對該項(xiàng)目展開梳理與分析,呈現(xiàn)GAI應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)的實(shí)踐進(jìn)展、經(jīng)驗(yàn)與問題,從而提煉我國文化遺產(chǎn)保護(hù)機(jī)構(gòu)的GAI應(yīng)用展望。
“邁向國家寶藏”項(xiàng)目是一項(xiàng)涵蓋數(shù)字化遺產(chǎn)保護(hù)及數(shù)字原生信息保護(hù)在內(nèi)的綜合性數(shù)字遺產(chǎn)保護(hù)實(shí)踐。該項(xiàng)目由英國國家科研與創(chuàng)新署戰(zhàn)略重點(diǎn)基金會(huì)于2020年資助設(shè)立,由藝術(shù)與人文研究理事會(huì)負(fù)責(zé)指導(dǎo),吸引了眾多檔案館、圖書館、博物館、大學(xué)等機(jī)構(gòu)參與其中。“虛擬利物浦雙年展”項(xiàng)目是“邁向國家寶藏”項(xiàng)目的子項(xiàng)目,于2021年1月1日至2021年8月31日開展,其目標(biāo)在于探索策展與GAI之間的關(guān)系,將策展重新定義為一個(gè)具有自我學(xué)習(xí)能力的人機(jī)交互系統(tǒng)。該項(xiàng)目旨在創(chuàng)建一個(gè)平行的人工智能與用戶聯(lián)合策展的在線平臺,從而促進(jìn)用戶與館藏互動(dòng)。
(一)項(xiàng)目背景
一是數(shù)字人文的發(fā)展使數(shù)字遺產(chǎn)保護(hù)成為文化遺產(chǎn)保護(hù)機(jī)構(gòu)的核心職責(zé)之一。英國的數(shù)字人文學(xué)科在數(shù)字遺產(chǎn)保護(hù)方面存在空白,但通過引入GAI等數(shù)字技術(shù),可為文化遺產(chǎn)保護(hù)提供新的方法和工具,優(yōu)化文化遺產(chǎn)的數(shù)字保存和訪問。
二是GAI為文化遺產(chǎn)保護(hù)機(jī)構(gòu)與公眾的互動(dòng)提供了新的可能性。尤其體現(xiàn)在借助GAI促進(jìn)公眾對遺產(chǎn)的數(shù)字訪問。例如,建立可互通互用的數(shù)字資源庫、開發(fā)涵蓋跨領(lǐng)域的多元利益相關(guān)者的資源平臺、深度挖掘數(shù)字資源以提供更具知識性的產(chǎn)品和服務(wù)等。
三是GAI可以滿足文化遺產(chǎn)保護(hù)機(jī)構(gòu)在多模態(tài)數(shù)據(jù)處理、用戶分析和數(shù)字?jǐn)⑹碌确矫娴男枨?。該?xiàng)目所使用的數(shù)據(jù)大多數(shù)不是具象圖像類型的數(shù)據(jù),而是多模態(tài)的復(fù)雜數(shù)據(jù)。借助GAI,可以應(yīng)對不同類型資源轉(zhuǎn)換、連通和集成帶來的挑戰(zhàn)。
(二)項(xiàng)目目標(biāo)
一是重新定義GAI在畫廊(Galleries)、圖書館(Libraries)、檔案館(Archives)和博物館(Muse? ums)領(lǐng)域(以下簡稱GLAM)的應(yīng)用。傳統(tǒng)模式下,大多數(shù)人工智能都作為單模態(tài)搜索引擎或自動(dòng)化編目方式被部署在GLAM環(huán)境中,一次只能處理一種信息模式。該項(xiàng)目將計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)視為策展主體之一,使其與人類一起工作,從而推動(dòng)GAI在GLAM領(lǐng)域的深層次應(yīng)用。
二是使用新模型收集用戶如何與系統(tǒng)進(jìn)行交互的數(shù)據(jù)。項(xiàng)目關(guān)注的是哪些用戶可能會(huì)對機(jī)器策劃的在線展覽感興趣,同時(shí),在線展覽在將藝術(shù)帶給用戶方面顯示出巨大潛力,但也面臨滿足用戶需求以及不同認(rèn)知水平的用戶如何以不同的方式參與策展活動(dòng)等問題。因此,通過新模型收集數(shù)據(jù),能夠探索新的策展模式以及如何滿足用戶需求,并不斷優(yōu)化完善。
三是調(diào)查項(xiàng)目組長期使用的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)模型可能存在的偏見,以及人機(jī)交互的協(xié)同策展框架是否能向在線用戶揭示這些偏見。這在傳統(tǒng)的搜索引擎或自動(dòng)元數(shù)據(jù)生成中是很難做到的,GAI可以更全面地審查和糾正這些偏見,以確保文化遺產(chǎn)的公平訪問。
(三)項(xiàng)目主體
“虛擬利物浦雙年展”項(xiàng)目是一個(gè)多方合作的跨學(xué)科實(shí)踐項(xiàng)目,由杜倫大學(xué)計(jì)算機(jī)科學(xué)系主導(dǎo),并得到多個(gè)合作伙伴,包括利物浦藝術(shù)與設(shè)計(jì)學(xué)院、利物浦約翰摩爾大學(xué)等的支持。這些合作伙伴不僅提供了前端網(wǎng)絡(luò)開發(fā)資金和實(shí)物資源,還參與了項(xiàng)目的策展支持和網(wǎng)站托管等工作。
項(xiàng)目的研究人員由跨學(xué)科團(tuán)隊(duì)組成,包括2名具有人文學(xué)科背景的學(xué)者和3名具有計(jì)算機(jī)學(xué)科背景的學(xué)者。不同專業(yè)背景的合作者負(fù)責(zé)不同的任務(wù),實(shí)現(xiàn)跨領(lǐng)域合作。例如,主要研究者萊昂納多·因佩特作為項(xiàng)目負(fù)責(zé)人,具備數(shù)字人文背景,負(fù)責(zé)機(jī)器學(xué)習(xí)系統(tǒng)的開發(fā)和數(shù)據(jù)清理等工作。
(四)項(xiàng)目成果
1.基于視覺與文本的多模態(tài)數(shù)據(jù)分析與處理。GAI具有多模態(tài)數(shù)據(jù)處理能力,能夠有效應(yīng)對藝術(shù)數(shù)據(jù)的多樣性和復(fù)雜性。與傳統(tǒng)的計(jì)算機(jī)視覺研究不同,該項(xiàng)目使用了利物浦雙年展的檔案數(shù)據(jù),其中包含如作品的背景、藝術(shù)家的觀點(diǎn)等在傳統(tǒng)的繪畫收藏中并不常見但對于深入理解作品和藝術(shù)家意圖至關(guān)重要且多模態(tài)的數(shù)據(jù)。多模態(tài)數(shù)據(jù)處理是GAI的一項(xiàng)強(qiáng)大功能,它不僅能理解圖像,還能處理文本,并從中提取并建立有用的關(guān)聯(lián),為更全面的數(shù)據(jù)分析提供支持。該方式創(chuàng)新了GAI在文化遺產(chǎn)領(lǐng)域的應(yīng)用,同時(shí)有助于更全面地理解和呈現(xiàn)當(dāng)代藝術(shù)作品。
2.用戶與GAI互動(dòng)的策展平臺。項(xiàng)目組采用圖像字幕網(wǎng)絡(luò)、關(guān)鍵詞提取網(wǎng)絡(luò)、圖像嵌入網(wǎng)絡(luò)、生成式對抗網(wǎng)絡(luò)和語言圖像預(yù)訓(xùn)練網(wǎng)絡(luò)五個(gè)不同的神經(jīng)網(wǎng)絡(luò)組合,打造了一個(gè)用戶與GAI互動(dòng)的個(gè)性化策展平臺。
在平臺的首頁上,用戶會(huì)看到由GAI根據(jù)源藝術(shù)品標(biāo)題生成的圖像。這些圖像是深度學(xué)習(xí)網(wǎng)絡(luò)在沒有任何文本信息的情況下,僅依靠圖像對藝術(shù)品所描述事件的最佳猜測。用戶點(diǎn)擊首頁上的任意一幅圖像,會(huì)看到一組由圖像和文本組成的圖。中間是源圖像,左側(cè)是AI生成的圖像,右側(cè)是AI認(rèn)為對生成該描述重要的圖像點(diǎn)的示意圖。與傳統(tǒng)的在線展覽不同,“虛擬利物浦雙年展”項(xiàng)目的每位用戶由于與機(jī)器學(xué)習(xí)系統(tǒng)共同策展,因此在相同的順序中不會(huì)看到同樣的作品集。
深度學(xué)習(xí)模型被用來收集用戶與系統(tǒng)互動(dòng)的數(shù)據(jù)。在該平臺上,用戶可以探索原始圖像和GAI生成的文字、圖像之間的聯(lián)系。用戶的每一次參與都將成為平臺的一次人機(jī)迭代,相關(guān)數(shù)據(jù)將被保存到項(xiàng)目的公共存儲(chǔ)庫中并通過在線系統(tǒng)提供用戶瀏覽。為確保個(gè)人隱私安全,該項(xiàng)實(shí)驗(yàn)以匿名方式開展。
3.實(shí)驗(yàn)與反思:減少GAI在策展應(yīng)用中的偏見。該項(xiàng)目展示了GAI在糾正偏見、消除硬性區(qū)別中應(yīng)用的潛力。進(jìn)行這項(xiàng)實(shí)驗(yàn)的目的是:一是如何消除機(jī)器學(xué)習(xí)系統(tǒng)中的偏見,消除人類和機(jī)器之間的硬性區(qū)別,以推動(dòng)更多樣化的策展模式;二是如何增強(qiáng)公眾對機(jī)器學(xué)習(xí)系統(tǒng)的信任,促進(jìn)其在文化遺產(chǎn)領(lǐng)域的批判性應(yīng)用。
為實(shí)現(xiàn)項(xiàng)目目標(biāo),項(xiàng)目組基于公開的視覺藝術(shù)數(shù)據(jù)集(WikiArt和Web Gallery of Art),使用語言圖像預(yù)訓(xùn)練網(wǎng)絡(luò)(Contrastive Language-Image Pretraining,CLIP),在生成式對抗網(wǎng)絡(luò)的幫助下轉(zhuǎn)化為圖像生成和圖像分類工具,這使得項(xiàng)目組能夠更準(zhǔn)確地研究其隱含的視覺、記憶、邏輯偏見。三個(gè)實(shí)驗(yàn)分別為:零樣本分類實(shí)驗(yàn)探索CLIP是否更善于記住某些特定類別,如場景類型、風(fēng)景等;零樣本檢索實(shí)驗(yàn)探索CLIP對圖像的編碼和計(jì)算能力;圖像生成實(shí)驗(yàn)探索CLIP與GAI一起使用是否能生成令人信服的知名作品。該項(xiàng)目還建立了一個(gè)獨(dú)立的開源代碼庫,將相關(guān)成果以共享的方式開放給大眾使用。
在數(shù)字轉(zhuǎn)型背景下,GAI如何應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)成為國際社會(huì)積極探索的方向。為了實(shí)現(xiàn)數(shù)字遺產(chǎn)的有效保護(hù),“虛擬利物浦雙年展”項(xiàng)目在基金會(huì)、大學(xué)等機(jī)構(gòu)的支持下順利實(shí)施,展示了GAI在數(shù)字遺產(chǎn)保護(hù)方面的巨大潛力,其實(shí)踐動(dòng)態(tài)顯示出以下幾個(gè)典型要點(diǎn)。
(一)典型場景識別為前提
GAI應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu),在數(shù)據(jù)供應(yīng)、基礎(chǔ)設(shè)施配置以及技術(shù)開發(fā)等多個(gè)方面,均有強(qiáng)大的資源需求。在文化遺產(chǎn)保護(hù)機(jī)構(gòu)資源有限的情況下,資源的有效利用更為重要。在此背景下,該項(xiàng)目以識別具體場景為策略,旨在由小及大、由點(diǎn)及面推動(dòng)GAI的應(yīng)用。
一是將利物浦雙年展的部分展品選作試驗(yàn)對象?!疤摂M利物浦雙年展”項(xiàng)目聚焦于利物浦雙年展的多模態(tài)數(shù)據(jù),因其數(shù)據(jù)資源類型豐富多樣且具有代表性,可以進(jìn)行多樣的探索。首先,對多模態(tài)數(shù)據(jù)進(jìn)行分析,從中提取有用的信息并建立關(guān)聯(lián);其次,采用多模態(tài)神經(jīng)網(wǎng)絡(luò),引導(dǎo)圖像生成并產(chǎn)出可解釋性熱成像圖,通過在線系統(tǒng),使用戶與GAI互動(dòng),增強(qiáng)人機(jī)策展的個(gè)性化體驗(yàn);最后,為了更好地促進(jìn)GAI的應(yīng)用,項(xiàng)目不僅開設(shè)了開源代碼庫,還通過零樣本分類、檢索和圖像生成實(shí)驗(yàn)增強(qiáng)用戶對機(jī)器學(xué)習(xí)系統(tǒng)的信任。以上三項(xiàng)探索雖然只是在小范圍內(nèi)進(jìn)行,但是其他機(jī)構(gòu)和研究人員可以通過項(xiàng)目的開源成果,借鑒其在推進(jìn)文化遺產(chǎn)線上開發(fā)利用并創(chuàng)造出新應(yīng)用場景方面的解決方案。
二是立足實(shí)踐,將應(yīng)用場景設(shè)定為優(yōu)化并完善線上策展。該項(xiàng)目始于2021年,由于多數(shù)實(shí)體檔案館、博物館的館藏資源無法提供穩(wěn)定的線下利用,而在線利用又面臨服務(wù)深度與質(zhì)量的挑戰(zhàn),因此,該項(xiàng)目將GAI的應(yīng)用場景精準(zhǔn)設(shè)定于線上策展,強(qiáng)調(diào)提升其智能化程度,以適應(yīng)不同用戶群體的需求。同時(shí),該項(xiàng)目并不是將線下服務(wù)照搬遷移于線上,而是更強(qiáng)調(diào)要通過GAI變革策展模式與可能性。因此,項(xiàng)目提出要突破線下難以實(shí)現(xiàn)的個(gè)性化展覽,通過GAI識別用戶需求,并根據(jù)需求提供個(gè)性化的策展服務(wù)。
(二)全面的數(shù)據(jù)化為基礎(chǔ)
隨著全球數(shù)字轉(zhuǎn)型的持續(xù)推進(jìn),各領(lǐng)域均在探索如何融入數(shù)據(jù)化趨勢從而實(shí)現(xiàn)創(chuàng)新變革,文化遺產(chǎn)領(lǐng)域亦是如此。一方面,文化遺產(chǎn)資源需要全面數(shù)據(jù)化,從而更好地提供利用;另一方面,需要積極采集用戶的行為數(shù)據(jù),精準(zhǔn)識別用戶需求,才能更好地推進(jìn)項(xiàng)目的開展。該項(xiàng)目以數(shù)字轉(zhuǎn)型為背景并強(qiáng)調(diào)數(shù)據(jù)化處理,主要體現(xiàn)在以下兩個(gè)方面。
一是資源對象的數(shù)據(jù)化。項(xiàng)目強(qiáng)調(diào)多模態(tài)資源對象的數(shù)據(jù)化處理,包括視覺圖像、文本信息等。通過充分利用GAI的多模態(tài)數(shù)據(jù)處理能力,項(xiàng)目成功地將資源進(jìn)行全面的數(shù)據(jù)化處理,不僅提高了文化遺產(chǎn)的可訪問性,細(xì)粒度的數(shù)據(jù)還有助于用戶更好地理解藝術(shù)品本身,揭示藝術(shù)家的觀點(diǎn)和創(chuàng)作意圖,提升用戶的線上服務(wù)體驗(yàn),同時(shí)也為未來的研究、教育和創(chuàng)新提供了寶貴的資源。
二是用戶數(shù)據(jù)的分析處理。項(xiàng)目在數(shù)據(jù)的采集、訓(xùn)練、使用方面取得了重要進(jìn)展。通過收集用戶互動(dòng)的多源數(shù)據(jù),包括用戶的點(diǎn)擊、瀏覽路徑、喜好和反饋等,該項(xiàng)目能夠從不同角度了解用戶對在線展覽的興趣和需求。這些數(shù)據(jù)不僅用于改進(jìn)展覽的個(gè)性化推薦,還用于深度學(xué)習(xí)數(shù)據(jù)分析,成功地提升了文化遺產(chǎn)保護(hù)和數(shù)字化藝術(shù)展覽的用戶體驗(yàn),為GAI在GLAM領(lǐng)域的應(yīng)用提供了有力支持。
(三)技術(shù)開放式利用為手段
GAI的應(yīng)用需要?jiǎng)?chuàng)新性的技術(shù)投入,在文化遺產(chǎn)保護(hù)機(jī)構(gòu)自身能力有限的情況下,其開放式利用成為重要手段,主要體現(xiàn)在以下兩個(gè)方面。
一是技術(shù)開源,強(qiáng)調(diào)與其他機(jī)構(gòu)的合作。一方面,該項(xiàng)目凸顯對前沿技術(shù)的開放使用。從項(xiàng)目時(shí)間線來看,在2021年就已洞察到GAI的發(fā)展?jié)摿?,及時(shí)追蹤并使用尚在發(fā)展過程中的OpenAI,體現(xiàn)出對技術(shù)的前瞻視野。另一方面,GAI即便已有其他技術(shù)公司的支持,如何應(yīng)用于具體領(lǐng)域乃至場景同樣需要長足的開發(fā)進(jìn)程,因而同樣需要多方助力。該項(xiàng)目因此設(shè)立了開源代碼庫,內(nèi)容不僅包括項(xiàng)目的核心技術(shù)和算法,還提供了相關(guān)數(shù)據(jù)和工具。這為技術(shù)應(yīng)用提供了一個(gè)公開的“眾包”平臺,供其他研究人員和社區(qū)成員參與共建和共享。通過技術(shù)開源,項(xiàng)目突破了自身的封閉性,還與全球范圍內(nèi)的專業(yè)人士建立了聯(lián)系。這種開放的合作模式不僅加速技術(shù)的演進(jìn)和項(xiàng)目的發(fā)展,也為GAI在文化遺產(chǎn)領(lǐng)域的應(yīng)用提供了更多的可能性。
二是強(qiáng)調(diào)技術(shù)的批判性利用。無論是技術(shù)應(yīng)用還是館藏資源管理,均強(qiáng)調(diào)批判性的風(fēng)險(xiǎn)思維,加強(qiáng)技術(shù)應(yīng)用風(fēng)險(xiǎn)的識別并制定相應(yīng)的指引,避免在文化遺產(chǎn)保護(hù)和開發(fā)利用過程中產(chǎn)生不良的倫理與法理后果。例如,項(xiàng)目采用了多源數(shù)據(jù),因此在數(shù)據(jù)處理方面提出技術(shù)應(yīng)用過程中要配置相應(yīng)的敏感數(shù)據(jù)使用指引、用戶隱私保護(hù)方案等;努力消除機(jī)器學(xué)習(xí)系統(tǒng)中的潛在偏見;積極倡導(dǎo)建立人工智能與人的良性關(guān)系,強(qiáng)調(diào)人工智能的應(yīng)用是為了服務(wù)并提升人類的體驗(yàn),而不是替代或削弱人的角色。
(四)跨領(lǐng)域多元主體協(xié)作為方略
鑒于GAI本身處在發(fā)展進(jìn)程中,其應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)更是創(chuàng)新性的復(fù)雜事務(wù),文化遺產(chǎn)保護(hù)機(jī)構(gòu)自身的資源與能力難以獨(dú)立應(yīng)對,跨領(lǐng)域的多元主體合作是基本方略。
一是合作主體是來自不同性質(zhì)和職能的機(jī)構(gòu)。該項(xiàng)目的指導(dǎo)方重點(diǎn)關(guān)注方向之一是研究和解鎖文化遺產(chǎn),保護(hù)、策劃和最大限度地發(fā)揮GLAM的作用,從國家層面展開統(tǒng)一部署和支持;項(xiàng)目的實(shí)施者包含大學(xué)、網(wǎng)絡(luò)托管部門、科研機(jī)構(gòu)等,實(shí)現(xiàn)在指導(dǎo)方的領(lǐng)導(dǎo)下各協(xié)作主體共同合作。
二是不同學(xué)科背景人員的相互合作。該項(xiàng)目首席調(diào)查員、合作調(diào)查員等主要合作伙伴均來自不同的學(xué)科領(lǐng)域,有數(shù)字人文、計(jì)算機(jī)科學(xué)、生物信息學(xué)等學(xué)科領(lǐng)域,不同領(lǐng)域的合作伙伴在項(xiàng)目建設(shè)過程中均貢獻(xiàn)著自己的專業(yè)知識。
三是社會(huì)利用導(dǎo)向下深化公眾參與。該項(xiàng)目體現(xiàn)出以社會(huì)化利用為目標(biāo)性策略,將用戶轉(zhuǎn)化為資源投入者與行動(dòng)貢獻(xiàn)者,共同解決GAI應(yīng)用過程中的各類挑戰(zhàn)。一方面,推動(dòng)公眾參與數(shù)字遺產(chǎn)保護(hù)實(shí)踐。這主要體現(xiàn)在用戶與GAI互動(dòng)策展平臺建設(shè)方面。平臺引導(dǎo)用戶與GAI互動(dòng),使其能夠根據(jù)自己的興趣和需求進(jìn)行深入探索,實(shí)現(xiàn)個(gè)性化、互動(dòng)性和創(chuàng)新性的虛擬展覽體驗(yàn)。另一方面,注重吸納用戶反饋以促進(jìn)項(xiàng)目的不斷發(fā)展。項(xiàng)目組邀請公眾了解項(xiàng)目的內(nèi)部運(yùn)作、項(xiàng)目成果等,并指出項(xiàng)目存在的不足,通過不斷調(diào)整和優(yōu)化,探索可提升的空間。這種模式增強(qiáng)了項(xiàng)目與公眾之間的互信,使文化遺產(chǎn)保護(hù)成為一個(gè)更廣泛參與的社會(huì)行動(dòng)。
隨著人工智能發(fā)展被納入國家戰(zhàn)略,尤其是GAI的快速發(fā)展,其在文化遺產(chǎn)領(lǐng)域的應(yīng)用取得了豐富的成果,但也面臨挑戰(zhàn)。
一方面,已有的人工智能應(yīng)用探索成果豐富。一是以各類記憶項(xiàng)目為牽引開展實(shí)踐探索。如數(shù)字故宮、北京記憶、數(shù)字敦煌等項(xiàng)目均呈現(xiàn)豐富的探索成就。以故宮團(tuán)隊(duì)建立的數(shù)字博物館為例,借助人工智能,人們在這里可以與1200多座古建筑對話。[15]敦煌研究院發(fā)布的“數(shù)字敦煌”資源庫,提供30個(gè)精品洞窟的高清數(shù)字化圖像及全景漫游。[16]二是將人工智能應(yīng)用于文化遺產(chǎn)保護(hù)各流程中。例如,利用人工智能通過虛擬方式拼接、修復(fù)被毀壞的文物,或?qū)⑷斯ぶ悄軕?yīng)用于展廳溫濕度控制、古建筑病害監(jiān)測等。例如,《我在故宮修文物》系列邀請了故宮博物院古建部專家團(tuán),攜手商湯科技,選取AI+AR、NFC芯片與區(qū)塊鏈加密等技術(shù)為故宮古建修繕內(nèi)容進(jìn)行高度精準(zhǔn)與中正的匹配及轉(zhuǎn)化。[17]此外,該系列電子出版物還建立了“數(shù)字文物庫”,將人工智能修復(fù)的超過68000件文物的高清數(shù)字影像對外發(fā)布。三是借助人工智能推出大量數(shù)字文化精品。如北京冬奧會(huì)開幕式為觀眾呈現(xiàn)的非物質(zhì)文化遺產(chǎn)“二十四節(jié)氣”。河南衛(wèi)視以5G+AR技術(shù)將虛擬場景和現(xiàn)實(shí)舞臺結(jié)合,將傳統(tǒng)文化與前沿科技創(chuàng)新交融。[18]
另一方面,GAI也得到文化遺產(chǎn)領(lǐng)域的關(guān)注,體現(xiàn)出廣闊的應(yīng)用空間,但也存在亟待解決的難點(diǎn)。例如,南京農(nóng)業(yè)大學(xué)研發(fā)的國內(nèi)首個(gè)專門應(yīng)用于古籍處理與研究的智能工具——古籍大語言模型“荀子”,包含了《四庫全書》在內(nèi)的超20億字古籍文獻(xiàn),能夠?qū)崿F(xiàn)自然語言理解、詩歌生成、自動(dòng)標(biāo)引等多項(xiàng)功能。[19]2024年,澄江化石地世界自然遺產(chǎn)博物館借助AIGC復(fù)原了“寒武紀(jì)生命大爆發(fā)”的場景以及地球生命演化的神奇壯美。[20]從現(xiàn)有實(shí)踐進(jìn)展來看,GAI在文化遺產(chǎn)領(lǐng)域的應(yīng)用存在應(yīng)用場景較為單一,各項(xiàng)目多在自主探索階段,缺乏多元、典型與適用場景的構(gòu)建以實(shí)現(xiàn)成規(guī)模、成整體的實(shí)踐體系等問題。因此,基于“虛擬利物浦雙年展”項(xiàng)目,我國文化遺產(chǎn)保護(hù)機(jī)構(gòu)的GAI應(yīng)用展望如下。
(一)本土文化創(chuàng)新與全球視野下的應(yīng)用場景構(gòu)建
我國文化遺產(chǎn)保護(hù)機(jī)構(gòu)在GAI優(yōu)質(zhì)應(yīng)用開發(fā)方面,面臨著需要大量資源投入的挑戰(zhàn),因此,選定典型與適用場景,建立以點(diǎn)帶面的應(yīng)用體系,成為關(guān)鍵策略。就應(yīng)用場景的選定和建構(gòu)而言,我國特色文化和現(xiàn)實(shí)背景可以提供系統(tǒng)的參考思路。結(jié)合這些背景,并立足文化遺產(chǎn)保護(hù)機(jī)構(gòu)的構(gòu)成要素,應(yīng)用場景可從如下方面考量。
一是以黨對宣傳思想文化工作的布局和要求為引領(lǐng),彰顯并踐行社會(huì)主義核心價(jià)值觀。在當(dāng)前中國式現(xiàn)代化建設(shè)的背景下,場景的選定應(yīng)當(dāng)考慮文化遺產(chǎn)保護(hù)機(jī)構(gòu)如何服務(wù)于人類命運(yùn)共同體構(gòu)建、數(shù)字文明建設(shè)、基本公共服務(wù)均等化等目標(biāo)。例如,普惠各類用戶線上展陳同樣可作為場景選擇方向之一。在實(shí)施過程中,確保線上展陳對殘障人士、老年人、兒童等人群開放,提供語音導(dǎo)航、多語言字幕支持、高對比度模式等多種輔助功能。
二是強(qiáng)調(diào)立足本土的中華優(yōu)秀傳統(tǒng)文化創(chuàng)新發(fā)展。一方面,我國文獻(xiàn)遺產(chǎn)的活化傳承是賡續(xù)中華文化血脈的重要路徑。在文化遺產(chǎn)保護(hù)和開發(fā)利用全流程中,可選定重點(diǎn)環(huán)節(jié)作為場景。另一方面,現(xiàn)當(dāng)代的文明傳播與發(fā)揚(yáng)同樣關(guān)鍵,講述中國故事是核心內(nèi)容。文化遺產(chǎn)保護(hù)機(jī)構(gòu)應(yīng)該立足所在區(qū)域、館藏特色、機(jī)構(gòu)專長與資源能力,從文化數(shù)據(jù)采集到提供數(shù)據(jù)產(chǎn)品與服務(wù)的過程中,均可提供典型場景。
三是聯(lián)動(dòng)文化事業(yè)和文化產(chǎn)業(yè)發(fā)展。以文化數(shù)字化戰(zhàn)略為指導(dǎo),在數(shù)字轉(zhuǎn)型框架下,從文化遺產(chǎn)保護(hù)機(jī)構(gòu)自身的數(shù)字能力建構(gòu)到文化對象數(shù)字化建設(shè),均應(yīng)積極對接文化產(chǎn)業(yè)化的思路。這一過程中的工作內(nèi)容也可提取重要場景。
四是以全球視野增強(qiáng)國際傳播能力建設(shè)。場景的選定和設(shè)計(jì)需要充分考慮國際化前景,既要體現(xiàn)我國特色與優(yōu)勢,又要便于國際層面理解和吸納相關(guān)成果。例如,可調(diào)查世界范圍內(nèi)正在著力建設(shè)的場景,實(shí)現(xiàn)從技術(shù)到方法的共建共享。
(二)數(shù)據(jù)要素化導(dǎo)向下的文化數(shù)據(jù)資源建設(shè)
依據(jù)《關(guān)于推進(jìn)實(shí)施國家文化數(shù)字化戰(zhàn)略的意見》《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》,文化數(shù)據(jù)要素化成為文化遺產(chǎn)保護(hù)機(jī)構(gòu)數(shù)字轉(zhuǎn)型的關(guān)鍵方向。在此基礎(chǔ)上,需對接GAI應(yīng)用所需的文化數(shù)據(jù)資源支撐,推進(jìn)人工智能應(yīng)用與數(shù)據(jù)要素化的充分聯(lián)動(dòng),實(shí)現(xiàn)資源的有效聚合利用。
一是強(qiáng)化文化資源的數(shù)據(jù)化工作。一方面,從數(shù)據(jù)化著手,以管理和技術(shù)為兩大抓手,明確文化數(shù)據(jù)的特質(zhì)和要求,以此確定文化資源數(shù)據(jù)化的方法、流程、目標(biāo)及其規(guī)范體系,形成通用的面向文化遺產(chǎn)保護(hù)機(jī)構(gòu)的數(shù)據(jù)化工作框架。在此框架下,將數(shù)據(jù)化納入日常業(yè)務(wù)活動(dòng)中。另一方面,以數(shù)據(jù)要素化為導(dǎo)向,建設(shè)面向具體應(yīng)用場景的數(shù)據(jù)集和語料庫。依據(jù)國家現(xiàn)有部署,文物、古籍、戲曲劇種、非物質(zhì)文化遺產(chǎn)等數(shù)據(jù)資源需在文化創(chuàng)意、旅游、展覽等領(lǐng)域依法開放共享,在政策指引下,貫通各類文化機(jī)構(gòu)數(shù)據(jù)中心,關(guān)聯(lián)形成中華文化數(shù)據(jù)庫,鼓勵(lì)依托市場化機(jī)制開發(fā)文化大模型。文化遺產(chǎn)保護(hù)機(jī)構(gòu)要立足自身館藏特色、發(fā)展目標(biāo)與應(yīng)用場景,構(gòu)建更聚焦的數(shù)據(jù)產(chǎn)品、數(shù)據(jù)服務(wù)等。
二是推進(jìn)文化遺產(chǎn)工作各流程、各環(huán)節(jié)的數(shù)據(jù)化。即文化遺產(chǎn)保護(hù)機(jī)構(gòu)自身的工作流程也要全面實(shí)現(xiàn)數(shù)據(jù)化轉(zhuǎn)型。上述項(xiàng)目強(qiáng)調(diào)用戶數(shù)據(jù)的收集以提升用戶需求分析,但這僅是其中一方面。在文化遺產(chǎn)保護(hù)機(jī)構(gòu)積極建構(gòu)數(shù)字能力的過程中,將自身的工作予以持續(xù)收集、分析和利用,同樣是積極應(yīng)用GAI的重要基礎(chǔ)。這可以更好地將應(yīng)用場景具象化,所累積下的數(shù)據(jù)更為未來全面的智能技術(shù)應(yīng)用奠定強(qiáng)大的數(shù)據(jù)基礎(chǔ)。
(三)文化科技發(fā)展驅(qū)動(dòng)下的技術(shù)開放自主應(yīng)用
文化強(qiáng)國與科技強(qiáng)國戰(zhàn)略背景下,以凸顯技術(shù)創(chuàng)新、融合文化內(nèi)涵、體現(xiàn)場景導(dǎo)向、技術(shù)應(yīng)用從點(diǎn)狀轉(zhuǎn)向矩陣、從“系統(tǒng)內(nèi)循環(huán)”向“社會(huì)大循環(huán)”邁進(jìn)為要義的文化科學(xué)發(fā)展觀成為文化遺產(chǎn)保護(hù)機(jī)構(gòu)數(shù)字轉(zhuǎn)型的重要引領(lǐng)。GAI的開發(fā)應(yīng)用需要在體系框架下以開放自主的方式展開。
一是開放強(qiáng)調(diào)兩個(gè)向度。一方面,積極利用現(xiàn)有的國內(nèi)外前沿技術(shù)成果,開放使用各類創(chuàng)新技術(shù)。對于我國文化遺產(chǎn)保護(hù)機(jī)構(gòu)而言,可以借鑒國內(nèi)外開源技術(shù)的研究應(yīng)用以及國外文化遺產(chǎn)保護(hù)機(jī)構(gòu)的探索成果。同時(shí),需防范“照搬”造成的風(fēng)險(xiǎn),做好技術(shù)使用需求分析,設(shè)計(jì)面向自身的使用方案,明確GAI的具體應(yīng)用點(diǎn)、應(yīng)用策略、風(fēng)險(xiǎn)與局限等。另一方面,應(yīng)合規(guī)共享文化遺產(chǎn)保護(hù)機(jī)構(gòu)自身的技術(shù)應(yīng)用成果。在保障自身權(quán)益的基礎(chǔ)上,共享技術(shù)開發(fā)和應(yīng)用過程中發(fā)現(xiàn)的問題與積累的經(jīng)驗(yàn),在共創(chuàng)的思路中持續(xù)優(yōu)化技術(shù)的開發(fā)應(yīng)用。
二是要強(qiáng)調(diào)一定程度的自主開發(fā)。自主開發(fā)并非要求文化機(jī)構(gòu)以孤立、單一的方式探索GAI的應(yīng)用,而是需明確自身的獨(dú)有需求、優(yōu)勢和成果。例如,立足資源優(yōu)勢,優(yōu)化數(shù)據(jù)標(biāo)注、組織等相關(guān)工作,做好數(shù)據(jù)集、語料庫的構(gòu)建工作。另外,也應(yīng)在國家數(shù)據(jù)和技術(shù)安全的前提下,積極聯(lián)合我國科技企業(yè)和研究機(jī)構(gòu)開展合作,從文化遺產(chǎn)保護(hù)機(jī)構(gòu)的角度為我國GAI的研發(fā)貢獻(xiàn)高質(zhì)量數(shù)據(jù)集、語料庫。
(四)產(chǎn)學(xué)研用聯(lián)動(dòng)框架下的協(xié)作機(jī)制建構(gòu)
對于GAI這類前沿又有強(qiáng)大資源投入需求的技術(shù)而言,普通的合作難以實(shí)現(xiàn)深度可持續(xù)的成果產(chǎn)出,因此,需要在產(chǎn)學(xué)研用的聯(lián)動(dòng)框架下構(gòu)建協(xié)作機(jī)制。
一是文化遺產(chǎn)保護(hù)機(jī)構(gòu)作為主導(dǎo)方要做好合作者的識別與定位。文化遺產(chǎn)保護(hù)機(jī)構(gòu)應(yīng)以產(chǎn)學(xué)研用體系的建設(shè)為目標(biāo),識別可吸納的合作方,并確立協(xié)作策略。協(xié)作方主要包括但不限于以下幾類:科技企業(yè)提供技術(shù)支持,文化公司輔助產(chǎn)品與服務(wù)的開發(fā)與市場化,研究機(jī)構(gòu)從技術(shù)和文化遺產(chǎn)開發(fā)利用兩方面提供智力支持,公眾作為用戶以及文化遺產(chǎn)創(chuàng)新探索的貢獻(xiàn)者等。此外,不僅要識別出各類的合作者,更要倡導(dǎo)建立國內(nèi)外協(xié)作共同體,充分發(fā)揮共建共享共創(chuàng)的優(yōu)勢力量。
二是設(shè)計(jì)“市場化”相關(guān)策略,吸納不同的合作方充分參與。GAI的應(yīng)用需要極高的資源投入,除了依靠國家資金與社會(huì)公益支持外,適當(dāng)?shù)氖袌龌呗砸彩菍?shí)現(xiàn)真正的產(chǎn)學(xué)研用協(xié)作的重要途徑。一方面,立足文化數(shù)據(jù)要素市場培育,優(yōu)化文化遺產(chǎn)機(jī)構(gòu)自身職能與業(yè)務(wù),將數(shù)據(jù)產(chǎn)品與服務(wù)的“生產(chǎn)”與“流通交易”納入工作內(nèi)容,并相應(yīng)擴(kuò)展組織架構(gòu)與業(yè)務(wù)流程。另一方面,尋求有效協(xié)作點(diǎn),建立可持續(xù)收益的合作框架和策略。例如,面向技術(shù)公司,可以加強(qiáng)高價(jià)值數(shù)據(jù)集、語料庫的合作開發(fā);面向文化公司,考慮如何形成可行的市場方案等。
本文基于“邁向國家寶藏·虛擬利物浦雙年展”項(xiàng)目,梳理了GAI應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu)的實(shí)踐圖景,從典型場景識別、全面數(shù)據(jù)化、技術(shù)開放式利用和跨領(lǐng)域多元主體協(xié)作等方面解析了可參考的行動(dòng)要點(diǎn),并結(jié)合我國國情探討了文化遺產(chǎn)保護(hù)機(jī)構(gòu)的GAI應(yīng)用展望。同時(shí),關(guān)于GAI如何應(yīng)用于文化遺產(chǎn)保護(hù)機(jī)構(gòu),尚有豐富的探索空間,涉及技術(shù)開發(fā)、資源建設(shè)與開發(fā)利用、風(fēng)險(xiǎn)防范等多個(gè)方面,有待進(jìn)一步深入和細(xì)化的研究。
注釋及參考文獻(xiàn):
[1]中國社會(huì)科學(xué)網(wǎng).人工智能介入非遺保護(hù)的路徑與問題[EB/OL]. (2020- 12- 04) [2023- 04- 16]. https://feiyi.gmw.cn/2020- 12/04/content_34429452. htm.
[2]中國文化報(bào).數(shù)字技術(shù)賦能文化遺產(chǎn)保護(hù)利用[EB/OL]. (2022-12-09)[2023-04-16]. https://www. chycci.gov.cn/news.aspx?id=70648.
[3]OpenAI.IntroducingChatGPT[EB/OL].(2022-11-30)[2023-04-13].https://openai.com/blog/chatg? pt.
[4]陳濤,劉煒,孫遜,等.IIIF與AI作用下的文化遺產(chǎn)應(yīng)用研究新模態(tài)[J].中國圖書館學(xué)報(bào),2021(2):67-78.
[5]呂慶華.地方高校圖書館對非物質(zhì)文化遺產(chǎn)的采集與管理[J].圖書館建設(shè),2007(6):60-63.
[6]劉向紅.基于用戶協(xié)作的非物質(zhì)文化遺產(chǎn)數(shù)字資源分類模式研究[J].現(xiàn)代情報(bào),2017(3):21-25;31.
[7]翟姍姍,張純,許鑫.文化遺產(chǎn)數(shù)字化長期保存策略研究:以“威尼斯時(shí)光機(jī)”項(xiàng)目為例[J].圖書情報(bào)工作,2019(11):140-148.
[8]牛金梁.非物質(zhì)文化遺產(chǎn)智能化傳播的數(shù)字技術(shù)賦權(quán)邏輯[J].湖南師范大學(xué)社會(huì)科學(xué)學(xué)報(bào),2020(5):150-156.
[9]張洋洋.人工智能時(shí)代建筑文化遺產(chǎn)的數(shù)字化保護(hù)[J].建筑科學(xué),2024,40 (1):186.
[10]孫雯,葛慧茹.數(shù)字化時(shí)代非物質(zhì)文化遺產(chǎn)知識產(chǎn)權(quán)保護(hù)的再思考[J].藝術(shù)百家,2020(5):194-199;204.
[11]邵燕.非物質(zhì)文化遺產(chǎn)數(shù)字化中的版權(quán)法律問題研究[J].廣西民族研究,2014(5):163-168.
[12]賈菁.人工智能背景下非物質(zhì)文化遺產(chǎn)數(shù)字化傳播的進(jìn)階路向[J].當(dāng)代傳播,2020(1):98-101.
[13]王曉光,梁夢麗,侯西龍,等.文化遺產(chǎn)智能計(jì)算的肇始與趨勢:歐洲時(shí)光機(jī)案例分析[J].中國圖書館學(xué)報(bào),2022(1):62-76.
[14]UKRI’s Arts and Humanities Research Coun? cil. Visitor Interaction and Machine Curation in the Virtual Liverpool Biennial: A Towards a National Col? lection COVID- 19 Project Final Report[EB/OL].(2021-12-09)[2024-02-24]. https://zenodo.org/re? cords/5770448.
[15]澎湃新聞.單霽翔:互聯(lián)網(wǎng)信息技術(shù)讓文化遺產(chǎn)活起來[EB/OL]. (2023-04-04)[2024-01-31]. https://www.thepaper.cn/newsDetail_forward_22570160.
[16]澎湃新聞.敦煌研究院院長:悉數(shù)“敦煌+科技”的N種打開方式[EB/OL]. (2020-06-23)[2024-02- 26]. https://cloud.tencent.com/developer/article/ 1650164.
[17]中國新聞網(wǎng).故宮出版社將推出首套元宇宙場景交互式電子出版物《我在故宮修文物》[EB/OL].(2023- 02- 14) [2024- 03- 08]. https://culture.ycwb. com/2023-02/25/content_51779445.htm.
[18]孫宗鶴.數(shù)字技術(shù)為文化遺產(chǎn)帶來了什么[EB/OL]. (2022-06-08)[2024-02-26]. https://news. gmw.cn/2022-06/08/content_35794714.htm.
[19]荔枝網(wǎng).與“荀子”對話?南京農(nóng)業(yè)大學(xué)發(fā)布全國首個(gè)古籍大語言模型[EB/OL]. (2023- 12- 11)[2024-03-07]. https : // news. jstv. com/a/20231211/ b0bdce470bab4fb0b64b951b06343e6d.shtml.
[20]上觀新聞. AIGC繪中國|跟著全國人大代表探索遠(yuǎn)古生命密碼[EB/OL]. (2024-03-03)[2024-03- 07]. https://www.jfdaily.com/staticsg/res/html/ web/newsDetail.html?id=722171sid=200.
作者單位:中國人民大學(xué)信息資源管理學(xué)院