摘 要 論文解析了數(shù)字人文視域下地理圖像檔案遺產(chǎn)開(kāi)發(fā)的實(shí)踐,旨在明確地理圖像檔案遺產(chǎn)開(kāi)發(fā)的總體思路和基本框架。采用案例研究的方法,梳理法國(guó)ALEGORIA項(xiàng)目在建設(shè)背景、服務(wù)內(nèi)容、項(xiàng)目成果等方面的內(nèi)容和經(jīng)驗(yàn),從機(jī)構(gòu)合作、數(shù)據(jù)加工、資源建設(shè)、內(nèi)容服務(wù)四個(gè)方面探討該項(xiàng)目參與地理圖像檔案遺產(chǎn)開(kāi)發(fā)的實(shí)踐特征。由此,立足我國(guó)地理圖像檔案遺產(chǎn)開(kāi)發(fā)的基本情況,可從資源整合的主體協(xié)同機(jī)制、統(tǒng)一標(biāo)準(zhǔn)化的數(shù)據(jù)處理、技術(shù)驅(qū)動(dòng)資源建設(shè)、研用并舉的內(nèi)容服務(wù)四個(gè)方面提出我國(guó)數(shù)字人文視域下地理圖像檔案遺產(chǎn)開(kāi)發(fā)的實(shí)踐策略。
關(guān)鍵詞 地理圖像檔案遺產(chǎn);數(shù)字人文;資源開(kāi)發(fā)
分類(lèi)號(hào) G250
DOI 10.16810/j.cnki.1672-514X.2025.04.011
Abstract This paper analyzes the practice of developing geographic image archive heritage in the perspective of digital humanities, aiming to clarify the overall thinking and basic framework of geographic image archive heritage development. Using a case study method, it examines the content and experience of the French ALEGORIA project in terms of construction background, service content, project results, etc., and explores the practice characteristics of the project’s participation in the development of geographic image archive heritage from four aspects: institutional cooperation, data processing, resource construction, and content services. Based on this, focusing on the basic situation of geographic image archive heritage development in China, this paper proposes practical strategies for the development of geographic image archive heritage in the perspective of digital humanities in China from four aspects: the collaborative mechanism of resource integration, standardized data processing, technology-driven resource construction, and the combination of research and application in content services.
Keywords Geographic image archive heritage. Digital humanities. Resource development.
0 引言
地理圖像檔案遺產(chǎn)是以圖像的形式記錄和傳承特定地理范圍各類(lèi)信息的一種檔案遺產(chǎn),在反映城市變遷、記錄國(guó)家領(lǐng)土變化、了解海陸變遷方面具有獨(dú)特價(jià)值。隨著數(shù)字傳媒技術(shù)的發(fā)展和普及,讀圖時(shí)代的來(lái)臨及圖像轉(zhuǎn)向的出現(xiàn)[1]使得海量的圖像檔案資源為人文社科領(lǐng)域研究提供豐富的研究資源?!皵?shù)字人文”(Digital Humanities)作為一門(mén)新興的、交叉性的學(xué)科,是在計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)等新興技術(shù)支撐下開(kāi)展人文研究而形成的新型跨學(xué)科研究領(lǐng)域。數(shù)字人文的興起為解決地理圖像檔案遺產(chǎn)資源分散、格式復(fù)雜、開(kāi)發(fā)有限等難題提供創(chuàng)新思路,地理圖像檔案遺產(chǎn)蘊(yùn)含的海量信息通過(guò)數(shù)字技術(shù)的創(chuàng)新組配為城市發(fā)展和記憶構(gòu)建提供新動(dòng)能。
經(jīng)過(guò)十余年發(fā)展,通過(guò)數(shù)字人文對(duì)圖像檔案開(kāi)展研究已受到業(yè)內(nèi)關(guān)注,在理論研究和實(shí)踐應(yīng)用方面均取得一定成果。敦煌研究院于2007年研發(fā)了“敦煌藝術(shù)圖像數(shù)據(jù)庫(kù)”[2]利用傳統(tǒng)膠片拍攝并數(shù)字化掃描,累計(jì)形成9個(gè)專題共1309幅圖像。天津美院圖書(shū)館自建的“四萬(wàn)張精品素材庫(kù)”[3]對(duì)四萬(wàn)張圖片資料進(jìn)行了整理、組織與分類(lèi),為藝術(shù)家和廣大藝術(shù)愛(ài)好者進(jìn)行觀賞、教學(xué)和創(chuàng)作研究提供的參考資料。但目前國(guó)內(nèi)較少有學(xué)者從數(shù)字人文的視角對(duì)地理圖像檔案遺產(chǎn)開(kāi)展研究,地理圖像檔案遺產(chǎn)的科研價(jià)值、藝術(shù)價(jià)值、教育價(jià)值乃至社會(huì)價(jià)值尚未得到廣泛關(guān)注。
ALEGORIA項(xiàng)目[4](全稱:Advanced Linking
and Exploitation of Digitized Geographic Iconographic
Heritage,即數(shù)字化地理圖像遺產(chǎn)的高級(jí)鏈接和利用,以下簡(jiǎn)稱:ALEGORIA)是由法國(guó)國(guó)家研究機(jī)構(gòu)(ANR)于2018年啟動(dòng)2021年正式建成的大型數(shù)字人文地理圖像檔案遺產(chǎn)應(yīng)用項(xiàng)目。該項(xiàng)目針對(duì)來(lái)源分散、格式不統(tǒng)一的地理圖像檔案遺產(chǎn)進(jìn)行處理,通過(guò)專題數(shù)據(jù)集構(gòu)建和創(chuàng)新性在線程序應(yīng)用為數(shù)字人文學(xué)者和普通用戶提供了了解和研究渠道,為地理圖像檔案遺產(chǎn)開(kāi)發(fā)提供實(shí)踐范式。本研究以法國(guó)的ALEGORIA項(xiàng)目為典型案例,明確其基于數(shù)字人文開(kāi)發(fā)地理圖像檔案遺產(chǎn)的實(shí)踐內(nèi)容與主要特征,并基于其創(chuàng)新舉措對(duì)我國(guó)地理圖像檔案遺產(chǎn)開(kāi)發(fā)提出啟示性策略。
1 ALEGORIA項(xiàng)目概覽
法國(guó)保存了大量從兩次世界大戰(zhàn)至今數(shù)十萬(wàn)個(gè)地理圖像檔案遺產(chǎn),這些地理圖像檔案遺產(chǎn)反映了法國(guó)從兩次世界大戰(zhàn)至今各個(gè)時(shí)期的領(lǐng)土變化,以獨(dú)特的視角描述法國(guó)文化和自然景觀、地標(biāo)及其演變,對(duì)于構(gòu)建法國(guó)的國(guó)家記憶具有重要價(jià)值。為了整合離散的地理圖像檔案遺產(chǎn),促進(jìn)地理圖像檔案遺產(chǎn)的社會(huì)利用。法國(guó)國(guó)家研究機(jī)構(gòu)(ANR)于2018年正式啟動(dòng)ALEGORIA項(xiàng)目。項(xiàng)目團(tuán)隊(duì)通過(guò)對(duì)地理圖像檔案遺產(chǎn)開(kāi)展數(shù)字化建設(shè)、開(kāi)發(fā)訪問(wèn)及利用工具并創(chuàng)建圖像數(shù)據(jù)集,試圖提出一種新穎的基于深度學(xué)習(xí)的方法來(lái)識(shí)別和標(biāo)引地理圖像檔案遺產(chǎn)的時(shí)空關(guān)系,便于用戶更直觀地了解法國(guó)領(lǐng)土資源變化。ALEGORIA項(xiàng)目已完成數(shù)萬(wàn)張法國(guó)地理圖像檔案遺產(chǎn)資源的整合處理,覆蓋法國(guó)19個(gè)大區(qū)、72個(gè)省,累計(jì)近12萬(wàn)人訪問(wèn)項(xiàng)目主頁(yè)。此外,ALEGORIA項(xiàng)目與“歐洲時(shí)光機(jī)”項(xiàng)目開(kāi)展項(xiàng)目協(xié)作,共同探討數(shù)字人文視角下歐洲記憶構(gòu)建的系列問(wèn)題。
ALEGORIA項(xiàng)目被定位為一個(gè)面向數(shù)字人文學(xué)者研究需求的應(yīng)用項(xiàng)目,并為提升用戶對(duì)地理圖像檔案遺產(chǎn)的認(rèn)知和使用提供輔助工具。為了滿足用戶訪問(wèn)和數(shù)字人文研究需要,ALEGORIA項(xiàng)目主要開(kāi)展了以下三個(gè)方面的服務(wù)內(nèi)容。
1.1 提供支撐研究需求的數(shù)據(jù)集
由于不同單位對(duì)地理圖像檔案遺產(chǎn)的整理標(biāo)準(zhǔn)不統(tǒng)一,地理圖像本身格式也存在差異。為了滿足數(shù)字人文學(xué)者的多樣化研究需求,ALEGORIA項(xiàng)目出于研究目的,根據(jù)地理圖像的時(shí)空特征,構(gòu)建了4個(gè)數(shù)據(jù)集向用戶提供專業(yè)性研究數(shù)據(jù),并提供地理圖像元數(shù)據(jù)的開(kāi)放獲取途徑。這4個(gè)數(shù)據(jù)集分別是:
(1)ALEGORIA元數(shù)據(jù):ALEGORIA項(xiàng)目處理的圖像元數(shù)據(jù)以鏈接公開(kāi)數(shù)據(jù)的形式發(fā)布。這些元數(shù)據(jù)描述了來(lái)源、生產(chǎn)者、創(chuàng)作日期、被拍攝的地點(diǎn)等圖像特征。同時(shí)在數(shù)據(jù)集中還對(duì)給定照片的每個(gè)可用實(shí)例化的特征進(jìn)行標(biāo)注,包括照片支持的類(lèi)型、格式、所使用的攝影技術(shù)、存儲(chǔ)這個(gè)實(shí)例化的機(jī)構(gòu)等等。這些元數(shù)據(jù)都是公共數(shù)據(jù),用戶可以任意訪問(wèn)。
(2)ALEGORIA-DB圖像基準(zhǔn)測(cè)試:ALEGORIA 基準(zhǔn)是一個(gè)圖像數(shù)據(jù)集,涉及城市和自然場(chǎng)景中各種感興趣對(duì)象的異構(gòu)文化、歷史和地理圖像,時(shí)間范圍從 1920 年代到現(xiàn)在。內(nèi)容具有多日期、多來(lái)源、多視角圖像的特點(diǎn)。該數(shù)據(jù)集共由 13 175 張高分辨率圖像組成,每個(gè)查詢圖像都使用與圖像變化相關(guān)的多個(gè)量化屬性進(jìn)行手動(dòng)注釋,可用于跨視角圖像匹配、少樣本地標(biāo)識(shí)別、多時(shí)相圖像匹配等。
(3)GENR:具有鄰里關(guān)系的地理實(shí)體:該數(shù)據(jù)集來(lái)自法國(guó)測(cè)繪局 (IGN)制作的參考矢量數(shù)據(jù)庫(kù)(BDTOPO)以及相關(guān)航空?qǐng)D像(BDORTHO)的部分摘錄。數(shù)據(jù)集中包含從法國(guó)三個(gè)地區(qū)(摩澤爾、下萊茵和默爾特-摩澤爾)在四個(gè)不同年份拍攝的垂直航拍圖像的語(yǔ)義注釋得出的圖表,每個(gè)圖像表示以特定區(qū)域?yàn)橹行牡?00m*200m區(qū)域中存在的地理實(shí)體及其鄰里關(guān)系,對(duì)其中不同的組成要素進(jìn)行顏色標(biāo)注。
(4)SF300大規(guī)模影像數(shù)據(jù)集:SF300數(shù)據(jù)集是一個(gè)大規(guī)模數(shù)據(jù)集。該數(shù)據(jù)集是使用從飛機(jī)上拍攝的圖像制作的,可用于遙感任務(wù)深度描述符的訓(xùn)練。同時(shí),該數(shù)據(jù)集即可憑借方向變化和基于地理位置進(jìn)行圖像注釋的類(lèi)定義。
1.2 構(gòu)建符合圖像特征的多模態(tài)搜索引擎
ALEGORIA項(xiàng)目目前保存了近了9萬(wàn)多幅地理圖像,共建立了54 000個(gè)視圖的子集。為了實(shí)現(xiàn)地理圖像檔案遺產(chǎn)的數(shù)據(jù)關(guān)聯(lián)且更便利地進(jìn)行訪問(wèn),ALEGORIA項(xiàng)目根據(jù)圖像特征開(kāi)發(fā)了一個(gè)基于Web的多模式搜索引擎,在使用時(shí)可對(duì)圖像的內(nèi)容和關(guān)聯(lián)的元數(shù)據(jù)進(jìn)行索引,以實(shí)現(xiàn)用戶在域內(nèi)集合和跨域集合中耦合內(nèi)容和元數(shù)據(jù)搜索。由于這些元數(shù)據(jù)來(lái)自不同的提供單位,在處理的過(guò)程中針對(duì)低數(shù)據(jù)、異構(gòu)圖像檢索問(wèn)題,ALEGORIA研究出通過(guò)組合元數(shù)據(jù)和圖像內(nèi)容搜索(通過(guò)示例范例和各種圖像描述符的查詢)一起查詢一個(gè)或多個(gè)集合的方式予以解決。
ALEGORIA項(xiàng)目的多模態(tài)搜索引擎采用基于視覺(jué)內(nèi)容和基于圖像元數(shù)據(jù)的搜索模式?;谝曈X(jué)內(nèi)容的搜索模式是通過(guò)自動(dòng)分析圖像像素以提取與給定圖像相關(guān)的視覺(jué)特征如顏色、紋理、形狀、細(xì)節(jié)等,這些特征被收集成圖像索引中的視覺(jué)描述符。檢索時(shí)將圖像作為查詢給出,就可以比較兩個(gè)圖像的視覺(jué)描述符,從而根據(jù)其視覺(jué)外觀找到相似的圖像。這種方式能夠進(jìn)行擴(kuò)展,無(wú)論所查詢的圖像庫(kù)的大小如何,都能實(shí)現(xiàn)對(duì)圖像內(nèi)容的快速搜索。
而基于圖像元數(shù)據(jù)的多模式搜索模式則是將元數(shù)據(jù)作為篩選條件進(jìn)行搜索。用戶可以按原始背景、日期、標(biāo)題、關(guān)鍵字、支持類(lèi)型、格式,甚至按拍攝地點(diǎn)篩選圖像。這些篩選條件可以單獨(dú)應(yīng)用,也可以組合應(yīng)用,具體取決于用戶所需?;谝曈X(jué)內(nèi)容和基于圖像元數(shù)據(jù)的多模態(tài)搜索引擎能夠?qū)λ占牡乩韴D像檔案遺產(chǎn)進(jìn)行元數(shù)據(jù)描述的重建,使得不同單位之間進(jìn)行資源的識(shí)別和共享,更加精確圖像的拍攝日期,從而更有效地了解國(guó)家或地區(qū)領(lǐng)土的變化。
1.3 打造實(shí)現(xiàn)時(shí)空交互的沉浸式3D導(dǎo)航平臺(tái)
ALEGORIA項(xiàng)目的目標(biāo)之一是向用戶展示其空間環(huán)境中的視覺(jué)內(nèi)容,打造一個(gè)開(kāi)源的沉浸式3D導(dǎo)航網(wǎng)絡(luò)平臺(tái),優(yōu)化數(shù)字人文學(xué)者和普通用戶的訪問(wèn)和體驗(yàn)。
沉浸式3D導(dǎo)航網(wǎng)絡(luò)平臺(tái)是基于Web的iTowns庫(kù)在空間環(huán)境中進(jìn)行地理可視化。技術(shù)基礎(chǔ)方面,該平臺(tái)利用WebGL和OGC標(biāo)準(zhǔn)來(lái)訪問(wèn)和可視化3D地理空間數(shù)據(jù)集。通過(guò)訪問(wèn)地理Web服務(wù),可以在任何有數(shù)據(jù)的地方以高精度、大規(guī)模地將具有多模式地理空間數(shù)據(jù)的地球渲染成一個(gè)通用的3D參考模型。服務(wù)功能方面,ALEGORIA項(xiàng)目基于該平臺(tái)開(kāi)發(fā)了諸如時(shí)間導(dǎo)航、自由視點(diǎn)導(dǎo)航、海量數(shù)據(jù)管理等新功能。此外,ALEGORIA項(xiàng)目通過(guò)該平臺(tái)還涉及了諸如通過(guò)內(nèi)容鏈接共享多源圖像信息、幫助構(gòu)建收藏資源、鏈接同一地點(diǎn)的相似圖像、導(dǎo)航到空間環(huán)境中等服務(wù)場(chǎng)景。沉浸體驗(yàn)方面,該平臺(tái)可與大規(guī)模搜索引擎共同使用,當(dāng)用戶在搜索引擎中查找圖像時(shí),可以在iTowns中利用查詢的地理位置,檢索得到其他類(lèi)似圖像相關(guān)聯(lián)的地理位置。根據(jù)地理位置類(lèi)型,iTowns可以在3D場(chǎng)景中實(shí)現(xiàn)一定程度的精確呈現(xiàn),然后提供半自動(dòng)改進(jìn)地理位置的可能性。
2 ALEGORIA項(xiàng)目地理圖像檔案遺產(chǎn)的開(kāi)發(fā)策略解析
通過(guò)分析ALEGORIA項(xiàng)目開(kāi)展地理圖像檔案遺產(chǎn)開(kāi)發(fā)的具體實(shí)踐,本研究發(fā)現(xiàn)數(shù)字人文方法的運(yùn)用對(duì)地理圖像檔案遺產(chǎn)的開(kāi)發(fā)與共享起到了積極作用,經(jīng)過(guò)梳理和分析,將ALEGORIA項(xiàng)目的實(shí)踐特征總結(jié)為以下四個(gè)方面。
2.1 基于機(jī)構(gòu)協(xié)同的資源集成
地理圖像的拍攝大多是滿足所屬機(jī)構(gòu)自身職能需求,圖像資源較為分散、關(guān)聯(lián)度不高,一個(gè)完整地理空間歷史變遷的樣貌往往需要多個(gè)機(jī)構(gòu)相關(guān)圖像的組配才能完整呈現(xiàn)。同時(shí),受機(jī)構(gòu)自身?xiàng)l件限制,地理圖像檔案遺產(chǎn)的大小不一,且拍攝的專業(yè)水準(zhǔn)也參差不齊。為了對(duì)大量地理圖像檔案遺產(chǎn)進(jìn)行有效開(kāi)發(fā),ALEGORIA項(xiàng)目通過(guò)開(kāi)展多部門(mén)、多機(jī)構(gòu)、多領(lǐng)域的協(xié)作,匯集各類(lèi)地理圖像檔案遺產(chǎn)。
ALEGORIA項(xiàng)目聚集了具有不同領(lǐng)域和跨學(xué)科背景的合作伙伴,大致可分為三類(lèi):第一類(lèi)是ICT 領(lǐng)域?qū)嶒?yàn)室的合作,主要為ALEGORIA項(xiàng)目提供技術(shù)支撐。法國(guó)測(cè)繪局的LaSTIG[5]和里昂中央理工大學(xué)的LIRIS[6]兩個(gè)ICT 領(lǐng)域的研究實(shí)驗(yàn)室聯(lián)合開(kāi)展合作,主要是負(fù)責(zé)提供通過(guò)視覺(jué)內(nèi)容和館藏元數(shù)據(jù)進(jìn)行索引和地理定位的分析方法,以及負(fù)責(zé)沉浸式和迭代式3D導(dǎo)航方法。第二類(lèi)是檔案館與其他社會(huì)組織合作,包括圖書(shū)館、博物館、檔案館等,為ALEGORIA項(xiàng)目提供地理圖像檔案遺產(chǎn)供給。ALEGORIA項(xiàng)目的資源主要來(lái)自法國(guó)國(guó)家檔案館、尼塞福爾·尼埃普斯博物館以及IGN照片庫(kù)。它們提供了描述法國(guó)領(lǐng)土幾個(gè)共同地理區(qū)域、時(shí)間變化的地理圖像,同時(shí)還負(fù)責(zé)對(duì)該項(xiàng)目為促進(jìn)資源訪問(wèn)及利用開(kāi)發(fā)的工具進(jìn)行評(píng)估。第三類(lèi)是兩個(gè)社會(huì)科學(xué)和人文學(xué)科研究實(shí)驗(yàn)室,負(fù)責(zé)ALEGORIA項(xiàng)目服務(wù)場(chǎng)景開(kāi)發(fā)。這兩個(gè)實(shí)驗(yàn)室分別是巴黎西南泰爾大學(xué)的LAVUE以及Cnam的LIRSA[7],這兩個(gè)實(shí)驗(yàn)室主要從城市視覺(jué)學(xué)、社會(huì)學(xué)、旅游學(xué)等人文社科視角利用ALEGORIA項(xiàng)目的成果開(kāi)展相關(guān)研究。通過(guò)開(kāi)展不同類(lèi)型的機(jī)構(gòu)合作,ALEGORIA項(xiàng)目處理了大約80 000張航空?qǐng)D片,包括低空的傾斜鳥(niǎo)瞰圖、正交照片、航拍圖片以及各類(lèi)用于軍事、旅游、教育或制圖的航空照片。這些資源主要來(lái)自法國(guó)國(guó)家檔案館、尼塞福爾·尼埃普斯博物館以及IGN照片庫(kù),其他文化機(jī)構(gòu)、科研院所、私人收藏家等也為ALEGORIA項(xiàng)目提供了支持,最大限度實(shí)現(xiàn)對(duì)法國(guó)地理圖像遺產(chǎn)的資源集成。
2.2 開(kāi)展格式統(tǒng)一的數(shù)據(jù)加工
ALEGORIA項(xiàng)目的地理圖像檔案遺產(chǎn)來(lái)自不同機(jī)構(gòu),由于各個(gè)機(jī)構(gòu)的整理標(biāo)準(zhǔn)不一,很難對(duì)資源開(kāi)展統(tǒng)一開(kāi)發(fā)和利用,因此ALEGORIA項(xiàng)目從資源的數(shù)字化及元數(shù)據(jù)的統(tǒng)一兩個(gè)方面進(jìn)行處理與加工,形成格式統(tǒng)一的地理圖像檔案遺產(chǎn)數(shù)字資源。在資源數(shù)字化方面,ALEGORIA 處理了來(lái)自法國(guó)國(guó)家檔案館、IGN 照片庫(kù)以及尼塞福爾-尼埃普斯博物館的大約80 000張傾斜或垂直地面拍攝的航空照片,由于三個(gè)機(jī)構(gòu)所收集的地理圖像在拍攝視角、圖像底色、圖像信息記錄等方面各有不同。ALEGORIA項(xiàng)目統(tǒng)一對(duì)所收集的地理圖像進(jìn)行數(shù)字化處理,滿足對(duì)地理圖像分析時(shí)圖像顏色保護(hù)、陸地地理信息參考、圖像信息記錄等研究需求。在資源元數(shù)據(jù)統(tǒng)一方面,項(xiàng)目依據(jù)法國(guó)文化傳播部于2014年發(fā)布的《戰(zhàn)略路線圖——文化元數(shù)據(jù)和 Web 3.0 轉(zhuǎn)型》,采用基于圖像數(shù)據(jù)模型和相關(guān)本體數(shù)據(jù)庫(kù)對(duì)圖像進(jìn)行描述,促進(jìn)不同背景元數(shù)據(jù)的交叉。同時(shí),在缺乏專門(mén)描述航空照片本體的情況下,由于所收集的圖像和圖像文檔屬于檔案的一部分,ALEGORIA項(xiàng)目根據(jù)國(guó)際檔案理事會(huì)開(kāi)發(fā)的RiC-O對(duì)資源本體進(jìn)行描述,實(shí)現(xiàn)對(duì)資源中拍攝內(nèi)容、拍攝地點(diǎn)、拍攝日期、拍攝人(攝影師、官方機(jī)構(gòu)或企業(yè))、技術(shù)特征等的統(tǒng)一處理,這種處理也可以輕松擴(kuò)展至特定文件類(lèi)別特征的描述。
2.3 聚焦地理時(shí)空的數(shù)據(jù)集建設(shè)
作為時(shí)空捕獲的二維表示,每個(gè)地理圖像的采集條件、來(lái)源的異質(zhì)性、時(shí)空變化性存在差異,地理圖像的跨時(shí)間航空?qǐng)D像匹配問(wèn)題在較長(zhǎng)時(shí)間未得到解決。ALEGORIA項(xiàng)目從地理圖像的時(shí)空維度出發(fā),依托現(xiàn)有的地形數(shù)據(jù)庫(kù),創(chuàng)新性提出了一種采用手工設(shè)計(jì)跨時(shí)間數(shù)據(jù)集的方式用于地理區(qū)域匹配,展示了如何利用場(chǎng)景地標(biāo)的幾何屬性檢索相同的地理區(qū)域。同時(shí),他們提出了一個(gè)類(lèi)似暹羅的GCN模型來(lái)學(xué)習(xí)兩個(gè)跨時(shí)間檢索場(chǎng)景的圖像嵌入,形成對(duì)應(yīng)的數(shù)據(jù)集。
目前,ALEGORIA項(xiàng)目利用場(chǎng)景的結(jié)構(gòu)和空間信息形成了4個(gè)數(shù)據(jù)集,以用于描述項(xiàng)目圖像集的標(biāo)準(zhǔn)化元數(shù)據(jù)并作為鏈接的開(kāi)放數(shù)據(jù)發(fā)布、為研究人員訓(xùn)練圖像描述符的大規(guī)模帶注釋圖像以及描述具有鄰里關(guān)系的地理實(shí)體的多日期和多模態(tài)數(shù)據(jù)。以“GENR:具有鄰里關(guān)系的地理實(shí)體”數(shù)據(jù)集[8]為例,該數(shù)據(jù)集包含了從法國(guó)三個(gè)地區(qū)在四個(gè)不同年份拍攝的垂直航拍圖像的語(yǔ)義注釋得出的圖表,每個(gè)圖像表示以特定區(qū)域?yàn)橹行牡?00m*200m區(qū)域中存在的地理實(shí)體及其鄰里關(guān)系,對(duì)其中不同的組成要素進(jìn)行顏色標(biāo)注。同時(shí),ALEGORIA項(xiàng)目為數(shù)據(jù)集選擇了地理區(qū)域,以便每個(gè)圖表至少包含一個(gè)所謂的興趣點(diǎn),通過(guò)對(duì)所選圖像進(jìn)行人工標(biāo)記,選擇興趣點(diǎn)和周邊區(qū)域進(jìn)行跨時(shí)間數(shù)據(jù)標(biāo)識(shí),將這些地理實(shí)體表示為連通圖。在地理數(shù)據(jù)集中,每個(gè)中心興趣點(diǎn)上都有一個(gè)地理空間的表述來(lái)表示圖形中的每個(gè)節(jié)點(diǎn)所代表的地理實(shí)體。最終,通過(guò)創(chuàng)建一個(gè)原始數(shù)據(jù)集,與一種基于深度學(xué)習(xí)的地理數(shù)據(jù)模型相關(guān)聯(lián)來(lái)學(xué)習(xí)跨時(shí)間的地理圖像表示,實(shí)現(xiàn)對(duì)給定地理圖像區(qū)域的關(guān)聯(lián)性和檢索,解決了圖像檢索和模糊性表述匹配的問(wèn)題。
2.4 提供聯(lián)合索引的內(nèi)容服務(wù)
地理圖像檔案遺產(chǎn)蘊(yùn)含著豐富的遺產(chǎn)資源,但較少被社會(huì)所認(rèn)知。ALEGORIA項(xiàng)目通過(guò)開(kāi)發(fā)面向用戶利用的應(yīng)用程序,為用戶提供了用于索引、檢索和互聯(lián)的多式聯(lián)運(yùn)搜索引擎,以及允許用戶在富含地理圖像檔案遺產(chǎn)的3D環(huán)境中進(jìn)行時(shí)空導(dǎo)航和交互的網(wǎng)絡(luò)平臺(tái)[9]。
為了構(gòu)建集合,使用戶更容易地訪問(wèn)資源,ALEGORIA項(xiàng)目開(kāi)發(fā)了一個(gè)基于Web的多模式搜索引擎,以支撐用戶使用時(shí)對(duì)地理圖像內(nèi)容和關(guān)聯(lián)的元數(shù)據(jù)進(jìn)行索引。該搜索引擎具有分布式的服務(wù)器架構(gòu),根據(jù)RiC-O本體對(duì)來(lái)自不同提供單位的地理圖像元數(shù)據(jù)進(jìn)行協(xié)調(diào),使其在數(shù)據(jù)集大小和描述符復(fù)雜性方面具有可擴(kuò)展性。此外,ALEGORIA項(xiàng)目為向用戶展示地理圖像檔案遺產(chǎn)的視覺(jué)內(nèi)容,基于Web的iTowns庫(kù)構(gòu)建了一個(gè)可視化的沉浸式交互式3D導(dǎo)航網(wǎng)絡(luò)平臺(tái)。該平臺(tái)可以作為一個(gè)通用模型滿足用戶訪問(wèn),例如通過(guò)時(shí)間導(dǎo)航,用戶所體驗(yàn)的圖像內(nèi)容與任意地理位置形成時(shí)空關(guān)聯(lián),這種關(guān)聯(lián)可以在三維場(chǎng)景中進(jìn)行顯示。同時(shí),ALEGORIA項(xiàng)目使用了IGN照片庫(kù)在整個(gè)法國(guó)領(lǐng)土上提供的地理建筑模型,可以實(shí)現(xiàn)與其他模型的對(duì)接,滿足用戶在任何網(wǎng)絡(luò)環(huán)境下對(duì)地理圖像檔案遺產(chǎn)的交互式訪問(wèn)和利用。
3 我國(guó)地理圖像檔案遺產(chǎn)開(kāi)發(fā)的實(shí)踐啟示
隨著數(shù)字人文項(xiàng)目的全球開(kāi)展,地理圖像檔案遺產(chǎn)經(jīng)由數(shù)字人文領(lǐng)域開(kāi)發(fā),在學(xué)術(shù)研究、文化傳承、教育普及、社會(huì)發(fā)展等方面的價(jià)值日益凸顯。與國(guó)外發(fā)展相同,我國(guó)也已針對(duì)如何開(kāi)發(fā)不同類(lèi)型的地理圖像檔案遺產(chǎn)開(kāi)展數(shù)字人文研究,如對(duì)版本圖像的知識(shí)圖譜構(gòu)建[10]、文化遺產(chǎn)遠(yuǎn)讀可視化、圖像知識(shí)組織模式[11]等。但目前國(guó)內(nèi)實(shí)踐中多數(shù)針對(duì)地理圖像檔案遺產(chǎn)的檢索功能較為簡(jiǎn)單,檢索詞聯(lián)想功能不足,多選擇基于文本的圖像檢索進(jìn)行數(shù)據(jù)集構(gòu)建,各數(shù)據(jù)庫(kù)之間缺乏聯(lián)動(dòng)。ALEGORIA項(xiàng)目對(duì)此提供了有效參照,可結(jié)合我國(guó)地理圖像檔案遺產(chǎn)開(kāi)發(fā)基礎(chǔ)提供未來(lái)建設(shè)思路。
3.1 建立主體多元的合作模式
ALEGORIA項(xiàng)目聚集來(lái)自檔案學(xué)、歷史學(xué)、城市視覺(jué)學(xué)、規(guī)劃學(xué)、計(jì)算機(jī)學(xué)等不同領(lǐng)域和跨學(xué)科背景的合作主體。根據(jù)各主體優(yōu)勢(shì)和項(xiàng)目定位,ALEGORIA項(xiàng)目形成了不同的合作團(tuán)隊(duì),明確了各團(tuán)隊(duì)的職責(zé)定位,形成了科學(xué)、高效的合作模式。我國(guó)地理圖像檔案遺產(chǎn)來(lái)源分散,涉及檔案館、圖書(shū)館、高校、科研院所、專業(yè)機(jī)構(gòu)乃至個(gè)人。出于不同的形成原因和項(xiàng)目建設(shè)目標(biāo),對(duì)地理圖像檔案遺產(chǎn)的開(kāi)發(fā)需要各主體的共同參與。因此,需要建立主體多元的合作模式,實(shí)現(xiàn)地理圖像檔案遺產(chǎn)的集成,為地理圖像檔案遺產(chǎn)開(kāi)發(fā)開(kāi)拓更多的研究視野。
一方面,立足開(kāi)發(fā)需求進(jìn)行主體選擇。圍繞地理圖像檔案遺產(chǎn)的開(kāi)發(fā)需求,分析行業(yè)內(nèi)外相關(guān)主體的特性,對(duì)各自的潛在能力及優(yōu)勢(shì)進(jìn)行評(píng)估,選擇適合的主體參與地理圖像檔案遺產(chǎn)開(kāi)發(fā)的項(xiàng)目創(chuàng)建,形成滿足開(kāi)發(fā)需求的合作聯(lián)盟。另一方面,建立規(guī)范化的主體合作機(jī)制。地理圖像檔案遺產(chǎn)開(kāi)發(fā)的主體較為復(fù)雜,需要建立規(guī)范化的主體合作機(jī)制。根據(jù)合作主體的共同利益和項(xiàng)目開(kāi)發(fā)的現(xiàn)實(shí)目標(biāo),需要對(duì)不同的主體進(jìn)行職責(zé)劃分,明晰其在項(xiàng)目開(kāi)發(fā)中的角色定位。通過(guò)建立溝通協(xié)商機(jī)制,實(shí)現(xiàn)各主體的溝通便利和協(xié)商透明,形成和諧穩(wěn)定的項(xiàng)目合作氛圍,為地理圖像檔案遺產(chǎn)的有效開(kāi)發(fā)奠定基礎(chǔ)。例如中央研究院數(shù)位文化中心的“皇輿搜覽——尋訪清宮流散歷史輿圖連接數(shù)位計(jì)劃”項(xiàng)目[12],該項(xiàng)目為征集散佚海外的中文古輿圖,與美國(guó)國(guó)會(huì)圖書(shū)館、英國(guó)國(guó)家圖書(shū)館、英國(guó)國(guó)家檔案館以及多所日本學(xué)術(shù)與典藏單位開(kāi)展項(xiàng)目合作,形成了9個(gè)專題近300個(gè)圖像資源的數(shù)字古輿圖數(shù)據(jù)庫(kù)。
3.2 采取標(biāo)準(zhǔn)統(tǒng)一的數(shù)據(jù)處理
ALEGORIA項(xiàng)目對(duì)整合的資源進(jìn)行統(tǒng)一的數(shù)據(jù)處理,很好地用于地理圖像檔案遺產(chǎn)的應(yīng)用與開(kāi)發(fā)。我國(guó)地理圖像檔案遺產(chǎn)數(shù)量龐大、成分復(fù)雜,各機(jī)構(gòu)地理圖像檔案遺產(chǎn)的數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,極大限制了地理圖像檔案遺產(chǎn)的開(kāi)發(fā)。因此,需要在地理圖像檔案遺產(chǎn)的基礎(chǔ)上進(jìn)行統(tǒng)一標(biāo)準(zhǔn)化的數(shù)據(jù)處理,以便于對(duì)地理圖像檔案遺產(chǎn)的可識(shí)別、可處理、可應(yīng)用。
首先,要制定統(tǒng)一的數(shù)據(jù)處理標(biāo)準(zhǔn)。明確地理圖像檔案遺產(chǎn)數(shù)據(jù)處理的具體內(nèi)容,如數(shù)據(jù)的定義、格式、單位、命名約定等,對(duì)不同類(lèi)型的數(shù)據(jù)確立統(tǒng)一的格式標(biāo)準(zhǔn),制定地理圖像檔案遺產(chǎn)數(shù)據(jù)字典或元數(shù)據(jù)規(guī)范,詳細(xì)記錄每個(gè)數(shù)據(jù)字段的信息。其次,建立數(shù)據(jù)處理的標(biāo)準(zhǔn)化流程。制定清除無(wú)效、錯(cuò)誤和重復(fù)數(shù)據(jù)條目的程序,對(duì)地理圖像檔案遺產(chǎn)進(jìn)行數(shù)據(jù)清洗。轉(zhuǎn)換數(shù)據(jù)類(lèi)型,確保數(shù)據(jù)格式的一致性,以便于地理圖像檔案遺產(chǎn)的分析和共享。最后,使用標(biāo)準(zhǔn)化公式進(jìn)行數(shù)據(jù)轉(zhuǎn)換。使用標(biāo)準(zhǔn)化公式將不同來(lái)源的地理圖像檔案遺產(chǎn)數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的尺度。同時(shí),使用數(shù)據(jù)質(zhì)量檢查工具或自定義腳本對(duì)轉(zhuǎn)化后的數(shù)據(jù)進(jìn)行質(zhì)量檢測(cè),確保轉(zhuǎn)換后地理圖像檔案遺產(chǎn)數(shù)據(jù)的準(zhǔn)確性和完整性。以英國(guó)Vamp;A博物館發(fā)起的“中國(guó)圖像志索引典”項(xiàng)目[13]為例,該項(xiàng)目集合了跨機(jī)構(gòu)圖像檢索平臺(tái)、圖像志辭典及圖像志標(biāo)引規(guī)范,通過(guò)搭建不同圖像元數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,按照?qǐng)D像元數(shù)據(jù)的層次結(jié)構(gòu)順序和同義詞組系統(tǒng)對(duì)圖像進(jìn)行深度標(biāo)引和多維度語(yǔ)義標(biāo)注,構(gòu)建了一套中國(guó)圖像志結(jié)構(gòu)性詞表,并為中國(guó)圖像學(xué)提供統(tǒng)一的數(shù)據(jù)描述標(biāo)準(zhǔn)。
3.3 開(kāi)發(fā)技術(shù)驅(qū)動(dòng)的創(chuàng)新應(yīng)用
ALEGORIA項(xiàng)目利用圖神經(jīng)網(wǎng)絡(luò)(GNN)端到端學(xué)習(xí)圖嵌入的技術(shù)場(chǎng)景解決了圖像的檢索和模糊匹配難題,通過(guò)特定的圖像分析工具建立不同類(lèi)型的地理圖像檔案遺產(chǎn)數(shù)據(jù)集。目前,我國(guó)地理圖像檔案遺產(chǎn)數(shù)字人文項(xiàng)目大多仍采用傳統(tǒng)的開(kāi)發(fā)技術(shù),對(duì)于數(shù)字人文、機(jī)器學(xué)習(xí)、元宇宙、知識(shí)圖譜等新興技術(shù)的應(yīng)用較少,難以挖掘地理圖像檔案遺產(chǎn)的深層知識(shí)。
開(kāi)發(fā)技術(shù)驅(qū)動(dòng)的數(shù)字人文項(xiàng)目是實(shí)現(xiàn)地理圖像檔案遺產(chǎn)與新技術(shù)融合的切實(shí)舉措。首先,開(kāi)拓思路,積極接受新技術(shù)理念。在開(kāi)發(fā)新技術(shù)應(yīng)用上要根據(jù)特定的項(xiàng)目目標(biāo)和多元主體的協(xié)同合作,拓寬地理圖像檔案遺產(chǎn)開(kāi)發(fā)的思路,主動(dòng)嘗試新技術(shù)的融入,增加新技術(shù)在項(xiàng)目建設(shè)中的占比。同時(shí),聚焦實(shí)際,選擇對(duì)應(yīng)的技術(shù)手段。針對(duì)不同的開(kāi)發(fā)目標(biāo),需要采用單一或組合的技術(shù)方法進(jìn)行具體實(shí)施。如面對(duì)地理圖像檔案遺產(chǎn)空間信息的提取,采用GIS技術(shù)根據(jù)時(shí)間變化匹配對(duì)應(yīng)的地理區(qū)域;實(shí)現(xiàn)地理圖像檔案遺產(chǎn)的場(chǎng)景再現(xiàn),可以采用虛擬建模的形式將圖像內(nèi)容進(jìn)行多維復(fù)刻;而針對(duì)地理圖像檔案遺產(chǎn)的檢索,可以采用暹羅網(wǎng)絡(luò)+深度圖像描述的組合技術(shù)進(jìn)行聯(lián)合檢索。以敦煌研究院的“數(shù)字敦煌”項(xiàng)目[14]為例,該項(xiàng)目采用技術(shù)組配的方式對(duì)處于洞窟三維空間的敦煌圖像進(jìn)行處理,利用三維激光掃描技術(shù)計(jì)算敦煌圖像的準(zhǔn)確位置和實(shí)際大小。采用上述技術(shù)繪制的考古測(cè)繪圖。該項(xiàng)目也利用哈蘇X5、易邁康848掃描儀,對(duì)4000余張傳統(tǒng)底片進(jìn)行數(shù)字化掃描,初步建立圖像資源數(shù)據(jù)庫(kù),為用戶提供更為豐厚的敦煌石窟藝術(shù)信息。
3.4 提供研用并舉的內(nèi)容服務(wù)
地理圖像檔案遺產(chǎn)既具有專業(yè)研究?jī)r(jià)值又具備豐富的文化內(nèi)涵,在滿足科學(xué)研究的同時(shí)為用戶提供豐富的文化資源。ALEGORIA項(xiàng)目通過(guò)開(kāi)發(fā)兩個(gè)應(yīng)用程序來(lái)滿足用戶和數(shù)字人文學(xué)者進(jìn)行實(shí)踐應(yīng)用。我國(guó)當(dāng)前在地理圖像檔案遺產(chǎn)開(kāi)發(fā)較少,多以提供圖像資源的數(shù)字化服務(wù),無(wú)法為地理圖像檔案遺產(chǎn)研究提供資源支撐,對(duì)用戶的文化服務(wù)也相對(duì)有限。因此,需要提供沿用并舉的地理圖像檔案遺產(chǎn)內(nèi)容服務(wù),根據(jù)深度研究與應(yīng)用實(shí)踐的差異,提供不同的地理圖像檔案遺產(chǎn)內(nèi)容服務(wù)。主要從兩個(gè)方面入手。
一方面,確立研究導(dǎo)向的服務(wù)策略。針對(duì)科學(xué)研究的需要,在地理圖像檔案遺產(chǎn)開(kāi)發(fā)的內(nèi)容服務(wù)方面?zhèn)戎赜谔峁┵Y源集成、數(shù)據(jù)挖掘、知識(shí)關(guān)聯(lián)等內(nèi)容。通過(guò)構(gòu)建專題數(shù)據(jù)庫(kù)、開(kāi)發(fā)科研工具,提供數(shù)據(jù)層級(jí)的內(nèi)容服務(wù),滿足科學(xué)研究的專業(yè)需求。另一方面,提供用戶導(dǎo)向的服務(wù)內(nèi)容。針對(duì)社會(huì)應(yīng)用,地理圖像檔案遺產(chǎn)開(kāi)發(fā)的內(nèi)容服務(wù)側(cè)重于提高社會(huì)認(rèn)知,通過(guò)數(shù)字策展、虛實(shí)互動(dòng)、實(shí)體活動(dòng)等形式,融合虛擬感知、圖像渲染等技術(shù),以富有趣味體驗(yàn)的服務(wù)內(nèi)容向用戶呈現(xiàn),增強(qiáng)用戶與地理圖像檔案遺產(chǎn)的互動(dòng),提高用戶對(duì)地理圖像檔案遺產(chǎn)的認(rèn)知。例如荷蘭的文化史圖像數(shù)據(jù)庫(kù)(ARKYVES)項(xiàng)目[15],該項(xiàng)目匯集了90多萬(wàn)張來(lái)自歐洲各國(guó)博物館、圖書(shū)館的藏品圖像,既是一個(gè)圖像數(shù)據(jù)庫(kù),又是藝術(shù)人文領(lǐng)域研究人員的研究工具和平臺(tái)。ARKYVES不僅提供了面向用戶的工具集,也具有索引、搜索、瀏覽、超鏈接和注釋功能等基礎(chǔ)架構(gòu),可用于數(shù)據(jù)集研究的機(jī)構(gòu)和個(gè)人使用,建構(gòu)了專業(yè)科研與公共服務(wù)并存的服務(wù)體系。
4 結(jié)語(yǔ)
本文解析了ALEGORIA項(xiàng)目以數(shù)字人文為導(dǎo)向進(jìn)行地理圖像檔案遺產(chǎn)開(kāi)發(fā)的實(shí)踐策略,對(duì)照其特征結(jié)合我國(guó)國(guó)情,提出建立主體多元的合作模式、采取標(biāo)準(zhǔn)統(tǒng)一的數(shù)據(jù)處理、開(kāi)發(fā)技術(shù)驅(qū)動(dòng)的創(chuàng)新應(yīng)用、提供研用并舉的內(nèi)容服務(wù)四方面的策略要點(diǎn),為我國(guó)地理圖像檔案遺產(chǎn)的開(kāi)發(fā)提供有益借鑒。然而,研究聚焦于對(duì)典型案例的分析和歸納,僅從其現(xiàn)有實(shí)踐中提出進(jìn)一步的發(fā)展方向和思路,尚需對(duì)我國(guó)地理圖像檔案遺產(chǎn)的實(shí)況進(jìn)行更深入的調(diào)研,以完善數(shù)字人文視角下地理圖像檔案遺產(chǎn)開(kāi)發(fā)的策略方案,從而進(jìn)一步促進(jìn)實(shí)踐的優(yōu)化。
參考文獻(xiàn):
MITCHELL W J T. Picture theory: essays on verbal
and visual representation[M]. Chicago: University of Chicago Press, 1994: 11-35.
俞天秀,吳健,趙良,等.“數(shù)字敦煌”資源庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)[J].敦煌研究, 2020(2): 120-130.
牛筱桔.美術(shù)圖像資源自建數(shù)據(jù)庫(kù)探析:淺議天津美院圖書(shū)館自建“四萬(wàn)張精品素材庫(kù)”大學(xué)圖書(shū)館學(xué)報(bào), 2010,28(6):72-74.
The French National Research Agency. Advanced Linking and Exploitation of Digitized Geographic Iconographic Heritage [EB/OL].(2018-01-22)[2024-03-28]. https://www.alegoria-project.fr/en.
MALLET C, CHRISTOPHE S, RAYMOND A. The LASTIG lab [EB/OL]. (2023-06-06)[2024-04-25].https://www.umr-lastig.fr/.
Central School of Lyon. Informatics Laboratory in image and Information Systems [EB/OL]. (2009-01-22)[2024-04-25]. https://liris.cnrs.fr.
The French National Research Agency. Advanced Linking and Exploitation of Digitized Geographic Iconographic Heritage [EB/OL].(2018-01-22)[2024-03-28].https://www.alegoria-project.fr/en/consortium.
KHOKHLOVA M, ABADIE N, CHEN L M, et al. Learning embeddings for cross-time geographic areas
represented as graphs[C]. New York: Association
for Computing Machinery, 2021.
GENIET F, GOUET-BRUNET V, BRéDIF M. Alegoria: joint multimodal search and spatial navigation
into the geographic iconographic heritage[C]. New York: Association for Computing Machinery, 2022.
謝瑋,衡雨,邱菊芯.面向《天工開(kāi)物》版本圖
像資源的知識(shí)圖譜應(yīng)用研究[J].包裝工程,2023,
44(S1):480-492, 535.
程結(jié)晶,王心雨.基于關(guān)聯(lián)數(shù)據(jù)的敦煌遺書(shū)圖像
知識(shí)組織模式的構(gòu)建[J].檔案學(xué)研究, 2021(5):
52-59.
中央研究院數(shù)位文化中心.數(shù)位方典[EB/OL].
(2014-06-01)[2024-05-06].https://digitalatlas.asdc.sinica.edu.tw/index.jsp.
Victoria and Albert Museum. Chinese Iconography Thesaurus (CIT) [EB/OL]. (2022-03-01)[2024-05-24].https:/chineseiconography.org/.
樊錦詩(shī).敦煌石窟保護(hù)與展示工作中的數(shù)字技術(shù)應(yīng)用[J].敦煌研究, 2009(6):1-3.
陳亮.數(shù)字人文中的圖像數(shù)據(jù)庫(kù)和圖像志索引典[J].美術(shù)觀察, 2021(4):24-26.