顏 佳 楊 敏 彭 梅
(上海圖書館 上海 200031)
數(shù)字圖像和文本一樣,是人類文化記憶的重要資源載體和表現(xiàn)形式。圖書館、博物館、檔案館(簡稱圖博檔)作為相似的公共文化機(jī)構(gòu),具有相似的使命責(zé)任,例如保護(hù)文化遺產(chǎn)、保存與提供信息資源等[1]。在圖博檔領(lǐng)域,數(shù)字圖像往往以數(shù)字化的歷史文獻(xiàn)、檔案、手稿、文物照片等形式出現(xiàn),是對人文歷史事件的真實記錄。但是和文本相比,當(dāng)前對數(shù)字圖像的研究還比較少。雖然過去十多年的數(shù)字典藏與數(shù)字圖書館計劃,將大量的圖像資源數(shù)字化并建成數(shù)據(jù)庫,但是由于數(shù)字圖像受限于其語義內(nèi)容難以揭示、跨機(jī)構(gòu)之間的資源難以互通等困難,圖博檔對圖像資源的發(fā)現(xiàn)、比較、引用、再利用、交換等均存在障礙。
我國圖博檔領(lǐng)域?qū)?shù)字圖像的研究,從上世紀(jì)90年代便逐漸開展,之后隨著館藏數(shù)字化建設(shè)、文化遺產(chǎn)數(shù)字化、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等研究的興起,圖博檔對數(shù)字圖像的研究也在不斷推進(jìn)。尤其是近年來數(shù)字人文研究的發(fā)展,革新了人文社科領(lǐng)域的研究范式,使數(shù)據(jù)成為一種支持研究、創(chuàng)新、服務(wù)大眾的新型資源,也由此引發(fā)了圖博檔等文化機(jī)構(gòu)建設(shè)數(shù)據(jù)基礎(chǔ)設(shè)施的需求。圖像數(shù)據(jù)建設(shè)作為數(shù)字人文基礎(chǔ)建設(shè)的重要組成部分,更是得到業(yè)界空前的重視。為了厘清我國圖博檔領(lǐng)域數(shù)字圖像發(fā)展脈絡(luò),找出其研究進(jìn)展與趨勢,筆者擬對我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的學(xué)術(shù)文獻(xiàn)進(jìn)行分析,借助CiteSpace、VOSviewer等科學(xué)計量與可視化分析工具[2],探討未來圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的發(fā)展方向,為我國圖博檔領(lǐng)域的圖像內(nèi)容揭示、文化遺產(chǎn)建設(shè)、數(shù)字人文基礎(chǔ)設(shè)施建設(shè)提供參考和借鑒。
在我國圖博檔領(lǐng)域,數(shù)字人文基礎(chǔ)設(shè)施建設(shè)實際開展較早,如上世紀(jì)末各大圖書館就已經(jīng)著手建設(shè)的數(shù)字圖書館項目可以算作數(shù)字人文基礎(chǔ)設(shè)施的一部分,其他如中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS)、大學(xué)數(shù)字圖書館國際合作計劃(CADAL)等跨機(jī)構(gòu)的文獻(xiàn)資源合作建設(shè)項目也可以納入數(shù)字人文基礎(chǔ)設(shè)施建設(shè)的范圍。而國內(nèi)完整闡述數(shù)字人文基礎(chǔ)設(shè)施建設(shè)這一概念的,當(dāng)屬劉煒在2016年發(fā)表的《面向人文研究的國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)》[3]。該文將數(shù)字人文的基礎(chǔ)設(shè)施定義成為人文研究提供資源、工具、網(wǎng)絡(luò)空間的研究基礎(chǔ)設(shè)施(research infrastructure),具體指在數(shù)字環(huán)境下為開展人文研究而必須具備的基本條件,包括全球范圍內(nèi)與研究主題相關(guān)的所有文獻(xiàn)、數(shù)據(jù)、相關(guān)軟件工具、學(xué)術(shù)交流和出版的公用設(shè)施及相關(guān)服務(wù)等。與一般性的公共基礎(chǔ)設(shè)施相似,數(shù)字人文基礎(chǔ)設(shè)施同樣具有公共性、開放性、可持續(xù)性等特點(diǎn),這使得圖博檔這類伴隨人類文明進(jìn)步的公共文化機(jī)構(gòu)參與數(shù)字人文基礎(chǔ)設(shè)施建設(shè)有著天然的可能性。
圖像數(shù)據(jù)基礎(chǔ)設(shè)施作為數(shù)字人文基礎(chǔ)設(shè)施的一部分,一般情況下,我們可以認(rèn)為其特指數(shù)字人文基礎(chǔ)設(shè)施中的圖像數(shù)據(jù)的建設(shè)及相關(guān)服務(wù)。圖像數(shù)據(jù)基礎(chǔ)設(shè)施中提到的數(shù)據(jù)并不特指單一的圖像數(shù)據(jù)庫,而是一種數(shù)據(jù)規(guī)模大、覆蓋時間長、地域范圍廣、描述粒度小、維度多的介于信息基礎(chǔ)設(shè)施后臺和特定領(lǐng)域研究前臺之間的數(shù)據(jù)中臺[4]。它不僅包含帶有圖像檢索服務(wù)的文獻(xiàn)知識庫,還包含基于資源對象和數(shù)據(jù)單元層面的基礎(chǔ)知識庫,同時這些圖像數(shù)據(jù)可以支持跨機(jī)構(gòu)的共建共享與跨網(wǎng)域的開放互聯(lián)。因此討論我國圖博檔領(lǐng)域?qū)D像數(shù)據(jù)基礎(chǔ)設(shè)施的研究關(guān)系到圖像數(shù)字化技術(shù)、圖像文本化技術(shù)、數(shù)字圖像的知識表示、數(shù)字圖像互聯(lián)與共享、圖像知識庫構(gòu)建等多個環(huán)節(jié)。
文章的數(shù)據(jù)來源于中國知網(wǎng)(CNKI)數(shù)據(jù)庫,該數(shù)據(jù)庫為我國最大的、連續(xù)更新的綜合性文獻(xiàn)數(shù)據(jù)庫,能夠較為全面地反映我國關(guān)于數(shù)字圖像的研究情況。筆者以篇名=“圖像”or篇名=“數(shù)字人文”為條件進(jìn)行檢索,共得到圖書情報與數(shù)字圖書館、檔案及博物館類目下的所有核心文獻(xiàn)814篇,其中以“圖像”為題的文章440篇,以“數(shù)字人文”為題的388篇,而同時包含“圖像”和“數(shù)字人文”文章僅12篇(表1)??紤]到本文研究的對象為圖像數(shù)據(jù)的基礎(chǔ)設(shè)施建設(shè),包含圖像數(shù)字化、文本化、結(jié)構(gòu)化、語義化建設(shè)等多個環(huán)節(jié),因此盡管很多圖像研究的文章主題中并無數(shù)字人文,但仍可作為圖像基礎(chǔ)設(shè)施建設(shè)的一部分,而檢索詞為“數(shù)字人文”的文章得出的結(jié)論多是關(guān)于數(shù)字人文的相關(guān)分析,范圍更為寬泛。因此,為了對我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)進(jìn)行系統(tǒng)的梳理,對其未來發(fā)展趨勢和方向提供針對性的指導(dǎo)建議,本文最終選取“圖像”為檢索詞的440篇核心文獻(xiàn),采集數(shù)據(jù)的時間為2020年9月12日。
表1 檢索詞及相關(guān)文獻(xiàn)數(shù)量
文章采用信息計量學(xué)的方法,以定量分析為主,并借助科學(xué)文本挖掘及可視化軟件形象地展示圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)進(jìn)展及前沿。文章采用的具體分析方法為:定量統(tǒng)計分析,以期獲得圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的進(jìn)展情況;詞頻分析,通過在文獻(xiàn)信息中提取能夠表達(dá)核心內(nèi)容的關(guān)鍵詞頻次的高低分布來研究該領(lǐng)域發(fā)展動向和研究熱點(diǎn);可視化網(wǎng)絡(luò)及自動生成的結(jié)果解讀,通過分析重要的可視化網(wǎng)絡(luò)節(jié)點(diǎn)、時間、主題內(nèi)容等來確定主要學(xué)者、機(jī)構(gòu)、研究前沿、熱點(diǎn)等,為今后在該領(lǐng)域進(jìn)行學(xué)術(shù)資源引進(jìn)、開展合作提供支撐。
通過統(tǒng)計某學(xué)科的文獻(xiàn)數(shù)量及其變化情況,來分析研究該學(xué)科的發(fā)展及其趨勢是文獻(xiàn)計量學(xué)的基本方法之一[5]。圖1中的曲線展示了發(fā)表的文獻(xiàn)數(shù)量隨時間變化的情況。我國圖博檔領(lǐng)域關(guān)于數(shù)字圖像的研究最早可以追溯到1993年,為韓建新發(fā)表的關(guān)于圖像數(shù)據(jù)庫和圖像檢索的研究論文[6]。在1993到2001年,相關(guān)文獻(xiàn)數(shù)量每年不超過10篇,說明我國圖博檔領(lǐng)域?qū)?shù)字圖像的研究剛剛起步,研究內(nèi)容也主要集中在圖像的數(shù)字化采集加工、圖像數(shù)據(jù)庫的建設(shè)與檢索等方面。2001年以后,關(guān)于數(shù)字圖像研究的文獻(xiàn)數(shù)量有了較大提升,每年的發(fā)文量保持在20篇左右,探究其背后的原因與當(dāng)時互聯(lián)網(wǎng)尤其是語義網(wǎng)的快速發(fā)展有關(guān)。20世紀(jì)末,萬維網(wǎng)之父蒂姆·伯納斯·李提出了語義網(wǎng)(semantic web)的概念[7],在此背景下,關(guān)于數(shù)字圖像語義標(biāo)注和知識本體等的研究也逐漸增多,我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的熱點(diǎn)逐漸由數(shù)字化技術(shù)向圖像內(nèi)容的深度標(biāo)注、圖像語義本體的建設(shè)等方向轉(zhuǎn)換。
圖1 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)文獻(xiàn)時間分布
筆者對所獲取的文獻(xiàn)機(jī)構(gòu)進(jìn)行統(tǒng)計,440篇文章共有機(jī)構(gòu)192家。按照普萊斯定律[8],核心機(jī)構(gòu)的數(shù)量等于全部機(jī)構(gòu)總數(shù)的平方根,因此192家機(jī)構(gòu)中核心機(jī)構(gòu)約14家,文章取其中位列前10的機(jī)構(gòu)進(jìn)行考察(表2)。通過表2可以看出圖博檔領(lǐng)域有關(guān)數(shù)字圖像的研究機(jī)構(gòu)主要以各個大學(xué)及科研院所為主。其中武漢大學(xué)占有較大優(yōu)勢,其次為南京大學(xué)、中國科學(xué)院、華中師范大學(xué)等。值得一提的是,上海圖書館非高?;蜓芯繖C(jī)構(gòu),同樣占有一席之地,這與上海圖書館數(shù)字人文團(tuán)隊近年來發(fā)表了大量的研究成果有較大關(guān)系。同時筆者關(guān)注到,作為擁有大量數(shù)字圖像資源的博物館、檔案館等文化記憶機(jī)構(gòu),在整個研究成果中占比較低。
表2 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究前十高產(chǎn)作者及機(jī)構(gòu)
同樣,我們對文獻(xiàn)的作者進(jìn)行了統(tǒng)計,440篇文獻(xiàn)共有作者791名,根據(jù)普萊斯定律,核心作者為28名,合作完成文章268篇,合作度為1.79,合作率為61%。為了方便讀者直觀地了解相關(guān)合作情況,文章借助CiteSpace來對作者合作網(wǎng)絡(luò)進(jìn)行展示。筆者將440篇文章導(dǎo)入CiteSpace(版本CiteSpace5.6R5)中,時間跨度為1993—2020年,時間切片為1,各時間切片閾值為TOP50,此時的Nodes Types選擇Author,網(wǎng)絡(luò)連線強(qiáng)度計算用Cosine算法,網(wǎng)絡(luò)不使用裁剪方法,得到作者合作網(wǎng)絡(luò)圖譜(圖2)。該圖譜共獲得節(jié)點(diǎn)499個,連線352條,網(wǎng)絡(luò)密度為0.0028,可見作者合作相對較為分散,以小團(tuán)體居多。通過繪制作者合作圖譜,我們找出了主要的合作團(tuán)隊,其中最大的來自武漢大學(xué)數(shù)字人文研究中心王曉光帶領(lǐng)的團(tuán)隊,成員有李綱、徐雷、侯西龍等21名,研究成果從2013年延續(xù)至今,研究內(nèi)容為數(shù)字人文視域下的“數(shù)字敦煌”項目。該項目建立了壁畫主題詞表及關(guān)聯(lián)數(shù)據(jù)服務(wù)平臺、文化遺產(chǎn)圖像交互式數(shù)字系統(tǒng)等,是我國圖博檔領(lǐng)域數(shù)字圖像研究的成功案例,具有很強(qiáng)的示范作用[9-10]。其次為來自武漢大學(xué)圖書情報與數(shù)字圖書館的陸偉、陸泉等所在的團(tuán)隊,共有成員12名,成果發(fā)布時間為2009年到2017年,研究內(nèi)容主要為圖像的語義標(biāo)注。第三為來自南京大學(xué)計算機(jī)軟件學(xué)院的朱學(xué)芳團(tuán)隊,共有成員12名,成果發(fā)布時間為2002年到2013年,研究內(nèi)容主要為圖像數(shù)字化、檔案數(shù)字化、圖像特征提取、基于內(nèi)容的圖像檢索等。值得一提的是由上海圖書館陳濤、上海大學(xué)張永娟等組成的團(tuán)隊,共有成員9名,主要研究成果集中在近兩年,其研究內(nèi)容包括數(shù)字人文圖像資源語義化建設(shè)的框架、國際圖像互操作框架(International Image Interoperability Framework,IIIF)等,代表了我國圖博檔領(lǐng)域圖像研究在未來的發(fā)展趨勢。
圖2 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究高產(chǎn)作者合作網(wǎng)絡(luò)
詞頻分析是指對一組文章中的關(guān)鍵詞出現(xiàn)的次數(shù)進(jìn)行統(tǒng)計分析,一般情況下,關(guān)鍵詞出現(xiàn)的次數(shù)越多,越能反映文章所表達(dá)的主要觀點(diǎn)。筆者對我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的關(guān)鍵詞詞頻進(jìn)行統(tǒng)計分析,并結(jié)合詞匯的中介中心性(測度節(jié)點(diǎn)重要性的指標(biāo),中介中心性越高,節(jié)點(diǎn)重要性越大),得到高頻關(guān)鍵詞列表(表3),并通過CiteSpace構(gòu)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。由于CiteSpace的可視化視圖效果較為有限,因此文章借助可視化知識圖譜軟件VOSviewer繪制關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)(圖3),得出了當(dāng)前圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究的主要進(jìn)展。
表3 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究高頻關(guān)鍵詞列表(前25位)
通過高頻關(guān)鍵詞表和關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),我們可以看到我國圖博檔領(lǐng)域關(guān)于圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究的核心詞匯包括基于內(nèi)容的圖像檢索、數(shù)字圖書館、語義標(biāo)注、圖像數(shù)字化、元數(shù)據(jù)等,然后以圖像數(shù)字化、元數(shù)據(jù)與語義標(biāo)注、數(shù)字人文與知識圖譜為核心分成了4塊核心區(qū)域,同時還包含光學(xué)字符識別、照片檔案數(shù)字化等外圍概念。文章將基于以上4塊核心區(qū)域分別介紹相關(guān)的研究進(jìn)展。
圖3 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
如何利用信息技術(shù)將實體轉(zhuǎn)化為數(shù)字圖像,其中涉及諸多技術(shù)問題,在這一領(lǐng)域也有很多探討,包括實體修復(fù)、圖像采集、圖像識別、圖像處理、圖像標(biāo)準(zhǔn)化加工等等,最終實現(xiàn)保護(hù)性利用與開發(fā)。如李升所撰寫的《敦煌壁畫的數(shù)字化保護(hù)與傳播研究》一文討論了敦煌壁畫的數(shù)字化輔助修復(fù)技術(shù)、智能化交互的壁畫臨摹輔助技術(shù)以及壁畫色彩虛擬復(fù)原技術(shù)等在敦煌壁畫數(shù)字化過程中的應(yīng)用[11];彭韻華在《平面圖像數(shù)位化之品質(zhì)控制因素分析》中對影響平面圖像質(zhì)量的諸多因素進(jìn)行了分析和探討[12];錢錚等在《民國期刊數(shù)字化建設(shè)中圖像傾斜度問題研究》中對近代報刊圖像在數(shù)字圖像采集中的掃描及處理技術(shù)進(jìn)行了探討,為業(yè)內(nèi)進(jìn)行近代報刊圖像的數(shù)字化掃描與加工提供了實踐案例[13]。
對圖像數(shù)字資源的特征進(jìn)行提取、描述、分類進(jìn)而實現(xiàn)多層次的標(biāo)引是滿足用戶多維度檢索需求和實現(xiàn)圖像知識檢索的重要前提,因此對這一問題的研究是整個圖像數(shù)字資源服務(wù)提升的關(guān)鍵所在。
在圖像分類方法的研究上,基于卷積神經(jīng)網(wǎng)絡(luò)圖像分類算法 、RGB-D圖像分類方法 、圖像語義分類等的研究是非常豐富的。國外比較通行的圖像主題詞表“ICONCLASS”則是專為藝術(shù)和圖像設(shè)計的分類主題詞表,它是在描述和檢索圖像(藝術(shù)作品、書籍插圖、復(fù)制品、照片等)主題方面最廣為人知的科學(xué)工具,被世界各地的博物館和藝術(shù)機(jī)構(gòu)所使用[14]。由張弘星團(tuán)隊參考“ICONCLASS”主題詞表的構(gòu)建形式,設(shè)計出的符合中文圖像的“中國圖像志索引典”(Chinese Iconography Thesaurus,CIT)項目,構(gòu)建了一套索引典系統(tǒng),收錄詞匯約有11 000個,分為7個大類[15]。
在圖像元數(shù)據(jù)標(biāo)準(zhǔn)方面,國外有IPTC 、VRA Core、MOA2、CDL、NISO/CLIR/RLG 等,我國則結(jié)合特定資源并在通用元數(shù)據(jù)標(biāo)準(zhǔn)上進(jìn)行修改和完善,如鄭巧英等編著的《國家圖書館圖像資源元數(shù)據(jù)規(guī)范和著錄規(guī)則》[16],肖瓏等編著的《國家圖書館輿圖元數(shù)據(jù)規(guī)范與著錄規(guī)則》[17]等。
從2011年開始,圖像的語義標(biāo)注開始逐漸興起,學(xué)者陳金菊等對數(shù)字圖像語義模型進(jìn)行了比較與分析,歸納出Eakins模型、Jaimes&Chang模型、Kong模型及Panofsky模型,并比較其在語義層次、可擴(kuò)展性及應(yīng)用場景方面的特點(diǎn)[18];李旭暉等提出了基于角色關(guān)聯(lián)的敘事型文化遺產(chǎn)知識表示方法,提出了多粒度、多角度的語義數(shù)據(jù)模型[19]。在實證研究方面,王曉光等基于Eakins模型提出了一個敦煌壁畫數(shù)字圖像語義描述層次模型[9]52-56;徐雷等對敘述性圖像語義標(biāo)注模型進(jìn)行了研究,結(jié)合開放標(biāo)注協(xié)同框架(OAC)實現(xiàn)了基于本體的語義標(biāo)注模型,并通過敦煌壁畫的案例實踐提出其模型的應(yīng)用前景[20];曾子明等提出一種面向數(shù)字人文的圖像語義描述模式,并基于國家圖書館老照片數(shù)據(jù)進(jìn)行實驗論證[21]。
我國圖博檔領(lǐng)域?qū)D像檢索的研究主要包括圖像內(nèi)容特征提取的各類算法、圖像匹配查找技術(shù)、圖像檢索結(jié)果優(yōu)化技術(shù)等。目前常用的圖像檢索技術(shù)多利用計算機(jī)算法提取視覺特征來對數(shù)字圖像進(jìn)行描述,這些做法較難滿足圖博檔機(jī)構(gòu)對數(shù)字圖像檢索的要求,主要問題在于圖博檔機(jī)構(gòu)的數(shù)字圖像語義信息較多,利用通用的數(shù)字圖像學(xué)方法提取語義信息容易導(dǎo)致明顯的錯誤,因此圖博檔機(jī)構(gòu)對圖像檢索的研究主要是為了解決特定領(lǐng)域內(nèi)圖像的語義特征提取及檢索問題。田學(xué)東等利用卷積神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建了適用于古籍漢字圖像的CNN模型,以提高圖像檢索的準(zhǔn)確率[22];針對醫(yī)學(xué)圖像基于內(nèi)容檢索的深度要求而語義描述框架又僅僅是對象層面描述的難題,丁恒等利用語義標(biāo)注模型實現(xiàn)醫(yī)學(xué)圖像領(lǐng)域的語義描述與自動標(biāo)注[23];鄧三鴻等利用在圖像語義描述框架中增加社會標(biāo)簽的機(jī)制,滿足了博物館圖像檢索中對深層次語義表達(dá)的檢索需求,繼而提高了圖像檢索的效率[24]。
數(shù)字人文的研究中,圖像可作為一種重要的研究資料,不僅僅包括人文研究的歷史原照還包括各種數(shù)字化后的圖像文獻(xiàn)、文物照片、繪畫掃描件等。圖像基礎(chǔ)設(shè)施的建設(shè)將改變并逐步形成新的人文研究范式,實現(xiàn)人文研究范式的全面改革,為新文科建設(shè)提供有力的支撐。我國圖博檔領(lǐng)域?qū)?shù)字人文研究中的新興、熱門技術(shù)應(yīng)用于圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)中,如關(guān)聯(lián)數(shù)據(jù)、深度學(xué)習(xí)、眾包、自然語言處理、知識圖譜、國際圖像互操作框架等。徐芳等基于關(guān)聯(lián)數(shù)據(jù)對文化遺產(chǎn)的數(shù)字化保護(hù)進(jìn)行了研究綜述,發(fā)現(xiàn)基于關(guān)聯(lián)數(shù)據(jù)的對象化的知識標(biāo)識手段是下一步文化遺產(chǎn)內(nèi)容揭示的有利途徑[25];楊冠燦等分析了人文研究的深度需求,對京劇臉譜圖案的數(shù)字化保護(hù)提出具體的方案,并利用“北京記憶-京劇臉譜”網(wǎng)站案例進(jìn)行了實證研究[26];陳濤等討論了數(shù)字人文中圖像資源的語義化標(biāo)注研究和語義化建設(shè)框架,提出了一套圖像資源語義化框架設(shè)計的方案,將關(guān)聯(lián)數(shù)據(jù)、IIIF與語義標(biāo)注相結(jié)合,推動圖博檔資源在信息化、數(shù)字化、語義化方面的創(chuàng)新轉(zhuǎn)型[27-28]。
在CiteSpace中,某個領(lǐng)域所包含的突發(fā)節(jié)點(diǎn)越多,那么該領(lǐng)域就越活躍或是研究的新興趨勢。共現(xiàn)時區(qū)視圖(Time View)是將相同時間內(nèi)的節(jié)點(diǎn)集合在了相同的時區(qū)中,清晰地展示時間維度上知識領(lǐng)域的演進(jìn)過程[29]。因此,我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的新興趨勢,可以通過繪制關(guān)鍵詞突變表和關(guān)鍵詞共現(xiàn)時區(qū)視圖來(圖4—5)揭示。結(jié)合這兩張圖表,我們可以發(fā)現(xiàn)隨著時間的演進(jìn),語義標(biāo)注、移動視覺搜索、大數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、國際圖像互操作框架和數(shù)字人文逐漸成為當(dāng)前領(lǐng)域的活躍關(guān)鍵詞,因此我們從以下4個方向?qū)ο乱浑A段圖博檔領(lǐng)域圖像語義標(biāo)注的趨勢進(jìn)行梳理。
圖4 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究關(guān)鍵詞突變表
圖5 圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究關(guān)鍵詞共現(xiàn)時區(qū)視圖
我們通過圖4中數(shù)字圖像領(lǐng)域的關(guān)鍵詞突變表可以看出,語義標(biāo)注的突變強(qiáng)度高達(dá)11.1276,表明圖像的語義標(biāo)注仍然為當(dāng)前研究的新興趨勢,具備很高的活躍度。曾蕾等在《圖檔博領(lǐng)域的智慧數(shù)據(jù)及其在數(shù)字人文研究中的角色》中指出,語義化表示的標(biāo)注信息與圖像本身一同構(gòu)成了圖像智慧數(shù)據(jù)資源,對語義檢索、細(xì)粒度內(nèi)容資源集成、知識發(fā)現(xiàn)、跨模態(tài)認(rèn)知計算、深度學(xué)習(xí)等計算機(jī)處理形成了資源支撐[30]。
未來,圖像的語義標(biāo)注將呈現(xiàn)如下三個特征:第一,結(jié)合受控術(shù)語或本體,建立適合特定領(lǐng)域的語義標(biāo)注模型。如敦煌壁畫的語義描述模型、“中研院”的佛教石窟圖像分類標(biāo)注系統(tǒng)、民國報紙廣告圖像資源標(biāo)注模型[31]等,這些都是對特定領(lǐng)域圖像資源特點(diǎn)進(jìn)行描述。第二,語義標(biāo)注與IIIF、關(guān)聯(lián)數(shù)據(jù)、眾包等其他數(shù)字人文技術(shù)、圖像標(biāo)準(zhǔn)相結(jié)合。由于IIIF并不包括語義標(biāo)注標(biāo)準(zhǔn)模型,因此將圖像的語義標(biāo)注與國際圖像互操作框架相結(jié)合,可以實現(xiàn)通用的圖像資源語義化建設(shè)。如陳濤等在其著作《數(shù)字人文中圖像資源的語義化標(biāo)注研究》[27]7-8中就以IIIF為框架,以關(guān)聯(lián)數(shù)據(jù)、語義網(wǎng)技術(shù)為支撐,建立了語義知識(本體)管理平臺。第三,利用深度學(xué)習(xí)技術(shù)、卷積神經(jīng)網(wǎng)絡(luò)推動自動圖像標(biāo)注技術(shù)的發(fā)展。如王仁武等在《圖片情感分析研究綜述》中指出,隨著圖片情感分析粒度的細(xì)化,下一步的研究方向是深度學(xué)習(xí)算法和標(biāo)注方式的優(yōu)化;同時,加快帶有情感標(biāo)簽圖片數(shù)據(jù)集的開放進(jìn)程,可以更好地推動該領(lǐng)域研究的不斷深入[32]。李志義等在《基于深度學(xué)習(xí)CNN模型的圖像情感特征抽取研究》中提出了一種基于深度學(xué)習(xí)的圖像情感特征抽取的算法,將圖像底層特征融合到圖像的高層情感語義當(dāng)中,應(yīng)用改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了對圖像情感特征的提取[33]。
IIIF在2015年由美國斯坦福大學(xué)的研究人員首先提出,核心是一組API解決數(shù)字化圖像尤其是高精度數(shù)字化圖像的查看、比較、標(biāo)注、開放、共享等問題。由于針對的是高精度圖像,因此迅速在國外的文化記憶機(jī)構(gòu)中得到了廣泛的應(yīng)用。歐洲文化圖書館(Europeana)是歐洲的數(shù)字文化遺產(chǎn)平臺,鼓勵其合作伙伴網(wǎng)絡(luò)(包括圖書館、檔案館、博物館)提供高質(zhì)量的內(nèi)容,并為此調(diào)整了基礎(chǔ)設(shè)施,以便能夠處理IIIF資源。目前,遵循第一個IIIF標(biāo)準(zhǔn)的數(shù)據(jù)集可以在歐洲文化圖書館數(shù)據(jù)集(Europeana Collections)門戶網(wǎng)站上訪問。法國數(shù)字人文中心的圣經(jīng)文獻(xiàn)(Biblissima)項目,重點(diǎn)是展示中世紀(jì)和文藝復(fù)興時期的書面文化遺產(chǎn),目前支持同時顯示在多個機(jī)構(gòu)托管的內(nèi)容,并將越來越多地提供對法語內(nèi)容的訪問。在這樣的背景下,我國也有多個機(jī)構(gòu)利用IIIF中的圖像API和呈現(xiàn)API來進(jìn)行大量全文圖像資源的展示,如上海圖書館的家譜、古籍、紅色文獻(xiàn)等文獻(xiàn)知識庫,華東師范大學(xué)的地方志數(shù)據(jù)庫等。
數(shù)字人文基礎(chǔ)設(shè)施被視為一種支持?jǐn)?shù)字人文研究活動的“研究基礎(chǔ)設(shè)施(research infrastructure)”,包括數(shù)字化的文獻(xiàn)資源、數(shù)據(jù)庫、工具平臺、支持知識生產(chǎn)和信息交流的網(wǎng)絡(luò)空間等。數(shù)字人文基礎(chǔ)設(shè)施建設(shè)的公共性、開放性與持續(xù)性等特點(diǎn),決定了圖博檔等公共文化機(jī)構(gòu)將成為其主要責(zé)任主體,致力于資源保存、文化傳承與知識整序。
數(shù)字圖像作為數(shù)字人文數(shù)據(jù)基礎(chǔ)設(shè)施中文獻(xiàn)資源與數(shù)據(jù)庫的主要部分,有待圖書館、博物館、檔案館等文化記憶機(jī)構(gòu)打破原有的壁壘,將所藏資源與已建平臺等聯(lián)合起來,遵循統(tǒng)一的技術(shù)規(guī)范,依托關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢,利用HTTPURI來作為唯一表示和定位的統(tǒng)一資源標(biāo)識符,最終實現(xiàn)資源跨機(jī)構(gòu)的共建共享。利用數(shù)字圖像語義描述框架、知識本體、知識圖譜、語義網(wǎng)等概念加強(qiáng)知識的表示與知識建模,以支持對圖像內(nèi)容細(xì)粒度的揭示。
在新型數(shù)字化技術(shù)以及語義網(wǎng)、人工智能等現(xiàn)代信息技術(shù)的推動下,圖像庫的建設(shè)在內(nèi)容上結(jié)合領(lǐng)域主題詞表進(jìn)行語義描述,在技術(shù)上與關(guān)聯(lián)數(shù)據(jù)技術(shù)、數(shù)字人文、知識圖譜技術(shù)相結(jié)合,并由此催生了一批圖檔博機(jī)構(gòu)主導(dǎo)的、優(yōu)質(zhì)的數(shù)據(jù)庫。比如英國瓦爾堡研究院(Warburg Institute)的“圖像文獻(xiàn)庫”、普林斯頓大學(xué)(Princeton University)的“中世紀(jì)藝術(shù)索引”(Index of Medieval Art)以及荷蘭的“文化史圖像數(shù)據(jù)庫(ARKYVES)”等[34-36]。在此背景下,我國圖博檔領(lǐng)域在圖像庫的建設(shè)上也有一定的成果,國家圖書館出版社的《民國圖片資源庫》實現(xiàn)了圖片分類、標(biāo)簽、專題、事件等語義層次的描述,但是數(shù)據(jù)庫數(shù)量較少,沒有實現(xiàn)大規(guī)模的數(shù)據(jù)標(biāo)注;中國故宮博物院的數(shù)字文物庫文物照片數(shù)量超過5萬張,涵蓋繪畫、法書、碑帖等25個類目,其描述的元數(shù)據(jù)條目篇名達(dá)到186萬條;上海圖書館《全國報刊索引》將館藏近代報刊中的圖片進(jìn)行挖掘,輔以照片、繪畫、漫畫、手稿等16個類目,建立了圖片數(shù)量多達(dá)百萬級的數(shù)據(jù)庫;“數(shù)字敦煌”是我國進(jìn)行數(shù)字圖像語義描述的典范,不僅詳細(xì)描述了對象元數(shù)據(jù)的屬性特征,同時對其對象的關(guān)聯(lián)關(guān)系也進(jìn)行了詳盡的揭示。
本文運(yùn)用CiteSpace、VOSviewer等可視化工具,對我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究的發(fā)文量、合作網(wǎng)絡(luò)、研究進(jìn)展和下一階段的研究趨勢進(jìn)行了可視化的分析與知識圖譜的展示。研究得出如下四點(diǎn)結(jié)論:首先,我國圖博檔領(lǐng)域圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究的發(fā)文量近幾年呈現(xiàn)逐年遞增的趨勢,說明圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)將成為下一步研究的熱點(diǎn);其次,圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究已經(jīng)形成了一批具有影響力的機(jī)構(gòu)與作者,但無論是機(jī)構(gòu)還是作者之間合作都比較少,因此應(yīng)加強(qiáng)機(jī)構(gòu)之間、作者之間的交流,尤其是博物館、檔案館作為擁有大量數(shù)字圖像資源的責(zé)任主體更應(yīng)該加強(qiáng)與高校、科研機(jī)構(gòu)、圖書館的交流合作;再次,對圖像內(nèi)容的語義化描述與知識建模將是圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)領(lǐng)域的重點(diǎn),目前已經(jīng)形成了一批示范性的、面向具體應(yīng)用領(lǐng)域的語義描述框架與知識挖掘,但是相關(guān)研究尚比較粗淺,比如怎樣在實現(xiàn)標(biāo)準(zhǔn)規(guī)范性的前提下更好地展現(xiàn)特定領(lǐng)域圖像的特性是值得深入探討的問題;最后,數(shù)字人文方興未艾,數(shù)字人文對人文研究的影響已經(jīng)非常顯著,有關(guān)圖像與數(shù)字人文的研究探討眾多,利用關(guān)聯(lián)數(shù)據(jù)、國際圖像互操作框架等數(shù)字人文相關(guān)技術(shù)進(jìn)行的研究已經(jīng)取得了一定進(jìn)展,但數(shù)字圖像資源在人文研究領(lǐng)域的深化運(yùn)用,對知識生產(chǎn)與知識傳播的影響的探討還有待深入和細(xì)化。