李 鈳 王曉光 譚 旭
(武漢大學(xué)信息管理學(xué)院,武漢,430072)
古籍是傳統(tǒng)文化和民族精神的重要載體,同時(shí)反映了特定時(shí)期政治、經(jīng)濟(jì)、軍事、哲學(xué)、文學(xué)、藝術(shù)等多個(gè)領(lǐng)域的成就,具有重大的文化價(jià)值和學(xué)術(shù)研究?jī)r(jià)值。古籍出版工作之于優(yōu)秀文化的傳承與發(fā)展具有重要意義。近年來(lái),在數(shù)字技術(shù)的驅(qū)使下,古籍?dāng)?shù)字出版成為古籍出版領(lǐng)域的新趨勢(shì)。古籍?dāng)?shù)字出版是指出版主體將古籍經(jīng)過(guò)選擇、編輯和數(shù)字化制作后,固化在數(shù)字存儲(chǔ)器或電子閱讀器中復(fù)制傳播,或登載在互聯(lián)網(wǎng)上供多用戶同時(shí)在線免費(fèi)或付費(fèi)瀏覽、下載閱讀,或通過(guò)網(wǎng)絡(luò)以點(diǎn)對(duì)面形式發(fā)送到用戶終端,以供閱讀和使用的一種社會(huì)傳播行為。大量古籍?dāng)?shù)字資源以數(shù)據(jù)庫(kù)形式出版。書目數(shù)據(jù)庫(kù)、影像數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)在內(nèi)的古籍?dāng)?shù)字資源庫(kù)漸成規(guī)模,如中華書局的中華經(jīng)典古籍庫(kù)、愛(ài)如生中國(guó)基本古籍庫(kù)、澳門大學(xué)圖書館古籍影像系統(tǒng)、史語(yǔ)所簡(jiǎn)帛金石資料庫(kù)等。它們一般能夠提供便捷的閱讀、查詢、圖文對(duì)照、文獻(xiàn)征引等服務(wù)。
古籍?dāng)?shù)字資源庫(kù)的建設(shè)深受數(shù)字環(huán)境下古籍研究模式的影響。一方面,古籍研究者對(duì)數(shù)字資源的需求越來(lái)越大。數(shù)字資源可以遠(yuǎn)程訪問(wèn),攜帶、檢索、存儲(chǔ)方便,且數(shù)據(jù)量大;數(shù)字出版還能夠保留古籍的行款與尺寸等原始特征信息,全彩圖片甚至還可以保留載體形式的某些特征,為學(xué)者提供更全面的研究素材。另一方面,數(shù)字技術(shù)的發(fā)展和“數(shù)字人文”的興起為古籍研究帶來(lái)了新的課題和方法。關(guān)聯(lián)數(shù)據(jù)、知識(shí)挖掘、地理信息系統(tǒng)(Geographic Information System,GIS)、知識(shí)組織等技術(shù)和方法越來(lái)越多地應(yīng)用于古籍研究之中??鐧C(jī)構(gòu)、大規(guī)模資源的共享、復(fù)用、整合及知識(shí)發(fā)現(xiàn)已經(jīng)成為該領(lǐng)域的新趨勢(shì)。這是紙本資源所不能支撐的。此外,古籍中包含大量不易識(shí)別的圖畫、印章、少數(shù)民族文字等;且古籍的價(jià)值不僅僅在其所承載的文獻(xiàn)內(nèi)容,還兼有文物、文字兩個(gè)方面的研究?jī)r(jià)值。因此,在眾多古籍?dāng)?shù)字資源中,能夠最大程度還原古籍原貌的圖像資源對(duì)古籍學(xué)者具有重要意義。目前,由于古籍文獻(xiàn)數(shù)量眾多、保存較為分散,不同平臺(tái)在古籍?dāng)?shù)字出版過(guò)程中并未做到著錄標(biāo)準(zhǔn)和技術(shù)規(guī)范的統(tǒng)一。數(shù)據(jù)之間無(wú)法順利實(shí)現(xiàn)數(shù)據(jù)交換和格式轉(zhuǎn)換,圖像資源也存在傳輸延遲或下載受限等問(wèn)題,阻礙了異構(gòu)資源的交換和使用。部分古籍資源很難在更大范圍內(nèi)被研究者共享和重用,成為“孤島”。為了應(yīng)對(duì)古籍?dāng)?shù)字資源的“孤島”問(wèn)題,增強(qiáng)相關(guān)資源的開(kāi)放性、規(guī)范性和共享性,支持?jǐn)?shù)字人文背景下的古籍圖像研究,一些機(jī)構(gòu)利用國(guó)際圖像互操作框架(International Image Interoperability Framework,IIIF)相關(guān)技術(shù)與工具進(jìn)行古籍出版實(shí)踐。
國(guó)際圖像互操作框架是一項(xiàng)通用的國(guó)際標(biāo)準(zhǔn),也是一個(gè)由圖書館、博物館、檔案館、軟件公司和其他組織組成的國(guó)際社區(qū)。2015年,英國(guó)圖書館、新西蘭國(guó)家圖書館、歐盟數(shù)字圖書館(Europeana)等29個(gè)非營(yíng)利機(jī)構(gòu)共同成立國(guó)際圖像互操作框架聯(lián)盟,旨在確保全球圖像存儲(chǔ)的互操作性和可獲取性。國(guó)際圖像互操作框架為實(shí)現(xiàn)數(shù)字圖像存儲(chǔ)庫(kù)之間圖像傳輸?shù)幕ゲ僮鞫x了一組共享的應(yīng)用程序接口(Application Programming Interface,API)規(guī)范,包括圖像應(yīng)用程序接口、呈現(xiàn)應(yīng)用程序接口、內(nèi)容檢索應(yīng)用程序接口、認(rèn)證應(yīng)用程序接口以及變更發(fā)現(xiàn)應(yīng)用程序接口,能夠幫助檔案館、圖書館和博物館充分利用其數(shù)字化收藏,使圖像資源的開(kāi)發(fā)和共享更為快捷和便利,同時(shí)也為用戶提供了一種在網(wǎng)絡(luò)上查看、操作、比較和注釋數(shù)字圖像的統(tǒng)一方法。
目前,古籍?dāng)?shù)字出版領(lǐng)域在國(guó)際圖像互操作框架應(yīng)用方面已經(jīng)有一定的經(jīng)驗(yàn),但相關(guān)調(diào)查和研究較少,其應(yīng)用現(xiàn)狀和發(fā)展前景尚不明晰。因此,本文試圖探討以下幾個(gè)問(wèn)題。當(dāng)前基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字出版實(shí)踐狀況如何?它們主要針對(duì)哪些類型的古籍資源?具體出版形式為何?為用戶提供了哪些功能?國(guó)際圖像互操作框架應(yīng)用于古籍?dāng)?shù)字出版具有什么優(yōu)勢(shì),存在哪些挑戰(zhàn)?為了明確這些問(wèn)題,本文擬采用網(wǎng)絡(luò)調(diào)查法和案例分析法,對(duì)幾個(gè)國(guó)際圖像互操作框架古籍資源庫(kù)的實(shí)踐情況進(jìn)行梳理和總結(jié),以期為我國(guó)該領(lǐng)域的未來(lái)發(fā)展帶來(lái)一些啟發(fā)。
研究采用網(wǎng)絡(luò)調(diào)查法與案例分析法,綜合考慮國(guó)際圖像互操作框架古籍資源庫(kù)在資源主題、出版形式、實(shí)現(xiàn)功能等方面表現(xiàn)出的不同特點(diǎn),選取日本大正新修大藏經(jīng)圖像數(shù)據(jù)庫(kù)、梵蒂岡圖書館館藏文獻(xiàn)數(shù)字化計(jì)劃(DigiVatLib)、日本典籍?dāng)?shù)據(jù)集、瑞士虛擬手稿圖書館(e-codices)以及法國(guó)的圣經(jīng)文獻(xiàn)項(xiàng)目(Biblissima)為代表樣本,對(duì)國(guó)際圖像互操作框架在古籍?dāng)?shù)字出版中的應(yīng)用情況進(jìn)行總結(jié)和比較,見(jiàn)表1。
表1 資源庫(kù)基本信息
國(guó)際圖像互操作框架古籍?dāng)?shù)字資源庫(kù)在資源主題和規(guī)模上特色鮮明,形成了兩種典型的出版形式,并能夠?yàn)橛脩籼峁┌▓D像查看、對(duì)比及注釋、資源檢索、資源策展在內(nèi)的豐富功能。
國(guó)際圖像互操作框架古籍?dāng)?shù)字資源庫(kù)以早期手稿或者包含豐富插圖的典籍為主,能夠反映一定時(shí)期的文化特征;而以國(guó)際圖像互操作框架圖像形式展現(xiàn)古籍的原本風(fēng)貌,可為學(xué)者的研究和考證提供更可靠準(zhǔn)確的信息。相較而言,大正新修大藏經(jīng)圖像數(shù)據(jù)庫(kù)的主題性和學(xué)科性更強(qiáng),其余調(diào)研對(duì)象則在資源選擇上更具綜合性、規(guī)模也更大。大正新修大藏經(jīng)圖像數(shù)據(jù)庫(kù)是大正新修大藏經(jīng)文本數(shù)據(jù)庫(kù)委員會(huì)以佛教典籍《大正藏》為基礎(chǔ)建立的,共有12卷,包含大量佛教圖像。梵蒂岡圖書館館藏文獻(xiàn)數(shù)字化計(jì)劃、瑞士虛擬手稿圖書館和法國(guó)的圣經(jīng)文獻(xiàn)項(xiàng)目都以手稿資源為主。其中,梵蒂岡圖書館館藏文獻(xiàn)數(shù)字化計(jì)劃是梵蒂岡圖書館的數(shù)字化項(xiàng)目,旨在對(duì)館藏中從中世紀(jì)直到文藝復(fù)興時(shí)期的大約8萬(wàn)件手稿進(jìn)行數(shù)字化;瑞士虛擬手稿圖書館提供瑞士地區(qū)中世紀(jì)和早期現(xiàn)代手稿的免費(fèi)在線訪問(wèn)服務(wù),目前已經(jīng)發(fā)布97個(gè)圖書館和私人收藏的2539份手稿;法國(guó)的圣經(jīng)文獻(xiàn)項(xiàng)目為25個(gè)數(shù)字圖書館中符合國(guó)際圖像互操作框架標(biāo)準(zhǔn)的1800年前的手稿和珍本構(gòu)建了一個(gè)實(shí)驗(yàn)性的跨機(jī)構(gòu)搜索和發(fā)現(xiàn)平臺(tái)。日本典籍?dāng)?shù)據(jù)集則是由日本國(guó)文學(xué)研究資料館和日本人文科學(xué)開(kāi)放數(shù)據(jù)中心(Center for Open Data in the Humanities,CODH)合作開(kāi)放的數(shù)據(jù)集,主要提供國(guó)文學(xué)研究資料館所保存的資源,包括文學(xué)、理學(xué)、工業(yè)、醫(yī)學(xué)等多學(xué)科典籍3126件。這些資源庫(kù)的建設(shè)多以項(xiàng)目為依托、在各類資源存儲(chǔ)機(jī)構(gòu)和基金會(huì)支持下實(shí)施和開(kāi)展,同時(shí)還涉及與其他資源存儲(chǔ)機(jī)構(gòu)、行業(yè)協(xié)會(huì)、數(shù)字技術(shù)公司以及高校學(xué)者的合作,實(shí)現(xiàn)了資源、技術(shù)、基礎(chǔ)保障與知識(shí)體系的融合互補(bǔ)。
由于目標(biāo)定位不同、主題各異,各機(jī)構(gòu)在古籍資源來(lái)源的選擇上也具有一定的差異,并形成了“館藏資源的數(shù)字出版”“跨機(jī)構(gòu)資源的數(shù)字出版”兩種形式。一是圖書館、博物館、檔案館等古籍存儲(chǔ)機(jī)構(gòu)越來(lái)越多地在其館藏古籍資源的數(shù)字化建設(shè)工作中使用國(guó)際圖像互操作框架技術(shù)與工具。在具體實(shí)踐中,古籍紙本資源經(jīng)數(shù)字化掃描得到大量高分辨率的數(shù)字圖像,館藏和出版機(jī)構(gòu)在此基礎(chǔ)上有選擇地對(duì)這些圖像資源實(shí)施國(guó)際圖像互操作框架核心應(yīng)用程序接口和其他擴(kuò)展應(yīng)用程序接口,實(shí)現(xiàn)圖像的標(biāo)準(zhǔn)化處理與發(fā)布,并建成相應(yīng)的存儲(chǔ)庫(kù)或門戶網(wǎng)站。例如梵蒂岡圖書館館藏文獻(xiàn)數(shù)字化計(jì)劃以及日本典籍?dāng)?shù)據(jù)集都采用了這種形式發(fā)布古籍圖像資源。二是跨機(jī)構(gòu)古籍資源的數(shù)字出版,指以某個(gè)地區(qū)或某個(gè)主題為納入標(biāo)準(zhǔn),對(duì)多個(gè)機(jī)構(gòu)的相關(guān)古籍資源進(jìn)行集成式網(wǎng)絡(luò)發(fā)布。代表性的項(xiàng)目有瑞士虛擬手稿圖書館和圣經(jīng)文獻(xiàn)項(xiàng)目門戶網(wǎng)站。這兩個(gè)項(xiàng)目分別代表了這種出版形式下兩種不同的解決方案:前者是收集瑞士地區(qū)所有手稿存儲(chǔ)機(jī)構(gòu)的紙本資源進(jìn)行數(shù)字化處理,并利用國(guó)際圖像互操作框架技術(shù)實(shí)現(xiàn)數(shù)字圖像和元數(shù)據(jù)的統(tǒng)一發(fā)布;后者則是對(duì)各機(jī)構(gòu)存儲(chǔ)庫(kù)或門戶網(wǎng)站中開(kāi)放的符合國(guó)際圖像互操作框架標(biāo)準(zhǔn)的數(shù)字資源進(jìn)行統(tǒng)一的元數(shù)據(jù)規(guī)范化處理和資源集成。大正藏圖像數(shù)據(jù)庫(kù)則較為特殊,其以大藏出版株式會(huì)社已出版的紙本《大藏經(jīng)》為基礎(chǔ)建成,以數(shù)字化方式實(shí)現(xiàn)這一佛教典籍的再出版,也確保了相關(guān)研究的更大范圍傳播和連續(xù)性。
國(guó)際圖像互操作框架為終端用戶提供了豐富的交互功能。除應(yīng)用程序接口規(guī)范外,這些功能的實(shí)現(xiàn)還有賴于圖像瀏覽器這樣的工具支持。目前已經(jīng)有很多符合國(guó)際圖像互操作框架標(biāo)準(zhǔn)的圖像瀏覽器被開(kāi)發(fā)出來(lái)并投入使用,最常見(jiàn)的有Mirador瀏覽器、Universal Viewer瀏覽器、TIFY瀏覽器、策展瀏覽器(IIIF Curation Viewer)等。在不同瀏覽器的支持下,古籍資源庫(kù)的基礎(chǔ)功能可以分為圖像查看、對(duì)比及注釋、資源檢索以及資源策展等,見(jiàn)表2。
表2 資源庫(kù)基本功能
3.3.1 圖像查看
國(guó)際圖像互操作框架古籍資源庫(kù)都配置了默認(rèn)的國(guó)際圖像互操作框架圖像瀏覽器;同時(shí),其中的內(nèi)容對(duì)象都具有國(guó)際圖像互操作框架清單(IIIF manifests)鏈接,用戶可以自行將這一鏈接復(fù)制到不同的圖像瀏覽器中對(duì)古籍圖像和元數(shù)據(jù)信息進(jìn)行查看和操作。高分辨率圖像的深度縮放是國(guó)際圖像互操作框架圖像瀏覽器的基本功能,能夠?qū)?shù)倍放大的圖像局部較為清晰地顯示出來(lái),方便用戶對(duì)古籍做更細(xì)致全面的觀察。此外,這些資源庫(kù)還包含古籍資源的元數(shù)據(jù)描述,為用戶提供關(guān)于古籍資源的標(biāo)題、作者、來(lái)源等基本信息內(nèi)容。這些內(nèi)容同樣可以通過(guò)圖像瀏覽器進(jìn)行展示。除了縮放和信息展示,用戶還可以利用圖像瀏覽器對(duì)圖像做旋轉(zhuǎn)、全屏顯示、多視圖查看等操作。大正新修大藏經(jīng)藏圖像數(shù)據(jù)庫(kù)、瑞士虛擬手稿圖書館、圣經(jīng)文獻(xiàn)項(xiàng)目門戶網(wǎng)站還支持用戶通過(guò)Mirador瀏覽器、TIFY瀏覽器等對(duì)圖像的亮度、對(duì)比度、飽和度等作調(diào)節(jié)。
3.3.2 對(duì)比及注釋
支持圖像間的對(duì)比和為圖像添加注釋是Mirador瀏覽器的特色功能,可為用戶進(jìn)一步研究圖像內(nèi)容提供幫助。一方面,Mirador瀏覽器支持在已有圖像視窗的上、下、左、右4個(gè)方向添加新的視窗插槽,使來(lái)自不同清單的國(guó)際圖像互操作框架標(biāo)準(zhǔn)圖像可以并排展示。如圣經(jīng)文獻(xiàn)項(xiàng)目選取部分國(guó)際圖像互操作框架圖像資源進(jìn)行手稿比較展示實(shí)驗(yàn),對(duì)不同版本《圣經(jīng)》中的同一插圖做標(biāo)注與對(duì)比。另一方面,Mirador瀏覽器通過(guò)插件為用戶提供注釋創(chuàng)建功能。用戶可以在圖像的任意區(qū)域添加注釋,解釋圖像內(nèi)容。在此基礎(chǔ)上,大正新修大藏經(jīng)圖像數(shù)據(jù)庫(kù)已經(jīng)為圖像添加了20786個(gè)注釋,詳細(xì)標(biāo)注了佛像各個(gè)部分的特征,如面相、寶冠、耳飾等;梵蒂岡圖書館館藏文獻(xiàn)數(shù)字化計(jì)劃則繼續(xù)開(kāi)展基于國(guó)際圖像互操作框架的中世紀(jì)手稿主題路徑展覽項(xiàng)目,對(duì)部分手稿做了文本轉(zhuǎn)錄和評(píng)論注釋,展示了國(guó)際圖像互操作框架注釋功能的潛力。也有資源庫(kù)如瑞士虛擬手稿圖書館自己開(kāi)發(fā)注釋工具,注冊(cè)用戶可以使用該工具為手稿添加注釋、參考書目以及對(duì)已有注釋作評(píng)論。
3.3.3 資源檢索
針對(duì)古籍資源的發(fā)現(xiàn),國(guó)際圖像互操作框架古籍資源庫(kù)提供了一般檢索和基于注釋的檢索兩種檢索方案。一方面,對(duì)于基礎(chǔ)古籍資源的檢索,除基本的字段檢索、分類檢索外,部分資源庫(kù)做了進(jìn)一步處理。如瑞士虛擬手稿圖書館根據(jù) TEI-P5 標(biāo)準(zhǔn)構(gòu)建元數(shù)據(jù)并將元數(shù)據(jù)信息分配到各個(gè)字段,使用戶能夠通過(guò)元數(shù)據(jù)對(duì)手稿進(jìn)行集中搜索;圣經(jīng)文獻(xiàn)項(xiàng)目對(duì)來(lái)自25個(gè)數(shù)字圖書館的一些元數(shù)據(jù)元素進(jìn)行協(xié)調(diào)、聚類和規(guī)范化,以便執(zhí)行強(qiáng)大的跨機(jī)構(gòu)搜索和發(fā)現(xiàn)功能。另一方面,為了方便用戶注釋資源內(nèi)容,還提供了基于注釋內(nèi)容的檢索。如大正新修大藏經(jīng)圖像數(shù)據(jù)庫(kù)和梵蒂岡圖書館主題路徑展覽項(xiàng)目將注釋內(nèi)容以標(biāo)簽形式嵌入圖像,用戶可以通過(guò)點(diǎn)擊標(biāo)簽對(duì)包含該標(biāo)簽的圖像進(jìn)行檢索。
3.3.4 資源策展
國(guó)際圖像互操作框架技術(shù)為數(shù)字資源策展提供了更便捷的工具。用戶可以直接在國(guó)際圖像互操作框架圖像瀏覽器中使用異構(gòu)資源創(chuàng)建動(dòng)態(tài)交互式數(shù)字展覽。日本人文科學(xué)開(kāi)放數(shù)據(jù)中心還開(kāi)發(fā)了專門的圖像策展工具IIIF Curation Viewer,允許用戶從多個(gè)材料中剪切、收集和按任意順序查看圖像,并以日本典籍?dāng)?shù)據(jù)集為基礎(chǔ)展開(kāi)一系列主題策劃和實(shí)踐,其中最典型的是從《奈良繪本》中摘取人物的面部特征形成奈良畫冊(cè)臉譜數(shù)據(jù)集。這為藝術(shù)史研究中以人物面部特征比較為中心的風(fēng)格分析提供了基礎(chǔ)數(shù)據(jù)。目前,日本人文科學(xué)開(kāi)放數(shù)據(jù)中心也已經(jīng)利用這些人臉畫像進(jìn)行了一些初步的分析研究。圣經(jīng)文獻(xiàn)項(xiàng)目也基于該功能進(jìn)行了虛擬重建演示實(shí)驗(yàn),包括通過(guò)Mirador瀏覽器對(duì)分散的書稿進(jìn)行虛擬重組、將被剪切的插圖重新虛擬定位到原書稿上,或者以某個(gè)人物相關(guān)的手稿為主題創(chuàng)建虛擬圖書館等。
除上述功能,圖片下載、社交媒體分享、多語(yǔ)言切換等也是古籍圖像資源庫(kù)的常見(jiàn)功能。也有資源庫(kù)增加了其他一些功能來(lái)適配豐富的用戶需求,如大正新修大藏經(jīng)藏圖像數(shù)據(jù)庫(kù)可以鏈接到電子佛教辭典(Digital Dictionary of Buddhism,DDB),為用戶理解佛教術(shù)語(yǔ)提供工具;圣經(jīng)文獻(xiàn)項(xiàng)目允許用戶挑選圖像加入個(gè)人收藏,并將所選資源生成新的國(guó)際圖像互操作框架集合或輸出為逗號(hào)分隔值(Comma-Separated Values,CSV)格式;日本典籍?dāng)?shù)據(jù)集則允許用戶單獨(dú)下載古籍書目數(shù)據(jù)、全文文本數(shù)據(jù)以及標(biāo)注數(shù)據(jù)。
國(guó)際圖像互操作框架目前在國(guó)外古籍?dāng)?shù)字出版領(lǐng)域已經(jīng)得到了初步應(yīng)用并取得了相應(yīng)成果,在古籍資源的整合與重用、用戶交互與智慧應(yīng)用中展現(xiàn)出了價(jià)值和優(yōu)勢(shì)。但同時(shí),這一出版形式也仍舊面臨著細(xì)粒度內(nèi)容發(fā)現(xiàn)、知識(shí)組織和語(yǔ)義關(guān)聯(lián)以及行業(yè)服務(wù)等方面的問(wèn)題和挑戰(zhàn)。
國(guó)際圖像互操作框架技術(shù)和工具的應(yīng)用增強(qiáng)了資源的開(kāi)放性和互操作性,促進(jìn)了古籍資源的整合和重用。一方面,基于國(guó)際圖像互操作框架的實(shí)踐打破了各機(jī)構(gòu)古籍資源存儲(chǔ)的“孤島”狀態(tài),既有利于各機(jī)構(gòu)對(duì)館藏古籍資源的數(shù)字化建設(shè)和開(kāi)放,也為跨地區(qū)、跨機(jī)構(gòu)古籍資源的訪問(wèn)和集成提供了解決方案,豐富了古籍?dāng)?shù)字出版的內(nèi)容和形式,加速了珍本古籍的開(kāi)放和流散古籍的數(shù)字化回歸。例如,瑞士虛擬手稿圖書館致力于對(duì)瑞士地區(qū)所有的手稿進(jìn)行整合并初見(jiàn)成效。另一方面,由于符合國(guó)際圖像互操作框架標(biāo)準(zhǔn)的圖像是分布式保存的,且可以通過(guò)統(tǒng)一資源定位 符(Universal Resource Locator,URL) 統(tǒng)一調(diào)用,無(wú)需多次下載和存儲(chǔ),這就大大減少了圖像傳遞過(guò)程中的圖像受損問(wèn)題,保證了古籍圖像的質(zhì)量和可重用性,為實(shí)現(xiàn)“一次發(fā)布,多次使用”、大規(guī)模的資源共享、復(fù)用、整合和發(fā)現(xiàn)提供了便利。相應(yīng)地,在古籍研究中手稿、拓片、輿圖、書畫以及包含古文字和插圖的古籍原件中蘊(yùn)含著不可取代的價(jià)值,需要以高分辨率圖像的形式呈現(xiàn)。國(guó)際圖像互操作框架能夠?yàn)檫@些古籍圖像的共享和重用提供高質(zhì)量的技術(shù)環(huán)境和資源交換條件,最大程度還原和再現(xiàn)古籍原件的細(xì)節(jié),擴(kuò)展古籍圖像研究的基礎(chǔ)資源與數(shù)據(jù)。
但是,就資源類型和主題而言,現(xiàn)有的國(guó)際圖像互操作框架的古籍圖像資源庫(kù)多為綜合型資源庫(kù),且未對(duì)圖像做進(jìn)一步分類,主題性和學(xué)科性不強(qiáng),不利于細(xì)分領(lǐng)域用戶對(duì)資源的搜尋與獲取。例如,梵蒂岡圖書館藏文獻(xiàn)數(shù)字化計(jì)劃僅以手稿名稱首字母作為導(dǎo)航;圣經(jīng)文獻(xiàn)項(xiàng)目按照收藏機(jī)構(gòu)對(duì)手稿做分類;日本典籍?dāng)?shù)據(jù)集根據(jù)館藏編號(hào)列出了詳細(xì)書目,但并未做學(xué)科分類和主題區(qū)分,用戶很難在這些資源庫(kù)中進(jìn)行更有針對(duì)性的古籍資源發(fā)現(xiàn)。此外,這些古籍資源庫(kù)也沒(méi)有針對(duì)圖像注釋部署內(nèi)容搜索應(yīng)用程序接口,而是通過(guò)標(biāo)簽嵌入等形式對(duì)注釋內(nèi)容做檢索,難以實(shí)現(xiàn)在圖像瀏覽器內(nèi)部的一站式檢索,而古籍圖像中文本內(nèi)容的檢索也未見(jiàn)有相關(guān)實(shí)踐,阻礙了古籍內(nèi)容層面更細(xì)粒度的知識(shí)發(fā)現(xiàn)。
國(guó)際圖像互操作框架技術(shù)提升了古籍資源整合和重用效率,推動(dòng)了基于大規(guī)模資源的跨學(xué)科研究。古籍資源庫(kù)采用不同的國(guó)際圖像互操作框架圖像瀏覽器展示古籍圖像資源,并利用瀏覽器的查看、對(duì)比、注釋、檢索、策展等功能增強(qiáng)用戶與古籍圖像的交互,為用戶對(duì)古籍圖像的初步探索提供工具和范例,在一定程度上可揭示古籍圖像的價(jià)值,為古籍圖像研究提供方向,如大正新修大藏經(jīng)圖像數(shù)據(jù)庫(kù)對(duì)佛像的標(biāo)注可以為其內(nèi)涵、特征、背景、思想等的鑒定打下基礎(chǔ)。此外,國(guó)際圖像互操作框架跟數(shù)字人文技術(shù)與方法的結(jié)合能夠進(jìn)一步促進(jìn)圖像內(nèi)容研究與知識(shí)發(fā)現(xiàn),如:結(jié)合光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)和關(guān)聯(lián)數(shù)據(jù)對(duì)更細(xì)粒度的圖像文本內(nèi)容進(jìn)行識(shí)別;對(duì)文字和圖像進(jìn)行分割,結(jié)合圖像語(yǔ)義標(biāo)注為用戶帶來(lái)新的研究模式,結(jié)合知識(shí)圖譜為知識(shí)發(fā)現(xiàn)帶來(lái)新的解決方案等。
在大數(shù)據(jù)思維和數(shù)字人文興起的趨勢(shì)下,技術(shù)驅(qū)動(dòng)研究、數(shù)據(jù)驅(qū)動(dòng)研究已成為人文學(xué)科發(fā)展的一個(gè)方向。然而,目前基于國(guó)際圖像互操作框架的古籍資源庫(kù)在功能上往往停留在資源開(kāi)放以及基于國(guó)際圖像互操作框架功能的基礎(chǔ)實(shí)踐階段。大部分古籍資源的語(yǔ)義特征還缺乏深度描述和揭示,只著眼于簡(jiǎn)單的注釋和關(guān)聯(lián)資源的羅列,資源之間語(yǔ)義關(guān)聯(lián)不足,古籍知識(shí)的細(xì)粒度組織與發(fā)現(xiàn)問(wèn)題仍待突破,應(yīng)用場(chǎng)景也還不夠豐富,難以支撐大規(guī)模古籍資源與數(shù)據(jù)的智慧化應(yīng)用。
在數(shù)字化成為古籍出版行業(yè)主流趨勢(shì)的背景下,國(guó)際圖像互操作框架為該領(lǐng)域帶來(lái)了新的發(fā)展機(jī)遇?;趪?guó)際圖像互操作框架的古籍?dāng)?shù)字出版涉及古籍出版機(jī)構(gòu)、圖書館等古籍資源存儲(chǔ)機(jī)構(gòu)以及數(shù)字技術(shù)機(jī)構(gòu)等多方力量的合作。整合跨機(jī)構(gòu)的古籍圖像資源和與之相關(guān)聯(lián)的圖書、音頻、視頻等多媒體資源,形成古籍資源共建共享新模式,從整體上提升古籍?dāng)?shù)字出版的效率;此外,國(guó)際圖像互操作框架認(rèn)證應(yīng)用程序接口的使用也在一定程度上解決了古籍資源的版權(quán)問(wèn)題。作為這一出版模式的最終產(chǎn)品,基于國(guó)際圖像互操作框架的古籍資源庫(kù)融合內(nèi)容與工具兩大屬性,既是古籍圖書閱讀平臺(tái),促進(jìn)傳統(tǒng)文化傳播,又是集多種功能于一體的服務(wù)平臺(tái),方便用戶進(jìn)行資源探索、古籍教學(xué)、學(xué)術(shù)研究等活動(dòng),實(shí)現(xiàn)了古籍出版產(chǎn)品和知識(shí)服務(wù)的創(chuàng)新。
基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字出版順應(yīng)出版業(yè)融合發(fā)展趨勢(shì),有利于古籍出版物由內(nèi)容產(chǎn)品向多元產(chǎn)品的轉(zhuǎn)型。但是,這一出版模式還處于起步階段。我國(guó)對(duì)國(guó)際圖像互操作框架的研究和實(shí)踐也較少,僅有少部分項(xiàng)目嘗試使用國(guó)際圖像互操作框架來(lái)揭示圖像資源,包括復(fù)旦大學(xué)“印譜虛擬圖書館”、華東師范大學(xué)“中國(guó)近現(xiàn)代書畫印本數(shù)據(jù)庫(kù)”、上海圖書館“家譜知識(shí)服務(wù)平臺(tái)”、中國(guó)社科院“抗日戰(zhàn)爭(zhēng)與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺(tái)”以及我國(guó)臺(tái)灣地區(qū)“中央研究院”開(kāi)發(fā)的“居延漢簡(jiǎn)資料庫(kù)”等。這些項(xiàng)目是國(guó)際圖像互操作框架與圖像出版相結(jié)合的初步探索。出版過(guò)程中涉及的標(biāo)準(zhǔn)和規(guī)范問(wèn)題、合作與規(guī)劃問(wèn)題、資金問(wèn)題、用戶的需求問(wèn)題等,還需要反復(fù)討論與嘗試,以推動(dòng)國(guó)際圖像互操作框架在行業(yè)中的應(yīng)用與發(fā)展。
國(guó)際圖像互操作框架在古籍?dāng)?shù)字出版中仍有很大應(yīng)用和發(fā)展空間。未來(lái)這一領(lǐng)域還需繼續(xù)加強(qiáng)內(nèi)容建設(shè)、深化國(guó)際圖像互操作框架應(yīng)用和相關(guān)研究,并逐步提升行業(yè)規(guī)范與服務(wù)水平。
基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字出版首先要著眼于內(nèi)容建設(shè),保證古籍資源的豐富性和可發(fā)現(xiàn)性。我國(guó)古籍資源類型和數(shù)量豐富,橫跨全國(guó)眾多省市和地區(qū),涉及多個(gè)學(xué)科領(lǐng)域。出版機(jī)構(gòu)可以從學(xué)科特色、地區(qū)特色或者館藏資源特色出發(fā),篩選適合IIIF標(biāo)準(zhǔn)的古籍資源,在此基礎(chǔ)上設(shè)定目標(biāo)、選擇合適的出版形式,以項(xiàng)目為依托進(jìn)行機(jī)構(gòu)館藏資源的數(shù)字化建設(shè)或者跨機(jī)構(gòu)資源集成,創(chuàng)建不同類型、不同規(guī)模、不同主題的古籍圖像資源庫(kù),從而豐富古籍教學(xué)和學(xué)術(shù)研究的基礎(chǔ)資料、提升古籍資源的價(jià)值、促進(jìn)更大范圍的交流與協(xié)作。例如,建設(shè)以佛教典籍、中醫(yī)藥古籍、古建筑典籍、譜牒、輿圖為主題的專題資源庫(kù);開(kāi)發(fā)寫本文獻(xiàn)資源庫(kù),能夠反映地域和朝代文化特點(diǎn)的刻本資源庫(kù),資源存儲(chǔ)機(jī)構(gòu)的特藏古籍資源庫(kù)等。此外,為便于資源發(fā)現(xiàn),來(lái)自不同機(jī)構(gòu)的古籍資源的元數(shù)據(jù)信息要盡量完善和統(tǒng)一,并以此為基礎(chǔ)實(shí)現(xiàn)元數(shù)據(jù)字段檢索、古籍收藏機(jī)構(gòu)地圖顯示、古籍朝代時(shí)間線導(dǎo)航等,古籍注釋內(nèi)容的檢索則可以通過(guò)嵌入標(biāo)簽、部署國(guó)際圖像互操作框架內(nèi)容檢索應(yīng)用程序接口實(shí)現(xiàn),還可以根據(jù)標(biāo)簽或注釋內(nèi)容對(duì)古籍資源做更細(xì)粒度的分類。
出版機(jī)構(gòu)在進(jìn)行國(guó)際圖像互操作框架古籍資源庫(kù)建設(shè)和服務(wù)時(shí),既要關(guān)注國(guó)際圖像互操作框架基礎(chǔ)功能的實(shí)現(xiàn)與擴(kuò)展,也要關(guān)注人文學(xué)者的學(xué)術(shù)研究需求。一方面,要為用戶選擇合適的圖像瀏覽器,增強(qiáng)古籍資源的可用性,必要時(shí)可進(jìn)行一些展示實(shí)驗(yàn),不斷拓展IIIF的應(yīng)用場(chǎng)景。如通過(guò)圖像對(duì)比功能對(duì)不同版本的古籍做徇證分析,對(duì)不同派別的書畫或古籍中的版畫、插圖做風(fēng)格分析;利用策展工具對(duì)古籍散頁(yè)、插圖甚至單字進(jìn)行整合和重組,發(fā)布破損古籍的保存和修復(fù)過(guò)程以供其他學(xué)者參考;基于注釋功能做古籍文本內(nèi)容轉(zhuǎn)錄,引用并添加不同版本的注疏,結(jié)合眾包技術(shù)實(shí)現(xiàn)大眾標(biāo)注等。另一方面,要明確該領(lǐng)域的研究需求與挑戰(zhàn),結(jié)合相關(guān)技術(shù)繼續(xù)深化符合國(guó)際圖像互操作框架的古籍資源的應(yīng)用,在知識(shí)單元層次上,提供能夠?qū)崿F(xiàn)用戶知識(shí)價(jià)值增值的知識(shí)服務(wù)。古籍圖像研究往往需要深入挖掘內(nèi)部知識(shí)、關(guān)聯(lián)外部資源。因此,要在利用國(guó)際圖像互操作框架呈現(xiàn)和發(fā)布的古籍圖像資源的基礎(chǔ)上,進(jìn)一步依托語(yǔ)義描述、本體建模、數(shù)據(jù)關(guān)聯(lián)等技術(shù),對(duì)其進(jìn)行數(shù)據(jù)層級(jí)的細(xì)粒度標(biāo)引、深層次挖掘與闡釋,揭示古籍中蘊(yùn)含的人、事、時(shí)、地、物等語(yǔ)義信息,并與中國(guó)歷代人物傳記資料庫(kù)(China Biographical Database,CBDB)、全球地理數(shù)據(jù)庫(kù)(GeoNames)、網(wǎng)絡(luò)百科全書(wikipedia)等進(jìn)行實(shí)體關(guān)聯(lián),形成機(jī)器可理解并可采取行動(dòng)的、一源多用、高效運(yùn)作的數(shù)據(jù)。同時(shí),要充分調(diào)用和挖掘古籍圖像資源庫(kù)的數(shù)據(jù)和知識(shí)建立多個(gè)系統(tǒng),在數(shù)字人文技術(shù)體系和研究方法的支撐下,提供能夠支持跨學(xué)科交叉研究的、更智慧化的數(shù)字出版語(yǔ)義服務(wù),實(shí)現(xiàn)古籍知識(shí)體系的全方位展示以及基于用戶知識(shí)需求的自動(dòng)解答。如基于知識(shí)圖譜和機(jī)器學(xué)習(xí)的古籍知識(shí)推薦與問(wèn)答系統(tǒng),基于地理信息系統(tǒng)的古籍地理信息時(shí)空分析系統(tǒng),基于社會(huì)網(wǎng)絡(luò)關(guān)系工具的歷史人物關(guān)系分析系統(tǒng)等,將古籍圖像資源逐漸建設(shè)成為智慧數(shù)據(jù),以適應(yīng)數(shù)智時(shí)代不斷拓展的人文研究。
基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字出版要集結(jié)行業(yè)各方力量,為相關(guān)項(xiàng)目的順利進(jìn)行提供保障。一方面,基于國(guó)際圖像互操作框架的古籍圖像資源數(shù)字化出版需要打通古籍資源數(shù)字化處理、技術(shù)實(shí)施、圖像發(fā)布、服務(wù)開(kāi)放的整個(gè)流程。其中,古籍資源的數(shù)字化處理是數(shù)字出版的基礎(chǔ),為避免該階段資源短缺、格式不統(tǒng)一、數(shù)據(jù)不規(guī)范等問(wèn)題對(duì)后續(xù)國(guó)際圖像互操作框架的實(shí)施造成障礙,有必要建立健全古籍資源建設(shè)的統(tǒng)一標(biāo)準(zhǔn)規(guī)范,如數(shù)字化技術(shù)標(biāo)準(zhǔn)、古籍分類標(biāo)準(zhǔn)、圖像處理標(biāo)準(zhǔn)、元數(shù)據(jù)描述標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)等。同時(shí),行業(yè)協(xié)會(huì)或相關(guān)部門可以通過(guò)政策引導(dǎo)、機(jī)制調(diào)控、流程監(jiān)督、資金投放,在資源匯總、數(shù)字技術(shù)集成、資源發(fā)布平臺(tái)管理上發(fā)揮作用,優(yōu)化古籍?dāng)?shù)字出版路徑。另一方面,可以建立起出版領(lǐng)域多元主體間聯(lián)合互動(dòng)機(jī)制,集結(jié)出版機(jī)構(gòu)、古籍資源存儲(chǔ)機(jī)構(gòu)、數(shù)字技術(shù)機(jī)構(gòu)的人員以及古籍、計(jì)算機(jī)、圖情檔領(lǐng)域的專家學(xué)者建立專業(yè)團(tuán)隊(duì),方便整體調(diào)研和把握用戶需求、厘清出版流程和思路、解讀項(xiàng)目主題、克服技術(shù)難點(diǎn),從而為基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字出版項(xiàng)目明確資源和服務(wù)建設(shè)方向。此外,也要及時(shí)跟蹤國(guó)際圖像互操作框架聯(lián)盟以及國(guó)際上特色項(xiàng)目的發(fā)展動(dòng)態(tài),借鑒成功經(jīng)驗(yàn)和先進(jìn)成果,不斷完善建設(shè)規(guī)劃,將基于國(guó)際圖像互操作框架的古籍資源庫(kù)打造成多元化、智能化、個(gè)性化的出版產(chǎn)品。
本文圍繞古籍?dāng)?shù)字出版中的圖像資源問(wèn)題,通過(guò)網(wǎng)絡(luò)調(diào)研和案例分析總結(jié)基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字出版實(shí)踐特點(diǎn)。結(jié)果顯示,基于國(guó)際圖像互操作框架的古籍?dāng)?shù)字資源庫(kù)多為綜合型資源庫(kù),以早期手稿或者包含豐富插圖的典籍為主,主要以“館藏資源的數(shù)字出版”“跨機(jī)構(gòu)資源的數(shù)字出版”兩種形式進(jìn)行出版,能夠提供圖像查看、對(duì)比及注釋、資源檢索以及資源策展多種功能。國(guó)際圖像互操作框架在古籍資源的整合與重用、用戶交互與智慧應(yīng)用以及古籍出版轉(zhuǎn)型中都體現(xiàn)出了一定的價(jià)值和優(yōu)勢(shì),同時(shí)也面臨著細(xì)粒度內(nèi)容發(fā)現(xiàn)、知識(shí)組織和語(yǔ)義關(guān)聯(lián)以及行業(yè)服務(wù)等方面的問(wèn)題和挑戰(zhàn)。
國(guó)際圖像互操作框架技術(shù)與古籍圖像發(fā)布和服務(wù)建設(shè)的有效結(jié)合,既能實(shí)現(xiàn)古籍文獻(xiàn)的長(zhǎng)期保存與全面共享,又能滿足數(shù)智時(shí)代多樣化的古籍研究需求。古籍出版行業(yè)要牢牢把握這一新興領(lǐng)域的機(jī)遇和挑戰(zhàn),在國(guó)內(nèi)外成功經(jīng)驗(yàn)的啟發(fā)下明確發(fā)展方向,繼續(xù)加強(qiáng)基于國(guó)際圖像互操作框架的古籍資源庫(kù)的內(nèi)容建設(shè),深化國(guó)際圖像互操作框架的應(yīng)用和研究,并不斷提升出版行業(yè)規(guī)范與服務(wù)水平,從而推進(jìn)古籍圖像資源的數(shù)字出版進(jìn)程,實(shí)現(xiàn)古籍資源由數(shù)字化建設(shè)向數(shù)據(jù)化、語(yǔ)義化、智慧化的轉(zhuǎn)變,為傳統(tǒng)文化的發(fā)展與傳承事業(yè)添磚加瓦。
注 釋
[1] 王宏.試析我國(guó)古籍?dāng)?shù)字化出版之主體博弈[J].出版發(fā)行研究,2013(2):80-82
[2] 張永貴.古籍類專業(yè)出版社數(shù)字化轉(zhuǎn)型的若干思考:以國(guó)家圖書館出版社為例[J].科技與出版,2013(8):22-24
[3] 顧雷.古籍出版與古籍保護(hù)關(guān)系芻議[J].大學(xué)圖書館學(xué)報(bào),2020,38(4):100-105
[4] 李明杰,張纖柯,陳夢(mèng)石.古籍?dāng)?shù)字化研究進(jìn)展述評(píng)(2009—2019)[J].圖書情報(bào)工作,2020,64(6):130-137
[5] 王雁行.以“中華古籍保護(hù)計(jì)劃”為依托 建設(shè)國(guó)家古籍資源數(shù)據(jù)庫(kù)[J].國(guó)家圖書館學(xué)刊,2016,25(3):82-88
[6]Awesome International Image Interoperability Framework (IIIF) [EB/OL].[2022-08-12].https://github.com/IIIF/awesome-iiif
[7]陳丹,張毅.國(guó)外大學(xué)圖書館國(guó)際圖像互操作框架應(yīng)用實(shí)踐與啟示[J].圖書情報(bào)工作,2021,65(4):135-143
[8][13][18] SAT Taishōzō Image DB [EB/OL].[2021-09-14].https://dzkimgs.l.u-tokyo.ac.jp/SATi/images.php
[9] [19]DigiVatLib [EB/OL].[2021-09-14].https://digi.vatlib.it
[10] [17][20]CODH.日本古典籍データセット[EB/OL].[2021-09-14].http://codh.rois.ac.jp/pmjt
[11] [21]e-codices [EB/OL].[2021-09-14].https://www.e-codices.unifr.ch/en
[12][22]Biblissima.[EB/OL].[2021-09-14].https://iiif.biblissima.fr
[14] [29] DigiVatLib.About [EB/OL].[2021-09-14] https://digi.vatlib.it/about
[15]e-codices.Brief history [EB/OL].[2021-09-14] https://www.e-codices.unifr.ch/en/about/history
[16] Biblissima.IIIF collections [EB/OL].[2021-09-14].https://iiif.biblissima.fr/collections/about
[23] Thematic Pathways on the Web [EB/OL].[2021-09-14].https://spotlight.vatlib.it
[24]奈良絵本顔貌データセット [EB/OL].[2021-09-14].http://codh.rois.ac.jp/pmjt/curation/4
[25] 單蓉蓉,陳濤,劉煒,等.國(guó)際圖像互操作框架及拓展應(yīng)用[J].圖書館雜志,2021,40(5):89-95+123
[26] 陳濤,單蓉蓉,李惠.數(shù)字人文中圖像資源的語(yǔ)義化標(biāo)注研究[J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2020,32(9):6-14
[27] 張永娟,劉煒,于建榮,等.基于IIIF和語(yǔ)義知識(shí)圖譜的印章資源整合與知識(shí)發(fā)現(xiàn)研究[J].圖書情報(bào)工作,2020,64(7):127-135
[28] 鄭永曉,段海蓉.古籍?dāng)?shù)字化、數(shù)字人文與古代文學(xué)研究:訪中國(guó)社會(huì)科學(xué)院鄭永曉教授[J].吉首大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2020,41(2):144-151
[30] 許劍穎.數(shù)字出版知識(shí)服務(wù)的內(nèi)涵、模式及對(duì)策[J].科技與出版,2017(11):107-111
[31] 姬榮偉,周耀林.數(shù)字人文賦能檔案遺產(chǎn)“活化”保護(hù):邏輯、特征與進(jìn)路[J].檔案學(xué)通訊,2021(3):46-54
[32] 曾蕾,王曉光,范煒.圖檔博領(lǐng)域的智慧數(shù)據(jù)及其在數(shù)字人文研究中的角色[J].中國(guó)圖書館學(xué)報(bào),2018,44(1):17-34
[33] 蘇靜.基于領(lǐng)域知識(shí)庫(kù)的語(yǔ)義出版形態(tài)研究[J].出版科學(xué),2020,28(5):91-99
[34] 黃先蓉,常嘉玲.融合發(fā)展背景下出版領(lǐng)域知識(shí)服務(wù)研究新進(jìn)展:現(xiàn)狀、模式、技術(shù)與路徑[J].出版科學(xué),2020,28(1):11-21