張喆昱,張 磊
圖書(shū)館、美術(shù)館、博物館、檔案館等作為傳承人類(lèi)文化遺產(chǎn)的記憶機(jī)構(gòu)(以下簡(jiǎn)稱“記憶機(jī)構(gòu)”),致力于收集、保存和管理人文科學(xué)資料,為大眾提供知識(shí)服務(wù)。在互聯(lián)網(wǎng)和數(shù)字化浪潮下,記憶機(jī)構(gòu)紛紛將實(shí)體資料數(shù)字化、加工整理,組織成可用程度不一的網(wǎng)絡(luò)數(shù)據(jù)資源,最終開(kāi)放為社會(huì)所用。伴隨“數(shù)據(jù)驅(qū)動(dòng)”新興研究范式到來(lái),人們對(duì)記憶機(jī)構(gòu)數(shù)字資源的共享和利用的期望急劇攀升,導(dǎo)致記憶機(jī)構(gòu)傳統(tǒng)的資源分享模式與社會(huì)需求之間的鴻溝日趨加大。記憶機(jī)構(gòu)在新形勢(shì)下的數(shù)字化服務(wù)轉(zhuǎn)型勢(shì)在必行。
在社會(huì)需求和技術(shù)推動(dòng)雙重作用下,國(guó)內(nèi)外記憶機(jī)構(gòu)開(kāi)展了積極探索,推出開(kāi)放數(shù)據(jù)服務(wù),挖掘人文資料的潛在價(jià)值,促進(jìn)文化創(chuàng)新。記憶機(jī)構(gòu)的社會(huì)定位也在悄然改變,從資源持有者轉(zhuǎn)向創(chuàng)新的使能者。隨之而來(lái)的挑戰(zhàn)包括數(shù)字化時(shí)代記憶機(jī)構(gòu)的定位、記憶機(jī)構(gòu)如何利用人類(lèi)文化知識(shí)寶藏支持?jǐn)?shù)據(jù)驅(qū)動(dòng)的創(chuàng)新活動(dòng)、如何實(shí)現(xiàn)記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型等。本文在總結(jié)國(guó)內(nèi)外記憶機(jī)構(gòu)人文開(kāi)放數(shù)據(jù)建設(shè)實(shí)踐的基礎(chǔ)上,嘗試以開(kāi)放數(shù)據(jù)內(nèi)容深度、開(kāi)放數(shù)據(jù)內(nèi)容廣度、開(kāi)放數(shù)據(jù)的利用3個(gè)分面對(duì)國(guó)內(nèi)外記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)建設(shè)及使用情況進(jìn)行梳理,為我國(guó)記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型提出建議。
在信息通信技術(shù)支持下,記憶機(jī)構(gòu)可以在傳統(tǒng)的基于物理介質(zhì)文獻(xiàn)的人類(lèi)文化遺產(chǎn)保藏和運(yùn)用方面,借助數(shù)字化手段,提升服務(wù)能力。通過(guò)資源的數(shù)字化建設(shè)、數(shù)據(jù)的開(kāi)放共享,記憶機(jī)構(gòu)不僅可以在更大范圍內(nèi)更全面地傳播藏品資源、挖掘資源價(jià)值、提升服務(wù)水平,更能在文化創(chuàng)新活動(dòng)中起到積極作用。近年國(guó)內(nèi)外記憶機(jī)構(gòu)紛紛將推進(jìn)開(kāi)放數(shù)據(jù)建設(shè)作為發(fā)展方向,采用關(guān)聯(lián)數(shù)據(jù)技術(shù)促進(jìn)記憶機(jī)構(gòu)中結(jié)構(gòu)化與語(yǔ)義化數(shù)據(jù)的建設(shè)和再利用[1]。雖然圖書(shū)館、博物館、美術(shù)館和檔案館記憶人類(lèi)文明的宗旨相同,但鑒于服務(wù)目的的差異和組織機(jī)構(gòu)的分離,本文將按形態(tài)歸類(lèi),總結(jié)國(guó)內(nèi)外記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)建設(shè)實(shí)踐。
傳統(tǒng)圖書(shū)館肩負(fù)著搜集、整理、收藏文獻(xiàn)資料,開(kāi)發(fā)信息資源,進(jìn)而為民眾服務(wù)的職能。其特點(diǎn)在于藏品是經(jīng)過(guò)文獻(xiàn)作者的凝練、圖書(shū)管理人員加工整理后的權(quán)威信息。新形勢(shì)下,各國(guó)圖書(shū)館不同程度地開(kāi)展了開(kāi)放數(shù)據(jù)探索。
歐洲圖書(shū)館的開(kāi)放數(shù)據(jù)探索非常活躍。德國(guó)數(shù)字圖書(shū)館(Deutsche Digitale Bibliothek,DDB)2013年向公眾發(fā)布API(應(yīng)用編程接口)[2],提供基于關(guān)聯(lián)技術(shù)的德國(guó)文化和科技數(shù)字資源的開(kāi)放數(shù)據(jù)服務(wù),促進(jìn)了數(shù)據(jù)創(chuàng)新[3]。從2014年起,德國(guó)數(shù)字圖書(shū)館聯(lián)合其他機(jī)構(gòu),每年共同舉辦“達(dá)芬奇編碼”競(jìng)賽活動(dòng),以開(kāi)放數(shù)據(jù)形式為大眾提供元數(shù)據(jù)、圖像、音頻、視頻、3D模型,不僅揭示了這些文化機(jī)構(gòu)數(shù)據(jù)的潛在價(jià)值,且進(jìn)一步促進(jìn)了開(kāi)發(fā)者、游戲玩家、設(shè)計(jì)師與各文化機(jī)構(gòu)之間的交流,競(jìng)賽結(jié)束后不少獲獎(jiǎng)項(xiàng)目跟專業(yè)機(jī)構(gòu)開(kāi)展了進(jìn)一步的合作[4]。英國(guó)大英圖書(shū)館建設(shè)了多個(gè)開(kāi)放數(shù)據(jù)平臺(tái)[5],其中2016 年推出的data.bl.uk公開(kāi)了74個(gè)數(shù)據(jù)集[6],除提供JPEG、PDF等部分?jǐn)?shù)字化館藏外,還提供結(jié)構(gòu)化的機(jī)讀格式信息,甚至以關(guān)聯(lián)數(shù)據(jù)方式組織和發(fā)布所有書(shū)目數(shù)據(jù)BNB(British National Bibliography)[7],以研討會(huì)、數(shù)據(jù)利用大賽等方式推廣開(kāi)放數(shù)據(jù),開(kāi)設(shè)British Library Lab,鼓勵(lì)公眾參與研究[8]。
在北美地區(qū),美國(guó)國(guó)會(huì)圖書(shū)館(Library of Congress,LC)2009 年起致力于將主題詞表(LCSH)、名稱規(guī)范檔(LCA)、圖書(shū)分類(lèi)法(LCC)等規(guī)范性文件以關(guān)聯(lián)數(shù)據(jù)方式開(kāi)放,提供API 訪問(wèn)和批量下載,幫助開(kāi)展自動(dòng)化的關(guān)聯(lián)和推理[9]。美國(guó)數(shù)字公共圖書(shū)館(Digital Public Library of America,DPLA)提供所有DPLA 記錄的批量下載,這些數(shù)據(jù)可以通過(guò)API 用于關(guān)聯(lián)應(yīng)用開(kāi)發(fā)[10]。加拿大多倫多公共圖書(shū)館發(fā)布了開(kāi)放數(shù)據(jù)政策及使用條款,公布了涉及書(shū)目、網(wǎng)站搜索、持證讀者、流通等方面的30多個(gè)開(kāi)放數(shù)據(jù)集[11]。
在亞太地區(qū),作為新西蘭開(kāi)放獲取許可框架和開(kāi)放政府信息、數(shù)據(jù)再利用計(jì)劃的一員,新西蘭國(guó)家圖書(shū)館制訂《開(kāi)放數(shù)據(jù)計(jì)劃》[12],開(kāi)放出版物、論文、報(bào)刊索引等的元數(shù)據(jù)以供下載,DigitalNZ API整合150多個(gè)組織的元數(shù)據(jù)用于應(yīng)用集成,鼓勵(lì)對(duì)這些數(shù)據(jù)進(jìn)行深度分析或開(kāi)發(fā)[13]。韓國(guó)國(guó)家圖書(shū)館發(fā)布國(guó)家書(shū)目的關(guān)聯(lián)開(kāi)放數(shù)據(jù)(LOD)網(wǎng)站,涵蓋書(shū)目、主題、作者等方面的信息,為關(guān)聯(lián)和融合其館藏及網(wǎng)絡(luò)數(shù)據(jù)帶開(kāi)了方便之門(mén)[14]。
在我國(guó),上海圖書(shū)館從館藏特色資源——家譜開(kāi)始,建設(shè)了集人、地、時(shí)、事、物、文獻(xiàn)為一體的人文數(shù)據(jù)基礎(chǔ)設(shè)施[15],以關(guān)聯(lián)數(shù)據(jù)形式提供數(shù)據(jù)服務(wù)。在此基礎(chǔ)上,連續(xù)4年舉辦開(kāi)放數(shù)據(jù)應(yīng)用開(kāi)發(fā)競(jìng)賽,數(shù)據(jù)種類(lèi)和開(kāi)放數(shù)量也從首屆5萬(wàn)種家譜元數(shù)據(jù)發(fā)展到第二屆新增開(kāi)放24萬(wàn)種名人手稿檔案元數(shù)據(jù)[16],2019年更與國(guó)內(nèi)外6家單位聯(lián)合推出涉及家譜、名人、建筑、紅色文獻(xiàn)、電影、詩(shī)詞、民國(guó)書(shū)刊、藏印等多類(lèi)型歷史人文內(nèi)容的數(shù)據(jù)數(shù)千萬(wàn)條,開(kāi)放數(shù)據(jù)競(jìng)賽為數(shù)據(jù)合作單位、歷史人文愛(ài)好者和數(shù)據(jù)創(chuàng)客提供了良好的學(xué)習(xí)交流平臺(tái),各方共同挖掘歷史人文數(shù)據(jù)背后的應(yīng)用潛力,豐富了數(shù)據(jù)資源利用手段,在國(guó)內(nèi)記憶機(jī)構(gòu)開(kāi)放數(shù)據(jù)應(yīng)用中起到了引領(lǐng)作用。
博物館美術(shù)館收藏具有代表性的人類(lèi)文化遺產(chǎn),供來(lái)訪者觀賞和研究。其特點(diǎn)是歷史性強(qiáng),藏品稀有度高。為讓世界各地的使用者體驗(yàn)特定的歷史文化特色,對(duì)特定類(lèi)別的文物展開(kāi)全方位研究,國(guó)內(nèi)外博物館美術(shù)館在藏品元數(shù)據(jù)、藏品的數(shù)字化對(duì)象等多個(gè)層次開(kāi)展了開(kāi)放關(guān)聯(lián)數(shù)據(jù)探索,其中以美國(guó)洛杉磯Getty博物館、大英博物館最全面。
美國(guó)洛杉磯Getty博物館免費(fèi)提供自有版權(quán)藏品及10萬(wàn)余張無(wú)版權(quán)對(duì)象的高清數(shù)字圖像下載,這些豐富的數(shù)字化資源反映了Getty研究院和Getty博物館的數(shù)千件藏品,內(nèi)容范圍還在不斷擴(kuò)大[17]。Getty敘詞表關(guān)聯(lián)數(shù)據(jù)包含藝術(shù)、建筑、裝飾藝術(shù)、檔案、書(shū)目材料等領(lǐng)域的結(jié)構(gòu)化術(shù)語(yǔ),為編目員和數(shù)據(jù)加工者提供了權(quán)威規(guī)范,為數(shù)字藝術(shù)史研究和發(fā)現(xiàn)提供了強(qiáng)大的渠道,促進(jìn)了博物館數(shù)據(jù)與網(wǎng)絡(luò)資源的結(jié)合[18]。
大英博物館開(kāi)放了藏品的數(shù)字化檔案、高清圖像供下載。作為關(guān)聯(lián)數(shù)據(jù)建設(shè)的先驅(qū),2011年大英博物館就基于館藏目錄創(chuàng)建了關(guān)聯(lián)數(shù)據(jù)項(xiàng)目ResarchSpace[19]。
在藏品數(shù)字化服務(wù)方面,洛杉磯郡立美術(shù)館開(kāi)放了2萬(wàn)份高清圖像資料,只要注明出處便可無(wú)限制使用[20]。2017年起,美國(guó)大都會(huì)博物館將無(wú)版權(quán)藏品的高清圖像開(kāi)放給公眾免費(fèi)使用[21]。荷蘭國(guó)立博物館[21-22]和芬蘭國(guó)家美術(shù)館[23]更勝一籌,不僅提供藏品的高清數(shù)字化圖像供大眾下載,還提供有關(guān)藝術(shù)品及藝術(shù)家數(shù)據(jù)的API,鼓勵(lì)人們進(jìn)行資源整合、應(yīng)用程序創(chuàng)新和藝術(shù)品的衍生創(chuàng)作。
亞洲具有代表性的關(guān)聯(lián)開(kāi)放數(shù)據(jù)應(yīng)用當(dāng)屬日本關(guān)聯(lián)開(kāi)放數(shù)據(jù)學(xué)術(shù)博物館。該館以關(guān)聯(lián)數(shù)據(jù)技術(shù)整合全國(guó)博物館、館藏文物、作者、設(shè)施等元數(shù)據(jù)記錄,供大眾進(jìn)行SPARQL查詢,有利于與事件數(shù)據(jù)、GIS數(shù)據(jù)、日本DBpedia、物種數(shù)據(jù)等數(shù)據(jù)資源的整合[24]。
檔案館記錄了特定歷史人物或事件的事實(shí)性信息,往往具有原始記錄性。在檔案領(lǐng)域推進(jìn)開(kāi)放數(shù)據(jù)活動(dòng)有利于公眾了解或核實(shí)某些事實(shí)。開(kāi)放數(shù)據(jù)應(yīng)用較全面的有英美兩國(guó)的國(guó)家檔案館。英國(guó)國(guó)家檔案館整合2,500 多家檔案機(jī)構(gòu)的3,200 萬(wàn)份記錄,公開(kāi)了API Discovery,向社會(huì)提供數(shù)字化服務(wù),形成全面的歷史人文記錄數(shù)字化資源[25-26]。美國(guó)國(guó)家檔案館提供以聯(lián)邦法規(guī)編碼規(guī)范檔和總統(tǒng)公共文件為代表的大批數(shù)據(jù)集、以國(guó)家檔案目錄API為代表的訪問(wèn)接口,以及眾包工具Transcribr[27],促進(jìn)了大眾對(duì)檔案數(shù)據(jù)的創(chuàng)新應(yīng)用。新西蘭檔案館2005年起成為政府開(kāi)放數(shù)據(jù)運(yùn)動(dòng)的重要伙伴,開(kāi)放了包括公共服務(wù)、歷史文化在內(nèi)的4個(gè)數(shù)據(jù)集,提供API訪問(wèn)或直接下載,供大眾二次開(kāi)發(fā)利用[28]。德國(guó)聯(lián)邦檔案館在維基百科網(wǎng)站投放了幾千份德國(guó)歷史照片[20]。
在資源協(xié)作方面,英國(guó)博物館、圖書(shū)館和檔案館理事會(huì)(Museums,Libraries and Archives Council,MLA)和加拿大國(guó)家圖書(shū)檔案館(Library and Archives Canada,LAC)[29]等做出了表率。澳大利亞昆士蘭州立圖書(shū)館將近3萬(wàn)名士兵一戰(zhàn)前拍攝的照片數(shù)字化,作為開(kāi)放數(shù)據(jù)集發(fā)布在政府網(wǎng)站,同時(shí)與澳大利亞檔案館合作,通過(guò)國(guó)家檔案館API,將這些士兵肖像與國(guó)家檔案館的個(gè)人檔案進(jìn)行匹配[12]。另一個(gè)著名的記憶機(jī)構(gòu)開(kāi)放數(shù)據(jù)建設(shè)協(xié)作是始于2008 年的Europeana,它整合歐盟數(shù)十個(gè)國(guó)家不同類(lèi)型記憶機(jī)構(gòu)的書(shū)籍、繪畫(huà)、音樂(lè)、檔案、電影等數(shù)據(jù)資料,向全球提供免費(fèi)的數(shù)字資源獲取平臺(tái),在跨機(jī)構(gòu)、跨領(lǐng)域文化資源融合中取得了良好效果;2012年建設(shè)關(guān)聯(lián)開(kāi)放數(shù)據(jù),提供批量下載、API、SPARQL 查詢等服務(wù),Europeana Lab網(wǎng)站為促進(jìn)文化遺產(chǎn)創(chuàng)新和創(chuàng)造提供了良好的平臺(tái)[30-32]。
整體而言,記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)建設(shè)具有3個(gè)特點(diǎn):(1)國(guó)外記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)實(shí)踐較豐富,尤以世界級(jí)頂尖圖書(shū)館和博物館的探索更突出,數(shù)字化內(nèi)容開(kāi)放程度高,開(kāi)放比例也大[20]。(2)開(kāi)放數(shù)據(jù)項(xiàng)目集中在歐美,亞洲地區(qū)日韓的開(kāi)放數(shù)據(jù)建設(shè)較先進(jìn)[18]。(3)我國(guó)記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)整體水平不高,從事開(kāi)放數(shù)據(jù)探索的機(jī)構(gòu)不多,開(kāi)放數(shù)據(jù)數(shù)量少,級(jí)別較低。比如,國(guó)內(nèi)博物館藏品的數(shù)字化資源呈封閉狀態(tài)[20]。盡管?chē)?guó)內(nèi)早有基于關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)記憶機(jī)構(gòu)數(shù)字資源整合的研究,但鮮有不同類(lèi)別的記憶機(jī)構(gòu)聯(lián)合開(kāi)展開(kāi)放數(shù)據(jù)建設(shè)和聯(lián)合提供數(shù)字化服務(wù)的成果[28]。
國(guó)內(nèi)外記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)建設(shè)特征,可從開(kāi)放數(shù)據(jù)內(nèi)容深度、內(nèi)容廣度及利用形式3個(gè)分面進(jìn)行梳理,見(jiàn)表1。
表1 國(guó)內(nèi)外開(kāi)放數(shù)據(jù)建設(shè)特點(diǎn)
開(kāi)放數(shù)據(jù)的深度按照Tim Berners Lee 提出的開(kāi)放數(shù)據(jù)五星評(píng)價(jià)體系[33]劃分。第一級(jí)對(duì)應(yīng)五星評(píng)價(jià)體系的四五星,其特征在于以RDF數(shù)據(jù)模型存儲(chǔ)數(shù)據(jù),利用URI命名數(shù)據(jù)實(shí)體,使數(shù)據(jù)之間互相關(guān)聯(lián)。第二級(jí)對(duì)應(yīng)五星評(píng)價(jià)體系的二三星,以結(jié)構(gòu)化數(shù)據(jù)或非專有格式提供開(kāi)放。第三級(jí)對(duì)應(yīng)五星評(píng)價(jià)體系的一星,數(shù)據(jù)可在互聯(lián)網(wǎng)上訪問(wèn)。這樣分級(jí)的意義在于,具備第一級(jí)特征的開(kāi)放數(shù)據(jù)可以支持自動(dòng)化的關(guān)聯(lián)和推理,更適合專題研究者和跨領(lǐng)域研究者開(kāi)展深入或跨界的高水平研究;第二級(jí)開(kāi)放數(shù)據(jù)滿足人們對(duì)精準(zhǔn)獲取數(shù)據(jù)和訪問(wèn)廣泛數(shù)據(jù)資源的需求,更利于大眾創(chuàng)新應(yīng)用;第三級(jí)標(biāo)準(zhǔn)降低了開(kāi)放數(shù)據(jù)的利用門(mén)檻,更加激發(fā)公眾對(duì)人文藝術(shù)的創(chuàng)意。
從開(kāi)放數(shù)據(jù)的廣度來(lái)說(shuō),完整藏品、多種類(lèi)別數(shù)據(jù)的完全開(kāi)放最為理想??墒牵恍┏R?jiàn)的約束條件,如知識(shí)產(chǎn)權(quán)、法律法規(guī)、社會(huì)影響等使得開(kāi)放數(shù)據(jù)的廣度呈現(xiàn)多樣化特征。此外,數(shù)字化制作、加工和維護(hù)成本也是一個(gè)不容忽視的要素。
開(kāi)放數(shù)據(jù)的利用程度是一個(gè)常被忽視但對(duì)記憶機(jī)構(gòu)職能轉(zhuǎn)型意義深遠(yuǎn)的一個(gè)維度。與記憶機(jī)構(gòu)傳統(tǒng)職能定位相吻合,以關(guān)聯(lián)數(shù)據(jù)形式開(kāi)放的規(guī)范檔會(huì)幫助記憶機(jī)構(gòu)更好地揭示藏品內(nèi)容,編織數(shù)字化資源的知識(shí)網(wǎng)絡(luò)。但開(kāi)放數(shù)據(jù)的爆炸式增長(zhǎng)和記憶機(jī)構(gòu)專業(yè)人手不足的矛盾也會(huì)激發(fā)一些新的數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)形態(tài)的出現(xiàn)。例如,利用眾包方式開(kāi)展數(shù)字化藏品的信息補(bǔ)全可以成功地將記憶機(jī)構(gòu)的數(shù)字化服務(wù)對(duì)象(開(kāi)放數(shù)據(jù)的消費(fèi)者)轉(zhuǎn)變?yōu)殚_(kāi)放數(shù)據(jù)的建設(shè)者。這將引發(fā)記憶機(jī)構(gòu)原有組織關(guān)系的調(diào)整。此外,帶有地域特征、表現(xiàn)風(fēng)格和文化底蘊(yùn)的文創(chuàng)設(shè)計(jì)也將促使記憶機(jī)構(gòu)人類(lèi)文化保藏者的社會(huì)定位發(fā)生改變。
依據(jù)上述分面的多類(lèi)特征審視國(guó)內(nèi)外開(kāi)放數(shù)據(jù)實(shí)踐,可勾勒出我國(guó)記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型模式。
(1)根據(jù)各機(jī)構(gòu)的能力、預(yù)期受眾和愿景探索獨(dú)特的數(shù)字化服務(wù)模式。記憶機(jī)構(gòu)定位的不同,藏品內(nèi)容、級(jí)別和豐度的差異意味著我們不能限定于唯一一種記憶機(jī)構(gòu)的數(shù)字化服務(wù)模式,而應(yīng)根據(jù)各機(jī)構(gòu)的能力、預(yù)期受眾和愿景探索獨(dú)特的數(shù)字化服務(wù)模式。即便是跨機(jī)構(gòu)、跨領(lǐng)域的開(kāi)放數(shù)據(jù)協(xié)作,也應(yīng)根據(jù)預(yù)期受眾形成有針對(duì)性的數(shù)字化服務(wù)模式。
以上海圖書(shū)館(以下簡(jiǎn)稱“上圖”)為例,該館一直致力于推動(dòng)歷史人文數(shù)據(jù)的開(kāi)放利用,倡導(dǎo)多源數(shù)據(jù)融合。一年一度的上圖開(kāi)放數(shù)據(jù)應(yīng)用開(kāi)發(fā)競(jìng)賽為各數(shù)據(jù)合作單位、歷史人文愛(ài)好者和數(shù)據(jù)創(chuàng)客提供了良好的學(xué)習(xí)交流平臺(tái),通過(guò)競(jìng)賽宣傳推廣了上圖和各家數(shù)據(jù)合作機(jī)構(gòu)的開(kāi)放數(shù)據(jù)資源,以豐富的數(shù)據(jù)內(nèi)容、種類(lèi)和數(shù)量催生高附加值的數(shù)據(jù)應(yīng)用和服務(wù)。在上圖歷年開(kāi)放數(shù)據(jù)競(jìng)賽中,達(dá)到第一級(jí)開(kāi)放內(nèi)容深度,廣泛關(guān)聯(lián)多種數(shù)據(jù)源,富有創(chuàng)意的數(shù)據(jù)利用作品盡管占有一定比例,但在與參賽者的溝通過(guò)程中,對(duì)各類(lèi)文獻(xiàn)資料原文掃描圖像的需求占比更大。可見(jiàn),低端的開(kāi)放深度(第三級(jí))和極大的開(kāi)放廣度或許是這一類(lèi)受眾獲得數(shù)字化服務(wù)的最佳形態(tài)。上圖推出的中文古籍聯(lián)合目錄及循證平臺(tái),以古籍目錄和古籍文獻(xiàn)中蘊(yùn)含的數(shù)據(jù)、事實(shí)和知識(shí),以及基于它們的統(tǒng)計(jì)、分析和推理來(lái)協(xié)助各類(lèi)人文、歷史、社會(huì)科學(xué)研究;而歷史文獻(xiàn)眾包平臺(tái)為用戶提供元數(shù)據(jù)深度著錄和全文標(biāo)引的功能,對(duì)無(wú)法OCR的全文進(jìn)行抄錄,是低端數(shù)據(jù)深度開(kāi)放的良好應(yīng)用。
數(shù)字化服務(wù)的目標(biāo)定位也將影響開(kāi)放數(shù)據(jù)建設(shè)和服務(wù)的形態(tài)。例如,如果要重現(xiàn)老街道、老建筑的文化風(fēng)采,就需要關(guān)聯(lián)眾多機(jī)構(gòu)/數(shù)據(jù)源中歷史上的建筑、人物、事件等信息,這就需要開(kāi)放數(shù)據(jù)達(dá)到第一級(jí)深度。從另一個(gè)角度來(lái)說(shuō),如果只滿足查閱原版文獻(xiàn)等需求,則建立可查詢(第二級(jí)深度)和網(wǎng)上瀏覽(第三級(jí)深度)的數(shù)據(jù)庫(kù)不見(jiàn)得不是一種恰切的數(shù)字化服務(wù)模式。
開(kāi)放數(shù)據(jù)的開(kāi)放深度和廣度以及數(shù)字化服務(wù)能力不得不受到其他因素的制約,如資源持有人開(kāi)放意愿,資源內(nèi)容涉及人物后代(如家譜)。所以,采用因地制宜的數(shù)字化服務(wù)模式是有效的方法。
(2)加強(qiáng)跨組織的協(xié)作和資源、成果共享。跨組織跨領(lǐng)域的協(xié)作能更全面地揭示隱藏在不同數(shù)據(jù)源間的知識(shí)聯(lián)系,協(xié)作成果也將使資源得到更充分的利用。不同類(lèi)別記憶機(jī)構(gòu)的協(xié)作、國(guó)內(nèi)各地區(qū)機(jī)構(gòu)的協(xié)作、大范圍的國(guó)際協(xié)作都有必要[34-35]。比如,歷史街道及歷史建筑重現(xiàn)可以由圖書(shū)館提供數(shù)字化服務(wù)來(lái)完成,但為了深度發(fā)掘其人文價(jià)值(建筑風(fēng)格、設(shè)計(jì)圖檔)或出于歷史建筑保護(hù)的目的,則需要跨部門(mén)(檔案館、博物館)協(xié)作。目前國(guó)內(nèi)跨圖博檔機(jī)構(gòu)的協(xié)作較少。上圖古籍聯(lián)合目錄將多館館藏目錄進(jìn)行融合,包括柏克萊加州大學(xué)東亞圖書(shū)館、哈佛大學(xué)哈佛燕京圖書(shū)館以及澳門(mén)大學(xué)圖書(shū)館等,提供古籍書(shū)目數(shù)據(jù)查詢和全文影像瀏覽。相比單一部門(mén)的開(kāi)放數(shù)據(jù)建設(shè),多方協(xié)作能產(chǎn)出更全面、更深入的技術(shù)成果。充分的資源利用和數(shù)據(jù)共享能破除片面采集、數(shù)據(jù)私有、重復(fù)勞動(dòng)等現(xiàn)象,節(jié)約開(kāi)放數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)的成本。
(3)人類(lèi)記憶機(jī)構(gòu)的職能定位應(yīng)從記錄文化演變的資源庫(kù)轉(zhuǎn)為數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的使能者。在生產(chǎn)能力逐步提高、產(chǎn)品日益豐富的社會(huì),借助記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)和數(shù)字化服務(wù),通過(guò)活用歷史人文開(kāi)放數(shù)據(jù),更能在物質(zhì)產(chǎn)品和精神產(chǎn)品開(kāi)發(fā)的競(jìng)爭(zhēng)中掌握優(yōu)勢(shì)。支撐帶有地域特征、表現(xiàn)風(fēng)格和文化底蘊(yùn)的文創(chuàng)設(shè)計(jì)能促使人類(lèi)記憶機(jī)構(gòu)的職能從記錄文化演變的資源庫(kù)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)創(chuàng)新的使能者,這種職能轉(zhuǎn)型將從傳統(tǒng)職能的根上開(kāi)出數(shù)據(jù)驅(qū)動(dòng)的萬(wàn)眾創(chuàng)新之花。
(4)制訂適應(yīng)于數(shù)字化服務(wù)快速變化的法規(guī)框架。開(kāi)放數(shù)據(jù)建設(shè)和數(shù)字化服務(wù)必須在法規(guī)框架中實(shí)施,也將伴隨這一框架的演變而發(fā)展。有別于傳統(tǒng)物理世界的產(chǎn)品和服務(wù),數(shù)字化產(chǎn)品和服務(wù)天生迎合了世界快速變化的特質(zhì)。再加上人們的數(shù)字化服務(wù)需求瞬息萬(wàn)變,加大記憶機(jī)構(gòu)數(shù)字化服務(wù)實(shí)踐的快速發(fā)展與相對(duì)滯后的法規(guī)框架之間的沖突。數(shù)據(jù)的安全與保密、個(gè)人隱私與知識(shí)產(chǎn)權(quán)的保護(hù)、內(nèi)容的合規(guī)性和平臺(tái)的法律責(zé)任等一系列問(wèn)題是最大限度發(fā)揮數(shù)字人文開(kāi)放數(shù)據(jù)和記憶機(jī)構(gòu)數(shù)字化服務(wù)效用所面臨的挑戰(zhàn),迫切需要研究和立法跟進(jìn)。
本文從開(kāi)放數(shù)據(jù)的內(nèi)容深度、廣度、利用形式等維度梳理國(guó)內(nèi)外記憶機(jī)構(gòu)的開(kāi)放數(shù)據(jù)建設(shè)實(shí)踐經(jīng)驗(yàn),認(rèn)為我國(guó)人類(lèi)記憶機(jī)構(gòu)的數(shù)字化服務(wù)轉(zhuǎn)型應(yīng)根據(jù)各機(jī)構(gòu)的能力、預(yù)期受眾和愿景探索差異化的數(shù)字化服務(wù)模式;加強(qiáng)跨記憶機(jī)構(gòu)的跨組織協(xié)作和成果共享;記憶機(jī)構(gòu)的職能定位應(yīng)從記錄文化演變的資源庫(kù)轉(zhuǎn)型為數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新的使能者;應(yīng)及時(shí)制訂適應(yīng)數(shù)字化服務(wù)快速變化的法律法規(guī)框架。上圖陸續(xù)進(jìn)行一系列探索,今后將結(jié)合上圖數(shù)字化服務(wù)轉(zhuǎn)型實(shí)踐,對(duì)上述建議逐步檢驗(yàn)并加以落實(shí)。