摘要:檔案與記憶有著深切的關(guān)聯(lián),檔案承載中國(guó)發(fā)展之記憶、銘刻中國(guó)精神之記憶、傳播中國(guó)力量之記憶?,F(xiàn)采用文獻(xiàn)研究法、可視化知識(shí)組織方法,對(duì)國(guó)內(nèi)數(shù)字記憶研究現(xiàn)狀進(jìn)行詳細(xì)梳理,在此基礎(chǔ)上提出區(qū)縣檔案館的數(shù)字記憶實(shí)施路徑,并以江寧區(qū)秦淮新河記憶工作為例,基于秦淮新河部分檔案進(jìn)行機(jī)構(gòu)知識(shí)組織及其知識(shí)圖譜的建立。
世界記憶工程于1992年由聯(lián)合國(guó)教科文組織發(fā)起,我國(guó)記憶工程于2012年啟動(dòng),目前全球已建設(shè)2400多個(gè)數(shù)字記憶項(xiàng)目。依據(jù)不同記憶對(duì)象,數(shù)字記憶可以劃分為國(guó)家記憶、城市(區(qū)域)記憶、文化遺產(chǎn)記憶、事件性記憶。其中,國(guó)家記憶是以國(guó)家為對(duì)象開展的記憶項(xiàng)目,其主要目標(biāo)是保護(hù)歷史文化遺產(chǎn)、傳承國(guó)家民族記憶,代表性項(xiàng)目有“中國(guó)記憶”“美國(guó)記憶”“加拿大記憶計(jì)劃”“俄羅斯記憶”等;城市(區(qū)域)記憶是以城市或者地區(qū)為對(duì)象開展的記憶項(xiàng)目,承載著人們對(duì)城市或地區(qū)的認(rèn)知、情感與價(jià)值認(rèn)同,國(guó)內(nèi)項(xiàng)目如“北京記憶”“上海城市記憶”“廣州記憶”等,國(guó)外如“佛羅里達(dá)記憶(Florida Memory Project,F(xiàn)MP)”“紐約市皇后區(qū)記憶(Queens Memory,QM)”等;文化遺產(chǎn)記憶實(shí)踐則是以文化遺產(chǎn)為對(duì)象開展的記憶項(xiàng)目;事件性記憶事件,即針對(duì)特殊歷史事件所開展的記憶項(xiàng)目。
“十四五”時(shí)期,檔案作為重要信息資源和獨(dú)特歷史文化遺產(chǎn),其價(jià)值日益凸顯,檔案與記憶有著深切的關(guān)聯(lián),檔案承載中國(guó)發(fā)展之記憶、銘刻中國(guó)精神之記憶、傳播中國(guó)力量之記憶。2021年,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》,提出“實(shí)施新時(shí)代新成就國(guó)家記憶工程”,這是記錄黨和人民奮斗史的宏大敘事。國(guó)家記憶、城市(區(qū)域)記憶等,都是數(shù)字中國(guó)建設(shè)背景下的數(shù)字記憶新形態(tài),能夠?qū)崿F(xiàn)中華傳統(tǒng)優(yōu)秀文化的全景呈現(xiàn)、歷史傳承、活化利用等,這些記憶對(duì)于中華傳統(tǒng)優(yōu)秀文化的凝聚、傳承與傳播,以及文化產(chǎn)業(yè)發(fā)展都意義重大。
數(shù)字記憶國(guó)內(nèi)研究現(xiàn)狀
通過檢索中國(guó)知網(wǎng)、萬方數(shù)據(jù)中文數(shù)據(jù)庫,獲取國(guó)內(nèi)有關(guān)數(shù)字記憶相關(guān)研究文獻(xiàn)108篇。利用文獻(xiàn)分析軟件CiteSpace對(duì)108篇文獻(xiàn)進(jìn)行內(nèi)容分析和時(shí)序圖譜繪制,結(jié)果如圖1所示。從圖中可以看出,國(guó)內(nèi)關(guān)于數(shù)字記憶的研究主題主要分布在“數(shù)字記憶”“圖書館”“大數(shù)據(jù)”“記憶”“交換共享”“模式”“民族文化”“鄉(xiāng)土中國(guó)”“非遺文化”“數(shù)字政府”“口述檔案”10個(gè)領(lǐng)域。在這10個(gè)主題領(lǐng)域中,“圖書館”是數(shù)字記憶的建設(shè)主體之一;“大數(shù)據(jù)”是數(shù)字記憶的技術(shù)支持;“交換共享”是數(shù)字記憶的重要建設(shè)導(dǎo)向;“模式”是數(shù)字記憶的建設(shè)要點(diǎn);“民族文化”“鄉(xiāng)土中國(guó)”“非遺文化”“數(shù)字政府”是數(shù)字記憶的建設(shè)背景;“口述檔案”是數(shù)字記憶建設(shè)的主要對(duì)象之一。
數(shù)字記憶的構(gòu)建模式。
在構(gòu)建模式上,現(xiàn)有研究提出了社會(huì)化建構(gòu)模式、參與式共建、“PDU”模型、城市文化記憶的數(shù)字化轉(zhuǎn)譯、基于數(shù)字人文技術(shù)的城市記憶資源開發(fā)路徑等。其中,社會(huì)化建構(gòu)模式是以集體記憶建構(gòu)為目標(biāo),開發(fā)記憶產(chǎn)品或以推進(jìn)個(gè)人數(shù)字記憶保存為基礎(chǔ),實(shí)現(xiàn)社會(huì)記憶資源的廣泛存儲(chǔ)[1]。參與式共建即從參與者角度,考察數(shù)字記憶建構(gòu)主體及其相互關(guān)系與組織形式,形成適合我國(guó)國(guó)情的多主體、多層級(jí)共建模式,政府在宏觀層面縱向管理、多元主體,在中觀層面橫向協(xié)作、公眾,在微觀層面網(wǎng)狀式參與共建[2]。城市文化記憶的數(shù)字化轉(zhuǎn)譯即以數(shù)字人文和信息技術(shù)為手段,構(gòu)建集專題展示、互動(dòng)開放、聯(lián)動(dòng)延伸等為一體的綜合性數(shù)字平臺(tái)[3]?;跀?shù)字人文技術(shù),城市記憶資源開發(fā)路徑主要利用文本挖掘、關(guān)聯(lián)數(shù)據(jù)、GIS、虛擬現(xiàn)實(shí)等數(shù)字技術(shù),進(jìn)行城市記憶資源的開發(fā)[4-7]。
數(shù)字記憶的構(gòu)建主體
數(shù)字記憶的構(gòu)建主體具有多元化特征,包括檔案館、圖書館、博物館、社會(huì)組織、高校等。檔案館作為數(shù)字記憶建設(shè)的主體之一,是具有良好記憶資源的機(jī)構(gòu),可實(shí)現(xiàn)檔案實(shí)體資源從數(shù)字技術(shù)到數(shù)字利用的全過程管理。自2002年青島市檔案局通過攝影攝像的形式記錄青島市的歷史發(fā)展變遷,引發(fā)了全國(guó)各地“城市記憶工程”的建設(shè)熱潮。從研究文獻(xiàn)內(nèi)容上看,現(xiàn)有文獻(xiàn)主要圍繞檔案館數(shù)字記憶的價(jià)值、跨機(jī)構(gòu)聚合機(jī)制、構(gòu)建路徑、參與數(shù)字政府建設(shè)、參與城市記憶建構(gòu)的可行路徑等方面展開。
在圖書館作為數(shù)字記憶構(gòu)建主體的研究方面,目前國(guó)內(nèi)主要圍繞公共圖書館社會(huì)記憶項(xiàng)目的特征、存在的問題、數(shù)字化記憶社會(huì)化構(gòu)建、文化記憶機(jī)構(gòu)價(jià)值共創(chuàng)、鄉(xiāng)村數(shù)字記憶建設(shè)影響因素,以及個(gè)人數(shù)字記憶保存等方面展開研究。在實(shí)踐層面,國(guó)內(nèi)32家省級(jí)公共圖書館中,有6家已建成具有地方特色、呈現(xiàn)體系發(fā)展的社會(huì)記憶項(xiàng)目,如首都圖書館的“北京記憶”、湖南圖書館的“湖南紅色記憶”、上海圖書館的“上海年華”等。
數(shù)字記憶構(gòu)建中的技術(shù)支持。
在數(shù)字記憶的構(gòu)建過程中,數(shù)字技術(shù)和方法是手段,涉及技術(shù)主要包括數(shù)字化保存技術(shù)、知識(shí)化開發(fā)技術(shù)、可視化呈現(xiàn)技術(shù)三個(gè)方面。其中,數(shù)字化保存技術(shù)涉及數(shù)字化轉(zhuǎn)化、OCR識(shí)別、異構(gòu)資源聚合等技術(shù)要點(diǎn);知識(shí)化開發(fā)技術(shù)涉及知識(shí)抽取、語義組織、本體構(gòu)建、知識(shí)挖掘、社會(huì)網(wǎng)絡(luò)分析等;可視化呈現(xiàn)技術(shù)涉及地理信息系統(tǒng)、3D建模、VR、AR、知識(shí)圖譜等。
江寧區(qū)秦淮新河記憶工作實(shí)施路徑
對(duì)區(qū)縣檔案館而言,城市記憶是重要記憶對(duì)象之一。在城市記憶構(gòu)建過程中,需要對(duì)城市記憶進(jìn)行相關(guān)資源采集、數(shù)字化加工、數(shù)字化存儲(chǔ)、數(shù)字化呈現(xiàn)、數(shù)字化利用等,從而將城市記憶資源加工轉(zhuǎn)換成可以保存、關(guān)聯(lián)、共享、傳播、利用的數(shù)字記憶形態(tài)。江寧區(qū)秦淮新河記憶實(shí)施路徑主要包括秦淮新河多源、多類型檔案資源的采集與數(shù)字化加工,以及數(shù)字化資源的知識(shí)組織和可視化呈現(xiàn)等方面。
秦淮新河檔案資源的采集與數(shù)字化加工
基于檔案的記憶資源分布呈現(xiàn)集中性與分散性并存的特點(diǎn)。部分資源集中保存于檔案館等文化機(jī)構(gòu),部分資源散存于民間及海外。秦淮新河記憶資源的采集和數(shù)字化加工是秦淮新河記憶工作的起點(diǎn)與基礎(chǔ),全面梳理秦淮新河有關(guān)資源,采用數(shù)字化技術(shù)與方法對(duì)多源、多類型的秦淮新河資源進(jìn)行收集,以及整理、分類,形成系統(tǒng)化、數(shù)字化的秦淮新河檔案資源。
1.資源采集的原則與方法。
在采集原則上,遵循類型多樣、主體多源的原則,即采集的資源形態(tài)要多樣化,涵蓋文本、音視頻、圖片等;采集的來源多元化,來源不只限于檔案館,還包括圖書館、社會(huì)團(tuán)體組織及個(gè)人等。在采集方法上,依據(jù)不同來源和類型檔案,采用有針對(duì)性的方法將資源進(jìn)行匯總,具體方式有挖掘館藏、廣泛征集、即時(shí)記錄和訪談?dòng)涗浀取?/p>
2.采集的資源主題范圍。
采集的資源主題范圍涵蓋秦淮新河概貌檔案,主要涉及其歷史沿革、發(fā)展歷程等;秦淮新河建設(shè)與管理檔案,涉及其建設(shè)、規(guī)劃、交通、水利、環(huán)保等;秦淮新河活動(dòng)檔案,涉及其重要會(huì)議、重大決策、著名人物等。
3.資源數(shù)字化加工與數(shù)據(jù)化處理。
數(shù)字化加工即對(duì)非數(shù)字形態(tài)的秦淮新河記憶資源進(jìn)行載體轉(zhuǎn)換與遷移,如紙質(zhì)文獻(xiàn)的數(shù)字化掃描;縮微膠片、錄像資源從模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào);實(shí)物資源的電腦繪圖、三維影像模擬處理等。數(shù)據(jù)化即在數(shù)字化的基礎(chǔ)上,提取機(jī)器可以理解的數(shù)據(jù)形式,為下一步數(shù)字記憶場(chǎng)構(gòu)建中的文本挖掘、關(guān)聯(lián)數(shù)據(jù)、知識(shí)圖譜等開發(fā)提供基礎(chǔ)。
秦淮新河數(shù)字化資源的知識(shí)組織與呈現(xiàn)
秦淮新河記憶數(shù)字化資源的組織主要是對(duì)多源、多類型的秦淮新河數(shù)字化檔案資源進(jìn)行整理,以及分類、描述、知識(shí)關(guān)聯(lián)。異構(gòu)性是數(shù)字化檔案記憶資源的重要特性之一。異構(gòu)記憶資源全方位記錄著秦淮新河發(fā)展變遷的各個(gè)方面,不論資源的載體、呈現(xiàn)形式如何,資源的完整連續(xù)屬性不會(huì)改變。鑒于此,一方面,基于檔案管理流程,對(duì)秦淮新河數(shù)字化記憶資源進(jìn)行整理、分類和著錄,實(shí)現(xiàn)記憶資源的科學(xué)存儲(chǔ);另一方面,利用知識(shí)組織與知識(shí)關(guān)聯(lián),深度組織與挖掘秦淮新河記憶資源的內(nèi)容聯(lián)系,如“人物—事件”“機(jī)構(gòu)—機(jī)構(gòu)”“事件—地點(diǎn)”“人物—地點(diǎn)”等類型的關(guān)聯(lián),為數(shù)字記憶場(chǎng)的構(gòu)建提供基礎(chǔ)。
本研究以部分秦淮新河檔案為例,通過對(duì)檔案中所包含的“機(jī)構(gòu)”進(jìn)行機(jī)構(gòu)名標(biāo)引、詞頻統(tǒng)計(jì)、共現(xiàn)矩陣建立以及可視化呈現(xiàn),搭建秦淮新河數(shù)字記憶場(chǎng)中的“機(jī)構(gòu)”知識(shí)圖譜。在構(gòu)建過程中,機(jī)構(gòu)名標(biāo)引采取人工標(biāo)引形式,詞頻統(tǒng)計(jì)和共現(xiàn)矩陣?yán)糜?jì)量軟件COOC構(gòu)建,知識(shí)圖譜則通過軟件Gephi實(shí)現(xiàn)。
在該批秦淮新河檔案中,共涉及126個(gè)機(jī)構(gòu),其中僅出現(xiàn)1次的機(jī)構(gòu)共99個(gè),如“劉家村生產(chǎn)隊(duì)”“東山公社”“雙閘公社革委會(huì)”等,占比78.6%;出現(xiàn)2次的機(jī)構(gòu)有17個(gè),如“雨花臺(tái)區(qū)計(jì)委”“梅山鐵礦”“太山大隊(duì)”等,占比13.5%。表1列出了該批檔案中頻次為3次以上的機(jī)構(gòu)名稱,這些機(jī)構(gòu)在秦淮新河檔案中出現(xiàn)頻次相對(duì)較高,說明其與秦淮新河建設(shè)關(guān)聯(lián)較為密切,如“鐵心公社”“西善公社”“南京市雨花臺(tái)區(qū)革命委員會(huì)”等。
將標(biāo)引后的機(jī)構(gòu)名稱按COOC軟件所要求的格式導(dǎo)入該工具中后,得到秦淮新河相關(guān)機(jī)構(gòu)的共現(xiàn)矩陣。表2為共現(xiàn)矩陣部分內(nèi)容,通過建立共現(xiàn)矩陣可以發(fā)現(xiàn)部分機(jī)構(gòu)之間關(guān)聯(lián)緊密程度,共現(xiàn)頻次越高,則緊密程度相對(duì)較高,如“雙閘公社”和“鐵心公社”的共現(xiàn)頻次為4,“西善公社”與“鐵心公社”的共現(xiàn)頻次為3。
Gephi作為一款社會(huì)網(wǎng)絡(luò)分析軟件,能夠?qū)W(wǎng)絡(luò)中的各種主題進(jìn)行聚類,并通過不同顏色進(jìn)行標(biāo)識(shí),用以區(qū)分不同群組。節(jié)點(diǎn)越大,說明該節(jié)點(diǎn)對(duì)相關(guān)節(jié)點(diǎn)有較強(qiáng)的影響力。根據(jù)秦淮新河機(jī)構(gòu)頻次及貢獻(xiàn)矩陣,利用Gephi軟件繪制機(jī)構(gòu)關(guān)聯(lián)知識(shí)圖譜(如圖2),從圖譜中可以看出“江蘇省秦淮新河工程指揮部”節(jié)點(diǎn)最大,影響力較高,其次為“鐵心公社”“雙閘公社”“沙洲公社”等,且這幾個(gè)機(jī)構(gòu)之間關(guān)聯(lián)緊密。
數(shù)字記憶是數(shù)字中國(guó)建設(shè)的重要內(nèi)容之一。檔案與記憶關(guān)聯(lián)密切,區(qū)縣檔案館作為基層檔案機(jī)構(gòu),在數(shù)字記憶建設(shè)中發(fā)揮著重要的作用。本研究基于江寧區(qū)檔案館秦淮新河記憶工作實(shí)踐,提出可以從多源、多類型檔案資源的采集與數(shù)字化加工工作出發(fā),通過對(duì)檔案數(shù)字化資源進(jìn)行語義知識(shí)組織以及知識(shí)圖譜構(gòu)建,實(shí)施區(qū)縣檔案館的數(shù)字記憶工作。該實(shí)施路徑能夠?qū)崿F(xiàn)對(duì)檔案資源語義層面的深度開發(fā)與利用,且具有一定的普適性,能夠?yàn)閰^(qū)縣檔案館數(shù)字記憶工作提供有效價(jià)值參考。
本文系2023年度江蘇省檔案科技項(xiàng)目“‘新時(shí)代新成就江蘇記憶工程’區(qū)縣檔案館實(shí)施路徑研究——以江寧區(qū)秦淮新河記憶工作實(shí)踐為例”(2023-6)研究成果。
(作者單位:朱玉紅:南京市江寧區(qū)檔案館;劉丹:金陵科技學(xué)院人文學(xué)院)