文/遼寧大學(xué) 耿睿
奧運(yùn)檔案指的是在申辦、籌辦以及舉辦奧運(yùn)會(huì)的過(guò)程中,各相關(guān)組織及個(gè)人形成的具有保存價(jià)值的歷史記錄。奧運(yùn)檔案作為奧運(yùn)精神的重要載體,對(duì)其進(jìn)行有效開(kāi)發(fā)可以對(duì)奧運(yùn)精神進(jìn)行有效的傳承與弘揚(yáng),是對(duì)歷屆奧運(yùn)會(huì)奧運(yùn)精神的見(jiàn)證,奧運(yùn)檔案資源開(kāi)發(fā)人員應(yīng)當(dāng)用好用活?yuàn)W運(yùn)檔案資源,對(duì)其進(jìn)行有效開(kāi)發(fā),以期發(fā)揮其最大的價(jià)值。
傳統(tǒng)的奧運(yùn)檔案資源開(kāi)發(fā)存在著檔案征集力度不夠大、檔案利用條件封閉以及奧運(yùn)檔案專題數(shù)據(jù)庫(kù)有待建設(shè)等一系列的問(wèn)題,需要一些新的理念與技術(shù)參與到奧運(yùn)檔案資源開(kāi)發(fā)的過(guò)程之中。在與奧運(yùn)檔案管理相關(guān)的研究中,陳潔指出,要通過(guò)加強(qiáng)奧運(yùn)檔案的信息化管理、鼓勵(lì),以跨機(jī)構(gòu)合作的方式進(jìn)行奧運(yùn)檔案的開(kāi)發(fā),運(yùn)用知識(shí)管理的方法管理奧運(yùn)檔案,從而實(shí)現(xiàn)奧運(yùn)檔案的數(shù)字化與價(jià)值開(kāi)發(fā)。在檔案學(xué)與數(shù)字人文理念相關(guān)聯(lián)的研究中。靳文君提出在落實(shí)檔案學(xué)與數(shù)字人文項(xiàng)目相關(guān)聯(lián)的過(guò)程中,要突出檔案部門在整個(gè)項(xiàng)目中所占的主導(dǎo)作用,鼓勵(lì)相關(guān)項(xiàng)目的落地與實(shí)施。張衛(wèi)東等認(rèn)為工具關(guān)系并非是“數(shù)字人文”和“檔案資源整合”間的唯一關(guān)系,可以將“數(shù)字人文”和“檔案資源整合”分別解構(gòu)為主體、客體、技術(shù)、方法以及服務(wù)五個(gè)元素,并在此基礎(chǔ)上構(gòu)建面向數(shù)字人文的新型檔案資源整合模式。綜上,數(shù)字人文與檔案學(xué)研究相結(jié)合是目前檔案學(xué)界研究的熱點(diǎn)之一,通過(guò)對(duì)數(shù)字人文和檔案學(xué)研究的交叉融合,能夠?yàn)闄n案資源的深度開(kāi)發(fā)提供新的工具,也為本文提供了研究思路。
(一)推動(dòng)奧運(yùn)檔案資源開(kāi)發(fā)進(jìn)入“數(shù)據(jù)化”階段。北京2022年冬奧會(huì)和冬殘奧會(huì)期間,北京奧組委設(shè)立了奧運(yùn)檔案數(shù)字檔案室,主要包括檔案數(shù)字化系統(tǒng)以及綜合檔案管理系統(tǒng)兩個(gè)子系統(tǒng),其目的是對(duì)電子檔案進(jìn)行集中管理,實(shí)物檔案數(shù)字化工作同時(shí)有序進(jìn)行。上述工作的目的是為了減輕相關(guān)研究人員的工作負(fù)擔(dān),使研究人員能從機(jī)械的資料收集過(guò)程中解放出來(lái)。但是,僅僅將資料收集起來(lái)是遠(yuǎn)遠(yuǎn)不夠的,利用這些資料來(lái)分析和解決問(wèn)題的工作仍需要人來(lái)進(jìn)行,也就是說(shuō),現(xiàn)階段的奧運(yùn)檔案資源開(kāi)發(fā)工作尚未進(jìn)入“數(shù)據(jù)化”階段,未能發(fā)揮數(shù)字人文技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的優(yōu)勢(shì)。如果不能將數(shù)字人文技術(shù)引入奧運(yùn)檔案資源開(kāi)發(fā)過(guò)程之中,檔案信息的粒度就不能從文件級(jí)轉(zhuǎn)變?yōu)閿?shù)據(jù)級(jí),從單元轉(zhuǎn)變成知識(shí)節(jié)點(diǎn),機(jī)器也就不能對(duì)奧運(yùn)檔案資源進(jìn)行分類、名稱識(shí)別、跨媒體檢索、組織和圖像語(yǔ)音識(shí)別等。北京冬奧組委會(huì)采購(gòu)了檔案管理系統(tǒng),可實(shí)現(xiàn)與OA系統(tǒng)的對(duì)接,這對(duì)于奧運(yùn)檔案的數(shù)字化工作來(lái)講是很大的進(jìn)步,相關(guān)奧運(yùn)檔案信息盡管可以在北京數(shù)字檔案館系統(tǒng)中進(jìn)行查詢,但仍有大量的奧運(yùn)檔案沒(méi)有原文信息,僅僅以標(biāo)題名稱的形式存儲(chǔ)在數(shù)字檔案館系統(tǒng)中,沒(méi)有提供相關(guān)的數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行關(guān)聯(lián)檢索查詢。
(二)豐富奧運(yùn)檔案資源的展現(xiàn)形式。我國(guó)的奧運(yùn)檔案主要由承辦奧運(yùn)賽事城市的相關(guān)檔案館進(jìn)行保管,因此奧運(yùn)檔案資源開(kāi)發(fā)主體是檔案館。在數(shù)字人文技術(shù)高度發(fā)展的背景下,奧運(yùn)檔案的開(kāi)發(fā)利用形式以現(xiàn)場(chǎng)實(shí)地借閱、展覽等為主,展覽中大多以文字、圖片等信息為主,圖片以及文字內(nèi)容相較以往有些許創(chuàng)新,但在開(kāi)發(fā)新意上并沒(méi)有進(jìn)步,不能吸引大眾的眼球。無(wú)論是展出形式還是展出規(guī)模都無(wú)法與同為文化事業(yè)機(jī)構(gòu)的博物館、圖書館相比較,如在博物館領(lǐng)域有“數(shù)字故宮”“數(shù)字敦煌”等項(xiàng)目,用戶通過(guò)手機(jī)、電腦等足不出戶就可以對(duì)博物館內(nèi)的文物進(jìn)行線上觀展;而在圖書館領(lǐng)域,上海市圖書館早已將數(shù)字人文技術(shù)引入圖書館建設(shè)過(guò)程中,于2016年上線了“家譜知識(shí)服務(wù)平臺(tái)”,這是上海市圖書館的第一個(gè)數(shù)字人文項(xiàng)目。通過(guò)該平臺(tái),相關(guān)研究人員可以查詢到有關(guān)姓氏的家譜文化以及家規(guī)家訓(xùn),方便相關(guān)人員進(jìn)行利用。
(三)推動(dòng)奧運(yùn)檔案資源的跨機(jī)構(gòu)合作開(kāi)發(fā)。跨學(xué)科以及跨機(jī)構(gòu)進(jìn)行合作研究是數(shù)字人文的重要理念之一,奧運(yùn)檔案形式多樣、數(shù)量龐大,相較于檔案部門獨(dú)自開(kāi)發(fā),跨機(jī)構(gòu)開(kāi)發(fā)能夠更好地實(shí)現(xiàn)奧運(yùn)檔案的價(jià)值。英國(guó)早已嘗試對(duì)奧運(yùn)檔案進(jìn)行跨機(jī)構(gòu)合作開(kāi)發(fā)。2012年,倫敦奧運(yùn)會(huì)所產(chǎn)生的奧運(yùn)檔案集中數(shù)字化并保管在英國(guó)“The Record”項(xiàng)目專欄網(wǎng)站中,該項(xiàng)目網(wǎng)站由英國(guó)國(guó)家檔案館牽頭規(guī)劃,英國(guó)博物館、圖書館等機(jī)構(gòu)參與其中,地方小組也發(fā)揮了作用,不同機(jī)構(gòu)在這個(gè)項(xiàng)目中通力合作,共同推動(dòng)了“The Record”項(xiàng)目網(wǎng)站的建成。
(一)應(yīng)用機(jī)器學(xué)習(xí)技術(shù)幫助奧運(yùn)檔案進(jìn)行智能分類。基于機(jī)器學(xué)習(xí)的文本分類方法是指計(jì)算機(jī)對(duì)文本中的數(shù)據(jù)按照一定的分類模型進(jìn)行智能分類標(biāo)記,常見(jiàn)的構(gòu)建文本分類模型的算法主要有邏輯回歸、樸素貝葉斯、決策樹(shù)、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等,上述算法有著各自的優(yōu)點(diǎn),但都可以用于對(duì)奧運(yùn)檔案進(jìn)行文本分類。奧運(yùn)檔案中蘊(yùn)含著大量的有利用價(jià)值的財(cái)富,運(yùn)用傳統(tǒng)的方式管理奧運(yùn)檔案信息,會(huì)消耗大量的人力和物力,這是文本信息量級(jí)關(guān)系而導(dǎo)致的結(jié)果。人工處理的方式因?yàn)榘藶橐蛩氐牟淮_定性,可能會(huì)造成一定的分類誤差。利用機(jī)器自動(dòng)對(duì)文本進(jìn)行分類,是人類解決文本分類必須經(jīng)歷的一個(gè)階段。國(guó)外一些檔案館已經(jīng)開(kāi)始了嘗試,如澳大利亞新南威爾士州檔案館利用機(jī)器學(xué)習(xí)技術(shù),對(duì)州政府部門產(chǎn)生的大量的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行智能分類。奧運(yùn)檔案涉及大量的非結(jié)構(gòu)數(shù)據(jù),如奧組委辦公產(chǎn)生的電子郵件、有關(guān)奧運(yùn)賽事的圖片、音頻以及網(wǎng)絡(luò)上有關(guān)奧運(yùn)會(huì)的網(wǎng)頁(yè)信息等,因此應(yīng)用支持向量機(jī)等機(jī)器學(xué)習(xí)技術(shù)對(duì)其進(jìn)行文本分類是必要的。
(二)應(yīng)用文本挖掘技術(shù)助力奧運(yùn)檔案信息提取。
文本挖掘是抽取有效、新穎、有用、可理解的、散布在文件文本中的有價(jià)值知識(shí),并且利用這些知識(shí)更好地組織信息的過(guò)程。利用文本挖掘技術(shù)得到的奧運(yùn)檔案可視化知識(shí)圖譜能夠?yàn)橄乱粚脢W運(yùn)主辦國(guó)進(jìn)行賽事承辦以及為將來(lái)的大型體育賽事積累組織經(jīng)驗(yàn),更直觀地理解奧運(yùn)檔案的潛在價(jià)值。在北京奧運(yùn)會(huì)期間,檔案編研主要以圖書、報(bào)紙、舉辦展覽為主,這些開(kāi)發(fā)方式耗時(shí)耗力、推廣難度大。此次北京冬奧會(huì)所產(chǎn)生的檔案完全可以借助文本挖掘技術(shù)從海量信息中發(fā)現(xiàn)內(nèi)在聯(lián)系,科學(xué)分析結(jié)果并挖掘內(nèi)在價(jià)值。借助文本挖掘的技術(shù)特點(diǎn)可以很好地分析奧運(yùn)檔案資源使用者的需求,分析確定奧運(yùn)檔案資源展覽以及奧運(yùn)相關(guān)產(chǎn)品的取材及選題方向,從而更好地迎合大眾的口味。2021年12月,由北京市檔案館牽頭主辦的“我們的奧運(yùn)”主題展覽根據(jù)奧運(yùn)檔案的不同主題并結(jié)合所產(chǎn)生的時(shí)間、地理位置等背景信息,綜合考量用戶需求,設(shè)計(jì)出能滿足不同年齡、不同職業(yè)參觀者的奧運(yùn)檔案展覽。
(三)應(yīng)用關(guān)聯(lián)數(shù)據(jù)技術(shù)優(yōu)化奧運(yùn)檔案檢索服務(wù)。
在2006年的語(yǔ)義網(wǎng)項(xiàng)目會(huì)議上,關(guān)聯(lián)數(shù)據(jù)(Linked date)這個(gè)概念被首次提出。關(guān)聯(lián)數(shù)據(jù)技術(shù)主要采用資源描述框架(RDF)來(lái)對(duì)資源進(jìn)行描述,利用URI來(lái)對(duì)資源實(shí)體進(jìn)行命名以及標(biāo)識(shí),從而構(gòu)建一個(gè)能夠?yàn)槿f(wàn)維網(wǎng)所理解的HTTP URI以幫助用戶獲取相關(guān)的信息資源。關(guān)聯(lián)數(shù)據(jù)技術(shù)具有很強(qiáng)的開(kāi)發(fā)性,在滿足用戶最基本的檢索、查詢等需求的基礎(chǔ)上,還能提供各種數(shù)據(jù)服務(wù)。不同的奧運(yùn)檔案之間在信息層面存在關(guān)聯(lián),大量的奧運(yùn)檔案數(shù)據(jù)信息聚集在一起,從而構(gòu)建起整個(gè)奧運(yùn)會(huì)的賽事全貌。關(guān)聯(lián)數(shù)據(jù)技術(shù)可以在不同的數(shù)據(jù)之間建立聯(lián)系,將與目標(biāo)事件相關(guān)的如時(shí)間、空間等各個(gè)要素串聯(lián)起來(lái),從而形成一個(gè)相互關(guān)聯(lián)的信息網(wǎng)絡(luò),更加直觀地展現(xiàn)檢索結(jié)果。例如,用戶在查詢北京冬奧會(huì)場(chǎng)館之一的首鋼滑雪大跳臺(tái)中心時(shí),可以將包括國(guó)家速滑館、國(guó)家體育場(chǎng)等在內(nèi)的其他相關(guān)信息一并提供給用戶,并為用戶提供相關(guān)鏈接,以優(yōu)化用戶的查詢檢索體驗(yàn),提高奧運(yùn)檔案資源的查全率與利用效率。
(四)基于可視化技術(shù),對(duì)奧運(yùn)檔案進(jìn)行直觀展示。數(shù)字人文理念中所包含的Web3D可視化技術(shù)、GIS技術(shù)以及全系投影技術(shù)等都可以用作奧運(yùn)檔案資源數(shù)字化展示的開(kāi)發(fā)工具。Web3D可視化技術(shù)作為實(shí)現(xiàn)網(wǎng)頁(yè)中虛擬現(xiàn)實(shí)的前沿技術(shù),為傳統(tǒng)的人文社會(huì)學(xué)科提供了新的開(kāi)發(fā)工具。通過(guò)對(duì)奧運(yùn)檔案進(jìn)行3D建模,將豐富的立體沉浸式交互展示功能融入其中,呈現(xiàn)奧運(yùn)檔案的原貌以及其中所蘊(yùn)含的奧運(yùn)故事情節(jié)和賽事信息,在用戶終端全方位呈現(xiàn)高保真的視覺(jué)效果,傳遞奧運(yùn)人文價(jià)值。相較于傳統(tǒng)形式的實(shí)物展覽,奧運(yùn)檔案管理人員不僅可以利用可視化技術(shù)對(duì)數(shù)字化的奧運(yùn)檔案資源進(jìn)行在線可視化呈現(xiàn),也可以將奧運(yùn)檔案綜合數(shù)據(jù)庫(kù)中所包含的視頻、音頻以及圖片格式的奧運(yùn)檔案進(jìn)行可視化顯示,并將數(shù)字化后的奧運(yùn)檔案通過(guò)PC端、平板端等各類設(shè)備實(shí)現(xiàn)隨時(shí)、隨地、多平臺(tái)的交互觀展,成為奧運(yùn)知識(shí)數(shù)字化傳播的新模式。目前,國(guó)外利用Web3D技術(shù)在文物和藝術(shù)品展覽領(lǐng)域已經(jīng)進(jìn)行了嘗試。2011,Google&Culture成立,通過(guò)360實(shí)景等數(shù)字虛擬與現(xiàn)實(shí)技術(shù),實(shí)現(xiàn)了館藏藝術(shù)品數(shù)字智能可視化,使人在虛擬的場(chǎng)景中擁有身臨其境的體驗(yàn)。截至2018年,已經(jīng)與包括故宮博物院、上海龍美術(shù)館、三星堆博物館在內(nèi)的70多個(gè)國(guó)家和地區(qū)的1700個(gè)文化機(jī)構(gòu)展開(kāi)了合作,展出了超過(guò)5800件線上作品并進(jìn)行了160多次線上展覽。奧運(yùn)檔案資源開(kāi)發(fā)人員應(yīng)當(dāng)主動(dòng)汲取先進(jìn)經(jīng)驗(yàn),為將來(lái)奧運(yùn)檔案資源展覽引入可視化技術(shù)做好準(zhǔn)備,從而提升奧運(yùn)檔案資源利用者的體驗(yàn)感與參與度,實(shí)現(xiàn)奧運(yùn)檔案資源的深度開(kāi)發(fā)。
(五)加強(qiáng)多方協(xié)同合作。傳統(tǒng)的奧運(yùn)檔案資源開(kāi)發(fā)模式基本是由檔案館為主體牽頭進(jìn)行組織,這種開(kāi)發(fā)模式必然導(dǎo)致奧運(yùn)記憶的分散、破裂乃至消失。數(shù)字人文視角下的奧運(yùn)檔案資源開(kāi)發(fā)應(yīng)當(dāng)打破過(guò)去以檔案館為單一開(kāi)發(fā)主體的模式,擴(kuò)大開(kāi)發(fā)主體的范圍,通過(guò)多方合作的形式,共建奧運(yùn)檔案信息集成平臺(tái),從而有效推動(dòng)資源共享。首先,檔案館應(yīng)當(dāng)以用戶需求為導(dǎo)向,挖掘用戶感興趣的奧運(yùn)檔案資源并及時(shí)發(fā)布在用戶可以接受的如微信公眾號(hào)平臺(tái)上以便于用戶利用。其次,檔案部門應(yīng)意識(shí)到數(shù)字人文研究團(tuán)隊(duì)在奧運(yùn)檔案資源開(kāi)發(fā)過(guò)程中所起到的支撐作用,主動(dòng)與數(shù)字人文研究團(tuán)隊(duì)合作,充分利用數(shù)字人文研究團(tuán)隊(duì)的相關(guān)資源,打破時(shí)間、空間等限制條件開(kāi)啟跨界合作,共享開(kāi)發(fā)成果。最后,要鼓勵(lì)社會(huì)公眾參與到奧運(yùn)檔案資源的開(kāi)發(fā)過(guò)程之中。公眾是奧運(yùn)檔案資源開(kāi)發(fā)過(guò)程中的參與者和反饋者,檔案館應(yīng)當(dāng)給予公眾反饋渠道,促進(jìn)檔案館開(kāi)發(fā)的積極性與主觀能動(dòng)性,形成奧運(yùn)檔案資源開(kāi)發(fā)的良性循環(huán)。
數(shù)字人文理念作為近年來(lái)新興的研究思潮,對(duì)奧運(yùn)檔案資源開(kāi)發(fā)提供了新的思路和視野。一方面,它突破了傳統(tǒng)的檔案單一收集理念,推動(dòng)了多機(jī)構(gòu)、多領(lǐng)域的協(xié)同建設(shè);另一方面,利用數(shù)字人文的技術(shù)工具,提高了資源整合的質(zhì)量和效率,同時(shí)結(jié)合可視化等技術(shù)創(chuàng)新了奧運(yùn)檔案資源開(kāi)發(fā)模式。此外,數(shù)字人文作為一個(gè)較為廣泛的領(lǐng)域,包含著門類眾多的技術(shù)應(yīng)用,在推動(dòng)數(shù)字人文與奧運(yùn)檔案資源開(kāi)發(fā)融合的過(guò)程中,還應(yīng)當(dāng)進(jìn)一步提高奧運(yùn)檔案管理人員對(duì)數(shù)字人文工具認(rèn)識(shí)的高度與深度,推動(dòng)奧運(yùn)檔案資源開(kāi)發(fā)更加多元化與智能化。