田偉 蔣冠
摘要:檔案資源數(shù)據(jù)化應(yīng)是新時(shí)代檔案事業(yè)發(fā)展的目標(biāo)。文章基于OFD標(biāo)準(zhǔn),以高校為具體應(yīng)用場(chǎng)景,研究滿(mǎn)足檔案資源數(shù)據(jù)化需求的實(shí)施策略,包括對(duì)數(shù)據(jù)化資源充分包容與主要資源形態(tài)間順暢轉(zhuǎn)換的支持、對(duì)檔案資源元數(shù)據(jù)體系充分支持、對(duì)本體論知識(shí)庫(kù)充分支持、對(duì)檔案資源協(xié)同過(guò)濾機(jī)制充分支持等方面。
關(guān)鍵詞:OFD;數(shù)據(jù)化;高校檔案;協(xié)同過(guò)濾;本體論
分類(lèi)號(hào):G270.7
Research on University Archives Resource Datalization Strategy Based on the OFD Standard
Tian Wei, Jiang Guan
(Management School of Tianjin Normal University, Tianjin, 300387)
Abstract:The datalization of archival resources should be the goal of the archives development in the new era. Based on the OFD standard, the paper takes universities as specific application scenario, and studies the implementation strategies to meet the needs of archival resources datalization. These strategies mainly include being supportive to sufficient inclusiveness for various datalized resource and smooth transition between major resource forms, being supportive to archival resources metadata, being supportive to ontological knowledge base and being supportive to archival resources collaborative filtering mechanism.
Keywords:OFD;Datalization; University Archives; Collaborative Filtering; Ontology
檔案資源的數(shù)據(jù)化是新時(shí)代檔案事業(yè)發(fā)展的根基與前提。當(dāng)前學(xué)界往往將“數(shù)據(jù)化”作為一個(gè)與“數(shù)字化”相對(duì)的概念,把檔案資源的“數(shù)據(jù)化”定義為:將檔案資源的形式與內(nèi)容轉(zhuǎn)化為電子計(jì)算機(jī)可處理的數(shù)據(jù),并通過(guò)檔案數(shù)據(jù)管理系統(tǒng)實(shí)現(xiàn)有效管理的系統(tǒng)化工作。
從實(shí)踐角度來(lái)看,離開(kāi)了充分有效的檔案數(shù)據(jù)化資源,新時(shí)代檔案事業(yè)將成為無(wú)源之水、無(wú)本之木。根據(jù)調(diào)查結(jié)果,受訪(fǎng)各高校檔案部門(mén)幾乎都存在檔案資源檢索遺漏現(xiàn)象(即未能找到實(shí)際上存在的館藏檔案資源),給檔案工作帶來(lái)了一系列問(wèn)題,而問(wèn)題的根本原因在于檔案資源的數(shù)據(jù)化程度不足。
從理論角度來(lái)看,四重境界理論[1]表明,新時(shí)代“互聯(lián)網(wǎng)+檔案”的建設(shè)應(yīng)從第一到第四重境界逐步開(kāi)展。第一重境界建設(shè)完成的標(biāo)志是:實(shí)現(xiàn)傳統(tǒng)介質(zhì)檔案的充分?jǐn)?shù)據(jù)化,并建立相應(yīng)完善的元數(shù)據(jù)標(biāo)引體系??梢?jiàn),數(shù)據(jù)化是實(shí)現(xiàn)“互聯(lián)網(wǎng)+檔案”建設(shè)的基礎(chǔ)條件。
當(dāng)前,檔案界在不斷探索大數(shù)據(jù)、智能化等問(wèn)題時(shí),實(shí)際上亦應(yīng)思考一個(gè)“根基問(wèn)題”:檔案資源的形式與內(nèi)容都很好地進(jìn)入計(jì)算機(jī)世界了嗎?這就是檔案資源“數(shù)據(jù)化”的要義所在。
如上所述,當(dāng)前“找到”檔案資源的問(wèn)題甚至尚未很好地解決,“第一境界”尚未實(shí)現(xiàn),又談何檔案資源的“高級(jí)應(yīng)用”?檔案資源“數(shù)據(jù)化”問(wèn)題尚未研究透徹而言他,就相當(dāng)于還沒(méi)有解決“走”而直接去研究“跑”。
因此,必須對(duì)檔案資源數(shù)據(jù)化問(wèn)題給予充分重視,對(duì)檔案資源數(shù)據(jù)化實(shí)現(xiàn)策略應(yīng)加以系統(tǒng)性研究。當(dāng)前,國(guó)家正在出臺(tái)一系列政策,推動(dòng)OFD版式文件標(biāo)準(zhǔn)的廣泛應(yīng)用,OFD代表著我國(guó)檔案資源數(shù)據(jù)化未來(lái)的發(fā)展方向。因此,本文基于OFD標(biāo)準(zhǔn),著眼于高校檔案這一具體應(yīng)用領(lǐng)域,提出檔案資源數(shù)據(jù)化的若干實(shí)現(xiàn)策略。
1相關(guān)研究
OFD是我國(guó)自主的版式文檔格式規(guī)范,由《電子文件存儲(chǔ)與交換格式版式文檔》(GB/T 33190-2016)確立。OFD標(biāo)準(zhǔn)體系使我國(guó)首次擁有了國(guó)家級(jí)的電子文檔自主版式格式標(biāo)準(zhǔn)及相應(yīng)技術(shù),對(duì)于實(shí)現(xiàn)新時(shí)代檔案資源“數(shù)據(jù)化”具有重要意義。
自相關(guān)標(biāo)準(zhǔn)發(fā)布后,圍繞OFD在檔案領(lǐng)域的應(yīng)用研究逐步展開(kāi)。例如,王姝等[2]對(duì)OFD在檔案領(lǐng)域的主要應(yīng)用、存在的問(wèn)題進(jìn)行了分析,進(jìn)而提出形成OFD標(biāo)準(zhǔn)族、加大應(yīng)用試點(diǎn)等檔案OFD發(fā)展策略;高林等[3]對(duì)OFD標(biāo)準(zhǔn)進(jìn)行了系統(tǒng)解讀,給出了其在電子公文、檔案等領(lǐng)域的應(yīng)用實(shí)例;周楓等[4]對(duì)OFD格式應(yīng)用場(chǎng)景進(jìn)行了探討,以SWOT分析法對(duì)OFD在檔案領(lǐng)域的發(fā)展進(jìn)行了分析;郭曉云[5]在研究中對(duì)OFD應(yīng)用于電子公文檔案一體化的策略進(jìn)行了研討;梁凱[6]對(duì)檔案部門(mén)應(yīng)用OFD的應(yīng)對(duì)之策進(jìn)行了研究。
從總體上看,OFD作為我國(guó)大力推廣的、具有全面自主知識(shí)產(chǎn)權(quán)的版式文件標(biāo)準(zhǔn),日益受到業(yè)界與學(xué)界的重視。相關(guān)工作具有良好的價(jià)值,但對(duì)OFD的研究尚處于初步階段。而一些研究也提到,OFD應(yīng)進(jìn)一步面向?qū)嵺`領(lǐng)域推動(dòng)落地研究,以突破當(dāng)前其所存在的局限性。
因此,我們應(yīng)結(jié)合檔案具體領(lǐng)域的應(yīng)用場(chǎng)景,加緊研究面向?qū)嶋H的OFD應(yīng)用策略,以具體實(shí)踐推動(dòng)整體研究,促進(jìn)OFD廣泛應(yīng)用與檔案資源數(shù)據(jù)化的實(shí)現(xiàn)。
2高校檔案資源“數(shù)據(jù)化”需求
2.1高校檔案資源主要特點(diǎn)
文章將高校檔案作為主要研究領(lǐng)域,是由于實(shí)現(xiàn)高校檔案資源的數(shù)據(jù)化具有典型示范意義。從總體上看,高校檔案具備以下特點(diǎn):
一是檔案資源門(mén)類(lèi)較齊全、數(shù)量豐富。當(dāng)前各高校基本根據(jù)《普通高等學(xué)校檔案管理辦法》等文件設(shè)立了門(mén)類(lèi)齊全的檔案資源體系,包含了黨政、教學(xué)、財(cái)務(wù)、基建等多種類(lèi)型的檔案資源,在資源數(shù)量上有相當(dāng)?shù)囊?guī)模,從而為檔案資源數(shù)據(jù)化提供了堅(jiān)實(shí)的資源基礎(chǔ)。
二是對(duì)檔案資源的管理較為規(guī)范。當(dāng)前國(guó)家出臺(tái)了一系列的規(guī)章制度與技術(shù)標(biāo)準(zhǔn)以規(guī)范高校檔案事業(yè)的開(kāi)展,在實(shí)踐中這些法規(guī)基本得到了較好的執(zhí)行,使高校檔案資源處于良好有序的管理體系之下,從而為檔案資源數(shù)據(jù)化提供了較好的運(yùn)行環(huán)境和制度保障。
三是對(duì)檔案資源的利用需求日益旺盛。根據(jù)以往課題的調(diào)查統(tǒng)計(jì),當(dāng)前對(duì)高校檔案資源的利用需求數(shù)量逐年遞增,對(duì)資源需求的種類(lèi)也在逐步擴(kuò)大。隨之由于對(duì)檔案資源未充分?jǐn)?shù)據(jù)化而造成的各種問(wèn)題也日益凸顯出來(lái),給新時(shí)代檔案事業(yè)發(fā)展帶來(lái)了一定阻力,從而對(duì)檔案資源數(shù)據(jù)化的開(kāi)展提出了迫切的要求。
2.2高校檔案資源主要形態(tài)
從總體上看,當(dāng)前高校檔案資源主要包括以下幾種主要呈現(xiàn)形態(tài)。
(1)文檔。即文本文檔,以字符作為主要表達(dá)形式的文件。它有電子文件和非電子文件兩種形式。典型的文檔諸如政府文件、總結(jié)報(bào)告、文章稿件、統(tǒng)計(jì)報(bào)表等。電子文檔文件的格式包括TXT、DOC、PDF、XLS等。
(2)圖像文件。即以圖像信息為主要形式的文件。主要包括照片、圖紙、繪畫(huà)、地圖等檔案資源。它有電子文件和非電子文件兩種形式。電子圖像文件的主要格式包括JPG、PNG、BMP、TIFF等。紙質(zhì)文檔經(jīng)數(shù)字化掃描而得的圖片文件亦屬于此類(lèi)。
(3)音頻音像文件。即以視頻或音頻為主要形式的文件。主要包括錄像資料、錄音資料等檔案資源。它有電子文件和非電子文件兩種形式,電子形式又可細(xì)分為磁介質(zhì)文件、光介質(zhì)文件、半導(dǎo)體介質(zhì)文件等。其電子文件主要格式包括MP4、WMV、ASF、3GP、RMVB等。
(4)數(shù)據(jù)庫(kù)文件。即由數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)所定義、操縱的數(shù)據(jù)文件。數(shù)據(jù)庫(kù)文件全部為電子文件形式,包括關(guān)系型數(shù)據(jù)庫(kù)與非關(guān)系型數(shù)據(jù)庫(kù)兩種類(lèi)型。典型的高校檔案資源中的數(shù)據(jù)庫(kù)文件包括教學(xué)成績(jī)數(shù)據(jù)、財(cái)務(wù)系統(tǒng)數(shù)據(jù)、各類(lèi)統(tǒng)計(jì)數(shù)據(jù)等。數(shù)據(jù)庫(kù)文件的主要格式包括DBF、MDB、MDF等。
(5)軟件及其數(shù)據(jù)文件。即除上述四種形態(tài)資源之外的檔案資源中其他軟件及其數(shù)據(jù)文件。所包含的種類(lèi)較為廣泛。隨著大數(shù)據(jù)、“互聯(lián)網(wǎng)+”等新時(shí)代技術(shù)環(huán)境的到來(lái),各種應(yīng)用軟件及其產(chǎn)生的數(shù)據(jù)越來(lái)越多地加入到檔案資源建設(shè)范圍中來(lái)。例如典型的軟件及數(shù)據(jù)文件歸檔包括工程CAD文件、網(wǎng)頁(yè)歸檔文件、社交媒體歸檔文件、科研軟件系統(tǒng)文件等。
五種形態(tài)之間互有包含、緊密聯(lián)系。如文檔中往往不單單含有文字,還包含一定的表格、圖像等,而圖像文件也必然含有文字說(shuō)明要素,數(shù)據(jù)庫(kù)文件實(shí)際上是軟件及數(shù)據(jù)文件的特例。
2.3高校檔案資源數(shù)據(jù)化需求
以上五種形態(tài)檔案資源對(duì)于版式文件具有不同的需求。在“四重境界”理論的視域下,我們以形態(tài)和境界為兩個(gè)維度,總結(jié)高校檔案資源數(shù)據(jù)化任務(wù)需求(表1)。
3基于OFD標(biāo)準(zhǔn)的檔案資源數(shù)據(jù)化策略
基于以上的檔案資源數(shù)據(jù)化典型需求,結(jié)合OFD標(biāo)準(zhǔn)自主性、安全性、兼容性的特點(diǎn),提出以下的檔案資源數(shù)據(jù)化實(shí)現(xiàn)策略。
3.1對(duì)數(shù)據(jù)化資源充分包容與主要形態(tài)間順暢轉(zhuǎn)換的支持
當(dāng)前國(guó)家相關(guān)部門(mén)致力于推動(dòng)使檔案資源版式文件格式統(tǒng)一于OFD標(biāo)準(zhǔn)。因此OFD標(biāo)準(zhǔn)應(yīng)對(duì)多種形態(tài)的檔案資源具有較好的包容能力。OFD標(biāo)準(zhǔn)應(yīng)充分包容各形態(tài)檔案資源,避免使檔案資源數(shù)據(jù)化成果呈現(xiàn)形態(tài)過(guò)于紛雜,同時(shí)實(shí)現(xiàn)檔案資源數(shù)據(jù)化成果統(tǒng)一于我國(guó)自主知識(shí)產(chǎn)權(quán)標(biāo)準(zhǔn)。
OFD標(biāo)準(zhǔn)擅長(zhǎng)于實(shí)現(xiàn)各類(lèi)文檔排版后的固化呈現(xiàn),因此文檔與圖像文件可較為直接地應(yīng)用OFD標(biāo)準(zhǔn)實(shí)現(xiàn)數(shù)據(jù)化成果存儲(chǔ)。當(dāng)前電子證照、政令文件等領(lǐng)域已經(jīng)成功地開(kāi)展了OFD標(biāo)準(zhǔn)應(yīng)用。因此,高校檔案資源中的類(lèi)似數(shù)據(jù)化成果可參照實(shí)現(xiàn)。同時(shí),應(yīng)擴(kuò)展OFD文件對(duì)于音頻音像文件的包容能力,使這類(lèi)檔案資源能夠通過(guò)OFD標(biāo)準(zhǔn)實(shí)現(xiàn)有效的存儲(chǔ)與利用。
OFD是基于XML與壓縮技術(shù)的電子文檔格式標(biāo)準(zhǔn)。因此OFD對(duì)數(shù)據(jù)庫(kù)文件應(yīng)該具有較好的支持度。XML善于描述結(jié)構(gòu)化數(shù)據(jù),是一種存儲(chǔ)與傳輸數(shù)據(jù)的格式標(biāo)準(zhǔn),與多數(shù)數(shù)據(jù)庫(kù)支持模型原理相通,具備對(duì)數(shù)據(jù)庫(kù)文件的良好支持度。當(dāng)然,XML僅僅關(guān)注于存儲(chǔ)數(shù)據(jù),而不提供數(shù)據(jù)索引、排序、查找、相關(guān)一致性等功能。這就意味著,可保持?jǐn)?shù)據(jù)庫(kù)文件的原有格式作為數(shù)據(jù)化資源形態(tài),不必一定將數(shù)據(jù)庫(kù)文件轉(zhuǎn)為OFD文檔存儲(chǔ),但應(yīng)保持?jǐn)?shù)據(jù)庫(kù)文件歸檔后的長(zhǎng)期可用性及其生成OFD版式文檔的能力。
應(yīng)用OFD文檔存儲(chǔ)檔案數(shù)據(jù)化資源,應(yīng)保障資源在相關(guān)形態(tài)間順暢轉(zhuǎn)換。例如,高校檔案資源中的教學(xué)成績(jī)單文件,往往以文檔的形態(tài)呈現(xiàn),但生成成績(jī)單文件的支持?jǐn)?shù)據(jù)來(lái)源于教學(xué)數(shù)據(jù)庫(kù),往往以關(guān)系型數(shù)據(jù)庫(kù)文件形態(tài)呈現(xiàn)。那么,成績(jī)單檔案資源應(yīng)以何種形態(tài)實(shí)現(xiàn)數(shù)據(jù)化?是應(yīng)以一個(gè)個(gè)獨(dú)立文檔(每個(gè)文檔對(duì)應(yīng)一份成績(jī)單)的形態(tài)還是以數(shù)據(jù)庫(kù)文件(利用時(shí)再生成獨(dú)立成績(jī)單)的形態(tài)進(jìn)行歸檔存儲(chǔ)?這是權(quán)衡多重因素應(yīng)加以確定的問(wèn)題,以確保文檔版式呈現(xiàn)與數(shù)據(jù)挖掘兩方面需求的充分滿(mǎn)足。
3.2對(duì)檔案資源元數(shù)據(jù)體系充分支持
檔案元數(shù)據(jù)是描述檔案資源與檔案業(yè)務(wù)活動(dòng)的數(shù)據(jù)集合,其主要可分為基本元數(shù)據(jù)、管理元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)等。“互聯(lián)網(wǎng)+檔案”建設(shè)“四重境界”的發(fā)展要求對(duì)檔案資源元數(shù)據(jù)加以充分重視,各重境界的目標(biāo)必須依靠檔案元數(shù)據(jù)的有效支持方能實(shí)現(xiàn)。這也就意味著,除了對(duì)檔案資源本身充分包容之外,OFD文檔也必須充分支持檔案資源元數(shù)據(jù)體系的存儲(chǔ)。
高校檔案資源元數(shù)據(jù)往往采用諸如都柏林核心元素集、MARC、GILS、FGDC/CSDGM等技術(shù)標(biāo)準(zhǔn),因此OFD文檔應(yīng)對(duì)相關(guān)的元數(shù)據(jù)實(shí)現(xiàn)充分有效的存儲(chǔ),并保障其長(zhǎng)期可用性。
相關(guān)研究表明[7],在一些情況下,OFD對(duì)于檔案文檔資源的屬性元數(shù)據(jù)保存存在信息損失現(xiàn)象。一些格式的流式文檔在轉(zhuǎn)換為OFD版式文檔后,一部分元數(shù)據(jù)會(huì)發(fā)生損失。這種缺失元數(shù)據(jù)副本的問(wèn)題對(duì)于電子檔案資源來(lái)講并非是可忽略的小問(wèn)題,應(yīng)著力加以解決。在建設(shè)OFD文檔資源工程中,應(yīng)充分認(rèn)識(shí)到元數(shù)據(jù)對(duì)檔案資源的戰(zhàn)略意義,推動(dòng)實(shí)現(xiàn)OFD對(duì)檔案資源元數(shù)據(jù)體系的充分支持。
3.3對(duì)本體論知識(shí)庫(kù)充分支持
以本體論所構(gòu)建的檔案資源信息概念模型是計(jì)算機(jī)可理解的智能工具,這是傳統(tǒng)的主題詞表等工具所不具備的能力。本體方法比傳統(tǒng)的分類(lèi)法、主題法等具有更強(qiáng)的知識(shí)導(dǎo)航功能,從而實(shí)現(xiàn)對(duì)檔案資源更有效的智能管理與組織。因此,本體知識(shí)庫(kù)對(duì)于實(shí)現(xiàn)檔案資源智能檢索等方面具有重要意義。
本體技術(shù)一般具有四個(gè)核心:一是形式化(Formal),本體是計(jì)算機(jī)可理解的;二是概念模型(Conceptualization),從現(xiàn)實(shí)世界抽象得到的、獨(dú)立于具體環(huán)境的概念集合;三是共享(Share),本體中所涵蓋的是人們對(duì)于事物的共同認(rèn)知;四是明確(Explicit),本體中的概念與概念之間的聯(lián)系均有明確約束。本體的描述語(yǔ)言主要包括RDF、RDFS、OWL等。
檔案資源領(lǐng)域的本體知識(shí)庫(kù)建設(shè)一般通過(guò)領(lǐng)域?qū)<业南到y(tǒng)性設(shè)計(jì)實(shí)現(xiàn)。通過(guò)將檔案資源所含知識(shí)建為本體知識(shí)庫(kù),實(shí)現(xiàn)以本體形式化描述檔案資源,以有效揭示檔案資源所反映的豐富內(nèi)容,提升檔案資源管理利用的智能化水平。所建設(shè)的本體知識(shí)庫(kù)作為智慧結(jié)晶,應(yīng)確??煽康拈L(zhǎng)期可用性。因此,應(yīng)探索應(yīng)用OFD文檔標(biāo)準(zhǔn)對(duì)檔案資源本體知識(shí)庫(kù)實(shí)施可靠存儲(chǔ)。通過(guò)發(fā)揮OFD標(biāo)準(zhǔn)在持續(xù)可解釋、顯示一致性、可轉(zhuǎn)換性等方面的優(yōu)勢(shì),使檔案資源本體知識(shí)庫(kù)獲得一種良好的存儲(chǔ)環(huán)境,發(fā)揮其應(yīng)有作用。
3.4對(duì)檔案資源協(xié)同過(guò)濾機(jī)制充分支持
個(gè)性化推薦是實(shí)現(xiàn)檔案資源智慧檢索的重要支持機(jī)制之一,協(xié)同過(guò)濾是實(shí)現(xiàn)個(gè)性化推薦的核心機(jī)制。為實(shí)現(xiàn)檔案資源協(xié)同過(guò)濾,需要收集存儲(chǔ)檔案用戶(hù)對(duì)檔案資源的評(píng)價(jià)反饋數(shù)據(jù)、檔案用戶(hù)自身屬性數(shù)據(jù)、檔案資源利用行為數(shù)據(jù)等。這些數(shù)據(jù)應(yīng)與檔案資源數(shù)據(jù)化成果密切結(jié)合,有效驅(qū)動(dòng)檔案智慧檢索系統(tǒng)的運(yùn)作。因此,對(duì)檔案資源協(xié)同過(guò)濾支持?jǐn)?shù)據(jù)的有效存儲(chǔ)和可用性保障可作為OFD文檔的一項(xiàng)應(yīng)用。
OFD文檔標(biāo)準(zhǔn)是基于XML實(shí)現(xiàn)的,具有較強(qiáng)的描述結(jié)構(gòu)化數(shù)據(jù)的能力。而協(xié)同過(guò)濾支持?jǐn)?shù)據(jù)在概念模型層面往往是矩陣的形式,在邏輯存儲(chǔ)層面則可采用結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)。因此,應(yīng)用OFD標(biāo)準(zhǔn)對(duì)協(xié)同過(guò)濾支持?jǐn)?shù)據(jù)進(jìn)行存儲(chǔ)是較為可行的。也就是將協(xié)同過(guò)濾支持?jǐn)?shù)據(jù)作為若干獨(dú)立的OFD文檔進(jìn)行歸檔存儲(chǔ)。該方式可較大程度上發(fā)揮OFD標(biāo)準(zhǔn)的優(yōu)勢(shì),實(shí)現(xiàn)檔案資源協(xié)同過(guò)濾平穩(wěn)有效運(yùn)行。
與將協(xié)同過(guò)濾支持?jǐn)?shù)據(jù)嵌入檔案資源本身存儲(chǔ)相比,將協(xié)同過(guò)濾支持?jǐn)?shù)據(jù)作為若干獨(dú)立的OFD文檔進(jìn)行歸檔存儲(chǔ)有諸多優(yōu)點(diǎn)。例如檔案用戶(hù)評(píng)分反饋數(shù)據(jù)可獨(dú)立作為一系列OFD文檔存在,從而實(shí)現(xiàn)矩陣計(jì)算等方面的快速調(diào)用與運(yùn)算,無(wú)需每次都調(diào)用檔案資源本身對(duì)應(yīng)的各個(gè)OFD文檔。而檔案用戶(hù)屬性等數(shù)據(jù)作為獨(dú)立的OFD存儲(chǔ),則有利于避免數(shù)據(jù)冗余與數(shù)據(jù)不一致等問(wèn)題的出現(xiàn)。
3.5對(duì)檔案資源跨界獲取數(shù)據(jù)交換充分支持
應(yīng)充分發(fā)揮OFD標(biāo)準(zhǔn)在安全性、兼容性等方面的優(yōu)勢(shì),促進(jìn)檔案資源數(shù)據(jù)化成果的遠(yuǎn)程跨界交換共享的實(shí)現(xiàn)。
檔案資源的跨界獲取完備主要可分為兩類(lèi)應(yīng)用場(chǎng)景:一是事務(wù)辦理類(lèi),二是興趣研究類(lèi)。前者要求檔案資源在事務(wù)所涉及的組織機(jī)構(gòu)之間能夠?qū)崿F(xiàn)交換共享,后者要求與研究主題相關(guān)的檔案資源能夠打破物理位置限制而實(shí)現(xiàn)交換共享。當(dāng)前應(yīng)充分利用OFD標(biāo)準(zhǔn)推進(jìn)實(shí)現(xiàn)這兩類(lèi)場(chǎng)景檔案資源的跨界獲取交換。
由于OFD格式基于業(yè)界主流的“XML描述+ZIP打包”模式,因此OFD標(biāo)準(zhǔn)產(chǎn)品從其內(nèi)在機(jī)制上就較為適合實(shí)現(xiàn)數(shù)據(jù)化檔案資源的遠(yuǎn)程跨界交換。一方面,XML是各種應(yīng)用程序之間進(jìn)行數(shù)據(jù)傳輸?shù)淖畛S玫墓ぞ?,為異?gòu)平臺(tái)間交換數(shù)據(jù)提供了良好的描述能力。另一方面,ZIP打包支持諸如ASIP、TSIP、AIP、DIP等信息包交換,易于實(shí)現(xiàn)數(shù)據(jù)化檔案資源的跨界共享。此外,OFD標(biāo)準(zhǔn)支持以數(shù)字簽名等方式進(jìn)行數(shù)據(jù)交換過(guò)程中的安全認(rèn)證,在數(shù)據(jù)交換安全性方面有較好保障。在以O(shè)FD標(biāo)準(zhǔn)存儲(chǔ)檔案資源數(shù)據(jù)化成果的基礎(chǔ)上,應(yīng)進(jìn)一步開(kāi)發(fā)OFD文檔跨界交換應(yīng)用軟件,制定相應(yīng)數(shù)據(jù)交換規(guī)章制度,實(shí)現(xiàn)四重境界的建設(shè)目標(biāo)。
4總結(jié)
OFD當(dāng)前是一個(gè)主標(biāo)準(zhǔn),解決了數(shù)據(jù)存儲(chǔ)、壓縮、位置等問(wèn)題,但其相關(guān)標(biāo)準(zhǔn)族尚待研究完善。這不僅是一個(gè)圍繞OFD的技術(shù)問(wèn)題,更是對(duì)于檔案資源數(shù)據(jù)化拓展與深化認(rèn)識(shí)的問(wèn)題。只有全面深刻認(rèn)識(shí)檔案資源數(shù)據(jù)化、以數(shù)據(jù)化實(shí)踐拓展OFD應(yīng)用領(lǐng)域,才能形成建立在實(shí)際需求之上的完善標(biāo)準(zhǔn)體系。
為此本文基于OFD標(biāo)準(zhǔn)提出若干檔案資源數(shù)據(jù)化實(shí)現(xiàn)策略,對(duì)于拓展OFD標(biāo)準(zhǔn)應(yīng)用、推動(dòng)檔案資源數(shù)據(jù)化工程具有積極意義。
*本文系中國(guó)高等教育學(xué)會(huì)檔案工作分會(huì)研究課題“‘互聯(lián)網(wǎng)+’時(shí)代高校檔案館發(fā)展研究”(項(xiàng)目編號(hào):ZGD-Y-2018-05)階段性研究成果。
注釋與參考文獻(xiàn)
[1]田偉,韓海濤.基于“四重境界”的“互聯(lián)網(wǎng)+檔案”建設(shè)策略研究[J].檔案學(xué)研究, 2019(3):55-61.
[2][7]王姝,徐華,王少康.OFD版式文檔應(yīng)用研究[J].檔案學(xué)研究,2019(1):95-100.
[3]高林,李海波,叢培勇,王寒冰.OFD版式文檔國(guó)家標(biāo)準(zhǔn)解讀[J].信息技術(shù)與標(biāo)準(zhǔn)化,2016(10):42-44.
[4]周楓,呂東偉,鄧晶京,黃麗萍,駱建珍.OFD格式在檔案領(lǐng)域的應(yīng)用初探[J].檔案管理,2018(4):35-37.
[5]郭曉云.國(guó)家版式文檔格式規(guī)范(OFD)標(biāo)準(zhǔn)[J].蘭臺(tái)世界,2018(3):33-36+12.
[6]梁凱.檔案部門(mén)應(yīng)用OFD格式的若干思考[J].浙江檔案,2017(1):64.