摘 要:大數(shù)據(jù)時代,檔案信息資源數(shù)量規(guī)模龐大,且呈現(xiàn)出異構(gòu)化特征。檔案信息資源是戰(zhàn)略性、基礎(chǔ)性的生產(chǎn)要素,要注重做好大數(shù)據(jù)背景下檔案信息資源整合與共享,最大限度地發(fā)揮檔案信息資源“存史、資政、育人”功能。本文從數(shù)據(jù)資源、信息采集、基礎(chǔ)設(shè)施、現(xiàn)實問題等四個方面分析了檔案信息資源共享及其現(xiàn)狀,并從內(nèi)容、原則和模式等方面提出了檔案信息資源整合與共享的深刻內(nèi)涵。在此基礎(chǔ)上提出在大數(shù)據(jù)背景下檔案信息資源整合與共享機制構(gòu)建策略,對整合與共享大數(shù)據(jù)背景下檔案信息資源,最大限度地發(fā)揮檔案資源經(jīng)濟與社會價值具有積極的現(xiàn)實指導(dǎo)意義。
關(guān)鍵詞:大數(shù)據(jù);檔案信息;資源整合與共享;機制
大數(shù)據(jù)(Big Data),即來自各種來源的大量非結(jié)構(gòu)化或結(jié)構(gòu)化的數(shù)據(jù)?;诨ヂ?lián)網(wǎng)普及與發(fā)展、存儲技術(shù)進步、移動設(shè)備廣泛使用的大數(shù)據(jù)時代,信息處理能力顯著增強。《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》中3次提及“大數(shù)據(jù)”:推動檔案全面納入國家大數(shù)據(jù)戰(zhàn)略;加強大數(shù)據(jù)等新一代信息技術(shù)在數(shù)字檔案館(室)建設(shè)中的應(yīng)用;大數(shù)據(jù)環(huán)境中電子文件與電子檔案一體化管理。同時指出“檔案作為重要信息資源和獨特歷史文化遺產(chǎn),價值日益凸顯”,要“推進檔案信息資源共享平臺建設(shè)”。檔案信息資源是人類活動中積累起來的以檔案信息為核心的檔案信息活動各要素的集合,包括檔案信息要素、人的要素、技術(shù)要素及其他要素。檔案信息資源在促進社會進步、推動經(jīng)濟發(fā)展等方面起著重要作用,并逐步成為一種基礎(chǔ)性資源和戰(zhàn)略性生產(chǎn)要素[1]。近年來,隨著數(shù)據(jù)技術(shù)、信息技術(shù)及網(wǎng)絡(luò)技術(shù)的應(yīng)用,高校人事、教學(xué)、科研等檔案管理過程中產(chǎn)生大量數(shù)據(jù)資源,但由于業(yè)務(wù)基礎(chǔ)軟件、硬件資源建設(shè)分散,檔案信息資源分散存儲于各個部門,缺少有效整合,無法實時共享利用,逐漸形成了事實上的“信息孤島”,不利于檔案信息資源價值的發(fā)揮,也制約了高校檔案事業(yè)高質(zhì)量發(fā)展。因此,開展大數(shù)據(jù)背景下檔案信息資源與共享研究意義重大。
1 檔案信息資源整合與共享現(xiàn)狀分析
《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》指出,“十三五”時期我國檔案館館藏較“十二五”末增長38.9%,開放檔案17659萬卷(件),接待利用2755.9萬人次。還要求,按照“增量電子化、存量數(shù)字化”原則,到“十四五”末,我國中央、國家機關(guān)傳統(tǒng)載體檔案數(shù)字化率要達到80%,全國縣級以上綜合檔案館檔案數(shù)字化率也要達到80%。目前,各級檔案館、檔案管理部門、高校等主管部門、行業(yè)機構(gòu)紛紛建起檔案文獻數(shù)據(jù)中心,開通檔案管理網(wǎng)站以及檔案管理系統(tǒng)等,檔案信息化建設(shè)取得顯著成效,極大地提高了檔案工作管理的水平,也為檔案信息資源整合與共享機制建設(shè)奠定了扎實基礎(chǔ)。
1.1 數(shù)據(jù)資源
根據(jù)第54次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》公布相關(guān)數(shù)據(jù),截至2024年6月底,我國網(wǎng)民規(guī)模為10.996億人,較2023年12月增長742萬人,互聯(lián)網(wǎng)普及率達78%,較2023年12月提升了0.5個百分點,網(wǎng)站數(shù)量為391萬個,移動互聯(lián)網(wǎng)接入流量達1604億GB,利用人工智能技術(shù)等搜索引擎用戶使用率為75%,線上辦公用戶為4.9959億人。截至2023年底,我國通過省級及以上檔案主管部門認證的數(shù)字檔案館為369個。館藏電子檔案2289.6TB,館藏檔案數(shù)字化成果28849.2TB??傮w來看,全國各級檔案管理機構(gòu)館藏的檔案信息資源呈現(xiàn)出快速增長趨勢,需要進一步整合相關(guān)檔案信息資源,通過開放共享機制的建立,實現(xiàn)大數(shù)據(jù)背景下檔案信息資源的互聯(lián)互通與共享共用。
1.2 信息采集
我國已經(jīng)建成了中央、省、市、縣四級綜合檔案管理組織架構(gòu)。根據(jù)《檔案法》第十五條規(guī)定,機關(guān)、團體和企業(yè)事業(yè)單位等應(yīng)“定期向檔案館移交檔案”。根據(jù)國家檔案館公布的統(tǒng)計數(shù)據(jù)顯示,截至2023年底,我國中央、省、市、縣級綜合檔案館館藏檔案126846.5萬卷/件,其中縣級90395.9萬卷/件,占71.26%。館藏紙質(zhì)資料4381.2萬冊,照片檔案2862.0萬張,錄音磁帶、錄像磁帶、影片檔案112.3萬盤。各級檔案館均建立了專門的檔案管理系統(tǒng)平臺,業(yè)務(wù)系統(tǒng)接入檔案管理平臺,實現(xiàn)檔案數(shù)據(jù)信息實時采集,使各級檔案館館藏檔案資源的數(shù)量和類型呈現(xiàn)出較大幅度的增長態(tài)勢。
1.3 基礎(chǔ)設(shè)施
根據(jù)國家檔案館發(fā)布的《2023年度全國檔案主管部門和檔案館基本情況摘要》,截至2023年底,中央、省市縣四級綜合檔案館總建筑面積達1624平方米,對外服務(wù)用房建筑面積226.3萬平方米。各級綜合檔案館公開查閱場所2437個,其中縣級綜合檔案館開放查詢場所2030個,占83.3%?!笆濉睍r期,陜西省數(shù)字檔案館(室)建設(shè)步伐進一步加快,縣區(qū)館藏檔案數(shù)字化率平均超過了50%,7個市館藏檔案數(shù)字化率超過80%。隨著館藏數(shù)字檔案數(shù)量的不斷增加,以及群眾對檔案信息資源檢索查詢的現(xiàn)實需要,陜西省檔案主管部門及其他相關(guān)領(lǐng)域紛紛加大了檔案基礎(chǔ)設(shè)施建設(shè)投入力度,基礎(chǔ)設(shè)施建設(shè)進一步得到了改善。
1.4 現(xiàn)實問題
檔案信息資源共享程度顯著提高是“十四五”時期全國檔案事業(yè)發(fā)展的主要目標(biāo)之一。目前,我國檔案信息資源整合與共享領(lǐng)域存在的主要問題有[2]:一是缺乏統(tǒng)一的標(biāo)準(zhǔn)規(guī)范。不同行業(yè)、不同系統(tǒng)及不同數(shù)字信息技術(shù)的應(yīng)用,使得檔案數(shù)據(jù)格式、標(biāo)準(zhǔn)不一致,導(dǎo)致檔案數(shù)字不兼容,影響檔案信息資源的整合與共享。二是缺乏精準(zhǔn)的用戶識別。檔案信息資源整合是前提,共享是目的。共享的實質(zhì)是為廣大用戶提供優(yōu)質(zhì)、高效、便捷的檔案信息檢索與查詢服務(wù)。但從現(xiàn)實情況看,檔案信息資源呈現(xiàn)較強的分散性,檔案信息價值較低,沒有根據(jù)用戶檔案信息資源使用習(xí)慣和需求提供高價值、針對性的檔案服務(wù),檔案服務(wù)用戶的識別度不夠精準(zhǔn)。三是缺乏高效的利用協(xié)調(diào)。檔案信息資源整合與共享屬于一種行為,需要協(xié)調(diào)政府、受眾及平臺媒介三方共同發(fā)揮作用。一直以來“重管輕用”“信息孤島”等傳統(tǒng)問題依然存在,檔案信息資源整合與共享主體、客體及媒介三方協(xié)調(diào)機制缺乏。
2 檔案信息資源整合與共享內(nèi)涵解析
檔案信息資源整合是避免檔案信息資源重復(fù)建設(shè)、保證檔案資源配置最優(yōu)化、實現(xiàn)經(jīng)濟效益最大化的有效途徑[3]。在大數(shù)據(jù)背景下,數(shù)字技術(shù)應(yīng)用使檔案信息與檔案實體分離,利用信息網(wǎng)絡(luò)技術(shù)將檔案信息資源整合、實現(xiàn)檔案信息資源共享是滿足人民群眾檔案信息需求的重要支撐。
2.1 檔案信息資源整合與共享內(nèi)容
根據(jù)《檔案法》規(guī)定,我國檔案工作實行“統(tǒng)一領(lǐng)導(dǎo)、分級管理”原則。在大數(shù)據(jù)背景下,這種管理模式下檔案信息資源面臨系統(tǒng)或行業(yè)條塊分割、體制約束等現(xiàn)實困境[4]。首先,檔案信息及其數(shù)據(jù)本身的整合與共享。信息是檔案信息資源整合的最基本元素,在大數(shù)據(jù)背景下,信息呈現(xiàn)數(shù)據(jù)異構(gòu)性,聯(lián)結(jié)性與多維性不足,數(shù)據(jù)信息分散、延遲和價值低密度等,需要運用信息技術(shù)將其整合成有序、整齊和效用持久的有機整體,并實現(xiàn)信息數(shù)據(jù)共享利用。其次,檔案信息技術(shù)及其標(biāo)準(zhǔn)整合與共享。在大數(shù)據(jù)背景下,檔案信息資源內(nèi)容海量化、形式多樣化、服務(wù)個性化,信息網(wǎng)絡(luò)技術(shù)成為檔案信息資源整合與共享的關(guān)鍵因素。涉及檔案信息數(shù)據(jù)轉(zhuǎn)換、存儲、壓縮、分類、檢索及系統(tǒng)集成等技術(shù)及實現(xiàn)技術(shù)應(yīng)用的外在標(biāo)準(zhǔn)規(guī)范。統(tǒng)一的檔案信息技術(shù)整合與共享標(biāo)準(zhǔn)體系是保障檔案信息資源整合與共享的技術(shù)支持。最后,檔案信息系統(tǒng)及其運行的整合與共享。在大數(shù)據(jù)背景下,檔案信息資源整合與共享是需要在統(tǒng)一的系統(tǒng)中實現(xiàn)檔案信息資源跨庫、無縫連接,通過檔案信息交換及共享系統(tǒng)平臺,實現(xiàn)檔案信息資源共建共享。
2.2 檔案信息資源整合與共享原則[5]
首先是完整系統(tǒng)原則。檔案信息資源整合要的是全面的整合、完整的整合、系統(tǒng)的整合和有序的整合,而不是個別、片面、分割和無序的整合與共享,否則也不能稱之為高效的整合與共享。其次是科學(xué)規(guī)范原則。檔案信息資源整合與共享要遵從大數(shù)據(jù)背景下檔案信息資源發(fā)展的特點和規(guī)律,要根據(jù)《檔案法》《保密法》等相關(guān)規(guī)定,確定檔案信息資源整合與共享的范圍、組織形式。再次是高效便利原則。在大數(shù)據(jù)背景下,檔案信息資源跨庫、跨系統(tǒng)整合與共享成為現(xiàn)實,檔案信息資源整合與共享技術(shù)的選擇、系統(tǒng)的運用及平臺的搭建都要始終堅持高效便利原則,發(fā)揮檔案信息資源整體價值、功能的最大化。最后是經(jīng)濟實用原則。在大數(shù)據(jù)背景下,檔案信息資源整合與共享要堅持成本控制法,既要實現(xiàn)檔案信息資源應(yīng)整合盡整合,應(yīng)共享盡共享,避免檔案信息資源閑置、浪費,也要本著節(jié)約原則,以最少的人力、物力和財力成本取得整合與共享價值效益的最大化。
2.3 檔案信息資源整合與共享模式
檔案信息資源整合與共享包括實體模式與虛擬模式兩種,其中,大數(shù)據(jù)背景下,檔案信息資源整合與共享主要是“虛擬模式”,是通過邏輯關(guān)系將分散、無序的檔案資源“虛擬整合”,并實現(xiàn)“共享”。該模式的實現(xiàn)主要路徑為:首先,入網(wǎng)。即利用虛擬機、主機托管、專線聯(lián)通等技術(shù),將館藏檔案信息資源虛擬化整合與共享;其次,協(xié)作。即在“入網(wǎng)”的基礎(chǔ)上做好區(qū)域文獻信息機構(gòu)之間的有效協(xié)作與配合,推動實現(xiàn)檔案信息資源整體化組織與建設(shè)。再次,一站式。在入網(wǎng)、協(xié)作的基礎(chǔ)上,檔案管理部門要利用大數(shù)據(jù)、互聯(lián)網(wǎng)和知識圖譜等技術(shù),開展檔案信息資源知識的挖掘,使檔案信息資源從形式、內(nèi)容整合與共享“升級”至“知識”級整合與共享的更高層級形式。從檔案信息資源整合與共享的結(jié)果來看,包括檔案館(室)、區(qū)域性和全國性三個不同層級的檔案信息資源整合與共享體系,整合與共享的層級越來越高、規(guī)模越來越大,最高層級必然是“橫向到邊、縱向到底”的終極目標(biāo),是綜合性檔案信息資源的開放與共享。
3 檔案信息資源整合與共享機制構(gòu)建
3.1 構(gòu)建標(biāo)準(zhǔn)規(guī)范體系
在大數(shù)據(jù)背景下,檔案信息資源存儲、傳輸、檢索和利用的形式更加多樣化與智能化,要實現(xiàn)檔案信息資源整合與共享,就需要國家檔案局及相當(dāng)層級的管理部門,從頂層做好標(biāo)準(zhǔn)規(guī)范體系的規(guī)劃設(shè)計,構(gòu)建全國統(tǒng)一或某個行業(yè)、系統(tǒng)的檔案信息系統(tǒng)標(biāo)準(zhǔn)、數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)等規(guī)范體系。當(dāng)前,要加快推進檔案數(shù)據(jù)庫結(jié)構(gòu)標(biāo)準(zhǔn)的制定,強化檔案領(lǐng)域、信息產(chǎn)業(yè)領(lǐng)域、特殊行業(yè)之間的協(xié)作,確保制定的標(biāo)準(zhǔn)規(guī)范體系具有前瞻性、可行性和先進性,與國際通用標(biāo)準(zhǔn)規(guī)范一致。
3.2 推動法律法規(guī)實施
《檔案法》《檔案法實施條例》等法律法規(guī)的頒布實施,為檔案信息資源整合與共享提供了強有力的法治化保障。關(guān)鍵在于落實。一方面,要加強譜法宣傳教育。把《檔案法》《保密法》《檔案法實施條例》等法律法規(guī)條例作為一項常規(guī)性工作,熟悉法條內(nèi)容,吃透立法精神,明確責(zé)任義務(wù),切實增強落實法規(guī)的思想自覺與行動自覺。另一方面,要加大落實監(jiān)督檢查。《檔案法》《檔案法實施條例》均詳細規(guī)定了“檔案信息化建設(shè)”“檔案的利用和公布”,檔案信息資源整合與共享要按照業(yè)已出臺的法律法規(guī)要求,加快推進“電子檔案管理信息系統(tǒng)建設(shè),與辦公自動化系統(tǒng)、業(yè)務(wù)系統(tǒng)等相銜接”,及時向社會開放到期檔案的信息資源,滿足民眾對信息的需求。同時,檔案主管部門、機關(guān)、團體、企業(yè)事業(yè)單位要落實監(jiān)督檢查的法律職責(zé),做到有法必依、執(zhí)法必嚴、違法必究,使檔案信息資源整合與共享始終在法治軌道上進行。
3.3 搭建總體技術(shù)框架[6]
要做好頂層規(guī)劃設(shè)計,從檔案信息化發(fā)展全局高度出發(fā),整合各方檔案信息資源,滿足共享需求,搭建整合共享總體技術(shù)框架,實現(xiàn)檔案信息資源獲取、傳輸、存儲、交換、共享和應(yīng)用。總體技術(shù)框架包括基礎(chǔ)設(shè)施、數(shù)據(jù)采集、數(shù)據(jù)資源等業(yè)務(wù)應(yīng)用的整合共享。即利用局域網(wǎng)、互聯(lián)網(wǎng)與業(yè)務(wù)網(wǎng)融合,完善檔案信息資源整合共享的信息傳輸、存儲、利用和維護的基礎(chǔ)設(shè)施條件。搭建檔案數(shù)據(jù)管理平臺,利用網(wǎng)絡(luò)爬蟲、離線傳輸?shù)燃夹g(shù),實現(xiàn)各類多元異構(gòu)數(shù)據(jù)信息的實時采集與共享交換。利用元數(shù)據(jù)、數(shù)據(jù)庫、數(shù)據(jù)資源目錄等,整合與共享數(shù)據(jù)資源,按照高效、可擴展、完整等針對用戶識別不夠精準(zhǔn)等問題,按照物理或邏輯集中整合原則,重構(gòu)檔案信息資源關(guān)系,并進行分類存儲,構(gòu)建結(jié)構(gòu)清晰、邏輯合理、流程規(guī)范的數(shù)據(jù)資源目錄和交換體系。建立專門的檔案數(shù)據(jù)管理平臺,采用面向?qū)ο笤O(shè)計和MVVM技術(shù)框架,建立檔案數(shù)據(jù)管理平臺,采用身份認證等權(quán)限管理,實現(xiàn)檔案信息資源整合與共享的安全、可靠。
3.4 改革管理體制機制
在大數(shù)據(jù)背景下,檔案信息資源整合與共享要堅持“三分建、七分管”的原則,積極探索信息網(wǎng)絡(luò)、知識要素環(huán)境下檔案信息資源整合與共享管理體制機制。要樹立“大檔案”管理意識,重塑檔案信息資源整合路徑,統(tǒng)一檔案信息資源標(biāo)準(zhǔn),實現(xiàn)檔案信息數(shù)據(jù)交互。按照“存量數(shù)字化、增量電子化”原則,積極落實單軌制,持續(xù)優(yōu)化館藏檔案資源結(jié)構(gòu)。始終堅持黨對檔案信息資源整合與共享工作領(lǐng)導(dǎo),堅持在“統(tǒng)一領(lǐng)導(dǎo)、分級管理”原則的基礎(chǔ)上,嚴格落實檔案信息資源整合與共享責(zé)任清單化、閉環(huán)式的管理機制。堅持檔案開放及開放審核機制,把檔案信息化納入發(fā)展規(guī)劃,加快推進全行業(yè)、全系統(tǒng)檔案數(shù)字資源整合與共享。
參考文獻
[1]蔣冠.網(wǎng)絡(luò)環(huán)境下檔案信息資源整合研究[D].湘潭:湘潭大學(xué),2005.
[2]束孟卿.大數(shù)據(jù)背景下檔案信息資源整合與服務(wù)模式探[J].2024(4):49-51.
[3]王爽,王彤.關(guān)于檔案信息資源整合的思考[J].蘭臺內(nèi)外,2013(2):40.
[4]曹航,謝敏.條塊分割、體制約束與機制創(chuàng)新——對檔案信息資源整合的再思考[J].檔案管理,2010(1):7-10.
[5]余厚洪.2003年~2011年我國檔案信息資源整合研究綜述[J].檔案管理,2012(1):63-65.
[6]陳龍,代強,周婧等.四川省智慧水利信息化資源整合共享研究與實踐[J].四川水利,2024(3):174-177.
作者簡介:同燕媚(1979.8—),大學(xué)學(xué)歷,延安大學(xué)西安創(chuàng)新學(xué)院檔案館員。