侯作龍 吳磊
摘 要:檔案事業(yè)作為一項基礎(chǔ)性服務(wù)性事業(yè),面臨大數(shù)據(jù)技術(shù)帶來的沖擊和影響。本文通過分析認為,作為檔案工作的從業(yè)者,需要深入思考如何與大數(shù)據(jù)技術(shù)融合發(fā)展,既要為大數(shù)據(jù)技術(shù)產(chǎn)業(yè)發(fā)展服務(wù),又要利用大數(shù)據(jù)技術(shù)發(fā)展促進自身發(fā)展。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;關(guān)注方向
人類進入二十一世紀之后,信息產(chǎn)業(yè)技術(shù)迅猛發(fā)展,特別是大數(shù)據(jù)技術(shù)更是突飛猛進,給人們的生活帶來了普遍影響。時至今日,各個行業(yè)都在思考如何利用大數(shù)據(jù)技術(shù)為本行業(yè)本產(chǎn)業(yè)服務(wù),都在尋找與大數(shù)據(jù)技術(shù)融合的最佳結(jié)合點。
檔案事業(yè)是基礎(chǔ)性事業(yè),也是服務(wù)性事業(yè),同樣面臨大數(shù)據(jù)技術(shù)帶來的沖擊和影響,一樣要思考如何與大數(shù)據(jù)技術(shù)融合發(fā)展,既要為大數(shù)據(jù)技術(shù)產(chǎn)業(yè)發(fā)展服務(wù),又要利用大數(shù)據(jù)技術(shù)發(fā)展促進自身發(fā)展。
1 大數(shù)據(jù)技術(shù)發(fā)展對檔案資源體系建設(shè)影響之一:來源更廣了
在人們的固有觀念里,檔案部門收藏的都是一些有關(guān)黨和國家的檔案,這就大大地限制了檔案的來源,把檔案的范圍集中在機關(guān)和企事業(yè)單位。大數(shù)據(jù)時代背景下,互聯(lián)網(wǎng)、社會、大眾生活也應該成為獲取檔案數(shù)據(jù)的來源。隨著互聯(lián)網(wǎng)的普及,越來越多的數(shù)據(jù)來自互聯(lián)網(wǎng)?;ヂ?lián)網(wǎng)已經(jīng)成為最大的信息資源生產(chǎn)地。我國的網(wǎng)民數(shù)量已經(jīng)穩(wěn)居世界各國之首。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心官網(wǎng)消息,第49次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》(以下簡稱《報告》)2月25日在京發(fā)布?!秷蟾妗凤@示,截至2021年12月,我國網(wǎng)民規(guī)模達10.32億,互聯(lián)網(wǎng)普及率達73.0%,我國網(wǎng)民人均每周上網(wǎng)時長達到28.5個小時。城鄉(xiāng)上網(wǎng)差距繼續(xù)縮小,我國農(nóng)村網(wǎng)民規(guī)模已達2.84億,農(nóng)村地區(qū)互聯(lián)網(wǎng)普及率為57.6。老年群體加速融入網(wǎng)絡(luò)社會,截至2021年12月,我國60歲及以上老年網(wǎng)民規(guī)模達1.19億,互聯(lián)網(wǎng)普及率達43.2%??梢?,互聯(lián)網(wǎng)產(chǎn)生的海量信息已經(jīng)成為檔案數(shù)據(jù)的一個重要來源。
同時,加大對民生的關(guān)注力度是檔案部門獲取檔案數(shù)據(jù)來源的又一個大的變化。最近幾年,為了響應國家政策,檔案部門加大了收集與民眾切身利益相關(guān)的民生檔案的工作力度。檔案部門還利用國際檔案日對普通公民展開教育,幫助民眾樹立社會檔案意識,喚起人們對我國的檔案事業(yè)的關(guān)注。[1]當前,為了使我國的檔案管理向生活化、草根化方向發(fā)展,家庭檔案和個人檔案的建立正成為一種新的趨勢。
2 大數(shù)據(jù)技術(shù)發(fā)展對檔案資源體系建設(shè)影響之二:內(nèi)容更豐富了
信息資源是檔案部門安身立命的根本所在。信息資源數(shù)量越是大、門類越是多,檔案的價值才越能夠發(fā)揮出來,愈加凸顯檔案部門的社會地位。當信息技術(shù)進入大數(shù)據(jù)時代,檔案部門也意識到自身變革的重要性,開始不斷改變自身[2]。
2.1 檔案數(shù)據(jù)量幾何級增長
大數(shù)據(jù)時代背景下,我國檔案數(shù)據(jù)資源在總量上呈現(xiàn)出快速增長的趨勢[3]。截至2020年底,全國各級綜合檔案館館藏檔案91789.8萬卷、件。其中,中央級2046.6萬卷、件,?。▍^(qū)、市)級4666.9萬卷、件,副省級2456.4萬卷、件,地(市、州、盟)級19050.2萬卷、件,縣(區(qū)、旗、市)級63569.7萬卷、件。照片檔案2401.0萬張。其中,中央級20.0萬張,?。▍^(qū)、市)級285.5萬張,副省級235.5萬張,地(市、州、盟)級607.6萬張,縣(區(qū)、旗、市)級1252.4萬張。錄音磁帶、錄像磁帶、影片檔案112.1萬盤。其中,中央級1.8萬盤,省(區(qū)、市)級26.7萬盤,副省級3.4萬盤,地(市、州、盟)級32.5萬盤,縣(區(qū)、旗、市)級47.7萬盤。館藏電子檔案1387.5TB,其中,數(shù)碼照片390.2TB,數(shù)字錄音、數(shù)字錄像523.5TB。館藏檔案數(shù)字化成果19588.5TB。2020年度全國各級綜合檔案館共接收檔案8310.1萬卷、件,照片檔案105.3萬張,錄音磁帶、錄像磁帶、影片檔案4.4萬盤。2020年度全國各級綜合檔案館共征集檔案91.7萬卷、件,照片檔案25.6萬張,錄音磁帶、錄像磁帶、影片檔案0.4萬盤。截至2020年底,全國各級綜合檔案館紙質(zhì)館藏資料4039.4萬冊。其中,中央級213.6萬冊,省(區(qū)、市)級272.9萬冊,副省級66.8萬冊,地(市、州、盟)級841.6萬冊,縣(區(qū)、旗、市)級2644.5萬冊。隨著新一輪各級各類檔案館的改擴建工程的批復與落地,我國檔案館館藏容量必將持續(xù)增長,對于存量檔案的數(shù)字化處理以及新增檔案的電子化處理將是檔案部門今后一段時間的工作重點,“雙套歸檔制”仍是我國檔案管理的主要制度[4]。而那些經(jīng)過移交、寄存、撤轉(zhuǎn)并改的檔案,很容易就會讓檔案館的館藏存儲量由TB級跨越到PB。
2.2 檔案數(shù)據(jù)類型空前多樣
紙質(zhì)、聲像、實物是常見的三種傳統(tǒng)檔案類型。隨著信息化的普及,電子檔案也成為檔案的一種類型。此外,檔案部門還要對瀏覽查詢記錄、用戶信息等進行保存。這些信息的載體不同、各自特點突出、結(jié)構(gòu)差異大,因此檔案部門以不同的方式把它們分門別類地保管起來。這樣,即使是同一個信息也會因載體的不同而呈現(xiàn)出不同的數(shù)據(jù)形式[5]。同樣的道理,同一個數(shù)據(jù)形式會因載體的不同而呈現(xiàn)出不同的信息。異構(gòu)數(shù)據(jù)大集群便由此產(chǎn)生。隨著大數(shù)據(jù)技術(shù)的發(fā)展,越來越多的半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)將以表格、文檔、圖像、音頻、視頻、網(wǎng)頁等的形態(tài)呈現(xiàn)出來。異構(gòu)化數(shù)據(jù)將是未來檔案館藏的重要來源,類型多樣、非結(jié)構(gòu)化的數(shù)據(jù)將在檔案中占有越來越大的比例[6]。
2.3 檔案數(shù)據(jù)價值密度大幅下降
與一般的信息資源比起來,檔案能夠真實地記錄歷史,因此有著很高的價值。然而,對于大多數(shù)的檔案而言,從它們進入檔案館的那一刻起,便進入了深度睡眠的狀態(tài),少有人問津。相關(guān)調(diào)查表明,真正具有較大利用價值、利用率較高的檔案在全部館藏中的占比并不是很高[7]。隨著大數(shù)據(jù)時代的到來,檔案數(shù)量也在不斷地增加,檔案價值密度也越來越低,因此有價值的檔案的占比越來越低。
2.4 檔案數(shù)據(jù)處理速度隨著技術(shù)進步不斷加快
信息化技術(shù)的普及使得檔案部門對檔案的管理工作,由過去的人工手動管理模式轉(zhuǎn)變?yōu)樾畔⒒?、網(wǎng)絡(luò)化的收、管、用業(yè)務(wù)流程管理模式[8]。時效性和便捷性是大數(shù)據(jù)時代檔案管理工作的兩大特點:第一,互聯(lián)網(wǎng)上的信息更新的速度都會很快,特別是那些有用的信息,若無法將它們快速地抓取出來,這些信息便難覓蹤影;第二,為了更好地滿足用戶的需求,檔案員應該快速地從海量的檔案中提取用戶想要的信息。怎樣才能夠快速地提取出用戶想要的信息呢?云計算技術(shù)是大數(shù)據(jù)背景下檔案部門亟須學習和掌握的一項技術(shù)[9]。云計算技術(shù)基于互聯(lián)網(wǎng)技術(shù),利用各種精密的算法,在大幅度提高檔案資源處理速度的同時,提高查找的準確度。
3 大數(shù)據(jù)技術(shù)發(fā)展對檔案資源體系建設(shè)影響之三:收集方式更多了
在實際工作中,一些單位總是借故拖延或是從未積極主動地把檔案移交給檔案館。修訂后的檔案法賦予了檔案行政管理部門強制執(zhí)行檔案收集移交的權(quán)利,也從法律層面明確了違法違規(guī)人員和行為的法律責任。但這依然屬于傳統(tǒng)的檔案收集模式,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)給檔案管理帶來了新的檔案收集方式:實時捕捉[10]。
互聯(lián)網(wǎng)可謂是深入到每個人的日常生活當中,它所蘊含的信息具有數(shù)量大、更新快、傳播廣的特點。這給大數(shù)據(jù)時代下的檔案收集工作提出了新的挑戰(zhàn)。對于檔案員而言,是否能夠捕捉到有價值的信息并將其歸檔,是對檔案員業(yè)務(wù)能力和操作水平的檢驗[11]。檔案部門應該轉(zhuǎn)變過去那種“等人送上門”的檔案收集辦法,利用云計算技術(shù),實時抓取互聯(lián)網(wǎng)上有用的信息,使檔案資源動態(tài)化,不斷提高互聯(lián)網(wǎng)信息資源抓取的科學性、準確性[12]。
結(jié)語
人類進入二十一世紀之后,人們的生活受到計算機技術(shù)的影響越來越大,第三次技術(shù)革命之后產(chǎn)生的信息產(chǎn)業(yè)技術(shù)越來越快發(fā)展,技術(shù)進步帶來的大數(shù)據(jù)技術(shù)更是突飛猛進。時至今日,信息產(chǎn)業(yè)技術(shù)特別是計算機技術(shù)的影響已經(jīng)深入經(jīng)濟社會生活的方方面面,無論是朝陽產(chǎn)業(yè)還是夕陽產(chǎn)業(yè),都在寄希望于能夠利用信息產(chǎn)業(yè)技術(shù)或者計算機技術(shù)促進本行業(yè)本產(chǎn)業(yè)的技術(shù)革新,都在思考如何利用大數(shù)據(jù)技術(shù)為本行業(yè)本產(chǎn)業(yè)服務(wù),都在尋找與大數(shù)據(jù)技術(shù)融合的最佳結(jié)合點。檔案事業(yè)是基礎(chǔ)性事業(yè),也是服務(wù)性事業(yè),檔案工作者要思考如何與大數(shù)據(jù)技術(shù)融合發(fā)展,既要發(fā)揮檔案事業(yè)基礎(chǔ)性工作、服務(wù)性工作的特性,為大數(shù)據(jù)技術(shù)產(chǎn)業(yè)發(fā)展服務(wù),發(fā)揮檔案為科學研究科技進步提供基礎(chǔ)數(shù)據(jù)服務(wù)的作用;又要利用大數(shù)據(jù)技術(shù)發(fā)展促進自身發(fā)展,利用大數(shù)據(jù)技術(shù)促進檔案管理工作提高效率、降低成本,進一步利用大數(shù)據(jù)技術(shù)提高檔案服務(wù)工作水平,做到超前服務(wù)、精準服務(wù)和個性化需求服務(wù)。本文從來源、內(nèi)容和收集三個方面總結(jié)了大數(shù)據(jù)技術(shù)發(fā)展對檔案資源體系建設(shè)具有重大影響,希望能夠引起檔案管理人員的注意,引起大家的共鳴,共同研究大數(shù)據(jù)技術(shù)發(fā)展對檔案資源體系建設(shè)的意義,揚其所長,避其所短,讓大數(shù)據(jù)技術(shù)為檔案資源體系建設(shè)賦能。
參考文獻
[1]陳如明.大數(shù)據(jù)時代的挑戰(zhàn):價值與應對策略[J].移動通信,2012(17):14.
[2]劉佳麗.數(shù)字時代紅色檔案資源開發(fā)利用策略研究[J].檔案天地,2022(05):50-51+14.
[3]于秀.大數(shù)據(jù)背景下檔案管理“價值鏈”的生成研究[J].文化產(chǎn)業(yè),2022(12):100-102.
[4]董中印.大數(shù)據(jù)時代檔案信息資源開發(fā)芻議[J].黑龍江檔案,2022(02):95-97.
[5]趙卉.大數(shù)據(jù)指導下對辦公室檔案管理工作的創(chuàng)新研究[J].辦公自動化,2022,27(02):44-46.
[6]舒瓊.探究大數(shù)據(jù)時代下的檔案管理工作[J].山西青年,2021(24):65-66.
[7]李文瓊.大數(shù)據(jù)挖掘技術(shù)在高校檔案管理中的運用[J].鄭州鐵路職業(yè)技術(shù)學院學報,2021,33(04):106-107+112.DOI:10.13920/j.cnki.zztlzyjsxyxb.2021.04.032.
[8]董繼紅.大數(shù)據(jù)背景下檔案管理發(fā)展及趨勢分析[J].蘭臺內(nèi)外,2021(35):10-12.
[9]馮華.大數(shù)據(jù)時代檔案管理的機遇與挑戰(zhàn)[J].當代工人(C版),2021(05):94-95.
[10]曲晶瑤.大數(shù)據(jù)視域下檔案信息建設(shè)發(fā)展研究動態(tài)研判[J].蘭臺世界,2021(10):110-114.DOI:10.16565/j.cnki.1006-7744.2021.10.29.
[11]楊爽.淺談大數(shù)據(jù)時代檔案管理工作存在的問題與對策[J].蘭臺內(nèi)外,2021(27):64-65.
[12]王迎.基于大數(shù)據(jù)時代的檔案信息(下接65頁)
(上接62頁)管理研究[J].無線互聯(lián)科技,2021,18(18):33-34.
[13]盤活存量 優(yōu)化增量 做強變量 提升質(zhì)量 整體推進檔案資源體系建設(shè)[J].四川檔案,2022(02):26-27.
[14]加小雙,姚靜.數(shù)字人文賦能檔案資源體系建設(shè):機制與路徑[J/OL].山西檔案:1-9[2022-07-10].http://kns.cnki.net/kcms/detail/14.1162.g2.20220227.1215.002.html
[15]張騰華.建立適合鄉(xiāng)村發(fā)展的檔案資源管理體系思考[J].黑龍江檔案,2022(01):108-110.
[16]倪代川,蔡麗華.數(shù)字檔案資源文化軟實力建設(shè)探析[J].山西檔案,2021(06):31-37+14.
[17]李晉.運用大數(shù)據(jù)技術(shù)加強干部人事檔案資源體系建設(shè)[J].數(shù)據(jù),2021(12):66-67.
[18]劉凱,肖向華,霍艷芳,霍紅霞,馬立偉,李潔.“十四五”時期檔案學專業(yè)教材資源體系的構(gòu)建研究[J].檔案學通訊,2021(06):100-102.DOI:10.16113/j.cnki.daxtx.2021.06.011.
[19]楊帆.國有企業(yè)檔案資源體系構(gòu)建研究[J].浙江檔案,2021(08):28-30.DOI:10.16033/j.cnki.33-1055/g2.2021.08.010.
[20]王麗茹.地方綜合檔案館館藏資源體系建設(shè)的思考[J].蘭臺內(nèi)外,2021(21):44-45.
[21]郭成斌,陳永楠,李珒,杜貞.社會治理視域下高??萍紕?chuàng)新檔案資源體系構(gòu)建[J].浙江檔案,2021(05):57-59.DOI:10.16033/j.cnki.33-1055/g2.2021.05.022.
[22]朱建邦,王巧玲,謝永憲.國家治理時代我國檔案資源整體治理體系構(gòu)建研究[J].檔案學研究,2021(02):20-25.DOI:10.16065/j.cnki.issn1002-1620.2021.02.003.
[23]劉芳.檔案資源體系建設(shè)研究[J].機電兵船檔案,2021(02):39-40.
[24]秦敏.檔案信息化背景下高校檔案資源體系建設(shè)[J].辦公自動化,2021,26(02):53-54+47.
[25]宋璇.運用大數(shù)據(jù)技術(shù)加強干部人事檔案資源體系建設(shè)[J].辦公室業(yè)務(wù),2020(02):161+168.
作者簡介:侯作龍,本科學歷,通榆縣債務(wù)管理服務(wù)中心館員;吳磊,本科學歷,白山市江源區(qū)機關(guān)事務(wù)服務(wù)中心職員。