周楠
摘 要:通過新思維、新方式、新資源觀、新能力闡述了大數(shù)據(jù)時代檔案管理的發(fā)展趨勢。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;管理趨勢
大數(shù)據(jù)是一種技術(shù),更是一種理念,它的出現(xiàn)對各行各業(yè)都產(chǎn)生了巨大影響,推動著社會快速發(fā)展。大數(shù)據(jù)時代,檔案作為其中一種重要數(shù)據(jù)、企業(yè)信息資源的核心,將給檔案工作帶來新的發(fā)展的契機(jī),同時迎來諸多的挑戰(zhàn)。
一、新思維
大數(shù)據(jù)視角下,檔案作為數(shù)據(jù)中不可缺少的重要組成部分,檔案管理工作面臨著前所未有的變革和挑戰(zhàn)。第一,企業(yè)檔案工作主要負(fù)責(zé)檔案資源的收、藏、管、用,一直以來重藏輕用,提供簡單的借閱及編研工作。大數(shù)據(jù)時代,數(shù)據(jù)的提取、計(jì)算、關(guān)聯(lián)、預(yù)測等技術(shù)將顛覆傳統(tǒng)的信息開發(fā)利用模式,給檔案開發(fā)利用工作帶來更多挖掘的可能性,更廣闊的發(fā)展空間,檔案工作將從關(guān)注保管轉(zhuǎn)向利用服務(wù)。第二,大數(shù)據(jù)給檔案安全保密工作帶來了巨大挑戰(zhàn),數(shù)據(jù)丟失、更改、失真以及數(shù)據(jù)泄密等安全隱患風(fēng)險將大大提高,使檔案工作將從關(guān)注檔案保管轉(zhuǎn)向數(shù)據(jù)監(jiān)管、維護(hù)及處置、利用審批。第三,大數(shù)據(jù)與檔案資源的融合,極大提高檔案工作“智能化”,改變了檔案工作傳統(tǒng)管理模式,檔案工作也從技術(shù)含量低端轉(zhuǎn)向高端。第四,有學(xué)者提出檔案工作未來研究重點(diǎn)是“數(shù)字檔案資源整合與服務(wù)”,著力解決利用服務(wù)的適應(yīng)性問題,企業(yè)檔案管理的重點(diǎn)將轉(zhuǎn)向跨專業(yè)、跨部門、跨系統(tǒng)、跨業(yè)務(wù)的檔案資源整合和服務(wù)的協(xié)同創(chuàng)新與合作。
二、新方式
大數(shù)據(jù)給檔案工作帶來最大的改變是檔案業(yè)務(wù)環(huán)節(jié)側(cè)重點(diǎn)的變化,以往,檔案工作多關(guān)注于收集,往往為無法齊全完整的收集到文件材料而想盡各種方法,而大數(shù)據(jù)時代影響檔案工作卻是信息的隱匿和泛濫,關(guān)注點(diǎn)將轉(zhuǎn)移到數(shù)據(jù)的挖掘以及有效信息的提取。檔案業(yè)務(wù)環(huán)節(jié)變化如下:
從圖表中的比較可以看出,大數(shù)據(jù)時代給檔案工作方式帶來了極大變化。首先,收集工作,傳統(tǒng)檔案工作往往會在收集工作中耗費(fèi)大量精力,運(yùn)用各種方式方法去減少收集工作中的漏洞,被大家所熟知的“三納入、四參加、四同步”的要求,主要目的也是為能夠順利開展收集工作,將檔案工作設(shè)立在各個業(yè)務(wù)關(guān)卡,來確保檔案的齊全、完整,但由于檔案工作與企業(yè)業(yè)務(wù)工作脫節(jié),很多單位對此要求的執(zhí)行難以落到實(shí)處,對于收集工作并未明顯改善。而利用大數(shù)據(jù)技術(shù),使得各類數(shù)據(jù)的抓取和捕獲將變得愈加容易,以“流處理”的模式將數(shù)據(jù)閃存,收集成本逐漸降低,檔案收集工作的難題將從根本得到解決。
其次,整理工作,以往檔案工作會耗費(fèi)大量時間進(jìn)行整理、裝訂,這些技術(shù)含量低、大量繁重的手工勞動占據(jù)了檔案工作者的大部分時間,使得檔案工作一度被輕視。傳統(tǒng)檔案資源中每份檔案相對獨(dú)立,檔案資源的整合方式也相對單一,一般以人工手段按事件、項(xiàng)目、課題歸類,將零散的文件聚集在一起,物理上使得檔案具有邏輯性,但事件之間、項(xiàng)目之間、課題之間難以建立互通聯(lián)系,難以挖掘更深層次的關(guān)系,對于提供決策支持顯得力不從心。大數(shù)據(jù)技術(shù)使得互不連通的檔案信息整合為連通的數(shù)據(jù)庫成為可能,將所有信息數(shù)據(jù)化,包括非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),通過數(shù)據(jù)尋找關(guān)聯(lián),使檔案的價值得到成倍增加。
最后,利用工作,長久以“提出需求-檢索答案-解決問題”守株待兔的低層次利用模式,解決問題的成功率受制于著錄信息是否完整全面,其效率依賴于檢索工具的科學(xué)性,利用目的多以工作查考為主,利用載體形式單一,以紙質(zhì)原生信息(即檔案)為主,難以提供知識服務(wù)及決策支持。大數(shù)據(jù)時代,當(dāng)業(yè)務(wù)系統(tǒng)的海量數(shù)據(jù)集成和融合后,大數(shù)據(jù)分析技術(shù)會以計(jì)算機(jī)算法和邏輯規(guī)則給出人工難以得出的分析結(jié)果。服務(wù)內(nèi)容,從提供孤立檔案轉(zhuǎn)變?yōu)橹R服務(wù),基于海量數(shù)據(jù)的關(guān)聯(lián)性分析,大數(shù)據(jù)在趨勢預(yù)測和發(fā)現(xiàn)隱性關(guān)聯(lián)方面具備相當(dāng)優(yōu)勢,使得各項(xiàng)業(yè)務(wù)、各專業(yè)、各個年代之間有機(jī)聯(lián)系在一起,為決策問題打開局面,為技術(shù)創(chuàng)新提供更多思路。服務(wù)方式,從坐等用戶上門轉(zhuǎn)變?yōu)橹鲃油扑?,通過對用戶特征數(shù)據(jù)、行為數(shù)據(jù)、歷史數(shù)據(jù)、反饋數(shù)據(jù)實(shí)時分析,跟進(jìn)用戶需求,滿足用戶個性化利用需求。同時,在處理用戶查詢過程中系統(tǒng)能夠及時不斷地提供反饋,根據(jù)反饋結(jié)果更改、調(diào)整、優(yōu)化、完善用戶服務(wù)策略。利用效率,不在局限于實(shí)地查閱借閱,減少用戶與檔案人員的溝通成本,以及信息不對稱而導(dǎo)致查詢失敗,不再受時空限制隨時獲取。
三、新資源觀
傳統(tǒng)檔案資源一般包括文書檔案、科技檔案、專門檔案、聲像檔案、實(shí)物檔案,這些檔案只集中收集企業(yè)內(nèi)部的部分信息。大數(shù)據(jù)之所以稱為“大”,包含了傳統(tǒng)的小數(shù)據(jù)和現(xiàn)代的大記錄,小數(shù)據(jù)指有根據(jù)的數(shù)字,大記錄的表現(xiàn)形式是文本、圖片、音頻、視頻等。大數(shù)據(jù)廣泛存在于各個領(lǐng)域、各個行業(yè)、各個學(xué)科,包括企業(yè)管理、科技、生產(chǎn)、采購、倉儲、營銷、運(yùn)輸?shù)雀鱾€方面產(chǎn)生或采集的各種信息、數(shù)據(jù),企業(yè)檔案資源要運(yùn)用大數(shù)據(jù)技術(shù),企業(yè)檔案就要與企業(yè)其他信息、數(shù)據(jù)一同納入大數(shù)據(jù)資源管理,形成大的資源觀。面向數(shù)據(jù)的管理方式使大量數(shù)據(jù)實(shí)現(xiàn)有效管理,有效打破信息孤島,建立信息共享、開放、再利用。
檔案資源角度,從國家檔案局頒布的十號令可以看出,檔案管理的范圍覆蓋了企業(yè)所有管理工作中形成的文件材料,檔案的歸檔范圍得到了極大的擴(kuò)充,向“一切歸檔”的終極目標(biāo)更進(jìn)一步。實(shí)現(xiàn)“一切歸檔”的終極目標(biāo),需要企業(yè)檔案管理平臺實(shí)現(xiàn)與各個業(yè)務(wù)系統(tǒng)廣泛連接和實(shí)時交互?!皩n案系統(tǒng)融入企業(yè)其他信息系統(tǒng),不僅要讓各系統(tǒng)中生成有價值的文件、數(shù)據(jù)能直接在線歸檔,還要提供與領(lǐng)域業(yè)務(wù)流程及數(shù)據(jù)應(yīng)用需求深度融合的解決方案,讓檔案資源隨時在各系統(tǒng)的運(yùn)行環(huán)節(jié)發(fā)揮作用”。
信息資源角度,具有信息資源屬性的圖書、情報、檔案是企業(yè)信息資源的核心組成部分,這三類信息資源具備很多共性,有著類似的工作內(nèi)容和目標(biāo),均涉及保存和提供利用工作,大數(shù)據(jù)技術(shù)給圖書、情報、檔案一體化帶來了良好的發(fā)展機(jī)遇,可以將三類信息資源相互融合,構(gòu)成三位一體的信息資源數(shù)據(jù)庫。
四、新能力
1.檔案數(shù)據(jù)安全
數(shù)據(jù)全生命周期、全過程、全面質(zhì)量管理、風(fēng)險管控的理論和技術(shù)條件日趨完善,同時,企業(yè)對于檔案工作數(shù)字服務(wù)的需求日趨強(qiáng)烈,電子文件亟待從雙套雙軌制走向無紙化單軌制,與大數(shù)據(jù)行動融合。檔案的原始記錄性、憑證性是檔案工作者在大數(shù)據(jù)時代關(guān)注和探究的重點(diǎn),檔案的原始記錄性一旦無法保證,將會帶來連續(xù)性錯誤,錯誤的存儲、分析、計(jì)算導(dǎo)致錯誤的結(jié)果及決策。因此,要建立全面的數(shù)據(jù)信息安全保障體系,確保檔案的真實(shí)完整、安全利用、可追溯。
2.檔案信息保密
檔案資源的開放與保密一定程度上存在著矛盾,大數(shù)據(jù)時代下,急需在檔案的開放與保密中找到解決之策。人們常常容易陷入到兩種誤區(qū)中,一部分認(rèn)為,現(xiàn)在已無密可保,有密難保,只注重檔案的服務(wù)利用,而忽視了其保密要求,一部分認(rèn)為,為避免泄密,將檔案束之高閣,脫離現(xiàn)實(shí)服務(wù)需求,兩種誤區(qū)都將阻礙檔案工作的健康發(fā)展。因此,對一些涉密及關(guān)鍵重要檔案數(shù)據(jù)在文件形成時甚至之前就進(jìn)行有效識別,運(yùn)用技術(shù)手段確保檔案數(shù)據(jù)源頭及其全生命周期的安全。在檔案數(shù)據(jù)的保密性得到有效保障的同時,充分發(fā)揮可公開檔案數(shù)據(jù)的服務(wù)功能。在盡可能降低檔案信息安全風(fēng)險的同時,最大限度的開放服務(wù)中尋找平衡。
3.檔案管理技術(shù)
首先,大數(shù)據(jù)包含很多方案、技術(shù)、模塊,企業(yè)信息系統(tǒng)需要前期論證和不斷嘗試,找到適合企業(yè)的功能模型,兼具安全性、操作性、適用性。其次,大數(shù)據(jù)的其中一個特點(diǎn)便是數(shù)據(jù)量大,在數(shù)據(jù)量足夠大時才能發(fā)揮出預(yù)測趨勢、尋找關(guān)聯(lián)的功能,企業(yè)如何獲取足夠的數(shù)據(jù),獲取多大量的數(shù)據(jù),以及數(shù)據(jù)的選擇才能支持大數(shù)據(jù)技術(shù)的發(fā)揮。再次,大數(shù)據(jù)包含結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)便于數(shù)據(jù)的提取處理,而非結(jié)構(gòu)化數(shù)據(jù)的提取處理還需要更加便捷高效的處理方式。最后,大數(shù)據(jù)的關(guān)鍵技術(shù)提取和挖掘工作,需要在企業(yè)信息系統(tǒng)中建立固定模型,并不斷挖掘新算法,對雜亂的數(shù)據(jù)進(jìn)行萃取、提煉、分析。
在大數(shù)據(jù)環(huán)境下,檔案工作迎來了新的機(jī)遇和挑戰(zhàn),引入大數(shù)據(jù)管理理念是檔案工作發(fā)展的重要方向,檔案部門應(yīng)積極探索,創(chuàng)新檔案工作管理模式,更新對檔案工作的傳統(tǒng)認(rèn)識,有效提升檔案服務(wù)能力。
參考文獻(xiàn):
[1]安小米.大數(shù)據(jù)時代數(shù)字檔案資源整合與服務(wù)的機(jī)遇與挑戰(zhàn)[J].檔案學(xué)通訊,2017(06):57-62
[2]王 波,郭紅玲.基于信息生態(tài)的企業(yè)檔案融合利用研究[J].航空檔案,2019(02):46-49.
[3]張 茵.軍工科研院所檔案管理平臺面向數(shù)據(jù)管理的應(yīng)用創(chuàng)新思考[J].航空檔案,2019(02):50-54.
[4]徐子沛.數(shù)據(jù)之巔[M]中信出版集團(tuán),2017:255-287
[5]張 玲.大數(shù)據(jù)2.0時代文獻(xiàn)資源融合與共享利用研究——以圖書、情報、檔案文獻(xiàn)信息資源為例.檔案管理[J],2015:36-37