張麗
【關(guān)鍵詞】電子檔案;歸檔;管理;利用
【中圖分類號(hào)】G276;F272 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-0688(2021)07-0174-03
1 電子文件歸檔
隨著文件越來(lái)越多,傳統(tǒng)紙質(zhì)檔案管理弊端逐漸顯現(xiàn),紙質(zhì)檔案管理不僅占用空間大,文件種類繁雜,還不利于查找,容易丟失、損壞。隨著科技的進(jìn)步,電子檔案應(yīng)運(yùn)而生。電子文件的有效整理、歸檔可以提高電子檔案的利用率。電子歸檔是指將人們生產(chǎn)的具有保存和借鑒價(jià)值并且系統(tǒng)已經(jīng)存錄的文件向權(quán)限部門(mén)提交的過(guò)程。根據(jù)這些年總結(jié)的實(shí)際經(jīng)驗(yàn)來(lái)看,電子文件歸檔必須做好歸檔接口和“四性”檢測(cè),這是電子文件歸檔時(shí)重點(diǎn)檢測(cè)工作。
1.1 歸檔接口
歸檔接口作為業(yè)務(wù)系統(tǒng)和檔案系統(tǒng)的接口,主要目的是保證電子檔案在歸檔時(shí)具備真實(shí)性、完整性、安全性及可用性。常規(guī)的歸檔接口不能滿足電子檔案信息管理要求,因?yàn)槌R?guī)的接口不能檢測(cè)數(shù)據(jù)是否正常,因此,在歸檔接口中應(yīng)該加入“四性”檢測(cè)[1]。以中間庫(kù)為例,電子檔案的歸檔系統(tǒng)將數(shù)據(jù)傳送到中間庫(kù)時(shí)接口應(yīng)該立即采集中間庫(kù)的數(shù)據(jù),并對(duì)中間庫(kù)數(shù)據(jù)進(jìn)行真實(shí)性、完整性、安全性和可用性檢測(cè),及時(shí)反饋檢測(cè)結(jié)果,進(jìn)行回寫(xiě),最后按系統(tǒng)要求將歸檔文件存儲(chǔ)于中間庫(kù),對(duì)于信息采集失敗的數(shù)據(jù)也要直接反饋,重新歸檔。
1.2 “四性”檢測(cè)
在進(jìn)行電子文件歸檔時(shí),為了保證后續(xù)對(duì)電子檔案的有效管理和利用,一定要對(duì)“四性”進(jìn)行檢測(cè)?!八男浴笔侵鸽娮游募n案的安全性、完整性、真實(shí)性及可用性。
1.2.1 真實(shí)性檢測(cè)
電子文件檔案歸檔時(shí)首先要進(jìn)行真實(shí)性檢測(cè),真實(shí)性檢測(cè)包含固化信息檢測(cè)、數(shù)字摘要檢測(cè)、元數(shù)據(jù)檢測(cè)、電子屬性檢測(cè)、信息包檢測(cè)[2]。一般情況下,固化信息檢測(cè)和數(shù)字摘要檢測(cè)采用MD5算法檢測(cè)數(shù)據(jù)是否有效;元數(shù)據(jù)檢測(cè)主要檢測(cè)數(shù)據(jù)的類型與長(zhǎng)度、格式等是否符合規(guī)定要求。電子文件中所記錄的檔案真實(shí)性也是檢查的要點(diǎn),重點(diǎn)是檢查元數(shù)據(jù)和歸檔文件數(shù)據(jù)是否有關(guān)聯(lián);還有電子檔案所記錄的存儲(chǔ)位置是否與實(shí)際的元數(shù)據(jù)存儲(chǔ)位置一致;電子屬性檢測(cè)就是元數(shù)據(jù)中所記錄的屬性信息是否和電子檔案中記錄的屬性信息一致;信息包檢測(cè)就是用XML封裝與MD5算法來(lái)檢測(cè)對(duì)比電子文件和原始記錄中的文件名稱、大小、數(shù)字摘要值是否一致。
1.2.2 完整性檢測(cè)
電子文件檔案歸檔時(shí)要進(jìn)行完整性檢測(cè),完整性檢測(cè)包含數(shù)據(jù)總量檢測(cè)、元數(shù)據(jù)完整性檢測(cè)、電子文件內(nèi)容完整性檢測(cè)及電子文件歸檔信息完整性檢測(cè)。其中,數(shù)據(jù)總量檢測(cè)指歸檔文件中數(shù)據(jù)的數(shù)量和大小是否完整無(wú)遺漏;元數(shù)據(jù)完整性檢測(cè)就是檢測(cè)電子歸檔文件中的數(shù)目編號(hào)是否編寫(xiě)齊全;電子文件內(nèi)容完整性檢測(cè)就是檢測(cè)文件中的內(nèi)容是否真實(shí)、完整;電子文件歸檔信息完整性檢測(cè)就是由系統(tǒng)來(lái)檢測(cè)歸檔信息中的文件數(shù)據(jù)、數(shù)量、大小與人工檢測(cè)的結(jié)果是否一致。
1.2.3 可用性檢測(cè)
電子文件檔案歸檔時(shí)還需要進(jìn)行可用性檢測(cè),可用性檢測(cè)包含元數(shù)據(jù)可用性檢測(cè)、目錄可用性檢測(cè)、內(nèi)容可用性檢測(cè)、信息包可用性檢測(cè)、電子檔案軟硬件環(huán)境檢測(cè)。元數(shù)據(jù)可用性檢測(cè)、目錄可用性檢測(cè)是指對(duì)于電子檔案中的數(shù)據(jù)存放信息能夠正常解析、讀取;內(nèi)容可用性檢測(cè)是指歸檔文件中的文件是否可以正常打開(kāi)應(yīng)用;信息包可用性檢測(cè)主要是檢測(cè)歸檔文件中是否有加密、壓縮、不符合要求的文件格式;電子檔案軟硬件環(huán)境檢測(cè)就是檢測(cè)歸檔文件中的軟硬件環(huán)境是否符合要求。
1.2.4 安全性檢測(cè)
電子文件檔案歸檔時(shí)最重要的是進(jìn)行安全性檢測(cè),安全是電子檔案的第一條防線。電子檔案安全性檢測(cè)包含信息包安全檢測(cè)、歸檔載體安全性檢測(cè)及歸檔過(guò)程安全性檢測(cè)。信息包安全檢測(cè)主要是檢測(cè)檔案是否感染病毒;歸檔載體安全檢測(cè)主要是檢測(cè)是否有非歸檔文檔及讀寫(xiě)的速度、外觀、質(zhì)量;歸檔過(guò)程安全性檢測(cè)顧名思義就是檢測(cè)電子檔案在歸檔過(guò)程中是否安全。
2 電子檔案管理
隨著科技的進(jìn)步,電子檔案的種類、數(shù)量急劇增加,因此對(duì)于日常電子檔案的有效管理將成為檔案管理工作的難點(diǎn)。電子檔案管理就是對(duì)需要?dú)w檔的原始文件進(jìn)行保管,而電子文件的保管是長(zhǎng)期的。根據(jù)實(shí)際情況及現(xiàn)在的環(huán)境電子檔案管理一定要按照要求做好數(shù)據(jù)的有效、安全存儲(chǔ),保證“四性”檢測(cè)等保管重點(diǎn)。
2.1 檔案存儲(chǔ)
不同的電子檔案所需要的存儲(chǔ)方式不同,根據(jù)電子檔案的特性,電子檔案保管要注意選擇合適的存儲(chǔ)方式,保障電子檔案的安全。當(dāng)然,合適的存儲(chǔ)方式有助于保障電子檔案的“四性”要求。現(xiàn)階段,不同時(shí)期、不同作用對(duì)于電子檔案的存儲(chǔ)要求也不同。例如:經(jīng)常調(diào)用的文件需要經(jīng)常交換儲(chǔ)存、在線收集,因此常用文件需要使用在線存儲(chǔ)的方式[3]。而一些不經(jīng)常被調(diào)取且原文件有備份的文件,需要采用離線存儲(chǔ)的方式。電子檔案的存儲(chǔ)不單指一份檔案,還包含原始數(shù)據(jù)、配置數(shù)據(jù)、日常收集實(shí)驗(yàn)數(shù)據(jù),包括電子檔案管理的系統(tǒng)都要一并存儲(chǔ)。在進(jìn)行電子檔案存儲(chǔ)時(shí),應(yīng)該將原始電子檔案中的文件、表格數(shù)據(jù)轉(zhuǎn)換為PDF,音頻轉(zhuǎn)換為MP3,視頻轉(zhuǎn)換為MP4的方式來(lái)進(jìn)行有效的長(zhǎng)期保存,實(shí)在不能轉(zhuǎn)換格式的,應(yīng)該掃描成以JPEG、PEG等圖片文件格式進(jìn)行有效存儲(chǔ)。當(dāng)然,以上格式轉(zhuǎn)換必須在不改變?cè)瓟?shù)據(jù)文件的情況下進(jìn)行,必須保證數(shù)據(jù)的真實(shí)性。在文件存儲(chǔ)過(guò)程中,要實(shí)現(xiàn)“三庫(kù)分離”。所謂“三庫(kù)”指的是長(zhǎng)期保存庫(kù)、管理庫(kù)、利用庫(kù)。長(zhǎng)期保存庫(kù)主要保存一些需要長(zhǎng)期封存的電子檔案,將這些檔案進(jìn)行封裝包,因此長(zhǎng)期保存庫(kù)是獨(dú)立于電子檔案管理系統(tǒng)的。管理庫(kù)主要是服務(wù)檔案管理者,服務(wù)于檔案管理者對(duì)于檔案的檢測(cè)、鑒定、審計(jì)、統(tǒng)計(jì)、檢索、銷(xiāo)毀等業(yè)務(wù)工作。利用庫(kù)就是利用檔案的屬性,對(duì)于需要具有共享屬性、開(kāi)放性屬性的檔案進(jìn)行多元利用。
2.2 “四性”檢測(cè)
電子檔案在長(zhǎng)期保存中需要進(jìn)行定期或不定期檢測(cè),這就需要制定一系列方案。日常的電子檔案檢測(cè)主要是對(duì)電子檔案的封裝、原數(shù)據(jù)、存儲(chǔ)路徑、存儲(chǔ)方式、各項(xiàng)指標(biāo)等進(jìn)行定期或不定期檢測(cè)[4]。電子檔案的檢測(cè)時(shí)效受存儲(chǔ)環(huán)境的影響,例如,系統(tǒng)是否進(jìn)行更新、數(shù)據(jù)是否遷移、格式是否轉(zhuǎn)換等因素都會(huì)影響電子檔案的檢測(cè)時(shí)效。在系統(tǒng)未更新、數(shù)據(jù)未發(fā)生遷移、格式?jīng)]有轉(zhuǎn)化、不影響電子檔案元數(shù)據(jù)和其他數(shù)據(jù)內(nèi)容的情況下,只對(duì)電子檔案的固化信息部門(mén)進(jìn)行檢測(cè)。反之,在系統(tǒng)發(fā)生更改、數(shù)據(jù)發(fā)生轉(zhuǎn)移或格式發(fā)生轉(zhuǎn)化的情況下,就會(huì)影響電子檔案的元數(shù)據(jù)和其他數(shù)據(jù)內(nèi)容,這種情況需要進(jìn)行全面的檢測(cè)。全面檢測(cè)內(nèi)容較多,如長(zhǎng)期保存封裝包、元數(shù)據(jù)、原內(nèi)容等都需要進(jìn)行系統(tǒng)的檢測(cè)。
電子檔案在存儲(chǔ)過(guò)程中,一旦涉及借用、遷移、格式的轉(zhuǎn)換、備份、出庫(kù)等,都應(yīng)該有詳細(xì)的記錄并且存放于電子檔案的長(zhǎng)期保存庫(kù)中,存儲(chǔ)中這些數(shù)據(jù)還應(yīng)該補(bǔ)充到電子檔案的原始數(shù)據(jù)中。
3 電子檔案利用
不管是電子檔案還是檔案信息管理,其服務(wù)宗旨都是為了使資源得到有效利用,充分發(fā)揮價(jià)值,為人們生活、企業(yè)發(fā)展、社會(huì)進(jìn)步貢獻(xiàn)力量。隨著社會(huì)的進(jìn)步與發(fā)展,我們已經(jīng)邁入數(shù)字化時(shí)代,電子檔案的數(shù)量在日益增加,并且還會(huì)源源不斷地增添電子數(shù)據(jù),同時(shí),人們對(duì)于電子檔案的利用需求越帶越大。因此,檔案管理不能限于傳統(tǒng)的檔案存放、檔案調(diào)取、檔案借閱等形式,要緊跟時(shí)代潮流,樹(shù)立新思維,合理運(yùn)用現(xiàn)在龐大且成熟的信息技術(shù)和資源,挖掘利用有價(jià)值的檔案,為社會(huì)發(fā)展添磚加瓦,使檔案管理部門(mén)更好地服務(wù)企業(yè)、社會(huì)、國(guó)家的發(fā)展。
3.1 運(yùn)用大數(shù)據(jù),助力業(yè)務(wù)拓展
隨著社會(huì)的不斷進(jìn)步與發(fā)展,大數(shù)據(jù)在很多行業(yè)都受到廣泛關(guān)注。與此同時(shí),檔案部門(mén)擁有龐大的數(shù)據(jù)資源,可以利用大數(shù)據(jù)對(duì)這些檔案進(jìn)行挖掘、分析,挑選出有價(jià)值的方案。同時(shí),為了保證數(shù)據(jù)的準(zhǔn)確率和利用率,檔案管理部門(mén)可以和信息技術(shù)部門(mén)合作,形成檔案信息管理數(shù)據(jù)池,從中進(jìn)行檔案數(shù)據(jù)整合。國(guó)內(nèi)一知名公司的檔案管理與檔案分析利用工作走在時(shí)代前沿,該公司將檔案部門(mén)與信息技術(shù)部門(mén)整合,以客戶檔案作為數(shù)據(jù)池,通過(guò)現(xiàn)代科技及大數(shù)據(jù)分析,對(duì)客戶形成完美的生命周期圖,以流程圖的方式對(duì)客戶進(jìn)行畫(huà)像,并且對(duì)客戶進(jìn)行全方位、多方面的評(píng)級(jí),然后將客戶信息送至企業(yè)業(yè)務(wù)前端,助力前端開(kāi)發(fā)和維護(hù)客戶,形成一個(gè)完善的流程。另外,該公司通過(guò)大數(shù)據(jù)分析,將客戶所需推送到客戶面前,從各個(gè)方面分析客戶,為客戶帶來(lái)利益,增加客戶黏性。因此,該公司的檔案管理工作發(fā)揮了最大作用,助力企業(yè)的發(fā)展與進(jìn)步。
3.2 利用人工智能,協(xié)助風(fēng)險(xiǎn)管控
隨著大數(shù)據(jù)的發(fā)展及科技的進(jìn)步,我們已經(jīng)實(shí)現(xiàn)了人臉識(shí)別技術(shù)。人臉識(shí)別是基于對(duì)人類面部的一種生物識(shí)別技術(shù),可用于對(duì)人員身份的確認(rèn),也可實(shí)現(xiàn)信息智能預(yù)警,還可以輔助企業(yè)和國(guó)家進(jìn)行合規(guī)把控。隨著時(shí)代的發(fā)展,我們將一個(gè)人的面部特征、照片或者身份信息等作為素材存入索引庫(kù),然后將這些信息在素材索引庫(kù)與其他片段、畫(huà)面進(jìn)行處理,還可以與素材索引庫(kù)中的聲音等資料進(jìn)行比對(duì),找到含有該面部特征或者畫(huà)面的信息,便可在眾多信息中找到特定的人物信息。國(guó)內(nèi)一些大型企業(yè)采集了公司內(nèi)部員工及客戶的人臉信息,一方面,可以通過(guò)這些信息在數(shù)據(jù)庫(kù)進(jìn)行匹配對(duì)比,用于企業(yè)內(nèi)部開(kāi)展的專題或編研等工作;另一方面,可以通過(guò)特定的信息比對(duì)客戶身份,有效地對(duì)一些事務(wù)進(jìn)行把控,減少企業(yè)風(fēng)險(xiǎn)。
3.3 應(yīng)用自然語(yǔ)義分析,實(shí)現(xiàn)智能檢索
我們?cè)谙到y(tǒng)中進(jìn)行查詢時(shí),經(jīng)常會(huì)出現(xiàn)因?yàn)轭}名不規(guī)范或者表達(dá)意思有誤而出現(xiàn)檢索失效的情況,但是通過(guò)電子檔案管理進(jìn)行自然語(yǔ)義分析可以提高檢索的準(zhǔn)確率和查全率,提高用戶體驗(yàn)。通過(guò)最新研發(fā)的檢索技術(shù),現(xiàn)在可以實(shí)現(xiàn)對(duì)3種以上數(shù)據(jù)源進(jìn)行數(shù)據(jù)抓取,再通過(guò)自然語(yǔ)義索引,形成有分類的索引目錄,最后將索引庫(kù)建立完成以便在索引時(shí)使用。同時(shí),還可以建立同義詞庫(kù),實(shí)現(xiàn)自主索引。例如,檢索金融行業(yè)融資方面的內(nèi)容時(shí),輸入“融資”“融券”“兩融”等任意一個(gè)關(guān)鍵詞,我們都可以檢索到與融資有關(guān)的信息,保證檢索的準(zhǔn)確率和查全率。
4 結(jié)語(yǔ)
綜上所述,根據(jù)時(shí)代發(fā)展需求,加強(qiáng)電子檔案的歸檔和管理是社會(huì)的訴求,同時(shí),完善電子檔案管理也有助于推動(dòng)時(shí)代發(fā)展,但是根據(jù)我國(guó)電子檔案管理現(xiàn)狀,我們?cè)陔娮訖n案歸檔和管理方面依然有很多不足之處,需要我們繼續(xù)發(fā)掘。因此,不論是對(duì)企業(yè)、單位還是國(guó)家,我們都應(yīng)該樹(shù)立起現(xiàn)代管理思維,積極推動(dòng)電子檔案管理事業(yè)繼續(xù)發(fā)展,并通過(guò)電子檔案管理的發(fā)展反哺社會(huì),使社會(huì)能夠更好地進(jìn)步。
參 考 文 獻(xiàn)
[1]李從衛(wèi),傅艷華.企業(yè)電子文件歸檔和電子檔案管理問(wèn)題及對(duì)策研究[J].機(jī)電兵船檔案,2020(1):73-75.
[2]陳小冬.企業(yè)電子文件歸檔與電子檔案管理工作探究[J].信息周刊,2020(3):204.
[3]張強(qiáng).企業(yè)電子文件歸檔與電子檔案管理工作探究[J].蘭臺(tái)內(nèi)外,2019(29):23-24.
[4]張彥.建設(shè)項(xiàng)目電子文件歸檔和電子檔案管理系統(tǒng)構(gòu)建路徑研究[J].西北電建,2019(4):15-16.