楊文忠
(內蒙古升騰電子科技有限公司,內蒙古 呼和浩特 010010)
檔案管理作為管理工作的重要組成部分,面臨著先進網(wǎng)絡技術綜合運用跨越式發(fā)展的挑戰(zhàn),傳統(tǒng)的檔案管理模式已經(jīng)無法適應當今世界計算機網(wǎng)絡信息化的發(fā)展潮流[1]。檔案信息化工作是信息化建設的核心,實現(xiàn)檔案的信息化管理有利于提高工作效率,有利于避免人工管理導致的諸多疏漏。因此,實現(xiàn)新形勢下檔案管理模式的網(wǎng)絡化越來越受到各領域的關注,當前對檔案管理與服務系統(tǒng)的管理手段進行創(chuàng)新是建設現(xiàn)代化檔案管理機制的必要舉措[2]。
檔案信息化本質上是利用相應的信息檢索系統(tǒng)實現(xiàn)檔案數(shù)據(jù)的歸檔、查詢和管理。其一般方式是事先用計算機錄入原始檔案材料,之后按照行業(yè)規(guī)則對檔案數(shù)據(jù)進行規(guī)范性編碼,以便于日后的檢索和 管理。在此基礎上可通過建設相關的互聯(lián)網(wǎng)門戶網(wǎng)站實現(xiàn)對檔案數(shù)據(jù)庫資料的線上查詢和遠程服務[3],實現(xiàn)多種路徑、多種方式、全方位的服務,使得檔案數(shù)據(jù)能以最短路徑進行必要的社會共享,最大程度發(fā)揮其社會服務功能。
目前國內檔案管理系統(tǒng)仍存在很多不足,如保密性較差、訪問效率較低、可維護性較差、大量數(shù)據(jù)處于休眠狀態(tài)、無法為使用者提供便捷和低效的訪問途徑等,這些現(xiàn)狀歸根結底都是因為傳統(tǒng)的、低效的人工管理方法造成的。
隨著城市化進程的加快,人口越來越集中,檔案相關的數(shù)據(jù)量和需求量也越來越龐大,需求頻次也越來越高,功能是否齊全,訪問是否高效,維護是否方便已成為衡量檔案管理系統(tǒng)信息化建設的標志性成果[4]。針對這種現(xiàn)實需求,越來越多的企業(yè)開始重視這個問題并不斷嘗試將先進的編程框架和技術運用到檔案管理系統(tǒng)的設計中,通過對業(yè)務流程的不斷磨合,逐步提升相關軟件對歷史檔案和現(xiàn)實業(yè)務的支持力度,大幅度提高檔案數(shù)據(jù)的利用率。
隨著互聯(lián)網(wǎng)技術、電子信息技術在檔案管理上的深入應用,任何組織、任何部門都迫切需求建立符合自身特點的檔案管理系統(tǒng)已實現(xiàn)高效地組織和管理內部活動以及活動過程所產生的各類文獻記錄,筆者所提出的智能檔案管理系統(tǒng)能夠為各類用戶提供快速、高效且可維護較優(yōu)的檔案管理模式[5]。
智能檔案管理系統(tǒng)主要包含數(shù)據(jù)處理、數(shù)據(jù)傳遞、數(shù)據(jù)檢索、數(shù)據(jù)統(tǒng)計和數(shù)據(jù)分析等。其中,檔案數(shù)據(jù)處理主要用于對檔案數(shù)據(jù)進行預處理,針對不同的需求使其獲得新的結構形態(tài)甚至產生新的數(shù)據(jù);檔案數(shù)據(jù)傳遞主要用于將數(shù)據(jù)信息在不同的平臺進行傳輸和交互。數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析和數(shù)據(jù)檢索等部分則依據(jù)不同的業(yè)務邏輯用對應的算法實現(xiàn)對數(shù)據(jù)的進一步處理和展示。該系統(tǒng)利用分析控制決策模型做業(yè)務邏輯處理,配合不同種類數(shù)據(jù)庫完成機構組織的正常運行、管理和決策,系統(tǒng)功能模塊,如圖1所示。
圖1 系統(tǒng)功能模塊
智能檔案管理系統(tǒng)主要采用瀏覽器/服務器架構的模塊化管理方式,不同的用戶可根據(jù)業(yè)務實際范圍和規(guī)模選擇適合本單位的管理模塊,系統(tǒng)以標準化的方式進行統(tǒng)一管理,在降低成本的基礎上提高工作效率;在流程清晰化,操作簡單化的基礎上實現(xiàn)數(shù)據(jù)、流程和結果的可視化,實現(xiàn)對智能檔案數(shù)據(jù)的價值挖掘,為決策者提供決策支持。
1.3.1 數(shù)據(jù)資源管理系統(tǒng)。數(shù)據(jù)資源管理系統(tǒng)是進行后續(xù)的數(shù)據(jù)分析和價值挖掘的前提和基礎。積累大量的檔案數(shù)據(jù)資源并通過數(shù)據(jù)倉庫或數(shù)據(jù)庫進行有機整合,使之成為融會貫通且相互可讀取、可查詢的大數(shù)據(jù)存儲體系,從而實現(xiàn)高效的數(shù)據(jù)資源共享,為業(yè)務系統(tǒng)的功能達成提供基礎性數(shù)據(jù)支撐。
1.3.2 數(shù)據(jù)分析系統(tǒng)。數(shù)據(jù)分析系統(tǒng)主要包含數(shù)據(jù)聯(lián)機分析平臺和數(shù)據(jù)多維分析平臺,其底層采用開源的Python工具包,如Scipy、Numpy以及Pandas等,具有高效、已使用和修改的特性。其中的數(shù)據(jù)聯(lián)機分析平臺支持通過聯(lián)系方式橫向擴展數(shù)據(jù)接口,具備對多源異構數(shù)據(jù)的實時查詢、存取和分析能力。其多維分析平臺對超大規(guī)模數(shù)據(jù)的多維特征進行有效降維后對數(shù)據(jù)進行二次聚合,實現(xiàn)包含超級特征的數(shù)據(jù)的聚攏效應,對數(shù)據(jù)進行“切塊和切片”,鉆取到細節(jié)中從而揭開數(shù)據(jù)的關系。在實現(xiàn)高速查詢響應的同時能夠對復雜多維特征數(shù)據(jù)的關鍵信息及關聯(lián)關系特征進行提純和凈化,保證對數(shù)據(jù)價值挖掘的有效性。
1.3.3 數(shù)據(jù)挖掘系統(tǒng)。 數(shù)據(jù)挖掘系統(tǒng)主要針對大規(guī)模檔案數(shù)據(jù)進行智能分析和挖掘,發(fā)現(xiàn)數(shù)據(jù)背后潛在的價值和規(guī)律,其過程包含對原始數(shù)據(jù)的預處理,如清洗、加工、標準化等,之后進行分析直到發(fā)現(xiàn)規(guī)律并進行價值析出,最后將分析或統(tǒng)計結果進行可視化呈現(xiàn)。
該系統(tǒng)中的數(shù)據(jù)挖掘分為3個階段:數(shù)據(jù)準備階段、價值挖掘階段和評價篩選階段。
首先,智能檔案信息系統(tǒng)對無序數(shù)據(jù)進行自主篩選并刪除其中重復的數(shù)據(jù),根據(jù)數(shù)據(jù)的價值權重和價值密度處理缺失值,之后根據(jù)箱線圖法或正態(tài)分布原理對異常數(shù)據(jù)進行處理,主要依據(jù)數(shù)據(jù)自身規(guī)律并考慮異常數(shù)據(jù)出現(xiàn)的原因做進一步篩選,最終得到有效精準的高價值基礎數(shù)據(jù)。
其次,對于處理完畢的基礎數(shù)據(jù),本系統(tǒng)通過物理或邏輯方法分析數(shù)據(jù)之間的關聯(lián)關系,通過線性分析、非線性分析、聚類分析等方法,利用數(shù)學、統(tǒng)計學、機器學習算法以及深度學習模型對其進行訓練和分析,挖掘數(shù)據(jù)內在聯(lián)系,找出隱藏的價值和規(guī)律[9]。
1.3.4 3D可視化技術。 智能檔案管理系統(tǒng)采用旋轉陣列形式的LED立體顯示方法實現(xiàn)檔案數(shù)據(jù)的立體投影顯示。立體顯示的本質是基于平面圖像的運算及處理,通過左右眼睛的位置差異造成影像的位移,在大腦中形成立體影像。
旋轉陣列式LED立體顯示器是利用當前成熟的LED發(fā)光材料,通過高速旋轉LED組合陣列,形成立體顯示空間。以單根500像素的LED顯示條為例,將其以一端為圓心進行高速旋轉,可以形成面積為785 000像素的圓形單層顯示平面。通過程序控制這單根500像素的LED發(fā)光點,能夠形成單層圖像信息的顯示。用多根LED顯示材料旋轉可形成立體空間場,能夠近似實現(xiàn)全立體裸眼顯示。
1.3.5 安全保障系統(tǒng)。智能檔案管理系統(tǒng)通過具備完善的安全保障系統(tǒng)來保障數(shù)據(jù)和系統(tǒng)的安全。從保障技術方面來看,該系統(tǒng)主要采用包含“保護、檢測、應對、恢復”四模態(tài)控制的自適應機制來實現(xiàn)。運用各種安全協(xié)議在協(xié)議層和網(wǎng)絡結構層上做物理和邏輯層面的保護,通過物理檢測設備對系統(tǒng)安全的薄弱環(huán)節(jié)逐個進行檢測,對可能的入侵攻擊行為進行預測和判斷,對發(fā)現(xiàn)的漏洞及時打補丁,增強系統(tǒng)的健壯性。同時通過快速自恢復機制保證在遇到惡意攻擊時能夠及時消除風險,第一時間從最近的備份點恢復業(yè)務。
智能化檔案管理系統(tǒng)實現(xiàn)了功能模塊化、數(shù)據(jù)處理智能化、統(tǒng)計和分析結果可視化,最大程度解決了政府、企事業(yè)單位、公檢法司、教育、醫(yī)療、法律和金融等不同行業(yè)的檔案信息化管理和智能化數(shù)據(jù)挖掘的需求,解決了傳統(tǒng)檔案管理中粗放、低效、不可靠和難以保密的問題。該系統(tǒng)的實施可使檔案管理工作人員的工作量下降80%~90%,通過對檔案的深度挖掘可使人才適用率提升50%~60%,檔案系統(tǒng)的工作效率和數(shù)據(jù)利用效果顯著提升。
傳統(tǒng)的檔案管理模式因低效、粗放等原因早已無法適應當今的信息社會,實現(xiàn)新形勢下檔案數(shù)據(jù)的信息化管理和智能挖掘已成為檔案管理革新的必經(jīng)之路。該系統(tǒng)基于這種需求實現(xiàn)了檔案數(shù)據(jù)管理的模塊化、標準化和規(guī)范化,但依然存在數(shù)據(jù)預處理不夠智能、數(shù)據(jù)挖掘不夠精細等問題,該系統(tǒng)將針對這些問題繼續(xù)改進和完善,為檔案管理和價值挖掘提供更多更好的方案。