胡雁 李媛 朱云燕
摘要:本文針對安全企業(yè)電子文檔內(nèi)容管理(SECM)結(jié)合云南省環(huán)保行業(yè)實際進行應(yīng)用探討,重點提升環(huán)保行業(yè)非結(jié)構(gòu)化數(shù)據(jù)內(nèi)容管理與使用,提升非結(jié)構(gòu)化數(shù)據(jù)安全性及內(nèi)容價值,從而更好服務(wù)于環(huán)境保護事業(yè)。
關(guān)鍵詞:電子文件管理;國家戰(zhàn)略;生命周期管理;智能數(shù)據(jù)管理;SECM;數(shù)據(jù)挖掘
中圖分類號:TP311.1 文獻標(biāo)識碼:A 文章編號:1007-9416(2018)07-0212-02
1 環(huán)保當(dāng)前非結(jié)構(gòu)化數(shù)據(jù)管理模式
隨著《“十三五”國家信息化規(guī)劃》、《促進大數(shù)據(jù)發(fā)展行動綱要》、《國家信息化發(fā)展戰(zhàn)略綱要》、《生態(tài)環(huán)境大數(shù)據(jù)建設(shè)總體方案》等政策文件和指導(dǎo)性文件的發(fā)行。依托互聯(lián)網(wǎng)技術(shù)整合信息化系統(tǒng),實現(xiàn)更加精細、動態(tài)的管理和決策,加快“數(shù)字化”向“智慧化”的轉(zhuǎn)變是信息化建設(shè)的必然趨勢。當(dāng)前,環(huán)保行業(yè)逐步采用“互聯(lián)網(wǎng)+”、云計算、大數(shù)據(jù)技術(shù)推動環(huán)保數(shù)據(jù)資源整合,構(gòu)建“互聯(lián)網(wǎng)+”綠色生態(tài),實現(xiàn)生態(tài)環(huán)境數(shù)據(jù)互聯(lián)互通和開放共享。但在實際工作環(huán)境中基礎(chǔ)設(shè)施和系統(tǒng)建設(shè)分散,應(yīng)用“煙囪”和數(shù)據(jù)“孤島”林立,業(yè)務(wù)協(xié)同和信息資源開發(fā)利用水平低,綜合支撐和公眾服務(wù)能力弱等突出問題,主要體現(xiàn)在:
(1)數(shù)據(jù)分散:在環(huán)保工作開展過程中產(chǎn)生大量數(shù)據(jù),例如:環(huán)境評測取證圖片、視頻、報告、污染監(jiān)測信息、工作文檔等海量數(shù)據(jù)。當(dāng)前,這些數(shù)據(jù)均散落在各業(yè)務(wù)系統(tǒng)、員工辦公終端、文件服務(wù)器等環(huán)境中,數(shù)據(jù)處于無序狀態(tài),各自管理和使用;
(2)存儲成本高:目前環(huán)保信息系統(tǒng)環(huán)境下相同的一份數(shù)據(jù)存儲在多個業(yè)務(wù)系統(tǒng)或存儲介質(zhì)中,數(shù)據(jù)冗余現(xiàn)象普遍,造成存儲空間浪費增加數(shù)據(jù)擁有成本;
(3)數(shù)據(jù)安全難以保障:隨著環(huán)保信息化的普及,環(huán)境監(jiān)測、環(huán)境執(zhí)法、區(qū)域環(huán)境綜合整治等工作依托信息系統(tǒng)技術(shù)進行開展,業(yè)務(wù)系統(tǒng)數(shù)據(jù)成倍增長,特別是圖片、視頻、評測報告等非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)備份保護時間窗口越來越長。同時,在《政務(wù)信息資源共享管理暫行辦法》的推動下,各業(yè)務(wù)系統(tǒng)、部門之間建立數(shù)據(jù)共享,數(shù)據(jù)邊界安全難于保障;
(4)數(shù)據(jù)孤立、利用率低下:雖然環(huán)保信息化采用云計算技術(shù)對業(yè)務(wù)系統(tǒng)進行了集中,但各很多業(yè)務(wù)系統(tǒng)數(shù)據(jù)彼此孤立、無序,數(shù)據(jù)之間無法建立關(guān)聯(lián)性,數(shù)據(jù)價值難于發(fā)揮。
我們要向“智慧環(huán)?!鞭D(zhuǎn)型,行業(yè)多年積累的海量數(shù)據(jù)是轉(zhuǎn)型的關(guān)鍵所在,而在全新的信息生態(tài)環(huán)境下,目前數(shù)據(jù)管理模式的問題不斷凸顯,這就驅(qū)使我們在信息化建設(shè)中注重業(yè)務(wù)數(shù)據(jù)內(nèi)容的全生命周期。
2 國內(nèi)外電子文件管理模式
2.1 國外發(fā)展現(xiàn)狀
根據(jù)國外Gartner的分析報告,目前企業(yè)文檔數(shù)據(jù)管理,從傳統(tǒng)的以網(wǎng)盤為中心的EFSS向以內(nèi)容為中心的SECM(安全企業(yè)內(nèi)容管理)方向轉(zhuǎn)變。
安全企業(yè)內(nèi)容管理(SECM)復(fù)合年增長率大約10%。在國外,美國的Box和Dropbox在企業(yè)內(nèi)容管理方面有新的產(chǎn)品推出,主要解決的是企業(yè)協(xié)同辦公,數(shù)據(jù)集中存儲,企業(yè)社交通信等領(lǐng)域,更多的是提供通用型產(chǎn)品,以提高企業(yè)生產(chǎn)效率為目的。
2.2 國內(nèi)發(fā)展現(xiàn)狀
目前,SECM(安全企業(yè)內(nèi)容管理)的概念剛剛引入中國,國內(nèi)市場中有道云筆記、印象筆記是做內(nèi)容管理較早的產(chǎn)品,但是這些產(chǎn)品更多的是關(guān)注個人免費市場,還沒有大規(guī)模的適用于企業(yè)級市場中,近年來,國內(nèi)愛數(shù)、聯(lián)想、億方云、360企業(yè)云盤等開始對非結(jié)構(gòu)化數(shù)據(jù)的管理、使用和分析進行研究,海量非結(jié)構(gòu)化數(shù)據(jù)采用分布云存儲技術(shù)進行存儲、管理已有一定的積累和驗證。
3 構(gòu)建環(huán)保安全的非結(jié)構(gòu)化數(shù)據(jù)管理體系
SECM安全企業(yè)內(nèi)容管理涵蓋了企業(yè)內(nèi)部、WEB、企業(yè)外部等數(shù)據(jù)內(nèi)容的管理。我們將基于SECM(安全企業(yè)內(nèi)容管理)對數(shù)據(jù)內(nèi)容全生命周期管理的方法論結(jié)合環(huán)境保護行業(yè)數(shù)據(jù)安全合規(guī)行要求下進行應(yīng)用探討。
3.1 中心化非結(jié)構(gòu)化數(shù)據(jù)
環(huán)保行業(yè)普遍面臨應(yīng)用系統(tǒng)開發(fā)廠商不一、類型多樣、復(fù)雜,業(yè)務(wù)系統(tǒng)數(shù)據(jù)“孤島”問題凸顯。辦公數(shù)據(jù)散亂無序,數(shù)據(jù)格式多種多樣,數(shù)據(jù)安全難于保障。在實際業(yè)務(wù)開展過程中業(yè)務(wù)系統(tǒng)之間、部門之間存在大量的共享、協(xié)作。例如:當(dāng)前云南省環(huán)保系統(tǒng)統(tǒng)一部署了全省建設(shè)項目環(huán)境影響評價管理系統(tǒng),大量的環(huán)評報告采用傳統(tǒng)文件服務(wù)器存儲,數(shù)據(jù)權(quán)限、邊界安全難于保障,采用傳統(tǒng)的存儲模式進行匯集,從性能、安全性、擴展性等方面都無法很好適應(yīng)海量數(shù)據(jù)的存儲。SECM(安全企業(yè)內(nèi)容管理)提供強有力的性能、整合、擴展能力,將數(shù)據(jù)內(nèi)容進行統(tǒng)一聚合,構(gòu)建非結(jié)構(gòu)化數(shù)據(jù)中心,為環(huán)保大數(shù)據(jù)挖掘和分析奠定良好基礎(chǔ)。
3.2 重構(gòu)非結(jié)構(gòu)化數(shù)據(jù)存儲架構(gòu)
根據(jù)IDC統(tǒng)計企業(yè)80%的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù),而且數(shù)據(jù)增長速度快,數(shù)據(jù)從PB向ZB發(fā)展,SECM(安全企業(yè)內(nèi)容管理)基于分布式云存儲技術(shù)架構(gòu),采用多副本技術(shù)確保數(shù)據(jù)高可用性,云存儲易擴展架構(gòu)特點能幫助環(huán)保行業(yè)工作開展中環(huán)評報告、圖片、視頻等海量非結(jié)構(gòu)化數(shù)據(jù)的安全存儲,并提供大并發(fā)的讀取性能,提供全新的數(shù)據(jù)存儲模式。
3.3 安全與合規(guī)的數(shù)據(jù)管理
云南省環(huán)境信息中心作為政府部門事業(yè)單位,數(shù)據(jù)安全性不言而喻,但在實際工作中對數(shù)據(jù)的管理、使用、傳播安全意識不足,文件被越權(quán)訪問、無意識的拷貝、對文件的誤操作等時常發(fā)生。另外,計算機系統(tǒng)容易受到自然災(zāi)害、供電、病毒、黑客攻擊等各方面的破壞和侵襲,2017年五月勒索病毒的盛行給數(shù)據(jù)安全敲響警鐘。加之,數(shù)據(jù)的分散存儲、文件服務(wù)器安全性不足,這給數(shù)據(jù)安全管理工作帶來更大挑戰(zhàn),我們以全省建設(shè)項目環(huán)境影響評價管理系統(tǒng)為例,該系統(tǒng)匯聚了全省環(huán)境影響評價報告數(shù)據(jù),而且報告數(shù)據(jù)本身有一定的安全要求,采用文件服務(wù)器存儲權(quán)限劃分不清晰,后端數(shù)據(jù)監(jiān)管不力,數(shù)據(jù)安全邊界模糊,無法滿足安全性和合規(guī)性的管理要求。SECM(安全企業(yè)內(nèi)容管理)致力于數(shù)據(jù)內(nèi)容的安全管理,從前端細粒度權(quán)限控制,存儲端切片加密,應(yīng)用全面、可視化的審計模式,對所有訪問行為、數(shù)據(jù)使用情況、訪問地理位置、權(quán)限配置合規(guī)性等進行全面洞察,形成整個非結(jié)構(gòu)化數(shù)據(jù)中心安全閉環(huán)。
3.4 建立高效、安全共享模式
日常工作中大量的工作需多人共享協(xié)作完成,當(dāng)前行業(yè)中均通過郵件、FTP或者聊天軟件進行共享,一方面數(shù)據(jù)丟失、泄露、損壞等問題難于控制,另一方面冗余數(shù)據(jù)普遍存儲成本壓力不斷增加。伴隨著國家網(wǎng)絡(luò)安全法的實施對企業(yè)網(wǎng)絡(luò)、數(shù)據(jù)、IT環(huán)境的安全提出了更高的要求,數(shù)據(jù)共享安全值得我們企業(yè)去努力和探討。SECM(安全企業(yè)內(nèi)容管理)的出現(xiàn)為企業(yè)數(shù)據(jù)共享提供了更安全、更高效的模式,在數(shù)據(jù)共享時實現(xiàn)數(shù)據(jù)細粒度權(quán)限控制,定義數(shù)據(jù)共享安全邊界,有效防止數(shù)據(jù)泄露、篡改。
3.5 優(yōu)化數(shù)據(jù)檢索
在環(huán)保行業(yè)中大量的數(shù)據(jù)查找通過業(yè)務(wù)系統(tǒng)(如:OA、全省建設(shè)項目環(huán)境影響評價管理系統(tǒng))和系統(tǒng)資源管理本地查找方式,面對時間較近的文件可以通過時間條件、文件名稱快速定位,但是對于海量的歷史數(shù)據(jù)對文件名稱、時間范圍模糊不清的文件,要能準(zhǔn)確找到需要的文件猶如“大海撈針”,工作中常常耗費大量的時間去查找某個歷史環(huán)境評測項目的相關(guān)資料,基于SECM(安全企業(yè)內(nèi)容管理)提供的全文檢索引擎,結(jié)合環(huán)境保護行業(yè)中數(shù)據(jù)類型(圖片、壓縮文件、視頻等)和結(jié)構(gòu),通過擴展文件標(biāo)簽、屬性等優(yōu)化搜索引擎填補環(huán)保行業(yè)中歷史數(shù)據(jù)的查找空缺。
3.6 數(shù)據(jù)內(nèi)容分析
數(shù)據(jù)價值的發(fā)揮在于數(shù)據(jù)內(nèi)容關(guān)聯(lián)性的分析挖掘,OA系統(tǒng)、知識管理系統(tǒng)雖然進行了一些文檔數(shù)據(jù)的統(tǒng)一存儲,但對數(shù)據(jù)內(nèi)容無法建立關(guān)聯(lián)性,單個文件價值無法凸顯,統(tǒng)一非結(jié)構(gòu)數(shù)據(jù)中心的建設(shè)為數(shù)據(jù)分析奠定良好的基礎(chǔ),如何建立數(shù)據(jù)之間關(guān)聯(lián)性是環(huán)保大數(shù)據(jù)建設(shè)的關(guān)鍵前提,SECM(安全企業(yè)內(nèi)容管理)核心在于企業(yè)數(shù)據(jù)內(nèi)容的管理,它通過自身豐富的融合方式,匯聚企業(yè)內(nèi)部各類數(shù)據(jù),并對數(shù)據(jù)內(nèi)容進行分類管理,建立規(guī)范化、標(biāo)準(zhǔn)化數(shù)據(jù)的管理機制,讓數(shù)據(jù)從無序變有序,數(shù)據(jù)源從多點變?yōu)榻y(tǒng)一,讓員工在業(yè)務(wù)開展過程中不斷優(yōu)化數(shù)據(jù)源,提升數(shù)據(jù)質(zhì)量,并對存儲數(shù)據(jù)進行詞頻、詞義進行分析,抽取文檔關(guān)鍵性內(nèi)容,形成基于內(nèi)容的聚類,加快大數(shù)據(jù)在環(huán)保行業(yè)中的落地。
3.7 擴展內(nèi)外網(wǎng)交換,促進資源共享
近年來,很多安全廠商逐步推出安全隔離交換設(shè)備及解決方案,對傳統(tǒng)刻錄光盤交換的方式發(fā)起沖擊,隨著政務(wù)公開、政務(wù)信息共享的推行,傳統(tǒng)的數(shù)據(jù)交換弊端逐漸凸顯,一方面,光盤刻錄效率低下,成本高昂;另一方面,審計人員工作效率低,數(shù)據(jù)安全不可控,無法進行良好的審計和追溯。當(dāng)下一些單位開始采用擺渡式網(wǎng)閘進行隔離交換,但是在交換中如何讓兩端緩存區(qū)域安全可控、合規(guī)給我們研究提出了新的挑戰(zhàn)。SECM(安全企業(yè)內(nèi)容管理)基于EFSS及底層安全管控機制對交換數(shù)據(jù)采用權(quán)限、密級、加密等安全機制保障數(shù)據(jù)安全擴展環(huán)保行業(yè)內(nèi)外網(wǎng)數(shù)據(jù)安全交換的探討,將智能數(shù)據(jù)內(nèi)容識別過濾,流程化交換模型靈活應(yīng)用工作中,簡化數(shù)據(jù)審核機制,釋放審計人員生產(chǎn)力。
4 結(jié)語
本文主要針對云南省環(huán)境保護行業(yè)SECM(安全企業(yè)內(nèi)容管理)的應(yīng)用探討,結(jié)合全省各級環(huán)保部門當(dāng)前工作人員桌面文檔數(shù)據(jù)、業(yè)務(wù)系統(tǒng)產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)使用現(xiàn)狀和問題進行探索,SECM(安全企業(yè)內(nèi)容管理)基于分布式云存儲架構(gòu)定義非結(jié)構(gòu)化數(shù)據(jù)中心;擴展全文檢索引擎、權(quán)限即共享的模式極大提高文件使用、傳輸效率;文件分類思想符合企業(yè)數(shù)據(jù)管理的需要;開放的接口加速業(yè)務(wù)系統(tǒng)數(shù)據(jù)的整合;通過應(yīng)用探討真正實現(xiàn)非結(jié)構(gòu)數(shù)據(jù)從生成、采集、存儲、使用、洞察、分析等全生命周期管理,當(dāng)然,目前對SECM(安全企業(yè)內(nèi)容管理)的應(yīng)用探討還不夠深入,希望在今后的工作開展中不斷深化數(shù)據(jù)內(nèi)容的管理與挖掘,讓企業(yè)無形的數(shù)據(jù)發(fā)揮蘊含的價值,為我省環(huán)境保護事業(yè)提供決策性指導(dǎo)意見。
參考文獻
[1]錢毅.電子文件管理系統(tǒng)功能需求規(guī)范定位研究[J].北京檔案,2011,(04):24-26.
[2]張玲.國有大型石油企業(yè)ECM平臺建設(shè)探悉[J].經(jīng)濟研究導(dǎo)刊,2013,(12):39-40.
[3]齊朝輝.基于跨網(wǎng)閘的安全隔離交換平臺的設(shè)計與實現(xiàn)[D].華南理工大學(xué),2009.