張華麗+楊華勇+江偉
摘要:
我國(guó)數(shù)字化檔案系統(tǒng)存儲(chǔ)主要是本地存儲(chǔ)和局域網(wǎng)存儲(chǔ),存在檔案信息孤立、建設(shè)和管理成本高、后期維護(hù)困難等問(wèn)題。闡述了數(shù)字化檔案云存儲(chǔ)平臺(tái)的物理架構(gòu)、云存儲(chǔ)平臺(tái)的體系結(jié)構(gòu)和規(guī)劃設(shè)計(jì)、開放接口和服務(wù)接入設(shè)計(jì)、云存儲(chǔ)安全策略等。設(shè)計(jì)了一套彈性云存儲(chǔ)、異構(gòu)數(shù)據(jù)存儲(chǔ)、開放文件中心、檔案一體化與全生命周期管理和電子文件加密與開放的數(shù)字化檔案系統(tǒng)。建設(shè)安全的數(shù)字化檔案云存儲(chǔ)平臺(tái),能夠普及數(shù)字化檔案,降低企業(yè)檔案管理成本,提高企業(yè)現(xiàn)代化管理水平。
關(guān)鍵詞:數(shù)字化檔案;云存儲(chǔ);安全策略
DOIDOI:10.11907/rjdk.172887
中圖分類號(hào):TP392
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2017)012-0184-04
Abstract:In the process of enterprise information construction, more and more enterprises begin to attach importance to the construction and implementation of digital archives system. At present, the storage of digital archives system is mainly local storage and local area network storage, resulting in the isolation of enterprise file information, high cost of construction and management, and difficult maintenance in the later stage. Research and design of digital archives cloud storage platform, introduces the physical architecture design of cloud platform, cloud storage platform architecture and planning and design, open interface and service access design, cloud storage security policy. The design of a flexible cloud storage, heterogeneous data storage, open file center, file integration and lifecycle management, electronic file encryption and open digital file system. The construction of a safe digital archives cloud storage platform can popularize the digital awareness of enterprise archives, reduce the cost of enterprise archives management, improve the level of enterprise archives management, and ultimately promote the modern management level of enterprises.
Key Words:digital archives; cloud storage; secure policy
0 引言
在信息技術(shù)高速發(fā)展的今天,電子化數(shù)據(jù)成為企業(yè)的重要資產(chǎn),為企業(yè)制定發(fā)展戰(zhàn)略提供重要的數(shù)據(jù)支撐。企業(yè)數(shù)字化檔案系統(tǒng)作為企業(yè)信息化管理的重要手段之一,普及程度越來(lái)越高。
我國(guó)數(shù)字化檔案系統(tǒng)主要以企業(yè)為主體進(jìn)行部署,企業(yè)檔案管理成本昂貴,對(duì)檔案管理人員要求較高,檔案管理規(guī)范不一,企業(yè)電子數(shù)據(jù)孤立[1],這種狀況越來(lái)越不適應(yīng)當(dāng)代數(shù)字化檔案管理要求。
1 數(shù)字化檔案管理現(xiàn)狀
數(shù)字化檔案管理在企業(yè)中的普及率、管理規(guī)范性和利用效率上參差不齊,存在以下問(wèn)題:
(1)數(shù)字化程度較低。目前大部分企業(yè)檔案數(shù)字化工作由檔案管理部門集中管理,缺乏數(shù)據(jù)的有效收集整理手段,從而造成大量有價(jià)值的檔案數(shù)據(jù)分散在各職能部門,未形成統(tǒng)一管理。同時(shí),由于數(shù)字化設(shè)備不足,造成大量實(shí)體檔案無(wú)法有效收集、大量檔案數(shù)據(jù)丟失。
(2)企業(yè)信息化系統(tǒng)和檔案管理系統(tǒng)不兼容。由于歷史原因,早期數(shù)字化檔案系統(tǒng)沒(méi)有提供統(tǒng)一的數(shù)據(jù)接口,無(wú)法將信息化系統(tǒng)對(duì)接到數(shù)字化檔案系統(tǒng),從而造成大量有價(jià)值的電子數(shù)據(jù)丟失[2]。
(3)專業(yè)檔案管理人才缺失。檔案數(shù)字化是一項(xiàng)專業(yè)性較強(qiáng)的工作,企業(yè)檔案管理人員不僅要熟悉檔案管理的要求與規(guī)范,還要熟悉檔案管理相關(guān)的專業(yè)計(jì)算機(jī)知識(shí)。雖然部分高校開設(shè)了檔案管理專業(yè),但基層仍然存在大量沒(méi)有經(jīng)過(guò)專業(yè)培訓(xùn)的檔案管理人員。
(4)網(wǎng)絡(luò)安全問(wèn)題嚴(yán)重影響檔案的高效利用。傳統(tǒng)的檔案管理系統(tǒng)一般在孤立的企業(yè)內(nèi)網(wǎng)中應(yīng)用,由于檔案管理的特殊性,檔案存儲(chǔ)和傳輸缺乏有效的安全性保障[4],企業(yè)對(duì)檔案的網(wǎng)絡(luò)應(yīng)用缺乏信心,從而造成數(shù)字檔案信息孤島,無(wú)法發(fā)揮檔案的最大價(jià)值。
(5)對(duì)云存儲(chǔ)技術(shù)成熟度的懷疑。云存儲(chǔ)技術(shù)已經(jīng)在很多領(lǐng)域得到了廣泛應(yīng)用。雖然云存儲(chǔ)已經(jīng)很成熟,但對(duì)于穩(wěn)定性和可靠性有特殊要求的檔案管理來(lái)說(shuō),仍然持有懷疑態(tài)度。
2 數(shù)字化檔案云存儲(chǔ)意義
企業(yè)數(shù)字化檔案發(fā)展過(guò)程中,由于硬件投入、管理成本和技術(shù)要求較高,部分基層企業(yè)檔案管理人才缺乏,特別是懂信息化的檔案管理人才缺乏,檔案數(shù)字化整體發(fā)展緩慢,普及率較低。應(yīng)采用成熟的云存儲(chǔ)技術(shù),采用安全、高效和可信任的數(shù)據(jù)加密技術(shù),研究一套安全、可靠、易擴(kuò)展和開放的標(biāo)準(zhǔn)化企業(yè)檔案管理系統(tǒng),以解決企業(yè)數(shù)字化檔案發(fā)展困境。通過(guò)企業(yè)數(shù)字化云存儲(chǔ)平臺(tái),解決數(shù)字檔案發(fā)展過(guò)程中的難題,實(shí)現(xiàn)檔案系統(tǒng)和企業(yè)業(yè)務(wù)系統(tǒng)的無(wú)縫連接,提高數(shù)字檔案的利用效率,減少數(shù)字檔案管理成本[5]。endprint
數(shù)字化檔案云存儲(chǔ)平臺(tái)由分布式文件存儲(chǔ)服務(wù)程序、數(shù)據(jù)存儲(chǔ)和查詢服務(wù)程序及系統(tǒng)控制服務(wù)程序組成,實(shí)現(xiàn)云平臺(tái)的異步數(shù)據(jù)同步功能、數(shù)據(jù)多節(jié)點(diǎn)備份功能、數(shù)據(jù)錯(cuò)誤發(fā)現(xiàn)與并行復(fù)制功能、數(shù)據(jù)的優(yōu)化存儲(chǔ)算法、數(shù)據(jù)壓縮算法、系統(tǒng)運(yùn)行日志保存分析與日記審計(jì)等功能。通過(guò)采用先進(jìn)的分布式服務(wù)框架,提供用戶開放接口和服務(wù)接入功能,從而減少軟硬件投入和項(xiàng)目運(yùn)行管理成本。通過(guò)網(wǎng)絡(luò)隔離、數(shù)據(jù)隔離和端到端的數(shù)據(jù)校驗(yàn)等先進(jìn)的網(wǎng)絡(luò)安全技術(shù)和數(shù)據(jù)加密技術(shù),防止暴力攻擊和系統(tǒng)漏洞等網(wǎng)絡(luò)安全威脅,提高系統(tǒng)安全性,以標(biāo)準(zhǔn)化的、透明的加密算法提供用戶可信的原文安全存儲(chǔ)服務(wù)[6]。
通過(guò)技術(shù)手段,最終實(shí)現(xiàn)企業(yè)數(shù)字檔案的彈性云存儲(chǔ)、異構(gòu)數(shù)據(jù)存儲(chǔ)、開放式文件中心、檔案一體化和全生命周期管理和電子文件加密與開放策略。數(shù)字化檔案云存儲(chǔ)平臺(tái)主要解決異構(gòu)數(shù)據(jù)的云存儲(chǔ)技術(shù)選擇、云存儲(chǔ)平臺(tái)搭建、分布式服務(wù)框架選型、效率分析及負(fù)載均衡實(shí)現(xiàn)、開放平臺(tái)的服務(wù)接口定義和實(shí)現(xiàn)、端到端的數(shù)據(jù)安全傳輸和驗(yàn)證、數(shù)據(jù)簽名和加密等技術(shù)難點(diǎn)。
3 數(shù)字化檔案云存儲(chǔ)關(guān)鍵
(1)彈性云存儲(chǔ)。數(shù)字化檔案應(yīng)用云存儲(chǔ)技術(shù),在實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)的同時(shí),要降低應(yīng)用成本,通過(guò)設(shè)備共享減少硬件資源浪費(fèi)。企業(yè)可根據(jù)其應(yīng)用規(guī)模和數(shù)據(jù)規(guī)模,按需購(gòu)買或升級(jí)服務(wù)。
(2)異構(gòu)數(shù)據(jù)存儲(chǔ)。企業(yè)數(shù)據(jù)的多元化,數(shù)據(jù)格式的多樣性,要求為用戶提供靈活的、可自定義的元數(shù)據(jù)存儲(chǔ)功能。企業(yè)可根據(jù)自身實(shí)際,方便、靈活地配置元數(shù)據(jù)格式。
(3)開放式文件中心。用戶可將工作中產(chǎn)生的數(shù)據(jù)存貯在文件中心,企業(yè)檔案管理部門根據(jù)歸檔范圍自動(dòng)進(jìn)行數(shù)據(jù)歸檔,無(wú)需重新傳輸和移交數(shù)據(jù),減少了人力、物力的浪費(fèi)。
(4)檔案一體化和全生命周期管理。通過(guò)檔案云存儲(chǔ)開放接口存儲(chǔ)的文件,在檔案管理全生命周期內(nèi)應(yīng)具有統(tǒng)一的資源ID屬性,實(shí)現(xiàn)文件的“文件存儲(chǔ)-文件利用-文件修改-文件鑒定-文件銷毀”的全過(guò)程管理。
(5)電子文件加密與開放策略。實(shí)現(xiàn)文件的安全傳輸和傳輸驗(yàn)證,采用有效的數(shù)字簽名技術(shù)和對(duì)稱加密算法,實(shí)現(xiàn)文件的安全存儲(chǔ)。
(6)彈性存儲(chǔ)空間。云存儲(chǔ)架構(gòu)采用并行擴(kuò)容架構(gòu),當(dāng)企業(yè)購(gòu)買的容量不足時(shí),只需采購(gòu)新的存儲(chǔ)空間即可增加容量,從而實(shí)現(xiàn)文件的彈性擴(kuò)容。
4 數(shù)字化檔案云存儲(chǔ)方案
4.1 數(shù)字化檔案云存儲(chǔ)物理架構(gòu)
要實(shí)現(xiàn)數(shù)據(jù)的云存儲(chǔ),特別是檔案數(shù)據(jù)的云存儲(chǔ),在進(jìn)行云存儲(chǔ)平臺(tái)的體系結(jié)構(gòu)和規(guī)劃時(shí)必須考慮以下幾個(gè)問(wèn)題:
4.1.1 穩(wěn)定性
數(shù)據(jù)在傳輸和存儲(chǔ)過(guò)程中不能丟失和出錯(cuò),當(dāng)軟件或硬件出現(xiàn)故障時(shí),必須采用一種機(jī)制實(shí)現(xiàn)容錯(cuò)功能。
4.1.2 一致性
為保證在高并發(fā)情況下數(shù)據(jù)的緩存、持久化和讀取的一致性,要求分布式文件服務(wù)器、業(yè)務(wù)邏輯數(shù)據(jù)庫(kù)和內(nèi)存數(shù)據(jù)庫(kù)中的數(shù)據(jù)一致。
4.1.3 安全性
檔案數(shù)據(jù)具有價(jià)值性和敏感性,云存儲(chǔ)平臺(tái)必須具有防御攻擊能力。數(shù)據(jù)在傳輸和存儲(chǔ)過(guò)程中,必須采取有效的加密措施,防止檔案數(shù)據(jù)流失。
數(shù)字檔案云存儲(chǔ)平臺(tái),對(duì)傳統(tǒng)單一數(shù)據(jù)存儲(chǔ)的檔案系統(tǒng)整體結(jié)構(gòu)進(jìn)行重新設(shè)計(jì),以符合開放服務(wù)云存儲(chǔ)要求。數(shù)字化檔案云存儲(chǔ)物理架構(gòu)如圖1所示。
企業(yè)檔案云存儲(chǔ)框架由以下幾部分組成:
(1)云存儲(chǔ)平臺(tái)。采用分布式云存儲(chǔ)技術(shù),實(shí)現(xiàn)易擴(kuò)展的云存儲(chǔ)平臺(tái)。云存儲(chǔ)平臺(tái)用于存儲(chǔ)加密的數(shù)字化檔案電子文件、檔案元數(shù)據(jù)和應(yīng)用服務(wù)數(shù)據(jù)。
(2)分布式服務(wù)框架和應(yīng)用開放接口。分布式服務(wù)框架包括服務(wù)的分布控制、負(fù)載均衡、接口權(quán)限控制、應(yīng)用安全管理等功能。開放接口向上層(接口用戶、Web服務(wù)器)提供數(shù)據(jù)云存儲(chǔ)開放接口。
(3)Web應(yīng)用服務(wù)器。向用戶提供云存儲(chǔ)后臺(tái)管理功能及開放數(shù)據(jù)的查詢服務(wù)。
(4)安全服務(wù)引擎。以AOP的方式為系統(tǒng)提供整體的安全服務(wù),包括數(shù)據(jù)傳輸加密、數(shù)據(jù)存儲(chǔ)加密(解密)和安全認(rèn)證等功能。
4.2 云存儲(chǔ)平臺(tái)體系結(jié)構(gòu)和規(guī)劃
新的檔案系統(tǒng)提出了數(shù)據(jù)一體化、數(shù)據(jù)異構(gòu)化和數(shù)據(jù)可追溯機(jī)制,設(shè)計(jì)和構(gòu)建檔案云存儲(chǔ)平臺(tái)時(shí),既要繼承傳統(tǒng)檔案系統(tǒng)的優(yōu)點(diǎn),又要對(duì)不適宜的地方進(jìn)行改進(jìn),從而設(shè)計(jì)出一套健壯的可持續(xù)發(fā)展的云存儲(chǔ)平臺(tái),如圖2所示。
檔案云存儲(chǔ)基礎(chǔ)平臺(tái)主要包括3類基本構(gòu)件:
(1)分布式文件存儲(chǔ)服務(wù)程序。數(shù)據(jù)存儲(chǔ)引擎以分布的方式安裝在局域網(wǎng)不同的服務(wù)器主機(jī)上,提供對(duì)傳統(tǒng)關(guān)系數(shù)據(jù)、異構(gòu)元數(shù)據(jù)的存儲(chǔ)和查詢服務(wù)。為提高系統(tǒng)吞吐量和響應(yīng)時(shí)間,內(nèi)置一個(gè)內(nèi)存數(shù)據(jù)庫(kù)引擎,提供數(shù)據(jù)的緩存服務(wù)。同時(shí)系統(tǒng)需要提供一個(gè)自適應(yīng)存儲(chǔ)引擎路由組件,該組件提供一種透明的存儲(chǔ)控制服務(wù)功能,實(shí)現(xiàn)對(duì)不同數(shù)據(jù)的自適應(yīng)存儲(chǔ)。
(2)數(shù)據(jù)存儲(chǔ)和查詢服務(wù)程序。數(shù)據(jù)存儲(chǔ)和查詢服務(wù)程序以開放接口的方式向外部業(yè)務(wù)程序提供服務(wù),包括數(shù)據(jù)存儲(chǔ)服務(wù)和數(shù)據(jù)開放服務(wù)。數(shù)據(jù)存儲(chǔ)服務(wù)為用戶提供服務(wù)目錄,允許用戶在權(quán)限范圍內(nèi)的目錄中存儲(chǔ)和管理系統(tǒng)數(shù)據(jù)和檔案元數(shù)據(jù)。開放數(shù)據(jù)處理服務(wù)向用戶提供云存儲(chǔ)平臺(tái)中的可利用數(shù)據(jù),以便用戶對(duì)數(shù)據(jù)進(jìn)行加工和利用。
(3)系統(tǒng)控制服務(wù)程序。系統(tǒng)控制服務(wù)程序用于對(duì)系統(tǒng)效率、安全性、數(shù)據(jù)一致性和數(shù)據(jù)冗余功能的控制。系統(tǒng)控制服務(wù)程序除保證數(shù)據(jù)的完整性和安全性外,還應(yīng)提供以下功能:①異步數(shù)據(jù)同步;②數(shù)據(jù)多節(jié)點(diǎn)備份;③數(shù)據(jù)錯(cuò)誤發(fā)現(xiàn)與并行復(fù)制;④數(shù)據(jù)的優(yōu)化存儲(chǔ);⑤數(shù)據(jù)壓縮算法;⑥系統(tǒng)運(yùn)行日志保存、分析和日記審計(jì)。
4.3 開放接口和服務(wù)接入
為了保證系統(tǒng)運(yùn)行的穩(wěn)定性和均衡性,用戶不能直接訪問(wèn)存儲(chǔ)平臺(tái)及存儲(chǔ)平臺(tái)上的數(shù)據(jù),數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)服務(wù)通過(guò)開放接口和服務(wù)接入的方式實(shí)現(xiàn),如圖3所示。
4.4 數(shù)字化檔案云存儲(chǔ)安全策略
4.4.1 數(shù)據(jù)存儲(chǔ)加密技術(shù)endprint
系統(tǒng)通過(guò)統(tǒng)一的加密、解密算法,對(duì)數(shù)據(jù)進(jìn)行加密、加殼存儲(chǔ),如圖4所示。
系統(tǒng)通過(guò)計(jì)算得到文件的唯一MD5碼,通過(guò)用戶令牌,獲取用戶的企業(yè)公鑰,通過(guò)公鑰對(duì)MD5進(jìn)行加密,產(chǎn)生電子文件的加密密匙。對(duì)電子文件加密,然后以MD5對(duì)文件加殼,最后將加殼的數(shù)據(jù)存儲(chǔ)到服務(wù)器。
當(dāng)用戶下載電子文件時(shí),傳輸?shù)接脩舳说氖羌用艿募託る娮游募?。用戶?duì)文件去殼,并取到文件的MD5碼,通過(guò)私鑰解密電子文件密匙,再對(duì)電子文件解密,得到最終解密的電子文件。
4.4.2 數(shù)據(jù)網(wǎng)絡(luò)傳輸校驗(yàn)
通過(guò)構(gòu)建健壯的、靈活的訪問(wèn)機(jī)制及數(shù)據(jù)校驗(yàn)機(jī)制,加強(qiáng)系統(tǒng)安全性。數(shù)據(jù)網(wǎng)絡(luò)傳輸校驗(yàn)機(jī)制主要包括如下技術(shù)手段:
(1)請(qǐng)求簽名驗(yàn)證。所有通過(guò)網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)統(tǒng)一使用簽名,防止文件偽造和篡改[11]。
(2)數(shù)據(jù)跨應(yīng)用授權(quán)。用戶申請(qǐng)應(yīng)用接口時(shí),系統(tǒng)會(huì)自動(dòng)對(duì)應(yīng)用進(jìn)行授權(quán),只有授權(quán)的應(yīng)用才能成功訪問(wèn)接口。
(3)賬戶雙層認(rèn)證。系統(tǒng)除提供基本的密碼驗(yàn)證外,還要提供硬件的驗(yàn)證保證,防止惡意訪問(wèn)。
(4)團(tuán)隊(duì)賬戶權(quán)限管理。系統(tǒng)對(duì)用戶組進(jìn)行細(xì)粒度的權(quán)限管理服務(wù),只有具有權(quán)限的用戶才能訪問(wèn)相應(yīng)的功能接口。
5 結(jié)語(yǔ)
數(shù)據(jù)是企業(yè)生存、發(fā)展的重要資產(chǎn),通過(guò)數(shù)字化檔案云存儲(chǔ)平臺(tái),能夠?yàn)槠髽I(yè)提供便捷、高效和安全的云存儲(chǔ)服務(wù),為企業(yè)提高核心競(jìng)爭(zhēng)力提供有力的數(shù)據(jù)支撐。通過(guò)建設(shè)安全的數(shù)字化云存儲(chǔ)平臺(tái),能夠強(qiáng)化企業(yè)檔案數(shù)字化意識(shí),提高企業(yè)檔案管理水平,提升企業(yè)檔案管理的安全
性,促進(jìn)企業(yè)現(xiàn)代化管理水平提高。
參考文獻(xiàn):
[1] 易靖涵.網(wǎng)絡(luò)環(huán)境下圖書館檔案信息資源共享機(jī)制研究[J].赤峰學(xué)院學(xué)報(bào):自然科學(xué)版,2013(17):152-153.
[2] 楊安蓮.檔案信息化建設(shè)的問(wèn)題與建議[J].中國(guó)信息界,2006(14):30-31.
[3] 種金成,何祖華.高校館藏檔案數(shù)字化實(shí)施方案及安全策略研究[J].黑龍江檔案,2014(1):44-45.
[4] 許景艷.知識(shí)經(jīng)濟(jì)時(shí)代高校檔案管理策略[J].赤峰學(xué)院學(xué)報(bào):自然科學(xué)版,2015,31(11):173-175.
[5] 徐秀娟,王宇晴.新時(shí)期高校檔案數(shù)字化管理的現(xiàn)實(shí)意義探析[J].辦公室業(yè)務(wù),2016 (13):132-133.
[6] 傅穎勛,羅圣美,舒繼武.安全云存儲(chǔ)系統(tǒng)與關(guān)鍵技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):136-145.
[7] 侯清鏵,武永衛(wèi),鄭緯民,等.一種保護(hù)云存儲(chǔ)平臺(tái)上用戶數(shù)據(jù)私密性的方法[J].計(jì)算機(jī)研究與發(fā)展,2011,48(7):1146-1154.
[8] MELL P,GRANCE T.The NIST definition of cloud computing[R].National Institute of Standards and Technology(NIST),Washington,USA:Technical Report Special Publication,2011:800-145.
[9] 洪澄,張敏,馮登國(guó).AB-ACCS:一種云存儲(chǔ)密文訪問(wèn)控制方法[J].計(jì)算機(jī)研究與發(fā)展,2010,47(z1):259-365.
[10] 李美云,李劍,黃超.基于同態(tài)加密的可信云存儲(chǔ)平臺(tái)[J].信息網(wǎng)絡(luò)安全,2012(9):35-40.
[11] 李暉,孫文海,李鳳華,等.公共云存儲(chǔ)服務(wù)數(shù)據(jù)安全及隱私保護(hù)技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2014,51(7):1397-1409.
[12] 熊智,王平,徐江燕,等.一種基于屬性的企業(yè)云存儲(chǔ)訪問(wèn)控制方案[J].計(jì)算機(jī)應(yīng)用研究,2013,30(2):513-517.
(責(zé)任編輯:杜能鋼)endprint