張玉偉,姚紅玲
?
數(shù)字教育資源云存儲安全策略
張玉偉,姚紅玲
(石家莊信息工程職業(yè)學院 傳媒藝術系,河北石家莊 050035)
云存儲為數(shù)字教育資源帶來海量存儲的同時也帶來數(shù)據(jù)安全性問題,針對現(xiàn)有的教育資源云存儲平臺在數(shù)據(jù)保密性方面的不足,在數(shù)據(jù)保密性方面對現(xiàn)有的數(shù)字教育資源云存儲平臺給出改進的方案,主要改進文件加密/解密、數(shù)據(jù)庫加密/解密、密鑰管理和客戶端4個模塊,引用加密算法設計,保證加密效率和加密數(shù)據(jù)的安全性.
教育資源;云存儲;系統(tǒng)架構;安全策略
云計算具有安全、方便、數(shù)據(jù)共享及無限可能等優(yōu)勢特點.然而,對于網(wǎng)絡教學資源而言,云環(huán)境下數(shù)據(jù)都存儲和運行在遠端的云計算中心,而非傳統(tǒng)的數(shù)據(jù)中心.云計算復雜性、用戶動態(tài)性等都使網(wǎng)絡教學資源云存儲的安全性、保密性、可用性變得不確定,云環(huán)境在為用戶提供高效、海量、便捷服務的同時,也對教學資源云存儲安全帶來了新的挑戰(zhàn).目前,隨著國家及省級相關文件的先后出臺,致力于打造優(yōu)質(zhì)數(shù)字教育資源成為各大院校和各級教育機構競相追逐的目標,如何更加安全可靠地實現(xiàn)教育資源共享,成為了數(shù)字教育資源云存儲平臺建設亟待解決的一項難題.但是目前,云計算作為一個整體概念還處在發(fā)展時期,相關的技術規(guī)范還不健全.本文在分析省內(nèi)數(shù)字教育云資源主要的安全威脅前提下,構建出云存儲安全分層模型,并將研究重點鎖定在數(shù)據(jù)保密性方面,把文件加密、數(shù)據(jù)庫加密、密鑰保護作為改進云存儲安全的策略,以保證基于云平臺的數(shù)字教育資源存儲安全,從而為河北省各院校、培訓機構打造優(yōu)質(zhì)教育資源,滿足人才培養(yǎng)需求,進而促進服務地區(qū)經(jīng)濟建設和產(chǎn)業(yè)發(fā)展,構建終身學習體系有著重要意義.
本文基于教育資源云存儲平臺的安全性問題,分析了現(xiàn)有的教育資源云存儲平臺在數(shù)據(jù)的保密性方面的不足之處,并對其中關鍵問題如文件加密、數(shù)據(jù)庫加密、密鑰保護的問題進行了重點闡述.基于上述的關鍵問題,方案給出云存儲實驗平臺的設計,并提出了云存儲加密/解密和密鑰管理的方式,從而建立起可信的網(wǎng)絡教學資源安全云.
1.1 云計算和云存儲
1.1.1 云計算
云計算[1]作為現(xiàn)今重要的資源服務方式,已經(jīng)被越來越多的商業(yè)及教育機構采納和接受.它以資源的虛擬性和動態(tài)伸縮性,將數(shù)以億計的資源以服務的形式通過互聯(lián)網(wǎng)提供給廣大用戶.一般的云計算被分為以下3類:基礎設施即是服務,也就是Iaas;平臺即服務,也就是Paas,還有軟件即服務,也就是Saas.現(xiàn)在世界上越來越多的大型科技公司和科研機構都加入到了云計算的研究領域,并且一些公司已經(jīng)推出了自己設計的云平臺,逐步實現(xiàn)從軟件服務提供商到信息服務提供商轉變的過程.
1.1.2 云存儲
云存儲作為云計算中的重要組成部分,以其海量的、易于擴展,并且虛擬化的資源存儲池所著稱.其出現(xiàn)解決了用戶資源海量存儲的問題,也就意味著存儲以服務的形式通過互聯(lián)網(wǎng)提供給廣大用戶,提供商對用戶主要按照存儲時間和占用的空間量進行計費.
云存儲的主要存儲形式分為文件存儲和數(shù)據(jù)庫存儲2種:
1) 文件存儲
相對傳統(tǒng)的文件存儲而言,云存儲具有虛擬性和較大的可擴展性,因此云存儲不像傳統(tǒng)存儲一樣具有存儲分區(qū),云存儲大都采用的是域或者命名空間的形式來分隔各個用戶的數(shù)據(jù)資源.通常每個域或者命名空間中僅存儲同一用戶的數(shù)據(jù),同一域或者命名空間的數(shù)據(jù)存儲都是并列的,即平級存儲所有文件,也就沒有了文件夾的存在.
2) 數(shù)據(jù)庫存儲
基于云中數(shù)據(jù)庫的海量存儲、存儲和訪問的高效性和高擴展性等特性方面的要求,傳統(tǒng)的數(shù)據(jù)庫達到完成這些方面的目標,因此大多的云數(shù)據(jù)庫廣泛采用的都是NoSQL數(shù)據(jù)庫.NoSQL數(shù)據(jù)庫在設計上更多關注海量存儲的問題和數(shù)據(jù)的高并發(fā)讀寫特性,實現(xiàn)了表中無Schema存在,采用的數(shù)據(jù)模型為ST的稀疏表,即表中任意行的屬性不同.
1.2 云存儲安全現(xiàn)狀分析
目前而言,比較主流的開源產(chǎn)品有很多,其中Hadoop以其較好的容錯特性以及高性能的部署特性為大多數(shù)的企事業(yè)單位和教育機構所使用,它其中自帶一個高性能的數(shù)據(jù)庫HBase,考慮到Hadoop的本身架構對于數(shù)據(jù)的可用性和完整性特點已經(jīng)比較完善,保密性的討論目前相對較少.國內(nèi)外的很多公司也在從事云存儲服務產(chǎn)業(yè)的開發(fā),比如亞馬遜公司的S3、谷歌的App Engine,其中亞馬遜的S3研發(fā)時間相對較早,在技術上比較成熟,比較注重完整性、加密、授權等方面的安全性設計,但是其加密僅實現(xiàn)了通訊過程的協(xié)議加密,而對于存儲數(shù)據(jù)則沒有采取任何加密措施.
雖然相對傳統(tǒng)的存儲方式而言,云存儲技術具有極大的優(yōu)勢,但是不可避談的就是云存儲的安全性問題,2011年的索尼公司的信息外泄事件為本來看似樂觀的云存儲技術敲響一記警鐘,該次事件共造成了超過10億元經(jīng)濟損失,并且泄露了數(shù)以億計的用戶數(shù)據(jù);而就在同年的4月份,作為云服務提供商的亞馬遜公司也遭遇了前所未有的宕機事件,給其用戶帶來了巨大損失.兩大云事件的相繼出現(xiàn),為有著無限憧憬的云產(chǎn)業(yè)籠罩了一層陰霾,這也使得人們將視線重點轉向了云存儲的安全性問題,也為本項目的研究提供了契機.
1.3 研究目標
針對現(xiàn)有的教育資源使用的云存儲平臺而言,其對數(shù)據(jù)保密性相對較少,而如果忽視保密性問題則會對信息資源的安全帶來很大隱患,為此我們決定對現(xiàn)有云存儲平臺的保密性方面做出改善.根本目標是保證存儲數(shù)據(jù)的安全,即數(shù)據(jù)的保密性、完整性和可用性;涉及的過程有數(shù)據(jù)生成、傳輸、保存、訪問.這其中,既包括傳統(tǒng)的信息安全、存儲加密等技術,又包括云存儲的特殊性帶來的安全問題和技術.
2.1 加密和解密原理
眾所周知,數(shù)據(jù)是文件的存在形式,而數(shù)據(jù)的組成單位是字節(jié),無論是否為可執(zhí)行文件,都可以看作是有序的一些字節(jié)流或者字節(jié)的集合.而加密則是把有序的易于理解的各種數(shù)據(jù)轉換成無序的無法理解的數(shù)據(jù),換句話說,就是把可讀變?yōu)椴豢勺x,把可用變?yōu)椴豢捎?,把文件固有的格式進行破壞,這就是所謂的加密,以提高其在使用和傳輸環(huán)節(jié)上的安全性.解密的過程則是加密逆過程,通過與加密相同的密鑰,通過算法進行解密,把數(shù)據(jù)重新恢復到可讀可用狀態(tài)[2].
2.2 混沌映射
混沌對于系統(tǒng)參數(shù)和初始條件具有極端敏感性和對長期演化結果的不可預測性,具備非常穩(wěn)定的密碼學特性.
2.3 DES、RSA、AES算法
2.3.1 DES算法
DES作為典型的分組算法,也是世界上目前應用最廣泛的密碼算法之一.其明文和密鑰分別為64 bit,各自作為其算法一端的輸入,被加密的明文通過復雜的16輪的密鑰運算,得到64 bit的密文進行輸出,其目的是盡可能增強混亂性和不可推斷性,以防止攻擊者的破譯.
2.3.2 RSA算法
除了可能的混雜因素以外,測量方法的主觀性、缺乏患者完成日常生活任務的實際背景也會阻礙患者日常生活能力的改善。動物研究和現(xiàn)代康復研究都證實環(huán)境是運動學習的重要因素。而且,由于可能有潛在的認知功能的損傷,卒中患者通常在把學習到的運動技巧轉化運用到日常生活中都存在困難。
RSA作為ISO推薦的公鑰加密標準,能抵擋迄今為止的所有已知的密碼攻擊,RSA算法采用的非對稱式密碼算法,即必須具備同時一對密鑰才可以對文件或數(shù)據(jù)加密和解密,該算法是目前最富影響力的公鑰加密算法.
2.3.3 AES算法
AES算法作為用以替代DES的算法標準,使用的迭代的對稱密碼分組,比較便于抵御空間和時間上的攻擊,是集高效、安全、高性能于一體的高級加密標準,已經(jīng)為多方認可和使用.
2.4 擬解決的關鍵問題
在數(shù)據(jù)保密性方面對現(xiàn)有的數(shù)字教育資源云存儲平臺給出改進的方案,采用文件加密、數(shù)據(jù)庫加密、密鑰保護等措施,引用加密算法設計,保證加密效率和加密數(shù)據(jù)的安全性.
我們以現(xiàn)今教育資源普遍采用的Hadoop平臺為實驗基礎,其中HBase作為其數(shù)據(jù)庫系統(tǒng),HDFS為其文件存儲系統(tǒng),實行文件加密設計、數(shù)據(jù)庫加密設計和密鑰保護三方面的改進,從而構建安全云存儲平臺.我們分別從系統(tǒng)構架、系統(tǒng)各個模塊及模塊加密算法的設計做如下探討:
3.1 構架設計[3]
依據(jù)云存儲平臺的特性,對其劃分為應用層、運營層、平臺層、虛擬層和設施層,其中應用層作為一個WEB客戶端,是面向用戶的,負責提供各種云存儲服務和簡單的文件、數(shù)據(jù)庫操作;而運營層作為應用層的基礎,主要實現(xiàn)業(yè)務的部署和運營,在本實驗平臺中不涉及運營方面的功能,所以不涉及運營層的設計;平臺層主要提供運行環(huán)境的支持,在此層上構架Hadoop平臺,并加以HBase和HDFS與之相配置,其中HBase中的數(shù)據(jù)通過數(shù)據(jù)庫加密模塊對其進行加密,而HDFS中文件則設置文件加密模塊對其加密,其中的密鑰保護模塊則保護這兩個模塊中的密鑰;虛擬層使用的KVM虛擬機,以實現(xiàn)設備的虛擬化;設施層提供了包括硬件和軟件的基本存儲、計算設備,建立一個由20臺PC和網(wǎng)絡設備構成的集群.
3.2 模塊設計
3.2.1 客戶端模塊
客戶端模塊主要包含文件和數(shù)據(jù)的上傳及獲取兩個功能,分別由文件管理子模塊和數(shù)據(jù)庫管理子模塊管理.該模塊實現(xiàn)用戶向云傳送和讀取文件及數(shù)據(jù),通過調(diào)用API,進行加密和解密.
3.2.2 文件加密/解密模塊
文件加密/解密模塊將經(jīng)由客戶端傳來的文件加密,并保存到HDFS;如果需要讀取文件則有HDFS獲取并解密已加密文件,再傳回客戶端.每個文件配有單獨的數(shù)據(jù)密鑰,需要提供相應用戶的私鑰、用戶ID及文件ID才能獲取文件的數(shù)據(jù)密鑰,數(shù)據(jù)密鑰用以對文件的加密和解密.
3.3.3 數(shù)據(jù)庫加密/解密模塊
其重要功能為實現(xiàn)由客戶端模塊傳來的文件及數(shù)據(jù)的加密,并保存于HBase;對于解密過程則由HBase讀取并解密已加密數(shù)據(jù),并傳回到客戶端.由用戶自行選擇需加密的敏感字段進行加密,以提高加密/解密性性能,保證數(shù)據(jù)庫檢索的效率,基于對稱密鑰加密速度快、運算量相對較小的特點,對于大量數(shù)據(jù)的加密采用AES算法,AES算法相較DES算法而言,更具安全性,為新一代對稱加密算法.
3.3.4 密鑰管理模塊[5]
該模塊主要為文件、數(shù)據(jù)庫加密/解密模塊提供并管理數(shù)據(jù)密鑰,數(shù)據(jù)密鑰用以加密數(shù)據(jù),不能用明文形式保存,因此使用公鑰加密RSA算法加密數(shù)據(jù)密鑰;而在資源用戶注冊的時候會生成2個RSA密鑰,我們可以由可信的云存儲平臺保存用戶公鑰,以加密數(shù)據(jù)密鑰,而對于用戶私鑰則交由用戶自己保管,以備解密密鑰時使用.
4.1 可行性分析
4.1.1 市場可行性
隨著教育資源云存儲的日趨盛行,社會上的各大云儲存服務和產(chǎn)品的推出,必然導致市場競爭的白熱化,服務商之間的競爭大都從價格、性能及容量上下功夫,往往忽視了安全的重要性.因此,對現(xiàn)有云存儲平臺在數(shù)據(jù)保密性方面的改進是有必要的.本方案分析了現(xiàn)有的教育資源云存儲平臺在數(shù)據(jù)保密性方面的不足之處,并在數(shù)據(jù)的保密性方面對云存儲平臺提出改進,解決了教育資源云平臺存儲的安全性問題,帶動了省內(nèi)教育資源云平臺的發(fā)展.
4.1.2 技術可行性
本方案不需要改變下層存儲構架,主要功能模塊完全建立在文件和數(shù)據(jù)庫存儲之上;對上層也僅需調(diào)用加密/解密接口,而無需關心具體的實現(xiàn)細節(jié).使用的相對成熟的加密算法,如DES、AES、RSA算法,保證安全性的同時兼顧效率.
綜上,從市場和技術角度來說本方案是可行的.
4.2 創(chuàng)新點
本方案與去傳統(tǒng)的存儲安全性方案相比,具有以下創(chuàng)新:
首先,提出用戶密鑰和數(shù)據(jù)密鑰的概念,其中用戶密鑰分為公鑰和私鑰,公鑰用于加密數(shù)據(jù)密鑰,私鑰用于解密數(shù)據(jù)密鑰,數(shù)據(jù)密鑰用以加密和解密用戶數(shù)據(jù).
其次,將用戶數(shù)據(jù)與密鑰分開存儲于不同模塊中,采用這種方式,攻擊者獲取單一某個模塊的數(shù)據(jù)都是沒有實際意義的,而同時攻破兩個模塊的可能性很小,從而保障了用戶數(shù)據(jù)和密鑰的安全性.
再者,采用大小文件分開處理的形式,對于大文件,采用DES和基于混沌映射相結合的算法進行加密,集兩種算法的優(yōu)勢于一體,相比較采用單一的某一種算法,比如單純采用DES或者RSA算法,都更加適用于大文件的加密,提高了加密效率.
本文針對現(xiàn)有云存儲平臺的架構和一些關鍵性問題進行分析,基于現(xiàn)有平臺的加密方面的不足之處,重點對諸如文件加密、數(shù)據(jù)庫加密以及密鑰加密等關鍵性問題進行論述,并給出了基于現(xiàn)有教育云資源平臺的安全性改進解決方案,并通過了安全性的驗證.
[1] MILLER M.云計算[M].姜進磊,史美林,姜進磊,等,譯.北京:機械工業(yè)出版社,2009:17.
[2] 吳朱華.云計算核心技術剖析[M].北京:人民郵電出版社,2011:167.
[3] 馬曉亭,陳臣.云安全2.0技術體系下數(shù)字圖書館信息資源安全威脅與對策研究[J].現(xiàn)代情報,2011(3):62-66.
[4] MATHER T.云計算安全與隱私[M].劉戈舟,楊澤明,劉寶旭,等,譯.北京:機械工業(yè)出版社,2011:64.
[5] 柳青.我國云計算安全問題及對策研究[J].電信網(wǎng)技術,2012(3):5-7.
Strategy of Cloud Storage Security of Digital Educational Resources
ZHANG Yu-wei, YAO Hong-ling
(Faculty of Media Art, Shijiazhuang Information and Engineering Vocational College, Shijiazhuang, Hebei 050035, China)
Cloud storage has brought a mass storage of digital educational resources and also brings data security issues. For the deficiencies of the data confidentiality in the existing educational resources cloud storage platform, some improved plans have been put forward: mainly improving file encryption / decryption module, database encryption / decryption module, key management module and client module. Try to ensure the efficiency and safety of data encryption by referring to encryption algorithm design.
educational resources; cloud storage; system architecture; security policy
(責任編校:李建明 英文校對:李玉玲)
10.3969/j.issn.1673-2065.2015.01.006
TP393
A
1673-2065(2015)01-0019-04
2014-06-25
河北省高等學??茖W技術研究青年基金項目(QN2014314)
張玉偉(1981-),女,河北石家莊人,石家莊信息工程職業(yè)學院傳媒藝術系講師,工學碩士;
姚紅玲(1979-),女,河北石家莊人,石家莊信息工程職業(yè)學院傳媒藝術系講師,工學碩士.