劉育平 楊爾欣 高 攀 于光宗 顧冰凌 田 琳
1(國網(wǎng)甘肅省電力公司 蘭州 730030) 2(國網(wǎng)思極飛天(蘭州)云數(shù)科技有限公司 蘭州 730030)
智慧后勤是指以完善的后勤服務(wù)信息化平臺(tái)為基礎(chǔ)[1],采用監(jiān)測、分析、融合、智能響應(yīng)等手段,構(gòu)建高效、便捷的服務(wù)以及綠色和諧的信息生態(tài)環(huán)境,提高用戶滿意度[2].后勤信息的動(dòng)態(tài)加密可實(shí)現(xiàn)后勤數(shù)據(jù)安全和隱私保護(hù)[3-4].大數(shù)據(jù)處理技術(shù)包括大數(shù)據(jù)收集、預(yù)處理以及挖掘等過程,Apache基金會(huì)成功研制了可以進(jìn)行大數(shù)據(jù)開發(fā)及處理的軟件平臺(tái)Hadoop,其作為大數(shù)據(jù)技術(shù)的代名詞被廣泛運(yùn)用在不同研究領(lǐng)域.
呂佳玉等人[5]研究的雙通道動(dòng)態(tài)加密方法可以得到Hadoop平臺(tái)的傳輸數(shù)據(jù)加密結(jié)果,但加密過程需要同時(shí)采用2個(gè)通道完成,且缺乏數(shù)據(jù)結(jié)構(gòu)重組過程,存在加密復(fù)雜度高以及加密時(shí)間長的弊端;李孟天等人[6]研究的RLWE(ring learning with errors)全同態(tài)加密方法,加密密鑰敏感性低,且加密加速比低.
為解決上述問題,需要采用密碼設(shè)計(jì)原理及技術(shù)進(jìn)行加密處理.本文提出一種基于大數(shù)據(jù)技術(shù)的智慧后勤信息動(dòng)態(tài)加密方法,利用Logistics超混沌序列重組大數(shù)據(jù)結(jié)構(gòu),提取大數(shù)據(jù)的模糊關(guān)聯(lián)性屬性量,利用Rossle實(shí)現(xiàn)大數(shù)據(jù)的混沌映射分組動(dòng)態(tài)加密;應(yīng)用Hadoop中的MapReduce并行編程模型加密和存儲(chǔ)數(shù)據(jù).實(shí)驗(yàn)結(jié)果表明,本文方法能夠提高加密信息的密鑰敏感性和平均加密加速比,實(shí)現(xiàn)信息動(dòng)態(tài)安全加密,保證信息安全.
基于分層規(guī)劃理念構(gòu)建智慧后勤信息化系統(tǒng),該系統(tǒng)由基礎(chǔ)設(shè)施層、采集層、數(shù)據(jù)層、應(yīng)用支撐層和應(yīng)用層構(gòu)成,如圖1所示[7-8].該系統(tǒng)通過物聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)實(shí)現(xiàn)不同類型后勤信息的結(jié)構(gòu)化和非結(jié)構(gòu)化采集、處理以及后勤信息模型化應(yīng)用,通過關(guān)聯(lián)分析后勤全部業(yè)務(wù)領(lǐng)域數(shù)據(jù),實(shí)現(xiàn)后勤信息的智能化管理.
基礎(chǔ)設(shè)施層為后勤信息化系統(tǒng)提供基礎(chǔ)數(shù)據(jù)源,并且提供服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)設(shè)備等支撐系統(tǒng)運(yùn)行的硬件設(shè)施,以及智能水電表、環(huán)境傳感器、視頻監(jiān)控設(shè)備等硬件設(shè)備.
采集層采集海量智慧后勤信息,并通過不同標(biāo)準(zhǔn)協(xié)議以及設(shè)備軟件開發(fā)工具包(software development kit, SDK)統(tǒng)一接入門禁、報(bào)警設(shè)備以及視頻設(shè)備.采集層在接入設(shè)備前要先分析設(shè)備型號(hào)以及通信協(xié)議,分析是否可以接入相應(yīng)的設(shè)備.采集層采集的海量智慧后勤信息主要包括:
1) 設(shè)備管控信息.后勤設(shè)備管控信息是指空調(diào)設(shè)備、電梯設(shè)備、照明設(shè)備、給排水設(shè)備、供配電設(shè)備、消防設(shè)備等后勤設(shè)備報(bào)修過程中涉及的報(bào)修通知信息、派工信息、日常檢修運(yùn)維信息、設(shè)備保養(yǎng)維修信息、安全管理信息等.
2) 后勤運(yùn)營信息.包括設(shè)備臺(tái)賬信息、視頻監(jiān)控信息、防盜報(bào)警信息、電子巡更信息等.對(duì)后勤運(yùn)營信息進(jìn)行全生命周期管理,實(shí)現(xiàn)信息應(yīng)用的持久化.
數(shù)據(jù)層對(duì)采集層采集的數(shù)據(jù)進(jìn)行清洗、映射以及授權(quán)等處理,通過數(shù)據(jù)資源目錄為應(yīng)用支撐層提供數(shù)據(jù)接口.數(shù)據(jù)層處理數(shù)據(jù)采用大數(shù)據(jù)技術(shù)以及人工智能技術(shù),大數(shù)據(jù)技術(shù)包括大數(shù)據(jù)分析、大數(shù)據(jù)計(jì)算以及大數(shù)據(jù)加密等.本文重點(diǎn)研究大數(shù)據(jù)加密技術(shù),主要采用Hadoop大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)海量后勤信息數(shù)據(jù)的加密,提高后勤信息的安全性,進(jìn)而為應(yīng)用層的不同業(yè)務(wù)提供安全可靠的數(shù)據(jù)需求服務(wù).
應(yīng)用支撐層用于為應(yīng)用層實(shí)現(xiàn)后勤信息查詢、報(bào)表生成、展示等功能提供驅(qū)動(dòng)服務(wù).應(yīng)用層實(shí)現(xiàn)后勤運(yùn)營管理以及設(shè)備智能管控2種業(yè)務(wù)服務(wù).
Hadoop大數(shù)據(jù)平臺(tái)是Apache基金會(huì)研發(fā)的排列式系統(tǒng)框架[9],包括Hadoop分布式文件系統(tǒng)(Hadoop distributed file system, HDFS)及MapReduce兩個(gè)重要組件.HDFS負(fù)責(zé)保存輸入、輸出的數(shù)據(jù)集以及中間處理結(jié)果;MapReduce負(fù)責(zé)基于并行編程模型處理計(jì)算數(shù)據(jù),利用Reduce(歸并)函數(shù)將HDFS內(nèi)的數(shù)據(jù)集合理劃分為數(shù)據(jù)塊,同時(shí)采用Map(映射)函數(shù)完成不同數(shù)據(jù)節(jié)點(diǎn)鍵值對(duì)之間的映射計(jì)算,并對(duì)數(shù)據(jù)塊進(jìn)行排序,保存在HDFS中.
智慧后勤信息大數(shù)據(jù)的結(jié)構(gòu)重組及混合加密主要分為3個(gè)步驟:
1) 數(shù)據(jù)結(jié)構(gòu)的Logistics超混沌序列重組[10].
通過大數(shù)據(jù)統(tǒng)計(jì)終端獲取密鑰協(xié)議Cn,Cn包括n種差異字符,描述為
(1)
其中,g1,g2,g3,…,gn為不同密文對(duì)應(yīng)的密鑰協(xié)議字符,uj為信道j轉(zhuǎn)移概率,X為門限參數(shù),t0,t1,…,ti為時(shí)間序列.(X,ti)表示門限函數(shù)序列,其與后勤數(shù)據(jù)關(guān)鍵詞密文param={G,gn,h,H}有關(guān).其中,G為回歸函數(shù),h為加密前后勤數(shù)據(jù)關(guān)鍵詞,H為加密后后勤數(shù)據(jù)關(guān)鍵詞.利用Logistics超混沌序列重組后勤數(shù)據(jù)結(jié)構(gòu),得到重組后的Logistics序列V為
V=σCn(X,ti)uj+|σCn-gnti|,
(2)
其中,σ為混沌區(qū)域內(nèi)的分支參數(shù).
2) 確定重新編碼參數(shù).
通過算數(shù)密碼體制對(duì)重組后的Logistics序列V重新編碼,重新編碼參數(shù)k根據(jù)密鑰協(xié)議Cn獲取,即
(3)
其中,e為算數(shù)密碼體制系數(shù),s為算數(shù)密碼體制主密鑰.
3)V和明文序列混合加密.
將V和明文序列I進(jìn)行動(dòng)態(tài)混合加密,s與I的關(guān)聯(lián)程度將影響混合加密的有效性.由于明文序列中包括的明文數(shù)據(jù)量較大且不同明文數(shù)據(jù)之間具有相似性,因此在混合加密之前需要考慮不同明文數(shù)據(jù)之間的相似性β.β的取值為0或1,取值為0時(shí)表示明文數(shù)據(jù)之間不相似或幾乎不相似,取值為1時(shí)表示明文數(shù)據(jù)之間相似度較高.在此條件下計(jì)算s與I的關(guān)聯(lián)程度f,即
(4)
其中,p為安全模糊相關(guān)性系數(shù)[11],p的取值范圍為[0,1].
明確s與I的相關(guān)性后,結(jié)合V和k,得到混合加密結(jié)果V′:
(5)
其中,γ為非線性度.
通過對(duì)智慧后勤信息大數(shù)據(jù)的結(jié)構(gòu)重組及編碼,增強(qiáng)了后勤信息大數(shù)據(jù)的動(dòng)態(tài)加密能力,為下一步的混沌映射分組加密優(yōu)化提供了支持.
智慧后勤信息大數(shù)據(jù)的混沌映射分組加密優(yōu)化主要分為2個(gè)步驟:
1) 獲得I和s的關(guān)聯(lián)規(guī)則屬性量.
根據(jù)s和β,可得算數(shù)密碼體制的關(guān)聯(lián)規(guī)則項(xiàng)集η=Decrypt(β,s).其中,Decrypt為s和β的監(jiān)控密碼函數(shù).結(jié)合η,可得I和s的關(guān)聯(lián)規(guī)則屬性量為
(6)
2) 混沌映射分組加密優(yōu)化.
確定I和s的關(guān)聯(lián)規(guī)則屬性量后,通過Rossle混沌映射對(duì)V′進(jìn)行分組加密,得到Rossle混沌映射初步加密結(jié)果為
(7)
其中,zi為混沌序列的擾動(dòng)控制參數(shù).zi和R與I的關(guān)系可用下述多項(xiàng)式表示:
(8)
其中,I1,I2,…,Im為I中的不同明文數(shù)據(jù),m為明文數(shù)據(jù)個(gè)數(shù),xi為經(jīng)過比特位擴(kuò)散的s中的密碼字符串,B為后勤信息大數(shù)據(jù)的私鑰.
在由式(7)獲取混沌映射初步加密結(jié)果的基礎(chǔ)上,優(yōu)化處理該結(jié)果,以避免混沌系統(tǒng)進(jìn)入短周期軌道而影響加密結(jié)果的安全性.本文擴(kuò)散處理F以實(shí)現(xiàn)優(yōu)化,具體方法如下:
① 對(duì)I1,I2,…,Im進(jìn)行分組,以o表示分組的輪數(shù),產(chǎn)生輪分組私鑰,記作SubKey.
② 獲取經(jīng)過Rossle混沌映射擴(kuò)散處理的動(dòng)態(tài)加密結(jié)果:
(9)
其中,mod代表求余運(yùn)算;q代表Rossle混沌映射的混沌數(shù),q的取值范圍為[0,1];⊕代表異或運(yùn)算.
③ 根據(jù)以往研究,當(dāng)xi在擴(kuò)散過程中的比特位達(dá)到128時(shí),將出現(xiàn)密鑰敏感性較低的情況,甚至將影響最終加密效果.因此,如果比特位大于等于128,則返回步驟②,重新擴(kuò)散處理;如果比特位小于128,則直接輸出Y[12-13].
由此采用Rossle混沌映射加密實(shí)現(xiàn)了海量智慧后勤信息大數(shù)據(jù)的分組動(dòng)態(tài)優(yōu)化加密.
智慧后勤信息動(dòng)態(tài)加密的最后一個(gè)過程為Hadoop超混沌加密與解密,以下是具體步驟:
1) 將Y存儲(chǔ)于HDFS中[14],利用MapReduce并行編程模型重排Y,得到重排結(jié)果Y′.
2) 利用Map函數(shù)超混沌加密Y和Y′:
(10)
其中,E為利用Map函數(shù)的超混沌加密結(jié)果,a為Y中第1個(gè)字節(jié)的偏移量.
3) 采用Reduce函數(shù)歸并E,將歸并結(jié)果Reduce(E)存儲(chǔ)至HDFS中[15].
至此完成了智慧后勤信息動(dòng)態(tài)加密過程.超混沌系統(tǒng)對(duì)初始值和參數(shù)敏感性較高,因此可以通過求解局部密文序列D提高智慧后勤信息數(shù)據(jù)解密精確度,解密公式為
(11)
其中,A為單向哈希函數(shù)安全素?cái)?shù),N0為初始迭代次數(shù),ω為生成的隨機(jī)數(shù).
某后勤管理系統(tǒng)采用ColdFusion進(jìn)行主體結(jié)構(gòu)設(shè)計(jì),可以實(shí)現(xiàn)后勤信息查詢、統(tǒng)計(jì)、報(bào)表生成等功能.在高性能服務(wù)器上配置多個(gè)虛擬機(jī),隨機(jī)導(dǎo)出4 GB和6 GB的后勤系統(tǒng)數(shù)據(jù)集.實(shí)驗(yàn)采用的2種對(duì)比方法分別是雙通道加密方法[5]和RLWE同態(tài)加密方法[6].
圖2為3種方法的加密時(shí)間對(duì)比情況.由圖2可知,隨著數(shù)據(jù)量的增加,3種方法的加密時(shí)間均上升,但本文方法加密時(shí)間低于其他2種方法.3種方法的加密時(shí)間均隨著集群計(jì)算節(jié)點(diǎn)數(shù)量的增加而降低,即加密效率隨著集群計(jì)算節(jié)點(diǎn)數(shù)量的增加而增高,但本文方法加密時(shí)間低于其他2種方法,證明了本文方法加密并行效率高的特點(diǎn).
本文方法使用密鑰參數(shù)解密的數(shù)據(jù)直方圖如圖3所示,其中橫坐標(biāo)為字節(jié)數(shù)據(jù)值,縱坐標(biāo)為抵抗已知明文攻擊下數(shù)據(jù)的分布情況,以分布頻率表示.實(shí)驗(yàn)證明,密鑰全面匹配產(chǎn)生的結(jié)果可以抵抗已知明文攻擊,精準(zhǔn)還原原始明文數(shù)據(jù).而密鑰參數(shù)一旦產(chǎn)生極小誤差,會(huì)造成密鑰失配,生成斷崖式效應(yīng).由圖3可知,本文方法使用具有極小誤差的密鑰參數(shù)解密的密鑰字節(jié)數(shù)據(jù)值在180~200時(shí),數(shù)據(jù)分布頻率產(chǎn)生斷崖式效應(yīng);密鑰字節(jié)數(shù)據(jù)值在200~240時(shí),密鑰完全失配,此時(shí)不能精準(zhǔn)還原原始明文數(shù)據(jù),說明本文方法具有極好的密鑰敏感性.
1) MapReduce加密處理時(shí)間.
采用本文方法對(duì)4 GB文件加密,并測試應(yīng)用MapReduce的加密時(shí)間,結(jié)果如圖4所示:
由圖4可知,當(dāng)Map函數(shù)的數(shù)量小于3時(shí),Map函數(shù)加密時(shí)間處于220 s左右;當(dāng)Map函數(shù)的數(shù)量在3~6時(shí),Map函數(shù)加密時(shí)間大幅度下降,下降到50 s左右;當(dāng)Map函數(shù)的數(shù)量在6~33時(shí),Map函數(shù)加密時(shí)間仍呈下降趨勢但速度有所延緩,達(dá)到18 s左右;當(dāng)Map函數(shù)的數(shù)量在33~51時(shí),Map函數(shù)加密時(shí)間趨于穩(wěn)定,達(dá)到約為10 s.實(shí)驗(yàn)表明,Map函數(shù)的數(shù)量越多,本文方法的Map函數(shù)加密時(shí)間越短.當(dāng)Map函數(shù)的數(shù)量小于18時(shí),Reduce函數(shù)歸并時(shí)間從130 s降到約78 s;當(dāng)Map函數(shù)的數(shù)量在18~24時(shí),Reduce函數(shù)歸并時(shí)間大幅度上升,達(dá)到約178 s;當(dāng)Map函數(shù)的數(shù)量在24~51時(shí),Reduce函數(shù)歸并時(shí)間趨于穩(wěn)定,達(dá)到180 s左右.綜上可知,Map函數(shù)的數(shù)量越多,本文方法利用MapReduce框架的收斂性越強(qiáng),方法越具有穩(wěn)定性.由于穩(wěn)定性可保證算法在運(yùn)行過程中具有良好的加密精準(zhǔn)性,從而表明本文方法對(duì)海量大數(shù)據(jù)具有較好的加密效果.
2) 加密時(shí)間對(duì)比.
對(duì)比分析3種方法加密海量智慧后勤信息過程中不同項(xiàng)目的時(shí)間和速度,如表1所示.
表1 3種方法加密時(shí)間對(duì)比結(jié)果
由表1可知,相較其他2種方法,本文方法加密海量智慧后勤信息過程中,身份認(rèn)證、證書及私鑰產(chǎn)生時(shí)間最短,數(shù)字簽名速度最快,證明本文方法加密效率最高.
3) 加密加速比對(duì)比.
加密加速比是文件加密任務(wù)在單處理器系統(tǒng)和并行處理器系統(tǒng)中運(yùn)行消耗的時(shí)間比率,用來衡量并行系統(tǒng)或程序并行化的性能和效果,具體公式為
(12)
其中,T1為單處理器系統(tǒng)執(zhí)行算法的時(shí)間,Tb為當(dāng)具有b個(gè)處理器時(shí)并行執(zhí)行算法的時(shí)間.加密加速比越大,說明加密性能的并行化效果越好.對(duì)比分析3種方法在不同數(shù)據(jù)量下加密海量智慧后勤信息過程中的加密加速比,如圖5和圖6所示:
由圖5可知,當(dāng)文件為4 GB、Map函數(shù)的數(shù)量小于5時(shí),3種方法的加密加速比呈現(xiàn)上升趨勢;Map函數(shù)的數(shù)量大于5時(shí),隨著Map函數(shù)的數(shù)量增加,3種方法的加密加速比逐漸下降,說明在Map函數(shù)的數(shù)量為5時(shí),4 GB文件的加密加速比達(dá)到最優(yōu).由圖6可知,當(dāng)文件為6 GB時(shí),隨著Map函數(shù)的數(shù)量增加,3種方法的加密加速比逐漸上升.實(shí)驗(yàn)結(jié)果表明,不同數(shù)據(jù)量下,本文方法加密加速比高于其他2種方法,且文件內(nèi)存越大,本文方法的平均加密加速比越高,平均加密加速比達(dá)5.5.可見,本文方法更適合海量數(shù)據(jù)的加密處理.
針對(duì)智慧后勤信息安全問題,本文在Hadoop大數(shù)據(jù)平臺(tái)上,依據(jù)MapReduce排列式并行編程模型,構(gòu)建了基于大數(shù)據(jù)技術(shù)的智慧后勤信息動(dòng)態(tài)加密方法.該方法具有加密時(shí)間短、密鑰敏感性良好等特點(diǎn),可以更好地加密、保存智慧后勤信息數(shù)據(jù),提高對(duì)數(shù)據(jù)的保護(hù)力度.然而,實(shí)驗(yàn)過程中選擇的文件大小及數(shù)量有限,下一步將擴(kuò)大研究范圍,探尋更優(yōu)的實(shí)驗(yàn)條件和進(jìn)一步優(yōu)化參數(shù)配置,以個(gè)性化設(shè)計(jì)加密傳輸方案.