陳孝如,邢蕭飛
(1. 廣州大學(xué)華軟軟件學(xué)院,廣東 廣州 510990;2. 廣州大學(xué)計算機科學(xué)與網(wǎng)絡(luò)工程學(xué)院,廣東 廣州 528225)
目前的涉密信息都是從物理上分離,為防止信息泄密導(dǎo)致互聯(lián)網(wǎng)禁止互通[1],這種情況會出現(xiàn)諸多矛盾,特別是基礎(chǔ)信息和重要業(yè)務(wù)系統(tǒng)出現(xiàn)分離,因此無法實現(xiàn)資源共享,存在工作效率低的問題[2],所以如何保證進行資源共享的同時還能保證涉密信息被更加嚴格的安全控制是目前亟待解決的一大問題[3]。
劉倍雄等人[4]提出大數(shù)據(jù)資源調(diào)度下網(wǎng)絡(luò)信息安全傳輸方法,該傳輸方法在合并多進程網(wǎng)絡(luò)信息及將要傳輸信息的基礎(chǔ)上,將網(wǎng)絡(luò)通訊地址映射機制進行改善,改變網(wǎng)絡(luò)數(shù)據(jù)傳輸中的信息包裝形式,完善了網(wǎng)絡(luò)信息的傳輸協(xié)議,實現(xiàn)信息安全傳輸,該方法在傳輸信息前未利用點群聚類的方法細致分類數(shù)據(jù),因此無法精確選取出傳輸路徑,降低了信息傳輸?shù)某晒β省W靜蘭等人[5]提出基于攜能通信的非信任雙向中繼網(wǎng)絡(luò)信息安全傳輸方法,該方法利用非信任中繼功率分割策略進行信息保密,以最大性能保密目標,并優(yōu)化中繼的PS因子,以此推導(dǎo)出保密和速率的解析式,同時針對非理想信道狀態(tài)信息的情況,分析信道誤差對系統(tǒng)保密性能的影響,最終實現(xiàn)信息安全傳輸,該方法沒有采用廣義距離的定義將數(shù)據(jù)轉(zhuǎn)化成屬性和點群聚類,因此只能粗略地分類涉密數(shù)據(jù),增加信息傳輸?shù)膹?fù)雜度,降低了信息傳輸速率。才巖峰等人[6]提出基于加密機制的SDN網(wǎng)絡(luò)信息安全傳輸方法,該方法利用AES加密算法對網(wǎng)絡(luò)數(shù)據(jù)的映射進行加密,并結(jié)合SDN傳輸特征優(yōu)化傳統(tǒng)傳輸協(xié)議,更新流表匹配域,實現(xiàn)信息安全傳輸,該方法在實現(xiàn)信息安全傳輸前,沒有將分類問題轉(zhuǎn)化求解權(quán)重的點群聚類問題以此進行數(shù)據(jù)分類,導(dǎo)致分類后的涉密數(shù)據(jù)中含有許多無用數(shù)據(jù),大大增加通道緩存數(shù)據(jù),導(dǎo)致CPU使用率過高。為了解決上述方法中存在的問題,提出基于點群聚類的網(wǎng)絡(luò)涉密信息安全傳輸方法。
將涉密信息中的離散點群Pn(n=1,2,…,N)通過SOFM點群網(wǎng)絡(luò)信息聚類的方法進行聚類[7],即結(jié)合信息點位置的坐標和屬性生成SOFM的輸入向量特征,遺傳獲取出一組帶有點群位置的信息數(shù)據(jù)和專屬點群特征的屬性數(shù)據(jù)。點群中的每個點都是SOFM聚類時可輸入的樣本,將所有信息點組成一個輸入樣本集合,則輸入樣本集合的表達式為
x={xn|n=1,2,…,N}
(1)
式中:N代表輸入樣本的總數(shù)。
且xn的表達式為
(2)
SOFM聚類的輸出層又叫競爭層[8],競爭層其中含有神經(jīng)元,且神經(jīng)元數(shù)量相當于預(yù)測出的樣本分類數(shù)。因此在進行點群聚類前應(yīng)確認樣本分類的數(shù)量,根據(jù)此數(shù)量任意設(shè)置輸出層神經(jīng)元,并將此處當作原始聚類中心。在進行數(shù)據(jù)聚類時,將相同或相似范圍內(nèi)的數(shù)據(jù)點群特征值當成樣本進行運算,可減少訓(xùn)練時間的同時還可保證訓(xùn)練樣本分類精度,所以在輸入樣本數(shù)據(jù)前需要標準化處理原始數(shù)據(jù),處理公式為:
xi=(x′i-xmin)/(xmax-xmin)
(3)
式中,xi代表經(jīng)過標準化處理后的數(shù)據(jù)特征分量,x′代表數(shù)據(jù)未經(jīng)標準化處理的特征分量,xmax代表特征分量的最大值,xmin代表特征分量的最小值。
將信息中的某組點群通過不一樣的分類規(guī)則分成很多個子群,以此確定出子群中的聚集特性[9],點群聚類最廣泛使用的兩種準則分別是方差準則及距離準則,它們的定義分別是子群內(nèi)的方差保持最小和相同子群中的兩點之間的距離最小,不同子群中的兩點保持最大。
在進行聚類統(tǒng)計時,最重要的一步就是計算距離,且此距離必須含有點群位置和語義的特性[10],雖然點群聚類中的距離是指一種廣義距離,但此距離中具有判別屬性間的相近、相似和相關(guān)大小的特征,由于距離聚類分析無法詳細分析高維點群,所以輸入時加入點群的坐標和屬性特征再進行SOFM,根據(jù)此情況定義出的聚類統(tǒng)計量表達式為
(4)
式中,Dij代表點j及點i間的廣義距離,m代表點群的屬性特征個數(shù),(xj,yj)代表點j的平面坐標,(xi,yi)代表點i的平面坐標,zjk代表點j的第k個屬性值,zik代表點i的第k個屬性值,wa代表廣義距離中屬性距離的對應(yīng)權(quán)重,wp代表空間距離的對應(yīng)權(quán)重,wk代表屬性距離計算中每個屬性的對應(yīng)權(quán)重。
根據(jù)以上總結(jié)出的學(xué)習(xí)算法過程步驟為:
第一步,在區(qū)間[0,1]中任意選取并設(shè)置SOFM聚類算法中的原始連接權(quán)。
第二步,輸入點群樣本集中的任意一個數(shù)據(jù)樣本xn。
第三步,利用廣義距離衡量出最優(yōu)匹配結(jié)果,將最終結(jié)點記為c,且結(jié)點c的條件為
(5)
式中,Dnc(t)代表結(jié)點c和第t次聚類計算中第n個輸入向量的廣義距離,Dnj(t)代表結(jié)點j和第t次聚類計算中第n個輸入向量的廣義距離。
經(jīng)過多次實驗后,學(xué)習(xí)步長及鄰域都有所減少,此學(xué)習(xí)算法最終是在提取出最終結(jié)點和調(diào)整權(quán)重的基礎(chǔ)上,將全部輸入矢量投影至參考矢量,實現(xiàn)各個樣本都得到最好的分類結(jié)果,聚類訓(xùn)練結(jié)束后,每個輸出結(jié)點相應(yīng)的參考矢量就是所要求的聚類中心,且每一個聚類中心都對應(yīng)一個訓(xùn)練樣本點群。以此實現(xiàn)了涉密信息的點群聚類。
為進一步加強信息安全,在精確劃分涉密信息類別后,將所有涉密信息利用SM2橢圓曲線公鑰加密算法進行信息安全加密。
此算法經(jīng)大量試驗及分析,證明出此算法是目前最有保證且安全的算法,也是最適合網(wǎng)絡(luò)涉密信息加密的算法[11]。
3.1.1 確定網(wǎng)絡(luò)系統(tǒng)參數(shù)
在SM2橢圓曲線公鑰加密算法中,SM2的系統(tǒng)參數(shù)就是有限域內(nèi)的橢圓曲線,因此求解其參數(shù)就是求解橢圓曲線,橢圓曲線包括。
1)有限域Fq的規(guī)模q。
2)規(guī)定橢圓曲線E(Fq)方程的兩個成分b∈Fq和a∈Fq。
3)E(Fq)上的基點為
G=(xG,yG)
(6)
式中,G≠0,xG代表Fq上的一個成分,yG代表Fq上的一個成分。
4)G的階n和其它可選擇的項目。
3.1.2 密鑰派生函數(shù)
假設(shè)KDF(Z,Klen)是密鑰派生函數(shù),則Z就是所需要加密的信息數(shù)據(jù),Klen就是最終密鑰的長度。最終獲取到密鑰長度是Klen的密鑰信息數(shù)據(jù)
k=(Ha1+Ha2)×Klen
(7)
當Klen不是整數(shù)時,將Klen設(shè)置成1。
3.1.3 涉密信息的SM2加密算法
1)涉密信息的加密過程
第一步,將原始涉密信息數(shù)據(jù)(橢圓曲線系統(tǒng)參數(shù))和公鑰等數(shù)據(jù)輸入算法系統(tǒng)中隨機生成參數(shù)k,且k∈[1,n-1]。
第二步,求解出橢圓曲線c1點,其表達式為
c1=[k]G=(x1,y1)
(8)
第三步,并求解出橢圓曲線S點,其表達式為
S=[h]PB
(9)
第四步,判斷獲取到的橢圓曲線點S是否為0,若等于0,則需要退出系統(tǒng)并上報錯誤,若不等于0,則完成涉密信息的加密操作。
2)涉密信息的解密過程
第一步,當用戶在網(wǎng)絡(luò)系統(tǒng)中獲取到密文數(shù)據(jù),在密文數(shù)據(jù)只能夠提取出C1密文。
第二步,判斷C1是否符合橢圓曲線要求,若不符合則直接報錯并退出運算,若符合曲線要求則進行下一步。
第三步,求解出橢圓曲線點S=[h]C1。
第四步,判斷橢圓曲線點是否為0,若是,則直接報錯并退出,若不為0,則進行下一步運算。
第五步,計算出[dB]C1=(x2,y2)。
第七步,判斷私鑰t是否為0,若為0,則進行下一步操作,若不等于0,則直接報錯并退出運算。
第八步,計算明文M′=t⊕C2。
以上就是涉密信息的安全加密,最后將信息傳輸給用戶,即實現(xiàn)涉密信息安全傳輸。
3.2.1 傳輸路徑訓(xùn)練階段
最終進行安全傳輸前需將所有傳感器節(jié)點設(shè)置在M×M的區(qū)域內(nèi),此時的節(jié)點都有屬于自己的專屬位置和ID[12]。且網(wǎng)絡(luò)中傳感器的全部類別都和初始配置相同,已知各個節(jié)點的區(qū)域位置信息,因此發(fā)射節(jié)點都可根據(jù)距離選擇傳輸功率。
節(jié)點收到的數(shù)據(jù)是損失的能量表達式為
ERx(k)=kEelec
(10)
節(jié)點接收到數(shù)據(jù)后將數(shù)據(jù)進行一系列處理的能耗表達式為
Eda-fus=kEda
(11)
式中,Eda代表接收數(shù)據(jù)后的處理單位比特數(shù)據(jù)的能耗。
利用LEACH算法選取出成簇后,令路由表S代表最短邊權(quán)值的節(jié)點集合,針對所有簇都有任意一個節(jié)點M在TDMA時隙中,將采集到的信息傳輸并標記該簇的簇頭Ci,則此簇頭將涉密數(shù)據(jù)全部傳輸?shù)礁鱾€基站的最優(yōu)路徑為:
第一步,簇頭Ci按照路由表訓(xùn)練全部鄰近簇頭,可獲取到鄰近簇頭的邊權(quán)值。
第二步,將M和Ci間的邊權(quán)值與Ci對應(yīng)的簇頭的邊權(quán)值之間生成的邊權(quán)值和鄰近簇頭與M產(chǎn)生的邊權(quán)值進行比較。
第三步,若兩個邊權(quán)值相同,就可在路由表S中構(gòu)建出最多數(shù)量的帶有初始狀態(tài)子路由表,標記Ci對應(yīng)鄰近的簇頭。簇頭Ci的鄰近節(jié)點根據(jù)上述過程進行訓(xùn)練直到路由表S含有基站后停止訓(xùn)練。
3.2.2 涉密信息穩(wěn)定傳輸階段
在傳輸階段,排除掉死亡節(jié)點的子路由表,通過結(jié)合M和其它子路由以此保存路徑,進而評價涉密數(shù)據(jù)傳輸性能,并基于余下能量R得出子路由表a的路徑代價函數(shù),其函數(shù)表達式為:
Djf=EAvg-Re(a)+Re(a,b)+Hop(a)+α
(12)
式中,EAvg-Re(a)代表表a保存路徑中余下能量的平均能量,Re(a,b)代表表a保存路徑上所產(chǎn)生的b節(jié)點的余下能量,Hop(a)代表子路由表a所能保存的路徑的跳數(shù)值,α代表傳輸路徑中的權(quán)重因子。
將每個子路由表保存路徑的代價函數(shù)值大小進行對比,同時選擇出函數(shù)值為最小的路徑當成最優(yōu)路徑,源節(jié)點將采集到的涉密數(shù)據(jù)根據(jù)最優(yōu)路徑響應(yīng)的子路由表的引導(dǎo)輸送給基站,最終實現(xiàn)涉密數(shù)據(jù)的安全傳輸。
為了驗證所提方法的整體有效性,在WindowsXP操作系統(tǒng)下對基于點群聚類的網(wǎng)絡(luò)涉密信息安全傳輸方法、文獻[4]方法、文獻[5]方法進行傳輸成功率、傳輸速率和CPU使用率進行測試。
分析圖1可知,在多次迭代中所提方法的傳輸成功率始終保持百分百,而其它兩種方法中總有不明因素干擾傳輸,導(dǎo)致傳輸失敗,因此降低傳輸成功率,所提方法保證每次傳輸都成功是因為它在傳輸前將涉密數(shù)據(jù)通過點群聚類的方法進行細致的分類,因此可精確選取傳輸路徑,保證傳輸?shù)某晒β省?/p>
圖1 不同方法的傳輸成功率
對比三種方法在不同信息量環(huán)境下的傳輸速率,分析圖2可知,傳輸信息量越多會一定程度上導(dǎo)致數(shù)據(jù)傳輸速率下降,但所提方法的傳輸速率始終遠遠高于其它兩種方法,這是因為所提方法利用廣義距離的定義將數(shù)據(jù)轉(zhuǎn)化成屬性和點群聚類,以此更加清晰且簡便地分類涉密數(shù)據(jù),進而簡化傳輸,加快信息傳輸速率。
圖2 三種方法的傳輸速率
在傳輸過程中可能緩存一些無用數(shù)據(jù)導(dǎo)致CPU使用率過高,正常情況下的CPU使用率不能超過35%,但不小于15%,由圖3可知,所提方法的CPU使用率始終保持在20%左右,文獻[5]方法的使用率過高,且接近最高值,文獻[4]方法CPU使用率次之,這是因為所提方法在實現(xiàn)信息安全傳輸前,利用可將分類問題轉(zhuǎn)化為求解權(quán)重的點群聚類方法進行數(shù)據(jù)分類,使得所有數(shù)據(jù)都精確分類并準確傳輸,降低無用數(shù)據(jù)被丟棄的概率,保證CPU使用率的穩(wěn)定性。
圖3 不同方法的CPU使用率
針對當前算法的不足,提出基于點群聚類的網(wǎng)絡(luò)涉密信息安全傳輸方法。該方法利用基于SOFM的點群聚類方法將涉密信息詳細分類,同時利用SM2加密算法在傳輸前將數(shù)據(jù)加密,最終通過路由算法找出最優(yōu)路徑實現(xiàn)信息安全傳輸。經(jīng)實驗表明,所提算法傳輸成功率高、傳輸速率快和CPU使用率穩(wěn)定。為今后的信息安全傳輸?shù)於嘶A(chǔ)。