白冰
(陜西警官職業(yè)學(xué)院,陜西西安 710021)
互聯(lián)網(wǎng)技術(shù)的發(fā)展,其規(guī)模和應(yīng)用不斷擴大,與此同時,對計算網(wǎng)絡(luò)安全的危害也越來越多,如不同類型的病毒侵入,黑客的惡意攻擊等,極大程度危害了網(wǎng)絡(luò)安全[1-3]。傳統(tǒng)的網(wǎng)絡(luò)安全評估已經(jīng)難以對當(dāng)前具備復(fù)雜聯(lián)系的攻擊方式進行準(zhǔn)確評估,導(dǎo)致評價準(zhǔn)確度偏低[4-6]。因此,建立高效實用的網(wǎng)絡(luò)安全評價體系完成對網(wǎng)絡(luò)安全問題的分析預(yù)測是面臨的巨大挑戰(zhàn)。目前相關(guān)學(xué)者從多角度對復(fù)雜網(wǎng)絡(luò)安全的風(fēng)險評估進行了研究[7-10],如利用神經(jīng)網(wǎng)絡(luò)構(gòu)建非線性動力學(xué)與并行分布式的互聯(lián)網(wǎng)處理系統(tǒng),實現(xiàn)對互聯(lián)網(wǎng)安全因素的自學(xué)習(xí)過程,獲得不同影響因子下安全評價[11];通過利用遺傳算法的進化規(guī)律對互聯(lián)網(wǎng)安全信息進行處理,搜尋到網(wǎng)絡(luò)安全因子的最優(yōu)解,并有針對性的給出建議策略[12]。
本文在相關(guān)研究的基礎(chǔ)上,通過BP神經(jīng)網(wǎng)絡(luò)來建立互聯(lián)網(wǎng)安全因子的非線性系統(tǒng),并針對BP神經(jīng)網(wǎng)絡(luò)非線性映射能力缺乏反饋的問題,引入遺傳算法具備的全局搜索能力進行網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化,提高神網(wǎng)絡(luò)的泛化能力。
BP 神網(wǎng)絡(luò)是通過多個神經(jīng)元進行相互關(guān)聯(lián)建立的網(wǎng)絡(luò)模型,通過模擬生物神經(jīng)系統(tǒng)對現(xiàn)實事物的映射關(guān)系進行模擬,并使用豐富的事件數(shù)據(jù)進行訓(xùn)練,獲得類事件的模擬結(jié)果[13]。如圖1所示為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
采用BP 算法學(xué)習(xí)過程中,首先給出輸入信息,由網(wǎng)絡(luò)輸入層到隱含層對每一單元輸入值進行計算并給出輸出結(jié)果,當(dāng)輸出層未獲得期望輸出值時,則逐層遞歸得到實際輸出與期望輸出值間的差值,并根據(jù)差值對給定權(quán)值進行調(diào)整,直到最終獲得的輸出值和期望值在設(shè)定范圍之內(nèi),或達到預(yù)先設(shè)定的訓(xùn)練次數(shù),停止訓(xùn)練,否則重新開始下一輪訓(xùn)練程序。
BP 算法學(xué)習(xí)初期,首先從輸入信息中隨機選取第k個樣本輸入x(k)和對應(yīng)的期望輸出di(k),分別采用式(1)和式(2)表示:
計算實際輸出y0(k)與期望輸出d0(k)間的全局誤差為:
核實誤差值是否在計劃范圍內(nèi),作為輸出結(jié)果,否則繼續(xù)執(zhí)行迭代操作。當(dāng)達到設(shè)定的訓(xùn)練次數(shù)上限,算法停止,重新開始進行下一輪訓(xùn)練。
遺傳算法是基于自然選擇和遺傳學(xué)機制推演而獲得的一種計算機算法模型[14]。通過模擬自然進化過程對最優(yōu)解進行搜索的一種方法。遺傳算法由問題潛在解集中某一種群開始,每一個個體表征為一個基因,而多個基因組合構(gòu)成一個染色體。由于基因編碼工作較為復(fù)雜,因此采用二進制編碼形式來實現(xiàn)由表現(xiàn)型到基因型的映射編碼[15]。當(dāng)初代種群產(chǎn)生后,根據(jù)優(yōu)勝劣汰原理,逐代演化形成更好的近似解。在每一代中,根據(jù)個體適應(yīng)度來選擇個體,并通過遺傳算子的交叉組合和變異形成新解集的中區(qū)[16]。獲得的末代種群最優(yōu)個體作為問題的近似最優(yōu)解,如圖2為GA遺傳算法的流程圖。
圖2 GA遺傳算法基本流程
算法由候選集合構(gòu)成一組解,根據(jù)適應(yīng)性條件得到集合的適應(yīng)度值,由適應(yīng)度選取候選解,去掉部分不滿足適應(yīng)度函數(shù)的解集后,將保留的候選集執(zhí)行選擇、交叉、變異操作,得到新的候選解,即新的群體[17]。由于遺傳算法主要是根據(jù)某一特征方式進行的組合,算法自問題解進行搜索,覆蓋面大,因此有利于全局擇優(yōu),同時在進行染色體群搜索時,采用的是概率的變遷規(guī)則指導(dǎo)搜索方向,有效擴大到算法的應(yīng)用范圍,并能獲得更適應(yīng)環(huán)境的基因結(jié)構(gòu)。
通過利用遺傳算法特性對神經(jīng)網(wǎng)絡(luò)全局搜索能力加強,并利用算法對神經(jīng)網(wǎng)絡(luò)的連接權(quán)和網(wǎng)絡(luò)結(jié)構(gòu)進行改進。由于BP 神經(jīng)網(wǎng)絡(luò)的三層網(wǎng)絡(luò)體系,當(dāng)樣本確定后,網(wǎng)絡(luò)輸入層和輸出層節(jié)點數(shù)也是一定的[18],因此通過遺傳算法來實現(xiàn)對網(wǎng)絡(luò)節(jié)點的優(yōu)化,提升神經(jīng)網(wǎng)絡(luò)的泛化能力。將遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)用數(shù)學(xué)表示為:
式中:wij為節(jié)點i連接到節(jié)點j的連接權(quán)值;θj為節(jié)點j閾值;n和m分別為種群數(shù)和個體數(shù),p 為預(yù)選概率;(t)和yk(t)分別為實際輸出量和模型預(yù)估值,通過遺傳算法對非線性優(yōu)化問題求解,獲得網(wǎng)絡(luò)連接權(quán)和結(jié)構(gòu),當(dāng)計算獲得的E小于設(shè)定誤差ε值時,將模型運用于實際問題處理中。
基于此,本文對BP 神網(wǎng)絡(luò)改進,首先確定網(wǎng)絡(luò)模型訓(xùn)練次數(shù)和訓(xùn)練誤差ε1。將訓(xùn)練樣本作為模型輸入集合進行訓(xùn)練,同時輸入檢測樣本誤差ε2,當(dāng)訓(xùn)練樣本誤差和檢驗樣本誤差均達到預(yù)先設(shè)定值范圍內(nèi)后,將連接權(quán)中最大值umax和umin最小值以及調(diào)節(jié)參數(shù)δ 構(gòu)成連接權(quán)的基本解空間[umin-δ1,umax+δ2]。
由于遺傳算法是利用目標(biāo)函數(shù)的最大值作為適應(yīng)度函數(shù),因此,定義遺傳算法的適應(yīng)度函數(shù)為:
將適應(yīng)度函數(shù)帶入到(1)式中,獲得優(yōu)化后的模型數(shù)學(xué)表達式為:
通過編碼形成的碼串由控制碼和其權(quán)重關(guān)系組成??刂拼a主要控制網(wǎng)絡(luò)結(jié)構(gòu)中隱節(jié)點數(shù)量,形成一個0—1形式的地串,0 表示無連接,1 表示已連接,地串長度根據(jù)輸入節(jié)點數(shù)的倍數(shù)確定。串碼的權(quán)重系數(shù)碼控制連接權(quán),串長以節(jié)點的輸入個數(shù)和輸出個數(shù)確定,每個串均對應(yīng)一組連接權(quán)和網(wǎng)絡(luò)結(jié)構(gòu)。
初始種群由L個不同個體組成,每個個體由串長度為l1的0—1碼串和分布在[umin-δ1,umax+δ2]區(qū)間的l2個隨機數(shù)組成。以pc概率來進行個體的交叉變異。當(dāng)?shù)趇 個個體與i+1個個體交叉操作時,可得:
獲得輸入樣本的網(wǎng)絡(luò)權(quán)系數(shù)和隱節(jié)點,將φ3帶入到式(9)中檢測網(wǎng)絡(luò)的泛化能力。
本節(jié)通過設(shè)計一個網(wǎng)絡(luò)安全評價系統(tǒng),將改良后的GABP 神經(jīng)網(wǎng)絡(luò)模型嵌入系統(tǒng)的風(fēng)險評估模塊,實現(xiàn)對網(wǎng)絡(luò)的安全態(tài)勢評估和預(yù)測,如圖3所示。整個網(wǎng)絡(luò)評估系統(tǒng)包括人機界面、管控界面、風(fēng)險評估、安全態(tài)勢和預(yù)測、數(shù)據(jù)庫模塊。在進行網(wǎng)絡(luò)拓撲結(jié)構(gòu)安全評估前,首先在管理控制系統(tǒng)獲得評估任務(wù)文件,并根據(jù)任務(wù)信息對子系統(tǒng)進行數(shù)據(jù)的相關(guān)測試,然后根據(jù)數(shù)據(jù)庫中的相關(guān)評估標(biāo)準(zhǔn)對輸出結(jié)果進行預(yù)測和評估,獲得信息系統(tǒng)的安全風(fēng)險和,并對今后一段時間內(nèi)的網(wǎng)絡(luò)運行安全態(tài)勢進行預(yù)測,最后在可視化界面展示評估結(jié)果,并生成相應(yīng)評估報告,提高給用戶決策幫助。
圖3 網(wǎng)絡(luò)評估系統(tǒng)結(jié)構(gòu)框圖
在網(wǎng)絡(luò)安全評估中,主要有對網(wǎng)絡(luò)結(jié)構(gòu)要素、網(wǎng)絡(luò)態(tài)勢、網(wǎng)絡(luò)拓撲專題、網(wǎng)絡(luò)加固方案等方面的評估。本文選擇對網(wǎng)絡(luò)結(jié)構(gòu)要素和網(wǎng)絡(luò)整體安全性的評估預(yù)測方面。首先建立起待評估的網(wǎng)絡(luò)拓撲結(jié)構(gòu),如圖4所示。
圖4 某地方網(wǎng)絡(luò)結(jié)構(gòu)圖
網(wǎng)絡(luò)拓撲要素評估中主要對網(wǎng)絡(luò)結(jié)構(gòu)的保密性進行評估,如圖5為網(wǎng)絡(luò)結(jié)構(gòu)在某一個時間段內(nèi)的保密性態(tài)勢圖和預(yù)測段曲線。其中0-30d 時間段內(nèi)為趨勢曲線段,30-35d 時間段內(nèi)為系統(tǒng)對網(wǎng)絡(luò)保密性和安全性的預(yù)測段??梢钥闯?,該網(wǎng)絡(luò)拓撲結(jié)構(gòu)的安全態(tài)勢整體呈現(xiàn)出一個逐步下降的趨勢,表明整個系統(tǒng)的保密性得到了有效加強。同時,獲得同時段的網(wǎng)絡(luò)綜合安全態(tài)勢圖和預(yù)測曲線,該時段內(nèi)整個網(wǎng)絡(luò)拓撲結(jié)構(gòu)安全綜合性保持在一個較高的勢態(tài)值位置,網(wǎng)絡(luò)安全整體表現(xiàn)為一個逐步上升的趨勢??梢钥闯?,態(tài)勢的預(yù)測給網(wǎng)絡(luò)管理提供了一個參考價值,通過總結(jié)歷史態(tài)勢來評估數(shù)據(jù)管理,為網(wǎng)絡(luò)管理人員掌握網(wǎng)絡(luò)安全態(tài)勢提供了較大便利。
圖5 基于GABP的網(wǎng)絡(luò)結(jié)構(gòu)安全性預(yù)測
互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種網(wǎng)絡(luò)攻擊手段和網(wǎng)絡(luò)病毒嚴(yán)重威脅到網(wǎng)絡(luò)安全安全。本文以網(wǎng)絡(luò)風(fēng)險評估角度出發(fā),在傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,建立互聯(lián)網(wǎng)安全因子的非線性系統(tǒng),針對BP神經(jīng)網(wǎng)絡(luò)非線性映射能力而缺乏反饋的問題,引入遺傳算法具備的全局搜索能力進行網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化,擴大到算法的應(yīng)用范圍,有效提高神網(wǎng)絡(luò)的泛化能力。在基于GABP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,實現(xiàn)對網(wǎng)絡(luò)風(fēng)險和網(wǎng)絡(luò)安全態(tài)勢評估和預(yù)測,取得了較為滿意的效果。