于燁, 吳佳靜, 馬國(guó)武, 賈博
(寧夏信通網(wǎng)絡(luò)科技有限公司, 寧夏, 銀川 750000)
在加快推進(jìn)電網(wǎng)數(shù)字化轉(zhuǎn)型與數(shù)字經(jīng)濟(jì)發(fā)展的時(shí)代背景下,信息網(wǎng)絡(luò)安全備受關(guān)注。電力企業(yè)在經(jīng)營(yíng)和發(fā)展的過(guò)程中必須采取有效的措施來(lái)對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行預(yù)測(cè),增強(qiáng)信息基礎(chǔ)設(shè)施抵御網(wǎng)絡(luò)攻擊的能力。特別是在電網(wǎng)數(shù)字化轉(zhuǎn)型的大環(huán)境下,信息網(wǎng)絡(luò)數(shù)據(jù)包含了更多重要民生數(shù)據(jù),加強(qiáng)對(duì)電力企業(yè)信息網(wǎng)絡(luò)安全防護(hù)刻不容緩。關(guān)于信息網(wǎng)絡(luò)安全,不同的學(xué)者從不同的角度進(jìn)行了研究。周瓏等[1]構(gòu)建了包含網(wǎng)絡(luò)管理安全、網(wǎng)絡(luò)環(huán)境安全、網(wǎng)絡(luò)軟硬件安全、網(wǎng)絡(luò)數(shù)據(jù)安全等指標(biāo)的評(píng)價(jià)體系,同時(shí)采用基因算法(GA)優(yōu)化BP(back propagation)神經(jīng)網(wǎng)絡(luò)參數(shù),獲得了用于網(wǎng)絡(luò)安全評(píng)價(jià)的模型。陳霖等[2]對(duì)機(jī)器學(xué)習(xí)中的聚類(lèi)分析算法進(jìn)行了改進(jìn),提出了基于動(dòng)態(tài)增量聚類(lèi)分析的網(wǎng)絡(luò)攻擊模式識(shí)別算法,該算法能夠有效地實(shí)現(xiàn)對(duì)數(shù)據(jù)的清除、聚類(lèi)類(lèi)別的控制,使得算法對(duì)數(shù)字電網(wǎng)網(wǎng)絡(luò)攻擊模式的識(shí)別率大大提升。冷飛等[3]提出了RSA(rivest shamir adleman)融合AES(advanced encryption standard)算法的網(wǎng)絡(luò)信息安全方法,通過(guò)采用RSA算法來(lái)配置網(wǎng)絡(luò)信息系統(tǒng)的密鑰,大大降低了密鑰管理的復(fù)雜度,所提出的算法具有執(zhí)行速度快、密鑰配置性能高的優(yōu)勢(shì)。王應(yīng)站[4]從統(tǒng)計(jì)學(xué)的角度出發(fā),構(gòu)建了船舶信息傳輸網(wǎng)絡(luò)用戶(hù)訪問(wèn)安全性模型,并通過(guò)實(shí)例驗(yàn)證了該模型能夠有效地提高船舶網(wǎng)絡(luò)訪問(wèn)控制的安全性。本文在前人研究的基礎(chǔ)上,采用鯨魚(yú)優(yōu)化算法(WOA)對(duì)支持向量機(jī)(SVM)算法進(jìn)行了改進(jìn),從而以更高的精度實(shí)現(xiàn)對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)的預(yù)測(cè)。
SVM是建立在統(tǒng)計(jì)學(xué)理論基礎(chǔ)上的一種二分類(lèi)算法模型,其目標(biāo)是在特定空間確定間隔最大的超平面,具體如圖1所示。
圖1 SVM算法模型示意圖
設(shè)特征空間上的樣本集為T(mén),即:
T={(x1,y1),(x2,y2),…,(xN,yN)}
(1)
式中,xi為第i個(gè)特征向量,yi∈{1,-1}。
設(shè)分離超平面方程為
wx+b=0
(2)
式中,w為分離超平面法向量,b為分離超平面截距。
對(duì)于線性可分的樣本集,可以對(duì)樣本進(jìn)行正確分割的超平面有許多個(gè),但是滿(mǎn)足超平面間隔取最大值的最優(yōu)超平面卻是唯一的。求解最優(yōu)超平面的問(wèn)題可以轉(zhuǎn)化為
(3)
式中,C為懲罰參數(shù),εi為松弛變量。
在求解的過(guò)程中引入拉格朗日乘子α便可以轉(zhuǎn)化為對(duì)偶問(wèn)題,即:
(4)
那么,決策函數(shù)f(x)為
f(x)=sgn(∑αiyiK(xi,x)+b)
(5)
式中,K(xi,x)為核函數(shù)。
不同的核函數(shù)會(huì)得到不同的支持向量機(jī)算法,核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)、拉普拉斯核函數(shù)、Sigmoid核函數(shù),其中拉普拉斯核函數(shù)在實(shí)際中應(yīng)用最為廣泛,拉普拉斯核函數(shù)[5]表達(dá)式為
(6)
懲罰系數(shù)C和核函數(shù)參數(shù)σ對(duì)支持向量機(jī)的分類(lèi)性能影響比較大,選擇鯨魚(yú)優(yōu)化算法對(duì)參數(shù)組合(C,σ)優(yōu)化,提升支持向量機(jī)算法對(duì)樣本的分類(lèi)準(zhǔn)確率。
WOA是受到自然界中座頭鯨的狩獵行為而提出的智能優(yōu)化算法,座頭鯨的狩獵方式比較特殊,覓食行為采用的是Bubble-net策略[6],具體如圖2所示。
圖2 座頭鯨狩獵行為示意圖
WOA主要包括包圍獵物、狩獵行為以及搜索獵物,座頭鯨包圍獵物的數(shù)學(xué)公式為
X(t+1)=X*(t)-A|CX*(t)-X(t)|
(7)
式中,X(·)為鯨魚(yú)位置,t為當(dāng)前迭代次數(shù),X*(t)為經(jīng)過(guò)t次迭代鯨魚(yú)的最優(yōu)位置,A和C為系數(shù),計(jì)算公式為
(8)
C=2r2
(9)
式中,r1和r2為區(qū)間(0,1)上的隨機(jī)數(shù),Tmax為最大迭代次數(shù)。
座頭鯨是采用螺旋運(yùn)動(dòng)的方式游向獵物,狩獵行為的數(shù)學(xué)公式為
X(t+1)=X*(t)+Dpeblcos(2πl(wèi))
(10)
式中,Dp為鯨魚(yú)和獵物的距離,b為螺旋線形狀參數(shù),l為區(qū)間(-1,1)上的隨機(jī)數(shù)。
鯨魚(yú)以螺旋路線向獵物游動(dòng)的過(guò)程中必須不斷地縮小包圍圈。設(shè)座頭鯨以Pi概率選擇包圍獵物,以1-Pi概率選擇更新位置,其數(shù)學(xué)表達(dá)式為
(11)
座頭鯨搜索獵物,其數(shù)學(xué)公式為
X(t+1)=Xrand-A|CXrand-X(t)|
(12)
式中,Xrand是隨機(jī)確定的鯨魚(yú)位置。
為了使得WOA算法具有更強(qiáng)的全局搜索能力,設(shè)置A≥1,根據(jù)隨機(jī)確定的鯨魚(yú)位置來(lái)對(duì)其它鯨魚(yú)的位置進(jìn)行更新,使得鯨魚(yú)偏離獵物,從而選擇更加合適的獵物。WOA算法流程[7]如圖3所示。
圖3 WOA算法流程圖
信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)系統(tǒng)主要包括3部分內(nèi)容:第一部分是構(gòu)建數(shù)據(jù)庫(kù),對(duì)歷史數(shù)據(jù)進(jìn)行處理獲得信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)的樣本數(shù)據(jù)集;第二部分是采用WOA算法對(duì)SVM算法的(C,σ)參數(shù)組合進(jìn)行優(yōu)化,獲得用于信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)的WOA-SVM模型;第三部分是對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)值進(jìn)行展示,同時(shí)發(fā)布預(yù)警。信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)流程如圖4所示。
圖4 信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)流程圖
本文所用數(shù)據(jù)為HoneyNet組織收集的黑客攻擊數(shù)據(jù),通過(guò)對(duì)黑客行為模式特征的預(yù)測(cè)來(lái)更好地發(fā)現(xiàn)網(wǎng)絡(luò)安全的態(tài)勢(shì)[8]。信息網(wǎng)絡(luò)安全態(tài)勢(shì)可以看作簡(jiǎn)單的時(shí)間序列,時(shí)間監(jiān)測(cè)點(diǎn)所對(duì)應(yīng)的信息網(wǎng)絡(luò)安全態(tài)勢(shì)值為序列a1,a2,…,am。由a1,a2,…,am得到信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)值am+1;由a2,a3,…,am+1得到信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)值am+2。以此類(lèi)推得到信息網(wǎng)絡(luò)安全態(tài)勢(shì)樣本數(shù)據(jù)集,具體如圖5所示。
圖5 信息網(wǎng)絡(luò)安全態(tài)勢(shì)樣本數(shù)據(jù)集
信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型將預(yù)測(cè)未來(lái)某個(gè)時(shí)間點(diǎn)的網(wǎng)絡(luò)安全態(tài)勢(shì)值,其在預(yù)測(cè)時(shí)間t時(shí)的態(tài)勢(shì)值由t-m之前的實(shí)際網(wǎng)絡(luò)安全態(tài)勢(shì)值得到,這樣可以避免預(yù)測(cè)誤差所造成的累積效應(yīng)。將信息網(wǎng)絡(luò)安全態(tài)勢(shì)樣本數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,通過(guò)測(cè)試集來(lái)構(gòu)建WOA-SVM的信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型,并檢驗(yàn)信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型的精度。
為了更好地驗(yàn)證算法的性能,采用預(yù)測(cè)相對(duì)誤差Re和總體平均誤差A(yù)e來(lái)衡量[9],其數(shù)學(xué)表達(dá)式為
(13)
(14)
WOA算法的參數(shù)對(duì)算法的性能影響比較大,通過(guò)大量的仿真試驗(yàn)確定WOA的參數(shù),具體參數(shù)設(shè)置[10]如表1所示。
表1 WOA算法參數(shù)設(shè)置
采用WOA算法對(duì)SVM算法參數(shù)組合(C,σ)進(jìn)行優(yōu)化,迭代次數(shù)和適應(yīng)度函數(shù)值之間的關(guān)系如圖6所示。
圖6 迭代次數(shù)和適應(yīng)度函數(shù)值關(guān)系曲線圖
為了對(duì)比SVM算法和WOA-SVM算法對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)的性能,計(jì)算預(yù)測(cè)相關(guān)誤差和總體平均誤差,結(jié)果如表2所示。
表2 算法預(yù)測(cè)性能對(duì)比結(jié)果
由表2可知,WOA-SVM算法對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)值的預(yù)測(cè)精度明顯高于SVM算法的預(yù)測(cè)精度。SVM算法對(duì)參數(shù)組合未進(jìn)行優(yōu)化,所采用的參數(shù)為系統(tǒng)默認(rèn)參數(shù),這使得對(duì)SVM模型的訓(xùn)練存在比較大的盲目性。采用WOA算法對(duì)SVM預(yù)測(cè)模型進(jìn)行優(yōu)化,這使得測(cè)試樣本的動(dòng)態(tài)輸入過(guò)程中SVM的訓(xùn)練參數(shù)在不斷地調(diào)整,大大提升了算法對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)值預(yù)測(cè)的性能。圖7給出了采用WOA-SVM模型預(yù)測(cè)結(jié)果和實(shí)際結(jié)果的對(duì)比。
圖7 預(yù)測(cè)結(jié)果與實(shí)際結(jié)果對(duì)比圖
由圖7可知,采用WOA-SVM算法對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)值的預(yù)測(cè)結(jié)果和實(shí)際只在少部分的點(diǎn)處差別比較大,大部分的點(diǎn)處相差很少,即預(yù)測(cè)具有比較高的精度。
信息網(wǎng)絡(luò)安全對(duì)電力企業(yè)的經(jīng)營(yíng)具有至關(guān)重要的作用,對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)能夠更好地了解信息網(wǎng)絡(luò)安全態(tài)勢(shì)變化規(guī)律,增強(qiáng)電力企業(yè)抵御網(wǎng)絡(luò)攻擊的能力。本文采用鯨魚(yú)優(yōu)化算法對(duì)支持向量機(jī)的懲罰系數(shù)和核函數(shù)參數(shù)進(jìn)行優(yōu)化,得到了改進(jìn)的支持向量機(jī)算法,并將其應(yīng)用于HoneyNet組織收集的黑客攻擊數(shù)據(jù)。預(yù)測(cè)結(jié)果表明,和傳統(tǒng)的SVM算法相比,改進(jìn)的SVM算法對(duì)信息網(wǎng)絡(luò)安全態(tài)勢(shì)值的預(yù)測(cè)精度更高。本論文的研究對(duì)提升電力企業(yè)信息網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)準(zhǔn)確性,有效增強(qiáng)企業(yè)抵御網(wǎng)絡(luò)攻擊具有一定的現(xiàn)實(shí)意義,為電力企業(yè)實(shí)現(xiàn)數(shù)字化發(fā)展具有重要保障作用。