摘" 要: 針對當前網絡安全態(tài)勢評估模型收斂速度慢、準確度不高的問題,提出一種多策略融合改進的蜣螂優(yōu)化(MIDBO)支持向量回歸機(SVR)的網絡安全態(tài)勢評估方法。利用混沌精英反向學習策略初始化蜣螂種群,提升種群多樣性和質量;采用自適應權重的黃金正弦策略對滾球蜣螂位置進行更新,以平衡局部挖掘能力和全局搜索能力;引入Lévy飛行策略改進偷竊蜣螂位置更新公式,提高算法跳出局部最優(yōu)能力;借鑒鯨魚優(yōu)化位置更新方法改進繁殖、覓食行為,提高算法的收斂速度和尋優(yōu)精度。通過MIDBO優(yōu)化SVR,獲得最佳核函數參數和懲罰因子,構建MIDBO?SVR網絡安全態(tài)勢評估模型。實驗結果表明,MIDBO?SVR評估模型與APSO?SVR、DBO?SVR和SVR評估模型相比,具有更高的分類準確率和運行效率,綜合性能最優(yōu)。
關鍵詞: 網絡安全; 態(tài)勢評估; 多策略; DBO; 支持向量回歸機; 自適應權重
中圖分類號: TN711?34" " " " " " " " " " " " " " " 文獻標識碼: A" " " " " " " " " " "文章編號: 1004?373X(2025)05?0101?06
Network security situation assessment method based on MIDBO?SVR
CHEN Qiuqiong, XU Huazhi, XIONG Weinan, LIU Weili
(Department of Information System, PLA Dalian Naval Academy, Dalian 116018, China)
Abstract: The current network security situation assessment models have slow convergence speed and low accuracy, so a multi?strategy improved dung beetle optimization (MIDBO) algorithm is used to optimize the support vector regression (SVR) machine, and on the basis of the optimized SVR machine, a network security situation assessment model is established. The chaotic elite opposition?based learning (EOBL) strategy is used to initialize the dung beetle population, so as to enhance the diversity and quality of the population. A golden sine strategy with adaptive weight is adopted to update the position of the rolling dung beetle, so as to balance the local excavation ability and global search capability. The Lévy flight strategy is introduced to improve the position update formula of the thieving dung beetle, so as to enhance the algorithm′s ability to escape from local optima. The position update method of whale optimization is referenced to improve the reproduction and foraging behavior, so as to increase the convergence speed and improve optimization accuracy of the algorithm. The MIDBO is used to optimize SVR machine, so as to obtain the optimal kernel function parameters and penalty factors. On the basis of the above, a network security situation assessment model based on MIDBO?SVR is constructed. Experimental results show that the assessment model based on MIDBO?SVR has higher classification accuracy and operational efficiency in comparison with the assessment models based on APSO?SVR, DBO?SVR and SVR. To sum up, the proposed model has the optimal comprehensive performance.
Keywords: network security; situation assessment; multi?strategy; DBO; SVR machine; adaptive weight
0" 引" 言
隨著互聯(lián)網技術的飛速發(fā)展,網絡安全問題已經成為全球范圍內亟待解決的重要議題。面對日益嚴峻的網絡安全挑戰(zhàn),研究和發(fā)展可靠的網絡安全防御策略至關重要。目前,已有學者對網絡安全防御做出相關研究。文獻[1]提出用模擬退火算法優(yōu)化麻雀搜索算法來改進BP神經網絡相關參數,用于構建網絡安全態(tài)勢評估模型,結果表明該模型準確性和收斂速度都有一定的提高。文獻[2]將卷積神經網絡與長短期記憶循環(huán)神經網絡結合用于電力網絡的態(tài)勢感知。文獻[3]利用混沌粒子群優(yōu)化后的BP神經網絡設計網絡安全風險評估系統(tǒng),能夠較好發(fā)揮網絡安全評估的效果,評估的準確率有一定的提高。但是由于人工神經網絡算法自身存在不足,在實際應用中會出現(xiàn)維數災難、過擬合等問題4]。支持向量回歸機(Support Vactor Regression, SVR)是一種基于統(tǒng)計思想的學習方法,模型簡單,能夠評定經驗風險和結構風險,可有效解決小樣本、維數災難等問題,已被成功應用到網絡安全態(tài)勢評估模型[5]。但由于網絡安全態(tài)勢受眾多評估指標因素的影響,多輸入的支持向量機使得態(tài)勢評估模型結構復雜,模型效率低,且各指標之間可能存在冗余。因此,選擇合理的核函數參數和懲罰因子是提高基于SVR的網絡安全態(tài)勢評估模型效率的關鍵。
本文提出MIDBO算法優(yōu)化SVR,通過結合不同的優(yōu)化策略,有效調整SVR的核函數參數以及懲罰因子,設計一種依托MIDBO?SVR網絡安全態(tài)勢評估模型,并通過對比實驗驗證了這一方法的精確度和有效性。
1" 基本理論
1.1" 支持向量回歸機
支持向量回歸機(SVR)是一種常用的模式分類方法,它可以借助核函數將低維線性不可分問題映射到高維特征空間,實現(xiàn)樣本值的分類[6]。SVR表達式如下:
[f(x)=i=1n(αi-α*i)K(xi, xj)+b] (1)
式中:[b]為超平面的截距;[αi]和[α*i]為拉格朗日乘子;[K(xi, xj)]表示核函數。對于態(tài)勢評估領域,通常選用如下函數作為核函數,其表達式為:
[K(xi, xj)=exp-σxi-xj2] (2)
核函數參數[σ]在SVR中起著至關重要的作用,其取值直接影響SVR的預測速度。同時,懲罰因子[C]的設定也對SVR的泛化能力具有決定性的影響。在模型構建和優(yōu)化過程中,需要綜合考慮這兩個參數的作用,以平衡模型的預測速度和泛化能力。
1.2" 蜣螂優(yōu)化算法
蜣螂優(yōu)化(Dung Beetle Optimization, DBO)算法是一種新型群智能優(yōu)化算法[7],受到蜣螂滾球、跳舞、繁殖、覓食和偷竊五類生活習性的啟發(fā),對優(yōu)化問題進行全局搜索和局部利用。
滾球蜣螂的位置會受光源強度的影響發(fā)生變化,位置更新規(guī)則如下:
[xt+1i=xti+a?k?xt-1i+b?xti-xtworst] (3)
式中:[xti]表示第[i]只蜣螂在第[t]次迭代時的位置;[k]為偏轉系數;[a]取-1或1;[b]∈(0,1)。
蜣螂前進過程中遇到障礙物時,會通過跳舞重新確定新的路線,位置更新規(guī)則如下:
[xt+1i=xti+tanθ?xti-xt-1i] (4)
蜣螂繁殖時會將糞球滾到安全區(qū)域并將其隱藏,嚴格遵循邊界選擇策略,其定義如下:
[Ub*=minx*?(1+R),UbLb*=maxx*?(1-R),Lb] (5)
式中:[Ub]和[Lb]分別表示待優(yōu)化問題的上界和下界;[R=1-t Tmax],[Tmax]表示最大迭代次數。
蜣螂產卵時,卵球的位置為[Bti],當前局部最優(yōu)位置為[x*],同時引入兩個大小為[1×D]的獨立隨機向量[b1]和[b2],其中[D]代表待優(yōu)化問題的維度,則蜣螂繁殖位置更新規(guī)則可以表達為:
[Bt+1i=x*+b1×(Bti-Lb*)+b2×(Bti-Ub*)] (6)
覓食蜣螂的最佳區(qū)域更新規(guī)則如下:
[Ubb=minxbbest×(1+R), UbLbb=maxxbbest×(1-R), Lb] (7)
式中:[Ubb]和[Lbb]分別表示最佳覓食區(qū)域的上界和下界;[xbbest]為當前局部最優(yōu)位置。
蜣螂覓食位置更新規(guī)則如下:
[xt+1i=xti+c1×(xti-Lbb)+c2×(xti-Ubb)] (8)
式中:[c1~N(0,1)];[c2]是(0,1)范圍內[1×D]的隨機向量。
蜣螂偷竊時位置更新規(guī)則如下:
[xt+1i=Xb+S?g?xti-x*+xti-Xb] (9)
式中:[xti]表示在迭代過程中第[i]個蜣螂在第[t]次迭代時所處的位置;[Xb]為當前最優(yōu)位置;[g]為隨機向量。
2" 改進蜣螂優(yōu)化算法
DBO算法具有收斂速度快、尋優(yōu)能力強和易于實施的特性。然而,其局部開發(fā)和全局探索能力不均衡,導致其搜索時容易過早地陷入局部最優(yōu)解,限制了其全局搜索能力。此外,算法利用隨機分布策略進行種群初始化,會降低種群多樣性且分布不均,使得種群在搜索空間的覆蓋不夠廣泛,大大降低了算法的尋優(yōu)效果。因此,本文引入以下四種策略對DBO算法進行改進。
2.1" 混沌精英反向學習策略
首先,采用混沌映射初始化種群,使個體位置分布更均勻。本文參考文獻[8],將Sine映射和PWLCM映射結合,得到SPM映射,如式(10)所示:
[xi=modxi-1 η+μsin(πxi-1)+rand,1," " "0≤xi-1≤ηmodxi-1 η0.5-η+μsin(πxi-1)+rand,1," " " " " " " " " " " " " " " " " " η≤xi-1lt;0.5F(1-xi-1,η, μ)," " "0.5≤xi-1lt;η]"(10)
式中:rand是擾動參數;當[η∈(0,1)],[μ∈(0,1)]時,系統(tǒng)處于混沌狀態(tài),設置[η]=0.52,[μ]=0.45,以達到最好的取值效果。
映射迭代10 000次生成的序列分布如圖1所示??梢钥闯觯傻幕煦缧蛄蟹植挤浅>鶆?,能夠產生更多的隨機值,混沌映射范圍更廣,具有更優(yōu)的遍歷性和收斂速度,更有利于增加目標區(qū)域種群的多樣性。
然后,利用精英反向策略對混沌映射生成的種群產生反向種群,進一步提高蜣螂種群質量和豐富性。分別計算原始種群和反向種群的適應度值,選取最優(yōu)的適應度值種群作為初始種群再進行迭代運算。產生精英反向種群的表達式為:
[x′ij(t)=k×ubij(t)+lbij(t)-xij(t)] (11)
式中:[x′ij(t)]為個體精英[xij(t)]的反向解;[k]為(0,1)上的隨機數;[ubij(t)]和[lbij(t)]分別為搜索空間的上、下界。如果[x′ij(t)]為非可行解,可以利用如下方法重置。
[x′ij(t)=randubij(t),lbij(t)] (12)
2.2" 自適應權重的黃金正弦策略
原始DBO算法中蜣螂滾球行為對算法的收斂速度和全局搜索能力有很大影響,滾球方式直接限制了其局部搜索能力,易錯失尋優(yōu)機會。采用Golden?SA[9]進行位置更新,有利于算法在充分搜索全局中逼近最優(yōu)解,且能夠提升算法求解速度和種群局部搜索能力。Golden?SA表達式如下所示:
[xt+1i=xti×sinr1-r2×sinr1×c1×Xb-c2×xtic1=-π+1-5-12×2π," c2=-π+5-12×2π] (13)
式中:隨機數[r1∈[0,2π]]、[r2∈[0,π]]分別表示蜣螂個體的移動距離和位置更新方向;[g1]為黃金分割數。為防止后期迭代中由于快速收斂易陷入局部最優(yōu)的情況,引入非線性權重因子[ω],公式如下所示:
[ω=cosπt Tmax+ωmaxωmax+ωmin2+e] (14)
式中:[t]和[Tmax]分別為當前迭代次數和最大迭代次數;[ωmax]和[ωmin]分別表示[ω]的最大值和最小值。[ω]的引入允許算法在搜索過程中動態(tài)調整其搜索策略,在早期維持廣泛的搜索范圍,以便發(fā)現(xiàn)潛在的全局最優(yōu)解;后期隨著[ω]的逐漸減小,算法能夠逐漸聚焦于局部區(qū)域,加快收斂速度。加入[ω]后的滾球蜣螂位置更新公式如下:
[xi(t+1)=ω×xi(t)×sin(r1)-ω×r2×sin(r1)×c1×Xb-c2×xi(t)] (15)
經過多次實驗結果可知,當[ωmin=0.2],[ωmax=0.9],[e=0.45]時,算法尋優(yōu)性能最佳。
2.3" Lévy飛行策略
Lévy飛行策略是一種獨特的隨機游動模型[10],搜索過程中巧妙地結合了短距離和長距離的交錯移動,以短距離搜索為主,輔以長距離搜索,通過這種策略性的交錯移動,有效擴大了搜索范圍,增強了全局搜索能力,更有利于算法跳出局部最優(yōu)解。Lévy飛行策略更新公式如下:
[Lévy~xti?Ψθ1θ20.5] (16)
式中:[θ1]、[θ2]符合標準正態(tài)分布,且有:
[Ψ=γ?(1+β)?sin(πβ2)γβ?2β-1] (17)
將Lévy飛行策略引入偷竊蜣螂位置更新公式進行改進,結果如下:
[xt+1i=Lévy(x*)+C×xti-xb+xti-ωx* 2] (18)
式中:[ω=μ-μ-1μ+μ-1],[μ=exp21-t Tmax]。
2.4" 改進螺旋搜索策略
在算法的初始階段,通過設計較大的螺旋軌跡來廣泛搜尋眾多潛在的優(yōu)質解,以增強全局搜索的覆蓋能力;算法后期,利用更精細的螺旋形狀聚焦目標區(qū)域,從而縮減冗余搜索,加速算法的收斂進程,并提升求解的精確度和優(yōu)化效果。迭代過程中,對蜣螂覓食和繁殖行為調整搜索時的螺旋形狀,具體表達式如下:
[k=erm 2cos(πr)] (19)
[m=e4cosπ(1-t)tmax+1] (20)
式中,隨機數[r∈[0,1]],余弦函數控制螺旋線的變化。因此,對式(4)、式(6)進行修改,得到式(21)、式(22)。
[xt+1i=xti+k1×(xti-Lbb)+k2×(xti-Ubb)] (21)
[Bt+1i=x*+k3×(Bti-Lb*)+k4×(Bti-Ub*)] (22)
3" 基于MIDBO?SVR的網絡安全態(tài)勢評估方法
3.1" 網絡安全態(tài)勢指標體系構建
本文在文獻[11]的理論基礎上,根據專家評論和系統(tǒng),分別從威脅性、脆弱性、容災性和穩(wěn)定性四個方面構建具備三個層次網絡安全態(tài)勢評估的指標體系,如圖2所示。該評估指標體系涵蓋了四個主要類別指標以及20個子項指標,這些指標共同構成了對網絡安全態(tài)勢的全面描述,具體涵蓋了威脅程度、系統(tǒng)的脆弱性、應對災難的恢復能力以及系統(tǒng)的穩(wěn)定性這四個核心維度。
3.2" MIDBO?SVR的網絡安全態(tài)勢評估方法
為優(yōu)化網絡安全態(tài)勢評估過程,引入MIDBO算法以改進SVR的性能,并將其應用于評估過程。圖3為該評估模型的示意圖。
MIDBO?SVR網絡態(tài)勢評估具體過程如下。
步驟1:構建網絡安全態(tài)勢評估指標體系,隨后按照給定的公式(23)對收集到的態(tài)勢數據進行標準化處理,以確保數據的一致性。
[x=x-min(x)max(x)-min(x)] (23)
式中:[x]和[x]分別表示原始樣本數據和歸一化后的數據。
步驟2:對網絡安全態(tài)勢指標的權重和閾值進行初始化設置,為后續(xù)的分析和評估奠定基礎。
步驟3:初始化蜣螂種群數量[N],設置滾球、跳舞、繁殖、覓食和偷竊蜣螂比例、最大迭代次數[Tmax]、繁殖及覓食邊界、搜索維度等參數。
步驟4:利用式(10)、式(11)初始化蜣螂個體位置。
步驟5:計算適應度值,分別找到原始最差位置蜣螂個體和最佳位置蜣螂個體。
步驟6:分別運用式(14)、式(17)~式(20)確定滾球蜣螂、覓食蜣螂、偷竊蜣螂、繁殖蜣螂位置。
步驟7:重新計算適應度值,并更新蜣螂個體位置。若新的適應度值更優(yōu),則更新蜣螂位置;反之,不更新。
步驟8:通過前述步驟確定了最優(yōu)的核函數參數和懲罰因子,用以優(yōu)化SVR模型。再利用這一優(yōu)化后的模型對已經歸一化的數據樣本進行訓練。完成訓練后,對數據進行反歸一化處理,最終輸出仿真結果。
3.3" 實驗仿真與結果分析
為便于分析,將態(tài)勢評估結果劃分為優(yōu)、良、中、差、危五個等級,分別對應具體的量化值,結果如表1所示。
3.3.1" 數據采集與預處理
在驗證SVR網絡安全態(tài)勢評估模型的效力時,本實驗將網絡安全系統(tǒng)所面臨的威脅性指標作為評估焦點。
如圖1所示,威脅性指標可細分為五個三級指標。實驗以文獻[12]中提供的數據集作為基準,用以驗證算法在評估效果上的準確性和有效性。實驗數據分為訓練集樣本和測試集樣本兩部分,其中,訓練樣本數據372條,測試樣本數據10條。
為了更直觀地體現(xiàn)網絡威脅程度,每個指標權重采用表2給出的方法進行設定[13]。某周網絡安全態(tài)勢值計算方法如式(24)所示:
[Vnst=ωi?i=1tSTiSTimax] (24)
式中:[STi]表示某周第[i]類安全威脅的數量;[STimax]表示選取的實驗數據中該類威脅的最大值;[ωi]表示對應該類威脅的權值。
網絡安全態(tài)勢值如圖4所示。
3.3.2" 實驗結果分析
圖5是采用APSO、DBO和MIDBO三種算法改進SVR模型進行態(tài)勢評估得到的10個評估值與真實值對比情況。
由圖5可知,四種態(tài)勢評估模型的評估曲線走勢大致相同。但是,經過比較發(fā)現(xiàn),MIDBO?SVR網絡安全態(tài)勢評估模型得出的態(tài)勢值與真實的態(tài)勢值更為接近,相較于APSO?SVR和DBO?SVR評估模型以及未做任何改進的SVR評估模型,MIDBO?SVR模型具有更強的擬合能力。這一結果進一步驗證了MIDBO?SVR模型在網絡安全態(tài)勢評估中的優(yōu)越性能,從而更客觀地反映當前網絡的安全態(tài)勢狀況。
選用均方誤差(MSE)和平均絕對百分比誤差(MAPE)這2個衡量指標,分別對SVR、APSO?SVR、DBO?SVR、MIDBO?SVR網絡安全態(tài)勢評估值與已知的國家互聯(lián)網應急中心態(tài)勢評估值之間的輸出誤差、相對誤差進行對比,結果如圖6、圖7和表3所示。
經過對比圖6、圖7發(fā)現(xiàn),MIDBO?SVR態(tài)勢評估模型展現(xiàn)出了顯著的特點,其絕對誤差值和相對誤差值的曲線波動最為輕微且表現(xiàn)穩(wěn)定,其波動范圍持續(xù)保持在與零誤差值標線最接近的區(qū)間內。這一發(fā)現(xiàn)凸顯了MIDBO?SVR態(tài)勢評估模型相較于其他三種評估模型,在準確性方面具備更高的優(yōu)越性。基于這一分析,本文提出的MIDBO?SVR態(tài)勢評估模型相較于其他三種評估模型,展現(xiàn)出了更高的精確度。此外,由表3可以明顯看出,用MIDBO?SVR評估模型進行網絡安全態(tài)勢評估所得到的結果與國家互聯(lián)網應急中心的評估結果之間的MAPE和MSE明顯比另外三種評估模型更小,進一步驗證了MIDBO?SVR態(tài)勢評估模型具有更高的評估準確性。
4" 結" 論
為增強蜣螂算法的優(yōu)化效能,本文運用了經不同策略改進的DBO算法(MIDBO),對SVR進行優(yōu)化并應用于網絡安全效能評估實例,構建基于MIDBO?SVR的網絡安全態(tài)勢評估模型。通過不同模型實驗仿真和對比分析表明,MIDBO?SVR評估模型收斂速度較快,擬合能力較強,且具有較強的自適應能力和學習能力,可為今后設計網絡空間安全態(tài)勢評估系統(tǒng)提供參考。
注:本文通訊作者為陳秋瓊。
參考文獻
[1] WANG Q, BU S Q, HE Z Y, et al. Toward the prediction level of situation awareness for electric power systems using CNN?LSTM network [J]. IEEE transactions on industrial informatics, 2021, 17(10): 6951?6961.
[2] 段秀娟.基于混沌粒子群優(yōu)化BP神經網絡的網絡安全風險評估系統(tǒng)設計[J].科學技術與工程,2019,19(16):251?255.
[3] 趙國生,王慧強,王健.基于灰色Verhulst的網絡安全態(tài)勢感知模型[J].哈爾濱工業(yè)大學學報,2008,40(5):798?801.
[4] 王晉東,沈柳青,王坤,等.網絡安全態(tài)勢預測及其在智能防護中的應用[J].計算機應用,2010,30(6):1480?1482.
[5] 呂鎮(zhèn)邦,周波.基于WOWA?FAHP的網絡安全態(tài)勢評估[J].計算機科學,2009,36(7):63?67.
[6] 黨德鵬,孟真.基于支持向量機的信息安全風險評估[J].華中科技大學學報(自然科學版),2010,38(3):46?49.
[7] XUE J K, SHEN B. Dung beetle optimizer: A new meta?heuristic algorithm for global optimization [J]. The journal of supercomputing, 2023, 79(7): 7305?7336.
[8] 班多晗,呂鑫,王鑫元.基于一維混沌映射的高效圖像加密算法[J].計算機科學,2020,47(4):278?284.
[9] TANYILDIZI E, DEMIR G. Golden sine algorithm: A novel math?inspired algorithm [J]. Advances in electrical and computer engineering, 2017, 17(2): 71?78.
[10] 施磊,郝武幫,郭曉龍.基于Levy飛行策略和改進灰狼算法的光伏陣列MPPT研究[J].電力科學與工程,2023,39(6):17?24.
[11] 張然,潘芷涵,尹毅峰,等.基于SAA?SSA?BPNN的網絡安全態(tài)勢評估模型[J].計算機工程與應用,2022,58(11):117?124.
[12] 姜萬菲.基于多模型權重提取與融合的網絡安全態(tài)勢預測研究[D].蘭州:蘭州理工大學,2016.
[13] 孫雋豐,李成海,曹波.基于TCN?BiLSTM的網絡安全態(tài)勢預測[J].系統(tǒng)工程與電子技術,2023,45(11):3671?3679.
[14] ZHANG Y, TAN X B, CUI X L, et al. Network security situation awareness approach based on Markov game model [J]. Journal of software, 2011, 22(3): 495?508.
[15] 陳龍,呂磊,楊旭東.基于改進CRITIC的灰色關聯(lián)網絡安全態(tài)勢評估方法[J].電訊技術,2022,62(4):517?525.
[16] TIZHOOSH H R. Opposition?based learning: A new scheme for machine intelligence [C]// International Conference on Computational Intelligence for Modeling, Web Technologies and Internet Commerce. New York: IEEE, 2005: 695?701.
[17] 肖子雅,劉升.精英反向黃金正弦鯨魚算法及其工程優(yōu)化研究[J].電子學報,2019,47(10):2177?2186.
基金項目:中國博士后科學基金項目(2015M572694,2016T90979)
作者簡介:陳秋瓊(1987—),女,安徽人,碩士研究生,研究方向為網絡空間防御。