陳 瑛,王高才
(廣西大學 計算機與電子信息學院,南寧 530004)
隨著互聯(lián)網(wǎng)技術和信息網(wǎng)絡的飛速發(fā)展,網(wǎng)絡安全事故頻繁發(fā)生,并且越來越呈現(xiàn)出一種“易攻難守”的趨勢,主要表現(xiàn)在攻擊者具有時間優(yōu)勢、能力優(yōu)勢和成本優(yōu)勢[1],而傳統(tǒng)的網(wǎng)絡防御技術因其被動性和滯后性導致防御方在網(wǎng)絡安全對抗中長期處于劣勢地位,經(jīng)研究表明,這一現(xiàn)狀主要由網(wǎng)絡的靜態(tài)性、同構性和確定性造成[2].
為了改變這種攻防雙方信息地位不對稱的網(wǎng)絡攻防環(huán)境,以挫敗攻擊者為目的的移動目標防御MTD(Moving Target Defense)應運而生[3],并且已成為網(wǎng)絡安全領域的一個研究熱點,它通過構建一種動態(tài)性、異構性和不確定性的網(wǎng)絡空間目標環(huán)境來增加攻擊者的攻擊難度,以系統(tǒng)的隨機性和不可預測性來對抗網(wǎng)絡攻擊,減少漏洞的暴露和被利用的可能性,增強目標系統(tǒng)的防御能力[4],博弈論是一種研究具有斗爭或競爭性質現(xiàn)象的數(shù)學理論和方法,被應用于較多領域的決策問題,其研究內(nèi)容的基本特征與網(wǎng)絡攻防對抗過程中攻防雙方的特點相吻合[5],因此博弈論成為研究MTD決策問題的有效指導理論.
目前,基于博弈論的MTD決策研究已經(jīng)取得了部分成果.Chowdhary[6]通過構建基于攻擊圖的兩人零和Markov博弈模型迫使攻擊者選取次優(yōu)策略,但該模型基于完全信息假設,不能較為準確地描述實際網(wǎng)絡攻防過程.Liu[7]以不完全信息動態(tài)博弈為基礎,分別構建單階段和多階段MTD博弈模型并求解最優(yōu)MTD策略,但多階段模型只是單階段模型的簡單疊加,并沒有體現(xiàn)實際網(wǎng)絡攻防過程中的階段性特點及對攻防收益的影響.李亞龍[8]采用信號博弈模型研究MTD策略選取問題,但防御者通過攻擊者信號和攻擊策略來選擇防御策略,防御者依然處于滯后和被動的地位,并未體現(xiàn)MTD主動防御的思想.Sun[9]通過考慮防御檢測系統(tǒng)本身存在的錯檢缺陷構建MTD信號博弈模型,但缺點是簡單地將攻防成本作為對方的收益,收益量化較為簡單.
由上可知,現(xiàn)有的基于博弈論的MTD策略選取研究存在以下問題:
1)大部分研究都基于攻防雙方完全理性的假設,而在實際網(wǎng)絡攻防對抗中,由于時間、成本等眾多因素,參與者無法做到完全理性.
2)攻防雙方的收益量化不詳細、不具有代表性,無法適用于大多數(shù)網(wǎng)絡攻防對抗過程的分析.
3)多數(shù)文獻基于單階段攻防對抗進行分析,在實際網(wǎng)絡攻防對抗的多階段過程中拓展性較差,且沒有較好地體現(xiàn)MTD的主動防御思想.
4)現(xiàn)有研究內(nèi)容都是針對存在的問題選取合適的模型進行策略選取的分析和計算,并沒有對具體的攻防對抗過程進行針對性的分析和防御優(yōu)化.
因此,本文選取更符合網(wǎng)絡攻防實際的不完全信息動態(tài)博弈分析方法,以信號博弈理論為基礎,將Markov決策與網(wǎng)絡攻防實際相結合,構建移動目標Markov信號博弈防御模型(Moving Target Markov Signaling Game Defense Model,MTMSGD),對MTD策略選取問題進行研究和分析,主要如下:
1)考慮到攻擊者是有限理性的,在防御者釋放信號的誘導作用下不能完全判斷防御者類型,同時攻防收益量化是雙方策略選擇的基礎,影響著策略選擇的準確性,因此引入攻擊者的最小風險的貝葉斯決策,重新量化雙方收益.
2)考慮到攻防過程是馬爾可夫過程的多階段多狀態(tài)轉移,引入基于馬爾可夫鏈并用于衡量網(wǎng)頁重要排行度的PageRank鏈接分析算法,衡量網(wǎng)絡攻防過程中的階段重要排行度并注重這些排行度較高階段的防御策略制定和選取.
3)在上述攻防收益量化的基礎上,給出該模型的精煉貝葉斯均衡求解步驟,并設計了移動目標Markov信號博弈的防御決策優(yōu)化算法,通過仿真實驗驗證了本文模型和方法的有效性與可行性.
本文從網(wǎng)絡攻防實際情況出發(fā),基于主動防御的角度,考慮到參與者是有限理性的,通過采取防御者釋放信號、攻擊者不完美識別信號的信號博弈來提升防御方的主動防御能力、挫敗攻擊者的行動,所提模型具有較好的實用性.同時,基于移動目標防御的原理特性,采取攻擊面變換、探測面擴展等策略,增強了目標系統(tǒng)的不確定性、異構性和動態(tài)性,加大了攻擊難度,從而提高系統(tǒng)防御力.本文模型可以從單攻擊者和單防御者擴展到多攻擊者和多防御者,具有較好的擴展性.
移動目標防御通過頻繁改變攻擊面,減少系統(tǒng)靜態(tài)性、同構性和確定性,以挫敗攻擊者在探測目標系統(tǒng)時的攻擊行動,達到改變現(xiàn)有網(wǎng)絡攻防局勢的目的[10,11].信號博弈是研究具有信息傳遞特征的信號機制的一般不完全信息動態(tài)博弈模型.本文在信號博弈的基礎上,借鑒現(xiàn)有研究對移動目標防御信號博弈過程中的多階段Markov特性和狀態(tài)轉移的描述[12],即網(wǎng)絡攻防對抗過程由多個階段組成,每個階段又分為初始狀態(tài)和穩(wěn)定狀態(tài).在各個階段,博弈系統(tǒng)經(jīng)過一系列攻防動作從初始狀態(tài)到達該階段的穩(wěn)定狀態(tài),由于系統(tǒng)環(huán)境經(jīng)常發(fā)生改變,該穩(wěn)定狀態(tài)無法繼續(xù)維持,會根據(jù)狀態(tài)轉移概率隨機跳變到一個新的狀態(tài),由此進入到下一階段并成為該階段的初始狀態(tài),如此循環(huán)往復,形成了網(wǎng)絡攻防的多階段過程.同時,基于主動防御的思想,從防御者釋放信號干擾攻擊者的角度出發(fā),本文定義防御者為信號發(fā)送方,攻擊者為信號接收方,構建MTMSGD博弈模型.
假設1.攻擊者總是追求回報最大和成本最小.
假設2.攻擊者的目標是提升自己在目標系統(tǒng)的攻擊權限.
1)N={Na,Nd}是局中人集合,分別表示攻擊者和防御者.
3)M={m1,m2,…,mn}表示防御者釋放的信號類型,防御信號類型與防御類型對應.
4)T是多階段博弈的階段數(shù),G(k)表示第k階段博弈過程,k∈[1,T].
5)B={D,A}表示博弈雙方的策略空間,D={d1,d2,…,dg}為防御策略,di={asd,asvi,esdi,esvi,sfi},A={a1,a2,…,ah}為攻擊策略,攻防雙方一般采取組合策略,即Ax和Dy,分別表示各自策略空間集合中的一種或幾種.
9)S={S1,S2,…,ST}是攻防對抗各階段的穩(wěn)定狀態(tài)集合.
11)ξ是Markov過程的折扣因子,ξk表示在博弈過程中第k階段的收益相對于第1階段的折現(xiàn)比例,0≤ξk≤1.
為了更準確地選取攻防策略,本文在現(xiàn)有研究[10,13]的基礎上從攻防雙方的角度對收益量化進行改進,具體如下:
定義2.系統(tǒng)損失代價SLC(ax,dy)(System Loss Cost)表示在攻防過程中防御策略dy無法阻止攻擊策略ax時目標系統(tǒng)產(chǎn)生的損失.系統(tǒng)防護收益SPG(ax,dy)(System Protection Gain)表示防御策略dy能夠阻止攻擊策略ax時對目標系統(tǒng)資源的保護[9].防御策略有效性μ(ax,dy)是指在攻防過程中防御者采取dy應對攻擊策略ax的有效性,且滿足0≤μ(ax,dy)≤1.SLC(ax,dy)、SPG(ax,dy)通常由系統(tǒng)資源重要程度C、攻擊致命度AL、安全屬性損害SAD[9]和防御策略有效性μ(ax,dy)描述,如公式(1)、公式(2)所示.
SLC(ax,dy)=(1-μ(ax,dy))C×AL×SAD
(1)
SPG(ax,dy)=μ(ax,dy)C×AL×SAD
(2)
定義3.防御成本DC(Defense Cost):包括MTD攻擊面轉移成本ASSC(Attack Surface Shift Cost)、探測面擴展成本ESEC(Exploration Surface Extend Cost)[8]和信號成本,由具體的防御策略決定.
定義4.信號成本SC(Signal Cost):防御者釋放迷惑誘導干擾攻擊者的信號mj所耗費的成本,根據(jù)MTD防御等級和釋放信號的等級可將SC進行分類.
定義5.攻擊成本AC(Attack Cost):是指在攻防過程中攻擊者發(fā)動攻擊所需要的成本.
(3)
(4)
(5)
綜上,在k第階段,
攻擊收益的計算公式為:
(6)
防御收益的計算公式為:
(7)
由于本文將MTD攻防對抗分為多階段的Markov過程,每個階段攻防雙方都有對應的收益函數(shù),因此為了得出從攻防初始階段到結束階段總的攻防收益,引入折扣因子,借鑒相關文獻[12]的方法,采用折扣期望函數(shù)計算攻防階段Markov過程的累計收益函數(shù),即
(8)
PageRank鏈接分析算法將鏈接價值概念作為排名因素,用于衡量特定網(wǎng)頁相對于其他網(wǎng)頁的重要程度.該算法基于以下兩個基本假設:
1)數(shù)量假設:一個網(wǎng)頁接收到其他網(wǎng)頁指向的入鏈數(shù)量越多,說明該網(wǎng)頁越重要;
2)質量假設:當一個質量高的網(wǎng)頁指向另一個網(wǎng)頁,說明這個被指向的網(wǎng)頁重要.
PageRank算法基于隨機沖浪者模型,其基本思想是:網(wǎng)頁間的鏈接關系決定網(wǎng)頁的重要性排序,算法依靠網(wǎng)頁間的鏈接結構來評價各頁面的等級和重要性,一個網(wǎng)頁的PageRank值不僅考慮指向它的鏈接數(shù),還有指向“指向它的網(wǎng)頁的其他網(wǎng)頁本身的重要性”.該算法具有如下性質:
1)PageRank值的傳遞性:當網(wǎng)頁A指向網(wǎng)頁B時,A的PageRank值也部分傳遞給B;
2)重要性的傳遞性:一個重要性大的網(wǎng)頁比一個重要性小的網(wǎng)頁傳遞的權重要多.
由于本文所提模型為多階段Markov過程,所以應用PageRank算法計算本文模型多階段過程中的階段權重值.下面證明該算法具有Markov特性.
證明:PageRank的計算公式為:
(9)
其中,pi表示第i張網(wǎng)頁,Mi是指向pi的入鏈集合,pj是Mi集合中的第j張網(wǎng)頁.PR(pj)是網(wǎng)頁pj的PageRank值,L(pj)表示網(wǎng)頁pj的出鏈接數(shù)量,α是用戶不進行隨機跳轉的概率,N表示所有網(wǎng)頁的數(shù)量.
用一個矩陣R表示所有網(wǎng)頁的PR值,如公式(10)所示,則R的迭代公式如公式(11)所示.
(10)
(11)
若有m個鏈接指向網(wǎng)頁pi,則il(pi,pj)=m/sum,sum為矩陣第j列的總和,表示網(wǎng)頁pj的外鏈總數(shù).
(12)
(13)
(14)
其中e為所有分量都為1的N階矩陣,則R的迭代公式可以表示為:
Rn=ARn-1
(15)
所以PR值的計算過程是一個Markov過程,證畢.
在上述證明結果的基礎上,又因為PageRank算法在標準的馬爾可夫鏈上還引入了隨機的跳轉操作,這與本文網(wǎng)絡攻防模型的多階段多狀態(tài)轉移過程相似,所以將PageRank算法引入到本文的網(wǎng)絡攻防多階段過程進行分析.對于本文模型,公式(9)中的pi表示網(wǎng)絡攻防過程中的第i階段,Mi是由其他階段跳轉到階段pi的數(shù)量,pj是Mi集合中第j階段,PR(pj)是階段pj的PR值,L(pj)表示階段pj跳轉到其他階段的數(shù)量,α是系統(tǒng)不進行隨機跳轉的概率,N表示攻防過程階段總數(shù).
MTMSGD模型的博弈過程分為多個階段,在每個階段,攻擊者在防御信號的作用下不斷調(diào)整對防御類型的信念推斷并采取合適的攻擊策略,防御者在觀察到攻擊策略后選擇合適的防御策略.具體博弈順序如下:
3)攻擊者觀察到信號mi后,選擇對應的攻擊策略,并更新對防御類型的后驗概率推斷.
4)防御者觀測到攻擊者采取的攻擊策略后,選擇合適的防御信號并采取防御策略.
5)攻擊者將更新的后驗概率推斷作為下一階段對防御類型的先驗信念.
一直循環(huán)以上過程,直至攻防結束.
由于本文提出的Markov信號博弈模型是不完全信息動態(tài)博弈,因此分析該模型的博弈均衡即為分析精煉貝葉斯均衡.根據(jù)上述分析可知,若(ak*,mk*,dk*)是博弈過程在第k階段的最優(yōu)解,則應滿足下列條件:
(16)
根據(jù)現(xiàn)有研究內(nèi)容對信號博弈基本定理的相關結論[13,14],可以證明本文Markov信號博弈均衡策略的存在性.
所以,該模型的精煉貝葉斯均衡求解步驟具體如下:
步驟2.計算攻擊者對應的最優(yōu)攻擊策略a*(m).
步驟3.計算防御者對應的最優(yōu)防御策略m*(φd,d*)
防御者預見到攻擊者會根據(jù)自己釋放的信號來選擇最優(yōu)攻擊策略a*(m),因此選擇使防御收益UD最大的防御策略m*(φd,d*),即通過計算maxUD(φd,a*(m),m)選取防御者對應的最優(yōu)攻擊策略m*(φd,d*).
根據(jù)上述方法即可依次求得網(wǎng)絡攻防過程中各個階段的精煉貝葉斯均衡.
由上述分析知,本文提出的移動目標Markov信號博弈過程是一個有限時間步的MDP(Markov Decision Process),根據(jù)貝爾曼最優(yōu)化原理(Bellman′s principle of Optimality)的推論,有限時間步的MDP至少存在一個全局最優(yōu)解,該最優(yōu)解是確定的并且可使用動態(tài)規(guī)劃求得,動態(tài)規(guī)劃可以解決把多階段過程轉化為一系列單階段問題并逐個求解的一類問題[15].所以針對本文MTMSGD博弈模型的多階段求解問題,將轉化為引入折扣因子ξ計算攻防過程多階段整體收益,并以整體收益為目標準則函數(shù)求最大值的動態(tài)規(guī)劃問題,具體計算過程見公式(8).
根據(jù)上述分析,設計MTMSGD的防御決策選取算法.
算法1.移動目標Markov信號博弈模型的防御決策優(yōu)化算法
輸入:移動目標Markov信號博弈模型MTMSGD
輸出:最優(yōu)防御策略m*(φd,d*)
BEGIN
1. 初始化移動目標Markov信號博弈模型MTMSGD
5. While(k≤T)
{
7. 在攻防過程中的第G(k)階段,分別計算攻防雙方收益
12.k=k+1
}
13. 構建移動目標Markov信號博弈多階段狀態(tài)轉移圖的PageRank鏈接分析算法,獲取各階段的權重值
END
由3.2節(jié)對算法均衡的分析可知,該算法的時間復雜度主要取決于精煉貝葉斯均衡的計算過程,若防御者的類型空間為n,r=max(g,h),根據(jù)動態(tài)博弈理論[16]可知,本文算法的時間復雜度為o(r3+n2+2n).存儲空間主要用于存儲收益和均衡計算過程的中間結果,為o(nr).
將本文提出的模型及算法與其他文獻進行對比,如表1所示.博弈過程是指網(wǎng)絡攻防對抗過程的階段性和狀態(tài)性特點,如單階段多階段和單狀態(tài)多狀態(tài);博弈類型是指攻防雙方采取的博弈方式;信號機制是指攻防雙方在博弈過程中是否采取信號博弈以及規(guī)定哪一方為信號發(fā)送方,由于信號博弈雙方有行動先后順序,因此采取防御者為信號發(fā)送者、攻擊者為信號接收者更能體現(xiàn)主動防御的思想;均衡求解是指算法的均衡求解過程是否詳細具體,因為對博弈的均衡求解來說,不完全信息動態(tài)博弈比完全信息博弈和靜態(tài)博弈的均衡求解的難度要更大,因此均衡求解是否詳細具體直接關系到這個算法的實用性的優(yōu)劣;考慮策略風險是指該算法的博弈雙方是否為有限理性,這也關系到該算法的實用性和通用性;考慮階段權重是指攻防博弈結束后是否對重要的階段進行分析,以便為以后的防御制定更有效的策略.
表1 模型與算法對比分析Table 1 Comparative analysis of model and algorithm
通過已有分析可知,Liu[7]和Li[8]采取攻擊者為信號發(fā)送方的信號機制,通過第1節(jié)對主動防御的分析可知采取防御者為信號發(fā)送方的信號機制更符合主動防御的思想,且防御者釋放的信號可以在一定程度上迷惑和誘導攻擊者,進而可以挫敗攻擊者的攻擊行動,具有更好的防御效果.Chowdhary[6]采用Markov博弈,Sun[9]和蔣侶[17]采用單階段或單狀態(tài)的博弈模型,且都假定博弈參與者完全理性,然而實際攻防過程中參與者因各種因素難以做到完全理性,都會或多或少地做出錯誤的判斷和決策,因此需要將策略風險考慮到博弈模型的決策中.以上文獻都只是將防御決策作為網(wǎng)絡攻防過程的結束,事實上求解出雙方策略時,網(wǎng)絡攻防對抗遠遠沒有結束,應該對攻防過程中的多階段進行進一步的分析,獲取較為重要的階段,并著重對這些攻防階段進行分析并制定更好的防御策略,為以后的網(wǎng)絡攻防對抗作準備.
為驗證MTMSGD模型及防御決策優(yōu)化算法的有效性和可行性,構建由網(wǎng)絡防御設備、web服務器、客戶端、FTP服務器和DB服務器組成的仿真系統(tǒng)并進行實驗,如圖1所示.該網(wǎng)絡的訪問控制策略限制系統(tǒng)外的用戶只能訪問web服務器,系統(tǒng)內(nèi)的web服務器、FTP服務器和客戶端可以訪問DB服務器.
圖1 仿真系統(tǒng)拓撲圖Fig.1 Simulation system topology
通過Nessus掃描工具掃描整個仿真系統(tǒng),根據(jù)國家信息安全漏洞庫(CNNVD)數(shù)據(jù)獲得該系統(tǒng)中的設備漏洞信息,如表2所示,漏洞信息包括漏洞涉及的主機、類型、危害級別、CVE編號以及漏洞在各主機上的初始權限和目標權限.
表2 設備漏洞信息Table 2 Device vulnerability information
表3 仿真系統(tǒng)不同階段狀態(tài)表Table 3 State table of simulation system in different stages
圖2 多階段狀態(tài)轉移圖Fig.2 Multi-stage transition diagram
攻擊者的目的在于獲取數(shù)據(jù)庫服務器的特權,實施SQL注入和竊取備份等攻擊,攻擊者無法直接訪問DB服務器,但是可以通過一系列連續(xù)的攻擊策略一步步獲取web服務器、客戶端和FTP服務器的對應權限,進而獲得DB服務器的root權限,最后實現(xiàn)攻擊目標.針對設備漏洞信息,參考美國麻省理工大學的攻防行為數(shù)據(jù)庫[18]和相關文獻[12,19],得出表4和表5所示攻擊策略和防御策略的相關屬性.
表4 原子攻擊屬性描述Table 4 Atomic attack attribute description
在分析漏洞信息的基礎上,本文將防御者類型分為高等級防御類型φH和低等級防御類型φL,分別對應于高等級防御信號mH和低等級防御信號mL.
表6 各階段攻防策略及收益Table 6 Attack-defense strategy and benefit of each stage
圖3 MTMSGD博弈模型第一階段博弈樹Fig.3 First stage game tree of MTMSGD game model
(17)
(18)
以第1階段為例,根據(jù)3.3節(jié)給出的博弈均衡求解步驟,求解MTMSGD模型的精煉貝葉斯均衡并選取最優(yōu)防御策略.
1)攻擊者在觀察到防御者釋放的防御信號時,推斷自己的最優(yōu)攻擊策略:
由4.3節(jié)可知,當0≤α≤1時,a*(mH)=a1.
同理,當m=mL時,若0≤β≤1,則a*(mL)=a1.
2)在預見到攻擊者采取最優(yōu)攻擊策略時,防御者會采取對應的最優(yōu)防御策略:
m*(φd,d*)∈argmaxUD(φd,a*(m),m)
當φd=φH時,m(φd,d*)∈argmaxUD(φd,a*(m),m)
=max{UD(φH,a*(mH),mH),UD(φH,a*(mL),mL)}
=max{UD(φH,a1,mH),UD(φH,a2,mL)}
即m*(φH)=mH
同理,當φd=φL時,m*(φL)=mH
由1)和2)可知此時的博弈均衡為(φH,mH,a1)與(φL,mH,a1),為混同均衡.當防御者采取高防御等級φH并釋放高等級防御信號mH時,攻擊者采取攻擊策略a1,防御者采取防御策略d1,防御收益為599;當防御者采取低防御等級φL并釋放高等級防御信號mH,攻擊者采取攻擊策略a1,防御者采取防御策略d1,防御收益為603.
仿真實驗設定折扣因子ξ=0.4,采用Pycharm2020.2.3工具計算各階段的目標準則函數(shù)值,在此基礎上得到防御者的最優(yōu)防御策略m*(φd,d*)以及攻擊者的最優(yōu)攻擊策略a*(m),實現(xiàn)了策略選取算法,具體各階段博弈均衡策略如表7所示.
表7 各階段博弈均衡策略Table 7 Game equilibrium strategy in each stage
本文在通過實驗得出各階段的最優(yōu)策略以及對應的攻防收益的基礎上,引入PageRank鏈接分析算法,對多階段多狀態(tài)網(wǎng)絡攻防過程中各階段的權重進行分析,得到各階段權重值對比圖,如圖4所示.在4.1節(jié)和4.2節(jié)的分析基礎上,結合圖4可以看出,階段6和7的權重值最高,階段4和5次之,其次是階段3,最后是階段1和2,這也與圖2的多階段狀態(tài)轉移圖相對應.在權重較高的階段下,目標系統(tǒng)具有很高的價值,如果此時攻擊者采取了合適的攻擊策略,很容易攻破目標系統(tǒng)防線,進而進入到下一個攻防階段和狀態(tài).因此在制定網(wǎng)絡攻防各階段的防御策略時,應著重加強對這些權重較高階段的防御策略的制定,爭取在網(wǎng)絡攻防過程的前期階段挫敗攻擊者.
圖4 各階段權重值對比圖Fig.4 Comparison chart of weight value in each stage
在4.1節(jié)搭建的仿真實驗環(huán)境中,將本文的防御決策算法與文獻[9,12]的未考慮攻擊策略風險的防御決策算法進行對比,本文算法與這兩個算法都是多階段決策算法,因此對3個算法的多階段攻防收益進行對比,如圖5、圖6所示.
圖5橫坐標表示防御收益,縱坐標表示攻擊收益;圖6橫坐標表示攻防階段數(shù),縱坐標表示攻擊收益.由圖5可知,縱觀各個階段,在防御收益相同的情況下,本文的攻擊收益在數(shù)值上有明顯的降低,這是因為本文算法考慮了攻擊者在防御者釋放信號的誘導迷惑作用下,對防御類型會有誤判的情況,因此會產(chǎn)生額外的損失收益,攻擊收益的降低在圖6中有更直觀的顯示.將誤判情況考慮進攻防決策中,收益量化更加精確,也更符合參與者是有限理性的這一攻防實際.
圖5 各階段攻防收益對比Fig.5 Comparison of attack-defense benefit in each stage
圖6 各階段攻擊收益對比Fig.6 Comparison of attack benefit in each stage
為了更直接的說明本文算法相比于其他兩個算法的攻擊收益的降低率,引入攻擊收益降低率的公式
(19)
表8 攻擊收益降低率Table 8 Attack benefit reduction rate
1)高等級防御信號可以有效實現(xiàn)主動防御.
由4.4節(jié)的分析可知,在混同均衡策略中,無論是高防御等級的防御者還是低防御等級的防御者都選取了高等級防御信號,這是因為高等級的防御信號可以有效迷惑攻擊者,誘導攻擊者選取錯誤的攻擊策略,從而阻止攻擊行動,所以高防御等級和低防御等級的防御者都會選取高等級的防御信號對自身進行偽裝,達到震懾攻擊者的目的.
2)防御者應及時更換自己釋放的防御信號.
隨著攻防過程的進行,攻擊者會逐漸修正對防御者類型的信念推斷,如果攻擊者能完全判斷出防御者的類型,就會采取更加合適的攻擊行動,對目標系統(tǒng)造成危害.因此防御者要及時更換自己釋放給攻擊者的防御信號,將防御信號和防御策略組合使用,以阻止攻擊行動.
3)防御者要針對實際攻防過程制定相應有效的策略.
網(wǎng)絡攻擊并不是一蹴而就的,實際中的網(wǎng)絡攻防是一個多階段多狀態(tài)的過程,而階段間和狀態(tài)間的重要性也不盡相同,因此要格外注重網(wǎng)絡攻防過程中相對來說更重要的階段和狀態(tài),因為這些階段狀態(tài)在一定程度上可以決定攻擊者的行動最終是否能成功,所以研究者要針對這些階段狀態(tài)制定更有效的防御策略,爭取能在攻擊者完全識破防御信號前成功阻止攻擊.
移動目標防御作為一種能改變網(wǎng)絡攻防現(xiàn)有局勢的主動防御思想,在實際應用中具有良好的效果,而針對移動目標防御的防御決策選取問題是研究的重點.本文提出了移動目標Markov信號博弈的防御決策模型MTMSGD,主要解決移動目標防御過程中的防御決策優(yōu)化問題,在移動目標Markov信號博弈的基礎上,引入攻擊者的最小貝葉斯決策,改進攻防收益量化,給出了求解精煉貝葉斯的詳細步驟,設計了優(yōu)化防御策略的求解算法.同時針對攻防過程中的多階段多狀態(tài)特點,引入PageRank鏈接分析算法,著重分析權重較高階段下的防御策略的制定.最后根據(jù)實驗結果總結了移動目標防御的普遍性規(guī)律,對現(xiàn)實網(wǎng)絡攻防環(huán)境下的防御決策具有一定的指導意義.