呂娜,潘武,*,陳柯帆,張彥暉
1. 空軍工程大學(xué) 信息與導(dǎo)航學(xué)院,西安 710077 2. 中國人民解放軍94860部隊,南京 210000
軟件定義網(wǎng)絡(luò)[1-3]將控制平面與數(shù)據(jù)平面分離,采用邏輯集中控制方式,基于靈活、開放、可編程的南北向接口,對網(wǎng)絡(luò)設(shè)備進(jìn)行統(tǒng)一管理,并且受到業(yè)界的廣泛關(guān)注。機載網(wǎng)絡(luò)[4-5]作為鏈接空中平臺的紐帶,為平臺間信息交互服務(wù)提供重要保證,但其一直遵循著傳統(tǒng)分布式網(wǎng)絡(luò)架構(gòu)的設(shè)計思路,難以滿足未來航空作戰(zhàn)中成員的靈巧作戰(zhàn)協(xié)同需求。為有效支撐航空平臺間的通信需求,SAMPIGETHAYA等[6-8]將軟件定義網(wǎng)絡(luò)(SDN)的思想應(yīng)用于機載網(wǎng)絡(luò)構(gòu)建中,軟件定義機載網(wǎng)絡(luò)的概念被提出。與傳統(tǒng)機載網(wǎng)絡(luò)相比,軟件定義機載網(wǎng)絡(luò)可以使網(wǎng)絡(luò)的配置與管理變得高效簡單,充分提升網(wǎng)絡(luò)管控的靈活性,有效打破網(wǎng)絡(luò)功能僵化造成的瓶頸。
航空平臺的通信端機形成軟件定義機載網(wǎng)絡(luò)的數(shù)據(jù)平面,控制器所形成的控制平面是軟件定義機載網(wǎng)絡(luò)的管控核心,維護(hù)著數(shù)據(jù)平面的可靠信息交互。每個控制器管控其控制域內(nèi)的若干通信端機。高對抗作戰(zhàn)環(huán)境下,控制器的設(shè)備故障或鏈路強干擾故障,造成其域中的通信端機失去網(wǎng)絡(luò)管控,導(dǎo)致相關(guān)數(shù)據(jù)平面部分的信息轉(zhuǎn)發(fā)失效,從而影響相應(yīng)作戰(zhàn)任務(wù)的實施。因此,針對軟件定義機載網(wǎng)絡(luò)控制平面控制器故障問題,研究有效恢復(fù)控制器故障的方法,對提升控制平面的健壯性具有重要意義。
目前,對于控制器故障恢復(fù)的研究,主要從控制器部署和交換機遷移2個方面提高控制平面的健壯性。對于控制器部署方面的研究,主要是在網(wǎng)絡(luò)的前期規(guī)劃階段,通過建立備份機制[9-12]及時應(yīng)對控制器突發(fā)故障情況,恢復(fù)網(wǎng)絡(luò)的正常管控。文獻(xiàn)[9]設(shè)計一種考慮備份開銷的最優(yōu)SDN控制器備份算法,提高網(wǎng)絡(luò)的可用性和可靠性。文獻(xiàn)[10]采用基于多目標(biāo)優(yōu)化的粒子群算法,得出最優(yōu)的備份控制器部署方案??梢钥闯?,對于控制器數(shù)量較少的小規(guī)模網(wǎng)絡(luò),部署備份控制器可以有效快速地恢復(fù)控制器故障,增強控制平面的健壯性;而在控制器數(shù)量較多的大規(guī)模網(wǎng)絡(luò)中,需要備份的控制器數(shù)量增多,控制路徑需要占用鏈路的開銷增多,整個網(wǎng)絡(luò)也變得更加臃腫。因此,備份機制較難適用于軟件定義機載網(wǎng)絡(luò)的控制器故障恢復(fù)場景。
另一類研究采用交換機遷移思想,即指當(dāng)某個或某幾個控制域內(nèi)的控制器發(fā)生故障,將故障域內(nèi)的交換機遷移至其他正??刂朴騼?nèi),對網(wǎng)絡(luò)進(jìn)行彈性管控。遂行作戰(zhàn)任務(wù)的作戰(zhàn)單元,根據(jù)所處的位置以及控制器容量等因素,每個控制器管理一定數(shù)量的通信端機,形成多個控制域,實現(xiàn)正常的信息交互。當(dāng)某個控制器發(fā)生故障時,可以考慮將數(shù)據(jù)平面中的通信端機進(jìn)行遷移,轉(zhuǎn)換控制關(guān)系,有效解決機載網(wǎng)絡(luò)中控制器故障問題。
在目前的交換機遷移相關(guān)研究中,由于負(fù)載不均衡會嚴(yán)重限制網(wǎng)絡(luò)的效能,不僅會造成控制器資源的浪費,而且高負(fù)載的控制器容易崩潰,從而削弱控制平面的健壯性;因此,有較多文獻(xiàn)著重考慮提高負(fù)載均衡率,并設(shè)定相應(yīng)的交換機遷移策略[13-21]。文獻(xiàn)[13]提出一種彈性的分布式控制器體系結(jié)構(gòu)ElastiCon,設(shè)計一種新穎的交換機遷移協(xié)議實現(xiàn)負(fù)載轉(zhuǎn)移。文獻(xiàn)[14]提出一種基于交換機遷移機制的集群控制器動態(tài)負(fù)載均衡方法,主要解決控制器之間負(fù)載的不均衡,還能夠支持控制器故障轉(zhuǎn)移且無需斷開交換機連接。文獻(xiàn)[15]針對現(xiàn)有遷移方案中遷移效率低下和遷移代價高的問題,提出基于效能優(yōu)化的交換機動態(tài)遷移策略,使負(fù)載均衡率保持在較高水平。文獻(xiàn)[16]提出一種基于過程優(yōu)化的交換機競爭遷移機制算法,有效避免交換機遷移沖突,并且控制器負(fù)載均衡率平均提升25.6%。上述研究主要優(yōu)化網(wǎng)絡(luò)中控制器的負(fù)載均衡率指標(biāo)。
針對交換機遷移過程中的其他網(wǎng)絡(luò)性能指標(biāo),如遷移時延,遷移距離和通信開銷等,目前也有相關(guān)研究基于多目標(biāo)優(yōu)化問題,同時優(yōu)化多個性能指標(biāo)。文獻(xiàn)[22]基于SMDM(Switch Migration-based Decision-Making)方案,權(quán)衡遷移成本和負(fù)載均衡率,提出基于貪婪方法的效率感知交換機遷移算法,指導(dǎo)遷移方法的選擇。文獻(xiàn)[23]首要衡量遷移距離和時延,基于Pareto的彈性最優(yōu)控制器放置框架設(shè)計遷移機制,該方法雖然可以在網(wǎng)絡(luò)運行過程中對網(wǎng)絡(luò)進(jìn)行彈性調(diào)整,但未考慮控制器的負(fù)載因素,容易增加相鄰控制器的負(fù)擔(dān),造成整個控制平面的負(fù)載失衡。文獻(xiàn)[24]提出了一種基于多目標(biāo)優(yōu)化的動態(tài)交換機遷移算法,基于NSGA-II的多目標(biāo)遺傳算法同時優(yōu)化控制平面負(fù)載均衡度和交換機遷移所產(chǎn)生的通信開銷。
綜上所述,本文將交換機遷移思想引入軟件定義機載網(wǎng)絡(luò)控制節(jié)點故障恢復(fù)問題,當(dāng)控制節(jié)點發(fā)生故障,考慮將數(shù)據(jù)平面中的傳輸節(jié)點進(jìn)行遷移,構(gòu)成新的控制關(guān)系;綜合考慮傳輸節(jié)點遷移時延和控制器負(fù)載均衡目標(biāo),提出一種基于時延和負(fù)載均衡的傳輸節(jié)點遷移TNM-LLB(Transfer Node Migration Latency and Load Balancing)策略,對數(shù)據(jù)平面中的傳輸節(jié)點進(jìn)行遷移。在恢復(fù)故障的過程中,該策略在犧牲少量故障恢復(fù)時間的同時,使網(wǎng)絡(luò)中控制節(jié)點的負(fù)載處于較為均衡狀態(tài),最終有效解決機載網(wǎng)絡(luò)控制節(jié)點故障問題。
為了便于描述,將機載網(wǎng)絡(luò)中的航空平臺定義為節(jié)點,網(wǎng)絡(luò)中的控制器映射為控制節(jié)點,通信端機映射為傳輸節(jié)點,具有多種作戰(zhàn)功能的有人/無人作戰(zhàn)單元,在不同作戰(zhàn)階段,根據(jù)所處位置以及控制容量等因素,將網(wǎng)絡(luò)劃分為多個控制域。采用與文獻(xiàn)[25]類似的控制器部署方式,在控制域中,一個控制節(jié)點管控多個傳輸節(jié)點,各域中控制節(jié)點對域內(nèi)傳輸節(jié)點進(jìn)行控制指令的上傳下達(dá),構(gòu)成邏輯集中、物理分散的網(wǎng)絡(luò)控制模式,完成相應(yīng)的作戰(zhàn)任務(wù)。應(yīng)用場景如圖1所示,假設(shè)某一控制域內(nèi)的控制節(jié)點發(fā)生故障,該域內(nèi)的傳輸節(jié)點將暫時失去管控,需要遷移至新的控制域內(nèi),獲取新的控制指令,有效解決控制節(jié)點故障對網(wǎng)絡(luò)造成的影響。
圖1 軟件定義機載網(wǎng)絡(luò)控制節(jié)點故障場景示意圖Fig.1 Schematic diagram of software-defined airborne network control node failure scenarios
軟件定義機載網(wǎng)絡(luò)拓?fù)溆脽o向圖G=(V,E)表示,其中V表示網(wǎng)絡(luò)中節(jié)點集合,E表示網(wǎng)絡(luò)中鏈路集合,G中包含M個控制節(jié)點C={c1,c2,…,cM}和N個傳輸節(jié)點S={s1,s2,…,sN},其中|V|=M+N。網(wǎng)絡(luò)中故障控制節(jié)點集合為F={c1,c2,…,cF},正??刂乒?jié)點集合為Z={c1,c2,…,cZ},其中M=F+Z。控制節(jié)點cm管控的傳輸節(jié)點集合定義為Wcm,并且Wcm∈S;傳輸節(jié)點si與控制節(jié)點cm的控制關(guān)系用li,m表示,其中,li,m=1表示控制節(jié)點cm管控傳輸節(jié)點si,li,m=0表示傳輸節(jié)點si不受控制節(jié)點cm管控。節(jié)點i與節(jié)點j之間的距離用dij表示,節(jié)點的通信半徑為R。將接收遷移傳輸節(jié)點的控制節(jié)點定義為遷入控制節(jié)點,并用集合Cim表示;故障域中需要遷移的傳輸節(jié)點定義為遷出傳輸節(jié)點,并用集合Sos表示。
基于時延和負(fù)載均衡的傳輸節(jié)點遷移TNM-LLB策略的基本思路為:首先,控制域中的傳輸節(jié)點與控制節(jié)點進(jìn)行正常的信息交互,當(dāng)所有傳輸節(jié)點均無法接收控制節(jié)點回復(fù)指令時,則判定控制節(jié)點發(fā)生故障,并會觸發(fā)遷移機制。其次,根據(jù)該故障域中傳輸節(jié)點的通信半徑,確立可遷移區(qū)域。在該可遷移區(qū)域中,根據(jù)傳輸節(jié)點遷移所耗費的時延和遷移負(fù)載差異矩陣來動態(tài)選擇待遷入控制節(jié)點,實施遷移操作并轉(zhuǎn)換控制關(guān)系,構(gòu)成新的控制域。最后,更新控制節(jié)點的負(fù)載信息,檢查網(wǎng)絡(luò)負(fù)載是否均衡,判斷是否完成遷移過程。
1) 控制節(jié)點負(fù)載
在每個控制域中,每個傳輸節(jié)點產(chǎn)生的流請求都需要通過控制節(jié)點進(jìn)行處理,并且控制節(jié)點將處理結(jié)果返回給該傳輸節(jié)以及轉(zhuǎn)發(fā)路徑上的其他傳輸節(jié)點。因此本文計算控制節(jié)點的負(fù)載主要考慮控制節(jié)點cm所連接的傳輸節(jié)點數(shù)量Q和所有活躍傳輸節(jié)點的平均“packet-in”消息到達(dá)速率B,因此定義控制節(jié)點cm的負(fù)載Lcm表示為
Lcm=α1Qcm+α2Bcm
(1)
式中:α1+α2=1,為簡化研究,取α1=α2=0.5。因此,根據(jù)各控制節(jié)點的負(fù)載,本文采用標(biāo)準(zhǔn)差表示網(wǎng)絡(luò)負(fù)載均衡率:
(2)
HZ×Z=
(3)
從H中可以較為快速得出網(wǎng)絡(luò)中控制節(jié)點的負(fù)載差異情況,從而依據(jù)各控制節(jié)點間的負(fù)載差異值指導(dǎo)遷移動作的完成。
由于需要將故障域內(nèi)的傳輸節(jié)點遷移至其他正??刂乒?jié)點域內(nèi),在完成遷移動作過后,網(wǎng)絡(luò)中各控制節(jié)點的負(fù)載會發(fā)生變化,有可能會造成控制節(jié)點的負(fù)載失衡;因此,在遷移過程中,需要考慮負(fù)載均衡率指標(biāo),保證遷移過后的控制節(jié)點負(fù)載均衡在可接受的范圍內(nèi)。本文設(shè)定負(fù)載差異閾值σ,在遷移過程中需要滿足?ci,cj∈Z,hcicj<σ;其中σ值對調(diào)整機載網(wǎng)絡(luò)中控制節(jié)點的負(fù)載分布具有重要意義,其大小與控制器的最大負(fù)載和最小負(fù)載都有關(guān)系;根據(jù)負(fù)載差異矩陣H,負(fù)載差異閾值σ計算公式為
(4)
式中:maxHZ×Z為負(fù)載差異矩陣H中元素最大值;minHZ×Z為負(fù)載差異矩陣H中除0元素外的最小值,即minHZ×Z>0。
2) 遷移時延
可以發(fā)現(xiàn),若所有的遷出傳輸節(jié)點為了減少遷移時延,選擇距離近的控制節(jié)點進(jìn)行遷移,則會使就近的控制節(jié)點負(fù)載突然增大,與距離遠(yuǎn)的控制節(jié)點負(fù)載差異過大,造成整個網(wǎng)絡(luò)的負(fù)載失衡,影響網(wǎng)絡(luò)的性能。因此,在遷移過程中,需要同時衡量網(wǎng)絡(luò)的負(fù)載均衡率β與遷移時延T2個優(yōu)化目標(biāo),使控制節(jié)點故障恢復(fù)的性能更佳。本文定義Ω=βT,可以得出本文的優(yōu)化模型為
minimizeΩ
(5)
式(5)表示模型的目標(biāo)函數(shù),即在故障恢復(fù)過程中,綜合權(quán)衡網(wǎng)絡(luò)控制節(jié)點負(fù)載均衡率和遷移耗費的遷移時延;約束條件第1條表示遷移過程中控制節(jié)點間的負(fù)載差異不能超過閾值σ;第2條表示每個傳輸節(jié)點只能選擇一個控制節(jié)點作為主控制節(jié)點。
在遷移過程中,依照優(yōu)化模型和約束條件指導(dǎo)遷移,使最終的遷移結(jié)果效果更佳。從優(yōu)化模型中可以看出,遷移后的網(wǎng)絡(luò)負(fù)載均衡率與遷移時延是相對矛盾的存在,屬于NP-Hard[26]問題。因此,本文的TNM-LLB策略基于貪婪決策[27]實施完成。該策略實施包含以下2個步驟:控制節(jié)點故障檢測和基于時延和負(fù)載均衡的傳輸節(jié)點遷移TNM-LLB算法的實現(xiàn)。
2.2.1 控制節(jié)點故障檢測
對于控制節(jié)點是否發(fā)生故障的判斷,本小節(jié)采用超時機制進(jìn)行檢測。在集中式網(wǎng)絡(luò)控制方式下,傳輸節(jié)點與控制節(jié)點間通過周期性地發(fā)送Echo Request和Echo Reply報文,確認(rèn)當(dāng)前的狀態(tài)信息;若一個傳輸節(jié)點連續(xù)3次請求沒有收到控制節(jié)點的響應(yīng),則認(rèn)為該控制節(jié)點處于故障狀態(tài)。但由于也可能存在該傳輸節(jié)點與控制節(jié)點間的鏈路出現(xiàn)故障等其他因素,導(dǎo)致誤判為控制節(jié)點故障的情況;因此,假定當(dāng)該控制域內(nèi)所有傳輸節(jié)點重復(fù)上述操作且未收到回復(fù)指令時,則判斷為該控制域內(nèi)的控制節(jié)點發(fā)生故障,并觸發(fā)遷移機制。采用上述故障檢測方法,根據(jù)網(wǎng)絡(luò)拓?fù)銰=(V,E),可對整個網(wǎng)絡(luò)中的控制節(jié)點狀態(tài)進(jìn)行依次判定,進(jìn)而得出故障控制節(jié)點集合,所有故障域中需要遷移的遷出傳輸節(jié)點集合Sos,以及正??刂乒?jié)點集合為Z??刂乒?jié)點故障檢測流程如圖2所示,圖2表示在某個控制域中,采用超時機制來判定該域中控制節(jié)點的狀態(tài)。
圖2 控制節(jié)點故障檢測流程Fig.2 Control node fault detection process
2.2.2 TNM-LLB算法實現(xiàn)
算法1 TNM-LLB算法輸入:遷出傳輸節(jié)點集合Sos輸出:遷入控制節(jié)點集合Cim,連接關(guān)系li,m1) 由Sos和節(jié)點的通信半徑為R得出可遷移區(qū)域Δ和Δ中包含的正??刂乒?jié)點集合Λ2) 基于控制節(jié)點負(fù)載Lcm,計算負(fù)載均衡率β和負(fù)載差異矩陣H3) for?p∈Sos do4) for?q∈Λ do5) 計算dpq,Tpq,β,Ω6) 選擇具有minΩ對應(yīng)的遷入控制節(jié)點q7) 遷移傳輸節(jié)點p至控制節(jié)點q8) 添加節(jié)點q至Cim9) 更新負(fù)載差異矩陣H10) ?ci,cj∈Λ11) ifhcicj<σ12) 完成節(jié)點p的遷移過程13) else 選擇次最小Ω對應(yīng)的遷入控制節(jié)點q',goto 7)14) end if15)end for16) end for17) ?i∈Sos,m∈C18) if∑Mm=1li,m=119) 完成所有遷出傳輸節(jié)點的遷移過程20) 更新Cim和li,m21) end if22) 輸出Cim和li,m
算法復(fù)雜度分析:假設(shè)遷出傳輸節(jié)點集合Sos中有e個元素,正??刂乒?jié)點集合Λ中有f個元素,則可從算法中發(fā)現(xiàn):第1)行通過遷出傳輸節(jié)點集合Sos和通信半徑,計算可遷移區(qū)域Δ和Δ中包含的正??刂乒?jié)點集合Λ,其時間復(fù)雜度為O(e+f+z);第2)行為計算各控制節(jié)點的負(fù)載、負(fù)載均衡率和負(fù)載差異矩陣,其時間復(fù)雜度為O(z2);第3)~16)行為遷移動作,其時間復(fù)雜度為O(efz2);第17)~22)行為約束條件的判定,其時間復(fù)雜度為O(ez),因此,算法的整體時間復(fù)雜度為O(efz2)。
為了驗證本文所提TNM-LLB策略的性能,本節(jié)仿真采用MATLAB軟件,將本文策略與距離就近遷移(Distance Closest Migration,DCM)策略[28]和分布式逐跳(Distributed Hopping Algorithm,DHA)策略[29]進(jìn)行比較,驗證TNM-LLB策略的有效性和可行性。各策略的對比描述如表1所示。
考慮機載網(wǎng)絡(luò)各作戰(zhàn)單元間動態(tài)組織配合,在網(wǎng)絡(luò)拓?fù)渖媳灰暈殡S機動態(tài)變化,因此,在實驗過程中使用的拓?fù)錇?,在給定的區(qū)域中隨機生成數(shù)個節(jié)點,這些節(jié)點依據(jù)相關(guān)子域劃分方法[25],被劃分為多個控制域。仿真參數(shù)設(shè)置如表2所示;假設(shè)在仿真環(huán)境中,控制節(jié)點故障率在0~0.3中隨機取值,節(jié)點平均流請求量在0~2 packet/ms中隨機取值,節(jié)點移動速度為340 m/s。值得說明的是,上述參數(shù)的設(shè)置僅影響仿真計算的具體數(shù)值,并不影響各策略的性能對比,在實際應(yīng)用中,可根據(jù)具體情況進(jìn)行設(shè)置。
表1 策略對比Table 1 Strategy comparison
表2 仿真參數(shù)設(shè)置Table 2 Simulation parameter setting
1) 遷移時延
本實驗分別在節(jié)點規(guī)模為60、100、140的航空網(wǎng)絡(luò)環(huán)境中,并且這些節(jié)點被劃分為10個子域,即網(wǎng)絡(luò)中控制節(jié)點數(shù)量為10,同時設(shè)定網(wǎng)絡(luò)中故障控制節(jié)點的數(shù)量不超過控制節(jié)點總數(shù)的30%。
圖3表示節(jié)點規(guī)模為60、100、140時,遷移時延隨故障控制節(jié)點數(shù)量的變化情況。由于遷移時延主要與遷移傳輸節(jié)點數(shù)量以及遷移對象間的距離有關(guān),所以當(dāng)網(wǎng)絡(luò)中節(jié)點規(guī)模越大,故障控制節(jié)點數(shù)量越多,需要遷移的傳輸節(jié)點也越多,因此,整個遷移過程所耗費的遷移時延也隨之增大。并且可以看出,由于DCM的就近遷移策略旨在選擇故障域附近的正??刂乒?jié)點進(jìn)行遷移,使得整個遷移過程所耗費的時延最少;DHA策略根據(jù)網(wǎng)絡(luò)中控制節(jié)點剩余容量的大小關(guān)系,選擇剩余容量最大的進(jìn)行遷移,而較少考慮遷移對象間的距離,導(dǎo)致遷移過程中耗費的遷移時延最大;本文由于兼顧遷移時延和負(fù)載均衡率兩個目標(biāo),根據(jù)優(yōu)化模型完成遷移過程,使得TNM-LLB策略下的遷移時延處于DCM與DHA之間。由于機載網(wǎng)絡(luò)相較于地面網(wǎng)絡(luò)具有高動態(tài)拓?fù)渥兓忍匦?,因此對網(wǎng)絡(luò)中的遷移時延要求較高;但由于機載網(wǎng)絡(luò)的規(guī)模也較大,其拓?fù)渥兓残枰欢ǖ臅r間。從圖中可以看出,3種策略的遷移時延均在秒級范圍,能有效應(yīng)對機載網(wǎng)絡(luò)故障恢復(fù)問題。而TNM-LLB策略在犧牲少量遷移時延的條件下,來獲取更低的負(fù)載均衡率,使最終遷移效果更佳。
圖3 不同網(wǎng)絡(luò)規(guī)模下遷移時延隨故障控制節(jié)點數(shù)的變化Fig.3 Changes in migration delay with number of fault control nodes at different network scales
2) 負(fù)載均衡率
本實驗同樣分別在節(jié)點規(guī)模60、100、140的航空網(wǎng)絡(luò)環(huán)境中,控制節(jié)點數(shù)為10,網(wǎng)絡(luò)中故障控制節(jié)點的數(shù)量不超過控制節(jié)點總數(shù)的30%,對比不同網(wǎng)絡(luò)規(guī)模下,各策略進(jìn)行遷移時得出的負(fù)載均衡率隨故障控制節(jié)點數(shù)的變化。
從圖4中可以看出,在不同的網(wǎng)絡(luò)規(guī)模下,各策略得出的負(fù)載均衡率數(shù)值呈現(xiàn)上升趨勢,即網(wǎng)絡(luò)的負(fù)載越來越不均衡,這是由于隨著故障控制節(jié)點的數(shù)量增多,需要遷移的傳輸節(jié)點隨之增多,導(dǎo)致網(wǎng)絡(luò)的控制節(jié)點間的負(fù)載差異增大,從而網(wǎng)絡(luò)的負(fù)載均衡率增大。
DCM策略將故障域內(nèi)的傳輸節(jié)點遷移至就近的正??刂乒?jié)點,使得附近的遷入控制節(jié)點的負(fù)載突增,與距離較遠(yuǎn)的控制節(jié)點間的負(fù)載差異也增大,并且隨著故障控制節(jié)點增多,其附近的控制節(jié)點增加的負(fù)載也越多,使得整個網(wǎng)絡(luò)的負(fù)載均衡率呈現(xiàn)上升趨勢;當(dāng)網(wǎng)絡(luò)規(guī)模增大時,各域中的傳輸節(jié)點相對增多,向附近控制節(jié)點遷移的傳輸節(jié)點數(shù)量增多,導(dǎo)致整個網(wǎng)絡(luò)控制節(jié)點間的負(fù)載差異更大,從而負(fù)載均衡率也隨之增大。
DHA策略根據(jù)網(wǎng)絡(luò)中各控制節(jié)點的剩余容量信息,將故障域內(nèi)的傳輸節(jié)點向剩余容量最大的正??刂乒?jié)點進(jìn)行遷移。由DHA策略思想可以看出,當(dāng)控制節(jié)點發(fā)生故障前,網(wǎng)絡(luò)中控制節(jié)點的負(fù)載差異相對較大時,將故障域內(nèi)的傳輸節(jié)點遷移至剩余容量最大的控制節(jié)點,能夠較好的平衡控制節(jié)點間的負(fù)載差異,減小負(fù)載均衡率;然而,當(dāng)控制節(jié)點發(fā)生故障前,網(wǎng)絡(luò)控制節(jié)點負(fù)載已處于較為平衡的狀態(tài),此時運用此策略將故障域內(nèi)的傳輸節(jié)點進(jìn)行遷移,將難以使網(wǎng)絡(luò)的負(fù)載均衡率處于較低水平。當(dāng)故障控制節(jié)點增多時,隨著網(wǎng)絡(luò)規(guī)模的增大,故障域內(nèi)需要遷移的傳輸節(jié)點增多,如果將這些傳輸節(jié)點遷移至剩余容量最大的控制節(jié)點,將使得該控制節(jié)點的負(fù)載突增,與其他控制節(jié)點的負(fù)載差異增大,導(dǎo)致負(fù)載均衡率增大。因此,從圖4(a)~圖4(c)中可以發(fā)現(xiàn),當(dāng)需要遷移的傳輸節(jié)點越少時,DHA策略的負(fù)載均衡率最小,網(wǎng)絡(luò)中控制節(jié)點間的負(fù)載越均衡;否則,隨著遷移傳輸節(jié)點的增多,其完成遷移過程造成的負(fù)載均衡率增大,負(fù)載越不均衡。
本文TNM-LLB策略對遷移時延和負(fù)載均衡率進(jìn)行綜合權(quán)衡,通過負(fù)載差異矩陣和貪婪決策模型指導(dǎo)遷移過程,使每個遷出傳輸節(jié)點在遷移過程中,選擇具有最小優(yōu)化目標(biāo)函數(shù)的控制節(jié)點進(jìn)行遷移,從而使整個遷移過程產(chǎn)生的負(fù)載均衡率保持在較低水平。從圖4中可以看出,當(dāng)網(wǎng)絡(luò)規(guī)模增大,故障控制節(jié)點增多時,本文策略產(chǎn)生的負(fù)載均衡率雖然也在增大,但均低于其他兩種策略,并且處于較低水平,整個網(wǎng)絡(luò)中控制節(jié)點間的負(fù)載越均衡。
圖5表示在節(jié)點規(guī)模為60、100、140的航空網(wǎng)絡(luò)環(huán)境中,目標(biāo)函數(shù)隨故障控制節(jié)點數(shù)的變化對比圖。從圖中可知,相較于其他兩種策略,本文策略以遷移時延和控制節(jié)點負(fù)載均衡率性能指標(biāo)為出發(fā)點,在犧牲少量遷移時延的條件下,使網(wǎng)絡(luò)中控制節(jié)點負(fù)載更為負(fù)均衡,并使最終的目標(biāo)函數(shù)最小,整體遷移效果最佳。
圖4 不同網(wǎng)絡(luò)規(guī)模下負(fù)載均衡率隨故障控制節(jié)點數(shù)的變化Fig.4 Changes in load balancing rate with number of fault control nodes at different network scales
圖5 不同網(wǎng)絡(luò)規(guī)模下目標(biāo)函數(shù)隨故障控制節(jié)點數(shù)的變化Fig.5 Changes in objective function with number of fault control nodes at different network scales
1) 針對軟件定義機載網(wǎng)絡(luò)控制域內(nèi)控制節(jié)點故障問題,提出了一種基于時延和負(fù)載均衡的傳輸節(jié)點遷移TNM-LLB策略,并設(shè)計了TNM-LLB算法,將故障域內(nèi)的傳輸節(jié)點遷移至其他正常控制節(jié)點域內(nèi),進(jìn)行新的控制關(guān)系轉(zhuǎn)換,實現(xiàn)控制域內(nèi)的故障恢復(fù)。
2) 與其他策略相比,本文策略綜合權(quán)衡了遷移時延和控制節(jié)點負(fù)載均衡率性能指標(biāo),并使得最終的目標(biāo)函數(shù)均小于其他兩種策略。在犧牲少量遷移時延的條件下,使負(fù)載均衡率小于其他兩種策略,使網(wǎng)絡(luò)中控制節(jié)點負(fù)載更為均衡,同時驗證了本文優(yōu)化模型能更好地適用于機載網(wǎng)絡(luò)控制節(jié)點故障恢復(fù)場景。