摘 要:航空通信網(wǎng)絡(luò)服務(wù)按需拓展、網(wǎng)絡(luò)環(huán)境動(dòng)態(tài)多變、網(wǎng)絡(luò)對(duì)象異構(gòu)多樣與網(wǎng)絡(luò)干擾強(qiáng)度和樣式急劇增加,要求通信網(wǎng)絡(luò)系統(tǒng)具備自動(dòng)性和智能性。本文構(gòu)建意圖識(shí)別和態(tài)勢(shì)感知聯(lián)合驅(qū)動(dòng)的路由策略系統(tǒng),為指揮人員提供路由策略方案,提升決策的時(shí)效性和準(zhǔn)確性,提高系統(tǒng)在復(fù)雜環(huán)境下的適應(yīng)性。所述系統(tǒng)包含網(wǎng)絡(luò)態(tài)勢(shì)感知、用戶意圖識(shí)別和路由輔助決策等模塊。網(wǎng)絡(luò)態(tài)勢(shì)感知模塊通過分析航空通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),利用收發(fā)數(shù)據(jù)包,獲取網(wǎng)絡(luò)中鏈路時(shí)延、帶寬、丟包率等網(wǎng)絡(luò)服務(wù)質(zhì)量指標(biāo);意圖識(shí)別模塊依據(jù)海量的航空通信數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法,實(shí)時(shí)對(duì)已經(jīng)接入網(wǎng)絡(luò)的航空單位依據(jù)其通信數(shù)據(jù)特征進(jìn)行識(shí)別分類,給出其在通信網(wǎng)絡(luò)中需要的服務(wù)質(zhì)量指標(biāo)權(quán)重;輔助決策模塊以提供最方便快捷的航空通信網(wǎng)絡(luò)服務(wù)為目的,利用前兩個(gè)模塊所提供的實(shí)時(shí)數(shù)據(jù),使用強(qiáng)化學(xué)習(xí)算法為端到端的網(wǎng)絡(luò)通信提供最佳路由,保障信息高效無失真地傳輸。
關(guān)鍵詞:意圖識(shí)別; 態(tài)勢(shì)感知; 輔助決策; 強(qiáng)化學(xué)習(xí)
中圖分類號(hào):E96 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.19452/j.issn1007-5453.2024.08.011
基金項(xiàng)目: 航空科學(xué)基金(2018ZG81002)
高效的航空通信網(wǎng)絡(luò)系統(tǒng)既要精準(zhǔn)識(shí)別用戶的行動(dòng)意圖,又要實(shí)時(shí)感知網(wǎng)絡(luò)態(tài)勢(shì)情況,能夠迅速對(duì)路由策略調(diào)整,以保障信息傳輸?shù)臅r(shí)效性。孫鵬飛等[1]提出零樣本學(xué)習(xí)能力,能夠快速應(yīng)對(duì)場景中未知情況下的策略選擇。Niem?ller等[2]將用戶的高級(jí)意圖轉(zhuǎn)化為可執(zhí)行的網(wǎng)絡(luò)策略和配置,使網(wǎng)絡(luò)自動(dòng)化管理成為可能。本文所提出的路由策略系統(tǒng),通過結(jié)合意圖識(shí)別與態(tài)勢(shì)感知來驅(qū)動(dòng)路由策略的制定,從而生成更為完善和全面的決策方案。
在實(shí)際網(wǎng)絡(luò)環(huán)境中,態(tài)勢(shì)感知[3]被定義為對(duì)環(huán)境中實(shí)體的認(rèn)知、對(duì)其含義的理解以及對(duì)其未來狀態(tài)的預(yù)測(cè)。Endsley[4]在1995年將動(dòng)態(tài)系統(tǒng)中的態(tài)勢(shì)感知模型分為三個(gè)層面:感知層、理解層和預(yù)測(cè)層。在航空領(lǐng)域中,張耕強(qiáng)等[5]將軟件定義網(wǎng)絡(luò)(SDN)技術(shù)應(yīng)用在移動(dòng)自組織網(wǎng)絡(luò)中,通過SDN控制器感知網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)中可能發(fā)生的擁塞/中斷預(yù)先采取預(yù)防措施。Anicho等[6]在無人機(jī)網(wǎng)絡(luò)中利用態(tài)勢(shì)感知影響路由決策從而提高網(wǎng)絡(luò)資源的利用率。在航空數(shù)據(jù)鏈方面,Link16[7]能夠交換安全、抗干擾的通信,包括實(shí)時(shí)態(tài)勢(shì)感知數(shù)據(jù)以及命令和控制信息,有利于共享數(shù)字語音、數(shù)據(jù)、文本信息等?;谀:龑哟畏治龇ǖ腖ink16[8],利用態(tài)勢(shì)質(zhì)量評(píng)估模型,通過對(duì)近距離空中支援典型場景的模擬,驗(yàn)證了該方法的簡單性和有效性。通過上述分析,網(wǎng)絡(luò)態(tài)勢(shì)感知對(duì)航空通信網(wǎng)絡(luò)的安全性提供了保障?;诖?,本文利用收發(fā)數(shù)據(jù)包以感知獲取網(wǎng)絡(luò)中鏈路時(shí)延、帶寬、丟包率等網(wǎng)絡(luò)服務(wù)質(zhì)量(QoS)指標(biāo),為安全高效的決策提供依據(jù)。
意圖識(shí)別是場景態(tài)勢(shì)的綜合分析和場上情報(bào)信息的特征抽取,推斷出用戶可能采取的下一步行動(dòng)。Lee等[9]提出利用深度學(xué)習(xí)和人工智能技術(shù)實(shí)現(xiàn)敵我識(shí)別、威脅評(píng)估等,以支持快速而準(zhǔn)確的決策。王偉剛[10]從收集到的環(huán)境信息中進(jìn)行知識(shí)推理,讓指揮員了解網(wǎng)絡(luò)態(tài)勢(shì),再通過多種因素的篩選得到可實(shí)施的最優(yōu)方案。周揚(yáng)等[11]從環(huán)境、任務(wù)狀態(tài)等多方面的態(tài)勢(shì)感知,設(shè)計(jì)分布式智能保障系統(tǒng),利用智能化技術(shù)使系統(tǒng)具備學(xué)習(xí)、自動(dòng)推理、輔助決策等能力,提升航空裝備的運(yùn)維效率、可靠性和安全性?;谝陨戏治?,本文通過使用強(qiáng)化學(xué)習(xí)算法為端到端的網(wǎng)絡(luò)通信提供最佳路由,保障信息高效無失真地傳輸。
本文從以下三個(gè)方面展開研究:(1)設(shè)計(jì)融合用戶意圖識(shí)別、態(tài)勢(shì)感知和路由輔助決策的航空網(wǎng)絡(luò)系統(tǒng)架構(gòu);(2)設(shè)計(jì)基于深度學(xué)習(xí)的意圖識(shí)別模型;(3)研究基于強(qiáng)化學(xué)習(xí)的路由策略生成方法,快速形成備選決策方案。
1 系統(tǒng)架構(gòu)設(shè)計(jì)
本文介紹了一種新穎的航空網(wǎng)絡(luò)系統(tǒng)架構(gòu),包括意圖識(shí)別、態(tài)勢(shì)感知和路由輔助決策模塊。該架構(gòu)利用SDN控制器,增強(qiáng)了網(wǎng)絡(luò)靈活性、可編程性和集中控制,如圖1所示。意圖識(shí)別模塊對(duì)接入用戶的通信數(shù)據(jù)包進(jìn)行解析分類,不同接入用戶對(duì)通信網(wǎng)絡(luò)的服務(wù)質(zhì)量有不同的要求,以輔助決策模塊中策略的制定,驅(qū)動(dòng)網(wǎng)絡(luò)服務(wù)適應(yīng)不斷變化的需求。路由輔助決策模塊根據(jù)不同用戶的需求以及感知的網(wǎng)絡(luò)狀態(tài)信息,制定出符合用戶意圖的可執(zhí)行的策略,進(jìn)而通過流表處理模塊下發(fā)到物理網(wǎng)絡(luò)進(jìn)行具體實(shí)施。態(tài)勢(shì)感知模塊監(jiān)控并收集網(wǎng)絡(luò)上每個(gè)節(jié)點(diǎn)的資源使用情況以及網(wǎng)絡(luò)拓?fù)渥兓刃畔ⅲ⒏兄降男畔鬏斀o意圖識(shí)別模塊和路由輔助決策模塊,以確保系統(tǒng)中各模塊實(shí)時(shí)了解網(wǎng)絡(luò)狀態(tài)。
2 應(yīng)用場景及態(tài)勢(shì)感知方法
2.1 應(yīng)用場景
本文聚焦于航空通信網(wǎng)絡(luò)中,多型號(hào)和多部隊(duì)的聯(lián)合協(xié)作應(yīng)用場景。在此網(wǎng)絡(luò)中,地面支持設(shè)施(如地勤人員)被抽象為固定節(jié)點(diǎn);具有通信樞紐功能的空中指揮機(jī)和預(yù)警機(jī)等被視為機(jī)動(dòng)節(jié)點(diǎn);而執(zhí)行具體任務(wù)的殲擊機(jī)、強(qiáng)擊機(jī)等航空單位則被劃分為終端節(jié)點(diǎn)。網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)被簡化為如圖2所示,其中,骨干鏈路具有較高的帶寬,優(yōu)于支線鏈路。在時(shí)延設(shè)定上,為簡化仿真過程,終端與機(jī)動(dòng)節(jié)點(diǎn)間的鏈路時(shí)延不予考慮,而其他鏈路的時(shí)延則設(shè)定在0.5~8ms之間的隨機(jī)值。
2.2 網(wǎng)絡(luò)態(tài)勢(shì)感知模塊
網(wǎng)絡(luò)態(tài)勢(shì)感知模塊旨在通過SDN控制器處理上傳報(bào)文以進(jìn)行測(cè)量和網(wǎng)絡(luò)中相應(yīng)參數(shù)的計(jì)算,并將參數(shù)傳遞給網(wǎng)絡(luò)意圖識(shí)別模塊和路由輔助決策模塊,以支持更加精準(zhǔn)和高效的網(wǎng)絡(luò)管理與決策制定。態(tài)勢(shì)感知模塊主要采用Ryu控制器測(cè)量鏈路帶寬、鏈路時(shí)延、丟包率等參數(shù)。
(1)鏈路帶寬獲取
在Ryu控制器中,通過發(fā)送OFPT_STATS_REQUEST和OFPT_FEATURES_REQUEST請(qǐng)求統(tǒng)計(jì)信息,可以分別獲取交換機(jī)端口的流量統(tǒng)計(jì)和端口特征(如帶寬和工作方式),并記錄特定時(shí)間t1到t2的間隔的總字節(jié)數(shù)變化,其中,b1為t1時(shí)刻的總字節(jié)數(shù),b2為t2時(shí)刻的總字節(jié)數(shù),當(dāng)前時(shí)刻的流量帶寬記為Bt,其計(jì)算公式為
3 基于深度學(xué)習(xí)的意圖識(shí)別
在航空通信網(wǎng)絡(luò)場景下,意圖的精準(zhǔn)識(shí)別對(duì)策略制定是至關(guān)重要的,是影響獲勝的關(guān)鍵因素。意圖識(shí)別模塊主要是對(duì)接入用戶的身份識(shí)別。具體來說,意圖識(shí)別模塊通過解析接入用戶的通信數(shù)據(jù)包參數(shù)進(jìn)行解析分類。不同接入用戶對(duì)通信網(wǎng)絡(luò)有不同的要求。面對(duì)多層次意圖的識(shí)別,通過場景態(tài)勢(shì)特征識(shí)別出敵方意圖,形成局部敵方意圖概念集合,再對(duì)概念集合進(jìn)行分析抽象,完成對(duì)敵意圖精準(zhǔn)識(shí)別。該模塊實(shí)現(xiàn)流程如圖3所示。設(shè)計(jì)采用離線和在線相結(jié)合的方式來完成意圖的準(zhǔn)確剖析。離線數(shù)據(jù)訓(xùn)練可充分結(jié)合歷史數(shù)據(jù)信息做出準(zhǔn)確的識(shí)別,在線數(shù)據(jù)訓(xùn)練能更實(shí)時(shí)地反映當(dāng)前情況。
3.1 規(guī)則定義
網(wǎng)絡(luò)用戶根據(jù)其QoS需求被劃分為三個(gè)主要類別:WWW、FTP-DATA和MAIL。具體而言,WWW類別的用戶主要關(guān)注于實(shí)現(xiàn)低延遲,以優(yōu)化遠(yuǎn)程控制和交互式頁面加載的體驗(yàn);FTP-DATA類別的用戶則注重獲得高帶寬,以支持大量數(shù)據(jù)的快速傳輸;而MAIL類別的用戶對(duì)于時(shí)延和帶寬都有一定的要求,這對(duì)于視頻會(huì)議和直播等應(yīng)用尤為重要。此外,用戶角色通過{IP,級(jí)別,類型}的組合進(jìn)行定義,支持基于(級(jí)別,類型)的查詢以確定角色值。在代理訓(xùn)練的強(qiáng)化學(xué)習(xí)過程中,延遲、帶寬和丟包率的權(quán)重參數(shù)被用作相應(yīng)的獎(jiǎng)勵(lì)權(quán)重,以指導(dǎo)學(xué)習(xí)過程。
3.2 訪問控制
該模型以用戶類S(發(fā)送用戶)、用戶類D(接收用戶)以及任務(wù)為輸入,并讓角色集、權(quán)限集和任務(wù)集以數(shù)據(jù)庫形式錄入處理單元進(jìn)行處理。在此模型中,角色集與任務(wù)集和用戶類相關(guān)聯(lián),且最終的QoS需求與任務(wù)相關(guān)。用戶以IP地址輸入,匹配其對(duì)應(yīng)的角色種類和等級(jí),從而確定角色值。利用用戶S和用戶D的角色值,在權(quán)限表中確定權(quán)限,進(jìn)而在任務(wù)集中獲取相應(yīng)的任務(wù)列表。任務(wù)列表包括可執(zhí)行和不可執(zhí)行任務(wù),其中可執(zhí)行任務(wù)可以匹配相應(yīng)的QoS指標(biāo),而不可執(zhí)行任務(wù)則無法獲得該指標(biāo)。
3.3 特征提取
本模塊中,采用監(jiān)督學(xué)習(xí)算法利用網(wǎng)絡(luò)流量數(shù)據(jù)集對(duì)訪問用戶身份進(jìn)行分類。特征選擇遵循特定原則,以提高準(zhǔn)確性并降低訓(xùn)練復(fù)雜性。該原則包括選擇與用戶行為高度相關(guān)的特征,確保SDN網(wǎng)絡(luò)內(nèi)特征測(cè)量的簡便性以及優(yōu)先考慮從數(shù)據(jù)流初始階段提取的特征,避免依賴于全流程觀察851043ebc5d4d267103f6897996e5af6ceb83ec75e0daacf7532913da9cbed45。特征選擇在粗粒度和細(xì)粒度兩個(gè)層面上進(jìn)行。粗粒度選擇通過互熵和信息增益的比值來確定特征重要性系數(shù);細(xì)粒度選擇基于重要性閾值和互信息閾值的特征子集中進(jìn)行降維和冗余減少。
3.4 分類識(shí)別
該部分采用Tri-training算法對(duì)接入用戶5e0bd0a90252df7046be6b2964b45eed59b4a3adb03fdb73a81056a2ff31bc2b進(jìn)行分類。Tri-training是對(duì)Co-training算法的改進(jìn),使用三種不同的基分類器:決策樹、隨機(jī)森林和樸素貝葉斯。這些算法在網(wǎng)絡(luò)流量分類中表現(xiàn)出較高的準(zhǔn)確率。訓(xùn)練數(shù)據(jù)集包含少量有標(biāo)記的樣本和大量無標(biāo)記樣本。算法通過這些數(shù)據(jù)學(xué)習(xí)生成分類模型。在協(xié)同訓(xùn)練階段,通過基于分類器的測(cè)試誤差比較來評(píng)估未標(biāo)記樣本的標(biāo)記置信度。預(yù)測(cè)階段,通過集成所有成員分類器的決策來進(jìn)行用戶類別的輸出。
4 基于強(qiáng)化學(xué)習(xí)的路由策略生成
采用強(qiáng)化學(xué)習(xí)設(shè)計(jì)路由策略生成。該部分利用數(shù)據(jù)分析快速生成替代決策解決方案,增強(qiáng)人員的策略響應(yīng)能力。采用Dyna-Q算法[12],該算法在強(qiáng)化學(xué)習(xí)領(lǐng)域?qū)W(xué)習(xí)與規(guī)劃的過程巧妙結(jié)合。通過利用現(xiàn)實(shí)世界的經(jīng)驗(yàn)與模擬獲得的經(jīng)驗(yàn),使用Q-Learning來更新相同的價(jià)值函數(shù),從而實(shí)現(xiàn)對(duì)動(dòng)作選擇策略和動(dòng)作價(jià)值估計(jì)的系統(tǒng)性改進(jìn)。航空通信網(wǎng)絡(luò)中,通過強(qiáng)化學(xué)習(xí)尋找最佳路由時(shí),綜合考慮延遲、帶寬和丟包率等QoS指標(biāo)對(duì)于準(zhǔn)確的信息傳輸至關(guān)重要。
5 仿真與性能分析
5.1 網(wǎng)絡(luò)態(tài)勢(shì)感知仿真實(shí)現(xiàn)
仿真實(shí)現(xiàn)中,使用Mininet網(wǎng)絡(luò)仿真工具進(jìn)行網(wǎng)絡(luò)拓?fù)涞拇罱?,為每一個(gè)交換機(jī)添加一個(gè)主機(jī),使得拓?fù)淇梢阅M用戶從任何一個(gè)節(jié)點(diǎn)接入,并與任意一個(gè)節(jié)點(diǎn)進(jìn)行通信。網(wǎng)絡(luò)控制器采用Ryu控制器,通過與Mininet連接實(shí)現(xiàn)網(wǎng)絡(luò)拓?fù)淇梢暬?;并借助Ryu模塊化開發(fā)特性,實(shí)現(xiàn)對(duì)上文提到的網(wǎng)絡(luò)拓?fù)?、時(shí)延、丟包率和帶寬等參數(shù)的測(cè)量?;赗yu模塊化的開發(fā),使用Ryu-manager命令啟動(dòng)network_ awareness.py、network_delay_detector.py、network_monitor.py三個(gè)Ryu APP,分別獲取拓?fù)鋱D的連接情況、發(fā)送數(shù)據(jù)包的時(shí)延、收發(fā)速率、帶寬等信息。由于使用單臺(tái)計(jì)算機(jī)進(jìn)行仿真,因此只測(cè)量帶寬和時(shí)延,丟包率暫時(shí)不考慮。
5.2 QoS意圖識(shí)別模塊仿真實(shí)現(xiàn)
本部分旨在根據(jù)目標(biāo)和源報(bào)文特征分析網(wǎng)絡(luò)流類型,提供計(jì)算獎(jiǎng)勵(lì)函數(shù)的參數(shù)。輸入用戶為拓?fù)鋱D1號(hào)節(jié)點(diǎn),向14號(hào)節(jié)點(diǎn)發(fā)送若干數(shù)據(jù)包,同時(shí)采用Wireshark軟件進(jìn)行抓包分析。所得特征值見表1。將特征值送入分類器中,得到識(shí)別結(jié)果為WWW類別,得到最終的權(quán)重參數(shù)見表2。
5.3 路由輔助模塊仿真實(shí)現(xiàn)
該部分強(qiáng)化學(xué)習(xí)被用于在特定網(wǎng)絡(luò)拓?fù)洵h(huán)境下尋找最佳路由。采用了Q-learning和Dyna-Q-learning兩種強(qiáng)化學(xué)習(xí)方法進(jìn)行仿真,目的是從1號(hào)節(jié)點(diǎn)到14號(hào)節(jié)點(diǎn)傳輸/執(zhí)行。設(shè)置帶寬和時(shí)延的權(quán)重各為0.5,學(xué)習(xí)率為0.1,折扣率為0.1,以及最大迭代次數(shù)為100。通過不斷迭代,系統(tǒng)逐漸找到最優(yōu)路徑并保存在路徑列表中。在SDN環(huán)境下,通過編寫Ryu控制器腳本,實(shí)現(xiàn)了將強(qiáng)化學(xué)習(xí)與流表下發(fā)結(jié)合,從而在靜態(tài)拓?fù)渚W(wǎng)絡(luò)中選擇基于時(shí)延和帶寬的最佳路由。通過在Mininet上運(yùn)行自建拓?fù)洳⒉捎胮ing工具發(fā)包,實(shí)現(xiàn)在Ryu終端觀察到最佳路由。
5.4 仿真性能分析
(1)流量提取算法的選取
在選擇流量分類算法的過程中,常用的數(shù)據(jù)集是來自劍橋大學(xué)的Moore數(shù)據(jù)集,由249個(gè)流量統(tǒng)計(jì)特征組成。本文選擇數(shù)據(jù)覆蓋率較好的Data01數(shù)據(jù)集。它結(jié)合并選擇性地采樣流量統(tǒng)計(jì)特征來構(gòu)建Moore測(cè)試數(shù)據(jù)集。該數(shù)據(jù)集通過包含ATTACK、P2P、DATABASE、MULTIMEDIA和SERVICE類別的所有樣本以及從較大的WWW、MAIL、FTP類別中隨機(jī)抽樣來確保相對(duì)平衡。使用WEKA平臺(tái)中的各種算法進(jìn)行特征選擇,然后使用C4.5決策樹方法進(jìn)行建模和分類。WEKA是一款開源數(shù)據(jù)挖掘軟件,提供各種數(shù)據(jù)分析和建模工具。我們對(duì)比分析了6種方案,得到了不同方法下的建模時(shí)間和準(zhǔn)確率,見表3,CFS表示一種特征選擇方法;BF是一種搜索策略;IGA是交互式遺傳算法;GRA和RANKER均是特征選擇方法。
由表3分析可以看出,經(jīng)過特征選擇后各方案的整體準(zhǔn)確率較原始數(shù)據(jù)集都有大幅度提高,且建模時(shí)間大大減少。其中采用IGA+RANKER方案所選取的特征子集的整體準(zhǔn)確率最高,采用IGA+RANKER+CFS+BF方案所選取的特征子集的建模時(shí)間最少。IGA+RANKER方案比IGA+ RANKER+CFS+BF慢0.02s,準(zhǔn)確率增加了2.0901%。
(2)輔助決策模塊算法性能分析
為了比較所采用的強(qiáng)化學(xué)習(xí)方法與傳統(tǒng)路由算法的優(yōu)缺點(diǎn),本節(jié)試驗(yàn)中選取經(jīng)典的Yen’s算法,該算法屬于非強(qiáng)化學(xué)習(xí)方法,作為對(duì)比算法用強(qiáng)化學(xué)習(xí)方法與非強(qiáng)化學(xué)習(xí)方法在算法時(shí)延性能方面進(jìn)行對(duì)比分析。選取10組源節(jié)點(diǎn)和目的節(jié)點(diǎn),分別運(yùn)用強(qiáng)化學(xué)習(xí)算法和Yen’s算法尋找最佳路由,得到結(jié)果如圖4所示。其中x軸代表10組試驗(yàn)序號(hào),y軸為路徑端到端總時(shí)延。
圖4分析結(jié)果表示,強(qiáng)化學(xué)習(xí)算法得到的端到端時(shí)延在多數(shù)情況下明顯小于運(yùn)用Yen’s算法所得到的端到端時(shí)延,因此強(qiáng)化學(xué)習(xí)的性能明顯優(yōu)于Yen’s算法。
6 結(jié)束語
本文在航空通信網(wǎng)絡(luò)場景下,設(shè)計(jì)融合用戶意圖識(shí)別、網(wǎng)絡(luò)態(tài)勢(shì)感知和路由輔助決策三個(gè)模塊的航空通信網(wǎng)絡(luò)架構(gòu)。通過態(tài)勢(shì)感知獲取網(wǎng)絡(luò)中帶寬、時(shí)延和丟包率數(shù)據(jù);進(jìn)而引入深度學(xué)習(xí)采用離線和在線相結(jié)合的方法實(shí)現(xiàn)用戶分類識(shí)別;通過強(qiáng)化學(xué)習(xí)計(jì)算出最優(yōu)路由輔助策略,輔助增強(qiáng)指揮人員的決策能力。最后,仿真試驗(yàn)驗(yàn)證了引入智能方法給網(wǎng)絡(luò)帶來的性能增益,論證了本文所提出的航空通信網(wǎng)絡(luò)架構(gòu)的可行性和有效性。
參考文獻(xiàn)
[1]孫鵬飛, 歐陽亞文, 戴新宇, 等. 基于隱式網(wǎng)絡(luò)和顯式網(wǎng)絡(luò)相似性學(xué)習(xí)的零樣本意圖識(shí)別[J].中國科學(xué): 信息科學(xué), 2021, 51(11): 1853-1866. Sun Pengfei, OuYang Yawen, Dai Xinyu, et al. Similarity learning with implicit-network and explicit-network for zeroshot intent detection[J]. Scientia Sinica Informationis, 2021, 51(11):1853-1866. (in Chinese)
[2]Niem?ller J, Mokrushin L, Mohalik S K, et al. Cognitive processes for adaptive intent-based networking[J]. Ericsson Technology Review, 2020, 2020(11): 2-11.
[3]Munir A, Aved A, Blasch E. Situational awareness: techniques, challenges, and prospects[J]. AI, 2022, 3(1): 55-77.
[4]Endsley M R. Toward a theory of situation awareness in dynamic systems[J]. Human factors, 1995, 37(1): 32-64.
[5]張耕強(qiáng), 謝鈞, 楊章林. SDN在戰(zhàn)術(shù)MANET路由中的應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用, 2022, 31(4): 309-321. Zhang Gengqiang, Xie Jun, Yang Zhanglin. Application of SDN in tactical MANET routing[J]. Computer Systems & Applications, 2022, 31(4):309-321. (in Chinese)
[6]Anicho O, Charlesworth P B, Baicher G S, et al. Situation awareness and routing challenges in unmanned HAPS/UAV based communications networks[C].2020 International Confer‐ence on Unmanned Aircraft Systems (ICUAS). IEEE, 2020: 1175-1182.
[7]寧曉燕, 王影, 孫志國, 等. 多音干擾下Nakagami-m信道傳輸 Link16數(shù)據(jù)鏈的性能分析[J]. 系統(tǒng)工程與電子技術(shù), 2023, 45(2): 566-571. Ning Xiaoyan, Wang Ying, Sun Zhiguo, et al. Performance analysis of Nakagami-m channel transmission Link16 under multi-tone interference[J]. Systems Engineering and Electron‐ics, 2023, 45(2):566-571. (in Chinese)
[8]Chen L, Wang S, Zhao L. Confidence-based fuzzy assessment model of LINK16 situational quality[C]. International Conference on Computer Application and Information Security(ICCAIS 2022). SPIE, 2023.
[9]Lee C E, Baek J, Son J, et al. Deep AI military staff: Cooperative battlefield situation awareness for commander’s decision making[J]. The Journal of Supercomputing, 2023, 79(6): 6040-6069.
[10]王偉鋼. 戰(zhàn)場決策過程中輔助決策功能分析[J]. 航空科學(xué)技術(shù), 2017, 28(6):4-8. Wang Weigang. Function analysis for decision aid during the process of battlefield decision[J]. Aeronautical Science & Technology, 2017, 28(6):4-8. (in Chinese)
[11]周揚(yáng), 曾照洋, 周巖, 等. 航空裝備智能保障系統(tǒng)研究[J].航空科學(xué)技術(shù), 2020, 31(12):68-73. Zhou Yang, Zeng Zhaoyang, Zhou Yan, et al. Research on intel‐ligent support system of aviation equipment[J]. Aeronautical Science & Technology, 2020, 31(12):68-73. (in Chinese)
[12]李芃. SDN網(wǎng)絡(luò)中基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)資源分配研究[D]. 南京:東南大學(xué), 2018. Li Peng. Research on network resource allocation based on machine learning in software define network[D]. Nanjing: Southeast University, 2018. (in Chinese)
Intent Recognition and Situation Awareness Driven Routing Decision System
Huang Jiaorui1,Zhou Shan2, Yang Chungang1, Mi Xinru1
1. Xidian University, Xi’an 710071, China
2. People’s Liberation Army 93658, Beijing 102300, China
Abstract: Aerospace communication network service on-demand expansion, dynamic and changeable network environment, heterogeneous and diverse network objects and sharp increase in network interference intensity and style require communication command decision-making system with automaticity and intelligence. This paper constructs an intent recognition and situation awareness jointly driven routing strategy system to provide solutions for commanders, enhance the timeliness and accuracy of decision-making, and improve the adaptability of the system in complex environments. This system contains modules of network situation awareness, user intent recognition and routing assisted decision-making. The network situation awareness module analyzes the topology of the aerospace communication network, and uses sending and receiving packets to obtain network service quality indicators such as link delay, bandwidth, packet loss rate, etc.; the intent recognition module, based on the huge amount of aerospace communication data, utilizes machine learning algorithms to identify and classify aerospace units that have already accessed the network in real time based on the characteristics of their communication data, and gives the weights of the service of quality indicators that are needed for their communication network; the assisted decision-making module provides the most convenient and fastest aerospace communication network services for the purpose of utilizing the real-time data provided by the first two modules, using reinforcement learning algorithms to achieve optimal routing for end-to-end network communication, and guaranteeing efficient and no-distortion transmission of information.
Key Words: intent recognition; situation awareness; assisted decision-making; reinforcement learning