劉浩,王昊,孟光磊,吳昊,周銘哲
1. 航空工業(yè)沈陽飛機設計研究所,沈陽 110035
2. 沈陽航空航天大學 自動化學院,沈陽 110136
隨著現代信息化裝備的快速發(fā)展,空中軍事力量的地位和其在綜合國力中展現的作用越來越大。在現代空戰(zhàn)過程中,戰(zhàn)斗機常采用機動動作進行進攻或規(guī)避,飛行員執(zhí)行機動動作的能力將直接影響空戰(zhàn)結果。因此,對飛行員執(zhí)行機動動作的能力的訓練是非常有意義的。對飛行訓練進行客觀、系統(tǒng)和全面的評估不僅可以準確高效地找到飛行員急需提高的科目,有針對性的提升飛行員的飛行水平和作戰(zhàn)能力,還可以降低訓練成本、提高訓練效率。由此可見,深入分析戰(zhàn)斗機飛行訓練評估問題具有重要的軍事價值和實際意義。
目前,學者們提出了多種戰(zhàn)斗機飛行訓練評估方法,主要有:專家系統(tǒng)[1]、層次分析[2]、序關系分析[3]、模糊理論[4-8]、神經網絡[9-12]等。文獻[1]依據訓練大綱及飛行數據,采用專家系統(tǒng)評價法對飛行訓練進行評估,該系統(tǒng)能夠對評定的成績進行管理、保存、編輯、統(tǒng)計以及打印,操作方便,可快速準確地完成飛行訓練成績評定;文獻[2]在遵循真實性原則的前提下設計了評估指標體系結構,并在此基礎上開展了基于層次分析法的飛機模擬訓練評估;文獻[3]結合飛行員經驗及相關評價準則,確定了不同飛行階段下的飛行品質評估指標及指標對應的權重,從而對飛行參數成績進行加權,基于序關系分析法建立了飛行訓練成績評估數學模型,實現了對飛行品質的評分;文獻[4]采用模糊集方法來處理專家意見中的不確定性,通過多個模糊集對參數進行建模,可以評估不同情況下的操作風險;文獻[9]綜合了飛行員的心率、呼吸頻率和典型飛行參數對飛行品質的描述,建立了BP神經網絡模型,利用該模型可計算出各評估指標對最終評價分數的影響,對飛行訓練進行自動評分,結果合理性良好。文獻[11]提出了基于教員經驗打分和大量歷史數據的BP神經網絡,構建飛行訓練科目評估模型,通過分析模擬機飛行訓練品質評估系統(tǒng)的需求和性能指標,結合數字圖像處理、模式識別和人工神經網絡等技術,設計系統(tǒng)的整體結構。采集模擬機數據、處理并識別飛行參數以此來對飛行訓練品質進行評估。上述方法主要根據訓練大綱與飛行訓練數據開展訓練后的飛行品質評估,一方面,由于實際飛行訓練中的不確定性,缺少了對實時飛行訓練中機動動作的在線識別,未考慮對不同機型的飛行訓練評估的適應性。另一方面,傳統(tǒng)評估方法進行飛行訓練評估容易受主觀因素影響且評估效率較低。
針對戰(zhàn)斗機飛行訓練評估問題進行了深入研究,提出了基于動態(tài)貝葉斯網絡和模糊灰度理論的飛行訓練評估方法。首先,建立了基于動態(tài)貝葉斯的機動動作識別模型,通過飛行訓練過程中的飛行姿態(tài)信息和敵我雙方空間占位信息等數據,利用動態(tài)貝葉斯網絡推理算法實現機動動作的識別。然后,建立飛行訓練評估指標體系,根據機動識別結果選擇飛行訓練評估指標,并確定了指標權重。最后,根據評估指標數據采用灰度模糊算法對本次訓練的飛行品質進行評估,得到評估結果。飛行訓練評估系統(tǒng)架構如圖1所示。
圖1 飛行訓練評估系統(tǒng)架構圖Fig.1 Structure diagram of flight training evaluation system
在戰(zhàn)斗機飛行訓練中,準確地識別機動動作是評估飛行員操縱能力的關鍵前提。動態(tài)貝葉斯網絡不僅能夠對不確定因素進行推理,還能描述動態(tài)飛行參數數據的演變過程。同時,動態(tài)貝葉斯網絡在進行機動動作識別的過程中結合了歷史信息和實時數據,更為符合客觀事物的發(fā)展規(guī)律[13-15]。因此,提出了一種采用動態(tài)貝葉斯網絡來識別機動動作的方法。
戰(zhàn)斗機飛行過程中伴隨著各種參數的變化,包括飛行高度、飛行速度、俯仰角、滾轉角、航向角、迎角和側滑角等[16]。因此,在對機動動作識別的過程中,可以通過深入分析機動動作的飛行參數變化特征來描述不同的機動動作。
同時,在對飛行參數進行選擇時應選取對識別結果影響最大的飛行參數作為目標機動動作識別的基本特征,分別為速度、偏航角、偏航角變化率、高度和高度變化率。在此基礎上結合某型戰(zhàn)斗機的實際飛行數據對13種機動動作的飛行參數進行綜合分析,總結出了飛行參數與定性描述的變化特征之間的一一對應關系,如表1所示。
表1 機動動作參數變化特征
基于動態(tài)貝葉斯的機動動作識別網絡模型結構由觀測節(jié)點、中間節(jié)點和輸出節(jié)點組成。將選定的機動動作特征作為模型的觀測節(jié)點,即模型的輸入節(jié)點。再根據飛行參數的變化特征與各機動動作的因果關系,對機動動作狀態(tài)進行逐層劃分并作為模型的中間節(jié)點。最后輸出節(jié)點的推理結果為機動動作識別概率值。同時,模型的節(jié)點在時間上也有相互聯系。各層的節(jié)點會結合前一時刻的識別概率值與當前時刻的輸入信息更新節(jié)點處的概率。機動動作識別網絡模型結構如圖2所示[16]。
圖2 機動動作識別網絡模型[16]Fig.2 Maneuver identification network model[16]
機動動作識別網絡模型共分為4層,分別為高度層、航向層、速度層以及決策層。第1層高度層根據飛行高度和飛行高度變化率參數的變化特征劃分典型機動動作;第2層航向層加入航向角和航向角變化率參數的變化特征,在高度層劃分的基礎上進一步將典型機動動作劃分為直線類機動動作和其他類機動動作;第3層速度層加入飛行速度參數的變化特征,繼續(xù)對直線類機動動作進行劃分;最后,第4層決策層推理出各機動動作的識別概率值并選取概率值最大的機動動作為識別結果。其中,網絡模型中各節(jié)點的狀態(tài)集如表2所示。
表2 節(jié)點狀態(tài)集定義
在機動動作識別網絡模型中,每條鏈路中節(jié)點之間的因果關系是通過設置條件概率表來描述的。在沒有對網絡參數進行學習時,節(jié)點處的初始條件概率由先驗知識定義,在此條件下采用鏈式網絡推理算法,根據確定的網絡結構和觀測信息不斷對網絡參數進行學習。在學習的過程中,網絡參數將不斷優(yōu)化并逐漸與客觀評估規(guī)律一致,從而得到貼近客觀數據的識別結果。以高度層識別結果節(jié)點為例,其條件概率表(Condition Probability Table,CPT)如表3所示。
表3 高度層識別結果CPT
機動動作識別網絡模型的推理過程分為4個步驟:
步驟1:根據當前時刻觀測信息et,計算機動動作識別概率。由當前時刻觀測節(jié)點的特征提取結果和各條鏈路的條件概率完成各觀測節(jié)點到根節(jié)點的推理,再將所有鏈路推理結果相乘得到當前時刻的識別概率分布:
p(Mrt|et)=
p(Mrt|ALTt,ALRt,YAWt,YARt,VKt)=
p(Mrt|ALTt)p(Mrt|ALRt)p(Mrt|YAWt)
p(Mrt|YARt)p(Mrt|VKt)
(1)
步驟2:根據上一時刻推理結果,更新機動動作識別概率。當前觀測信息下的鏈路推理結果與上一時刻的識別結果共同影響機動動作的最終識別結果。根據貝葉斯公式,可求解條件概率分布:
p(et|Mrt)=
(2)
根據上述計算結果,可得到綜合歷史證據信息的機動動作識別概率分布:
(3)
步驟3:判斷收斂性。當網絡處于收斂狀態(tài)或超過最大迭代次數時,不再進行迭代,否則繼續(xù)進行網絡推理。
步驟4:確定識別結果。選擇計算概率最大的機動動作為當前時刻的識別結果。
為了保證建立的評價指標體系具有科學、準確及實用等良好特性,飛行訓練評價指標的篩選過程應該滿足下述原則。
1) 系統(tǒng)性原則:評價指標體系需具有充分體現出評價對象在各個方面的特性,即能夠對飛行品質的全過程進行有效描述。
2) 科學性原則:確定的評價指標元素能夠科學地反映出飛行品質的情況,建立的評價體系結構合理,使用方法原理科學。
3) 可比性原則:選取的各個指標對于評價對象是能夠公平對比的,對于最終評價結果是沒有主觀傾向性的。
4) 實用性原則:選取的評價指標可通過測量或其他手段直接獲得,且具有簡單、實用、可操作性等優(yōu)點。
根據評價指標篩選原則,綜合分析影響典型機動動作執(zhí)行標準的因素,依據飛行大綱訓練要求和領域專家的資深經驗,構建所有機動動作的評估指標體系如表4所示。
表4 機動動作評估指標體系
將選定的機動動作評估指標劃分成5個評估等級,分別為優(yōu)秀、良好、中等、較差和差。同時給出評價等級的量化標準:優(yōu)秀的量化標準為(95,100],良好的量化標準為(85,95],中等的量化標準為(75,85],較差的量化標準為(65,75],差的量化標準為(0,65]。以左盤旋機動動作為例,其評估等級劃分原則如表5所示。
表5 左盤旋動作評估等級劃分原則
評估指標的權重反映了各指標因素對機動動作的影響程度,直接影響評估結果。目前權重的確定方法有主觀賦權法、客觀賦權法以及融合了主、客觀賦權法的綜合賦權法[17-18]。采用綜合賦權法計算評估指標權重。首先,根據機動動作識別模型推理的識別結果在戰(zhàn)斗機飛行訓練評估指標體系中確定其對應的評估指標。采用層次分析法根據專家經驗計算主觀權重,同時采用熵值法根據實際飛行數據計算客觀權重,最后用線性組合的方式得到最終的綜合權重。這樣既可以融合專家的主觀知識經驗,又可以體現出數據表達的客觀性。
2.2.1 確定主觀權重
采用定量與定性分析相結合的層次分析法確定各指標對改變機動動作評價結果的影響程度,即判定指標的重要程度。以左盤旋為例,其飛行訓練評估指標的判斷矩陣如表6所示。
表6 左盤旋評估指標判斷矩陣
若構建的判斷矩陣通過一致性檢驗,則求解判斷矩陣并進行歸一化處理,得到左盤旋機動動作評價指標的主觀權重向量P=[p1,p2,…,pm]。
2.2.2 確定客觀權重
熵權法是一種根據各項指標評價值所提供的信息的大小來確定指標權重的客觀方法。信息的大小由熵來度量,信息量越大,不確定性就越小,熵也就越?。恍畔⒘吭叫?,不確定性就越大,熵也就越大。根據這個特性,就可以利用熵值來判斷某個評價指標的離散程度,從而得到該指標對最終評價結果的影響[19]。例如當樣本數據在某指標下取值相同,則表示該指標的離散程度極小,對最終評價結果的影響為0,所以該指標的權值為0。
熵值法的主要計算過程:首先根據戰(zhàn)斗機飛行訓練評估等級劃分原則,結合多次飛行訓練的評估指標參數得到原始數據。其次,通過對原始數據進行標準化處理來克服不同目標量綱和量級上的差異。標準化數據的方法為
(4)
式中:i∈[1,n],j∈[1,m],i為針對某機動動作的訓練樣本,j為評價指標,n針對某機動動作的訓練樣本數,m為評估指標的個數,Dij為原始數據,Fij為標準化數據,Dijmax和Dijmin分別為評估指標j原始數據中的最大值和最小值。
通過標準化的數據就可以計算出每個評價指標的熵值:
(5)
最后,通過所有評價指標的熵值計算得到機動動作評價指標的客觀權重Q=[q1,q2,…,qm]:
(6)
2.2.3 確定最終指標權重
為了降低主客觀賦權法各自缺點對指標權重確定的影響,采用線性組合賦權法對主觀權重向量和客觀權重向量加權處理,確定最終的指標權重向量:
C=[c1,c2,…cm]=k1×P+k2×Q
(7)
目前,飛行員訓練評估的方法主要是根據教練員的經驗簡單地將評估結果劃分為“及格”或“不及格”,很難反映出飛行員具體的能力水平。同時,由于飛行參數數據不可避免的存在信息不完備、不全面、不充分的情況,因此,采用將模糊數學的隸屬度理論與灰度理論結合的方式來解決飛行訓練評估中不確定性問題[20-23]。
灰色模糊評價算法中的權重集表示的是各指標因素與被評估對象之間的灰色模糊關系,包括模糊和灰色兩部分,可以表示為
(8)
表7 灰度打分標準
考慮到評估時應具備精確性和可操作性的特點,所以為評價集合的每一等級設置了對應的數值范圍組成評語集,即:V0={100,90,80,70,60}。
為了體現包含m個指標因素的因素集合與包含5個評判等級的評語集合之間的模糊和灰色關系,建立了模糊灰度評估矩陣[27]:
(9)
式中:R1為模糊部分,表示各評估指標隸屬于各等級的隸屬度,其元素為μij;R2為灰色部分,表示專家對于隸屬度信息的充分性給出的對應灰度值,其元素為φij。模糊灰度評估矩陣元素的模糊部分通過構建隸屬度函數的方式確定,灰度部分由專家投票打分的方式確定。
3.2.1 確定隸屬度函數
根據隸屬度函數理論,依據評估指標體系中的準則確定隸屬度函數。以各評價指標的偏差值x為基礎,其對應的隸屬度即為評估矩陣的模糊部分。根據對應評價等級劃分的極值點確定了5個特征點ΔDi,i=1,2,…,5。
(10)
μ2(x)=
(11)
μ3(x)=
(12)
μ4(x)=
(13)
(14)
建立的隸屬函數模型如圖3所示。
圖3 隸屬度函數模型Fig.3 Membership function model
3.2.2 確定灰度
模糊灰度評估矩陣中的各指標的評分灰度值φij,是根據統(tǒng)計專家的評分得到的。具體的實現方法是:N位專家依照打分標準分別對影響機動動作的指標因素進行灰度值評分。同時,為了降低專家主觀因素對結果的影響,在統(tǒng)計的過程中將去掉最大值和最小值后求取平均數作為最終灰度值。
(15)
(16)
令dj=1-vj,表示對于隸屬度的可信度。再與評語集向量對應的分數V0相乘就可以得到機動動作執(zhí)行評估結果:
(17)
為驗證戰(zhàn)斗機飛行訓練評估方法的有效性,進行了仿真實驗。將戰(zhàn)斗機的實時飛行參數進行特征提取、離散化處理后,傳遞給動態(tài)貝葉斯網絡模型,推理得到機動動作識別結果,根據機動動作識別結果選擇評估指標,采用模糊灰度評估方法計算得到飛行訓練品質評估結果。通過模擬一組機動動作進行自主飛行訓練評估的準確性及可行性分析。具體仿真飛行軌跡如圖4所示。
圖4 飛行訓練仿真軌跡Fig.4 Trajectory of flight training simulation
在戰(zhàn)斗機飛行訓練的初期,高度、高度變化率、航向角變化率和速度的變化特征為不變,航向角的變化特征為減小,此時經過模型識別出機動動作為左盤旋;當飛行訓練到第23.80 s時,高度、航向角和速度的變化特征更新,模型的識別結果為急躍升;至第37.50 s,高度、航向角和速度變化特征再一次更新,得到模型的識別結果左盤旋;至第53.95 s,除航向角變化率外的其他飛行參數的變化特征均進行了更新,更新模型的識別結果為俯沖;至第63.75 s,除速度以外的其他飛行參數的變化特征再一次進行更新,識別結果為“S”形急轉機動動作。識別過程中具體的特征提取情況如圖5所示。
圖5 識別過程特征提取結果Fig.5 Feature extraction results of recognition process
飛行訓練過程中識別機動動作的概率變化如圖6所示。為了更明顯的看出識別概率的變化,在23.80、37.50、53.95、63.75 s處,即飛行參數的變化特征更新時,坐標軸單位長度為1 s;在機動動作識別概率達到90%后,將坐標軸單位長度改為10 s,直至下一次飛行參數的變化特征進行更新。其中,圖6的機動動作編號對應表1中眼鏡蛇機動動作。
圖6 機動動作識別概率Fig.6 Maneuver recognition probability
由機動動作識別概率結果可知,在飛行訓練過程中,戰(zhàn)斗機先后進行左盤旋、急躍升、左盤旋、俯沖、“S”形急轉,機動動作識別結果如表8所示。
表8 機動動作識別結果
利用蒙特卡羅模擬實驗[28-30]對機動庫中的機動動作進行隨機調用。對6 000組實驗數據進行識別,實驗結果表明,本文方法對機動動作平均的識別率為97.2%,超過平均水平。
根據飛行訓練采集到的滾轉角、飛行高度和飛行速度的實驗數據,結合左盤旋機動動作評估等級劃分原則,對滾轉角、飛行高度以及飛行速度進行分析得到評估原始數據。在進行數據標準化處理時,所有評估指標均為正向指標。標準化處理結果如表9所示。
表9 評價指標的標準化數據
根據熵值計算公式可計算出滾轉角、飛行高度以及飛行速度的熵值G={0.880,0.628,0.448}。最終利用各評估指標熵值得到客觀權重向量為Q={0.529,0.356,0.115}。得到左盤旋機動動作的主、客觀權重后,采用線性組合賦權公式對主客觀權重進行加權處理,同時將k1和k2的取值均設定為0.5,從而得到最終指標權重向量C={0.544 5,0.338,0.117 5}。
按照構建的左盤旋機動動作評估指標隸屬度函數,對灰色模糊評估矩陣的模糊部分進行取值,得到飛行高度指標的優(yōu)秀隸屬度為1,其他評估等級隸屬度為0;飛行速度的中等隸屬度為0.61,良好隸屬度為0.39,其他評估等級隸屬度為0;滾轉角優(yōu)秀隸屬度為0.55,良好隸屬度為0.45,其他評估等級隸屬度為0。
以“滾轉角”指標因素為例,8位專家對模糊評估矩陣中隸屬度充分性的打分情況具體如表10所示。
表10 滾轉角評估隸屬度專家灰度打分
將專家對每一等級的灰度打分去掉最高分和最低分后取平均值,作為灰色模糊評估矩陣中的灰度部分。確定模糊部分和灰度部分的取值后得到本次左盤旋機動動作訓練的灰色模糊評估矩陣為
按照評估等級劃分的分數范圍標準,得到最終評價分數為93.6。同理可得,急躍升、第二次左盤旋、俯沖和“S”形急轉的評估得分依次為90.1、 87.8、90.9和81.2。具體評價分值顯示如圖7所示。
圖7 機動動作評估結果Fig.7 Maneuver evaluation results
1) 提出的戰(zhàn)斗機飛行訓練評估方法能夠實時根據飛行過程中的飛行參數、空間占位等信息的變化,對飛行訓練任務執(zhí)行情況進行在線的智能化識別與評估,減少了教練員的工作量,提高了飛行訓練評估效率。
2) 提出的算法對機動動作具有較高的識別率。在大樣本實驗測試中,對表1中機動動作的識別準確率均達到95%以上。
3) 針對自主飛行訓練評估問題,提出了一種基于灰色模糊理論的評估方法。通過指標數據偏差的隸屬度函數構建和專家灰度打分確定了當前飛行訓練下各指標的模糊評價與信度,實現了對戰(zhàn)斗機自主訓練下的機動動作執(zhí)行情況進行評估,解決了傳統(tǒng)由教練員主觀評價容易受主觀因素影響的問題,具有實際工程應用價值。
4) 提出的戰(zhàn)斗機飛行訓練評估方法具有較好的泛化能力,經過適應性修改,可為其他機型的飛行訓練評估提供有益參考,值得推廣。