林圣琳 李偉 楊明 馬萍
目前建模與仿真技術已成為人們認識和改造現(xiàn)實世界的重要手段.由于仿真是一種基于模型的活動,仿真模型是否可信成為用戶十分關注的問題.驗證是仿真模型可信度評估的重要步驟[1],包含概念模型驗證和結果驗證.仿真結果驗證最直接而有效的方法是,在相同輸入條件下度量仿真輸出與參考輸出數(shù)據(jù)之間的一致性程度.然而,針對復雜系統(tǒng)建立的仿真模型往往具有不確定性、多元異類(動、靜態(tài))輸出,且各輸出變量間可能存在相關性,此時,若仍采用傳統(tǒng)仿真結果驗證方法將導致驗證結果不準確.因此,考慮相關性及不確定性的多元輸出仿真結果驗證是需要重點研究的問題.
由于仿真模型和參考系統(tǒng)的輸入及模型參數(shù)通常含有不確定性,加之仿真模型運行和實際實驗過程中引入的不確定性因素和誤差,導致仿真模型和參考系統(tǒng)的輸出為隨機變量或不確定的時間序列[2].考慮不確定性的影響,靜態(tài)輸出結果驗證方法的研究多數(shù)集中在概率框架,形成了以參數(shù)估計[3?5]、假設檢驗[6?7]、貝葉斯因子[8?10]、證據(jù)距離[11]、概率分布差異法[12?13]為代表的5 種解決方案.其中,Oberkampf 等針對參考數(shù)據(jù)稀疏的情況,采用插值和回歸分析的方法估計參考輸出的均值和標準差,并與仿真輸出的相應統(tǒng)計量進行對比,得到置信區(qū)間形式的驗證結果[5];同時,假設檢驗和貝葉斯因子方法在靜態(tài)仿真輸出結果驗證中的應用日趨完善,Jiang 等將貝葉斯區(qū)間假設檢驗應用于模型的分等級評估中[14];考慮到固有和認知不確定性的影響,文獻[11]采用證據(jù)理論對動靜態(tài)輸出進行描述,并引入證據(jù)距離度量仿真和參考輸出的一致性;Ferson等提出了概率分布差異與u-pooling 相結合的方法,用于處理稀疏參考數(shù)據(jù)情況下的單輸出仿真結果驗證問題[12],該方法以其原理簡單、可操作性強等優(yōu)點得到了廣泛應用.
考慮不確定性的同時,復雜仿真模型可能存在多個輸出變量的情況,且各變量間可能存在函數(shù)或相關關系.在單變量靜態(tài)輸出結果驗證方法的基礎上,針對多元輸出仿真結果驗證方法的研究取得了一定的進展.例如,Rebba 等最先提出了假設檢驗、貝葉斯因子與協(xié)方差相結合的多元輸出結果驗證方法,并引入了非正態(tài)驗證數(shù)據(jù)轉化為正態(tài)數(shù)據(jù)的方法以滿足假設檢驗的條件[15];Jiang 等將區(qū)間貝葉斯因子方法進行推廣,將其應用至多元靜態(tài)輸出結果驗證問題中[16];Zhan 等提出了基于概率主成分分析(Probabilistic principal component analysis,PPCA)與貝葉斯因子相結合的方法,用于解決帶有不確定性和相關性的多元動態(tài)輸出結果驗證問題[17].同時,Li 等將概率積分變換(Probability integral transformation,PIT)與概率分布差異法相結合,將多變量累積概率分布轉化為單變量概率分布的形式,采用概率分布差異法計算仿真和參考輸出累積概率分布的差異[18];Zhao 等分別計算仿真和參考輸出與相應總體分布的馬氏距離,進而得到仿真和參考輸出馬氏距離的累積概率分布,并應用概率分布差異法計算兩者的差異[19].
從單變量驗證到多變量驗證,各變量間的關系是研究的重點,現(xiàn)有驗證方法存在驗證結果不夠準確和全面的問題.利用傳統(tǒng)單變量驗證(或結合多種預處理方法)對各變量進行分別驗證再綜合,一是對帶有相關性的多個驗證結果進行加權綜合導致最終驗證結果不夠準確;二是未考慮多變量間相關性的驗證將導致驗證結果不全面.此外,對復雜仿真模型進行結果驗證,其輸出變量間的關系不夠明確.此時需首先明確輸出變量間的關系(獨立/函數(shù)/相關關系)再進行驗證,現(xiàn)有的多變量驗證方法僅適用于變量間關系已知的情況.同時,多變量驗證方法均利用協(xié)方差矩陣度量變量間的相關性,這對非線性等其他相關關系將不再適用,導致多變量間相關性度量不夠準確.
為解決上述問題,提出基于變量選擇和概率分布差異相結合的多元輸出仿真結果驗證方法,對具有不確定性的多元異類輸出進行聯(lián)合驗證.第1 節(jié)對多元輸出結果驗證問題進行描述與分析,指出現(xiàn)有方法存在的問題;第2 節(jié)給出多元靜、動態(tài)輸出的相關性分析及變量選擇方法;第3 節(jié)提出基于數(shù)據(jù)特征提取和聯(lián)合概率分布差異的多元輸出仿真結果驗證方法;第4 節(jié)給出應用實例與對比實驗結果;第5 節(jié)給出本文結論.
用S表示系統(tǒng),Ss和Sr分別表示仿真模型和參考系統(tǒng),用As={as1,as2,···,asp}和Ar={ar1,ar2,···,arp}分別表示仿真模型和參考系統(tǒng)的輸入變量集,p為輸入變量個數(shù),Ys={ys1,ys2,···,ysm}和Yr={yr1,yr2,···,yrm}分別表示仿真模型和參考系統(tǒng)的輸出變量集,m為輸出變量個數(shù),多元異類輸出集Ys、Yr中的靜態(tài)輸出表示為隨機變量,動態(tài)輸出表示為多個時間序列集合的形式.假設ysi、ysj分別為仿真模型的某一動態(tài)和靜態(tài)輸出,則有
式中,i,j ∈[1,m],且=j;N為時間序列的長度;t1,t2,···,tN表示時間序列的時刻點;考慮不確定性的影響,需要進行多次仿真和實際實驗,n為重復實驗次數(shù).用C(Ys,Yr)表示在As=Ar時,Ys相對于Yr的一致性程度,且C(Ys,Yr)∈(0,1].當Ys與Yr完全一致,則有C(Ys,Yr)=1;當Ys相對于Yr的一致性程度越差,表示仿真模型越不可信,則有C(Ys,Yr)→0[1].
假設YsJ ∈Rns×m與YrJ ∈Rnr×m為多元仿真模型和參考系統(tǒng)的靜態(tài)輸出變量,ns、nr表示仿真和實際實驗的重復運行次數(shù).針對帶有相關性的多元靜態(tài)輸出結果驗證方法主要有:
1)基于假設檢驗和馬氏距離相結合的方法.文獻[16]給出基于似然比檢驗和馬氏距離相結合的驗證方法,得到最終一致性結果.
2)基于主成分分析的方法[17].對YsJ和YrJ進行降維,去除變量間相關性,得到新的輸出變量和,η ≤m為主成分的個數(shù),而后采用現(xiàn)有靜態(tài)輸出驗證方法對若干主成分進行逐一驗證并綜合得到最終驗證結果.
3)基于概率分布差異的方法[18].分別計算m維YsJ和YrJ的聯(lián)合累積概率分布(Cumulative distribution function,CDF)函數(shù)并作差,獲得仿真和參考輸出數(shù)據(jù)的差異,得到[0,+∞)的誤差度量結果.
針對帶有相關性的多元動態(tài)輸出結果驗證問題,常用方法為基于數(shù)據(jù)特征和主成分分析相結合的方法[17].首先分別提取動態(tài)輸出數(shù)據(jù)的特征矩陣,而后采用基于主成分分析的多元靜態(tài)輸出驗證方法獲得最終驗證結果.針對上述多元輸出仿真結果驗證方法進行分析,存在以下問題需要進一步研究:
1)復雜仿真模型常存在多元輸出變量間的相關或獨立關系未知的情況,目前方法均是在變量關系已知的前提下進行研究,存在一定局限性;
2)利用主成分分析獲取的多元輸出變量的主成分是線性變換后的結果,被提取主成分所代表的變量含義不夠明確,同時對多元輸出變量進行降維將導致驗證信息丟失,使驗證結果不夠準確和全面;
3)采用協(xié)方差矩陣度量變量相關性,需假設變量樣本服從正態(tài)分布,且僅能描述多元輸出變量間的線性關系,無法度量變量間非線性等其他相關關系,進而導致變量間相關性度量不準確;
4)基于聯(lián)合概率分布差異法可直接度量多元靜態(tài)輸出變量間的差異,需要已知變量間的獨立或相關關系,同時,處理多元動態(tài)輸出存在局限,得到的差異度量結果無法刻畫仿真模型的可信度.
為解決上述問題,可采用基于變量選擇和概率分布差異相結合的多元輸出仿真結果驗證方法,考慮不確定性的影響,對選取到具有相關性的多變量進行聯(lián)合驗證.首先,引入變量選擇方法分別對Ys、Yr進行相關性分析,提取相關變量子集(又稱相關變量組,子集中各變量是相關的,各子集中變量數(shù)的和為輸出變量總數(shù)),進而得到多個獨立的變量子集;同時,提取相同變量子集中多變量的數(shù)據(jù)特征,對于靜態(tài)輸出選取數(shù)據(jù)本身作為變量特征,對于動態(tài)輸出選取距離、形狀以及頻譜特征;而后計算變量子集中多個變量關于某特征的聯(lián)合CDF 差異,并將其轉化為可信度;最后將多個變量子集關于若干數(shù)據(jù)特征的一致性與多個動態(tài)輸出均值曲線的一致性進行綜合得到仿真模型可信度.
為明確復雜仿真模型中多元輸出變量間的獨立或相關關系,引入數(shù)據(jù)挖掘領域的相應方法對多變量進行相關性分析,進而提取相關變量子集.本文僅考慮同種類型(靜態(tài)或動態(tài))輸出變量間的相關性,利用分形維數(shù)和互信息方法分別對靜、動態(tài)輸出變量進行相關性分析.
對隨機變量的相關性分析集中于Pearson 相關系數(shù),它僅能度量變量的線性關系,并對變量間強相關性較敏感,其結果受奇異值的影響較大,無法適應具有非線性、不確定性以及非正態(tài)分布的數(shù)據(jù)集.其他一些相關系數(shù),如Kendall 系數(shù)、Spearman系數(shù)等雖可以描述非線性相關關系,但卻不能完整地刻畫變量間的相關性結構.此外,數(shù)據(jù)挖掘領域常用的變量選擇方法,如奇異值分解法(Singular value decomposition,SVD)、主成分分析法(Principal component analysis,PCA)、基于神經網(wǎng)絡的方法(Neural networks,NN)、基于k-鄰近方法(K-nearest neighbor,KNN)、基于決策樹的方法(Decision tree,DT)、基于貝葉斯網(wǎng)絡的方法(Bayesian network,BN)以及基于分形維數(shù)的方法(Fractal dimension,FD)等,具有不同的特點,對其進行對比分析如表1 所示.
由表1 可知,SVD 和PCA 方法得到的變量子集失去了其原有的含義,且只能對具有線性相關性的變量集進行分析;而基于機器學習的方法需要訓練樣本集作為支撐,其運行速度受到變量個數(shù)的影響較大,導致變量個數(shù)較多時運行速度較慢;而基于分形維數(shù)的方法不僅能夠度量線性相關性,還能度量非線性等其他相關關系,具有不需要訓練樣本集和運行速度快等優(yōu)點.因此,本文引入基于分形維數(shù)[20]的方法對多元輸出變量進行分析,提取相關變量子集.假設YsJ、YrJ為仿真和參考多元靜態(tài)輸出變量集,以為例給出YsJ的相關變量子集提取步驟如下.
步驟1.根據(jù)自相似性原理計算的局部固有維度pD(·):
表1 常用變量選擇方法對比Table 1 Comparison of general variable selection methods
式中,r表示將劃分成2υ個相等大小區(qū)間的長度,υ為劃分深度,表示中落入第i個區(qū)間的樣本個數(shù);
步驟2.設c=1,移除YsJ中的變量,ξ為預定義的固有維度閾值,排除的變量為獨立變量,并按照pD(·)大小將進行降序排列,形成新變量集其變量個數(shù)為;
步驟3.計算直到
步驟4.若,則算法結束;
步驟5.設相關性變量超集并提取ξSGc中的相關變量子集ξGc和相關變量基ξBc,具體算法見文獻[20],并設循環(huán)變量j=k+1;
步驟6.若,則執(zhí)行下一步,否則轉至步驟8;
步 驟 7.對于ξBc中的每個變量,若同時成立,則將加入ξGc;
步驟8.執(zhí)行j ←j+1,若,則轉至下一步,否則轉至步驟6;
步驟9.移除中ξGc ?ξBc的變量,并輸出相關變量子集ξGc和相關變量基ξBc;
步驟10.執(zhí)行c ←c+1,并轉至步驟3.
通過上述步驟提取YsJ和YrJ的相關變量子集如下.
式中,βs、βr分別為提取YsJ和YrJ相關變量子集的個數(shù),msi、mrj分別為中變量的個數(shù),且有ms1+ms2+···+msi=mr1+mr2+···+mrj=m.
與隨機變量不同,多元動態(tài)輸出變量與時間有關,其相關性分析與變量選擇需從時間序列整體的角度進行分析.一些傳統(tǒng)的隨機變量相關性分析方法對于多元動態(tài)變量同樣適用,例如Pearson 系數(shù)、Kendall 系數(shù)、Spearman 系數(shù)等,但無法用于動態(tài)輸出變量具有多個樣本(時間序列)的情況.此外,一些統(tǒng)計學分析方法,如Granger 因果關系分析[21]、典型相關分析[22]、Copula 分析[23]、灰色關聯(lián)分析[24]以及互信息分析[25]等同樣能夠用于多變量的相關性分析.Granger 因果關系分析只能定性地分析變量間的因果關系,而無法得到定量的結果;典型相關分析對觀測值的順序不會做出響應,因此無法解決時間序列問題;Copula 分析需要建立在對邊緣分布的合理假設之上,使其應用受到限制;灰色關聯(lián)分析僅從形狀相關性的角度對時間序列進行分析,其相關性度量不夠全面.
基于互信息的相關性分析方法能夠度量動態(tài)輸出變量間任意類型的關系,互信息以信息熵為理論基礎,它能夠度量變量取值的不確定性程度,進而描述變量的信息含量大小[26],通常用于多種類型時間序列的特征提取和結構化預測[27].然而,互信息同樣存在不能完整刻畫變量集相關性結構的缺點,因此本文引入類可分性和變量可分性提取多元動態(tài)輸出的相關變量子集[28].假設YsD、YrD為仿真和參考多元動態(tài)輸出變量集,同樣以YsD為例,給出變量選擇步驟如下.
步驟1.計算YsD的m×m維互信息矩陣,具體算法見文獻[26];
步驟2.分別計算每一維變量的類間離散度?bi和類內離散度?wi:
式中,Csam為樣本類別總數(shù),qi為屬于第i類的樣本個數(shù),按照每個變量的類可分離性大小,進行變量排序:
步驟3.取Ji值最大的變量為變量子集的第一個變量;
步驟4.選擇使下式最大的變量為的下一個變量:
步驟5.當則算法終止,其中,ε為預設值,否則轉至步驟4.通過上述步驟得到相關變量子集如下:
式中,i=1,2,···,βs,j=1,2,···,βr.βs、βr的含義與式(3)相同.
考慮不確定的影響,若對每一時刻的多元動態(tài)輸出變量進行分析勢必導致維數(shù)爆炸.為此提出基于特征的驗證方法,首先提取用戶關注的輸出數(shù)據(jù)特征,而后計算每個特征下多變量聯(lián)合概率分布的差異,并將其轉化為可信度結果,最后綜合多個驗證結果得到模型可信度.
針對于靜態(tài)輸出,選取數(shù)據(jù)本身作為變量特征.假設Ys ∈Rns×m與Yr ∈Rnr×m為多元仿真和參考靜態(tài)輸出變量,其數(shù)據(jù)特征描述為
對于動態(tài)輸出ysij(t)、yrik(t),i=1,2,···,m,j=1,2,···,ns,k=1,2,···,nr則選取ns、nr次系統(tǒng)運行得到的輸出均值曲線作為基準,與每次實驗得到的輸出曲線進行對比,求取相應的均值曲線的第l個特征:
式中,Li為第i個輸出的特征數(shù),Φl(·)為第l個特征度量模型.
提取動態(tài)輸出特征前,需要先對動態(tài)輸出進行歸類[1].以第j個動態(tài)輸出的第i次實現(xiàn)yij(t)為例,其對應的時間變化序列為[t1,t2,···,tN].則定義yij(t)隨時間變化的頻率為:
式中,Fij ≥0 為yij(t)的變化頻率;?yij(tk)=yij(tk+1)?yij(tk);?tk=tk+1?tk;給定F0為判斷時間序列變化快慢的臨界值,若Fij ≥F0,則認為yij(t)為速變數(shù)據(jù),否則為緩變數(shù)據(jù).
為刻畫不確定性對系統(tǒng)輸出的影響, 從距離和形狀兩方面提取緩變數(shù)據(jù)的特征. 在前期工作[29]的基礎上, 給出第j個仿真輸出的第i次實現(xiàn)ysij(t)與其均值曲線的距離和形狀差異的度量公式如下.
式中,i= 1,2,··· ,α,j= 1,2,··· ,β. 若Gsi和Grj均為靜態(tài)輸出變量子集, 則Li= 1; 若Gsi和Grj均為緩變輸出變量子集, 則Li= 2; 若Gsi和Grj均為速變輸出變量子集, 則Li=1. 需要說明的是, 在某些特殊仿真應用中, 除了上述特征外, 通常還需關注數(shù)據(jù)本身的一些特征, 例如控制系統(tǒng)階躍響應中的上升時間、超調量以及穩(wěn)態(tài)誤差, 位置數(shù)據(jù)中的變化趨勢, 測量數(shù)據(jù)中的噪聲等. 在進行實際驗證中, 特征矩陣包含兩部分內容, 一部分為上文給出的數(shù)據(jù)特征, 另一部分為根據(jù)具體領域知識確定的數(shù)據(jù)特征.
將υ維空間劃分為等尺寸的ρυ個區(qū)域,遍歷υ維變量的ρ個取值區(qū)間,若則F(x1,x2,···,xυ)=0;若則F(x1,x2,···,xυ)=k/ρυ等.如果變量集x1,x2,···,xυ在第k個區(qū)間內的樣本量為1,則F在x1,x2,···,xυ點的跳躍度為1/ρυ,如果變量集x1,x2,···,xυ在第k個區(qū)間內有ε個樣本,則F在x1,x2,···,xυ點的跳躍度是ε/ρυ.給出EEElsi和聯(lián)合CDF 間的差異如下.
為計算聯(lián)合CDF 的差異D(Fr,Fs),可將上式改寫為下面積分之差的形式:
式中x=[x1,x2,···,xυ].假設分別用估計Is和Ir,并用估計,則的方差為:
其 中,x=x1,x2,···,xυ,gs(x)、gr(x)是 兩個密度函數(shù),Hs(x)=Fs(x)/gs(x),Hr(x)=Fr(x)/gr(x).首先,由gs(x)、gr(x)各產生P個相互獨立的υ維隨機數(shù)Ts1,···,TsP和Tr1,···,TrP,并計算
采用逆變換方法由同一個υ維聯(lián)合均勻分布U(0,1)產生Ts1,···,TsP和Tr1,···,TrP,能夠保證兩組隨機數(shù)具有較高的正相關程度,進而使較小,對的估計值趨于穩(wěn)定.
需要說明的是,D(Fs,Fr)∈[0,∞)僅是仿真和參考輸出特征的聯(lián)合CDF 的差異(如圖1 所示),其取值范圍為[0,∞),此時無法給出仿真和參考輸出的一致性程度(即取值為[0,1]的相對值).因此,提出將D(Fs,Fr)向可信度C(Fs,Fr)轉化的公式如下.
性質1.非負性:C(Fs,Fr)≥0;
性質2.交換性:C(Fs,Fr)=C(Fr,Fs);
性質3.有界性:C(Fs,Fr)∈[0,1];
性質4.同一性:C(Fs,Fr)=1,當且僅當Fs=Fr.
圖1 參考與仿真輸出的CDF 對比Fig.1 Comparing CDF curves of reference and simulation output
基于前文所述方法,給出考慮相關性的多元輸出仿真結果驗證流程如圖2 所示.
1)考慮不確定因素的影響,分別進行n次仿真運行和實際試驗,獲取多元仿真和參考輸出Ys={Ys1,Ys2,···,Ysm},Yr={Yr1,Yr2,···,Yrm};
圖2 考慮相關性的多元輸出仿真結果驗證方法流程Fig.2 Procedures of multivariate simulation result validation under correlation
2)利用多元輸出變量選擇方法提取Ys、Yr的相關變量子集Gsi,i=1,···,βs,Grj,j=1,···,βr;
3)若βs=βr且Gsi=Grj,則依據(jù)式(8)~(13)提取Gsi、Grj中各變量的數(shù)據(jù)特征反之,若βs=βr或的相關變量子集,則認為該仿真模型不可信,即C=0,算法結束;
5)依據(jù)式(15)~(19)計算特征變量集的聯(lián)合CDF:Fsil、Frjl的差異
7)通過2)可知,α個相關變量子集之間是相互獨立的,且用戶關注的多個數(shù)據(jù)特征(包括位置、形狀、頻譜)間也可認為是獨立的,進而可采用加權方法綜合多個可信度結果l=1,···,Li;i=1,···,βs;j=1,···,βr.圖2 中“Integrate(·)”表示加權綜合算子.同時第σ個動態(tài)輸出的均值曲線可認為是對系統(tǒng)輸出的一次抽樣,不考慮不確定性影響時的多元輸出數(shù)據(jù)是近似獨立的,進而綜合得到最終驗證結果如下所示.
其中,σ=1,···,mdynamic表示第σ個動態(tài)輸出變量,ζ=1,···,Lσ表示動態(tài)輸出均值曲線的第ζ個特征,wl、wζ代表第l、ζ個數(shù)據(jù)特征的可信度結果權重,wi代表第i個相關變量子集的一致性分析結果權重,代表相關變量子集和動態(tài)輸出均值曲線一致性的權重.
為驗證本文方法的有效性,針對文獻[2]中給出的某飛行器縱向平面內末制導階段的仿真模型進行結果驗證.該模型包括飛行器制導模型和目標運動模型.圖3 給出縱向平面內彈目相對運動幾何關系.目標以恒定速度vT沿x軸向右行駛.假設飛行器無動力飛行且航向已對準目標,忽略地球自轉,給出以時間為自變量的飛行器縱向質心運動方程
式中,v為速度,θ為彈道傾角,h為高度,d為水平距離.阻力D=0.5ρv2SCD(Ma,α),升力L=0.5ρv2SCL(Ma,α).CD與CL分別為阻力系數(shù)與升力系數(shù).α為攻角,馬赫數(shù)Ma=v/vs,S為參考面積,M為質量,αM為法向加速度,λ為視線角.聲速vs與大氣密度ρ根據(jù)1976 年美國標準大氣計算.相應的制導律設計可見文獻[30].根據(jù)上述信息建立該飛行器縱向平面內末制導仿真模型.
圖3 縱向平面內彈目相對運動幾何關系Fig.3 Geometrical relationship of relative missile-target movement in longitudinal plane
利用此仿真模型精確研究此飛行器在末制導階段的特性,需要考慮其受到的不確定性因素.飛行器升力與阻力均存在不確定性,引入升力系數(shù)擾動CLC,與阻力系數(shù)擾動CDC模擬阻力系數(shù)與升力系數(shù)的不確定性,因此有升力L=0.5ρv2SCLCCL(Ma,α),阻力D=0.5ρv2SCDCCD(Ma,α),分別采用不同分布對CLC和CDC進行描述.同時,大氣密度會影響升力和阻力,因每次飛行環(huán)境不同需考慮其不確定性的影響,采用大氣密度系數(shù)Cρ表示.此外,飛行器進入末制導階段時的初始視線角λ0與彈道傾角θ0亦具有不確定性.選取仿真模型和參考系統(tǒng)的不確定參數(shù)如表2 所示.
表2 飛行器末制導過程的不確定參數(shù)取值Table 2 Uncertainty parameters values in the terminal guidance process of flight vehicle
選取用戶關注的多元輸出變量如表3 所示.選取靜態(tài)輸出變量有飛行器的最終落點位置坐標(xf,zf)和目標終點位置坐標(xT f,zT f),同時選取待驗證的動態(tài)輸出變量有彈道傾角θ、攻角α、視線角λ、彈目相對距離DMT、目標速度vT.利用拉丁超立方抽樣法,對模型不確定性參數(shù)進行抽樣,給定初始樣本數(shù)為1 000,運行仿真模型共得到1 000 組輸出.改變飛行器模型參數(shù)(見表2),采用拉丁超立方抽樣獲得的1 000 組數(shù)據(jù)作為參考輸出.系統(tǒng)輸出數(shù)據(jù)的包絡線如圖4~10 所示.其中目標速度vT、目標終點位置zT f為恒定值,未在圖中標出.
表3 待驗證的模型輸出Table 3 Model outputs to be validated
利用本文方法對該飛行器末制導仿真輸出進行驗證.首先利用多元輸出變量選擇方法分別對仿真和參考的動靜態(tài)輸出變量進行相關性分析及變量選擇,得到相關性分析結果如表4 所示.通過分析可知,仿真和參考輸出變量具有相同的變量子集,動態(tài)輸出變量θ、α、λ、DMT具有相關性,故將其歸為一類.vT為定值(不隨時間改變)并與變量子集I 相互獨立;靜態(tài)輸出xf、xT f具有相關性,通過驗證可知兩者滿足線性關系(如圖11 所示),同時zf與xf相互獨立(如圖12 所示),進而可得zf與xf相互獨立,zT f為定值0 形成了變量子集III.由上述分析結果驗證了變量選擇方法的有效性.
圖4 彈道傾角輸出包絡線Fig.4 Envelope lines of launch angle
圖5 攻角輸出包絡線Fig.5 Envelope lines of angle of attack
圖6 視線角輸出包絡線Fig.6 Line-of-sight angle envelopes
圖7 彈目相對距離輸出包絡線Fig.7 Envelope lines of the missile-target relative distance
圖8 飛行器落點X坐標輸出散點圖Fig.8 Scatter diagram of X-direction drop point coordinates of the flight vehicle
圖9 目標終點位置X坐標輸出散點圖Fig.9 Scatter diagram of X-direction terminal point coordinates of the target vehicle
根據(jù)表4 的變量選擇結果求取各變量子集關于某特征的聯(lián)合CDF,選取動態(tài)輸出的位置和形狀特征,分別求取變量子集I 的聯(lián)合CDF,變量子集II為恒定值在驗證過程中直接采用相對誤差方法進行一致性分析即可;對于靜態(tài)輸出變量子集I 關于數(shù)據(jù)本身的聯(lián)合CDF 如圖13 所示,變量子集II 的CDF 曲線如圖14 所示.進而得到動態(tài)輸出均值曲線的一致性結果(見表5)以及多個變量組關于多個特征的CDF 差異和可信度結果(見表6).依據(jù)式(21)綜合多個可信度結果得到最終驗證結果為0.82,由于仿真和參考輸出變量vT、zT f均相等且恒為0,故在計算模型可信度時不予考慮,為方便計算采用均權的方式進行綜合.
圖10 飛行器落點Z坐標輸出散點圖Fig.10 Scatter diagram of the terminal point of the target in the Zdirection
表4 多元輸出變量選擇結果Table 4 Variables selection results of multiple outputs
圖11 飛行器落點X坐標與目標終點位置X坐標間的關系Fig.11 Relationship of X-direction coordinates between drop point of flight vehicle and terminal point of target
圖12 飛行器落點X方向坐標與Z方向坐標間的關系Fig.12 Relationship between X-direction and Z-direction coordinates of the drop point of flight vehicle
圖13 仿真和參考靜態(tài)輸出變量子集I 的聯(lián)合CDF 對比Fig.13 JCDF comparison of variable subset I between static simulation and reference output
圖14 仿真和參考靜態(tài)輸出變量子集II 的CDF 對比Fig.14 Comparison of variable subset II between static simulation and reference output
此外,為進一步驗證本文方法對參數(shù)不確定性度量的有效性,針對上述應用實例分別設計兩組驗證實驗(不確定性參數(shù)取值見表7).固定仿真模型和參考系統(tǒng)的不確定性參數(shù)大氣密度系數(shù)Cρ、升力系數(shù)CD、阻力系數(shù)CL和初始視線角λ0的取值.分別調節(jié)仿真模型初始彈道傾角θ0的均值和方差,得到最終驗證結果如圖15~16 所示.通過實驗可得,該方法能夠度量仿真模型不確定參數(shù)取值的離散程度對驗證結果的影響,證明過大或過小的參數(shù)不確定度均會降低模型的可信度;同時該方法能夠度量不確定性參數(shù)的均值差異對驗證結果的影響.綜上所述,所提方法能夠用于解決帶有相關性的多元輸出仿真結果驗證問題.
表5 動態(tài)輸出均值曲線的一致性分析結果Table 5 Consistency analysis results of the mean curves of dynamic outputs
表6 仿真和參考輸出變量子集的一致性分析結果Table 6 Consistency analysis results of the variables subset of the simulation and reference outputs
表7 驗證實驗的不確定參數(shù)取值Table 7 Uncertainty parameters values for validation experiments
針對帶有相關性的多元輸出仿真模型驗證問題,提出了考慮不確定性的聯(lián)合驗證方法.首先對多變量輸出提取相關變量子集,并對各輸出變量提取數(shù)據(jù)特征,利用聯(lián)合CDF 差異法度量各相關變量子集的一致性程度,進而綜合得到模型可信度.利用單變量驗證方法進行多變量驗證時需要滿足輸出變量相互獨立的條件.本文方法考慮了多變量間的相關關系,基于相關變量子集進行聯(lián)合驗證,較單變量驗證方法應用更合理;同時在驗證前引入了變量相關性分析,使其能夠適應輸出變量之間關系未知的情況,使驗證結果更準確,但也增加了計算開銷.此外,該方法能夠度量不確定性因素對模型可信度的影響.
圖15 實驗組I 驗證結果Fig.15 Validation result of experiment I
圖16 實驗組II 驗證結果Fig.16 Validation result of experiment II
需要說明的是,本文僅考慮同一類型輸出(動態(tài)或靜態(tài))存在相關性的情況,涉及的變量選擇方法本質上屬于數(shù)據(jù)挖掘方法,為確保方法的準確性要求具備足夠的樣本容量,對于參考數(shù)據(jù)缺乏的情況,可采用專家給出參考數(shù)據(jù)的大致分布,或可利用已有的歷史數(shù)據(jù)、可信度較高且類似的半實物/純數(shù)字仿真模型所產生的數(shù)據(jù)代替.此外,刻畫動態(tài)輸出的數(shù)據(jù)特征不限于距離、形狀及頻譜,可依據(jù)具體應用需求而定(例如,超調量、相位誤差等).后續(xù)將對動態(tài)、靜態(tài)輸出間的相關性分析及變量選擇方法進行研究;同時針對參考數(shù)據(jù)缺乏以及存在認知和固有混合不確定性時的多元輸出仿真結果驗證問題展開進一步研究.