聶 凱,欒瑞鵬
(中國(guó)人民解放軍92124部隊(duì),遼寧 大連 116023)
隨著仿真技術(shù)的迅速發(fā)展,仿真試驗(yàn)已逐漸成為飛行器定型試驗(yàn)中不可缺少的試驗(yàn)手段,與外場(chǎng)試驗(yàn)有機(jī)結(jié)合,推動(dòng)著飛行器試驗(yàn)與鑒定技術(shù)的發(fā)展。仿真試驗(yàn)最重要的是仿真系統(tǒng)的可信性,仿真系統(tǒng)的校核、驗(yàn)證與確認(rèn)(Verification,Validation and Accreditation,VV&A)日益成為人們研究的熱點(diǎn)[1]。通過(guò)靜態(tài)、動(dòng)態(tài)數(shù)據(jù)驗(yàn)證飛行數(shù)據(jù)與仿真數(shù)據(jù)的一致性,是目前飛行器仿真模型驗(yàn)證過(guò)程中最常用、最重要的方法[2]。通過(guò)驗(yàn)證飛行數(shù)據(jù)與仿真數(shù)據(jù)的一致性,進(jìn)而確定仿真系統(tǒng)的可信度對(duì)仿真系統(tǒng)來(lái)說(shuō)非常重要。
靜態(tài)數(shù)據(jù)的驗(yàn)證方法一般包括圖示法、統(tǒng)計(jì)分析法、假設(shè)檢驗(yàn)法等,動(dòng)態(tài)數(shù)據(jù)的驗(yàn)證方法分為相似比較方法(誤差分析法、灰色關(guān)聯(lián)分析法、相關(guān)系數(shù)法)、特征比較方法(時(shí)域分析、頻域分析)等[3],已成功應(yīng)用于各種仿真試驗(yàn)?zāi)P万?yàn)證。受飛行器實(shí)際試驗(yàn)成本限制,實(shí)際飛行數(shù)據(jù)呈現(xiàn)小樣本特性,而仿真結(jié)果樣本量不受限制,會(huì)造成驗(yàn)前大容量仿真信息“淹沒(méi)”飛行小樣本試驗(yàn)信息問(wèn)題[4]。針對(duì)飛行數(shù)據(jù)小樣本問(wèn)題,人們通過(guò)研究提出了很多解決方法,如貝葉斯估計(jì)、Bootstrap方法[5]、主從一體化檢驗(yàn)[6]等,但依然會(huì)增加決策風(fēng)險(xiǎn)[7]。
近年來(lái),以深度學(xué)習(xí)為代表的人工智能技術(shù)迅速發(fā)展,人們研究了多種數(shù)據(jù)增強(qiáng)方法來(lái)滿足其訓(xùn)練時(shí)對(duì)大樣本數(shù)據(jù)量的需求[8]。當(dāng)飛行器實(shí)際飛行數(shù)據(jù)小樣本無(wú)法滿足仿真模型驗(yàn)證需求時(shí),可以通過(guò)采用生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Nets,GAN)等深度學(xué)習(xí)新技術(shù)生成逼真數(shù)據(jù),擴(kuò)大數(shù)據(jù)子樣[9]。GAN通過(guò)非線性變換和迭代對(duì)抗訓(xùn)練而具備擬合高度復(fù)雜分布的能力,因此增強(qiáng)后的數(shù)據(jù)與原飛行數(shù)據(jù)在相容性上保持高度一致。文獻(xiàn)[10]提出了一種離散序列生成式對(duì)抗網(wǎng)絡(luò)(Sequence Generative Adversarial Nets,SeqGAN),在語(yǔ)音、詩(shī)詞和音樂(lè)生成方面超過(guò)了傳統(tǒng)方法,也適合離散的實(shí)際飛行數(shù)據(jù)。
針對(duì)仿真模型驗(yàn)證中飛行數(shù)據(jù)小樣本問(wèn)題,采用離散序列生成式對(duì)抗網(wǎng)絡(luò)對(duì)飛行數(shù)據(jù)進(jìn)行增強(qiáng),并對(duì)增強(qiáng)后飛行數(shù)據(jù)和仿真數(shù)據(jù)的一致性進(jìn)行驗(yàn)證,最后選取靜態(tài)數(shù)據(jù)脫靶量和動(dòng)態(tài)數(shù)據(jù)俯仰姿態(tài)角對(duì)某飛行器半實(shí)物制導(dǎo)仿真系統(tǒng)的相關(guān)仿真模型進(jìn)行驗(yàn)證測(cè)試。
仿真模型驗(yàn)證過(guò)程分為飛行數(shù)據(jù)預(yù)處理、飛行數(shù)據(jù)增強(qiáng)、仿真模型驗(yàn)證方法、實(shí)例驗(yàn)證測(cè)試等,具體過(guò)程如圖1所示。
圖1 仿真模型驗(yàn)證過(guò)程
仿真模型驗(yàn)證具體步驟為:
1)飛行數(shù)據(jù)預(yù)處理。通過(guò)時(shí)間配準(zhǔn)、野值識(shí)別與修復(fù)、平滑與去噪、重采樣等保持與仿真數(shù)據(jù)的一致性。
2)飛行數(shù)據(jù)增強(qiáng)。采用離散序列生成式對(duì)抗網(wǎng)絡(luò)SeqGAN對(duì)小樣本飛行數(shù)據(jù)進(jìn)行增強(qiáng)。
3)仿真模型驗(yàn)證方法。對(duì)于脫靶量等靜態(tài)數(shù)據(jù)采用假設(shè)檢驗(yàn)方法進(jìn)行驗(yàn)證,對(duì)于位置、速度、姿態(tài)角等動(dòng)態(tài)數(shù)據(jù)采用灰色關(guān)聯(lián)分析方法進(jìn)行驗(yàn)證。
4)實(shí)例驗(yàn)證測(cè)試。選取飛行器制導(dǎo)仿真系統(tǒng)中的脫靶量、俯仰姿態(tài)角等實(shí)際飛行數(shù)據(jù)進(jìn)行驗(yàn)證測(cè)試。
假設(shè)檢驗(yàn)方法是靜態(tài)數(shù)據(jù)驗(yàn)證中最常用的一類(lèi)方法,當(dāng)數(shù)據(jù)為小樣本時(shí),通常使用秩和檢驗(yàn)、游程檢驗(yàn)等非參數(shù)檢驗(yàn)方法進(jìn)行檢驗(yàn)。文獻(xiàn)[11]采用秩和檢驗(yàn)對(duì)樣本數(shù)為1的極端情況進(jìn)行了驗(yàn)證,得出了結(jié)果,但決策風(fēng)險(xiǎn)高。當(dāng)實(shí)際飛行數(shù)據(jù)被增強(qiáng)后,數(shù)據(jù)樣本擴(kuò)大了,有可能滿足正態(tài)分布,就可以使用F檢驗(yàn)方法,即
令飛行數(shù)據(jù)和仿真數(shù)據(jù)的變量為X和Y,設(shè)其分布函數(shù)為F(x)和F(y),下面判斷公式(1)是否成立:
H0:F(x)=F(y)
(1)
當(dāng)增強(qiáng)后數(shù)據(jù)滿足正態(tài)分布時(shí),采用F檢驗(yàn)驗(yàn)證H0是否成立,F(xiàn)檢驗(yàn)的步驟和公式見(jiàn)文獻(xiàn)[12]。
近年來(lái),灰色關(guān)聯(lián)分析方法、時(shí)域內(nèi)分析法、頻域內(nèi)分析法等動(dòng)態(tài)數(shù)據(jù)驗(yàn)證方法獲得迅速發(fā)展[13],灰色關(guān)聯(lián)分析方法在序列一致性分析方面具有明顯優(yōu)勢(shì),因此本文選用灰色關(guān)聯(lián)分析方法對(duì)動(dòng)態(tài)數(shù)據(jù)進(jìn)行驗(yàn)證,具體步驟為[14]:
1)若動(dòng)態(tài)數(shù)據(jù)較長(zhǎng),則根據(jù)數(shù)據(jù)的特點(diǎn)和模型驗(yàn)證的需要對(duì)動(dòng)態(tài)數(shù)據(jù)進(jìn)行分段,段數(shù)為N;
2) 對(duì)于每段數(shù)據(jù),通過(guò)灰色關(guān)聯(lián)度模型計(jì)算灰色關(guān)聯(lián)度γk,基于專(zhuān)家經(jīng)驗(yàn)為每個(gè)灰色關(guān)聯(lián)度確定權(quán)重ωk;
4)根據(jù)灰色關(guān)聯(lián)度與仿真系統(tǒng)可信度的映射關(guān)系,評(píng)估系統(tǒng)的可信度。
無(wú)論靜態(tài)還是動(dòng)態(tài)飛行數(shù)據(jù),都是離散的。因此,采用GAN的變型——離散序列生成式對(duì)抗網(wǎng)絡(luò)(Sequence GAN,SeqGAN)對(duì)飛行數(shù)據(jù)進(jìn)行增強(qiáng)。SeqGAN的生成器使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),判別器使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN),并引入強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)和蒙特卡洛搜索。判別器的輸出作為強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì),采用獎(jiǎng)勵(lì)和梯度策略對(duì)生成器進(jìn)行更新,最后使用蒙特卡洛搜索評(píng)估中間狀態(tài)。SeqGAN很好地結(jié)合了GAN和強(qiáng)化學(xué)習(xí),其計(jì)算流程和結(jié)構(gòu)如圖2所示。
圖2 SeqGAN的計(jì)算流程和結(jié)構(gòu)
離散序列生成式對(duì)抗網(wǎng)絡(luò)算法流程如表1所示。
表1 離散序列生成式對(duì)抗網(wǎng)絡(luò)算法流程
算法中用到的公式如下:
(2)
θ←θ+αhθJ(θ)
(3)
(4)
這里我們把SeqGAN的生成模型當(dāng)作一種非參數(shù)的產(chǎn)生式建模方法,它可以逐步逼近任何概率分布,如果判別器訓(xùn)練良好,生成器可以生成與真實(shí)樣本幾乎相同的分布,因此SeqGAN是漸進(jìn)一致的[15]。而其他生成模型如變分自動(dòng)編碼器會(huì)依賴(lài)預(yù)先假設(shè)的近似分布,而對(duì)近似分布的選擇需要一定的經(jīng)驗(yàn)信息,同時(shí)它還受變分方法本身的限制,生成的概率分布會(huì)存在偏差。
在我們搭建的深度學(xué)習(xí)系統(tǒng)中,離散序列生成對(duì)抗網(wǎng)絡(luò)中的RNN與CNN模型的訓(xùn)練采用TensorFlow實(shí)現(xiàn)。RNN生成模型包含2層隱含層,每層包含200個(gè)長(zhǎng)短記憶網(wǎng)絡(luò),其訓(xùn)練時(shí)采用了丟棄正則化方法,在預(yù)訓(xùn)練與對(duì)抗訓(xùn)練時(shí)初始丟棄率均為0.3。CNN判別模型分別采用窗長(zhǎng)為1,2,3,4,5的卷積核進(jìn)行卷積操作,每個(gè)窗長(zhǎng)分別使用40個(gè)不同的卷積核。此外,判別模型包含2層通道層,每層200節(jié)點(diǎn)。輸出層包含1個(gè)節(jié)點(diǎn),表示輸入序列與真實(shí)數(shù)據(jù)相似程度。在訓(xùn)練過(guò)程中,也采取丟棄正則化技術(shù)防止模型過(guò)擬合,丟棄率為0.3。同時(shí)在輸出層采用L2范數(shù)正則化技術(shù),正則項(xiàng)系數(shù)為0.15。
生成模型和判別模型的訓(xùn)練采用基于Adam算法的批量(Mini-batch)隨機(jī)梯度下降更新參數(shù),輸入序列長(zhǎng)度為50,批量數(shù)目為分別為5000和400。生成模型的初始學(xué)習(xí)率為0.01,衰減速率為0.95,判別模型的學(xué)習(xí)率為 0.000 1。選擇靜態(tài)數(shù)據(jù)脫靶量和動(dòng)態(tài)數(shù)據(jù)俯仰姿態(tài)角進(jìn)行增強(qiáng)性能驗(yàn)證。某型號(hào)飛行器脫靶量實(shí)測(cè)數(shù)據(jù)只有9個(gè),樣本量小,因此我們采用遷移學(xué)習(xí)的方法[16],即將某艦炮5000發(fā)的脫靶量數(shù)據(jù)進(jìn)行學(xué)習(xí),然后結(jié)合某飛行器脫靶量分布實(shí)際進(jìn)行遷移,發(fā)現(xiàn)學(xué)習(xí)效果較好。圖3為某飛行器的9次脫靶量結(jié)果,其增強(qiáng)后分布如圖4所示。
圖3 某飛行器脫靶量結(jié)果
圖4 某飛行器脫靶量增強(qiáng)后結(jié)果
我們對(duì)增強(qiáng)后的脫靶量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,脫靶量數(shù)據(jù)已經(jīng)達(dá)到5000個(gè),其服從均值為6,方差為1的正態(tài)分布,達(dá)到了數(shù)據(jù)增強(qiáng)目的。
圖5為某飛行器一次飛行俯仰姿態(tài)角數(shù)據(jù),其增強(qiáng)后結(jié)果如圖6所示。
圖5 某飛行器一次飛行俯仰姿態(tài)角數(shù)據(jù)
圖6 某飛行器俯仰姿態(tài)角增強(qiáng)后數(shù)據(jù)
我們對(duì)增強(qiáng)后的俯仰姿態(tài)角數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,姿態(tài)角數(shù)據(jù)已經(jīng)達(dá)到400條,采用t-SNE算法[17]對(duì)原數(shù)據(jù)和生成數(shù)據(jù)的分布進(jìn)行可視化,映射到二維空間,結(jié)果顯示其分布與原數(shù)據(jù)的分布十分接近。
選擇某飛行器半實(shí)物制導(dǎo)仿真系統(tǒng),采用靜態(tài)、動(dòng)態(tài)數(shù)據(jù)對(duì)仿真模型進(jìn)行驗(yàn)證,半實(shí)物制導(dǎo)仿真系統(tǒng)的組成如圖7所示。
圖7 某飛行器半實(shí)物制導(dǎo)仿真系統(tǒng)的組成圖
基于仿真系統(tǒng)和模型,通過(guò)仿真生成飛行器脫靶量數(shù)據(jù)記為Y,其分布函數(shù)為F(y),服從正態(tài)分布,實(shí)際飛行脫靶量數(shù)據(jù)記為X,其分布函數(shù)為F(x)。
當(dāng)實(shí)際飛行脫靶量數(shù)據(jù)未增強(qiáng),個(gè)數(shù)僅為9時(shí),采用秩和檢驗(yàn)法[11],不能通過(guò)一致性檢驗(yàn)。
基于灰色關(guān)聯(lián)分析方法的動(dòng)態(tài)數(shù)據(jù)驗(yàn)證,首先在時(shí)間[0,100]上以 0.05秒步長(zhǎng)仿真得到一組(400個(gè))關(guān)于俯仰姿態(tài)角的仿真數(shù)據(jù),與飛行數(shù)據(jù)個(gè)數(shù)相等,時(shí)間一致。驗(yàn)證步驟為:
1)從400組數(shù)據(jù)中選擇一組數(shù)據(jù),動(dòng)態(tài)數(shù)據(jù)長(zhǎng)達(dá)100 s,將時(shí)間序列分為N=2段,[0.02, 49.97][50.03, 99.97];
2)采用鄧氏灰色關(guān)聯(lián)度模型計(jì)算灰色關(guān)聯(lián)度γk,并確定ω1=[0.4,0.6],ω2=[0.7,0.3],按照上述參數(shù)設(shè)置之后獲得的灰色關(guān)聯(lián)度結(jié)果為γ1=[0.835,0.918],γ2=[0.931,0.886];
4)對(duì)剩余399組數(shù)據(jù)進(jìn)行灰色關(guān)聯(lián)度計(jì)算,得到一組值,合起來(lái)記為矩陣A400x2。對(duì)固定的分辨系數(shù)ε,γ越大,表明兩組數(shù)據(jù)序列間的相關(guān)性就越強(qiáng)。相對(duì)于小樣本的計(jì)算結(jié)果,基于增強(qiáng)后的飛行俯仰姿態(tài)角數(shù)據(jù),灰色關(guān)聯(lián)度計(jì)算結(jié)果矩陣A400x2包含的結(jié)果更多,對(duì)仿真模型的驗(yàn)證更有效。從A400x2中γ值的計(jì)算結(jié)果看,基本都在0.8以上,動(dòng)態(tài)飛行數(shù)據(jù)和仿真數(shù)據(jù)的一致性好。根據(jù)灰色關(guān)聯(lián)度與仿真系統(tǒng)可信度的映射關(guān)系,進(jìn)一步可以評(píng)估系統(tǒng)的可信度。
相對(duì)于仿真數(shù)據(jù),大型飛行器的飛行結(jié)果數(shù)據(jù)呈現(xiàn)小樣本特性,在仿真試驗(yàn)時(shí)增加了仿真模型驗(yàn)證的決策風(fēng)險(xiǎn)。本文采用生成式對(duì)抗網(wǎng)絡(luò)GAN這一深度學(xué)習(xí)新技術(shù)生成逼真數(shù)據(jù),擴(kuò)大飛行數(shù)據(jù)樣本。針對(duì)飛行數(shù)據(jù)的離散特性,在數(shù)據(jù)預(yù)處理的基礎(chǔ)上,采用離散序列生成式對(duì)抗網(wǎng)絡(luò),對(duì)靜態(tài)結(jié)果數(shù)據(jù)(如脫靶量)和動(dòng)態(tài)數(shù)據(jù)(如俯仰姿態(tài)角),進(jìn)行增強(qiáng),然后采用假設(shè)檢驗(yàn)方法中的F檢驗(yàn)對(duì)靜態(tài)數(shù)據(jù),采用灰色關(guān)聯(lián)分析方法對(duì)動(dòng)態(tài)數(shù)據(jù)分別進(jìn)行了驗(yàn)證。飛行數(shù)據(jù)增強(qiáng)后,F(xiàn)檢驗(yàn)將一致性從未通過(guò)變成通過(guò),灰色關(guān)聯(lián)分析方法使一致性檢驗(yàn)通過(guò),為仿真模型驗(yàn)證及其可信度評(píng)估提供了一種新方法。下一步,將結(jié)合深度學(xué)習(xí)研究更多的數(shù)據(jù)增強(qiáng)方法及其增強(qiáng)后與原數(shù)據(jù)兼容性的定量評(píng)價(jià)標(biāo)準(zhǔn),進(jìn)一步提高仿真模型驗(yàn)證及其可信度評(píng)估的效率。