李剛 杜冬 翟羽佳
摘要:飛行數(shù)據(jù)分析是進(jìn)行飛行品質(zhì)評估的基礎(chǔ),通過對Garmin-1000航電系統(tǒng)中數(shù)據(jù)的研究,發(fā)現(xiàn)飛行氣壓高度數(shù)據(jù)存在野值的情況,通過閱讀相關(guān)處理野值的文獻(xiàn)以及根據(jù)飛行訓(xùn)練中的飛行特點(diǎn),文章建立合適階數(shù)的多項(xiàng)式擬合方程對進(jìn)行高度數(shù)據(jù)擬合,由于高度數(shù)據(jù)不符合萊特準(zhǔn)則判斷野值的標(biāo)準(zhǔn),提出利用區(qū)間平均殘差進(jìn)行野值判斷,通過樣本擬合運(yùn)算的結(jié)果發(fā)現(xiàn),此方法可以很好的將野值點(diǎn)判斷出來。
Abstract:? Flight data analysis is the basis for flight quality evaluation. Through the study of the data in the Garmin-1000 avionics system, it is found that there are outliers in the flight pressure and altitude data. By reading the relevant documents dealing with outliers and according to flight training, the article establishes a polynomial fitting equation of suitable order to fit the altitude data. Since the altitude data does not meet the wright criterion for judging the outliers, it proposes to use the interval average residuals to judge the outliers. Through the sample fitting operation of the results, it is found that this method can well judge the outliers.
關(guān)鍵詞:Garmin-1000;多項(xiàng)式回歸;飛參數(shù)據(jù);最小二乘法
Key words: Garmin-1000;polynomial regression;flight data;least square method
中圖分類號:V355.1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)27-0152-03
0? 引言
近些年隨著通用航空的發(fā)展,飛行訓(xùn)練數(shù)據(jù)也被廣泛應(yīng)用,例如飛行品質(zhì)的評估,超限事件判斷,分析發(fā)動機(jī)數(shù)據(jù)輔助機(jī)務(wù)維修等,這些都是基于飛行數(shù)據(jù)的分析,但是飛行數(shù)據(jù)在研究時(shí)需要對數(shù)據(jù)的可用性進(jìn)行研究,比如數(shù)據(jù)中常出現(xiàn)漏采集和出現(xiàn)野值的情況。野值是指在對實(shí)際記錄的飛參數(shù)據(jù)的檢查中發(fā)現(xiàn),經(jīng)常有部分參數(shù)值存在明顯的異常值,而通過檢查相關(guān)設(shè)備又證明工作情況未出現(xiàn)異常,我們把這類數(shù)據(jù)稱為野值[1]。對于野值識別的研究早先姚本軍提出了關(guān)聯(lián)參數(shù)法,但是這種方法總體上還是從宏觀的角度進(jìn)行分析[1],后來康健利用最小二乘和多項(xiàng)式結(jié)合的方法擬合飛機(jī)油量數(shù)據(jù)曲線剔除曲線中的野值[2]。李映穎采用了多項(xiàng)式、RBF神經(jīng)網(wǎng)絡(luò)與最小二乘相結(jié)合的方法擬合發(fā)動機(jī)轉(zhuǎn)速數(shù)據(jù),剔除野值并利用Matlab實(shí)現(xiàn)[3]。王玉偉改進(jìn)了經(jīng)典最小二乘法對預(yù)測值和真實(shí)值之間的距離進(jìn)行限定,針對擬合數(shù)據(jù)起伏較大的情況[4],效果良好。他們研究的總體的思想都是利用殘差和標(biāo)準(zhǔn)差之間的數(shù)量關(guān)系進(jìn)行野值判斷或是對小樣本數(shù)據(jù)的野值進(jìn)行判斷,基于的原理是當(dāng)數(shù)據(jù)符合正太分布時(shí)可以使用萊特準(zhǔn)則對野值進(jìn)行判斷,萊特準(zhǔn)則是指當(dāng)數(shù)據(jù)服從正態(tài)分布時(shí)可以利用殘差和標(biāo)準(zhǔn)差進(jìn)行野值的判斷,但是通過lillietest檢驗(yàn)(p<0.5),高度數(shù)據(jù)不符合正太分布,基于這種情況本文提出利用等區(qū)間的方法擬合數(shù)據(jù)并且利用區(qū)間殘差的平均值與單個(gè)點(diǎn)的殘差值判斷野值,通過運(yùn)算對比,發(fā)現(xiàn)可以較好的將野值點(diǎn)識別出來。
1? 最小二乘多項(xiàng)式回歸擬合
在閉區(qū)間內(nèi)任何確定性連續(xù)函數(shù),都可以用區(qū)間內(nèi)的代數(shù)多項(xiàng)式按要求精度一致逼近,進(jìn)行非線性擬合[6],為了更好地?cái)M合各個(gè)點(diǎn)一般采取同時(shí)結(jié)合最小二乘法的思想對系數(shù)進(jìn)行求解。最小二乘法在工程中處理數(shù)據(jù)被廣泛引用,目的是設(shè)定一個(gè)擬合數(shù)據(jù)方程使其所估算的數(shù)據(jù)和實(shí)測數(shù)據(jù)之間的差值平方和最小[7],尋求最優(yōu)的方程參數(shù)解。以m次多項(xiàng)式為例,求解過程如下:
1)
以時(shí)間tk為自變量,則高度時(shí)刻數(shù)據(jù)就可以用如下公式表示:
(2)
將式(2)利用系數(shù)矩陣B和時(shí)間變量矩陣X表示,轉(zhuǎn)化為公式(3)
(3)
令方差為S,目標(biāo)方程:
將B看做變量取極值,則式(3)的最小二乘解就是:
這就是最小二乘法的原理,利用估計(jì)出B^的對數(shù)據(jù)進(jìn)行預(yù)測,殘差。
2? 等區(qū)間計(jì)算法
Garmin-1000航電系統(tǒng)是cessna-172等小飛機(jī)常裝備的一款航電系統(tǒng),在飛行過程中該系統(tǒng)會把飛行數(shù)據(jù)、發(fā)動機(jī)數(shù)據(jù)、通信、導(dǎo)航頻率等數(shù)據(jù)都會記錄在其自帶的Secure Digital Card中(下文簡稱SD卡數(shù)據(jù)),記錄的時(shí)間間隔是1秒,通過對所記錄的飛行數(shù)據(jù)可視化發(fā)現(xiàn)在飛行高度數(shù)據(jù)存在野值的情況,并且野值奇異特點(diǎn)比較明顯,與正常值差距大。由于飛行訓(xùn)練過程中一次SD卡所記錄的數(shù)據(jù)是3-4小時(shí)的數(shù)據(jù),數(shù)據(jù)量大,如果進(jìn)行一次擬合將會造成數(shù)據(jù)擬合精度差導(dǎo)致誤差對野值進(jìn)行識別的情況,所以文章利用等區(qū)間的計(jì)算方法對數(shù)據(jù)進(jìn)行處理。
飛行高度數(shù)據(jù)分為起飛、爬升、平飛和降落等幾個(gè)階段,在起飛和爬升、降落等階段高度曲線是近似直線的狀態(tài),在平飛中由于氣壓數(shù)據(jù)的不穩(wěn)定性數(shù)據(jù)呈現(xiàn)出起伏連綿的曲線,基于總體飛行高度曲線的狀態(tài)以及防止過擬合的出現(xiàn),本文選用二次多項(xiàng)式對數(shù)據(jù)進(jìn)行分段擬合,對于二次方程方程的求解直接利用matlab中的函數(shù)即可,但SD卡中的飛行數(shù)據(jù)記錄的一般是一個(gè)上午或下午的飛行數(shù)據(jù),這會造成數(shù)據(jù)量大、維數(shù)高,如果進(jìn)行一次擬合顯然得出的結(jié)果會非常差而且預(yù)測精度也會受影響,所以在計(jì)算過程中設(shè)定5秒為一個(gè)間隔,先取時(shí)刻[t1,t2…t5]和其對應(yīng)的高度對此階段的回歸系數(shù)行估算,然后利用所得出的系數(shù)通過擬合方程估算對應(yīng)時(shí)刻的值,在計(jì)算得出的值中取中間值作為擬合方程的第3個(gè)值,接著選取下一個(gè)區(qū)間[t2,t3…t6]估算第4個(gè)值,以此類推后會得到,最后的和直接利用和進(jìn)行估算。
野值判斷:
最小二乘法在一個(gè)區(qū)間內(nèi)進(jìn)行擬合時(shí)目的是使這一區(qū)間的殘差最小,導(dǎo)致同一區(qū)間的殘差存在關(guān)聯(lián)性,不能直接在預(yù)測區(qū)間進(jìn)行判別。文章提出利用整體數(shù)據(jù)的區(qū)間平均殘差來進(jìn)行判斷,假設(shè)擬合的區(qū)間為N個(gè),則N個(gè)區(qū)間的平均值即為公式(4)所示。工程中常使用3?啄-5?啄為參考值區(qū)間,根據(jù)SD卡數(shù)據(jù)野值的特點(diǎn)以及本文選擇的擬合階數(shù),本文規(guī)定當(dāng)tk時(shí)刻的殘差?駐H屬于[-5?啄,5?啄]時(shí)判斷為正常值,這個(gè)區(qū)間之外的即判斷為野值,并利用相鄰時(shí)刻的高度數(shù)據(jù)的中值進(jìn)行代替,如公式(5)所示。
3? 實(shí)現(xiàn)過程與結(jié)果對比
利用matlab對SD卡中的數(shù)據(jù)進(jìn)行提取并處理,SD卡數(shù)據(jù)主要以csv格式的方式對數(shù)據(jù)進(jìn)行儲存,數(shù)據(jù)類型有時(shí)間數(shù)據(jù)類型、字符串類型和數(shù)值類型并以逗號隔開,整體數(shù)據(jù)類型多樣,可以利用fopen函數(shù)和textscan函數(shù)將整體數(shù)據(jù)以二進(jìn)制的方式訪問讀取,并matlab內(nèi)置函數(shù)對數(shù)據(jù)進(jìn)行計(jì)算,實(shí)現(xiàn)過程以某csv文件為例如圖1所示。
通過以上的計(jì)算流程對高度數(shù)值進(jìn)行擬合,計(jì)算得出的每秒的殘差如圖2所示,由于受到野值的影響在野值時(shí)刻附近的殘差變成了負(fù)值。計(jì)算得出的?啄值為0.0269,大于5?啄的兩個(gè)點(diǎn)的殘差分別為351.0342和59.0428下標(biāo)簽分別是14:32:03和15:25:38,這兩個(gè)時(shí)刻的高度分別是2201英尺和6615英尺,通過比較確實(shí)是對應(yīng)野值的兩個(gè)點(diǎn),同時(shí)利用公式(4)對野值進(jìn)行代替,得到的結(jié)果如圖3所示。
4? 總結(jié)
文章分析了garmin-1000系統(tǒng)中的SD卡中的飛參數(shù)據(jù)格式和類型,利用matlab對csv格式的數(shù)據(jù)進(jìn)行提取,由于數(shù)據(jù)量大維數(shù)高的特點(diǎn),利用等區(qū)間處理數(shù)據(jù)的方法對數(shù)據(jù)進(jìn)行擬合。為了降低野值對擬合區(qū)間的影響以及防止過擬合選用了2次多項(xiàng)式作為擬合函數(shù),利用最小二乘的方法對預(yù)測函數(shù)的系數(shù)進(jìn)行求解,從結(jié)果中可以看出利用區(qū)間平均殘差對野值進(jìn)行判斷效果良好。
參考文獻(xiàn):
[1]李映穎,姚本軍,鄭衛(wèi)東,殷合香.飛參數(shù)據(jù)的野值與故障值的判別研究[J].計(jì)量與測試技術(shù),2009,36(09):3-4.
[2]康健.一種利用飛參數(shù)據(jù)優(yōu)化計(jì)算燃油量的方法[J].技術(shù)與市場,2017,24(07):126-127.
[3]李映穎,譚光宇,曲建嶺,殷合香,姚海燕.飛行參數(shù)野值點(diǎn)的預(yù)處理[J].計(jì)量與測試技術(shù),2008(08):17-18.
[4]王玉偉,高永.基于穩(wěn)健回歸算法的無人機(jī)數(shù)據(jù)預(yù)處理技術(shù)研究[J].艦船電子工程,2018,38(11):38-41.
[5]陳韋名.曲線擬合原理及其應(yīng)用研究[D].長沙理工大學(xué),2018.
[6]邸亞洲,秦永元,尚希良,曲建嶺.基于多項(xiàng)式回歸算法的飛參記錄數(shù)據(jù)預(yù)處理研究[J].測控技術(shù),2008(04):21-22.
[7]張強(qiáng).最小二乘法原理及其處理方法的探討[J].計(jì)量與測試技術(shù),2020,47(04):75-76.
基金項(xiàng)目:2019年大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目(項(xiàng)目編號S201910624109)。
作者簡介:李剛(1994-),男,安徽馬鞍山人,碩士研究生,主要研究方向?yàn)轱w行數(shù)據(jù)分析。