錢 宇,龍 濤
(中國民用航空飛行學(xué)院,四川 廣漢 618307)
民航運輸飛機起飛離地速度是飛機主輪離地時的瞬時速度,該速度超過輪胎型號限制速度,即發(fā)生超輪速[1]。由于超輪速極易造成輪胎超負荷損傷,甚至爆胎,嚴重威脅航空安全運行[2],因此對超輪速的研究尤為重要。飛機起飛離地速度受多種因素的影響,目前對超輪速誘因的研究多為定性分析[3][4]??焖俅嫒∮涗浧?Quick Access Recorder,QAR)用于日常運行時獲取飛行數(shù)據(jù),飛行數(shù)據(jù)能夠反映飛機運行情況。因此,為客觀分析超輪速誘因,進行識別風(fēng)險,可以使用QAR數(shù)據(jù)對超輪速誘因進行定量研究。
超輪速誘因研究涉及多個變量,且變量間相關(guān)性明顯。為使研究問題得到簡化,降低建立模型的難度和復(fù)雜性,并保證模型的合理性,需要對多個變量進行降維,而主成分分析是一種常用的降維方法。Chuanqi Lu等[5]利用主成分分析法對航空液壓泵的故障特征進行降維,建立支持向量回歸模型對故障規(guī)模進行識別;劉科生和王思洋[6]對函數(shù)型自變量進行主成分提取,降低參數(shù)估計的復(fù)雜性;李鼎哲等[7]利用主成分分析法將航空發(fā)動機工作狀態(tài)數(shù)據(jù)進行屬性約簡,輸出作為隨機森林原始訓(xùn)練集;Shane Kosir等[8]利用主成分分析法處理航空燃油容積膨脹數(shù)據(jù),所得主成分用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
研究以民航客機起飛離地速度為對象,依據(jù)QAR所記錄的發(fā)生超輪速事件的飛行數(shù)據(jù),利用主成分分析方法對影響起飛離地速度的多個參數(shù)進行降維,建立主成分回歸模型,得出各參數(shù)與離地速度的定量關(guān)系。
QAR數(shù)據(jù)涵蓋了飛行過程中上千個不同的參數(shù),如經(jīng)緯度、高度、風(fēng)向風(fēng)速、溫度、速度、側(cè)桿輸入等。因此,飛行數(shù)據(jù)分析和應(yīng)用一直是航空安全研究的熱點之一。目前對QAR數(shù)據(jù)的應(yīng)用研究在飛機性能分析[9]和故障診斷[10]、飛行員操作特征研究[11]、風(fēng)險評估和預(yù)警[12]等方面發(fā)揮著巨大的作用。
研究選取影響起飛離地速度的26個參數(shù),基于QAR數(shù)據(jù)建立超輪速誘因分析模型。所選參數(shù)分為機組操縱類、飛機性能類、飛機姿態(tài)類、飛機位置類和環(huán)境類等5類,具體分類情況見表1。
表1 起飛離地速度影響參數(shù)分類情況
采用主成分分析(Principal Component Analysis,PCA)方法,將多個變量化為少數(shù)幾個主成分(綜合變量),實現(xiàn)降維。這些主成分可以表示為原始變量的線性組合,能夠反映原始變量的大部分信息,且各主成分之間互不相關(guān)[13]。主成分分析模型的建立過程如下:
1)原始數(shù)據(jù)標準化處理
(1)
(2)
(3)
R=(rij)p×p
(4)
(5)
3)求解R的特征值λ和正交單位特征向量e
由特征方程|R-λD|=0,計算得出R的特征值λ和特征向量D,將特征值由大到小進行排序,得到λ1≥λ2≥…≥λp;利用施密特正交化方法將特征向量D正交規(guī)范化,再對向量進行單位化處理,得到正交單位特征向量e,即主成分表達式的系數(shù)。
4)計算貢獻率ci和累積貢獻率C
(6)
(7)
式中,λi、λj分別為R的第i和第j個特征值。
5)計算主成分得分score。
(8)
式中,i,j=1,2,…,p,ej為相應(yīng)主成分表達式的系數(shù),scorej表示第j個主成分得分,主成分得分可用于進一步的統(tǒng)計分析。
通過主成分分析方法得到主成分得分和主成分表達式。將各主成分得分作為回歸模型的輸入,得到主成分回歸方程,使原始回歸模型得到簡化,并使得回歸方程和參數(shù)估計更加可靠;將主成分表達式代回回歸模型,即可得到因變量關(guān)于標準化自變量的回歸模型。模型建立過程如下:
1)變量共線性診斷與相關(guān)性分析
VIF=1/(1-R2)
(9)
式中,VIF為方差膨脹因子;R2為判定系數(shù),R2=1-SSE/SST,SSE為誤差平方和,SST為變量的總離差平方和。VIF越大說明變量間共線性越嚴重,一般,VIF<5,認為不存在共線性;VIF>10,認為共線性嚴重。
2)建立多元線性回歸模型
采用普通最小二乘法,建立因變量y關(guān)于主成分Z1,Z2,…,Zk的回歸模型
y=β0+β1Z1+β2Z2+…+βkZk+ε
(10)
3)顯著性檢驗
給定顯著性水平α=0.05,對回歸方程進行顯著性檢驗(F檢驗),若F檢驗的p值小于0.05,則應(yīng)拒絕原假設(shè)H0:β1=β2=…=βk=0,可認為回歸方程是顯著的。然后,對方程的常數(shù)項和線性項進行顯著性檢驗(t檢驗),若t檢驗的p值小于0.05,則說明方程各項系數(shù)是顯著的。
4)殘差分析和異常值診斷
通過殘差直方圖和殘差正態(tài)概率圖檢驗殘差是否服從正態(tài)分布,然后通過學(xué)生化殘差統(tǒng)計量Se查找異常值。去除異常值并剔除不顯著的線性項,重新建立回歸模型。
(11)
式中,ei為第i個觀測對應(yīng)的殘差,MSE為均方殘差,hii為帽子矩陣H=X(XTX)-1XT對角線上的第i個元素。
5)回代主成分表達式
(12)
建立主成分回歸模型的流程圖如圖1。
圖1 主成分回歸模型建立流程圖
研究選取144組航班QAR數(shù)據(jù)作為樣本。為判斷樣本是否適合進行主成分分析,通過Kaiser-Meyer-Olkin (KMO)檢驗和Bartlett’s test of sphericity(Bartlett’s)檢驗對數(shù)據(jù)進行總體分析[14]。一般,KMO檢驗值分布在0~1之間,若系數(shù)值大于0.6,則認為樣本的數(shù)據(jù)結(jié)構(gòu)合理且滿足要求;Bartlett’s檢驗基于各參數(shù)互不相關(guān)的假設(shè),即各參數(shù)無法進行降維。因此,若Bartlett’s檢驗的p值小于0.001,則拒絕原假設(shè),說明樣本可以進行主成分提取。檢驗結(jié)果見表2。
表2 樣本總體分析檢驗結(jié)果
從表2的檢驗結(jié)果可以看出,樣本數(shù)據(jù)可用于主成分分析。
考慮各參數(shù)的量綱不同,故將原始數(shù)據(jù)進行標準化處理,對標準化數(shù)據(jù)進行主成分分析的結(jié)果如圖2和表3。
表3 主成分分析結(jié)果
由于前9個主成分的累積貢獻率已經(jīng)達到85.69%,超過85%,且綜合考慮累積貢獻率和各主成分的特征值(方差),前9個主成分已經(jīng)具有足夠的解釋能力,故確定選取前9個主成分作為回歸模型的自變量。
圖2 主成分貢獻率和累計貢獻率圖
所選主成分關(guān)于原始變量的表達式系數(shù)見表4。其中,Zi表示各主成分,Xi表示標準化的原始自變量,i=1,2,…,26。
表4 所選主成分關(guān)于原始變量的表達式系數(shù)
經(jīng)多重共線性診斷,各主成分的方差膨脹因子VIF計算結(jié)果均為1,說明各主成分間不存在共線性。然后以主成分Z1,Z2,…,Z9為自變量,以離地速度y為因變量,通過相關(guān)性分析,得到各變量相關(guān)系數(shù)如圖3。
圖3 離地速度與各主成分的相關(guān)系數(shù)矩陣圖
從圖3可以看出,各自變量與因變量之間均存在相關(guān)性。
建立初始線性回歸模型,得到回歸分析結(jié)果見表5。
表5 初始線性回歸模型參數(shù)估計結(jié)果
由表5得到初始線性回歸方程:
y=0.008Z1+0.378Z2-0.157Z3+0.125Z4+0.210Z5-0.074Z6+0.061Z7-0.013Z8+0.019Z9
回歸方程的F檢驗p值小于0.05,說明該方程通過顯著性檢驗,整體顯著;從表中常數(shù)項和各線性項t檢驗的p值可以看出,回歸系數(shù)中的常數(shù)項和線性項Z1、Z7、Z8、Z9所對應(yīng)的p值均大于0.05,說明其均不顯著。
對回歸模型進行殘差分析和異常值診斷,所得結(jié)果如圖4和圖5。
圖4 初始線性回歸模型殘差分析結(jié)果
圖5 初始線性回歸模型異常值診斷結(jié)果
從殘差直方圖中可以看出,殘差基本呈正態(tài)分布;殘差正態(tài)概率圖的下尾部分偏離直線,說明存在異常值。根據(jù)學(xué)生化殘差查找異常值,得到8組存在異常的樣本。去除異常值并剔除不顯著的線性項,重新建立線性回歸模型,參數(shù)估計結(jié)果見表6。
表6 去異線性回歸模型參數(shù)估計結(jié)果
由表6得到去異線性回歸方程為:
y=0.398Z2-0.130Z3+0.130Z4+0.235Z5-0.084Z6
對回歸方程的顯著性檢驗p值小于0.05,說明方程整體是顯著的。除了常數(shù)項外,各線性項的t檢驗p值均小于0.05,說明各線性項均顯著。
表7 回歸模型擬合效果評價結(jié)果對比
參數(shù)的置信區(qū)間能夠反映參數(shù)真實值在某個可信程度下處于某區(qū)間。計算去異線性回歸模型中回歸系數(shù)在95%可信程度下的置信區(qū)間,結(jié)果見表8。
表8 去異線性回歸模型回歸系數(shù)置信區(qū)間
表8反映了在95%置信水平下,去異線性回歸模型的各回歸系數(shù)分別處于表中所示相應(yīng)區(qū)間內(nèi)。
將主成分與標準化原始變量的表達式系數(shù)代入去異線性回歸方程,得到用標準化自變量表示的回歸方程:
y=-0.191X6-0.177X5+0.141X2+0.052X1+0.039X3+0.038X4+0.203X13+0.148X8+0.132X9+0.116X16+0.099X14+0.083X10+0.072X11+0.065X7+0.031X12-0.003X15+0.038X17+0.031X18-0.155X19-0.034X20+0.012X21+0.020X22+0.100X25-0.032X24-0.013X23-0.001X26
觀察以標準化自變量表示的回歸方程和表1中的參數(shù)分類情況,可以發(fā)現(xiàn):
1)變量X6(襟翼角度)、X5(縫翼角度)、X15(發(fā)動機排氣溫度)、X19(經(jīng)度)、X20(緯度)、X23(總溫)、X24(靜溫)和X26(風(fēng)向)的系數(shù)為負,其余均為正。方程系數(shù)為負,說明起飛離地速度隨相關(guān)變量減小而增大;反之,方程系數(shù)為正,起飛離地速度隨相關(guān)變量增大而增大。
2)對起飛離地速度影響較大的因素分別是低壓轉(zhuǎn)子轉(zhuǎn)速、襟翼角度、縫翼角度、經(jīng)度。表現(xiàn)為低壓轉(zhuǎn)子轉(zhuǎn)速越高,越易超輪速;起飛襟翼和縫翼伸出角度越小,越易超輪速;起飛位置越靠近我國西部,即經(jīng)度越小,越易超輪速。此外,影響其次的是油門、抬前輪速度、指示空速、發(fā)動機壓力比、風(fēng)速等;影響最小的兩個因素分別是發(fā)動機排氣溫度和風(fēng)向。
3)盡管風(fēng)向的回歸系數(shù)值僅為0.001,但這并非說明風(fēng)向?qū)ζ痫w離地速度幾乎沒有影響。經(jīng)分析,由于風(fēng)向和風(fēng)速構(gòu)成一個矢量,當順風(fēng)風(fēng)速越大,起飛離地速度越大,越容易超輪速,符合實際情況。
利用發(fā)生超輪速事件的航班QAR數(shù)據(jù),通過主成分回歸分析方法,所建立的包含機組操縱、飛機性能、飛機姿態(tài)、飛機位置和運行環(huán)境等參數(shù)的運輸飛機超輪速誘因分析模型,實現(xiàn)了各參數(shù)與起飛離地速度的定量關(guān)系估計,解釋了起飛離地速度的影響因素及其影響程度,為飛行訓(xùn)練及起飛風(fēng)險預(yù)測奠定了基礎(chǔ)。