薛明浩,端木京順,甘旭升,閔桂龍
(1.空軍工程大學(xué)裝備管理與安全工程學(xué)院,陜西 西安 710051;2.空軍工程大學(xué)空管領(lǐng)航學(xué)院,陜西 西安 710051)
飛行事故預(yù)測是在對歷史數(shù)據(jù)統(tǒng)計(jì)和分析的基礎(chǔ)上,對未來可能發(fā)生的飛行事故預(yù)先做出近乎合理的推測判斷[1]。準(zhǔn)確的飛行事故預(yù)測可以為飛行安全管理提供幫助,對有效地預(yù)防飛行事故具有十分重要的意義。
針對飛行事故預(yù)測國內(nèi)外學(xué)者已做了大量的研究[2-3]。如灰色預(yù)測法[4]、時(shí)間序列[5]一般是選取某種函數(shù)建立相關(guān)數(shù)學(xué)模型,并通過歷史數(shù)據(jù)對數(shù)學(xué)模型進(jìn)行修正,然后利用模型進(jìn)行預(yù)測,但預(yù)測模型收斂性、精度等均受到不同程度的限制;神經(jīng)網(wǎng)絡(luò)(BP)[6-7]具有很強(qiáng)的非線性映射能力,可以彌補(bǔ)傳統(tǒng)方法的不足,但也存在易陷入局部極小點(diǎn)和過擬合等缺點(diǎn),使得其應(yīng)用受到限制;最小二乘支持向量機(jī)(LS-SVM)[8]較好地解決了小樣本、非線性、局部極小點(diǎn)等問題,但求解時(shí)存在二次規(guī)劃問題,求解速度相對較慢?;诖?,本文針對單個(gè)預(yù)測模型存在不同缺點(diǎn)以及難以達(dá)到理想預(yù)測精度的問題,提出一種基于證據(jù)理論的飛行事故組合預(yù)測模型,分別采用時(shí)間序列、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對飛行事故進(jìn)行預(yù)測,根據(jù)每個(gè)模型的相對誤差確定該模型在組合中的權(quán)重,從而確立基本信任分配函數(shù),并運(yùn)用D-S證據(jù)理論[9]對函數(shù)進(jìn)行融合,進(jìn)而對未來的飛行事故發(fā)生情況進(jìn)行預(yù)測。
時(shí)間序列預(yù)測模型就是將預(yù)測對象時(shí)間序列反映的發(fā)展過程和趨勢進(jìn)行類推,以預(yù)測其未來可能達(dá)到的水平。時(shí)間序列預(yù)測模型主要包括穩(wěn)定模型和非穩(wěn)定模型,由于飛行事故存在一定的周期波動(dòng),其時(shí)間序列通常屬于非穩(wěn)定模型,因此這里采用差分自回歸滑動(dòng)平均法(Auto Regressive Integrated Moving Average,ARIMA)模型[10],其模型表達(dá)式為
式中:Yt為t 時(shí)刻的實(shí)際值;α 為參數(shù),α=τ(1-φ1-φ2-φp),其中τ=E(Yt);εt為t 時(shí)刻的隨機(jī)誤差;p、q分別為自回歸階數(shù)和滑動(dòng)平均階數(shù);φ1,φ2,…,φp為自回歸參數(shù);θ1,θ2,…,θq為滑動(dòng)平均參數(shù)。
對于飛行事故,ARIMA 模型建模主要過程有模型識別、平穩(wěn)化處理、參數(shù)估計(jì)和模型檢驗(yàn)等,具體步驟如下:
(1)通過對時(shí)間序列的分布圖、自相關(guān)函數(shù)的分析,對時(shí)間序列的平穩(wěn)性進(jìn)行識別。
(2)通過對非平穩(wěn)序列的差分變換使非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列。
(3)通過赤池信息量準(zhǔn)則(Akaike’s Information Criterion,AIC)來確定ARMA 模型階數(shù)p 和q。AIC準(zhǔn)則函數(shù)為
(4)估計(jì)模型的未知參數(shù),并檢驗(yàn)參數(shù)的顯著性及模型本身的合理性。
(5)將歷史數(shù)據(jù)代入模型,以驗(yàn)證模型是否有效;否則,轉(zhuǎn)入第(3)步。
(6)利用所建立模型進(jìn)行預(yù)測分析。
BP神經(jīng)網(wǎng)絡(luò)是一種基于誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),但算法存在收斂速度慢、容易陷入局部最優(yōu)以及網(wǎng)絡(luò)性能差等缺點(diǎn)。針對以上缺點(diǎn),采用分組批處理的訓(xùn)練方式,不僅可使不同學(xué)習(xí)率在訓(xùn)練樣本循環(huán)訓(xùn)練完成后得到適當(dāng)調(diào)整,又能減小調(diào)整學(xué)習(xí)率的時(shí)間,從而加快收斂速度;將每個(gè)訓(xùn)練樣本的梯度值平均在一起,以獲得更精確、更符合全局的梯度估計(jì)和較好的泛化能力;使用復(fù)合誤差函數(shù)Gλ(m)來代替?zhèn)鹘y(tǒng)算法中的全局均方誤差函數(shù)E(m),以此來加快收斂速度和減小陷入局部最優(yōu)的可能性;采用分開調(diào)整輸出層學(xué)習(xí)率β1 和隱含層學(xué)習(xí)率β2 的方法替代傳統(tǒng)算法中固定不變的學(xué)習(xí)率β[11]。
分組批處理的訓(xùn)練方式中,對于各分組Pi(1≤i≤n)個(gè)訓(xùn)練樣本,BP 神經(jīng)網(wǎng)絡(luò)實(shí)際輸出值()與理想輸出值)間的全局均方誤差函數(shù)可表示為
復(fù)合誤差函數(shù)Gλ(m)的具體展開式為
式中:λ=exp(-|ΔE(m)|/E(m)),其中ΔE(m)為誤差變化量,ΔE(m)=E(m)-E(m-1),E(m)為分組樣本在第m 次循環(huán)學(xué)習(xí)時(shí)的全局均方誤差。
最小二乘支持向量機(jī)(LS-SVM)是支持向量機(jī)的一種拓展,它適用于飛行事故預(yù)測這樣的小樣本情況,使用最小二乘支持向量機(jī)模型進(jìn)行飛行事故預(yù)測就是將已有的飛行事故數(shù)據(jù)作為輸入值,經(jīng)過變換,得到學(xué)習(xí)樣本,建立預(yù)測模型,從而預(yù)測未來時(shí)刻飛行事故的預(yù)測值。其關(guān)鍵問題在于如何重構(gòu)線性空間,找到輸入與輸出的對應(yīng)關(guān)系。
設(shè)訓(xùn)練樣本為{(x1,y2),…,(xm,ym)},xi∈Rm,yi∈R(i=1,2,…,m,m 為訓(xùn)練樣本個(gè)數(shù))。將訓(xùn)練樣本映射到高維特征空間,并采用如下的回歸估計(jì)函數(shù)對該空間進(jìn)行線性回歸:
式中:w 為權(quán)值向量;b 為偏差;φ(x)為從輸入空間到高維特征空間的非線性映射。
基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,可將回歸問題等效為如下的約束優(yōu)化問題:
s.t.yi=wTφ(xi)+b(i=1,2,…,m)
式中:c為正規(guī)化參數(shù);ξ為非相關(guān)隨機(jī)誤差。
用Lagrange方法求解該優(yōu)化問題,可得
式中:α為Lagrange乘子,α=[α1,α2,…,αm]。
根據(jù)Mercer條件,選用RBF核函數(shù),利用最小二乘法可求出回歸估計(jì)函數(shù):
式中:σ為核寬度。
由此可見,LS-SVM 預(yù)測模型僅需要確定正規(guī)化參數(shù)c和σ,而其最優(yōu)參數(shù)組合在實(shí)際運(yùn)用時(shí)應(yīng)根據(jù)需要來確定。
定義1 設(shè)Θ 為識別框架,?X?Θ,m(X)表示用[0,1]區(qū)間上一個(gè)確定值來賦予2Θ中每一個(gè)元素,即m(X):2Θ→[0,1],滿足:
式中:m(X)為事件X 的基本信任分配函數(shù),它表示證據(jù)對X 的信任程度。
D-S證據(jù)理論相較于其他評價(jià)方法最大的優(yōu)勢是能將不同評價(jià)結(jié)論實(shí)施合成。設(shè)在識別框Θ 上有2個(gè)證據(jù)是完全獨(dú)立的基本可信函數(shù),分別為m1和m2,對應(yīng)焦元為,則D-S合成算法規(guī)則為[9]
式中:C 表示合成后的函數(shù),若待合成的函數(shù)多于2個(gè),則可通過上述方法將之前的合成結(jié)果與下一個(gè)函數(shù)再次合成,直至所有函數(shù)完成合成,這種方法便于將不同的預(yù)測模型進(jìn)行融合。
假設(shè)歷史飛行事故率通過預(yù)測模型進(jìn)行訓(xùn)練后,每個(gè)模型產(chǎn)生的預(yù)測誤差為(i=1,2,3),其中為飛行事故率的預(yù)測值,yi為飛行事故率的實(shí)際值,在對各個(gè)預(yù)測模型進(jìn)行融合之前,需要提取各個(gè)待融合模型的權(quán)重。在飛行事故預(yù)測模型中,各個(gè)預(yù)測模型的權(quán)重被視為證據(jù)理論的基本信度值,其對應(yīng) 的信度 值(i=1,2,3)。而權(quán)重的確定又與預(yù)測精度有密切的關(guān)系,預(yù)測精度高,則該算法在組合中所占的權(quán)重大;預(yù)測精度低,相應(yīng)的權(quán)重就小。因此,權(quán)重ωi可表示為關(guān)于ei的函數(shù):
為避免某種預(yù)測模型出現(xiàn)相對誤差為0 的情況,這里引入ε,ε=0.000 1,進(jìn)而可得到組合預(yù)測結(jié)果:Y==1。所以,基于D-S證據(jù)理論權(quán)重融合的飛行事故率預(yù)測的具體流程如下(見圖1):
(1)選擇預(yù)測模型的輸入變量和輸出變量,并對輸入樣本做相應(yīng)的預(yù)處理。例如對于時(shí)間序列預(yù)測模型,飛行事故率本身就是一維時(shí)間序列,其中歷史飛行事故率為自變量,待測飛行事故率為因變量;而對于BP神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī),需要將一維歷史數(shù)據(jù)轉(zhuǎn)化為矩陣形式,以獲得數(shù)據(jù)的關(guān)聯(lián)信息;此外,為了加快樣本訓(xùn)練速度和模型的收斂速度,提高模型預(yù)測精度,還可以采用歸一化方法對數(shù)據(jù)進(jìn)行如下預(yù)處理:
(2)將處理完的數(shù)據(jù)作為輸入量,分別采用三種預(yù)測模型對a—b年份的飛行事故率進(jìn)行預(yù)測,計(jì)算各模型的相對誤差,并采用平均絕對百分比誤差(MAPE)來評價(jià)預(yù)測模型的預(yù)測效果,其表達(dá)式為
(3)根據(jù)計(jì)算得到的各個(gè)預(yù)測模型的相對誤差,運(yùn)用D-S合成法測,計(jì)算各模型的權(quán)重wi,這里選取待測年份前三年的預(yù)測結(jié)果作為融合樣本。
(4)利用權(quán)重融合模型求得的各模型權(quán)重,可得出三種預(yù)測模型融合后最終的輸出值。
飛行事故萬時(shí)率作為飛行安全水平的重要指標(biāo),一方面是飛行員素質(zhì)、飛機(jī)可靠性、訓(xùn)練水平以及飛行安全管理工作好壞的綜合表現(xiàn),另一方面也是衡量空軍戰(zhàn)斗力強(qiáng)弱的重要標(biāo)志。因此,本文選取美國空軍1988—2010年的飛行事故萬時(shí)率[12-13]作為預(yù)測模型研究的基礎(chǔ)數(shù)據(jù)(見表1),并基于D-S證據(jù)理論融合模型對待測年份的飛行事故率進(jìn)行預(yù)測,具體過程如下:
表1 美國空軍1988—2010年飛行事故萬時(shí)率Table 1 10 000hour-rates of flight accidents in United States Air Force from 1988to 2010
(1)采用時(shí)間序列模型對1988—2010 年的飛行事故萬時(shí)率進(jìn)行預(yù)測,并計(jì)算相對誤差。建模前先利用EViews軟件對1988—2010 年飛行事故萬時(shí)率時(shí)間序列模型進(jìn)行ADF單位根檢驗(yàn)(見表2),檢驗(yàn)結(jié)果表明ADF 檢驗(yàn)t-統(tǒng)計(jì)量為-0.591 073(遠(yuǎn)大于1%、5%、10%的檢驗(yàn)臨界值),故為非平穩(wěn)序列,印證了之前根據(jù)事故率為非平穩(wěn)序列而采用差分自回歸滑動(dòng)平均法的判斷。因此,需將原有的非平穩(wěn)序列轉(zhuǎn)換為平穩(wěn)序列后才能進(jìn)行預(yù)測,而通過一階差分變換后ADF 單位根檢驗(yàn)結(jié)果(見表3)顯示ADF檢驗(yàn)t-統(tǒng)計(jì)量為-6.601 631(小于1%、5%、10%的檢驗(yàn)臨界值),表明差分后的時(shí)間序列為平穩(wěn)序列,可以對時(shí)間序列進(jìn)行ARMA 建模。根據(jù)AIC準(zhǔn)則,預(yù)測模型的自相關(guān)函數(shù)滯后數(shù)p 和偏相關(guān)函數(shù)滯后數(shù)q 都取4[14],利用EViews軟件,可得到2007—2009年飛行事故萬時(shí)率時(shí)間序列模型的預(yù)測值及相對誤差,見表4。
表3 一階差分后的ADF單位根檢驗(yàn)結(jié)果Table 3 ADF unit roots test results of first-order difference
表4 2007—2009年飛行事故萬時(shí)率時(shí)間序列模型預(yù)測值與實(shí)際值的比較Table 4 Actual and predicted values of time series of flight accidents from 2007to 2009
(2)分別采用BP神經(jīng)網(wǎng)絡(luò)模型和最小二乘支持向量機(jī)模型(LS-SVM 模型)對2007—2009年的飛行事故萬時(shí)率進(jìn)行預(yù)測,并計(jì)算相對誤差。其輸入及輸出數(shù)據(jù)采用相空間重構(gòu)方法獲得,這里嵌入維數(shù)取5,延遲時(shí)間取1,可以得到2007—2009年的飛行事故萬時(shí)率BP神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī)模型的預(yù)測值及相對誤差,見表5。
(3)根據(jù)各模型的相對誤差,通過權(quán)重提取模型,可以分別得到2007—2009年三種預(yù)測模型對應(yīng)的權(quán)重,見表6。
表5 2007—2009年飛行事故萬時(shí)率BP神經(jīng)網(wǎng)絡(luò)和LS-SVM 模型預(yù)測值與實(shí)際值的比較Table 5 Comparison of actual values and predicted values of BP neural network and LS-SVM from 2007to 2009
表6 2007—2009年三種預(yù)測模型對應(yīng)的權(quán)重Table 6 Weights of the 3prediction models from 2007 to 2009
(4)將求出的各模型對應(yīng)權(quán)重當(dāng)作相應(yīng)的基本信任分配函數(shù),通過Dempster合成法則進(jìn)行二重融合,得到最終的權(quán)重為0.123 4、0.228 3、0.648 3,最后對2010年度的飛行事故萬時(shí)率進(jìn)行預(yù)測,其預(yù)測結(jié)果見表7。由表7 可以看出,在2007—2010年飛行事故萬時(shí)率的預(yù)測值中,采用DS證據(jù)理論融合模型(DS模型)的預(yù)測值的平均絕對百分比誤差MAPE值(1.954%)小于任何一個(gè)單一預(yù)測模型,表明組合模型的預(yù)測精度優(yōu)于其中任一單一預(yù)測模型,且預(yù)測值與實(shí)際值非常接近,具有較高的預(yù)測精度。
表7 2007—2010年飛行事故萬時(shí)率四種預(yù)測模型預(yù)測值與實(shí)際值的比較Table 7 Comparison of actual values and predicted values of 4prediction models from 2007to 2010
為了進(jìn)一步提高飛行事故預(yù)測精度,本文通過三種預(yù)測模型對待測年份前3年的飛行事故率進(jìn)行預(yù)測,根據(jù)得出的各模型預(yù)測值與實(shí)際值的相對誤差,利用D-S證據(jù)理論對三種預(yù)測模型進(jìn)行融合,計(jì)算出融合后各模型的權(quán)重,進(jìn)而對待測年份的飛行事故率進(jìn)行預(yù)測。實(shí)例研究結(jié)果表明,采用D-S證據(jù)理論融合后的預(yù)測模型的預(yù)測結(jié)果比任何單一預(yù)測模型的精度都高,且融合過程簡單易行,為飛行事故預(yù)測提供了一種新的有效方法。
[1]徐邦年.飛行安全評估概論[M].北京:藍(lán)天出版社,2005.
[2]王永剛,單方方,王燦敏.GREAM 法在機(jī)務(wù)維修操作差錯(cuò)概率預(yù)測中的應(yīng)用[J].安全與環(huán)境工程,2014,21(1):134-137.
[3]劉玲莉,孫亞菲,鄭紅運(yùn).基于集對分析的民航運(yùn)輸事故征候預(yù)測模型研究[J].安全與環(huán)境工程,2013,20(5):154-158.
[4]甘旭升,端木京順,盧永祥.灰色均生函數(shù)模型及其在航空裝備事故預(yù)測中的應(yīng)用[J].中國安全科學(xué)學(xué)報(bào),2010,20(6):40-44.
[5]Box G E P,Jenkins G M,Reinsel G C.Time Series Analysis Forecasting and Control[M].Englewood Cliffs,New Jersey:Prentice-Hall,Inc.,1994:126-131.
[6]李瑞榮,康銳.基于神經(jīng)網(wǎng)絡(luò)的故障率預(yù)測方法[J].航空學(xué)報(bào),2008,29(2):357-363.
[7]趙錄峰,端木京順,韓衛(wèi)剛,等.基于改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)模型的飛行事故預(yù)測研究[J].舫空維修與工程,2008(4):25-26.
[8]Suykens J A K,Gestel V T,Brabanter J De,et al.Least Squares Support Vector Machines[M].Singapore:World Scientific,2002.
[9]段新生.證據(jù)理論與決策、人工智能[M].北京:中國人民大學(xué)出版社,1993.
[10]Shafer G.A Mathematical Theory of Evidence[M].Princeton:Princeton University Press,1976.
[11]張國翊,胡錚.改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型及其穩(wěn)定性分析[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,42(1):115-123.
[12]陸惠良.軍事飛行事故研究[M].北京:國防工業(yè)出版社,2003:7-10.
[13]Air Force Safety Lenter.Annual Report of Headquarters Air Force Safety Center(fiscal year 2012)[R].Headquaters Air Force Safety Center,2012.
[14]甘旭升,端木京順,高建國,等.基于ARIMA 模型的航空裝備事故時(shí)序預(yù)測[J].中國安全科學(xué)學(xué)報(bào),2012,22(3):97-102.