鄒 杰,葛俊鋒,葉 林,鄭 英,張 洪
(華中科技大學(xué)控制科學(xué)與工程系,武漢 430074)
基于支持向量機(jī)的飛機(jī)空中結(jié)冰嚴(yán)重程度識(shí)別
鄒 杰,葛俊鋒,葉 林,鄭 英,張 洪
(華中科技大學(xué)控制科學(xué)與工程系,武漢 430074)
為了保證飛機(jī)的飛行安全,必須對(duì)飛機(jī)空中結(jié)冰的嚴(yán)重程度作出較準(zhǔn)確的判斷。針對(duì)飛機(jī)空中結(jié)冰狀況的復(fù)雜性,提出將支持向量機(jī)與二分法相結(jié)合的飛機(jī)空中結(jié)冰嚴(yán)重程度識(shí)別的算法模型。仿真結(jié)果表明,雖然該訓(xùn)練樣本較少且為多參量分類識(shí)別,但是由于建立了多支持向量機(jī)且采用二分法的概率抉擇能找到最佳的建立支持向量機(jī)的分類方式,所以找到了最佳的分類方式,提高了分類準(zhǔn)確率,而且可以較準(zhǔn)確地識(shí)別飛機(jī)空中結(jié)冰的嚴(yán)重程度??梢娫摲椒梢栽谟?xùn)練樣本較少的情況下對(duì)飛機(jī)空中結(jié)冰嚴(yán)重程度作出較好的識(shí)別效果。
飛機(jī)空中結(jié)冰;支持向量機(jī);二分法
飛機(jī)空中結(jié)冰對(duì)飛機(jī)飛行安全具有重要影響[1],全世界已經(jīng)發(fā)生了很多起由于飛機(jī)空中結(jié)冰而導(dǎo)致的空難事故,使國家和人民承受了巨大的精神和財(cái)產(chǎn)損失。西方發(fā)達(dá)國家早已對(duì)飛機(jī)空中結(jié)冰進(jìn)行了大量研究,中國近年來也意識(shí)到飛機(jī)空中結(jié)冰的嚴(yán)重危害并開展了一系列的研究工作,但對(duì)飛機(jī)空中結(jié)冰嚴(yán)重程度的識(shí)別大多基于單參量。單參量識(shí)別具有一定的局限性,而且鑒于飛機(jī)空中結(jié)冰情況的復(fù)雜性,該研究還不可能獲取大量的訓(xùn)練樣本,為了能夠在訓(xùn)練樣本很少的情況下也能達(dá)到很好的分類效果,本文提出了基于支持向量機(jī)[2-3]的飛機(jī)空中結(jié)冰嚴(yán)重程度識(shí)別方法。在詳細(xì)的分析空中飛機(jī)空中結(jié)冰復(fù)雜性的基礎(chǔ)上,開展冰風(fēng)洞試驗(yàn)進(jìn)行基礎(chǔ)研究,對(duì)影響飛機(jī)空中結(jié)冰的目標(biāo)進(jìn)行特征提取,并利用提取的特征產(chǎn)生初始的訓(xùn)練樣本,然后采用支持向量機(jī)對(duì)小樣本進(jìn)行學(xué)習(xí),再將學(xué)習(xí)的好的分類器結(jié)合二分法和概率論的基本原理進(jìn)行分析識(shí)別。
支持向量機(jī)(support vector machine)是Vapnik于1963年首先提出的,用于解決模式識(shí)別問題,其理論基礎(chǔ)源于統(tǒng)計(jì)學(xué)理論。與神經(jīng)網(wǎng)絡(luò)、遺傳算法、人工智能等現(xiàn)有的學(xué)習(xí)機(jī)相比,在解決小樣本、非線性及高維模式識(shí)別中支持向量機(jī)表現(xiàn)出許多特有的優(yōu)勢。
支持向量機(jī)是從線性可分情況下的最優(yōu)分類面發(fā)展而來的,主要解決的是一個(gè)二分類問題,其基本思想可用如圖1所示的二維情況說明。
圖1 線性可分的最優(yōu)分類線Fig.1 Linear divisible optimal classifier line
圖1中正方形和圓形的圈代表兩類數(shù)據(jù)樣本,H、H1、H2為分類線,它們之間的距離margin=2/‖w‖。SVM就是要尋找一個(gè)滿足要求的H、H1、H2,使訓(xùn)練樣本中的點(diǎn)距離H盡可能地遠(yuǎn),亦即使其兩側(cè)的margin盡可能大。
現(xiàn)實(shí)世界的實(shí)際問題很多是非線性問題,為了在此種情況下仍能實(shí)現(xiàn)支持向量機(jī),于是引入了核函數(shù),即通過一個(gè)非線性映射,把輸入映射到另一個(gè)可以使用支持向量機(jī)處理的高維空間,然后計(jì)算高維空間的內(nèi)積。
常用的核函數(shù)K(xi·xj)有以下兩種:
線性核函數(shù):K(x·ix)j=
徑向基函數(shù)(RBF):K(x·ix)j=exp(-|xi-xj|2/σ2)
由于飛機(jī)空中結(jié)冰的嚴(yán)重程度識(shí)別是多分類問題,所以為了更好的分類,我們采用了二分法。其分類原理如圖2所示。
圖2 二分法基本原理Fig.2 Basic principle of method of bisection
如圖2所示,二分法解決多分類問題就是將多類看成一個(gè)整體,每次采用一個(gè)SVM將其分成兩類,再將余下的訓(xùn)練集用另一個(gè)SVM分成兩類,以此類推,直到分出所有的類為止。由此可知,對(duì)于n分類需要構(gòu)建n-1個(gè)支持向量機(jī)。
支持向量機(jī)可用于飛機(jī)空中結(jié)冰嚴(yán)重程度,主要體現(xiàn)在以下幾個(gè)方面:
1)飛機(jī)空中結(jié)冰對(duì)飛機(jī)的影響程度受冰型(明冰、淞冰、混合冰)、溫度、結(jié)冰速率、冰厚等因素的共同影響,所以飛機(jī)空中結(jié)冰的識(shí)別本質(zhì)上是一個(gè)高維模式識(shí)別的問題,而支持向量機(jī)的特點(diǎn)是使其適合于解決高維模式識(shí)別的問題;
2)飛機(jī)空中結(jié)冰的真實(shí)數(shù)據(jù)極難獲取,冰風(fēng)洞模擬試驗(yàn)數(shù)據(jù)也比較難于獲取,所以其仿真分析的數(shù)據(jù)樣本往往是小樣本,而支持向量機(jī)恰好適合于解決小樣本的問題;
3)支持向量機(jī)已在飛機(jī)空中結(jié)冰的冰型識(shí)別方面取得了一定發(fā)展[4],為多參量識(shí)別提供了依據(jù)。
飛機(jī)空中結(jié)冰數(shù)據(jù)獲取的關(guān)鍵在于兩方面:探測裝置(傳感器)和模擬實(shí)驗(yàn)(結(jié)冰風(fēng)洞試驗(yàn))。
作為飛機(jī)空中結(jié)冰的探測裝置[5],目前飛機(jī)空中結(jié)冰傳感器在國內(nèi)的相關(guān)研究比較少,目前國內(nèi)只有華中科技大學(xué)等少數(shù)科研單位在進(jìn)行飛機(jī)空中結(jié)冰探測技術(shù)的研究。作為飛機(jī)空中結(jié)冰的試驗(yàn)環(huán)境,國內(nèi)僅有武漢航空儀表有限責(zé)任公司等極少的幾家單位擁有結(jié)冰風(fēng)洞。
本文選用的是自行研制開發(fā)的光纖式飛機(jī)空中結(jié)冰探測系統(tǒng),在武漢航空儀表有限責(zé)任公司的結(jié)冰風(fēng)洞中進(jìn)行模擬試驗(yàn)而獲取的。
美國國家大氣研究中心(NCAR)將結(jié)冰的嚴(yán)重性指數(shù)S用數(shù)字0~10來表示,嚴(yán)重程度隨數(shù)值的增大而增加[6]。前蘇聯(lián)將積冰強(qiáng)度按單位時(shí)間內(nèi)的積冰厚度劃分為輕度(<0.6 mm/min)、中度(0.6~1.0 mm/min)、重度(>1.0 mm/min)3個(gè)等級(jí)。因此,依據(jù)結(jié)冰厚度和結(jié)冰速率的綜合影響將飛機(jī)空中結(jié)冰嚴(yán)重程度劃分為未結(jié)冰狀態(tài)、輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)共4個(gè)嚴(yán)重程度。
將獲取的38個(gè)數(shù)據(jù)樣本根據(jù)結(jié)冰嚴(yán)重程度等級(jí)分為四個(gè)等級(jí),每個(gè)數(shù)據(jù)樣本包括溫度、結(jié)冰持續(xù)時(shí)間、冰厚對(duì)應(yīng)的電壓值和結(jié)冰速率。用于支持向量機(jī)的數(shù)據(jù)樣本,如表1所示。
表1 訓(xùn)練及測試樣本Tab.1 Train and test sample
由于數(shù)據(jù)樣本對(duì)SVM的分類識(shí)別具有決定性的影響作用,所以在訓(xùn)練之前需對(duì)數(shù)據(jù)樣本進(jìn)行歸一化處理,使每個(gè)數(shù)據(jù)在一個(gè)給定的范圍內(nèi)(一般?。?1,1)之間),避免數(shù)據(jù)樣本之間的大小差異性。歸一化公式如下
式中:X*為歸一化后的值;X為歸一化前的值;Xmax、
Xmin為此影響因素中的最大值和最小值。
通過嘗試仿真各種核函數(shù),本課題選取線性(linear)核函數(shù)作為該SVM的分類核函數(shù),將訓(xùn)練數(shù)據(jù)二分類進(jìn)行訓(xùn)練,即每次將一個(gè)結(jié)冰等級(jí)作為一類,余下的一類或幾類作為另一類進(jìn)行訓(xùn)練。如將未結(jié)冰狀態(tài)作為一類,將輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)作為另一類訓(xùn)練。
為了提高飛機(jī)空中結(jié)冰嚴(yán)重程度識(shí)別的準(zhǔn)確率,經(jīng)過研究發(fā)現(xiàn),對(duì)于多分類問題,不同的分類循序(即想把哪一類從多類中分出來)可以影響分類的準(zhǔn)確率,于是提出了基于二分法的概率抉擇。
對(duì)于n分類問題所需構(gòu)建的n-1個(gè)支持向量機(jī)而言,其每一個(gè)支持向量機(jī)可能構(gòu)建的二分類可能有多種可能性,如圖2所示的SVM1可能的SVM二分類情況如圖3所示。
圖3 基于二分法的概率抉擇Fig.3 Probility choice based on method of bisection
對(duì)應(yīng)于每種可能分類情況的分類準(zhǔn)確率可能各不相同,設(shè)對(duì)應(yīng)于SVM1的n情況的分類準(zhǔn)確率分別為 P11、P12、…、P1n,則對(duì)應(yīng)于 SVMi的分類準(zhǔn)確率分別為Pi1、Pi2、…、Pi(n-1),由此得最終的分類準(zhǔn)確率P=P1x×P2y× … × Pnz,x∈1,2,…,n;y∈1,2,…,n-1;z=1。要提高分類的準(zhǔn)確性就是要提高每個(gè)SVM的分類準(zhǔn)確率,也就是對(duì)應(yīng)于每個(gè)SVM,要從可能的分類情況中找出一個(gè)分類準(zhǔn)確率高的情況,再在此情況下依次向下分。
因此,一種可行的提高多分類問題分類準(zhǔn)確率的方法就是對(duì)根據(jù)一個(gè)數(shù)據(jù)樣本的可能分類情況將其每一種情況都建立一個(gè)支持向量機(jī),然后再比較其分類準(zhǔn)確率,從中挑選出分類準(zhǔn)確率較高的分類情況,再按相同的方法在此基礎(chǔ)上繼續(xù)往下分類,直至所有情況都被分類完全。
本文的分類屬于多分類,采用的是one-againstall多分類法,通過構(gòu)建3個(gè)SVM來區(qū)分4類樣本數(shù)據(jù),并通過二分法的概率抉擇來提高分類的準(zhǔn)確率。第1個(gè)SVM的構(gòu)建有4種可能情況,于是構(gòu)建了4個(gè)SVM,然后再比較它們的分類準(zhǔn)確率,以確定第1個(gè)SVM的分類方式。0、1、2、3分別代表未結(jié)冰狀態(tài)、輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài),[0:1-2-3]代表將未結(jié)冰狀態(tài)作為一類,將輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)作為另一類訓(xùn)練,檢驗(yàn)結(jié)果如表2所示。
表2 SVM1檢驗(yàn)結(jié)果Tab.2 SVM1test result
由表2可知,[0:1-2-3]分類方式構(gòu)建的SVM能將未結(jié)冰狀態(tài)和輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)完全區(qū)分開,為四種可能的分類情況中準(zhǔn)確率最高的一種。因此第一個(gè)SVM將先區(qū)分有冰狀態(tài)和無冰狀態(tài)。
經(jīng)過第1次區(qū)分后,只需區(qū)分輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)。第2個(gè)SVM的構(gòu)建有3種情況,檢驗(yàn)結(jié)果如表3所示。
表3 SVM2檢驗(yàn)結(jié)果Tab.3 SVM2test result
由表3可知,[1:2-3]分類方式構(gòu)建的SVM能將輕度結(jié)冰狀態(tài)和中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)完全區(qū)分開,為四種可能的分類情況中準(zhǔn)確率最高的一種。因此第2個(gè)SVM將區(qū)分輕度結(jié)冰狀態(tài)和中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)。
經(jīng)過第2次區(qū)分后,只需區(qū)分中度結(jié)冰狀態(tài)和重度結(jié)冰狀態(tài)。第3個(gè)SVM的構(gòu)建只有一種可能性,檢驗(yàn)結(jié)果如表4所示。
表4SVM3檢驗(yàn)結(jié)果Tab.4 SVM3test result
由表4可知,該SVM能正確區(qū)分中度結(jié)冰和重度結(jié)冰。
通過以上分析可發(fā)現(xiàn):采用先從未結(jié)冰狀態(tài)、輕度結(jié)冰狀態(tài)、中度結(jié)冰狀態(tài)、重度結(jié)冰狀態(tài)所組成的總樣本中區(qū)分出未結(jié)冰狀態(tài),然后再從剩余的樣本中區(qū)分出輕度結(jié)冰狀態(tài)、再從剩余樣本中區(qū)分中度結(jié)冰狀態(tài)和重度結(jié)冰狀態(tài)的樣本的分類順序可以達(dá)到最佳的分類準(zhǔn)確率。
若令識(shí)別率Px=S1x×S2x×S3x(S1x、S2x、S3x分別為某種分類方式在某個(gè)支持向量機(jī)的分類準(zhǔn)確率,如S12則為[1:0-2-3]這種分類方式在第一個(gè)構(gòu)建的支持向量機(jī)下對(duì)應(yīng)的分類準(zhǔn)確率),則對(duì)于本試驗(yàn)樣本若采用本文提出的支持向量機(jī)與二分法相結(jié)合的分類方式的分類準(zhǔn)確率為P=S11×S21×S31=100%×100%×100%=100%,而當(dāng)采用其它分類方式的分類準(zhǔn)確率時(shí),則由于參數(shù) S1x 本文探討了基于支持向量機(jī)的飛機(jī)空中結(jié)冰嚴(yán)重程度的識(shí)別,采用二分法來解決多分類問題,并提出了基于二分法的概率抉擇的方法。從檢驗(yàn)結(jié)果顯示,支持向量機(jī)能夠較好地對(duì)飛機(jī)空中結(jié)冰的嚴(yán)重程度作出分類識(shí)別;不采用二分法的概率抉擇,不能夠完全正確的對(duì)飛機(jī)空中結(jié)冰嚴(yán)重程度進(jìn)行分類識(shí)別,而采用了二分法的概率抉擇之后分類的準(zhǔn)確率大大提高。未來的研究方向?qū)⑹窃诤撕瘮?shù)的選取方面再進(jìn)行仔細(xì)的研究。 [1] 張德躍,王國棟.警惕!飛機(jī)結(jié)冰[J].江蘇航空,2008(1):12. [2]VAPNIK V N.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].北京:清華大學(xué)出版社,2000. [3] 鄧乃揚(yáng),田英杰.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].北京:科學(xué)出版社,2009. [4] 張 鎮(zhèn),葉 林.基于支持向量機(jī)的主動(dòng)紅外式結(jié)冰冰型分類方法研究[J].計(jì)算機(jī)應(yīng)用研究,2010(7):2560-2562. [5] 張 杰,周 磊,張 洪,等.飛機(jī)空中結(jié)冰探測技術(shù)[J].儀器儀表學(xué)報(bào),2006,27(12):1578-1586. [6]POLITOVICH M K,SAND W R.A Proposed Icing Severity Index Based Upon Meteorology[C]//4th International Conference on Aviation Weather Systems,1991:24-27. Aircraft Air Icing Severity Recognition Based on Support Vector Machine ZOU Jie, GE Jun-feng,YE Lin, ZHENG Ying,ZHANG Hong In order to guarantee the aircraft flight safety, must on the severity of the aircraft air icing a more accurate judgment.Aiming at the complexity of the aircraft air icing conditions,the aircraft air icing severity recognition algorithm model was built which mixed SVM (support vector machine) and method of bisection.The simulation results show that, although the training sample is not enough and there are many parameters,but due to not only one support vector machine and with dichotomy of probability choices can find the best build SVM classification approach, and found the perfect classification method, improve the classification accuracy,but also can accurately identify the aircraft air icing severity.So this method make good recognition effect of the aircraft air icing severity even there are not enough the training sample. aircraft air icing;SVM;method of bisection TN911 A 1674-5590(2011)02-0009-04 2010-10-09; 2011-01-04 基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(60975030) 鄒 杰(1986—),男,湖南長沙人,碩士研究生,研究方向?yàn)榻Y(jié)冰探測、數(shù)據(jù)處理. (責(zé)任編輯:楊媛媛)4 結(jié)語
(Dept of Control Science&Engineering,Huazhong University of Science&Technology,Wuhan 430074, China)