徐 濤,蘇 瀚,楊國(guó)慶(.中國(guó)民航大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津 300300;.中國(guó)民航信息技術(shù)科研基地,天津 300300)
?
基于空間擬合和神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)噪聲預(yù)測(cè)集成模型
徐 濤1,2*,蘇 瀚1,楊國(guó)慶2(1.中國(guó)民航大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津 300300;2.中國(guó)民航信息技術(shù)科研基地,天津 300300)
摘要:將集成學(xué)習(xí)方法引入到機(jī)場(chǎng)噪聲預(yù)測(cè)中,提出一種基于空間擬合和神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)噪聲預(yù)測(cè)集成模型.該模型采用空間擬合算法和BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建基學(xué)習(xí)器,然后通過所提出的基于觀察學(xué)習(xí)的異構(gòu)集成算法將基學(xué)習(xí)器集成起來,獲得集成的機(jī)場(chǎng)噪聲預(yù)測(cè)結(jié)果.該模型通過集成多個(gè)異構(gòu)機(jī)場(chǎng)噪聲預(yù)測(cè)基學(xué)習(xí)器,能夠有效提升預(yù)測(cè)準(zhǔn)確率.實(shí)驗(yàn)結(jié)果表明,本文所提出的基于觀察學(xué)習(xí)的異構(gòu)集成算法,較之其他異構(gòu)集成算法,在解決機(jī)場(chǎng)噪聲預(yù)測(cè)問題上準(zhǔn)確性更高、容錯(cuò)性更強(qiáng).
關(guān)鍵詞:機(jī)場(chǎng)噪聲預(yù)測(cè);空間擬合;神經(jīng)網(wǎng)絡(luò);集成學(xué)習(xí);觀察學(xué)習(xí)
* 責(zé)任作者, 教授, txu@cauc.edu.cn
近年來,隨著民航業(yè)的飛速發(fā)展,全國(guó)各地正在不斷改建、擴(kuò)建、新增大批機(jī)場(chǎng),機(jī)場(chǎng)吞吐能力及占地規(guī)模都相應(yīng)地?cái)U(kuò)大.機(jī)場(chǎng)周邊地區(qū)的城鎮(zhèn)化進(jìn)程也隨之加快,機(jī)場(chǎng)用地與城鎮(zhèn)用地越來越靠近,由機(jī)場(chǎng)噪聲影響所引起的矛盾、糾紛也越來越多.如何有效地解決機(jī)場(chǎng)噪聲問題是民航各單位面臨的一個(gè)重要課題,而機(jī)場(chǎng)噪聲預(yù)測(cè)是環(huán)境評(píng)估和噪聲控制的前提,能夠?yàn)闄C(jī)場(chǎng)周圍用地規(guī)劃提供依據(jù)[1].因此,科學(xué)合理地構(gòu)建機(jī)場(chǎng)噪聲預(yù)測(cè)模型具有重要意義.
飛機(jī)噪聲具有聲壓級(jí)高、低頻(<250Hz)噪聲大、噪聲源非穩(wěn)態(tài)運(yùn)動(dòng)、影響范圍廣且有時(shí)空間斷性及累加性等特征,國(guó)外很早就開展了機(jī)場(chǎng)噪聲及其預(yù)測(cè)模型的研究,其中美國(guó)聯(lián)邦航空局(FAA)提出的綜合噪聲模型INM(Integrated Noise Model)應(yīng)用最為廣泛.該模型根據(jù)預(yù)測(cè)點(diǎn)到飛機(jī)航跡的距離,通過對(duì)飛機(jī)既有基本聲學(xué)數(shù)據(jù)插值來計(jì)算預(yù)測(cè)點(diǎn)的噪聲級(jí),并在此基礎(chǔ)上運(yùn)用噪聲影響因素修正模型對(duì)噪聲級(jí)進(jìn)行修正,從而得出實(shí)際噪聲級(jí).但該模型需要大量參數(shù),而在現(xiàn)實(shí)環(huán)境中,很難全面、精確地獲取這些參數(shù),從而致使預(yù)測(cè)精度較低.
由于機(jī)場(chǎng)噪聲與其影響因素之間存在復(fù)雜的非線性關(guān)系,傳統(tǒng)的方法很難建立相應(yīng)的函數(shù)模型.而理論證明,機(jī)器學(xué)習(xí)可以以任意精度擬合任意復(fù)雜的非線性函數(shù).因此,不少學(xué)者采用機(jī)器學(xué)習(xí)的方法開展機(jī)場(chǎng)噪聲預(yù)測(cè)研究.文獻(xiàn)[2-3]分別采用BP神經(jīng)網(wǎng)絡(luò)算法和支持向量機(jī)算法構(gòu)建機(jī)場(chǎng)噪聲預(yù)測(cè)學(xué)習(xí)器,然而其實(shí)驗(yàn)的預(yù)測(cè)結(jié)果與真實(shí)情況仍有較大差距.研究發(fā)現(xiàn),依靠單一學(xué)習(xí)器提高學(xué)習(xí)能力是一項(xiàng)比較困難的工作,而集成學(xué)習(xí)是提升學(xué)習(xí)效果的有效途徑[4].文獻(xiàn)[5]提出一種基于動(dòng)態(tài)集成學(xué)習(xí)的機(jī)場(chǎng)噪聲預(yù)測(cè)模型,該模型在一定程度上提升了模型的預(yù)測(cè)精度,但同構(gòu)集成模型魯棒性較差.為此,開展機(jī)場(chǎng)噪聲異構(gòu)集成模型的研究具有重要意義,而由不同算法構(gòu)造的學(xué)習(xí)器的異構(gòu)集成,一直是集成學(xué)習(xí)中的難點(diǎn)[6].本文用空間擬合算法和BP神經(jīng)網(wǎng)絡(luò)算法分別構(gòu)建基學(xué)習(xí)器,引入觀察學(xué)習(xí)將異構(gòu)的基學(xué)習(xí)器集成起來,提出基于觀察學(xué)習(xí)的異構(gòu)集成算法.將這種異構(gòu)集成算法應(yīng)用于解決機(jī)場(chǎng)噪聲預(yù)測(cè)問題,預(yù)測(cè)準(zhǔn)確性有顯著的提高.
1.1 機(jī)場(chǎng)噪聲影響因素
圖1 機(jī)場(chǎng)噪聲主要影響因素Fig.1 The main factors affecting airport noise
機(jī)場(chǎng)噪聲與航班信息,氣象信息及飛機(jī)自身的一些屬性密切相關(guān)[7].航班信息中,飛機(jī)的飛行高度、距觀察點(diǎn)的直線距離、操作類型(起飛還是降落)顯著影響噪聲影響區(qū)域;氣象信息中,平均風(fēng)速和是否降雨影響噪聲傳播距離;飛機(jī)自身屬性中,發(fā)動(dòng)機(jī)推力影響聲源產(chǎn)生噪聲的大小.然而,發(fā)動(dòng)機(jī)推力屬性無法通過機(jī)場(chǎng)噪聲監(jiān)測(cè)數(shù)據(jù)獲取.通常,飛機(jī)在航跡穩(wěn)定的情況下,推力與飛行速度成線性關(guān)系[8].民航飛機(jī)不會(huì)做復(fù)雜飛行動(dòng)作.一般認(rèn)為是航跡穩(wěn)定的,因此可以用飛機(jī)的飛行速度屬性來替代推力.同時(shí),單次飛行事件所產(chǎn)生的噪聲值用EPNL(有效感覺噪聲級(jí))表示.機(jī)場(chǎng)噪聲的主要影響因素歸納在圖1中.
1.2 觀察學(xué)習(xí)算法
文獻(xiàn)[9]首次提出在BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中合理地加入虛擬數(shù)據(jù),可以顯著提升神經(jīng)網(wǎng)絡(luò)的性能.文獻(xiàn)[10]在此基礎(chǔ)上結(jié)合集成學(xué)習(xí)的概念,提出一種神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)算法并將其命名為觀察學(xué)習(xí)算法.采用bagging方法[11]將機(jī)場(chǎng)噪聲監(jiān)測(cè)數(shù)據(jù)集抽樣為H個(gè)數(shù)據(jù)子集Di,i=1,2,…H.其中,表示數(shù)據(jù)集中的第i條數(shù)據(jù)記錄,構(gòu)建機(jī)場(chǎng)噪聲預(yù)測(cè)模型,即是要尋找各噪聲影響因素與噪聲值大小關(guān)系的函數(shù)表達(dá),即:即為神經(jīng)網(wǎng)絡(luò)的輸入?yún)⒘?y代表在這一條件下監(jiān)測(cè)到的噪聲值,其為神經(jīng)網(wǎng)絡(luò)的輸出參量;依次代表飛機(jī)飛行高度、距觀察點(diǎn)的直線距離、操作類型、平均風(fēng)速、是否降雨、飛行速度,為神經(jīng)網(wǎng)絡(luò)的輸入?yún)⒘?通過對(duì)每個(gè)子集Di訓(xùn)練得到神經(jīng)網(wǎng)絡(luò)fi,然后通過觀察階段和訓(xùn)練階段的不斷迭代可逐漸逼近最優(yōu)權(quán)重值.
觀察階段產(chǎn)生每個(gè)網(wǎng)絡(luò)的虛擬數(shù)據(jù)子集:對(duì)
訓(xùn)練階段:在第t次迭代中,對(duì)每個(gè)神經(jīng)網(wǎng)絡(luò)fi更新權(quán)重系數(shù),其更新公式為:
是標(biāo)準(zhǔn)均方誤差函數(shù).權(quán)重系數(shù)每次在iiD∪ V?上更新,第1次迭代時(shí)只有原始數(shù)據(jù)而沒有虛擬數(shù)據(jù).
觀察階段求每個(gè)網(wǎng)絡(luò)的虛擬數(shù)據(jù)集,將虛擬數(shù)據(jù)集代入訓(xùn)練階段反復(fù)迭代更新權(quán)重系數(shù)集,可逐步達(dá)到最優(yōu).表1給出了觀察學(xué)習(xí)的算法描述.
表1 觀察學(xué)習(xí)算法Table 1 The observational learning algorithm
觀察學(xué)習(xí)算法用于多個(gè)神經(jīng)網(wǎng)絡(luò)的集成,由于多個(gè)神經(jīng)網(wǎng)絡(luò)屬于同構(gòu)學(xué)習(xí)器,因此觀察學(xué)習(xí)算法是一種同構(gòu)集成算法.然而在解決機(jī)場(chǎng)噪聲預(yù)測(cè)問題上,同構(gòu)學(xué)習(xí)器所構(gòu)建的預(yù)測(cè)模型實(shí)驗(yàn)結(jié)果沒有達(dá)到預(yù)期的準(zhǔn)確率[2-3].因此,本文提取觀察學(xué)習(xí)的核心思想,將添加虛擬數(shù)據(jù)集的做法應(yīng)用于異構(gòu)學(xué)習(xí)器的集成中,提出基于觀察學(xué)習(xí)的異構(gòu)集成算法.
圖2 基于空間擬合和神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)噪聲預(yù)測(cè)集成模型流程Fig.2 The process of airport noise ensemble prediction model based on space fitting and neural network
基于空間擬合和神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)噪聲預(yù)測(cè)集成模型,將觀察學(xué)習(xí)“訓(xùn)練、觀察、再訓(xùn)練”的學(xué)習(xí)機(jī)制運(yùn)用于異構(gòu)基學(xué)習(xí)器的集成上,分別采用兩種算法生成基學(xué)習(xí)器,然后通過觀察其他學(xué)習(xí)器加入虛擬數(shù)據(jù)進(jìn)行再訓(xùn)練,最后將多個(gè)學(xué)習(xí)器的結(jié)果集成,得到最終輸出結(jié)果.完整的預(yù)測(cè)集成模型流程如圖2所示.
2.1 基學(xué)習(xí)器的構(gòu)建
集成學(xué)習(xí)中,基學(xué)習(xí)器之間必須有比較明顯的差異且各個(gè)基學(xué)習(xí)器的準(zhǔn)確率必須在50%以上才能保證集成后效果的提升[12].因此,本文采用空間擬合和神經(jīng)網(wǎng)絡(luò)兩種算法生成基學(xué)習(xí)器以滿足學(xué)習(xí)器之間的差異性.同時(shí)在集成過程中,只選用準(zhǔn)確率高于50%的基學(xué)習(xí)器.
2.1.1 基于空間擬合的基學(xué)習(xí)器的構(gòu)建 輸入屬性和輸出屬性的映射關(guān)系,可以展示在多維空間中.空間擬合算法將訓(xùn)練數(shù)據(jù)的輸入輸出投影到空間曲面上,通過尋找最優(yōu)擬合曲面來逼近訓(xùn)練數(shù)據(jù)點(diǎn)在空間的映射關(guān)系[13],獲得輸入輸出的映射函數(shù).
采用三維空間向量擬合法,在數(shù)據(jù)集中的任選3個(gè)輸入屬性,構(gòu)成屬性組(α1, α2, α3),且以該屬性組為坐標(biāo)軸構(gòu)建三維空間.假設(shè)對(duì)應(yīng)于該屬性組中任意一條噪聲監(jiān)測(cè)數(shù)據(jù)記錄,其中,xp代表屬性α1對(duì)應(yīng)的值,yp代表屬性α2對(duì)應(yīng)的值,zp代表屬性α3對(duì)應(yīng)的值,m代表該條監(jiān)測(cè)數(shù)據(jù)記錄對(duì)應(yīng)的噪聲值,那么該條監(jiān)測(cè)數(shù)據(jù)與三維空間中的點(diǎn)一一對(duì)應(yīng).以三維空間的坐標(biāo)原點(diǎn)到該條數(shù)據(jù)記錄對(duì)應(yīng)的監(jiān)測(cè)點(diǎn)之間的線段OP構(gòu)造向量msinθ sin φ ,m cos θ ),其中,θ表示OP?與Z軸夾角,φ表示OP平面投?影與X軸夾角與OP構(gòu)成的向量方向相同,?等于噪聲值m.那么以原點(diǎn)作為向量起始點(diǎn),則的末端點(diǎn)將分布在一個(gè)空間曲面上.于是構(gòu)造擬合曲面方程:
代入χ?的末端點(diǎn)坐標(biāo),曲面表示為:
式(2)(4)聯(lián)立構(gòu)成預(yù)測(cè)基學(xué)習(xí)器.聯(lián)立方程組可求解得直線與空間曲面J( x , y , z )的交點(diǎn).交點(diǎn)S與原點(diǎn)的距離即為點(diǎn)Q所對(duì)應(yīng)的噪聲值大小.在訓(xùn)練基學(xué)習(xí)器時(shí),將輸入屬性進(jìn)行三元組劃分后分別訓(xùn)練,最終將得到多個(gè)有差異的基學(xué)習(xí)器. 2.1.2 基于神經(jīng)網(wǎng)絡(luò)的基學(xué)習(xí)器的構(gòu)建 在測(cè)試不同結(jié)構(gòu)及層數(shù)的神經(jīng)網(wǎng)絡(luò)后發(fā)現(xiàn),采用三層BP神經(jīng)網(wǎng)絡(luò)構(gòu)建機(jī)場(chǎng)噪聲預(yù)測(cè)基學(xué)習(xí)器能夠有效模擬噪聲傳播狀況,在保證預(yù)測(cè)準(zhǔn)確性的同時(shí)運(yùn)算復(fù)雜度也不高.由于噪聲問題對(duì)傳遞函數(shù)的選擇不敏感,因此選用最常用的正切S型函數(shù)作為輸入層與隱含層的傳遞函數(shù).為減少運(yùn)算量,采用線性函數(shù)作為輸出層的傳遞函數(shù).
表2 神經(jīng)網(wǎng)絡(luò)基學(xué)習(xí)器訓(xùn)練方法Table 2 The training method of base neural network learner
由于輸入屬性中有非數(shù)值屬性,且數(shù)值屬性之間數(shù)量級(jí)相差很大,這會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中不收斂或者收斂很慢,因此需對(duì)數(shù)據(jù)進(jìn)行預(yù)處理.對(duì)于非數(shù)值屬性,如是否降雨和操作類型,將其轉(zhuǎn)化為邏輯值.對(duì)于數(shù)值屬性值b,采用歸一化方式將其轉(zhuǎn)化為[0,10]之內(nèi)的數(shù)值B,且
式中,max(b )和min(b )分別是樣本中屬性的最大值和最小值.
為生成多個(gè)不同神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)器,采用bagging方法,從原始訓(xùn)練數(shù)據(jù)中抽樣形成不同的數(shù)據(jù)子集.在不同的子集上訓(xùn)練即可得到不同的學(xué)習(xí)器.基于神經(jīng)網(wǎng)絡(luò)的基學(xué)習(xí)器訓(xùn)練方法如表2所示.由表2中的方法可以生成10個(gè)不同的神經(jīng)網(wǎng)絡(luò)基學(xué)習(xí)器.
2.2 基于觀察學(xué)習(xí)的異構(gòu)基學(xué)習(xí)器集成
對(duì)基于空間擬合和基于神經(jīng)網(wǎng)絡(luò)的多個(gè)基學(xué)習(xí)器,必須采用異構(gòu)集成算法才能有效集成.將觀察學(xué)習(xí)進(jìn)行改進(jìn)調(diào)整,提出基于觀察學(xué)習(xí)的異構(gòu)集成算法,算法描述如表3所示.
表3 基于觀察學(xué)習(xí)的異構(gòu)集成算法Table 3 The heterogeneous ensemble algorithm based on observational learning
經(jīng)過上述集成算法,可將多個(gè)異構(gòu)基學(xué)習(xí)器最終集成在一起,實(shí)驗(yàn)階段將證明該集成算法的有效性.
為了有效開展機(jī)場(chǎng)噪聲監(jiān)測(cè)及預(yù)警研究,收集噪聲監(jiān)測(cè)數(shù)據(jù)并進(jìn)行分析,為機(jī)場(chǎng)噪聲管理控制提供保障與支持,北京首都國(guó)際機(jī)場(chǎng)安裝部署了丹麥BK公司的噪聲與運(yùn)行監(jiān)測(cè)系統(tǒng).根據(jù)首都國(guó)際機(jī)場(chǎng)的跑道及主航跡信息,在機(jī)場(chǎng)周邊選取21個(gè)噪聲敏感區(qū)域部署3639E型噪聲監(jiān)測(cè)終端設(shè)備,麥克風(fēng)采用的是4952型戶外麥克風(fēng).
其中,噪聲敏感區(qū)管頭監(jiān)測(cè)點(diǎn)(NMT3)的監(jiān)測(cè)數(shù)據(jù)包含風(fēng)速等氣象信息,故選取監(jiān)測(cè)點(diǎn)NMT3所監(jiān)測(cè)到的航空噪聲數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù).噪聲監(jiān)測(cè)設(shè)備全天時(shí)、全天候自動(dòng)采集,每隔0.5S采集1個(gè)噪聲數(shù)據(jù).但由于飛機(jī)起飛或降落有時(shí)間間隔,導(dǎo)致并不是采集到的每一個(gè)數(shù)據(jù)都有意義,大部分監(jiān)測(cè)數(shù)據(jù)都是臟數(shù)據(jù),而只有能夠與飛行航跡和航班計(jì)劃關(guān)聯(lián)上的監(jiān)測(cè)數(shù)據(jù)才有意義.因此,基于航空器噪聲識(shí)別處理,結(jié)合飛行航跡及航班計(jì)劃,篩選出能夠與飛行航跡及航班計(jì)劃關(guān)聯(lián)的噪聲監(jiān)測(cè)數(shù)據(jù)作為本文實(shí)驗(yàn)數(shù)據(jù).選取該機(jī)場(chǎng)飛行事件數(shù)量最多的4種機(jī)型B738, B733,A320,A321,分為4組進(jìn)行實(shí)驗(yàn),驗(yàn)證各基學(xué)習(xí)器對(duì)噪聲預(yù)測(cè)的效果,以及最終集成后的預(yù)測(cè)效果.實(shí)驗(yàn)數(shù)據(jù)集如表4所示.
實(shí)驗(yàn)分為3個(gè)部分:分別構(gòu)建空間擬合算法生成基學(xué)習(xí)器、神經(jīng)網(wǎng)絡(luò)算法生成基學(xué)習(xí)器和基于觀察學(xué)習(xí)的異構(gòu)集成算法集成多個(gè)基學(xué)習(xí)器進(jìn)行機(jī)場(chǎng)噪聲預(yù)測(cè).學(xué)習(xí)器的輸入屬性為機(jī)場(chǎng)噪聲的影響因素,輸出屬性為噪聲值.每種機(jī)型的實(shí)驗(yàn)數(shù)據(jù)格式如表5所示,表5中左部6列屬性是圖1中的6種機(jī)場(chǎng)噪聲影響因素,最右列EPNL值是對(duì)應(yīng)的輸出屬性.
表4 實(shí)驗(yàn)數(shù)據(jù)Table 4 The experimental data
對(duì)于6個(gè)輸入屬性,可以組合形成15個(gè)三元組.對(duì)每個(gè)三元組使用訓(xùn)練集進(jìn)行空間擬合訓(xùn)練,并用測(cè)試進(jìn)行驗(yàn)證.實(shí)驗(yàn)發(fā)現(xiàn),有的三元組擬合效果較好,如圖3所示B738在(距離,高度,速度)上擬合的曲面.而有些三元組無法擬合出合適的曲面,如圖4所示B738在(距離,高度,風(fēng)速)上擬合的曲面.經(jīng)分析,擬合效果不好是所選三元組對(duì)于噪聲值無法構(gòu)成有效映射.故通過實(shí)驗(yàn),在構(gòu)建基學(xué)習(xí)器時(shí),只選用預(yù)測(cè)誤差1dB以內(nèi)且準(zhǔn)確率高于60%的三元組.最終選擇9個(gè)三元組構(gòu)建9個(gè)空間擬合基學(xué)習(xí)器.
表5 訓(xùn)練數(shù)據(jù)格式Table 5 The format of training data
圖3 B738在(距離,高度,速度)上擬合結(jié)果Fig.3 The fitting results on (distance, height, speed) of B738
圖4 B738在(距離,高度,風(fēng)速)上擬合結(jié)果Fig.4 The fitting results on (distance, height, wind) of B738
圖5是針對(duì)4種機(jī)型,采用9個(gè)基學(xué)習(xí)器進(jìn)行測(cè)試的預(yù)測(cè)結(jié)果,以平均累計(jì)誤差分布表示.
圖5 空間擬合方法的預(yù)測(cè)結(jié)果Fig.5 The prediction results of space fitting model
由圖5的統(tǒng)計(jì)結(jié)果可以看出,空間擬合方法在噪聲誤差超過4dB以上時(shí)其預(yù)測(cè)準(zhǔn)確率較高,但在噪聲誤差范圍為1至3dB內(nèi)效果較差.而在機(jī)場(chǎng)噪聲評(píng)價(jià)中,5dB足以區(qū)分一個(gè)污染等級(jí),因此該方法的預(yù)測(cè)精度尚不能滿足實(shí)際需要.
3.2 BP神經(jīng)網(wǎng)絡(luò)算法生成基學(xué)習(xí)器進(jìn)行機(jī)場(chǎng)噪聲預(yù)測(cè)
采用隨機(jī)抽樣方式訓(xùn)練10個(gè)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)基學(xué)習(xí)器.通過實(shí)驗(yàn)表明:當(dāng)輸入層、隱含層神經(jīng)元數(shù)分別為6和10時(shí),網(wǎng)絡(luò)能很快達(dá)到預(yù)定精度.本文網(wǎng)絡(luò)輸出只有噪聲事件的EPNL值,因此選擇輸出層神經(jīng)元數(shù)量為1.為了加快網(wǎng)絡(luò)的收斂速度以及避免陷入局部最小,采用帶附加動(dòng)量項(xiàng)和自適應(yīng)學(xué)習(xí)率的BP網(wǎng)絡(luò)[15-16].
由于隨機(jī)抽樣每次抽出的樣本都不一樣,加之神經(jīng)網(wǎng)絡(luò)獲得的是局部最優(yōu)解,每次得到的預(yù)測(cè)值也可能不同.故重復(fù)5次訓(xùn)練,計(jì)算預(yù)測(cè)準(zhǔn)確率的均值.圖6是針對(duì)四種不同機(jī)型,采用10個(gè)神經(jīng)網(wǎng)絡(luò)基學(xué)習(xí)器進(jìn)行測(cè)試的預(yù)測(cè)結(jié)果,以平均累計(jì)誤差分布表示.從圖6的結(jié)果可見,神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練的基學(xué)習(xí)器學(xué)習(xí)能力較空間擬合基學(xué)習(xí)器效果稍好,但仍然無法達(dá)到較高的預(yù)測(cè)準(zhǔn)確率.
圖6 神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)結(jié)果Fig.6 The prediction results of neural network model
3.3 基于觀察學(xué)習(xí)的異構(gòu)集成算法集成多個(gè)基學(xué)習(xí)器進(jìn)行機(jī)場(chǎng)噪聲預(yù)測(cè)
在分別獲得多個(gè)空間擬合和神經(jīng)網(wǎng)絡(luò)基學(xué)習(xí)器后,運(yùn)用3.2節(jié)中提出的集成算法將多個(gè)異構(gòu)基學(xué)習(xí)器集成.圖7為異構(gòu)集成機(jī)場(chǎng)噪聲預(yù)測(cè)模型在測(cè)試集上的預(yù)測(cè)結(jié)果,以平均累計(jì)誤差分布表示.
將集成后的預(yù)測(cè)結(jié)果分別與基學(xué)習(xí)器的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,對(duì)4種機(jī)型求平均誤差,并統(tǒng)計(jì)不同誤差范圍內(nèi)所占的比例,其對(duì)比結(jié)果如表6所示.從表6可看出,該方法誤差在[0, 1)dB區(qū)間的比例分別比空間擬合算法和神經(jīng)網(wǎng)絡(luò)算法高26.6%和19.9%;誤差在[4, +∞)dB區(qū)間的比例分別比空間擬合算法和神經(jīng)網(wǎng)絡(luò)算法低8.0%和9.0%.實(shí)驗(yàn)結(jié)果表明,本文的方法能大幅提高預(yù)測(cè)準(zhǔn)確率.
圖7 基于觀察學(xué)習(xí)的集成模型預(yù)測(cè)結(jié)果Fig.7 The prediction results of ensemble model based on observational learning
表6 預(yù)測(cè)誤差范圍比例的對(duì)比(%)Table 6 Comparison the percentage of every prediction error range (%)
為了證明本文提出方法的有效性,將其與新近的異構(gòu)集成算法進(jìn)行對(duì)比.引入文獻(xiàn)[17]中的bagging++算法和文獻(xiàn)[18]中的HEDES算法.表7 給3種算法各自重復(fù)10次實(shí)驗(yàn)后的預(yù)測(cè)結(jié)果平均值.
表7 本文方法與HEDES和bagging++的誤差對(duì)比Table 7 Comparison of error between proposed model, HEDES and bagging++
從表7可以看出,本文提出的方法在所有機(jī)型上的均方誤差都比HEDES算法小,平均均方誤差小0.52dB.HEDES算法對(duì)孤立點(diǎn)敏感,而機(jī)場(chǎng)噪聲數(shù)據(jù)集中的數(shù)據(jù)完全來自真實(shí)監(jiān)測(cè)系統(tǒng),其中孤立點(diǎn)比較多.因此應(yīng)用HEDES算法于機(jī)場(chǎng)噪聲預(yù)測(cè),其效果不佳.相比于bagging++算法,本文方法在A321和B733兩種機(jī)型上明顯優(yōu)于bagging++算法,其誤差分別比bagging++算法小0.229dB和0.249dB;在A320和B738兩種機(jī)型上稍弱于bagging++算法,其誤差分別比bagging++算法大0.107dB和0.118dB,本文方法在4個(gè)機(jī)型上平均均方誤差比bagging++算法小0.127dB.由于bagging++算法是基于增量學(xué)習(xí)的,新近數(shù)據(jù)在整個(gè)數(shù)據(jù)集中所占重要程度較高,會(huì)對(duì)預(yù)測(cè)結(jié)果有形成較大影響.而機(jī)場(chǎng)噪聲監(jiān)測(cè)系統(tǒng)實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)如出現(xiàn)異常也是隨機(jī)發(fā)生,bagging++算法較難保證預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性.而本文提出的方法基于所有訓(xùn)練數(shù)據(jù)等權(quán)重,容錯(cuò)性好,更為適用于機(jī)場(chǎng)噪聲預(yù)測(cè)這種實(shí)際應(yīng)用場(chǎng)景.
運(yùn)用空間擬合算法和BP神經(jīng)網(wǎng)絡(luò)算法分別構(gòu)建基學(xué)習(xí)器,提出基于觀察學(xué)習(xí)的異構(gòu)集成算法.同時(shí)將這種異構(gòu)集成算法應(yīng)用于機(jī)場(chǎng)噪聲預(yù)測(cè)中,構(gòu)建了基于空間擬合和神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)噪聲預(yù)測(cè)集成模型.通過與其他異構(gòu)學(xué)習(xí)器集成算法的對(duì)比實(shí)驗(yàn),證明該集成算法能夠更為有效的解決機(jī)場(chǎng)噪聲預(yù)測(cè)問題.
參考文獻(xiàn):
[1] 過春燕,張邦俊.基于Surfer的機(jī)場(chǎng)噪聲等值線計(jì)算機(jī)繪制方法[J]. 中國(guó)環(huán)境科學(xué), 2003,23(6):631-634.
[2] 徐 濤,燕憲金,楊國(guó)慶.基于神經(jīng)網(wǎng)絡(luò)集成的單個(gè)飛行事件噪聲預(yù)測(cè)模型 [J]. 中國(guó)環(huán)境科學(xué), 2014,34(2):539-544.
[3] 溫冬琴,王建東.基于奇異譜分析的機(jī)場(chǎng)噪聲時(shí)間序列預(yù)測(cè)模型[J]. 計(jì)算機(jī)科學(xué), 2014,41(1):267-270.
[4] Dai D, Gool L V. Ensemble Projection for Semi-supervised Image Classification [C]//Proceedings of IEEE International Conference on Computer Vision, 2013:2072-2079.
[5] 徐 濤,楊奇川,呂宗磊.一種基于動(dòng)態(tài)集成學(xué)習(xí)的機(jī)場(chǎng)噪聲預(yù)測(cè)模型 [J]. 電子與信息學(xué)報(bào), 2014,36(7):1631-1636.
[6] Bounova G, Weck O. Overview of Metrics and Their Correlation Patterns for Multiple-metric Topology Analysis on Heterogeneous Graph Ensembles [J]. Physical Review E, 2012, 85(1):161-170.
[7] Nelson J P. Meta-analysis of Airport Noise and Hedonic Property Values [J]. Journal of Transport Economics and Policy, 2004, 38(1):1-27.
[8] Li X, Lan S, Li G, et al. Simulation of Aircraft Flight Track by BéZier and B-spline Curve [J]. Journal of Southwest Jiaotong University, 2011,46(6):1040-1045.
[9] Bishop C M. Training with Noise is Equivalent to Tikhonov Regularization [J]. Neural Computation, 1995,7(1):108-116.
[10] Jang M, Cho S. Ensemble Learning Using Observational Learning Theory [M]. Proceedings of IEEE International Joint Conference on Neural Networks, 1999,2:1287-1292.
[11] Galar M, Fernandez A, Barrenechea E, et al. A Review on Ensembles for the Class Imbalance Problem: Bagging-, Boosting-, and Hybrid-based Approaches [J]. Part C: Applications and Reviews, IEEE Transactions on Systems, Man, and Cybernetics, 2012,42(4):463-484.
[12] Dietterich T G. Machine Learning Research: Four Current Directions [J]. AI Magazine, 1997,18(4):97-136.
[13] Ibrahim N, Wibowo A. Partial Least Squares Regression based Variables Selection for Water Level Predictions [J]. American Journal of Applied Science, 2013,10(4):322-330.
[14] Guo Z, Wu J, Lu H, et al. A Case Study on a Hybrid Wind Speed Forecasting Method Using BP Neural Network [J]. Knowledgebased Systems, 2011,24(7):1048-1056.
[15] 鄧萬(wàn)宇,鄭慶華,陳 琳,等.神經(jīng)網(wǎng)絡(luò)極速學(xué)習(xí)方法研究 [J]. 計(jì)算機(jī)學(xué)報(bào), 2010,33(2):279-287.
[16] Ding S, Su C, Yu J. An Optimizing BP Neural Network Algorithm based on Genetic Algorithm [J]. Artificial Intelligence Review, 2011,36(2):153-162.
[17] Zhao Q L, Jiang Y H, Xu M. Incremental Learning by Heterogeneous Bagging Ensemble [M]. Advanced Data Mining and Applications. Berlin: Springer-Verlag, 2010:1-12.
[18] Nguyen H V, Ang H H, Gopalkrishnan V. Mining Outliers with Ensemble of Heterogeneous Detectors on Random Subspaces [R]. Proceedings of the 15th International Conference of Database Systems for Advanced Applications, 2010:368-383.
智能信息處理研究.發(fā)表論文100余篇.
Airport noise prediction ensemble model based on space fitting and neural network.
XU Tao1,2*, SU Han1, YANG Guo-qing2(1.College of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China;2.Information Technology Research Base of Civil Aviation Administration of China, Tianjin 300300, China). China Environmental Science, 2016,36(4):1250~1257
Abstract:This paper proposes an airport noise ensemble prediction model based on space fitting and neural network by introducing ensemble learning method. Space fitting and BP neural network is used respectively to create the base learner and a heterogeneous ensemble algorithm based on observational learning is used to integrate these base learners. The final ensemble model thus can improve prediction accuracy effectively by integrating multiple heterogeneous base prediction learners. The experimental results shows that the proposed heterogeneous ensemble algorithm based on observational learning is better than other heterogeneous ensemble algorithms on accuracy and tolerance for solving the airport noise prediction problem.
Key words:airport noise prediction;space fitting;neural network;ensemble learning;observational learning
作者簡(jiǎn)介:徐 濤(1962-),男,重慶市人,教授,碩士,主要從事民航
基金項(xiàng)目:國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(61139002);國(guó)家“863計(jì)劃”項(xiàng)目(2012AA063301);國(guó)家科技支撐計(jì)劃項(xiàng)目(2014BAJ04B02);中國(guó)民用航空局科技項(xiàng)目(MHRD201006, MHRD201101);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金(3122013P013)
收稿日期:2015-08-20
中圖分類號(hào):X707,X738.2,TP391.9
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1000-6923(2016)04-1250-08