李劍鋒 吳林弟 胡伍生 王永前 朱明晨
(1成都信息工程學(xué)院資源環(huán)境學(xué)院,成都 610225)(2江蘇省吳江經(jīng)濟技術(shù)開發(fā)區(qū),蘇州 215200)(3東南大學(xué)交通學(xué)院,南京 210096)(4江蘇鎮(zhèn)江新區(qū)房產(chǎn)管理處,鎮(zhèn)江 212114)
基于BP神經(jīng)網(wǎng)絡(luò)算法的對流層濕延遲計算
李劍鋒1吳林弟2胡伍生3王永前1朱明晨4
(1成都信息工程學(xué)院資源環(huán)境學(xué)院,成都 610225)
(2江蘇省吳江經(jīng)濟技術(shù)開發(fā)區(qū),蘇州 215200)
(3東南大學(xué)交通學(xué)院,南京 210096)
(4江蘇鎮(zhèn)江新區(qū)房產(chǎn)管理處,鎮(zhèn)江 212114)
摘 要:為了提高對流層濕延遲的計算精度和全球定位系統(tǒng)水汽反演的準(zhǔn)確性,結(jié)合BP神經(jīng)網(wǎng)絡(luò)算法的自主學(xué)習(xí)、記憶、計算和智能處理功能,利用氣象探空數(shù)據(jù)建立了計算對流層濕延遲的BP神經(jīng)網(wǎng)路模型,其模型結(jié)構(gòu)為4×15×1.分別利用霍普菲爾德模型、多元線性回歸模型及BP神經(jīng)網(wǎng)絡(luò)模型計算對流層濕延遲.對比分析了3種模型的對流層濕延遲計算結(jié)果,得到結(jié)論:霍普菲爾德模型存在系統(tǒng)誤差,精度較低;多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型的精度都優(yōu)于霍普菲爾德模型;BP神經(jīng)網(wǎng)絡(luò)模型精度較霍普菲爾德模型改進約50%,較多元線性回歸模型學(xué)習(xí)中誤差改進約71.7%,檢驗中誤差改進約2%.
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);對流層濕延遲;精度分析
利用GPS技術(shù)反演大氣可降水量是近年來飛 速發(fā)展的一門大氣探測技術(shù),因其具有實時性、連續(xù)性、精度高、成本低、不受天氣影響等特點而備受關(guān)注.GPS大氣水汽反演是利用GPS信號在對流層中傳播產(chǎn)生的路徑延遲反算大氣中水汽含量,因此準(zhǔn)確求得對流層濕延遲是反演大氣可降水量的關(guān)鍵.目前計算對流層濕延遲的方法主要有兩類:一是利用GPS信號延遲來計算,二是利用探空數(shù)據(jù)計算.
影響對流層濕延遲的水汽是一個非線性的物理量,對非線性的物理量難以用一個固定的函數(shù)模型去準(zhǔn)確表達,而BP神經(jīng)網(wǎng)絡(luò)模型屬于自適應(yīng)非線性動力學(xué)系統(tǒng),它具有學(xué)習(xí)、記憶、計算和智能處理功能,特別是在處理一些復(fù)雜的非線性問題上,有著其獨特的優(yōu)勢[1].也正是基于該原因,本文采用第二類方法,研究如何運用BP神經(jīng)網(wǎng)絡(luò)算法計算對流層濕延遲.
人工神經(jīng)網(wǎng)絡(luò)是由大量神經(jīng)元互相連接組成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),具有感知、記憶、學(xué)習(xí)和聯(lián)想等功能,能模仿人腦處理信息的物理過程,具有大規(guī)模并行模擬處理分布式存儲信息的能力及很強的自適應(yīng)自學(xué)習(xí)和容錯能力等特點[1].BP神經(jīng)網(wǎng)絡(luò)模型則是一種應(yīng)用最廣泛的人工神經(jīng)網(wǎng)絡(luò)模型.常用的單隱含層的BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示.
圖1 單隱含層BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖
圖1中,第1層為輸入層轉(zhuǎn)換層,第2層為輸入層,第3層為隱含層,第4層為輸出層,第5層為輸出層轉(zhuǎn)換層.其基本原理為:輸入向量首先經(jīng)過輸入轉(zhuǎn)換層及輸入層向前傳播經(jīng)連接輸入層和隱含層之間的權(quán)重作用后到隱含層節(jié)點,然后經(jīng)激活函數(shù)把隱含節(jié)點的輸出信息經(jīng)過連接隱含層和輸出層之間的權(quán)重作用后傳播到輸出節(jié)點,經(jīng)輸出轉(zhuǎn)換層后輸出結(jié)果[2].BP算法是在導(dǎo)師(樣本真值)的指導(dǎo)下,經(jīng)過學(xué)習(xí)訓(xùn)練,調(diào)整權(quán)值從而使輸出向量與樣本真值的誤差達到人們的要求,從而保存此時的權(quán)值,建立預(yù)測模型.
用于計算對流層濕延遲BP神經(jīng)網(wǎng)絡(luò)的建立分為以下2個步驟:
1)網(wǎng)絡(luò)結(jié)構(gòu)的確定
建立BP神經(jīng)網(wǎng)絡(luò)模型在工程應(yīng)用中的網(wǎng)絡(luò)結(jié)構(gòu),需要確定的內(nèi)容如下:
①輸入層節(jié)點個數(shù)
輸入層節(jié)點的數(shù)目多少取決于數(shù)據(jù)源的維數(shù)以及其對樣本值影響度的大小.另外,人工神經(jīng)元網(wǎng)絡(luò)只能處理數(shù)值型數(shù)據(jù),如果源數(shù)據(jù)中有非數(shù)值類型的數(shù)據(jù),首先要將外部信息變換或編碼.一般需要先將輸入數(shù)據(jù)“歸一化”到限定范圍[0,1]之間[3].
由于采用第二類對流層濕延遲計算方法,源數(shù)據(jù)為氣象探空數(shù)據(jù),考慮到源數(shù)據(jù)的維數(shù)以及各種氣象參數(shù)對對流層濕延遲的影響因素,確定BP神經(jīng)網(wǎng)絡(luò)模型的輸入層為:測站的地面氣壓P0、絕對溫度與T0、測站海拔高度h0及測站的地面水汽分壓e0.因此BP神經(jīng)網(wǎng)絡(luò)模型的輸入層節(jié)點數(shù)為4.
②輸出層節(jié)點個數(shù)
一般工程中輸出層節(jié)點的個數(shù)為1;若有多個輸出也可構(gòu)造多輸出網(wǎng)絡(luò)或多個單輸出網(wǎng)絡(luò)分別研究.本文用于計算對流層濕延遲的網(wǎng)絡(luò)模型輸出層節(jié)點數(shù)為1,其物理意義為對流層濕延遲.
③隱含層節(jié)點數(shù)的選取
常見的神經(jīng)網(wǎng)絡(luò)模型均為單隱含層模型,選取隱含層節(jié)點數(shù)是一個復(fù)雜的問題.隱含層節(jié)點數(shù)太少,可能導(dǎo)致網(wǎng)絡(luò)不收斂,而隱含層節(jié)點數(shù)太多,可能導(dǎo)致樣本學(xué)習(xí)時間過長或計算結(jié)果不穩(wěn)定.本文采用經(jīng)驗試算法,最后確定隱含層節(jié)點數(shù)為15.
至此傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)已經(jīng)確定,其模型結(jié)構(gòu)為4×15×1.
2)網(wǎng)絡(luò)參數(shù)的設(shè)置
BP神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)包括:學(xué)習(xí)速率η、平滑因子α、學(xué)習(xí)誤差E,網(wǎng)絡(luò)參數(shù)的設(shè)置合理與否會影響到網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的速度.
①學(xué)習(xí)速率η:通過試算建議取值范圍為[0.5,2.5].試驗發(fā)現(xiàn),學(xué)習(xí)速率的選擇要和平滑因子綜合考慮才有利于網(wǎng)絡(luò)模型的優(yōu)化.
②平滑因子α:平滑因子的引入使學(xué)習(xí)速率不再是恒定的值,而是隨著迭代誤差的變化而變化,但平滑因子也不宜過大,通過試算建議取值范圍為[0.5,0.9],若取值過大容易進入飽和區(qū).
③學(xué)習(xí)誤差E:學(xué)習(xí)中誤差的大小會對檢驗中誤差造成影響,一般學(xué)習(xí)中誤差越小,檢驗中誤差也越小.但學(xué)習(xí)中誤差越小,學(xué)習(xí)速度也越慢,甚至不收斂,若學(xué)習(xí)中誤差太小,會造成過擬合現(xiàn)象,即使網(wǎng)絡(luò)能夠收斂,檢驗中誤差也會產(chǎn)生回彈[2].通過大量試算,采用學(xué)習(xí)中誤差控制在[0.005,0.01].
通過以上2個步驟,完成了用于對流層濕延遲神經(jīng)網(wǎng)絡(luò)模型的建立.
為了對比分析BP神經(jīng)網(wǎng)絡(luò)模型的優(yōu)劣性,這里介紹2種傳統(tǒng)的對流層濕延遲計算模型.
1)霍普菲爾德模型
霍普菲爾德模型是Hopfield在1969年用全球18個站臺一年的平均資料得到的,該模型將大氣層分為對流層和電離層2層[4].在對流層中,其主要分析對流層中各個氣象參數(shù)與海拔高度之間的關(guān)系,然后經(jīng)過推導(dǎo)分別得出折射率干分量和濕分量與高程之間的關(guān)系,進而通過地面氣象參數(shù)來推演整個對流層延遲[5].其函數(shù)表達式為
式中,前半部分為干延遲;后半部分為濕延遲;h0為測站高度;e0是地面的水汽分壓;P0與T0分別為測站的地面氣壓與絕對溫度;Hw為對流層頂,一般取Hw=11 000 m;HT為折射率為0處的大氣層高度.霍普菲爾德模型形式簡單,僅需要地面的氣壓、溫度及水汽壓就能很好地估計對流層天頂干延遲,但是其濕延遲的精度不理想[6].
2)多元線性回歸模型
由于對流層濕延遲受測站的地面氣壓、絕對溫度、測站海拔高度及測站地面水汽分壓等諸多因素影響[7],即有多個影響因素作為自變量來解釋因變量的變化.當(dāng)多個自變量與因變量之間是線性關(guān)系或近似線性關(guān)系時,所進行的回歸分析即為多元線性回歸[4].在某一項工程中,若采集到n組p維的自變量和一個因變量的數(shù)值.假設(shè)因變量用Y表示;而自變量可以表示為 X1,X2,…,Xp.那么多元線性回歸模型整個數(shù)據(jù)可表示成一個n(p+1)的排列,即
式中,a0,a1,…,ap表示未知參數(shù);Y表示因變量;Xi1,Xi2,…,Xip表示自變量[8].
在多元線性回歸的過程中,我們主要關(guān)心的是通過n組觀測值,利用最小二乘原理來求解未知參數(shù)a0,a1,…,ap,然后可以通過求解出來的參數(shù)并利用式(2)來建立預(yù)測模型.
在利用多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型計算對流層濕延遲時,并非將所有樣本帶入計算,而是將樣本分為學(xué)習(xí)樣本和檢驗樣本2部分.由于這2部分樣本分別能得出學(xué)習(xí)中誤差和檢驗中誤差.通過學(xué)習(xí)中誤差可以看出模型學(xué)習(xí)的精度,而檢驗中誤差則可以得出模型用于預(yù)測的精度.為使學(xué)習(xí)樣本具有代表性,其選取原則是在綜合考慮整個探空數(shù)據(jù)的區(qū)域內(nèi)的經(jīng)度、緯度以及海拔高度三維之后隨機、均勻的選取.為方便比較,所有模型均選取2010年5月1號晚上8點的探空數(shù)據(jù)所計算出來的延遲中的200個樣本來進行建模.表1為部分探空站3不同模型計算結(jié)對流層濕延遲結(jié)果.
為便于比較分析,選取相同的探空數(shù)據(jù)利用霍普菲爾德模型、多元回歸分析模型及BP神經(jīng)網(wǎng)絡(luò)模型進行計算.經(jīng)大量試算,最終確定BP神經(jīng)網(wǎng)絡(luò)模型中的參數(shù)設(shè)置為:學(xué)習(xí)速率η=1.5,平滑因子 α =0.7,E=0.001.分析計算結(jié)果,霍普菲爾德模型的濕延遲誤差較大,平均中誤差σHw=±0.2 m,多元線性回歸模型的學(xué)習(xí)中誤差為±0.046 m,檢驗中誤差為±0.050 m.BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)中誤差為 ±0.013 m,檢驗中誤差為 ±0.049 m.為直觀地分析3種模型計算得到的對流層濕延遲的優(yōu)劣性,分別繪制出殘差圖.其中圖2、圖3和圖4分別為200個樣本霍普菲爾德模型、多元線性回歸模型以及BP神經(jīng)網(wǎng)絡(luò)模型殘差圖.
通過圖2可以看出,霍普菲爾德模型計算濕延遲誤差主要分布在0.02~0.47之間,誤差均大于0,可見其含有一定的系統(tǒng)誤差.霍普菲爾德模型作為一個全球范圍的對流層濕延遲計算模型,雖適用范圍廣,但很難滿足局部地區(qū)的高精度對流層濕延遲計算的精度要求.
將圖3與圖2相比可知,多元線性回歸模型不存在系統(tǒng)誤差,從殘差圖上可以明顯看出,其誤差基本分布在-0.1~0.1 m之間,精度較之霍普菲爾德模型有較大提高.
分析圖4,由中誤差這個指標(biāo)來看,BP神經(jīng)網(wǎng)絡(luò)模型精度較之多元線性回歸模型稍有提高,由殘差圖可以看出,其誤差值除少數(shù)站點外,基本與0刻度重合,若剔除少數(shù)幾個較大殘差后,BP神經(jīng)網(wǎng)絡(luò)結(jié)果將明顯優(yōu)于多元線性回歸.對比圖2、圖3和圖4,可以看出多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)得到對流層延遲的精度高于霍普菲爾德模型,分析原因,霍普菲爾德模型作為適用全球范圍的普適模型,在局部地區(qū)的對流層延遲計算上,存在較大的誤差.霍普菲爾德模型濕延遲剔除其系統(tǒng)誤差后仍有約10 cm的誤差.多元線性回歸的精度較高,達5 cm,較剔除系統(tǒng)誤差霍普菲爾德模型提高了約50%,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的精度最高可以精確到4.9 cm,較多元線性回歸模型僅改進2%,但是BP神經(jīng)網(wǎng)絡(luò)模型剔除粗差后,其精度將明顯優(yōu)于多元線性回歸模型.
表1 三種模型對流層濕延遲計算結(jié)果(部分)
圖2 霍普菲爾德模型濕延遲殘差圖
圖3 多元線性回歸模型濕延遲殘差圖
圖4 BP神經(jīng)網(wǎng)絡(luò)模型濕延遲殘差圖
本文在分析BP神經(jīng)網(wǎng)絡(luò)模型工作原理基礎(chǔ)上,結(jié)合氣象探空數(shù)據(jù)建立了計算對流層濕延遲的BP神經(jīng)網(wǎng)絡(luò)模型,并對比分析了霍普菲爾德模型和多元線性回歸模型得到的對流層濕延遲結(jié)果,得到以下結(jié)論:
1)對流層濕延遲計算的BP神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)為4×15×1.即輸入層有4個:測站的地面氣壓、與絕對溫度與、測站海拔高度及測站的地面水汽分壓.輸出層有1個:對流層濕延遲.隱含層數(shù)量為15.
2)對比分析3種模型計算得到的對流層濕延遲結(jié)果,霍普菲爾德模型濕延遲平均中誤差為±0.20 m,多元線性回歸模型學(xué)習(xí)中誤差為±0.046 m,檢驗中誤差為 ±0.050 m.BP 神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)中誤差為±0.013 m,檢驗中誤差為±0.049 m.其中,霍普菲爾德模型存在明顯的系統(tǒng)誤差.若剔除系統(tǒng)誤差和粗差,BP神經(jīng)網(wǎng)絡(luò)模型精度較霍普菲爾德模型提高約50%,較多元線性回歸模型學(xué)習(xí)中誤差改進約71.7%,檢驗中誤差改進約2%.
[1]胡伍生.神經(jīng)網(wǎng)絡(luò)理論及其工程應(yīng)用[M].北京:測繪出版社,2006:63-83.
[2]朱明晨.基于神經(jīng)網(wǎng)絡(luò)的對流層延遲研究[D].南京:東南大學(xué)交通學(xué)院,2012.
[3]青盛.地基GPS水汽反演的研究[D].成都:西南交通大學(xué)地球科學(xué)與環(huán)境學(xué)院,2009.
[4]盛裴軒,毛節(jié)泰,李建國,等.大氣物理學(xué)[M].北京:北京大學(xué)出版社,2003:48-56.
[5]陳澍,熊永良,張緒豐,等.GPS水汽反演技術(shù)在四川地區(qū)的應(yīng)用研究[J].全球定位系統(tǒng),2011,36(1):32-37.
Chen Shu,Xiong Yongliang,Zhang Xufeng,et al.Application of GPS water vapor inversion technology in Sichuan area[J].GNSS World of China,2011,36(1):32-37.(in Chinese)
[6]劉愛梅,胡鵬,尹承美,等.GPS水汽反演資料在濟南地球的應(yīng)用[J].氣象科學(xué),2010,30(4):555-558.
Liu Aimei,Hu Peng,Yin Chengmei,et al.The application of GPS—PWV computing data in Jinan area[J].Scientia Meteorologica Sinica,2010,30(4):555-558.(in Chinese)
[7]陳笑娟,扈成省,王占偉.國內(nèi)外GPS氣象學(xué)的若干研究應(yīng)用進展[J].測繪科學(xué),2010,35(3):216-218.
Chen Xiaojuan,Hu Cheng,Wang Zhanwei.Research and application progress of national and international GPS meteorology[J].Science of Surveying and Mapping,2010,35(3):216-218.(in Chinese)
[8]楊小磊.基于CORS系統(tǒng)的區(qū)域大氣水汽含量的研究[D].昆明:昆明理工大學(xué)國土資源工程學(xué)院,2010.
Calculation of tropospheric wet delay based on BP neural network algorithm
Li Jianfeng1Wu Lindi2Hu Wusheng3Wang Yongqian1Zhu Mingchen4
(1College of Resources and Environment,Chengdu University of Information Technology,Chengdu 610225,China)
(2Wujiang Economic and Technological Development Zone,Suzhou 215200,China)
(3School of Transportation,Southeast University,Nanjing 210096,China)
(4Estate Management Office of Zhenjiang City,Zhenjiang 212114,China)
Abstract:In order to improve the calculation accuracy of the tropospheric wet delay and the precision of the global positioning system water vapor inversion,a back propagation(BP)neural network model with the structure of 4×15×1 is introduced to calculate the tropospheric wet delay.The model establishment involves the combination of the functions such as self-learning,memory,calculation and intelligent processing of the BP neural network algorithm as well as the usage of radiosonde data.Three models are taken to calculate the tropospheric wet delay,which are the Hopfield model,the multiple linear regression model and the BP neural network model,respectively.Analysis results show that the Hopfield model is relatively low in precision because of its systematic error,whereas the other two are superior in this respect.The accuracy of the BP neural network model is improved about 50%compared to the Hopfield model,while both the learning error and inspection error are increased by 71.7%and 2% ,respectively,compared to the multiple linear regression model.
Key words:back propagation neural network model;tropospheric wet delay;accuracy analysis
中圖分類號:P228
A
1001-0505(2013)S2-0355-05
doi:10.3969/j.issn.1001 -0505.2013.S2.030
收稿日期:2013-08-20.
李劍鋒(1986—),男,碩士,講師,lijianfeng_ljf@126.com.
基金項目:國家自然科學(xué)基金資助項目(41101314,41274028).
引文格式:李劍鋒,吳林弟,胡伍生,等.基于BP神經(jīng)網(wǎng)絡(luò)算法的對流層濕延遲計算[J].東南大學(xué)學(xué)報:自然科學(xué)版,2013,43(S2):355-359.[doi:10.3969/j.issn.1001 -0505.2013.S2.030]