黎峻宇,劉立龍,蔡成輝,林國標(biāo),黃良珂(桂林理工大學(xué)a.測繪地理信息學(xué)院; b.廣西空間信息與測繪重點(diǎn)實(shí)驗(yàn)室; c.廣西礦冶與環(huán)境科學(xué)實(shí)驗(yàn)中心,廣西桂林 541004)
?
數(shù)據(jù)預(yù)處理對(duì)基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響
黎峻宇a,b,劉立龍,蔡成輝a,b,林國標(biāo)a,b,黃良珂a,b
(桂林理工大學(xué)a.測繪地理信息學(xué)院; b.廣西空間信息與測繪重點(diǎn)實(shí)驗(yàn)室; c.廣西礦冶與環(huán)境科學(xué)實(shí)驗(yàn)中心,廣西桂林541004)
摘要:介紹了數(shù)據(jù)預(yù)處理對(duì)基于徑向基函數(shù)網(wǎng)絡(luò)的高程轉(zhuǎn)換的必要性,提出了基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換建模的基本原理和實(shí)現(xiàn)步驟。結(jié)合工程實(shí)例,重點(diǎn)對(duì)歸一化、中心化、標(biāo)準(zhǔn)化3種不同的數(shù)據(jù)預(yù)處理方法對(duì)基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響進(jìn)行計(jì)算分析。結(jié)果表明:針對(duì)大面積、高程異常值變化較大的區(qū)域,經(jīng)過數(shù)據(jù)預(yù)處理后模型能夠達(dá)到更高的轉(zhuǎn)換精度;不同的預(yù)處理方法對(duì)轉(zhuǎn)換結(jié)果影響不同,中心化預(yù)處理較其他兩種方法能夠更大程度地提高徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的精度;歸一化預(yù)處理方法不一定是最優(yōu)的,進(jìn)行高程轉(zhuǎn)換前有必要對(duì)預(yù)處理方法進(jìn)行選擇。
關(guān)鍵詞:歸一化;中心化;標(biāo)準(zhǔn)化;數(shù)據(jù)預(yù)處理;徑向基函數(shù)網(wǎng)絡(luò);高程轉(zhuǎn)換;改善精度
當(dāng)前,GPS測量技術(shù)已經(jīng)在測繪生產(chǎn)實(shí)踐中得到廣泛應(yīng)用,然而GPS測量直接獲得的高是相對(duì)于WGS-84橢球面的大地高,實(shí)際生產(chǎn)過程中使用的卻是相對(duì)于似大地水準(zhǔn)面的正常高[1]。因此,為了使GPS測量技術(shù)能夠得到更普遍的應(yīng)用,必須將大地高H轉(zhuǎn)換為正常高h(yuǎn),它們之間的關(guān)系是: h = H-ε,ε稱為高程異常。故只需知道每一點(diǎn)的高程異常,就能夠?qū)⒃擖c(diǎn)大地高H轉(zhuǎn)換為正常高h(yuǎn)。高程異常轉(zhuǎn)換方法主要有4類:幾何解析法、物理大地測量法、人工智能法和混合轉(zhuǎn)換法[2]。人工神經(jīng)網(wǎng)絡(luò)屬于人工智能法的范疇[3],近年來許多學(xué)者對(duì)人工神經(jīng)網(wǎng)絡(luò)高程轉(zhuǎn)換模型作了進(jìn)一步研究[4-14],這些研究在一定程度上對(duì)高程轉(zhuǎn)換模型進(jìn)行了改進(jìn)。然而,除了文獻(xiàn)[3]進(jìn)行了數(shù)據(jù)預(yù)處理對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的高程轉(zhuǎn)換的影響研究外,很少有人詳細(xì)研究不同的數(shù)據(jù)預(yù)處理方法對(duì)高程轉(zhuǎn)換結(jié)果的影響。徑向基函數(shù)網(wǎng)絡(luò)是一種結(jié)構(gòu)簡單、收斂速度快、能夠逼近任意非線性函數(shù)網(wǎng)絡(luò),文獻(xiàn)[1-2]中已經(jīng)有一部分學(xué)者將徑向基函數(shù)網(wǎng)絡(luò)用于高程轉(zhuǎn)換,并在一定程度上改善了高程轉(zhuǎn)換的精度;然而進(jìn)行高程轉(zhuǎn)換的樣本數(shù)據(jù)往往是相當(dāng)龐大的,特別對(duì)于面積廣、高程起伏較大的地區(qū),樣本數(shù)據(jù)中的信息很繁雜,且樣本數(shù)據(jù)的北、東方向坐標(biāo)不在一個(gè)數(shù)量級(jí)上,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理或許可以使得北、東坐標(biāo)以及高程異常之間的關(guān)系挖掘過程更快捷、更精確,如此徑向基函數(shù)才能更好地逼近北、東坐標(biāo)與高程異常之間的函數(shù)關(guān)系。為了使得徑向基函數(shù)網(wǎng)絡(luò)在高程轉(zhuǎn)換領(lǐng)域得到更好的發(fā)展,本文通過在嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,增加一個(gè)數(shù)據(jù)預(yù)處理層,采用3種不同的預(yù)處理層構(gòu)造3種不同的徑向基函數(shù)網(wǎng)絡(luò)模型進(jìn)行高程轉(zhuǎn)換,并將轉(zhuǎn)換結(jié)果與不帶數(shù)據(jù)預(yù)處理層的徑向基函數(shù)網(wǎng)絡(luò)模型的轉(zhuǎn)換結(jié)果進(jìn)行對(duì)比、分析,探討數(shù)據(jù)預(yù)處理對(duì)基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響。
1. 1徑向基函數(shù)網(wǎng)絡(luò)基本原理
徑向基函數(shù)網(wǎng)絡(luò)是具有3層結(jié)構(gòu)的前向網(wǎng)絡(luò):輸入層在第1層,其節(jié)點(diǎn)個(gè)數(shù)等于輸入向量的維數(shù);第2層叫隱含層,節(jié)點(diǎn)個(gè)數(shù)由問題的復(fù)雜程度確定;第3層是輸出層,節(jié)點(diǎn)個(gè)數(shù)等于輸出數(shù)據(jù)的維數(shù)。徑向基函數(shù)網(wǎng)絡(luò)不同層的功能各不相同,隱含層是非線性的,以徑向基函數(shù)為基函數(shù),在此將輸入向量空間轉(zhuǎn)換到隱含層空間,達(dá)到將原來線性不分的問題變得線性可分的目的,輸出層則是線性的[10]。一個(gè)嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 61Strict radial basis function network structure
隱含層Φi( i = 1,2,…,N)為基函數(shù),本文使用高斯函數(shù)為基函數(shù),則有徑向基函數(shù)網(wǎng)絡(luò)模型為其中: Xk是m維的網(wǎng)絡(luò)輸入向量; y = F( x)為對(duì)應(yīng)的輸出;ωij( i = 1,2,…,N)為從第i個(gè)隱含節(jié)點(diǎn)到第j個(gè)輸出節(jié)點(diǎn)的權(quán)值; N為隱含層神經(jīng)元個(gè)數(shù);是高斯函數(shù)基函數(shù); Xi=[xi1,xi2,…,xim]為每個(gè)隱含層神經(jīng)元基函數(shù)的中心;σi為拓展常數(shù),且是所選取中心之間的最大距離,m為選取中心個(gè)數(shù)[1];建立和訓(xùn)練一個(gè)嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò),就是使其通過學(xué)習(xí)來確定Xi、ωi、σi的過程,以完成所需要的輸入到輸出的映射[2]。
1. 2徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的實(shí)現(xiàn)
本文的徑向基函數(shù)網(wǎng)絡(luò)輸入層神經(jīng)元個(gè)數(shù)是2個(gè),即控制點(diǎn)的平面坐標(biāo)( x,y) ;輸出層神經(jīng)元個(gè)數(shù)為1個(gè),即高程異常ε[1]。假設(shè)R = { ( Pi,Ti) | i = 1,2,…,M}為訓(xùn)練樣本集,M為訓(xùn)練樣本數(shù),稱P = [P1,P2,…,PM]T為樣本輸入陣,其中Pi= ( xi,yi),相應(yīng)的教師輸出為T =[T1,T2,…,TM]T,其中
徑向基函數(shù)網(wǎng)絡(luò)的高程轉(zhuǎn)換步驟為
①生成函數(shù)網(wǎng)絡(luò):本文中的徑向基函數(shù)網(wǎng)絡(luò)是通過MATLAB內(nèi)的newrbe函數(shù)實(shí)現(xiàn)的,形式為net = newrbe ( P,T,goal),P為樣本輸入陣,T為教師輸出陣,均方差精度goal選用默認(rèn)的微小值。
②調(diào)試網(wǎng)絡(luò):利用仿真函數(shù)Ts= sim ( net,P)對(duì)網(wǎng)絡(luò)進(jìn)行調(diào)試,net為①生成的函數(shù)網(wǎng)絡(luò),P為樣本輸入陣,將仿真輸出Ts與T教師輸出進(jìn)行比較判斷生成網(wǎng)絡(luò)的可靠性,本文所生成網(wǎng)絡(luò)滿足可靠性要求(由文獻(xiàn)[10]可知newrbe可以迅速創(chuàng)建一個(gè)誤差為零的嚴(yán)格徑向基函數(shù)網(wǎng)絡(luò))。
③高程轉(zhuǎn)換:利用①中生成的函數(shù)網(wǎng)絡(luò),運(yùn)用函數(shù)G = sim ( net,J)求驗(yàn)證樣本點(diǎn)的高程異常,其中J = ( J1,J2,…,JN)T,Ji= ( xi,yi) ;輸出陣G為利用徑向基函數(shù)網(wǎng)絡(luò)計(jì)算得到的高程異常陣,將G與正常高陣h = ( h1,h2,…,hN)相加就完成了所有點(diǎn)的高程轉(zhuǎn)換。
數(shù)據(jù)預(yù)處理方法種類很多,適用范圍也因?qū)嶋H處理問題的不同而不同。在高程轉(zhuǎn)換相關(guān)文獻(xiàn)中學(xué)者們最常用的方法是歸一化、標(biāo)準(zhǔn)化,中心化也是比較經(jīng)典的數(shù)據(jù)預(yù)處理方法,本文將就此3種數(shù)據(jù)預(yù)處理方法進(jìn)行討論。
將輸入數(shù)據(jù)表示為Z = ( Z1,Z2),Z1= ( x1,x2,…,xn)表示輸入樣本的北坐標(biāo)矩陣,Z2= ( y1,y2,…,yn)表示輸入樣本的東坐標(biāo)矩陣。
歸一化公式為式中:Zij為樣本數(shù)據(jù)Zij歸一化的結(jié)果,Zmax、Zmin分別為Z1、Z2中的最大值和最小值[3]。
3. 1建立模型
本文在嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,于輸入層前分別增加1個(gè)歸一化、標(biāo)準(zhǔn)化、中心化數(shù)據(jù)預(yù)處理層,構(gòu)成3種不同的徑向基函數(shù)網(wǎng)絡(luò)訓(xùn)練方法來建立模型,分別簡稱歸一化模型、標(biāo)準(zhǔn)化模型、中心化模型。實(shí)驗(yàn)過程中,運(yùn)用這3種不同的模型和嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)(無數(shù)據(jù)預(yù)處理層,在此稱徑向基模型)用同樣的樣本進(jìn)行訓(xùn)練,并對(duì)相同驗(yàn)證樣本進(jìn)行高程轉(zhuǎn)換[11]。
3. 2數(shù)據(jù)來源
采用某大型工程的D級(jí)GPS控制網(wǎng)點(diǎn)作為樣本數(shù)據(jù),該控制網(wǎng)共有點(diǎn)23個(gè),控制區(qū)域面積較大,達(dá)850 km2。水準(zhǔn)按照二等水準(zhǔn)測量要求施測,高程異常變化較大,異常值變化如圖2所示,其中坐標(biāo)、異常值已通過歸一化。取18個(gè)分布相對(duì)均勻的點(diǎn)作為訓(xùn)練樣本,5個(gè)點(diǎn)作為驗(yàn)證樣本[12-13]。樣本數(shù)據(jù)點(diǎn)位分布見圖3。
圖2 異常值變化Fig. 62Change of elevation anomaly change
圖3 樣本數(shù)據(jù)點(diǎn)位分布Fig. 63Distribution of example points
3. 3模型精度分析
由文獻(xiàn)[10]可知,newrbe可以迅速創(chuàng)建一個(gè)誤差為零的嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò),因此,不同的嚴(yán)格的徑向基函數(shù)網(wǎng)絡(luò)模型的可塑性都較好,在此不再就模型可塑性進(jìn)行比較。本文通過比較不同模型轉(zhuǎn)換所得高程異常與真值之差進(jìn)行轉(zhuǎn)換精度的評(píng)定,運(yùn)用標(biāo)準(zhǔn)差來考察不同轉(zhuǎn)換模型的泛化能力。比較統(tǒng)計(jì)見表1、圖4。
標(biāo)準(zhǔn)差公式
式中: n為驗(yàn)證樣本點(diǎn)總數(shù),Δε表示模型轉(zhuǎn)換所得高程異常εi與高程異常真值ε之差。
本文實(shí)驗(yàn)區(qū)域中,數(shù)據(jù)預(yù)處理使得徑向基函數(shù)
表1 轉(zhuǎn)換精度比較Table 1 Comparison of fitting accuracy m
圖4 不同模型轉(zhuǎn)換結(jié)果誤差絕對(duì)值Fig. 64Absolute value of fitting error based on different models
網(wǎng)絡(luò)高程轉(zhuǎn)換精度有較明顯的提高,且大大改善了徑向基函數(shù)網(wǎng)絡(luò)模型的泛化能力。由此可見,在應(yīng)用徑向基函數(shù)網(wǎng)絡(luò)進(jìn)行高程轉(zhuǎn)換時(shí),對(duì)數(shù)據(jù)樣本進(jìn)行預(yù)處理是非常必要的。
由表1和圖4得知,在本文實(shí)驗(yàn)中,中心化模型高程轉(zhuǎn)換精度最高,幾乎在所有驗(yàn)證點(diǎn)處的轉(zhuǎn)換誤差絕對(duì)值都是最小的,標(biāo)準(zhǔn)差最小,在3種模型中具有最強(qiáng)的泛化能力。標(biāo)準(zhǔn)化模型高程轉(zhuǎn)換精度稍低于中心化模型,其各驗(yàn)證點(diǎn)轉(zhuǎn)換誤差接近于中心化模型,也具有一定的泛化能力。歸一化模型高程轉(zhuǎn)換精度較低,且在某些驗(yàn)證點(diǎn)處轉(zhuǎn)換誤差絕對(duì)值偏大,模型泛化能力較差。
本文通過對(duì)選定區(qū)域數(shù)據(jù)實(shí)驗(yàn)分析表明,針對(duì)大面積、高程異常值變化較大的區(qū)域,在3種預(yù)處理數(shù)據(jù)中,中心化預(yù)處理數(shù)據(jù)對(duì)徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換精度提高程度最大,中心化預(yù)處理與徑向基函數(shù)網(wǎng)絡(luò)結(jié)合的模型具有較強(qiáng)的泛化能力。一部分參考文獻(xiàn)中常用的歸一化預(yù)處理方法,可能不是提高高程轉(zhuǎn)換精度的最優(yōu)數(shù)據(jù)預(yù)處理方式。在進(jìn)行高程轉(zhuǎn)換時(shí),有必要通過比較不同的數(shù)據(jù)預(yù)處理方法尋找更優(yōu)的數(shù)據(jù)預(yù)處理方式,以達(dá)到更優(yōu)化模型的目的。本文實(shí)驗(yàn)獲取數(shù)據(jù)具有局域性,不同的數(shù)據(jù)預(yù)處理方式對(duì)其他高程轉(zhuǎn)換模型以及在其他區(qū)域的優(yōu)化能力有待進(jìn)一步驗(yàn)證。
參考文獻(xiàn):
[1]劉建,王琪潔,王小輝,等.基于遺傳算法的RBF神經(jīng)網(wǎng)絡(luò)在GPS高程轉(zhuǎn)換中的應(yīng)用[J].測繪科學(xué),2013,38 ( 2) : 143-145.
[2]任超,吳偉,黃征凱,等.基于AIC準(zhǔn)則的RBF神經(jīng)網(wǎng)絡(luò)在GPS高程擬合中的應(yīng)用[J].測繪科學(xué),2013,38 ( 2) : 77-79.
[3]張昊,王琪潔,朱建軍,等.樣本數(shù)據(jù)預(yù)處理對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的GPS高程擬合的影響[J].大地測量與地球動(dòng)力學(xué),2011,31 ( 2) : 125-128.
[4]王小輝,王琪潔,丁元蘭,等.基于二次曲面和BP神經(jīng)網(wǎng)絡(luò)組合模型的GPS高程異常擬合[J].大地測量與地球動(dòng)力學(xué),2012,32 ( 6) : 103-106.
[5]姬張建,袁運(yùn)斌,盛傳貞.混沌粒子群支持向量機(jī)并考慮地形改正的GPS高程擬合[J].大地測量與地球動(dòng)力學(xué),2010,30 ( 2) : 95-98.
[6]焦明連,蔣廷臣.基于小波方法和Kriging估計(jì)的GPS高程轉(zhuǎn)換[J].大地測量與地球動(dòng)力學(xué),2008,28( 2) :100-103.
[7]魏子卿.GPS重力位水準(zhǔn)[J].大地測量與地球動(dòng)力學(xué),2007,27 ( 4) : 1-7.
[8]趙輝,張書畢,張秋昭.基于加權(quán)總體最小二乘法的GPS高程擬合[J].大地測量與地球動(dòng)力學(xué),2011,31( 5) :88-91.
[9]孫傳勝,楊國東,吳瓊.神經(jīng)網(wǎng)絡(luò)在GPS高程擬合中的應(yīng)用[J].測繪通報(bào),2011 ( 8) : 48-50.
[10]陳明.MATLAB神經(jīng)網(wǎng)絡(luò)原理與實(shí)例精解[M].北京:清華大學(xué)出版社,2013.
[11]黃良珂,劉立龍,唐艷新,等.基于改進(jìn)的Kriging法區(qū)域似大地水準(zhǔn)面精華[J].桂林理工大學(xué)學(xué)報(bào),2012,32 ( 4) : 532-536.
[12]王新橋,黃良珂,劉立龍,等.GPS高程轉(zhuǎn)換模型[J].桂林理工大學(xué)學(xué)報(bào),2013,33 ( 3) : 504-508.
[13]張騰旭,劉立龍,周淼,等.基于LS-SVM和BP神經(jīng)網(wǎng)絡(luò)組合模型的GPS高程擬合[J].桂林理工大學(xué)學(xué)報(bào),2014,34 ( 3) : 505-509.
[14]張騰旭,劉立龍,周淼,等.基于最小二乘配置法的高程擬合及精度評(píng)定方法[J].桂林理工大學(xué)學(xué)報(bào),2014,34(4) :728-731.
Effects of data pretreatment to elevation fitting on radial basis function network
LI Jun-yua,b,LIU Li-long,CAI Cheng-huia,b,LIN Guo-biaoa,b,HUANG Liang-kea,b
( a. College of Geomatics Engineering and Geoinformations; b. Guangxi key laboratory of Spatial Information and Geomatics; c. Guangxi Scientific Experiment Center of Mining,Metallurgy and Environment,Guilin University of Technology,Guilin 541004,China)
Abstract:The necessity of data pretreatment to the elevation fitting on radial basis function network modeling is described.The basic principle and implementation steps of the conversion modeling is depicted based on radial basis function networks elevation.With engineering examples,normalization,centralization,standardization of three different data pretreatment methods is used to calculate the impact of good conversion on radial basis function network.It is shown that data pretreatment model can achieve better conversion accuracy in a large area with elevation changes over the outliers.Different pretreatment methods result in different conversion.The centralization can improve the elevation accuracy on radial conversion function network in a greater degree.Normalization wouldn't be the best data pretreatment method.It is necessary for the selection of pretreatment method before elevation conversion.
Key words:normalization; centralization; standardization; pretreatment of data; radial basis function network; elevation fitting; raise accuracy
通訊作者:劉立龍,博士,教授,hn_liulilong@163. com。
作者簡介:黎峻宇( 1989—),男,碩士研究生,研究方向: GNSS技術(shù)及應(yīng)用,lijunyu36@163. com。
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目( 41064001) ;廣西自然科學(xué)基金項(xiàng)目( 2012GXNSFAA053183; 2012GXNSFGA060001) ;廣西研究生教育創(chuàng)新計(jì)劃項(xiàng)目( YCSZ2013077) ;廣西空間信息與測繪重點(diǎn)實(shí)驗(yàn)室項(xiàng)目(桂科能1207115-07) ;廣西礦冶與環(huán)境科學(xué)實(shí)驗(yàn)中心項(xiàng)目( KH2012ZD004) ;廣西“八桂學(xué)者”專項(xiàng)經(jīng)費(fèi)項(xiàng)目
收稿日期:2014-05-05
doi:10. 3969/j.issn. 1674-9057. 2015. 01. 015
文章編號(hào):1674-9057( 2015) 01-0103-04
文獻(xiàn)標(biāo)志碼:A
中圖分類號(hào):P228. 49
引文格式:黎峻宇,劉立龍,蔡成輝,等.?dāng)?shù)據(jù)預(yù)處理對(duì)基于徑向基函數(shù)網(wǎng)絡(luò)高程轉(zhuǎn)換的影響[J].桂林理工大學(xué)學(xué)報(bào),2015,35 ( 1) : 103-106.