高 尚,金 犇,郭 凱
(長江水利委員會水文局長江下游水文水資源勘測局,南京 210011)
在長江沿線的基礎(chǔ)測繪和工程建設(shè)中,高程數(shù)據(jù)是必不可少的。傳統(tǒng)的高程測量方法,如幾何水準法,雖然準確,但在大范圍水準測量中成本高且效率低下[1]。隨著衛(wèi)星導(dǎo)航定位技術(shù)的發(fā)展,GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))高程在工程測繪中得到廣泛應(yīng)用。然而,由于衛(wèi)星定位技術(shù)所采用的高程基準面是參考橢球面而非傳統(tǒng)水準基準的大地水準面,導(dǎo)致出現(xiàn)高程異常問題。為解決高程異常影響,研究者們提出了多種方法,包括曲線擬合模型、曲面擬合模型、神經(jīng)網(wǎng)絡(luò)模型和地球重力場模型等。
其中,二次多項式方法作為曲面擬合模型在高程擬合中得到廣泛應(yīng)用。該方法通過最小二乘準則構(gòu)建擬合方程,并利用此方程外推高程異常值。粟劍[2]采用曲線擬合法將GNSS 大地高轉(zhuǎn)換為正常高,使擬合高程達到三等測量精度。唐詩華等[3]針對GPS 高程擬合方法的精度問題,根據(jù)測量實例比較了各種最小二乘法的擬合能力。研究表明:最小二乘估計在高程擬合中精度最高。張騰旭等[4]通過研究發(fā)現(xiàn)對于大面積高程異常值變化較大的地區(qū),最小二乘配置法能夠取得較高的擬合精度。在高程擬合方面,張潘等[5]通過高程擬合與三等水準測量成果進行對比分析,驗證了模型在實際中應(yīng)用的優(yōu)越性。
近年來,隨著機器學(xué)習(xí)算法的不斷發(fā)展,如BP 神經(jīng)網(wǎng)絡(luò),采用機器學(xué)習(xí)來進行高程異常擬合也引起了許多學(xué)者的廣泛關(guān)注。曾凱等[6]利用神經(jīng)網(wǎng)絡(luò)進行高程擬合應(yīng)用。鄧才林等[7]采用BP 神經(jīng)網(wǎng)絡(luò)對湖南省新化縣進行高程異常擬合。李林曉等[8]對改進的RBF 神經(jīng)網(wǎng)絡(luò)組合模型中的關(guān)鍵參數(shù)進行優(yōu)化選取,且應(yīng)用于工程實踐中。
本文旨在探究二次多項式擬合和BP 神經(jīng)網(wǎng)絡(luò)在高程擬合中的應(yīng)用。通過評估內(nèi)外符合精度,對比分析2 種方法的精度表現(xiàn)。該研究將提供一種新的解決方案和方法,為長江沿線大范圍帶狀區(qū)域的高程擬合問題提供支持,以提高測繪和工程建設(shè)的精確性。
高程異常的多項式擬合法就是建立一個以二維位置參數(shù)為自變量的多項式函數(shù)模型,其函數(shù)值即為高程異常,通過一定數(shù)量的已知點的高程異常值可計算出多項式的系數(shù)。對于公共點(同時具有大地高和正常高的點)上的高程異常與平面坐標之間假定有如下數(shù)學(xué)關(guān)系
式中:ξi為對應(yīng)于平面坐標(xi,yi)的高程異常,a0、a1、a2、a3、a4、a5為所求的模型參數(shù),εi是誤差,因此,需要6 個或6 個以上公共點,采用最小二乘原理進行數(shù)學(xué)模擬,確定模型。
將式(2)寫成矩陣形式
通過列以上的方程并解算,本文可以求出各個重合點的正常高。具體方法是,解出在Σε2=min 條件下的ai值,再通過公式(2)求解出未知點的ξ。
BP 神經(jīng)網(wǎng)絡(luò)也可以稱為多層前饋型神經(jīng)網(wǎng)絡(luò),其最大特點是信號和錯誤的反向傳輸。初始權(quán)重是隨機設(shè)置的,然后根據(jù)反向傳播過程中訓(xùn)練數(shù)據(jù)(訓(xùn)練過程中的計算值)與輸出數(shù)據(jù)(訓(xùn)練要達到的實際值)之間的差異進行修改。重復(fù)前進和后退過程,直到訓(xùn)練數(shù)據(jù)和輸出數(shù)據(jù)之間的差異達到訓(xùn)練精度為止,其具體網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示[9]。
圖1 BP 神經(jīng)網(wǎng)絡(luò)模型算法結(jié)構(gòu)
BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層三部分組成。設(shè)神經(jīng)網(wǎng)絡(luò)的輸入向量為X=(X1,…,Xn)T,期望輸出為d=(d1,…,dm)T,輸入層與隱含層的權(quán)值矩陣為V=(v1,v2,…,vk,…,vq)T,閥值為θ,隱含層和輸出層的權(quán)值矩陣為W=(w1,w2,…,wi,…,wm)T,神經(jīng)網(wǎng)絡(luò)的正向傳輸?shù)挠嬎氵^程如下。
隱含層的輸出計算公式為
輸出層的輸出計算公式為
式中:f1(I1)、f2(I2)為隱含層與輸出層的傳遞函數(shù),f1(I1)通常為Sigmoid 函數(shù)。f2(I2)可以為Sigmoid 函數(shù)或Purelin 函數(shù),y2為最終的輸出值。
常用BP 神經(jīng)網(wǎng)絡(luò)通常采用誤差反向傳播法調(diào)整連接權(quán)。神經(jīng)網(wǎng)絡(luò)的目標函數(shù)為
式中:p 表示第p 個樣本,k 表示第k 個節(jié)點,dk表示期望輸出。
本文的BP 神經(jīng)網(wǎng)絡(luò)簡述如下:使用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱建立,輸入層包含高程點平面坐標x 和y,輸出層為高程異常。訓(xùn)練函數(shù)選用了tansig、purelin 和trainlm,訓(xùn)練參數(shù)設(shè)置net.tranParam.show=100,net.tranParam.epochs=1000,net.tranParam.lr=0.01,net.tranParam.goal=le-3,并且其他參數(shù)采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱默認值。
南京河段是長江中下游重點河段之一,上承馬鞍山河段,下接鎮(zhèn)揚河段。河段起始端和尚港是蘇皖兩省分界點,終端為泗源溝,主泓長100.3 km。本文采用長江下游安徽馬鞍山市小黃洲沿江至江蘇鎮(zhèn)江市世業(yè)洲頭的E 級GNSS 控制點作為樣本數(shù)據(jù),該段區(qū)域控制點共有71 個,控制長度約為104 km,控制點呈帶狀分布在長江兩岸沿線(點位分布圖如圖2 所示),水準高程按照三等水準測量要求施測。本文取60 個分布相對均勻的點作為樣本點,11 個點作為待擬合點。
圖2 點位分布圖
為了分析不同模型的可塑性,可以使用已知點的GNSS 高程異常值與擬合的高程異常值進行比較,并定義擬合殘差,來驗證不同模型的精度。精度評定分為內(nèi)符合精度和外符合精度。
2.2.1 內(nèi)符合精度
根據(jù)參與擬合計算已知點的GNSS 高程異常值ξi與擬合的高程異常值進行比較,并用來定義擬合殘差,內(nèi)符合精度μ1公式如下所示
2.2.2 外符合精度
根據(jù)參與擬合計算檢核點的GNSS 高程異常值ξi與擬合的高程異常值進行比較,并用ui=ξi-ζi′來定義擬合殘差,外符合精度公式如下所示
分別采用2 種方式對測區(qū)范圍內(nèi)的60 個高程值進行擬合,驗證精度的誤差最大值(max)、誤差最小值(min)、均方根誤差(RMS)、平均絕對誤差(MAE)、中誤差見表1,2 種方法在對應(yīng)點擬合殘差如圖3 所示,BP神經(jīng)網(wǎng)絡(luò)擬合結(jié)果如圖4 所示。
表1 內(nèi)符合精度對比
圖3 二次多項式與BP 神經(jīng)網(wǎng)絡(luò)擬合殘差
從表1 與圖3 中可知,采用2 種擬合方式都有較好的擬合效果,計算結(jié)果非常接近,誤差趨勢也一致。
通過對2 種擬合方式的數(shù)據(jù)進行對比,可以看出,在該測區(qū)范圍內(nèi),通過二次多項式和BP 神經(jīng)網(wǎng)絡(luò)2 種擬合方式計算得出的結(jié)果相差較小。針對11 個均勻分布的校核點進行外符合精度計算比較,得出以下結(jié)論:
首先,從表2 中可以看出,2 種擬合方式在最大值和最小值方面的絕對值誤差都在測量要求范圍之內(nèi)。
表2 外符合精度對比
其次,通過比較RMS 和MAE,可以看出2 種擬合方式在整體預(yù)測精度上也相差較小。RMS 和MAE 都是衡量預(yù)測結(jié)果與真實值之間誤差的指標,數(shù)值越小代表預(yù)測的精度越高。根據(jù)表2 中的數(shù)據(jù),二次多項式的RMS 為0.040 4,BP 神經(jīng)網(wǎng)絡(luò)的RMS 為0.034 5,這說明使用BP 神經(jīng)網(wǎng)絡(luò)進行擬合的結(jié)果相對更加精確。而在MAE 方面,二次多項式的數(shù)值為0.033 1,BP 神經(jīng)網(wǎng)絡(luò)的數(shù)值為0.025 3,也表明了BP 神經(jīng)網(wǎng)絡(luò)相對于二次多項式更能接近真實數(shù)據(jù)。
最后,本研究還可以觀察比較2 種擬合方式的中誤差。中誤差是用來衡量預(yù)測值的分散程度,數(shù)值越小說明預(yù)測結(jié)果的穩(wěn)定性越好。根據(jù)表2 的數(shù)據(jù),二次多項式的中誤差為0.042 3,BP 神經(jīng)網(wǎng)絡(luò)的中誤差為0.036 2,可以看出2 種擬合方式在中誤差上也存在一定的差距,BP 神經(jīng)網(wǎng)絡(luò)的結(jié)果更加穩(wěn)定。
綜上所述,通過對2 種數(shù)據(jù)擬合方式進行比較,研究可以得出結(jié)論:無論是二次多項式還是BP 神經(jīng)網(wǎng)絡(luò),都能夠滿足測量要求內(nèi)的誤差,并且2 種方式的預(yù)測結(jié)果相差較小。在整體預(yù)測精度上,BP 神經(jīng)網(wǎng)絡(luò)相對于二次多項式表現(xiàn)更佳,其RMS 和MAE 的數(shù)值較小,能夠更準確地擬合真實數(shù)據(jù)。此外,BP 神經(jīng)網(wǎng)絡(luò)還表現(xiàn)出更好的穩(wěn)定性,其中誤差較小。因此,本研究可以認為BP 神經(jīng)網(wǎng)絡(luò)是一種更適用于該測區(qū)范圍內(nèi)數(shù)據(jù)對比的擬合方式。
本文以長江下游馬鞍山至鎮(zhèn)江多項式段布設(shè)的E級GNSS 控制網(wǎng)作為實驗區(qū)域,使用二次多項式曲面擬合、BP 神經(jīng)網(wǎng)絡(luò)擬合2 種常用的方式進行高程擬合,對大范圍帶狀區(qū)域高程擬合方法進行研究。通過研究得出:
1)確定地球表面高程異常的大小不僅與地球內(nèi)部的密度變化有關(guān),也與地形起伏等多種因素有關(guān)。因此,對于給定區(qū)域內(nèi)的高程異常點,采用一種數(shù)學(xué)函數(shù)進行擬合時,由于擬合模型的缺陷,必然存在誤差。在選擇擬合方程來描述高程異常分布時,只能選擇誤差相對較小的模型,這是比較合理的做法。
2)已知點的分布情況對擬合效果和選擇擬合模型具有關(guān)鍵影響。如果已知點覆蓋整個擬合區(qū)域,則擬合精度通常比較穩(wěn)定。但是,如果待擬合的點位于已知點所涵蓋的區(qū)域之外,則擬合精度會降低。
3)2 種高程擬合方法相對比,BP 神經(jīng)網(wǎng)絡(luò)擬合具有相對更好的擬合結(jié)果,但容易陷入局部最優(yōu)解,應(yīng)在實際應(yīng)用當中,多次進行訓(xùn)練,最后選擇更好的擬合結(jié)果。
綜上所述,在長江下游平原沿線區(qū)域,進行高程擬合時,可采用BP 神經(jīng)網(wǎng)絡(luò)擬合法。