王金玲
摘 要:本文通過分析比較空間數(shù)據(jù)內(nèi)插中反距離加權(quán)法和謝別德法的基本原理,并利用SRTM數(shù)據(jù)對對算法進行測試,結(jié)果表明,改進謝別德法的插值效果優(yōu)于反距離加權(quán)法和原始謝別德法。
關(guān)鍵詞:反距離加權(quán)法;謝別德方法;SRTM
中圖分類號:TB22 文獻標識碼:A
一、 引言
空間數(shù)據(jù)是用來表示空間實體的位置、形狀、大小及其分布特征諸多方面信息的數(shù)據(jù),它可以用來描述來自現(xiàn)實世界的目標,它具有定位、定性、時間和空間關(guān)系等特性,在社會各行業(yè)、各部門,如城市規(guī)劃、交通、銀行、航空航天等領(lǐng)域廣泛應用。隨著計算機技術(shù)的發(fā)展,空間數(shù)據(jù)的處理分析顯得尤為重要。通常觀測的空間數(shù)據(jù)是離散無規(guī)律的,而實際應用中除了需要知道某個點的確定值之外,還需要獲取觀測數(shù)據(jù)區(qū)域或某個指定區(qū)域范圍內(nèi)均勻分布的格網(wǎng)值。因此,需要將離散觀測數(shù)據(jù)進行內(nèi)插??臻g數(shù)據(jù)內(nèi)插在海洋、氣候、石油等地球科學及相關(guān)學科廣泛使用,例如,地球科學中的DEM構(gòu)建、圖形圖像處理,地球重力場中位場數(shù)據(jù) 等都要進行內(nèi)插。
常用的空間數(shù)據(jù)插值法很多,尤其在科學計算領(lǐng)域中的許多軟件均內(nèi)置了多種內(nèi)插算法,例如Sufer中就有12種插值算法(http://www.goldensoftware.com)。各種方法有各自優(yōu)點和缺點,有些算法簡單,如反(逆)距離加權(quán)法 、謝別德法、最近鄰點插值法等;有些算法復雜,計算耗時,如最小曲率法、克里金插值法 、多項式回歸法、徑向基函數(shù)法 、線性插值三角網(wǎng)法等。其中,與距離倒數(shù)有關(guān)的反距離加權(quán)法和謝別德方法簡單,計算省時,在一般的工程應用中極為廣泛。
本文就反距離加權(quán)法和謝別德方法,討論這兩種基本方法的特點,并利用SRTM數(shù)據(jù)進行分析比較。
二、 原理方法
空間數(shù)據(jù)插值就是根據(jù)已知點的觀測數(shù)據(jù) 內(nèi)插計算未知點 的數(shù)據(jù)處理過程。實際工作中一般要獲取規(guī)則格網(wǎng)數(shù)據(jù),因此,網(wǎng)格化就是根據(jù)一組已知點數(shù)據(jù) ,采用空間內(nèi)插方法生成網(wǎng)格數(shù)據(jù)的處理過程。這些空間內(nèi)插方法假設屬性值 是在研究區(qū)域內(nèi)是連續(xù)或分段連續(xù)的,也就是對于所有點 來說, 存在且是唯一的。此外,內(nèi)插模型可以是精確的,此時,要求模型精確通過觀測點時。不管采用何種方法,數(shù)據(jù)的多少、間隔及分布方向?qū)?nèi)插結(jié)果有影響。網(wǎng)格生成其實就是根據(jù)附近點進行加權(quán)平均的過程,一般假設每個網(wǎng)格單元或交叉點的值最有可能與其附近點的值接近。模型的一般形式為
式中 為第 個待內(nèi)插點的內(nèi)插估值; 為第 個位置在 處的已知或觀測值; 為已知點的總個數(shù); 為與 對應的系數(shù)因子,一般滿足
反距離加權(quán)法(IDW:Inverse Distance Weight)是一個加權(quán)平均插值法,其系數(shù)為
其中,對于某個待插點來說, 為一常數(shù),根據(jù)式,該方法的一般形式為:
這是一種直觀的加權(quán)平均法。在IDW方法中,權(quán) 用已知點 到內(nèi)插點 的距離 倒數(shù)表示,故得名反(逆)距離加權(quán)法。通常可以表示為
式中 為乘方因子,一般選擇為一整數(shù),取值一般為0~5。
在利用加權(quán)函數(shù)求取待插點數(shù)值中,一般只有臨近點對未知點有顯著影響。同時,為了節(jié)約計算時間,也不可能對所有觀測點都進行計算。因此,實際計算中只需選取未知點周圍部分數(shù)據(jù)進行內(nèi)插即可,即內(nèi)插前需要選擇合適的搜索區(qū)域,并考慮該區(qū)域的形狀與大小。其中,大小可以選擇為一個固定值,即指定一個搜索半徑;也可以根據(jù)某種適合的方式確定,例如根據(jù)計算中設定一個最少觀測點數(shù),由此每個計算中動態(tài)確定大小。搜索區(qū)域的形狀或搜索面積可以為圓形、橢圓形,或者上述這些形狀的分片組成。實際處理中,為了達到簡化的目的,搜索區(qū)域形狀一般選取為圓形,由此可以考慮兩個基本準則:一是距離準則,即用來計算內(nèi)插點的觀測點離內(nèi)插點某個半徑范圍之內(nèi);二是點數(shù)準則,即采用點數(shù)為離待插點最近的 個點。聯(lián)合考慮兩個準則就可以避免各自的不足。假設 為搜索半徑, 為所有觀點總數(shù), 為 個數(shù)據(jù)點所包圍多邊形的最大面積,假設在搜索半徑 范圍內(nèi)最少點數(shù)為 ,那么搜索半徑與最少點數(shù)之間有以下簡單關(guān)系
謝別德方法是南非地質(zhì)學家Shepard最早提出的方法,該方法本質(zhì)上是一種標準的距離倒數(shù)法。其權(quán)函數(shù)為[1]
另外一種改進Shepard方法根據(jù)最遠點距離來定權(quán),其中最遠距離也就是指定的搜索半徑 ,與IDW公式相似,該方法的權(quán)函數(shù)公式為:
上述公式均為平面坐標形式,如果在橢球坐標系中,需要將距離 按橢球坐標計算。本文使用數(shù)據(jù)即為橢球坐標系下的數(shù)據(jù)。
三、 實例分析
為了分析IDW和Shepard方法的特性,以數(shù)字地形高程模型SRTM進行測試。SRTM的全稱是Shuttle Radar Topography Mission,即航天飛機雷達地形測繪任務,由美國太空總署和國防部國家測繪局聯(lián)合實施觀測。SRTM數(shù)據(jù)每經(jīng)緯度方格提供一個文件,分辨率有1″和3″兩種,其中3″數(shù)據(jù)大約為地面距離90米,每個文件包含1201×1201共1442401個采樣點的高度數(shù)據(jù)。本文選取SRTM中N25E100.hgt文件為例,共有1439898個觀測值,缺少2503個數(shù)據(jù),其影像如圖 1所示。該區(qū)域地形復雜,起伏大,最高4072米,最低1162米,平均高度2112.7米。除了有兩個區(qū)域(100°8′E,25°38′N)和(100°20′E,25°58′N)附近屬于高地,存在明顯的數(shù)據(jù)缺失外(白色),還有多個小區(qū)域缺少數(shù)據(jù)。由于SRTM本身是格網(wǎng)數(shù)據(jù),為了對算法進行驗證,從原始數(shù)據(jù)中提取少數(shù)數(shù)據(jù)作為已知觀測值,其余數(shù)據(jù)用來進行檢驗。如影像
圖 2所示,圓圈表示選取的已知數(shù)據(jù),共有360579個,其它節(jié)點為未知點(實際已知數(shù)值用來檢核),需要進行內(nèi)插,共有1081822個。因此,這是一個以少數(shù)已知點內(nèi)插多數(shù)未知點的內(nèi)插過程,而實際工作中,一般都是以多數(shù)已知點來內(nèi)插少數(shù)未知點。
內(nèi)插處理中,選取乘方因子 ,數(shù)據(jù)搜索半徑為20″,分別采用基本的IDW方法、Shepard方法和改進的Shepard方法,將圖 2中圓圈點作為已知數(shù)據(jù),內(nèi)插其余節(jié)點的高程。將內(nèi)插結(jié)果與已知點聯(lián)合,可以得到如圖 3所示高程影像。可以看出,采用內(nèi)插算法,可以有效填補原始數(shù)據(jù)的缺損。將內(nèi)插結(jié)果與原始數(shù)據(jù)相減,可以得到表 1所示的統(tǒng)計結(jié)果??梢钥闯?,三種基于距離倒數(shù)的方法中,改進謝別德方法最優(yōu),平均差異約為-0.6mm,標準差為±13.62m,而IDW方法結(jié)果最差,平均差異和標準差分別為-2.8mm和±27.07m。
將差值作地理分布直方圖(圖 4),其中左圖僅繪出差值大于60米的分布圖,右圖僅作出差值小于-60米的分布,在右圖中,為了作圖方便,將負值均轉(zhuǎn)換為正值作圖。從圖中可以看出,差值大的點位大部分均位于地形復雜變化大的地方。
四、 結(jié)語
空間數(shù)據(jù)插值在科學計算中極為普遍,各種方法均有其優(yōu)點和不足,實際處理中要根據(jù)數(shù)據(jù)的物理特性及對數(shù)據(jù)的具體需要來選取最優(yōu)的算法。在對海量數(shù)據(jù)處理中,簡單的基于距離倒數(shù)的方法更能節(jié)約時間,但不一定是最優(yōu)的方法。為此,基于統(tǒng)計法的kriging方法在很多領(lǐng)域應用更加靈活,但其計算量大,計算耗時。
本文針對距離倒數(shù)法中的反距離加權(quán)法和謝別德方法,通過實例分析和比較,指出改進謝別德方法優(yōu)于傳統(tǒng)的反距離加權(quán)法和原始的謝別德法。在地形復雜、起伏大的地區(qū),插值精度較低,但算法簡單,計算省時,適宜對海量數(shù)據(jù)進行內(nèi)插處理。