陳西強,黃張裕
(河海大學 測繪科學與工程系,江蘇 南京 210098)
抗差估計的選權(quán)迭代法分析與比較
陳西強,黃張裕
(河海大學 測繪科學與工程系,江蘇 南京 210098)
在抗差穩(wěn)健估計中,選權(quán)迭代法應用最廣,較易理解,M估計法計算簡單。基于M估計的基本理論,深入分析Huber、Hampel、IGG 3種常用的選權(quán)迭代法,并利用水準網(wǎng)數(shù)據(jù),分析這3種常用選權(quán)迭代法的適用范圍和相應的抗差效果,表明IGG法比其他兩種的抗粗差效果要好,且易實現(xiàn)。
抗差穩(wěn)健估計;選權(quán)迭代法;Huber法;Hampel法;IGG法
在抗差穩(wěn)健估計中,最常用的為M估計法,其估計方法有許多種,其中選權(quán)迭代法應用最廣,較易理解,計算簡單。對于選權(quán)迭代法,理論研究相對比較多,但對其中的參數(shù)選取,在理論上有所研究,實際應用研究上存在不夠深入和不足的問題[1-2]。本文在分析M穩(wěn)健估計基本理論的基礎上,討論了3種常用的選權(quán)迭代法。選用水準網(wǎng)實例,深入分析3種選權(quán)迭代法的初始權(quán)選取和條件參數(shù)選取,并從縱橫兩個方面來進行比較、分析這3種常用選權(quán)迭代法的適用范圍和相應抗差效果,表明IGG法比其他兩種方法的抗粗差效果要好,且易實現(xiàn)。
設有參數(shù)向量X是未知的非隨機量,為了估計未知向量值,進行n次觀測得到向量L的觀測值l,由極大似然估計有[3]
式中:f是隨機量L的密度函數(shù)。
Huber提出用ρ(li,x)代替函數(shù)-lnf(li,^x),使其定義廣義化,于是有
式中:φ(li,^x)=?ρ(li,x)/?x。
由式(2)對參數(shù)x進行估計,就是廣義極大似然估計,簡稱M估計。測量平差中,觀測量L的殘差為V,M估計的函數(shù)ρ可取為ρ(vi),即M估計的準則為
通常殘差V為未知數(shù)的函數(shù),將式(2)對未知數(shù)x求導,取極值點,則有
考慮到誤差方程vi=ai^x-li,ai為A的第i行向量,則有
令權(quán)函數(shù)pi(vi)=ρ′(vi)/vi,即得
用矩陣表示為
式(7)類似最小二乘估計的法方程形式,用權(quán)函數(shù)矩陣P(V)=diag(p1(vi),p2(vi),…,pn(vi))代替觀測權(quán)陣P。為此,可將穩(wěn)健估計的選權(quán)迭代法歸結(jié)為如下模型:
誤差方程與權(quán)函數(shù)為
估計準則為
將平差模型轉(zhuǎn)換為最小二乘估計的模型,采用類似最小二乘估計。只是權(quán)函數(shù)P(V)是殘差的函數(shù),計算前V未知,只能通過給其賦予一定的初值,采用迭代法估計參數(shù)^x。具體計算過程如下:
1)列誤差方程,令各觀測權(quán)函數(shù)初值均為1,即令p1(vi)=p2(vi)=…=pn(vi)=1。
2)解算法方程,得出^x和V的第1次估值^x(1)=(ATA)-1ATl,V(1)=A^x(1)-l。
3)由V(1)確定各觀測權(quán)函數(shù)pi(vi),再解算法方程,通過迭代計算,直到前后兩次解的差值符合要求為止。
4)最后結(jié)果為
隨著函數(shù)ρ的選取不同,可以構(gòu)成權(quán)函數(shù)的多種不同的形式,通常權(quán)函數(shù)是一個在平差過程中隨改正數(shù)變化的量,經(jīng)過多次迭代,使含有粗差的奇異觀測的權(quán)函數(shù)為0(或者接近于0),而相應的殘差值在很大程度上反映了其粗差值[4-5]。
2.1 Huber法
Huber法的極值估計準則是假設觀測值在不利分布情況下求最優(yōu)估計[6]。取M估計的函數(shù)
由Huber權(quán)函數(shù)可以看出,Huber估計的權(quán)函數(shù)是單調(diào)的,它在c處的斜率有突然變化。當所有改正數(shù)均在-c和c之間時,Huber估計就是經(jīng)典最小二乘法估計[7]。而當部分改正數(shù)大于c時,其p(v)與改正數(shù)成反比,v愈大,對應的p(v)愈小,與此相應該觀測值對參數(shù)估計的影響也愈小。
2.2 Hampel法
對于Hampel法,取M估計的函數(shù)為3段截尾函數(shù)
求得權(quán)函數(shù)pi(vi)為
式中:a、b、c為3個系數(shù),可適當選取,它們均為標準差的倍數(shù)。
2.3 IGG法(周文江法)
IGG法是由中國科學院測量與地球物理研究所周文江教授最初提出的,取M估計的函數(shù)[8]
求得權(quán)函數(shù)pi(vi)為
IGG法屬于有淘汰區(qū)的M估計,權(quán)因子之間變化比較平緩,k值一般取一個很小的數(shù)。
水準路線如圖1所示。
圖1 水準路線
如表1所示水準網(wǎng),A、B兩點的已知高程分別為HA=5.000 m,HB=6.000 m,觀測了7條水準線路,表中帶*號的表示有粗差的觀測值,對h2賦以粗差0.050 m,h6賦以粗差-0.030 m。根據(jù)水準路線觀測數(shù)據(jù),按最小二乘原理,在不含有粗差和含有粗差的條件下分別解算,如表2所示。
表1 水準網(wǎng)觀測數(shù)據(jù)
表2 基于最小二乘解算結(jié)果
3.1 3種方法分析
對于 Huber法分析c選取對估計結(jié)果影響。在迭代過程中,σ值隨每次迭代后算出的觀測改正值來確定。在本次數(shù)據(jù)分析中,c分別取 0.4σ、0.8σ、σ、1.2σ、1.6σ、2.0σ、2.5σ,試驗數(shù)據(jù)結(jié)果如表3所示。
表3 c選取對估計結(jié)果的影響
從表3的數(shù)據(jù)可以知道,隨著c取值的增大,總體上中誤差越來越大,迭代次數(shù)越來越多,到達一定的時候,迭代效果失效。而且當c為一倍中誤差的時候,Vh2和Vh6的改正值是最能反映出含有粗差的數(shù)據(jù),但總體效果不是很理想。
對于Hampel法分析a、b、c的取值對估計結(jié)果影響。a、b、c3個系數(shù)分別取4組值進行比較分析,即取a=0.9σ,b=1.8σ,c=2.7σ;a=σ,b=2σ,c=3σ; a=1.1σ,b=2.2σ,c=3.3σ和a=1.2σ,b=2.4σ,c= 3.6σ,試驗數(shù)據(jù)結(jié)果如表4所示。
表4 a、b、c取值對估計結(jié)果的影響
從表4數(shù)據(jù)分析可知,在a、b、c三者的相互間隔增大的同時,方案1、2、3的估計結(jié)果沒有大的變化,只是中誤差和迭代次數(shù)都有所增大。當三者之間的間隔超出了一定的范圍時,必將導致估計失效。試驗分析得出間隔應在0.9~1.1之間,而且當間隔太小時,會導致求解過程中的權(quán)陣單極化。
對于IGG法分析k取值對估計效果影響。分別取k為0.001、0.000 1、0.000 01,試驗所得數(shù)據(jù)如表5所示。
表5 k取值對估計效果的影響 mm
從表5的數(shù)據(jù)分析可知,只要k值在一定的范圍之內(nèi),即對估計的效果沒有影響。權(quán)函數(shù)中的條件是隨著每次迭代得到的中誤差,在整個迭代過程中是變化的,而且越來越低,隨著滿足迭代條件而終止。
另外,對于3種選權(quán)迭代方法,分別分析初始權(quán)選取對估計結(jié)果的影響。在試驗分析中分別采用了初始權(quán)都為1和初始權(quán)按距離定權(quán)的2種方案進行數(shù)據(jù)分析,3種迭代方法計算結(jié)果完全相同,數(shù)據(jù)結(jié)果如表6所示。
表6 初始權(quán)選取對估計結(jié)果的影響 mm
從表6的數(shù)據(jù)分析可以看出,初始權(quán)的選取對3種方法的估計結(jié)果都沒有影響。
3.2 3種方法比較分析
現(xiàn)對Huber、Hampel、IGG方法作橫向比較,由這3種方法分別對這個已知含有粗差的水準網(wǎng)觀測數(shù)據(jù)進行平差處理,得到的結(jié)果如表7所示。
表7 不同選權(quán)迭代法比較
從表7的數(shù)據(jù)分析可知,在粗差較大的情況下,在迭代次數(shù)和最后的精度及計算結(jié)果綜合因素來看,IGG法比 Hampel法和Huber法效果要好。在抗粗差及剔除粗差方面,IGG和 Hampel都能很好地剔除由于h2帶來的粗差0.050 m和h6已賦的粗差-0.030 m,而Huber法相對來說要差點,而且在Huber法中的c值的選取好壞直接影響到抗粗差的能力。
1)穩(wěn)健估計中的選權(quán)迭代法在初始化權(quán)方面都是相同的,即估計結(jié)果不受初始權(quán)的取值影響,且在選權(quán)迭代過程中,對于選權(quán)的標準或條件系數(shù)都是隨著每次迭代完后重新計算的中誤差相關,說明3種選權(quán)迭代的條件系數(shù)是動態(tài)的。
2)對于 Huber法,隨著c取值的增大,總體上中誤差越來越大,迭代次數(shù)越來越多,到達一定的時候,迭代失效,而且當c為1倍中誤差時,Vh2和Vh6的改正值是最能反映出含有粗差的數(shù)據(jù),但效果不是很理想,因此,在含粗差較大時,建議 Huber法中c的取值范圍為中誤差的0.8~1.2之間。對于Hampel法,a、b、c三者的取值在一定范圍內(nèi)相互間隔增大時,估計結(jié)果沒有大的變化,只是中誤差和迭代次數(shù)都有所增大,當三者之間的間隔超出了一定的范圍,將導致估計失效,試驗結(jié)果表明間隔應在0.9~1.1之間,而且當間隔太小時,會導致求解過程中的權(quán)陣單極化。在IGG法分析中,k的取值足夠小就能滿足要求,如本文試驗k值取0.001~0.000 01。
3)在這3種穩(wěn)健估計的選權(quán)迭代法中,IGG法比其他兩種的抗粗差效果要好,且易實現(xiàn);在不清楚數(shù)據(jù)分布的情況下,建議采用IGG法。
[1]陶本藻.穩(wěn)健估計的應用問題[J].地礦測繪,2000(1): 1-3.
[2]楊元喜.參數(shù)M估計及驗后精度綜述[J].測繪通報, 1991(6):6-10.
[3]劉大杰 ,陶本藻.實用測量數(shù)據(jù)處理方法[M].北京:測繪出版社,2000:52-58.
[4]吳富梅.多種權(quán)函數(shù)固定臨界值與可變臨界值抗差估計的比較[J].測繪工程,2006,15(3):19-22.
[5]李浩軍,唐詩華,黃杰.抗差估計中幾種選權(quán)迭代法常數(shù)選取的探討[J].測繪科學,2006,31(6):70-72.
[6]周江文.經(jīng)典誤差理論與抗差估計[A].抗差估計論文集[C].北京:測繪出版社,1992:1-6.
[7]姚宜斌.基于等價分析法的穩(wěn)健估計權(quán)函數(shù)設計[J].測繪工程,2001,10(2):29-31.
[8]楊元喜,宋力杰,徐天河.大地測量相關觀測抗差估計理論[J].測繪學報,2002,31(2):95-99.
Analysisand comparison of the selecting weight iteration method in resistance robust estimation
CHEN Xi-qiang,HUANG Zhang-yu
(Department of Survey Science and Engineering,Hohai University,Nanjing 210098,China)
In the robust estimation,selecting weight iteration method is the most w idely understood,more easily and simp le calculation of M estimation.Based on the basic theory of M estimation method,this paper deep ly analyzes three common selecting w eight iteration methodsw hich are Huber、Hampel、IGGmethods,and analyzes the app licable scope and co rresponding poo r effect on the three commonly selecting w eight iteration methods by using the data of the netwo rk level.It show s that the exco rresponding poo r effect of the IGG is better than other two methods,and easy to achieve results.
resistance robust estimation;selecting weight iteration method;Hubermethod;Hampelmethod;IGGmethod.
P207
A
1006-7949(2010)04-0008-04
2009-09-03
陳西強(1986-),男,碩士研究生.
[責任編輯:劉文霞]