王冠宇
(山東理工大學(xué),山東 淄博 255000)
粗差會(huì)對最小二乘估計(jì)造成不良影響,即觀測值中含有粗差時(shí),采用最小二乘法求得的參數(shù)估值變得不再可靠[1]。L1范數(shù)最小估計(jì)作為一種穩(wěn)健估計(jì)方案,雖然在計(jì)算效率方面弱于最小二乘,但在抗差方面有較為明顯的優(yōu)勢[2]。目前對L1范數(shù)估計(jì)在測量數(shù)據(jù)處理中的應(yīng)用已有大量研究,如L1范數(shù)在控制網(wǎng)觀測值粗差探測,以及衛(wèi)星定位中的應(yīng)用等[3-4]。
在進(jìn)行平差處理時(shí),對于小樣本觀測的情形,計(jì)算效率并不是考慮的主要因素,保證精度為首要目標(biāo)。在一般的觀測過程,粗差出現(xiàn)的概率在1%~10%,且不服從正態(tài)分布[5-6]。此時(shí)若使用單純最小二乘估計(jì)進(jìn)行平差解算,參數(shù)估計(jì)必然會(huì)失實(shí);若采用L1范數(shù)最小估計(jì),是否會(huì)取得較高精度的參數(shù)平差值有待驗(yàn)證。
基于上述理論,本文詳細(xì)解釋了L1范數(shù)在平差過程中的應(yīng)用原理,并采用matlab軟件模擬觀測值,通過平差實(shí)驗(yàn),從內(nèi)、外符精度等方面對最小二乘估計(jì)和L1范數(shù)最小估計(jì)方案的抗差性以及殘差特性作出討論。實(shí)驗(yàn)表明,最小二乘會(huì)使粗差等概率分配到正常觀測值上,即不能從殘差分布上探測到粗差;L1范數(shù)則不受影響,對粗差觀測值作出有效探測。
設(shè)有誤差方程[7]:
基于線性規(guī)劃理論,對式(1)采用單純形法求解,其估計(jì)準(zhǔn)則[8]:
其中:n為觀測值個(gè)數(shù);pi為獨(dú)立觀測值的權(quán),vi為第i個(gè)觀測值的殘差;P和V為相應(yīng)的權(quán)陣和殘差向量。求解L1范數(shù)估計(jì)時(shí)通常使用基于線性規(guī)劃的單純形法或選權(quán)迭代法,解得待估參數(shù)及殘差V。將參數(shù)平差式(1)作為約束條件的L1估計(jì)數(shù)學(xué)模型[9]:
將(4)代入模型式中可得到線性規(guī)劃的標(biāo)準(zhǔn)形式[10]:
式(5)為具有概括性的L1范數(shù)平差模型?;谶x權(quán)迭代法求解L1范數(shù),取ρ函數(shù)為ρ(ν)=|ν|,則估計(jì)準(zhǔn)則[11]:
式中:νi為觀測值改正數(shù);ρ(νi)為觀測值權(quán)函數(shù),式(6)對求導(dǎo),得
如此進(jìn)行法方程解算并迭代,直到前后兩次解的差值符合限差要求為止。選權(quán)迭代法解算L1范數(shù)已有較多討論,在此不多贅述,本文使用算法和模型相對完備的單純形法對L1范數(shù)估計(jì)進(jìn)行求解。
標(biāo)準(zhǔn)形式的單純形法用向量形式表示如下[12]:
約束方程組的系數(shù)矩陣的任意非奇異子方陣B,其列向量線性無關(guān),稱為一個(gè)基矩陣,用B來表示B=(P1,…,Pm)。除基變量以外的變量Pi(i=m+1,…,n),非基矩陣用N表示N=(Pm+1,Pm+2,…,Pn)。從而可以將系數(shù)矩陣寫為分塊的形式A=(B,N),記XB=(x1,x2,…,xm)T,XN=(xm+1,xm+2,…,xn)T,這樣待求解X寫為分塊形式,即BXB+NXN=b,由此解得:
這是用非基變量表達(dá)基變量的公式。此時(shí)可以將XN看作一組自由變量,給它們?nèi)我庖唤M值,得,這就是約束方程組的一個(gè)解。如令式(5)中所有的非基變量,則,稱解為線性規(guī)劃問題的基本可行解。
在式(10)中令xN=0,得,則式(5)相當(dāng)于。將式(10)代入目標(biāo)函數(shù)的表達(dá)式,即得用非基變量表達(dá)目標(biāo)函數(shù)的公式:
此時(shí)若記目標(biāo)函數(shù)在x(0)處的值為f(0),即,再記,則目標(biāo)函數(shù)的表達(dá)式可寫為:
λj可用來判斷一個(gè)基可行解是否為最優(yōu)解,對于某線性規(guī)劃問題的一個(gè)基B,若全部λN=cN-cBB-1N≥0,則對應(yīng)的基解x(0)便是LP的最優(yōu)解,否則重復(fù)上述過程。
假設(shè)某觀測向量為Y,參數(shù)真值向量為X,其存在以下關(guān)系:
式中ε是誤差向量。為了實(shí)驗(yàn)驗(yàn)證方便,我們給定真值X和設(shè)計(jì)矩陣A,則觀測值的真值向量:
給定的參數(shù)真值X=[1,2,3]T;隨機(jī)生成100×3的設(shè)計(jì)矩陣A;根據(jù)不同情況生成的100×1的誤差向量ε。生成模擬數(shù)據(jù)后,為了直觀展示最小二乘估計(jì)與L1范數(shù)估計(jì)之間的差異,使用如下方案進(jìn)行解算:
(1)生成服從均值為0,標(biāo)準(zhǔn)差為1的無粗差正態(tài)分布誤差,分別用最小二乘估計(jì)和L1范數(shù)估計(jì)進(jìn)行計(jì)算,重復(fù)計(jì)算過程10次,得到當(dāng)誤差分布服從正態(tài)分布時(shí)的參數(shù)X;
(2)在(1)的基礎(chǔ)上,對每次生成的數(shù)據(jù)添加10%的較大粗差,并比較2種算法的結(jié)果差異。
為對比2種算法所得結(jié)果,使用內(nèi)符精度和外符精度進(jìn)行直觀展現(xiàn)[2]。參數(shù)的內(nèi)符精度含義為所有組數(shù)據(jù)計(jì)算的參數(shù)中誤差的平均,即為第i組數(shù)據(jù)第n個(gè)參數(shù)的中誤差。參數(shù)的外符精度為所有數(shù)據(jù)計(jì)算的參數(shù)真誤差的均方根,即mn=為第i組數(shù)據(jù)第n個(gè)參數(shù)的中誤差。
根據(jù)上述實(shí)驗(yàn)流程,得到結(jié)果見表1。
表1 2種方法精度對比
由表1我們可以看出,當(dāng)誤差服從正態(tài)分布的時(shí)候,最小二乘估計(jì)和L1范數(shù)估計(jì)的內(nèi)、外符精度存在較小差別,最小二乘估計(jì)精度稍優(yōu)于L1范數(shù)估計(jì),說明此時(shí)最小二乘估計(jì)最優(yōu)。而當(dāng)添加粗差時(shí),對最小二乘估計(jì)會(huì)造成嚴(yán)重影響,L1范數(shù)則能避免粗差影響,依然保持和無粗差時(shí)相同的精度。下面,我們通過2種方案的殘差值來進(jìn)一步分析。
從圖1中我們可以看出,在使用最小二乘估計(jì)平差時(shí),會(huì)將粗差無差別等概率分配到其他觀測值中,導(dǎo)致無法從殘差結(jié)果進(jìn)行粗差觀測值的定位。說明最小二乘估計(jì)不具有抗差性,粗差會(huì)損害最小二乘估計(jì)的平差結(jié)果,從而無法達(dá)到預(yù)期精度。
圖1 最小二乘估計(jì)殘差值
由圖2我們可以看出,L1范數(shù)估計(jì)的殘差值能精確定位粗差觀測值,真殘差會(huì)分配到粗差較大的觀測值上,說明L1范數(shù)具有較強(qiáng)的抗粗差能力。
圖2 L1范數(shù)估計(jì)殘差值
通過L1范數(shù)估計(jì)和最小二乘估計(jì)的實(shí)驗(yàn)驗(yàn)證,小樣本情況下,當(dāng)觀測中不含粗差時(shí),最小二乘估計(jì)和L1范數(shù)估計(jì)精度相差不大;當(dāng)觀測值中含有粗差時(shí),L1范數(shù)最小估計(jì)能獲得較好的平差結(jié)果,這與L1范數(shù)的解算原理有關(guān),總是能在準(zhǔn)則下選得最優(yōu)的平差解。
雖然L1范數(shù)估計(jì)相比最小二乘有良好的抗差性,但并不能說L1范數(shù)估計(jì)強(qiáng)于最小二乘,其在某些情況存在不能真實(shí)反映粗差信息的問題,且其多適用于小樣本參數(shù)估計(jì)。在抗差領(lǐng)域,發(fā)展L1范數(shù)與最小二乘相結(jié)合的抗差估計(jì)方法,進(jìn)而為抗差最小二乘提供高質(zhì)量、高可靠性殘差信息,讓最小二乘變得適應(yīng)性更強(qiáng)。