姜家慶*
(天津市市政工程設(shè)計(jì)研究院,天津 300202)
在數(shù)據(jù)處理中,最小二乘法(Least Squares,LS)是最基本的數(shù)據(jù)處理方法,從18世紀(jì)高斯提出后發(fā)展至今成為數(shù)據(jù)處理領(lǐng)域應(yīng)用最廣泛的方法。最小二乘法是以只存在觀測(cè)向量誤差為前提的。然而,在測(cè)量數(shù)據(jù)處理過(guò)程中,由于采樣誤差和建模誤差,觀測(cè)向量誤差和系數(shù)矩陣偏差往往是同時(shí)存在的。在這種情況下,用最小二乘法求得的參數(shù)估值就不再是最優(yōu)無(wú)偏估計(jì)了。針對(duì)這種情況,在20世紀(jì)80年代有學(xué)者對(duì)最小二乘方法進(jìn)行擴(kuò)展,提出了總體最小二乘方法,該方法在計(jì)算觀測(cè)值誤差的同時(shí)還能顧及模型系數(shù)矩陣誤差,在系數(shù)矩陣存在誤差時(shí),總體最小二乘解比最小二乘解更為真實(shí)可靠。
在本章節(jié)中,作者首先以一個(gè)直線擬合模型介紹最小二乘方法的基本思想及原理;然后以一個(gè)系數(shù)矩陣存在誤差的問題引出總體最小二乘方法并闡述了其原理;最后給出了兩種最為常見的總體最小二乘問題的解法及其詳細(xì)的推導(dǎo)過(guò)程。
經(jīng)典的高斯-馬爾柯夫模型假設(shè)函數(shù)模型是已知且非隨機(jī)的,并且只考慮觀測(cè)向量含隨機(jī)誤差,假設(shè)系數(shù)矩陣不存在誤差或者不考慮系數(shù)矩陣誤差。但是在很多實(shí)際問題中,比如大地測(cè)量反演、邊坡監(jiān)測(cè)、空間數(shù)據(jù)分析和坐標(biāo)轉(zhuǎn)換等數(shù)學(xué)模型中,函數(shù)模型的系數(shù)矩陣也是由觀測(cè)數(shù)據(jù)組成。因此,不僅觀測(cè)向量存在誤差,系數(shù)矩陣也有可能出現(xiàn)隨機(jī)誤差。此時(shí),再用最小二乘原理做數(shù)據(jù)處理的話,計(jì)算結(jié)果就不能再保證其最優(yōu)無(wú)偏性。而總體最小二乘方法就能很好地解決這一問題,該方法在計(jì)算觀測(cè)值誤差的同時(shí)還能顧及模型系數(shù)矩陣誤差。
設(shè)線性函數(shù)模型為:L=AX-V (1)
上式中,L為 n×1觀測(cè)向量,A為 n×t系數(shù)矩陣,X為 t×1未知參數(shù),V為觀測(cè)向量誤差??傮w最小二乘方法是不僅考慮觀測(cè)向量含有誤差V,而且還顧及系數(shù)矩陣誤差EA,那么上式應(yīng)改寫為
對(duì)應(yīng)的誤差方程可寫為
誤差的期望和方差為
式中,In和 It分別為 n和 t階單位矩陣,vec(EA)是將 矩 陣 EA按列拉直得到的列向 量化函 數(shù),vec(EA)∈R(n×t)×1;表示克羅內(nèi)克(Kronecker)積。(2-10)式的矩陣形式為
求解上述方程的總體最小二乘方法可以表示為一個(gè)約束化問題:
求解‖(EA,V)‖F(xiàn)最小的問題即為總體最小二乘問題,當(dāng)n<t+1即方程個(gè)數(shù)小于未知參數(shù)個(gè)數(shù)時(shí),存在無(wú)數(shù)多個(gè)解X,用總體最小二乘解可以給出其最小范數(shù)解。而總體最小二乘問題主要是研究當(dāng)n>t即線性方程超定時(shí)的總體最小二乘解。下面就介紹一下超定方程的兩種常用的總體最小二乘解法。
奇異值分解是線性代數(shù)中一種非常重要的矩陣分解方法,最早由Golub和Van Loan引入求解總體最小二乘問題。
一般情況下,求解線性方程L=AX,當(dāng)n≥t+1時(shí),NTN的階數(shù)小于或等于 NNT,此時(shí),由矩陣 NTN求出來(lái)的最小特征值對(duì)應(yīng)的特征向量就是對(duì)應(yīng)于最小奇異∑t+1值的右奇異向量Wt+1。將
代入式(2-24),該式可變換為
則有
1)列觀測(cè)方程,建立函數(shù)模型 L+V=(A+EA)X;
2)構(gòu)建增廣矩陣 N=[A L],并對(duì)增廣矩陣進(jìn)行奇異值分解;
3)求解矩陣 NTN的特征值,并得出最小特征值 σt+1;
Schaffrin和魯鐵定等對(duì)總體最小二乘平差模型和推到方法進(jìn)行了改進(jìn)后[97、98],得出總體最小二乘平差準(zhǔn)則為
以式(2-10)為條件,按拉格朗日乘數(shù)法求解,構(gòu)成目標(biāo)函數(shù)為
由式(12)和(13)分別可得
將式(16)代入上式,可得
將(20)式化為
同時(shí)
將(21)和(22)寫成矩陣形式
上式即為參數(shù)的總體最小二乘解,采用迭代求解。
總體最小二乘的奇異值分解法是基于數(shù)值逼近理論的總體最小二乘解,該解法沒有顧忌變量誤差(EIV)的隨機(jī)模型,因此總體最小二乘的奇異值分解法求得的參數(shù)估值并不是真正統(tǒng)計(jì)意義上的TLS解。奇異值分解法無(wú)法獲得相關(guān)情況下的平差模型以及觀測(cè)數(shù)據(jù)不等精度的統(tǒng)計(jì)意義上的最佳估值,而這種情況在大地測(cè)量領(lǐng)域又是普遍存在的。因此,盡管奇異值分解法算法簡(jiǎn)單,其在大地測(cè)量領(lǐng)域的應(yīng)用也受到了很多的限制。
總體最小二乘的迭代解法是Schaffrin等人基于拉格朗日求極值并且結(jié)合測(cè)量數(shù)據(jù)處理的特點(diǎn),從測(cè)量平差的角度,顧及系數(shù)矩陣含有誤差的情況下,構(gòu)建拉格朗日條件極值的目標(biāo)函數(shù),并推導(dǎo)出來(lái)的總體最小二乘解法。
從理論上來(lái)講,在觀測(cè)量獨(dú)立等精度的情況下,兩種解法是等價(jià)的。然而在測(cè)量數(shù)據(jù)處理過(guò)程中,往往是出現(xiàn)觀測(cè)量精度不等的情況??傮w最小二乘的迭代解法是從測(cè)量平差的角度推導(dǎo)而來(lái)的,因此該算法更適用于測(cè)量數(shù)據(jù)處理。
最小二乘法是測(cè)繪數(shù)據(jù)處理領(lǐng)域中最基本的數(shù)據(jù)處理方法,但是最小二乘方法有很大局限性,即最小二乘只考慮觀測(cè)向量的誤差而不考慮系數(shù)矩陣的誤差或者是假設(shè)系數(shù)矩陣不存在誤差。然而,在實(shí)際的數(shù)據(jù)處理過(guò)程中發(fā)現(xiàn),觀測(cè)方程系數(shù)矩陣往往會(huì)存在一定的偏差。如果直接忽略觀測(cè)系數(shù)矩陣偏差的影響,求得的參數(shù)估值必然不是最優(yōu)無(wú)偏估計(jì)??傮w最小二乘方法的提出則很好的解決了這一問題,該方法在考慮觀測(cè)向量誤差的同時(shí)也顧及了觀測(cè)方程系數(shù)矩陣偏差。當(dāng)觀測(cè)方程系數(shù)矩陣存在偏差時(shí),總體最小二乘解比最小二乘解更為真實(shí)可靠。在求解總體最小二乘問題時(shí),最常用的方法有奇異值分解法和迭代解法。由于在測(cè)量數(shù)據(jù)處理過(guò)程中,觀測(cè)向量往往是精度不相等的,總體最小二乘的迭代解法更適用于測(cè)量數(shù)據(jù)處理。
【參考文獻(xiàn)】
[1]陶武勇,魯鐵定.基于奇異值分解法的抗差總體最小二乘[J].江 西 科 學(xué) ,2015,33(01):101-105.
[2]魯鐵定,周世健.總體最小二乘的迭代解法[J].武漢大學(xué)學(xué) 報(bào) (信 息 科 學(xué) 版 ),2010,35(11):1351-1354.
[3]王樂洋.測(cè)邊網(wǎng)坐標(biāo)的總體最小二乘平差方法[J].大地測(cè)量與地球動(dòng)力學(xué),2012,32(06):81-85.
[4]李思達(dá).總體最小二乘平差方法及若干測(cè)繪應(yīng)用研究[D].中國(guó)礦業(yè)大學(xué),2017.
[5]趙英文.總體最小二乘精度評(píng)定方法研究[D].東華理工大學(xué),2017.