宋占峰 ,郭捷佳 ,李 軍
(中南大學土木工程學院,湖南 長沙 410075)
直線擬合不僅是曲線擬合研究的熱點,并且在工程實踐中被應用廣泛[1-2]. 直線擬合是由n個測量點 (xi,yi),i=1,2,···,n,基于最小二乘準則找到一條最佳擬合直線.x、y分別為自變量、因變量,a、b分別為直線的斜率和截距,擬合直線的方程為y=ax+b.
普通最小二乘認為變量x或y無誤差去估計參數(shù)a和b,該方法簡單明了,但選擇自變量和因變量不同,擬合的直線不同. 正交最小二乘認為x和y具有相同的精度,幾何意義是測量點到擬合直線的垂直距離平方和最小,通常被認為是最佳擬合[3],在鐵路整正工程中被廣泛采用[4-5].
為顧及自變量x存在誤差,通常采用EIV (errorsin-variables)模型進行整體最小二乘估計直線參數(shù)[6-7].整體最小二乘通過建立變量的隨機模型可以實現(xiàn)普通及正交最小二乘擬合直線,同時還可以實現(xiàn)加權(quán)整體最小二乘擬合直線[8]. 但此時還不能考慮自變量x和因變量y間的誤差相關(guān)性. 當已知觀測誤差的隨機特性時,參數(shù)的最優(yōu)估計應符合這種隨機特性[9]. Amiri-Simkooei 等[10]進一步提出了考慮觀測值誤差充分相關(guān)性的加權(quán)整體最小二乘法擬合直線.
直線是軌道線形的組成部分,為保證線路平順性,需要估計直線參數(shù),進行既有軌道線形整正. 采用全站儀采集的數(shù)據(jù)點,其縱、橫坐標不僅精度不同,并且誤差具有相關(guān)性. 因此,考慮觀測值誤差相關(guān)性的加權(quán)整體最小二乘才能處理這種情況,實現(xiàn)直線的最佳擬合. 整體最小二乘法是基于擬合直線得出的,要處理系數(shù)矩陣含有誤差及與因變量y誤差相關(guān)等情況,引入了EIV 模型及Kronecker 積等復雜矩陣運算[11]. 這在一定程度上造成了理解及工程應用上的困難[12]. 同時,線路中直線的擬合還受到相鄰線元的約束.
因此,本文基于極大似然估計及拉格朗日條件極值原理建立直線擬合模型,引入表征測點位置的附加參數(shù),推導出了顧及約束和觀測值誤差相關(guān)性直線擬合的通用方法. 實驗驗證了該方法能在任何誤差分布情況下顧及約束估計直線參數(shù)及其精度.
由式(1)和誤差傳播定律可計算點P縱、橫坐標的方差-協(xié)方差陣為
圖1 全站儀測量原理Fig. 1 Measuring principle
圖2 擬合原理Fig. 2 Fitting principle
直線上n個觀測點坐標組成觀測向量l,其聯(lián)合密度函數(shù)為
線路中直線的擬合還要滿足與相鄰線元相切等約束條件,如已知相鄰線元為圓曲線,其圓心位置(x0,y0)和半徑R已知,則直線擬合受到的約束為
式中:B為系數(shù)矩陣,其秩為約束條件的個數(shù);w為閉合差向量.
構(gòu)造拉格朗日極值函數(shù)為
求得參數(shù)的最佳估值,需進一步評定其精度. 依據(jù)協(xié)因數(shù)傳播定律,由式(24)得到參數(shù)估值 Θ? 的協(xié)因數(shù)陣為
由于擬合模型舍去了高次項,參數(shù)初值為近似值. 因此,需要使用高斯-牛頓迭代尋優(yōu)算法進行迭代計算,直至 δΘ 向量趨于0. 迭代終止條件設為‖δΘ‖≤ε ,ε為閾值,取為10?6. 算法流程見圖3.
圖3 高斯-牛頓迭代算法Fig. 3 Gauss-Newton iteration algorithm
選取國內(nèi)某既有專用線(設計速度30 km/h)直線段的復測數(shù)據(jù),每20 m 測一個點,共20 個測點,坐標數(shù)據(jù)見表1. 使用的全站儀的測角精度為2″,測距精度為(2 + 2 × 10?6D) mm,D為距離,mm. 控制點A的坐標為(1000.012,1500.023),后視方位角為45°00′05″,由式(3)~(5)可計算出各測點縱、橫坐標的方差及協(xié)方差,進而組成方差-協(xié)方差矩陣C.取先驗單位權(quán)中誤差 σ0=1 ,由式(10)可計算出實際測點的隨機模型P1,其各項元素列于表1.表中:px、py和pxy分別為式(2)中c?1對應對角線元素和非對角線元素. 結(jié)果表明觀測點的坐標分量不僅精度不同,并且誤差具有相關(guān)性.
為驗證直線的擬合方法的通用性,選用了對應正交最小二乘和普通最小二乘的兩種隨機模型對比計算,隨機模型P2為單位矩陣,表示觀測點的x坐標和y坐標具有相同的精度,即正交最小二乘擬合;模型P3表示x坐標的精度遠高于y坐標,即普通最小二乘擬合.
由設計資料知該直線與圓曲線直接相接,圓心C的坐標為(1693.970,1443.300),半徑R= 800 m. 為測試高斯-牛頓算法的效率和穩(wěn)健性,選擇的初始直線遠離最優(yōu)位置,初始直線參數(shù)列于表2 中的第0 次迭代,閉合差w為圓心到直線的距離減去半徑,初始直線與圓曲線相離479.525 m. 算法經(jīng)過6 次迭代收斂,w變?yōu)?,說明擬合直線滿足約束,與圓曲線相切于直圓點(Z),圖4(a)展示了該擬合過程,驗證了方法的正確性.
表2 顧及約束和相關(guān)誤差的直線擬合過程Tab. 2 Process of straight-line fitting with both a constraint and correlated noise
3 種隨機模型的非零元素見表1. 約束下3 種隨機模型的擬合直線參數(shù)和精度列于表3,算法均經(jīng)過6 次迭代收斂,耗時均在0.6 s 以內(nèi). 基于P1得到的后驗單位權(quán)中誤差 σ?0= 16.5 mm,截距的中誤差σb= 60.0 mm,均為最小,相對于P2和P3得到的σb= 66.1 mm,精度提升了9.2%. 3 種隨機模型下的直圓點坐標(xZ,yZ)列于表3,對應位置如圖4(b),分別表示為Z1、Z2和Z3,其中Z2和Z3點重合.
表1 實地觀測點坐標及采用的3 種隨機模型Tab. 1 Coordinate pairs of field surveying data and three stochastic models for fitting
表3 約束下3 種隨機模型擬合直線的參數(shù)估值及其精度Tab. 3 Parameter estimation of fitting line and their precisions of three stochastic models with constraints
令B為空矩陣,用同樣的參數(shù)初值進行無約束的直線擬合,3 種隨機模型的擬合直線參數(shù)和精度列于表4,算法均經(jīng)過3 次迭代收斂,耗時均在0.5 s 以內(nèi),表明無約束擬合直線具有更高的效率.且無約束時的單位權(quán)中誤差及參數(shù)精度均高于約束下的直線擬合,說明在無約束情況下,測點與擬合直線的貼合度更好. 但是,無約束擬合獲得的直線不相切于已知圓曲線,如圖4(b)所示,相離距離d= 0.18 m,不符合線路連續(xù)性的要求. 另外,在無約束擬合時,基于P1得到的后驗單位權(quán)中誤差σ?0= 2.3 mm,截距的中誤差 σb= 25.0 mm,相對P2和P3精度提升了2.7%. 說明不論是否有約束,考慮坐標相關(guān)誤差時,獲得的直線參數(shù)精度均為最高.
表4 無約束下3 種隨機模型擬合直線的參數(shù)估值及其精度Tab. 4 Parameter estimation of line fitting and their precisions of three stochastic models without constraint
圖4 約束及無約束的直線擬合Fig. 4 Straight-line fitting with a constraint and without constraint
在鐵路維護中,全站儀獲取的軌道坐標點具有誤差相關(guān)性,普通最小二乘或正交最小二乘擬合直線不能考慮觀測值之間的這種誤差相關(guān)性. 提出的直線擬合通用模型,可以考慮坐標分量間的誤差相關(guān)性實現(xiàn)直線擬合. 通過指定隨機模型,可以實現(xiàn)普通最小二乘、正交最小二乘或加權(quán)整體最小二乘直線擬合,并揭示了其對應的幾何意義.
通常的直線擬合方法未考慮約束條件,線路重構(gòu)中直線的擬合受到相鄰線元的約束. 提出的直線擬合通用模型,可以在約束下同時顧及誤差相關(guān)性實現(xiàn)直線擬合. 顧及坐標相關(guān)誤差時,可以提升估計參數(shù)的精度:約束及無約束下參數(shù)估計精度分別提高了9.2%和2.7%.
采用的高斯-牛頓算法運行效率高,能夠快速得到直線參數(shù)的最佳估值及其精度. 在約束及無約束情況下分別僅6 次及3 次迭代就搜索出最優(yōu)直線.
致謝:中南大學土木工程國家級實驗教學示范中心項目(201905406).