孫寶京
(沈陽炮兵學(xué)院電子偵察系,遼寧沈陽 110867)
基于正交多項(xiàng)式擬合的氣象數(shù)據(jù)處理方法*
孫寶京
(沈陽炮兵學(xué)院電子偵察系,遼寧沈陽 110867)
針對(duì)高空氣象探測(cè)數(shù)據(jù)變化規(guī)律復(fù)雜、突變情況不可預(yù)測(cè)、數(shù)據(jù)量大等特點(diǎn),提出了基于離散數(shù)據(jù)正交多項(xiàng)式最小二乘的分段擬合方法.首先,從計(jì)算穩(wěn)定性角度,說明了采用離散數(shù)據(jù)的正交多項(xiàng)式最小二乘法的原因;其次,從曲線擬合的保形性角度,詳細(xì)闡述了二次分段擬合原則;最后,以具有典型特征的氣溫探測(cè)數(shù)據(jù)為例,證明了采用基于離散數(shù)據(jù)正交多項(xiàng)式最小二乘的分段擬合方法能夠獲得明顯優(yōu)于傳統(tǒng)內(nèi)插方法的擬合精度,提高高空氣象探測(cè)數(shù)據(jù)處理的精度和自動(dòng)化處理程度.
離散數(shù)據(jù);正交多項(xiàng)式;最小二乘;分段擬合;氣象探測(cè)
當(dāng)前氣象探測(cè)站整理高空氣象探測(cè)數(shù)據(jù)時(shí),主要采用的方法是將整個(gè)探測(cè)空間分層,計(jì)算規(guī)定高度的中間數(shù)值,作為計(jì)算層數(shù)據(jù),其他數(shù)據(jù)則采用依托計(jì)算層數(shù)據(jù)內(nèi)插的方法計(jì)算.上述計(jì)算方法使用高度上的數(shù)據(jù)均由計(jì)算層數(shù)據(jù)插值得到,存在一定的截?cái)嗾`差和舍入誤差;另外在較少的計(jì)算層數(shù)據(jù)中,必然會(huì)丟棄絕大多數(shù)探測(cè)數(shù)據(jù),造成探測(cè)資源的極大浪費(fèi).隨著氣象探測(cè)及作業(yè)裝備自動(dòng)化水平和數(shù)據(jù)處理能力的不斷提高,對(duì)高空氣象探測(cè)數(shù)據(jù)處理精度和時(shí)效性提出了更高的要求,這也使得從根本上改變氣象參數(shù)的計(jì)算方法成為可能[1].
由于氣象要素隨時(shí)間、空間在不斷地變化,而且探測(cè)儀器本身也受到許多復(fù)雜因素的影響,因此各種高空氣象探測(cè)數(shù)據(jù)普遍具有數(shù)據(jù)量大、變化規(guī)律復(fù)雜、突變情況較多且不可預(yù)測(cè)等特點(diǎn)[2].以彈道氣象諸元中最重要的高空實(shí)時(shí)氣溫/高度曲線為例,當(dāng)探測(cè)高度達(dá)到2萬m時(shí),采用電子探空儀探測(cè)的數(shù)據(jù)超過2 000組,雖然高空實(shí)時(shí)氣溫總體呈下降趨勢(shì),但是在局部經(jīng)常出現(xiàn)不可預(yù)測(cè)的無規(guī)則變化.
針對(duì)高空氣象探測(cè)數(shù)據(jù)特點(diǎn),筆者基于離散數(shù)據(jù)正交多項(xiàng)式最小二乘擬合思想,提出根據(jù)數(shù)據(jù)變化率的變化情況,分段擬合各種高空氣象探測(cè)數(shù)據(jù)曲線的方法.借助編程軟件的自動(dòng)處理,經(jīng)過多次試驗(yàn)證明,此方法可直接得出氣象通報(bào)所需要的氣(虛)溫-高度、氣壓-高度、風(fēng)速-高度和風(fēng)向-高度函數(shù)方程(高度為自變量),并且對(duì)高空氣象探測(cè)數(shù)據(jù)處理的精確性、實(shí)效性和計(jì)算簡(jiǎn)捷性都有了很大的提高.因?yàn)楦呖諏?shí)時(shí)氣溫/高度曲線在彈道氣象諸元中最為重要,所以筆者將以此作為說明實(shí)例.
用插值方法所找出的近似曲線,通過所有己知點(diǎn),但是由觀測(cè)或?qū)嶒?yàn)所獲得的數(shù)據(jù),不可避免地含有誤差,這就使插值所找出的近似曲線保存所有觀測(cè)誤差,導(dǎo)致所得結(jié)果可能偏離了實(shí)際情況,出現(xiàn)曲線擬合的過度現(xiàn)象.而根據(jù)實(shí)際標(biāo)準(zhǔn)盡可能地通過節(jié)點(diǎn)的函數(shù)值近旁,以部分地抵消原始數(shù)據(jù)所包含的觀測(cè)誤差,則更具有實(shí)用價(jià)值,最小二乘擬合就是其中的一個(gè)重要方法[3].
1.1 離散數(shù)據(jù)的正交多項(xiàng)式最小二乘擬合
在線性空間由Φ=span(φ0,φ1,...,φn)求解最小二乘曲線擬合問題,經(jīng)常會(huì)出現(xiàn)法方程組是病態(tài)方程組的情況,特別是當(dāng)樣本組數(shù)n偏大時(shí)更是如此,同時(shí)在求解法方程組時(shí)系數(shù)矩陣或右端項(xiàng)微小的擾動(dòng)都可能導(dǎo)致解函數(shù)有很大的誤差.為了確保計(jì)算過程的穩(wěn)定性和精確性,筆者利用基于高空氣象探測(cè)數(shù)據(jù)的正交多項(xiàng)式作為擬合函數(shù)系,使法方程組的系數(shù)矩陣變?yōu)閷?duì)角矩陣,從而解得正交多項(xiàng)式的系數(shù)[4-5].
根據(jù)點(diǎn)集{x1,x2,...,xm},構(gòu)造出相應(yīng)的正交多項(xiàng)式系{p0(x),p1(x),...,pn(x)}.
由正交多項(xiàng)式三項(xiàng)遞推關(guān)系,最高次項(xiàng)系數(shù)為1的正交多項(xiàng)式系{pk(x)}(k=0,1,2,...,n)有如下遞推關(guān)系:
其中pk(x)為最高項(xiàng)系數(shù)為1的k次多項(xiàng)式.由{pk(x)}正交性可知,
1.2 二次分段擬合原則
因一次完整綜合氣象探測(cè)的數(shù)據(jù)量大,若對(duì)整組數(shù)據(jù)進(jìn)行一次性擬合,則擬合精度和計(jì)算效果都比較差.同時(shí),為克服傳統(tǒng)分段曲線擬合方法中對(duì)數(shù)據(jù)點(diǎn)分段時(shí)經(jīng)驗(yàn)成分較多的缺點(diǎn),筆者根據(jù)數(shù)據(jù)曲線斜率的變化情況對(duì)曲線進(jìn)行分段擬合,并且加入了使相鄰曲線連續(xù),即曲線邊界點(diǎn)必須連續(xù)的約束條件[6-7].
考慮到高度是單調(diào)遞增,為了適應(yīng)高空氣象數(shù)據(jù)曲線在局部隨高度變化的無規(guī)則性,采取二次分段原則.
一次分段:在氣溫和高度曲線中,設(shè)Δti=(ti+1-ti)/(hi+1-h(huán)i),其中ti和hi分別為探測(cè)數(shù)據(jù)中第i個(gè)探測(cè)點(diǎn)的氣溫和高度,ti+1和hi+1分別為探測(cè)數(shù)據(jù)中第i+1個(gè)探測(cè)點(diǎn)的氣溫和高度.若Δti-1為負(fù),Δti,Δti+1,Δti+2,...,Δti+a(a≥1)為正,Δti+a+1,...,Δti+a+b(b≥1)為負(fù),Δti+a+b+1為正,則{ti,...,ti+a+b}為第i個(gè)分段,第i+1個(gè)分段從點(diǎn)ti+a+b開始.
二次分段:在氣溫和高度曲線中,第i個(gè)分段已經(jīng)由一次分段確定,設(shè)δi+c=Δti+c-Δti+c-1(1≤c≤a+b-1).若δi+1,δi+2,...,δi+d(d≥1)均大于標(biāo)準(zhǔn)值δ0(為負(fù)數(shù)),δi+d+1≤δ0,且δi+d+2,...,δi+d+e(e≥1)小于或等于(-δ0),δi+d+e+1>(-δ0),則ti+d+e+1為分段點(diǎn),即{ti,...,ti+d+e+1}為一個(gè)分段,下一個(gè)分段以ti+d+e+1為起點(diǎn),從δi+d+e+2開始判斷;若δi+1≤δ0,且δi+2,...,δi+e(e≥1)小于或等于(-δ0),δi+e+1>(-δ0),則ti+e+1為分段點(diǎn),即{ti,...,ti+e+1}為一個(gè)分段,下一個(gè)分段以ti+e+1為起點(diǎn),從δi+e+2開始判斷[8-9].
為使在單個(gè)分段內(nèi)擬合曲線在誤差允許范圍內(nèi)最大程度地保持?jǐn)?shù)據(jù)曲線的形狀,并且減少數(shù)據(jù)處理程序的計(jì)算量,實(shí)際計(jì)算過程對(duì)原始探測(cè)數(shù)據(jù)中心化計(jì)算后,采用如下做法進(jìn)行擬合:
若a+b≥5,則用四階正交多項(xiàng)式為擬合函數(shù)系,即當(dāng)一個(gè)分段包含4個(gè)以上的點(diǎn)時(shí)用四階正交多項(xiàng)式擬合,
若a+b=4,則用三階正交多項(xiàng)式為擬合函數(shù)系,即當(dāng)一個(gè)分段包含4個(gè)點(diǎn)時(shí)用三階正交多項(xiàng)式擬合,
若a+b=3,則用二階正交多項(xiàng)式為擬合函數(shù)系,即當(dāng)一個(gè)分段包含3個(gè)點(diǎn)時(shí)用二階正交多項(xiàng)式擬合,
同時(shí),使參與第i個(gè)分段擬合的第i個(gè)分段中的最后一個(gè)數(shù)據(jù)點(diǎn),作為第i+1個(gè)分段的第1個(gè)數(shù)據(jù)點(diǎn)參與第i+1個(gè)分段的擬合,這樣第i個(gè)分段的擬合函數(shù)和第i+1個(gè)分段的擬合函數(shù)在分界點(diǎn)上的值相等,從而實(shí)現(xiàn)所有分段擬合函數(shù)在整體上保持連續(xù)[10],即
以編號(hào)為087233的GZZ8型電子探空儀探測(cè)數(shù)據(jù)為例.
圖1是該組探測(cè)數(shù)據(jù)曲線中一部分,溫度t∈[-61.31,-62.27],高度H∈[15 125.89,1 5 494.56].根據(jù)文中的分段規(guī)則,數(shù)據(jù)處理系統(tǒng)自動(dòng)將此段數(shù)據(jù)曲線分為5段進(jìn)行擬合.
圖1 溫度和高度探測(cè)數(shù)據(jù)分布
第1個(gè)分段為前13個(gè)點(diǎn),h∈[15 125.89,15 230.23],擬合函數(shù)為
平方誤差為0.08.
第2個(gè)分段為后續(xù)7個(gè)點(diǎn),h∈[15 230.23,15 289.47],擬合函數(shù)為
平方誤差為0.03.
第3個(gè)分段為后續(xù)10個(gè)點(diǎn),h∈[15 289.47,15 397.85],擬合函數(shù)為
平方誤差為0.02.
第4個(gè)分段為后續(xù)5個(gè)點(diǎn),h∈[15 397.85,15 439.32],擬合函數(shù)為
平方誤差為0.01.
第5個(gè)分段為最后7個(gè)點(diǎn),h∈[15 439.32,15 494.56],擬合函數(shù)為
平方誤差為0.03.
根據(jù)傳統(tǒng)高空氣象探測(cè)數(shù)據(jù)處理方法,14 000~16 000m高度范圍內(nèi)的相關(guān)氣象數(shù)據(jù)從標(biāo)準(zhǔn)高度層14 000m和16 000m處的實(shí)際探測(cè)數(shù)據(jù)進(jìn)行線性內(nèi)插得到.在此例中,14 000m和16 000m處的氣溫分別為-56.16℃和-62.37℃,從而內(nèi)插得到高度為15 142.00,15 276.4,15 378.67,15 417.06,1 5 479.1m處的氣溫.各高度對(duì)應(yīng)的實(shí)際探測(cè)值、內(nèi)插結(jié)果和擬合結(jié)果見表1.由表1可見,采用基于離散數(shù)據(jù)正交多項(xiàng)式最小二乘的分段擬合法,可以獲得比傳統(tǒng)內(nèi)插法更好的擬合精度.
表1 不同高度實(shí)際探測(cè)值、內(nèi)插值、擬合值對(duì)應(yīng)關(guān)系
針對(duì)高空氣象探測(cè)數(shù)據(jù)量大、變化規(guī)律復(fù)雜、突變情況較多且不可預(yù)測(cè)等特點(diǎn),提出了基于離散數(shù)據(jù)正交多項(xiàng)式最小二乘的分段擬合法.經(jīng)過實(shí)踐證明,該方法能夠根據(jù)算法自動(dòng)分段,擬合出符合精度要求的曲線,在處理程序自動(dòng)計(jì)算過程中確保計(jì)算的穩(wěn)定性和高效性,避免傳統(tǒng)高空氣象探測(cè)數(shù)據(jù)處理方法中不斷累計(jì)的舍入誤差對(duì)結(jié)果的影響,提高高空氣象探測(cè)數(shù)據(jù)處理結(jié)果的精度和自動(dòng)化處理程度.
[1] 孫寶京.炮兵防空兵氣象信息系統(tǒng)研究[D].沈陽:東北大學(xué),2004.
[2] 曲延祿.外彈道氣象學(xué)概論[M].北京:氣象出版社,1987:59-176.
[3] FRANK R.Scattered Data Interpolation:Tests of Some Methods[J].Mathematical Computation,1982,38:181-200.
[4] MICCHELLI C.Interpolation of Scattered Data:Distance Matrix and Conditionally Positive Definite Functions[J].Constructive Approximation,1986,2:11-22.
[5] 藺小林,蔣耀林.現(xiàn)代數(shù)值分析[M].北京:國防工業(yè)出版社,2004:212-255.
[6] WU Zong-min,SCHABACK R.Shape Preserving Properties and Convergence of Univariate Multi-Quadric Quasti-Interpolation[J].ACTA Mathematice Application Sinica,1994,10:441-446.
[7] GREGORY J A.Shape Preserving Spline Interpolation[J].Computer-Aided Design,1986,18(1):53-57.
[8] KAUFMANN E,KLASS R.Smoothing Surfaces Using Reflection Lines for Families of Splines[J].Computer-Aided Design,1988,20(6):312-316.
[9] HOSCHEK J.Smoothing Curves and Surfaces[J].Computer-Aided Geometric Design,1985,2(1-3):97-105.
[10] JORG PRTERS.Local Smooth Surface Interpolation:A Classification[J].Computer-Aided Geometric Design,1 990(7):191-195.
(責(zé)任編輯 向陽潔)
Piecewise Curve Fitting Method of Processing Meteorological Data Based on the Orthogonal Polynomial
SUN Bao-jing
(Department of Electronic Reconnaissance,Shenyang Artillery Academy,Shenyang 110867,China)
In accordance with the characterics of the large number and complex and unpredicted trend on change of the meteorological detecting data,the piecewise curve fitting method based on the least squares of orthogonal polynomial for scattered data is presented.Firstly,the reason of using the least squares of orthogonal polynomial for scattered data is introduced from the respect of the stability of data processing.Secondly,the principle of twice piecewise curve fitting is set out in detail from the respect of the shape preserving feature of curve fitting.Finally,as the temperature detecting data for example,it is proved clearly that the twice piecewise curve fitting method can make much better fitting precision than the traditional interpolation method,and improve the level of precision and automation of the meteorological detecting data processing.
scattered data;orthogonal polynomial;least squares;piecewise curve fitting;meteorological detecting
P412.2;TP274
A
10.3969/j.issn.1007-2985.2013.05.012
1007-2985(2013)05-0049-04
2013-01-24
孫寶京(1968-),男,山東五蓮人,沈陽炮兵學(xué)院教授,主要從事彈道氣象學(xué)研究.