閆麗莉 溫少妍 高文晶 劉傳軍 楊 甜
整點(diǎn)氣溫缺測的插補(bǔ)方法研究及其初步應(yīng)用1
閆麗莉1)溫少妍2)高文晶1)劉傳軍1)楊 甜3)
1)天津市地震局,天津 300201 2)新疆維吾爾自治區(qū)地震局,烏魯木齊 830011 3)山西省地震局代縣中心地震臺(tái),山西忻州 034200
長期連續(xù)完整的歷史氣溫資料是震前氣溫異常判別研究的重要數(shù)據(jù)基礎(chǔ)。本文考慮了參考站與缺測站之間的距離,建立改進(jìn)的線性回歸模型。利用該模型插補(bǔ)缺測和錯(cuò)誤的氣溫整點(diǎn)值數(shù)據(jù),在一定程度上解決了長期連續(xù)觀測數(shù)據(jù)缺測的情況。通過對(duì)收集的唐山觀測站氣溫整點(diǎn)值數(shù)據(jù)進(jìn)行插補(bǔ),并應(yīng)用插補(bǔ)完整的數(shù)據(jù)分析研究了2012年5月28日唐山4.8級(jí)地震前兆異常。結(jié)果表明:①插補(bǔ)值與其前后觀測值銜接吻合,插補(bǔ)后完整連續(xù)數(shù)據(jù)符合夏高冬低的年變規(guī)律;②插補(bǔ)誤差在±0.5℃范圍內(nèi)的比例為60.2%,在±0.8℃范圍內(nèi)的比例為80.3%,其誤差絕對(duì)值大于1.0℃的比例為9.6%,平均絕對(duì)誤差為0.84℃,插補(bǔ)值與觀測值的相關(guān)系數(shù)大部分在0.9以上;③從3月27日起出現(xiàn)增溫異常,特別是震前2天增溫幅度約8℃。
整點(diǎn)氣溫 插補(bǔ) 線性回歸 地震
陸地與大氣緊密相連,地震前大氣的異常情況受到地震學(xué)者們的重視。前人進(jìn)行了大量探索性研究工作,以尋求地震前兆(徐國鈞等,1993;李貴福等,1996;曹新來等,1997;張鐵寶等,2013)。在這些地震研究中,長期連續(xù)完整且均一性較好的氣象資料是研究地震前氣溫異常的數(shù)據(jù)基礎(chǔ)。但是,由于各種原因(如環(huán)境干擾、硬件故障等),歷史氣溫資料缺測現(xiàn)象時(shí)有發(fā)生,導(dǎo)致氣溫觀測資料缺測,造成歷史資料的不連續(xù)(王建國等,2010;2013;姚會(huì)琴等,2012)。
中國許多學(xué)者開展了對(duì)日、月、年時(shí)間尺度的氣象資料缺測插補(bǔ)研究,并利用一維車貝雪夫多項(xiàng)式展開、線性回歸、標(biāo)準(zhǔn)序列法、基于SVD的迭代等方法對(duì)中國部分地區(qū)的氣象日、月、年值資料進(jìn)行了恢復(fù)性實(shí)驗(yàn)(張秀芝等,1996a,1996b;涂詩玉等,2001;張永領(lǐng)等,2006;王海軍等,2008;余予等,2012),但對(duì)整點(diǎn)氣溫值進(jìn)行缺測插補(bǔ)鮮見文獻(xiàn)報(bào)道。在國外,Huth等(1995)建立回歸模型來插補(bǔ)缺測的日氣溫?cái)?shù)據(jù),Eischeid等(2000)采用空間差值法,插補(bǔ)后建立美國西部40年逐日氣溫和降水?dāng)?shù)據(jù)集,但這些插補(bǔ)模型只用于1個(gè)或數(shù)個(gè)缺測日數(shù)據(jù)的插補(bǔ),不合適用于連續(xù)幾個(gè)月數(shù)據(jù)缺測的情況。DeGaetano等(1995)引用改進(jìn)的標(biāo)準(zhǔn)序列法,對(duì)美國東北部近400個(gè)站的日最高、最低氣溫缺測值進(jìn)行了插補(bǔ)。標(biāo)準(zhǔn)序列法和線性回歸法解決了插補(bǔ)長期連續(xù)缺測數(shù)據(jù)的問題。整點(diǎn)氣溫值的缺測插補(bǔ)方法可借鑒日平均、最高、最低氣溫值的缺測插補(bǔ)方法。由于線性回歸法具有更好的統(tǒng)計(jì)性能和穩(wěn)健性,本文對(duì)線性回歸法進(jìn)行改進(jìn),考慮了距離因素,采用線性回歸模型參數(shù)求解法,解決了連續(xù)數(shù)日甚至數(shù)月造成的氣溫缺測問題,為地震前后氣溫變化特征的研究提供長期連續(xù)完整可靠的數(shù)據(jù)資料,也為今后開展衛(wèi)星遙感紅外亮溫與衛(wèi)星過境時(shí)刻氣溫的對(duì)比研究奠定了數(shù)據(jù)基礎(chǔ)。
本文選取的研究區(qū)范圍為37°—42°N、113°—119°E,在研究區(qū)內(nèi)收集到15個(gè)地震觀測站(氣溫觀測站)的氣溫整點(diǎn)值數(shù)據(jù),觀測站分布情況如圖1所示。
圖1 氣溫觀測站分布
本文收集了15個(gè)地震觀測站氣溫?cái)?shù)據(jù),氣溫指地面以上1.5m處百葉窗測得的空氣溫度。太陽的熱能被地面吸收后,地面再通過輻射、傳導(dǎo)和對(duì)流把熱傳給空氣,這是空氣中熱量的主要來源。氣溫的觀測范圍-30℃—70℃,精度0.1℃。由于各觀測站安裝時(shí)間、停測時(shí)間不同,導(dǎo)致觀測時(shí)間的長度不等,多數(shù)觀測數(shù)據(jù)起止時(shí)間為2007年1月1日,截止時(shí)間為2014年12月31日。
由于觀測環(huán)境、儀器設(shè)備故障等原因,部分觀測站的觀測數(shù)據(jù)缺測,包括僅缺測1個(gè)值、缺測1天的值(即24個(gè)觀測值)、連續(xù)缺測幾天甚至1個(gè)多月導(dǎo)致長達(dá)數(shù)千個(gè)觀測值連續(xù)缺測等情況。基于震例研究,本文僅討論唐山站氣溫?cái)?shù)據(jù)的缺測情況(表1),可以看出該站缺測情況較嚴(yán)重,如2008年8月18日—9月15日連續(xù)缺測696個(gè)整點(diǎn)值,2009年4月2日—5月13日連續(xù)缺測1000個(gè)整點(diǎn)值,2012年6月2日—24日連續(xù)缺測552個(gè)整點(diǎn)值,2013年1月21日—2月5日連續(xù)缺測384個(gè)整點(diǎn)值。唐山站數(shù)據(jù)連續(xù)缺測時(shí)間較長,連續(xù)缺測幾十個(gè)值的頻率較高,同時(shí)該站還存在錯(cuò)誤值,如2010年11月22日18時(shí)的觀測氣溫整點(diǎn)值是59.701,類似的錯(cuò)誤值在每年均有出現(xiàn)。2010、2011年的觀測數(shù)據(jù)較完整。
表1 唐山站整點(diǎn)氣溫?cái)?shù)據(jù)的缺測統(tǒng)計(jì)
圖2為唐山站2012年12月17日—22日氣溫整點(diǎn)值變化曲線,可以看出氣溫日變明顯,最高溫一般出現(xiàn)在14時(shí)左右,最低溫出現(xiàn)在8時(shí)左右,符合日變規(guī)律。
圖2 唐山站氣溫變化曲線
對(duì)唐山站2012年1、4、7、10月的日均值進(jìn)行分析,繪制了相關(guān)曲線,如圖3所示。由圖可以看出,氣溫變化整體表現(xiàn)出明顯的夏高冬低的年變規(guī)律;1月、7月氣溫變化平穩(wěn),4月氣溫表現(xiàn)為升溫過程,10月氣溫表現(xiàn)為明顯的降溫過程。
圖3 唐山站氣溫日均值變化曲線
唐山站2008—2013年連續(xù)的氣溫整點(diǎn)值數(shù)據(jù)變化曲線如圖4所示。由圖可以看出,氣溫表現(xiàn)出明顯的夏高冬低的年變特征,夏季最高日平均溫度接近31℃,冬季最低日平均溫度接近-14℃;氣溫在冬季和夏季處于穩(wěn)定的狀態(tài),氣溫從3月開始上升,1月—7月處于升溫過程,氣溫上升快,7月、8月氣溫達(dá)到最高,9月后氣溫開始迅速降低,進(jìn)入降溫階段,符合季節(jié)變化規(guī)律;此外,數(shù)據(jù)缺測明顯。
圖4 唐山站氣溫整點(diǎn)值年變曲線
應(yīng)用線性回歸法解決連續(xù)幾日甚至數(shù)月的整點(diǎn)氣溫值缺測問題,并采用交叉驗(yàn)證方法對(duì)插補(bǔ)結(jié)果進(jìn)行誤差分析。
本文對(duì)線性回歸方法進(jìn)行改進(jìn),考慮了參考站和缺測站之間的距離。改進(jìn)后該方法更科學(xué),可以更好地去除距離因素的影響。
利用鄰近站資料對(duì)距離進(jìn)行加權(quán),建立回歸模型,插補(bǔ)缺測站資料的方程式為:
因歷史同期各要素時(shí)空變化規(guī)律通常比較相似,選擇缺測整點(diǎn)值前后若干整點(diǎn)值的歷史同期(不包括缺測值所在的年份)數(shù)據(jù),作為擬合回歸模型的樣本數(shù)據(jù),建立線性回歸模型,并利用附近站資料,計(jì)算缺測記錄插補(bǔ)值。
本文采用交叉驗(yàn)證的方法對(duì)缺測記錄的插補(bǔ)結(jié)果進(jìn)行分析,即假設(shè)某個(gè)站的記錄缺測,首先利用插補(bǔ)模型插補(bǔ)整點(diǎn)氣溫?cái)?shù)據(jù),然后對(duì)插補(bǔ)值與實(shí)際觀測資料進(jìn)行對(duì)比和誤差分析,并用平均絕對(duì)誤差(Mean Absolute Error,MAE)代表插補(bǔ)精度(王海軍等,2008),其表達(dá)式為:
參考站的選擇不僅與觀測站密度有關(guān),也與插補(bǔ)站及其鄰近站所處的地理環(huán)境有關(guān)(如平原、丘陵、山區(qū)等)。同時(shí),時(shí)間窗大小也對(duì)缺測數(shù)據(jù)的插補(bǔ)精度有影響。本文采用滑動(dòng)優(yōu)選法確定時(shí)間窗,時(shí)間窗的寬度為氣溫整點(diǎn)值個(gè)數(shù),高度為年數(shù)。以選擇缺測整點(diǎn)值所在的年份為中心,其前后若干點(diǎn)值歷史同期若干年的數(shù)據(jù)作為樣本數(shù)據(jù),對(duì)于前后無資料的年份,則使用靠近插補(bǔ)年份的資料。
唐山站位于華北平原,周圍地勢(shì)平坦,氣溫變化相近,故采用最短距離的原則選取臨近參考站。根據(jù)距離及地形因素,選取了該站周邊的北京、昌黎、薊縣、寧河、青光和徐莊子6個(gè)觀測站,年數(shù)為7年。采用15個(gè)整點(diǎn)值作為樣本資料,建立線性回歸模型,插補(bǔ)唐山站的缺測值(包括連續(xù)和不連續(xù)的單點(diǎn)缺測值)。插補(bǔ)站及其鄰近站的基本信息見表2。
表2 唐山插補(bǔ)站及其鄰近臺(tái)站信息
采用交叉驗(yàn)證的方法評(píng)估上述插補(bǔ)方法,統(tǒng)計(jì)了2010年3月的31天實(shí)際觀測整點(diǎn)值與相應(yīng)插補(bǔ)值的相關(guān)系數(shù),統(tǒng)計(jì)結(jié)果見表3。從表中可以看出,3月8日、14日、15日、19日和20日的相關(guān)系數(shù)相對(duì)較低。王海軍等(2008)經(jīng)過對(duì)比研究,在平原地區(qū)選取了4個(gè)參考站,選取年數(shù)為8年、天數(shù)為15天,插補(bǔ)誤差最小。唐山站也位于平原地區(qū),考慮與唐山站的距離及地形因素,選取昌黎、寧河、青光、徐莊子4個(gè)參考站,并選取年數(shù)為7年、15個(gè)整點(diǎn)值的優(yōu)化模型。通過對(duì)比發(fā)現(xiàn),4個(gè)參考站的相關(guān)系數(shù)偏高(表3)。
利用式(3)對(duì)優(yōu)化后的模型得到的插補(bǔ)結(jié)果計(jì)算平均絕對(duì)誤差,并統(tǒng)計(jì)其誤差的比例分布(表4)。從表4可以看出,插補(bǔ)誤差在±0.5℃范圍內(nèi)的比例為60.5%,在±0.8℃范圍內(nèi)的比例為80.6%,其誤差絕對(duì)值大于1.0℃的為9.4%,平均絕對(duì)誤差為0.82℃。
表3 觀測值與插補(bǔ)值相關(guān)系數(shù)
表4 唐山站整點(diǎn)氣溫缺測插補(bǔ)誤差比例
針對(duì)唐山站2008年1月1日—2013年12月18日的氣溫整點(diǎn)值缺測數(shù)據(jù)及錯(cuò)誤數(shù)據(jù),利用唐山鄰近站的同期數(shù)據(jù)和線性回歸模型,對(duì)缺測數(shù)據(jù)插補(bǔ)完整,并修正錯(cuò)誤數(shù)據(jù),繪制氣溫整點(diǎn)值的年變曲線,如圖5所示。從圖中可以看出,在長時(shí)間序列缺測的部位,插補(bǔ)值與前后正確的數(shù)據(jù)銜接吻合,沒有出現(xiàn)突升或突降變化。插補(bǔ)后完整連續(xù)的數(shù)據(jù)符合夏高冬低的年變規(guī)律,氣溫6年的變化形態(tài)一致。
圖5 插補(bǔ)后的唐山臺(tái)氣溫整點(diǎn)值年變曲線
據(jù)中國地震臺(tái)網(wǎng)中心測定,2012年5月28日10時(shí)22分在河北省唐山市轄區(qū)、灤縣交界處發(fā)生4.8級(jí)地震,震源深度8km。
利用插補(bǔ)完整的連續(xù)數(shù)據(jù),分析2012年3—5月震前氣溫?cái)?shù)據(jù)的變化情況。首先,選取無震年份(2008—2011年)同期(3—5月)整點(diǎn)值氣溫,并計(jì)算歷年同期氣溫日均值,以此作為3—5月正常的背景值;其次,將2012年3—5月日均值與歷年同期背景值做差值,得到2012年3—5月份數(shù)據(jù)與歷年同期均值的偏移程度;最后,以無震年份同期氣溫波動(dòng)范圍作為基準(zhǔn),即2008—2011年3—5月所有氣溫值的標(biāo)準(zhǔn)差作為判斷標(biāo)準(zhǔn)。根據(jù)以往經(jīng)驗(yàn)將差值大于2倍標(biāo)準(zhǔn)差視為氣溫前兆異常。
從2012年3—5月當(dāng)年日均值與歷年同期(2008—2011年)多年日均值的差值及標(biāo)準(zhǔn)差(圖6)中可以看出,從3月27日開始,唐山站數(shù)據(jù)出現(xiàn)大幅度增溫異常現(xiàn)象,4月增溫天數(shù)也較多,5月1日—11日的氣溫日均值仍然高于歷年同期,特別是5月10日(即震前2天)增幅達(dá)到約8℃,且大于2倍標(biāo)準(zhǔn)差;震后差值開始變小,并逐步恢復(fù)至平靜。
圖6 觀測值與同期均值的差值及標(biāo)準(zhǔn)差
長期連續(xù)完整的歷史氣象資料是震前氣溫異常判別研究的重要數(shù)據(jù)基礎(chǔ),但由于觀測環(huán)境、儀器故障等原因,造成氣溫觀測數(shù)據(jù)缺測或錯(cuò)誤數(shù)據(jù),且部分?jǐn)?shù)據(jù)缺測的時(shí)間較長。為此,本文利用線性回歸模型,插補(bǔ)缺測和錯(cuò)誤的氣溫整點(diǎn)值數(shù)據(jù),較好地解決了長期連續(xù)缺測的情況。
通過對(duì)唐山觀測站2008年1月1日—2013年12月18日的氣溫整點(diǎn)值缺測數(shù)據(jù)及錯(cuò)誤數(shù)據(jù)進(jìn)行插補(bǔ),使得數(shù)據(jù)完整連續(xù),并應(yīng)用插補(bǔ)完整的氣溫整點(diǎn)值數(shù)據(jù),分析研究了2012年5月28日唐山4.8級(jí)地震的氣溫前兆異?,F(xiàn)象,主要得出以下結(jié)論:
(1)唐山觀測站的插補(bǔ)值與其前后的觀測數(shù)據(jù)銜接吻合,插補(bǔ)后完整連續(xù)的數(shù)據(jù)符合夏高冬低的年變規(guī)律。
(2)插補(bǔ)誤差在±0.5℃范圍內(nèi)的比例為60.2%,在±0.8℃范圍內(nèi)的比例為80.3%,其誤差絕對(duì)值大于1.0℃的為9.6%,平均絕對(duì)誤差為0.84℃。插補(bǔ)值與觀測值的相關(guān)系數(shù)大部分在0.9以上,可見插補(bǔ)結(jié)果真實(shí)可靠。
(3)從3月27日起,唐山觀測站數(shù)據(jù)出現(xiàn)增溫異常,震前2天增溫幅度約8℃。
曹新來,張子廣,李福來,1997.1976年唐山7.8級(jí)地震前氣象要素的異常變化.華北地震科學(xué),15(2):50—59.
李貴福,解明恩,1996.本世紀(jì)云南強(qiáng)震(S≥6.0)的氣象特征研究.地震研究,19(2):154—161.
涂詩玉,陳正洪,2001.武漢和宜昌缺測氣溫資料的插補(bǔ)方法.湖北氣象,(3):11—13.
王海軍,涂詩玉,陳正洪,2008.日氣溫?cái)?shù)據(jù)缺測的插補(bǔ)方法試驗(yàn)與誤差分析.氣象,34(7):83—91.
王建國,姚會(huì)琴,高遜等,2010.天津市地震前兆臺(tái)網(wǎng)的運(yùn)行監(jiān)控與維護(hù)管理.大地測量與地球動(dòng)力學(xué),30(S1):111—115.
王建國,劉春國,王偉等,2013.地震前兆數(shù)據(jù)庫綜合管理系統(tǒng).大地測量與地球動(dòng)力學(xué),33(S1):114—116.
徐國鈞,譚天明,蘭紅林等,1993.云南破壞性地震與氣象要素的關(guān)系.地震研究,16(2):148—155.
姚會(huì)琴,李悅,高遜等,2012.NagVis等開源監(jiān)控軟件在天津地震前兆臺(tái)網(wǎng)的應(yīng)用研究.震災(zāi)防御技術(shù),7(3):329—333.
余予,李俊,任芝花等,2012.標(biāo)準(zhǔn)序列法在日平均氣溫缺測數(shù)據(jù)插補(bǔ)中的應(yīng)用.氣象,38(9):1135—1139.
張鐵寶,路茜,辛華等,2013.2010年玉樹7.1級(jí)地震前后氣溫變化分析. 四川地震,(4):7—11.
張秀芝,孫安健,1996a. 利用車貝雪夫多項(xiàng)式進(jìn)行資料缺測插補(bǔ)的研究. 應(yīng)用氣象學(xué)報(bào),7(3):344—352.
張秀芝,孫安健,1996b. 氣候資料缺測插補(bǔ)方法的對(duì)比研究. 氣象學(xué)報(bào),54(5):625—632.
張永領(lǐng),丁裕國,高全洲等,2006. 一種基于SVD的迭代方法及其用于氣候資料場的插補(bǔ)試驗(yàn). 大氣科學(xué),30(3):526—532.
DeGaetano A. T., Eggleston K. L., Knapp W. W., 1995. A method to estimate missing daily maximum and minimum temperature observations. Journal of Applied Meteorology, 34(2): 371—380.
Eischeid J. K., Pasteris P. A., Diaz H. F., et al., 2000. Creating a serially complete, national daily time series of temperature and precipitation for the western United States. Journal of Applied Meteorology, 39(9): 1580—1591.
Huth R., Nemeóová I., 1995. Estimation of missing daily temperatures: can a weather categorization improve its accuracy? Journal of Climate, 8(7): 1901—1916.
Interpolating Method for Missing Data of Integral Point Temperature and Its Preliminary Application
Yan Lili1), Wen Shaoyan2), Gao Wenjing1), Liu Chuanjun1)and Yang Tian3)
1) Tianjin Earthquake Agency, Tianjin 300201, China 2) Earthquake Agency of Xinjiang Uygur Autonomous Region, Urumqi 830011, China 3) Daixian Central Seismological Station of Shanxi Earthquake Agency, Xinzhou 034200, Shanxi, China
The analysis of the temperature anomaly before earthquakes is based on the continuously historical air temperature data. The improved linear regression model is established in this paper inconsiderationof the distance of reference sites and missing observation sites. This model is used to interpolate hourly temperature data of missing and incorrect observations, which can partially help to solve the problem of long-term continuous observations data missing. The observation data from 15 sites were interpolated with the improved linear regression method and the interpolated data were applied to the TangshanS4.8 earthquake that occurred on May 28, 2012. Our results suggest that: ①The interpolated data are consistent with its pre and post observation and the complete temperature data have the annual variation characteristic of higher in summer and lower in winter; ②The probability of error in temperature range ±0.5℃is about 60.2%, and the error in ±0.8℃is about 80.3%. The absolute error over 1.0℃is 9.6% and the mean absolute error is 0.84℃. The correlation coefficients between interpolated and observed data are generally greater than 0.9; ③The complete interpolated temperature data of Tangshan site were applied to study the Tangshan earthquake, 2012. The results show that the temperature increasing anomaly was found on May 10, 2012, when the temperature increased 8℃ two days before the quake.
Integral point temperature; Interpolating; Linear regression model; Earthquake
10.11899/zzfy20190218
中國地震局三結(jié)合課題“氣溫在地震監(jiān)測中的初步應(yīng)用”(2018008),天津市地震局青年基金“缺測整點(diǎn)氣溫的插補(bǔ)方法研究及初步應(yīng)用”(20141021),新疆地震局基金項(xiàng)目(201802)
2018-09-17
閆麗莉,女,生于1983年。工程師。主要從事地震前兆數(shù)據(jù)處理和衛(wèi)星紅外遙感在地震監(jiān)測中的應(yīng)用研究。E-mail:yanlili_2003@163.com
溫少妍,女,生于1985年。工程師。主要從事InSAR同震形變場和震源破裂過程反演研究工作。 E-mail:wenshaoyan999@163.com
閆麗莉,溫少妍,高文晶,劉傳軍,楊甜,2019.整點(diǎn)氣溫缺測的插補(bǔ)方法研究及其初步應(yīng)用.震災(zāi)防御技術(shù),14(2):446—455.