馮 健
(黑龍江省水文局,黑龍江 哈爾濱 150001)
?
基于氣象因子的逐步回歸分析技術(shù)在水文長期預(yù)報中的應(yīng)用
馮 健
(黑龍江省水文局,黑龍江 哈爾濱 150001)
將嫩江富拉爾基水文站自1983年以來的流量年極大值系列資料作為預(yù)報對象,氣象130項指數(shù)作為預(yù)報因子,采用逐步回歸分析技術(shù)建立預(yù)測模型進(jìn)行試報和檢驗,并對成果進(jìn)行了分析論證。結(jié)果表明,逐步回歸分析技術(shù)建立的預(yù)測模型具有較好的歷史擬合及預(yù)測效果,具有一定的可信度。
逐步回歸;水文長期預(yù)報;氣象因子;預(yù)測模型
隨著我國國民經(jīng)濟的快速發(fā)展,相關(guān)部門對水文預(yù)報提出的要求越來越高,不僅要求有準(zhǔn)確的短期洪水預(yù)報,而且要求有預(yù)見期更長的中長期水文預(yù)報;準(zhǔn)確的中長期水文預(yù)報,對于做好防汛抗旱工作具有重要的支撐作用。一般情況下,洪水的量級主要取決于降水量,而降水量又是由一定的大氣環(huán)流形勢和天氣過程變化決定的,因此,洪水與大型的天氣過程的演變存在著密切的關(guān)系[1]。通過逐步回歸分析技術(shù),尋找到與預(yù)報的水文要素關(guān)系密切的氣象因子,建立他們之間關(guān)系的預(yù)報模型,從而達(dá)到預(yù)報中長期洪水趨勢的目的。
1.1 預(yù)報因子的篩選
本次分析采用中國氣象局提供的130項逐月氣象因子數(shù)據(jù)作為預(yù)報因子,年最大流量作為預(yù)報對象。在預(yù)報過程中,挑選出與預(yù)報對象關(guān)系密切的因子是十分關(guān)鍵的。從大的方面考慮,可以從供給大氣運動的能量方面、下墊面影響因素、前期大氣環(huán)流形勢等進(jìn)行挑選,但是需要具有很專業(yè)的氣象知識,而且該挑選方法是從宏觀上進(jìn)行分析,不易挑選到相關(guān)性較好的因子,同時人的主觀因素對于預(yù)報因子的挑選影響也較大。為了解決上述問題,采用統(tǒng)計計算的方法進(jìn)行預(yù)報因子的挑選,以單相關(guān)系數(shù)的大小作為因子挑選的依據(jù)。單相關(guān)系數(shù)的計算公式如下:
(1)
相關(guān)系數(shù)有正有負(fù),即正負(fù)相關(guān),我們這里按照絕對值的大小來進(jìn)行衡量,不管正負(fù)相關(guān),只要其相關(guān)系數(shù)的絕對值較大,就說明二者具有較好的相關(guān)性。
1.2 多元回歸模型原理
要說明逐步回歸分析模型,我們首先要了解多元回歸分析,假設(shè)通過因子篩選,我們已經(jīng)挑選到了n個與預(yù)報對象相關(guān)性較高的x1,x2,……,xn作為預(yù)報對象y的預(yù)報因子,通過回歸分析,建立回歸方程如下:
(2)
式(2)中:b0,b1,b2,……,bn為回歸方程的系數(shù),ε為隨機誤差。
這里需要注意,建立的回歸方程應(yīng)滿足如下假設(shè):預(yù)報因子對預(yù)報對象的影響是顯著的,即通過顯著性檢驗;預(yù)報因子與預(yù)報對象是線性相關(guān),即通過相關(guān)性檢驗;預(yù)報因子之間是相互獨立的。
多元線性回歸分析的基本思想和方法與一元線性回歸分析是相同的,但是,由于多元線性回歸分析涉及多個變量之間的相關(guān)關(guān)系,使問題變得更加復(fù)雜,根據(jù)最小二乘法原理,使全部實測值與擬合值的殘差平方和達(dá)到最小值,以求解回歸方程的回歸系數(shù)[2]。
1.3 逐步回歸模型原理
逐步回歸分析是在多元回歸分析的基礎(chǔ)上發(fā)展而來,因為多元回歸分析視所有選擇的因子對預(yù)報對象具有相同的影響程度,沒有分析因子與預(yù)報對象的主次關(guān)系,沒有考慮預(yù)報因子對預(yù)報對象的貢獻(xiàn)大小,如果建立的方程中包含了對預(yù)報對象影響很小的因子時,會降低預(yù)報的精度,對方程的穩(wěn)定性也有影響。
這時就需要逐步回歸分析來解決上述問題,逐步回歸不是一次全部把預(yù)報因子引入方程,而是定義方差貢獻(xiàn)作為衡量因子對預(yù)報對象的貢獻(xiàn)指標(biāo),根據(jù)方差大小逐步挑選因子,每一步只選擇一個因子,保證選出的因子是方差貢獻(xiàn)最大的,并且通過給定信度的顯著性檢驗。
假設(shè)第一步挑選了因子x1,則第一步建立的方程為:
(3)
再根據(jù)原則選擇第二個因子x2,則第二步建立的方程為:
(4)
按照這種方法選擇剩下的因子,直至沒有對預(yù)報對象作用顯著的因子為止。如果由于后面引入的因子導(dǎo)致了前面已經(jīng)引入方程的因子對預(yù)報對象的作用顯著變小還要將不顯著的因子剔除,每一步都是引進(jìn)剔除的過程,這樣最后得到的回歸方程只有對預(yù)報對象影響顯著的因子[3]。
2.1 資料選取
嫩江富拉爾基水文站1983年至2013年年最大流量資料系列,其中1983年至2008年為率定期,2009年至2013年為檢驗期。
1980年至2013年逐月130項氣象指數(shù)資料。
2.2 模型建立
通過對預(yù)報因子與預(yù)報對象做相關(guān)系數(shù)篩查分析,篩選出相關(guān)系數(shù)較高的因子,我們選擇相關(guān)系數(shù)較大的前50個因子,為了有預(yù)見期,將氣象指數(shù)以4月份向前回溯,然后進(jìn)行逐步回歸分析,最終確定9個影響顯著的因子,建立回歸方程如下:
y=122.22x1+408.06x2-230.93x3-
442.23x4+1382.34x5+287.89x6+1.91x7+
0.27x8+227.49x9-16 622.15
(5)
對上述方程進(jìn)行顯著性檢驗及相關(guān)性檢驗,F(xiàn)檢驗的公式如下:
(6)
式(6)中:QE為回歸離差平方和,Qe為殘差平方和,n為樣本長度,p為自由度,對于給定的信度α=0.05,查F分布表得到相應(yīng)的F值。
F=9.57>F(0.05)=2.59,在信度α=0.05時,各回歸系數(shù)為零的假設(shè)不成立,回歸效果是顯著的。t=6.19>t(0.05/2)=2.02,在信度α=0.05時,全部隨機自變量xi與因變量y是線性相關(guān)的。確定的氣象指數(shù)因子見表1。
表1 氣象指數(shù)因子表
將各因子值帶入回歸方程,預(yù)報對象實測系列與模擬系列如圖1所示,從模擬的效果來看還是不錯的,按照《水文情報預(yù)報規(guī)范》(GB/T 22482-2008)中對中長期水文預(yù)報精度評定的規(guī)定,用多年實測最大流量變幅的10%作為許可誤差,率定期全部合格,5年檢驗期中有3年是合格的[4],最大流量實測與模擬系列數(shù)據(jù)對比表見表2,對比圖見圖1。
圖1 實測與模擬系列對比圖
年份實測值模擬值絕對誤差許可誤差合格否198336203237.61-382.391491合格198444204563.69143.691491合格198520801765.61-314.391491合格198635303748.74218.741491合格198717602201.86441.861491合格198871106412.37-697.631491合格198966106481.31-128.691491合格199032503429.51179.511491合格199148604368.49-491.511491合格199226902919.06229.061491合格199332503250.040.041491合格199420301833.27-196.731491合格199510601172.27112.271491合格199639004028.81128.811491合格199728802655.34-224.661491合格1998155001550001491合格199921502237.9787.971491合格200017201282.31-437.691491合格200119001904.954.951491合格2002742619.66-122.341491合格200354805619.59139.591491合格200431103560.5450.51491合格200511401374.53234.531491合格200615501351.84-198.161491合格2007881855.06-25.941491合格20085861242.4656.41491合格200920103334.241324.241491合格201015504067.372517.371491不合格20111870586-12841491合格201211302328.481198.481491合格201377203934.76-3785.241491不合格
水文要素與氣象因子之間存在著一定的聯(lián)系,運用逐步回歸分析方法,建立氣象因子與水文要素的回歸方程,通過已知的氣象指數(shù)數(shù)值預(yù)報未來的水文要素,為防汛抗旱部門提前提供決策依據(jù),對防汛抗旱工作具有重要的指導(dǎo)作用,同時也是中長期水文預(yù)報工作的一種有效的預(yù)報方法。
預(yù)報因子的挑選對回歸分析模型的影響是很大的,預(yù)報對象與預(yù)報因子在尺度上要盡量對應(yīng),如有的水文站流域面積幾萬甚至不到1萬平方公里,而有的大江大河控制站流域面積能達(dá)到幾十萬平方公里,對于大江大河控制站,可以盡量考慮亞歐范圍、北半球范圍的因子,而對于較小流域來講,還應(yīng)考慮能夠反映當(dāng)?shù)靥攸c的一些預(yù)報因子。
逐步回歸分析不是將所有因子對預(yù)報對象的影響程度等同對待,而是根據(jù)其貢獻(xiàn)大小來挑選,同時,考慮了預(yù)報因子之間的相關(guān)性,避免了預(yù)報因子重復(fù)挑選的可能,從而挑選到真正對預(yù)報對象影響顯著的預(yù)報因子,建立的回歸方程也更可靠。
回歸方程是根據(jù)歷史資料建立的,對于超出歷史資料的因子,以及預(yù)報對象較為異常的情況,可能預(yù)報結(jié)果就不夠理想。同時,由于影響水文中長期預(yù)報的因素較多,一種方法得出的結(jié)論也存在較大的不確定性,所以在實際工作中應(yīng)綜合考慮,才能得出較為科學(xué)準(zhǔn)確的預(yù)報結(jié)論。
[1] 范鐘秀.中長期水文預(yù)報[M].南京:河海大學(xué)出版社,1999.
[2] 湯成友,官學(xué)文,張世明.現(xiàn)代中長期水文預(yù)報方法及其應(yīng)用[M].北京:中國水利水電出版社,2008.
[3] 旦木仁加甫.常用中長期水文預(yù)報Visual Basic 6.0應(yīng)用程序及實例[M].鄭州:黃河水利出版社,2004.
[4] 宋潤虎.多元線性回歸與逐步回歸在洪水預(yù)報中的應(yīng)用-以南汀河中長期洪水預(yù)報為例[J].人民長江,2012(S1),122-125.
Application of stepwise regression analysis technique based on meteorological factor in the long-term hydrological forecasting
FENG Jian
(HydrologyBureauofHeilongjiangProvince,Harbin150001,China)
The Nenjiang River in Fulaerji Hydrology station since 1983 the annual maximum flow series of data as forecast object, meteorological 130 index as a forecast factor, the prediction model was established by stepwise regression analysis to reporting and test, and the results were analyzed and demonstrated, the results show that the prediction model established by stepwise regression method has good historical fitting and forecasting effect, and has certain credibility.
stepwise regression; long-term hydrological forecast; meteorological factors; prediction model
馮 健(1984-) ,男,工程師,主要從事水文情報預(yù)報工作。
O242;P338
A
2096-0506(2016)11-0042-04