• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    MGF模型和SVM回歸法在甘河加格達(dá)奇站年最大流量長(zhǎng)期預(yù)報(bào)中的應(yīng)用

    2020-06-19 09:59:36劉文斌于成剛
    水資源開(kāi)發(fā)與管理 2020年5期
    關(guān)鍵詞:加格達(dá)奇極值合格率

    劉文斌 于成剛

    (1.黑龍江省水文水資源中心,黑龍江 哈爾濱 150001;2.大興安嶺水文水資源中心,黑龍江 加格達(dá)奇 165000)

    分析預(yù)測(cè)年最大流量的主要意義在于定量描述預(yù)測(cè)年份的洪水量級(jí),為防洪決策提供支撐,但年最大流量的變化受江河前期底水,預(yù)見(jiàn)期內(nèi)降水、蒸發(fā)、氣溫,水利工程、人類(lèi)活動(dòng)等諸多因素影響,具有很大不確定性。常用的時(shí)間系列分析技術(shù)和預(yù)測(cè)方法(如:多元線性回歸),對(duì)系列數(shù)據(jù)的極值和趨勢(shì)預(yù)測(cè),不能體現(xiàn)年最大流量因受大氣環(huán)流變化而具有的與預(yù)報(bào)因子之間的非線性關(guān)系,存在精度不高的問(wèn)題。現(xiàn)有的時(shí)間序列預(yù)測(cè)模型中,自回歸(AR)、自回歸滑動(dòng)(ARMA)和門(mén)限自回歸(TAR)模型在進(jìn)行多步預(yù)測(cè)時(shí),預(yù)測(cè)值會(huì)趨于平均值,對(duì)極值的擬合效果欠佳。指數(shù)平滑模型和灰色模型等進(jìn)行多步預(yù)測(cè)時(shí),表示的是一種指數(shù)增長(zhǎng),不適用于預(yù)測(cè)起伏變化大的年最大流量。

    針對(duì)時(shí)間系列預(yù)測(cè)模型對(duì)于轉(zhuǎn)折性變化預(yù)測(cè)能力較差的問(wèn)題,依據(jù)氣候時(shí)間序列蘊(yùn)涵不同時(shí)間尺度振蕩的特征,魏鳳英[1]拓展了數(shù)理統(tǒng)計(jì)中算術(shù)平均值的概念,定義了時(shí)間序列的均生函數(shù),提出了視均生函數(shù)為原序列生成的、體現(xiàn)各種長(zhǎng)度周期性的基函數(shù)的新構(gòu)思。均生函數(shù)預(yù)測(cè)模型既可以作多步預(yù)測(cè),又可較好地預(yù)測(cè)極值,為長(zhǎng)期預(yù)報(bào)和短期氣候預(yù)測(cè)開(kāi)辟了一條新途徑[3]。采用均生函數(shù)作多步預(yù)測(cè),可以改善其他時(shí)間序列模型的不足,改善對(duì)序列極值的擬合與預(yù)測(cè)效果。

    支持向量機(jī)(Support Vector Machines,SVM)以統(tǒng)計(jì)理論為基礎(chǔ),能較好地解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等問(wèn)題,是一種新穎有效的處理非線性分類(lèi)和回歸的方法。本文即以均生函數(shù)構(gòu)成的周期性函數(shù),結(jié)合支持向量機(jī)方法建立了甘河的加格達(dá)奇站年最大流量預(yù)測(cè)模型,有機(jī)地結(jié)合兩種方法的優(yōu)點(diǎn),克服了傳統(tǒng)時(shí)間系列預(yù)測(cè)方法對(duì)極值模擬精度較低和長(zhǎng)期預(yù)測(cè)中存在的趨勢(shì)性預(yù)測(cè)的問(wèn)題。在加格達(dá)奇站年最大流量預(yù)測(cè)的應(yīng)用結(jié)果顯示,本文建立的模型預(yù)測(cè)結(jié)果既實(shí)現(xiàn)了數(shù)量和趨勢(shì)同步預(yù)測(cè),也實(shí)現(xiàn)了該年最大流量系列非線性變化的預(yù)測(cè),大大提高了預(yù)報(bào)精度。

    1 研究資料和方法

    1.1 資料

    甘河發(fā)源于大興安嶺東坡伊勒呼里阿侖山脈的南支英吉奇山,由西北流向東南,匯入嫩江干流,全長(zhǎng)446km,流域面積19549km2,流域內(nèi)森林覆蓋率高,沒(méi)有過(guò)多人為活動(dòng)影響,下墊面條件變化不大。加格達(dá)奇水文站為甘河中游控制站,多年平均降水量531mm,年際變化大,年內(nèi)分布主要集中在6—9月,該站洪水為典型山溪性洪水,暴漲暴落,漲水期間水位、流量變化劇烈。

    本文所用的資料為加格達(dá)奇站1952—2019年共68年的年內(nèi)最大流量序列資料。

    1.2 均生函數(shù)模型

    均生函數(shù)(Mean Generating Function,MGF)是時(shí)間序列均值生成函數(shù)的簡(jiǎn)稱(chēng),是由時(shí)間序列按不同時(shí)間間隔計(jì)算均值,生成的一組周期函數(shù)[7],將此函數(shù)進(jìn)行周期性延拓,即在定義域上延拓到整個(gè)數(shù)軸,可構(gòu)造出均生函數(shù)延拓矩陣。魏鳳英[1]將均生函數(shù)的概念推廣到回歸分析中,給出相應(yīng)的建模方案,使回歸模型的擬合效果更為理想。

    利用加格達(dá)奇站年最大流量系列構(gòu)造最大流量周期性均生函數(shù),采用CSC[1]雙向評(píng)分準(zhǔn)則,選擇最優(yōu)因子,利用SVM的K-CV統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本,通過(guò)逐漸改變參數(shù)的取值,獲取最佳的參數(shù)組合,而后建立回歸模型進(jìn)行擬合。計(jì)算1952—2001年的擬合值。根據(jù)模型對(duì)2002—2019年最大流量進(jìn)行預(yù)測(cè),最后與2002—2019年實(shí)測(cè)資料進(jìn)行對(duì)比分析。

    設(shè)時(shí)間序列為X(t)(t=1,2,…,n),構(gòu)造均生函數(shù):

    (1)

    (2)

    (mod表示同余)

    (3)

    F=(fij)n×m,fij=fl(t)

    (4)

    (5)

    fl(t)為均生函數(shù)延拓序列,是一種周期性基函數(shù)。均生函數(shù)延拓矩陣中第1列記為f1,第2列記為f2,……,第m列記為fm。從f1、f2、…、fm中挑選出m個(gè)與原始序列密切相關(guān)的序列作為預(yù)報(bào)因子,建立模型進(jìn)行模擬和預(yù)測(cè)。

    1.3 支持向量機(jī)(SupportVector,SVM)回歸方法

    支持向量機(jī)(SupportVector,SVM)是一種基于統(tǒng)計(jì)理論的算法,屬于有監(jiān)督的學(xué)習(xí)方法,已知訓(xùn)練點(diǎn)的類(lèi)別,可學(xué)習(xí)求得訓(xùn)練點(diǎn)和類(lèi)別之間的對(duì)應(yīng)關(guān)系,以便將訓(xùn)練集按照類(lèi)別分開(kāi),或者預(yù)測(cè)新的訓(xùn)練點(diǎn)所對(duì)應(yīng)的類(lèi)別。

    用線性回歸函數(shù)f(x)=ωx+b擬合數(shù)據(jù){xi,yi},(i=1,2,…,n,xi∈Rd),yi∈R的問(wèn)題,根據(jù)SVM理論,若采用線性ε不敏感損失函數(shù)

    (6)

    (7)

    下,最小化目標(biāo)函數(shù)

    (8)

    常數(shù)c>0控制對(duì)超出誤差ε的樣本的懲罰程度。采用優(yōu)化方法可以得到其對(duì)偶問(wèn)題,即在約束條件

    (9)

    (10)

    從而得回歸模型

    (11)

    (12)

    式(5)、(6)中的b*,取在邊界上的一點(diǎn),即可確定。有關(guān)非線性核函數(shù)的種類(lèi)較多,常用的有多項(xiàng)式核函數(shù)、徑向基核函數(shù)、柯西核函數(shù)等多種形式。本文采用徑向基核函數(shù)

    K(x,xj)=exp(-(γ‖x-xi‖2),λ>0)(13)

    1.4 年最大流量延拓均生函數(shù)

    選取通過(guò)置信度0.01~0.05檢驗(yàn)的函數(shù)因子作為預(yù)報(bào)因子。所選取的周期性基函數(shù)因子為5個(gè)。這5個(gè)周期性基函數(shù)分別為5年、11年、16年、18年、19年的函數(shù),其中11年、18年的基函數(shù)因子通過(guò)了0.01的檢驗(yàn)。這樣有效避免函數(shù)因子之間的復(fù)相關(guān),確保各個(gè)因子間的獨(dú)立性。

    2 周期檢驗(yàn)和突變檢驗(yàn)

    2.1 周期檢驗(yàn)

    周期性檢驗(yàn)采用小波分析法,該方法最早提出于20世紀(jì)80年代初,具有時(shí)-頻多分辨功能,能清晰地揭示出隱藏在時(shí)間序列中的多種變化周期。本文計(jì)算所用年最大流量系列包含“多時(shí)間尺度”變化特征且這種變化是連續(xù)的,所以選用連續(xù)復(fù)小波變換來(lái)分析該流量序列的多時(shí)間尺度特征,結(jié)果見(jiàn)圖1,結(jié)果顯示該系列存在11年、34年左右明顯的周期。

    因此,加格達(dá)奇站流量隨時(shí)間出現(xiàn)周期性變化,具有一定起伏性,適合用MGF和SVM來(lái)解決極值預(yù)報(bào)的問(wèn)題。

    2.2 突變檢驗(yàn)

    流量系列的突變檢驗(yàn),采用滑動(dòng)t檢驗(yàn)(MMT)的方法。兩子系列長(zhǎng)度n1=n2=11。給定顯著性水平a=0.01,t分布自由度ν=n1+n2-2=20,t0.01=±2.85,為了提高更嚴(yán)格的顯著水平,給定t0.01=±3.20。將計(jì)算出的t統(tǒng)計(jì)量序列和t0.01=±3.20繪成圖2。圖2顯示,流量系列自1952年以來(lái),t統(tǒng)計(jì)量有一處超過(guò)0.01顯著水平,且為正值,說(shuō)明年最大流量在20世紀(jì)70年代經(jīng)歷了一次由大到小的突變。該次突變包含在過(guò)去的變化中,后期系列未出現(xiàn)突變,因此,可以依據(jù)率定的模型進(jìn)行多步預(yù)測(cè)。

    3 年最大流量預(yù)測(cè)模型

    3.1 SVM回歸預(yù)測(cè)模型的建立

    為了避免挑選出的周期性基函數(shù)因子之間的量級(jí)差異,消除各個(gè)因子由于量綱和單位不同造成的影響,首先對(duì)每個(gè)預(yù)報(bào)因子進(jìn)行歸一化處理:

    (14)

    式中:xmax、xmin為原始數(shù)據(jù)x的最大值和最小值;ymax、ymin為映射范圍的參數(shù),在這里取值為2和1。

    圖3 加格達(dá)奇站年最大流量歸一化后逐年數(shù)據(jù)曲線

    建模時(shí),將經(jīng)過(guò)處理的預(yù)測(cè)因子(優(yōu)選后的周期性基函數(shù))作為輸入,年最大實(shí)測(cè)洪峰流量作為輸出,取前50年(1952—2001年)為檢驗(yàn)樣本集,用于SVM進(jìn)行學(xué)習(xí)訓(xùn)練和驗(yàn)證,后18年(2002—2019年)為預(yù)測(cè)檢驗(yàn)樣本,歸一化后逐年數(shù)據(jù)曲線見(jiàn)圖3。選取線性ξ不敏感損失函數(shù),采用徑向基核函數(shù)進(jìn)行SVM建模,由于所選的參數(shù)值不同,函數(shù)形態(tài)會(huì)發(fā)生較大變化,進(jìn)而引起SVM模型的變化。因此,在建模中利用K-CV[8]統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本,通過(guò)逐漸改變參數(shù)的取值,以獲取最佳的參數(shù)組合,使建立的模型預(yù)測(cè)效果最好。經(jīng)過(guò)多次交叉驗(yàn)證學(xué)習(xí)和訓(xùn)練,最終建立用于年最大洪峰流量預(yù)報(bào)的SVM回歸模型,經(jīng)過(guò)計(jì)算其校正模型參數(shù)c為11.31,g為0.35,MSE為0.013。其參數(shù)計(jì)算結(jié)果見(jiàn)圖4、圖5。

    3.2 SVM回歸模型預(yù)測(cè)效果分析

    依據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范》(GB/T 22482—2008)對(duì)中長(zhǎng)期預(yù)報(bào)的精度評(píng)定的要求,流量數(shù)值預(yù)報(bào)誤差精度采用多年變幅的10%,而趨勢(shì)(定性)評(píng)分采用合格和不合格[4]。

    SVM模型模擬和檢驗(yàn)結(jié)果顯示:模擬和檢驗(yàn)效果較好,精度較高,50個(gè)模擬數(shù)據(jù)符合誤差要求的共42個(gè),合格率達(dá)84.0%;46個(gè)數(shù)據(jù)趨勢(shì)模擬正確,合格率達(dá)到92.0%。18個(gè)檢驗(yàn)數(shù)據(jù)符合誤差要求的共13個(gè),合格率為72.2%;14個(gè)數(shù)據(jù)趨勢(shì)模擬正確,合格率達(dá)到77.8%。極值的模擬結(jié)果較好,模擬數(shù)據(jù)的極值數(shù)據(jù)均符合誤差要求,預(yù)測(cè)值和實(shí)際觀測(cè)值對(duì)比曲線見(jiàn)圖6。

    圖6 加格達(dá)奇年最大流量SVM預(yù)測(cè)值和實(shí)際觀測(cè)值對(duì)比曲線

    3.3 逐步回歸預(yù)測(cè)模型

    為了比較SVM回歸與逐步回歸方法的預(yù)測(cè)能力,本文同樣利用上述19個(gè)周期性基函數(shù)作為預(yù)報(bào)因子,選取不同F(xiàn)值引入不同的預(yù)報(bào)因子,采用逐步回歸方法建立加格達(dá)奇站年最大流量預(yù)測(cè)模型。依據(jù)模型的預(yù)測(cè)誤差最小原則,數(shù)學(xué)方程為

    +0.547x19-1889.905

    (15)

    對(duì)檢驗(yàn)樣本和預(yù)測(cè)樣本年最大流量數(shù)據(jù)進(jìn)行了預(yù)測(cè)模擬,其回歸結(jié)果和實(shí)際觀測(cè)值對(duì)比見(jiàn)圖7。

    圖7 加格達(dá)奇站年最大洪峰流量多元逐步回歸預(yù)測(cè)值和實(shí)際觀測(cè)值對(duì)比曲線

    3.4 逐步回歸模型預(yù)測(cè)效果分析

    采用上述預(yù)報(bào)誤差精度進(jìn)行評(píng)定,模擬和檢驗(yàn)效果都不好,50個(gè)模擬數(shù)據(jù)符合誤差要求的共30個(gè),合格率為60.0%;44個(gè)數(shù)據(jù)趨勢(shì)模擬正確,合格率達(dá)到88.0%。18個(gè)檢驗(yàn)數(shù)據(jù)符合誤差要求的共10個(gè),合格率為55.6%;9個(gè)數(shù)據(jù)趨勢(shì)模擬正確,合格率為50.0%。極值的模擬結(jié)果也不好,從圖7可以看出有2個(gè)極值的模擬數(shù)據(jù)差距都很大。

    3.5 兩種模型對(duì)比分析結(jié)果

    根據(jù)兩種方法的模擬結(jié)果,逐步回歸模型的數(shù)值預(yù)測(cè)合格率為60.0%,SVM回歸方法構(gòu)建的模型合格率為84.0%,兩者相差達(dá)到24.0%。趨勢(shì)上逐步回歸模型合格率為88.0%,SVM方法構(gòu)建的回歸模型合格率達(dá)到92.0%,兩者相差4.0%,但是逐步回歸在2個(gè)極值的模擬上都出現(xiàn)了較大差距,而SVM方法構(gòu)建的回歸模型3個(gè)極值都模擬預(yù)測(cè)的很好。18年的檢驗(yàn)結(jié)果中,逐步回歸模型的數(shù)值預(yù)測(cè)合格率為55.6%,趨勢(shì)模擬合格率為50.0%,而SVM回歸方法構(gòu)建的模型合格率為72.2%;趨勢(shì)模擬合格率達(dá)到78.8%。

    4 結(jié) 論

    a.通過(guò)對(duì)加格達(dá)奇站年最大流量系列進(jìn)行小波分析和滑動(dòng)t檢驗(yàn),發(fā)現(xiàn)數(shù)據(jù)系列存在11年、34年左右周期,而在20世紀(jì)70年代存在一個(gè)由高到低的突變,說(shuō)明該系列存在著明顯的非線性變化。按常規(guī)長(zhǎng)期預(yù)報(bào)方法需提取周期、濾波趨勢(shì),以及構(gòu)建隨機(jī)過(guò)程的模型來(lái)進(jìn)行外延預(yù)報(bào)。但如前文所述,常規(guī)預(yù)報(bào)方法并不能較好處理非線性數(shù)據(jù)系列,對(duì)極值和趨勢(shì)變化的預(yù)測(cè)能力尚有改善空間。本文即采用均生函數(shù)(MGF)、支持向量機(jī)(SVM)相組合的方法來(lái)提高預(yù)測(cè)能力。分析預(yù)報(bào)結(jié)果顯示,無(wú)論是極值還是趨勢(shì)預(yù)報(bào),合格率均較高。

    b.采用均生函數(shù) (MGF)構(gòu)建時(shí)間序列的周期性基函數(shù),并對(duì)均生矩陣進(jìn)行周期外延得到延拓矩陣,有效地實(shí)現(xiàn)了對(duì)時(shí)間系列數(shù)據(jù)的重構(gòu),一定程度上避免了單數(shù)據(jù)系列對(duì)預(yù)報(bào)結(jié)果的負(fù)面影響;而因子選取上采用CSC雙評(píng)分準(zhǔn)則,提高了模型在數(shù)據(jù)趨勢(shì)預(yù)測(cè)上的能力,從而實(shí)現(xiàn)了數(shù)量和趨勢(shì)的雙預(yù)測(cè)。

    c.運(yùn)用SVM方法中的K-CV統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本并優(yōu)化參數(shù)。經(jīng)過(guò)多次交叉驗(yàn)證學(xué)習(xí)和訓(xùn)練,最終計(jì)算其校正模型參數(shù)c為1,g為0.353,MSE為0.0081。交叉驗(yàn)證提高了SVM類(lèi)別識(shí)別最優(yōu)參數(shù)集,間接提高了SVM回歸模型的精度。

    d.通過(guò)均生函數(shù)(MGF)生成30個(gè)周期性基函數(shù),采用CSC雙評(píng)分準(zhǔn)則,篩選部分周期性基函數(shù)作為預(yù)測(cè)對(duì)象的影響因子,運(yùn)用SVM中的K-CV統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本、優(yōu)化參數(shù),最終建立年最大流量預(yù)測(cè)模型。模型預(yù)測(cè)結(jié)果顯示,無(wú)論模擬還是檢驗(yàn),本文所構(gòu)建的模型均表現(xiàn)出明顯優(yōu)勢(shì),尤其在趨勢(shì)和極值的預(yù)測(cè)上克服了AR、ARMA等時(shí)間預(yù)測(cè)模型的極值均值化的問(wèn)題。

    e.對(duì)比采用均生函數(shù)(MGF)、多元逐步回歸相組合傳統(tǒng)預(yù)測(cè)方法,本文所構(gòu)建模型的預(yù)測(cè)結(jié)果無(wú)論是極值還是趨勢(shì)預(yù)測(cè)都遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)預(yù)測(cè)方法,尤其在系列極值的預(yù)測(cè)能力上表現(xiàn)更為明顯。結(jié)果表明,新構(gòu)建模型在處理年最大流量非線性變化方面有一定程度的改善。

    根據(jù)目前水文行業(yè)開(kāi)展年最大流量預(yù)報(bào)的實(shí)際情況,傳統(tǒng)中長(zhǎng)期預(yù)報(bào)方法存在細(xì)節(jié)處理不細(xì)致、預(yù)測(cè)精度有待提高等問(wèn)題,尤其針對(duì)極端洪水或干旱年份,極值預(yù)報(bào)誤差較大。本文主要針對(duì)數(shù)據(jù)系列的非線性變化和存在極值問(wèn)題,利用均生函數(shù)(MGF)并結(jié)合支持向量機(jī)(SVM)構(gòu)建年最大流量預(yù)測(cè)模型。通過(guò)在甘河加格達(dá)奇站的實(shí)際應(yīng)用并與逐步回歸預(yù)測(cè)方法對(duì)比,本文所構(gòu)建模型在模擬和檢驗(yàn)中的預(yù)報(bào)結(jié)果均呈現(xiàn)明顯優(yōu)勢(shì),應(yīng)用于工作實(shí)際是可行的。從水文領(lǐng)域的應(yīng)用來(lái)看,該模型不僅提高了年最大流量非線性及極值預(yù)報(bào)能力,也實(shí)現(xiàn)了數(shù)量和趨勢(shì)雙預(yù)報(bào),可更好應(yīng)用于中長(zhǎng)期預(yù)報(bào)。

    猜你喜歡
    加格達(dá)奇極值合格率
    極值點(diǎn)帶你去“漂移”
    提高肉雞出欄合格率的綜合措施
    極值點(diǎn)偏移攔路,三法可取
    眾志成城打贏春防硬仗 戮力同心捍衛(wèi)綠色家園——加格達(dá)奇林業(yè)局春季森林防火工作紀(jì)實(shí)
    活力(2019年15期)2019-09-25 07:21:12
    一類(lèi)“極值點(diǎn)偏移”問(wèn)題的解法與反思
    加格達(dá)奇的夜
    歲月(2017年12期)2017-12-14 20:34:50
    大興安嶺加格達(dá)奇地區(qū)早白堊世侵入巖的巖石特征
    提高重癥醫(yī)學(xué)科床頭抬高合格率
    匹配數(shù)為1的極值2-均衡4-部4-圖的結(jié)構(gòu)
    我國(guó)生鮮乳連續(xù)7年三聚氰胺抽檢合格率100%
    湘潭市| 宁明县| 安乡县| 中西区| 深泽县| 华宁县| 喀喇沁旗| 建德市| 万州区| 若羌县| 和政县| 长兴县| 徐汇区| 稷山县| 锦屏县| 花垣县| 荣昌县| 桃园县| 米易县| 延津县| 中宁县| 滦平县| 柳林县| 灯塔市| 石林| 五指山市| 太白县| 耿马| 华池县| 南靖县| 永登县| 吉木萨尔县| 郎溪县| 连城县| 志丹县| 栾城县| 鄢陵县| 大洼县| 古田县| 涟水县| 吉安市|