摘要:介紹了SVM的基本原理,指出了其在解決樣本非線性問題中表現(xiàn)的特有優(yōu)勢,并將SVM和BP神經網絡在葉爾羌河年徑流量預測結果進行了對比。結果表明SVM方法預測精度要略優(yōu)于BP神經網絡方法。
關鍵詞:徑流量預測;神經網絡;SVM模型;葉爾羌河
前言
水文系統(tǒng)中影響預測對象的因子眾多,影響因子與預測對象之間關系復雜,目前較多地用顯式的統(tǒng)計模型進行預測。但是統(tǒng)計模型缺乏自適應性,更新困難,具有不確定性,擬合歷史資料的精度較高,而預測檢驗的精度卻時好時壞,不是十分穩(wěn)定。許多事實己經說明,水文系統(tǒng)中很多變量間的復雜非線性關系遠非簡單的代數(shù)方程所能有效表達。
近年來,支持向量機(Support Vector Machines,簡稱SVM)的研究在各個領域廣泛開展。SVM是Vapnik等根據(jù)統(tǒng)計學習理論(Statistical Learning Theory,簡稱SLT)提出的一種新的機器學習方法,在解決小樣本、非線性問題中表現(xiàn)出許多特有的優(yōu)勢,并在模式識別、函數(shù)逼近和概率密度估計等方面取得了良好的效果。本文采用SVM模型對葉爾羌河多年徑流量進行年徑流量預測,旨在為國內相關研究提供參考。
1 SVM模型基本原理
SVM方法是從線性可分情況下的最優(yōu)分類面(Optimal Hyper Plane)提出的。假設d維空間中線性判別函數(shù)的一般形式為,分類面方程為
對判別函數(shù)進行歸一化,使兩類樣本都滿足≥1,即使離分類面最近的樣本的=1,這樣分類間隔就等于,因此間隔最大等價于使(或)最小。而要求分類線對所有樣本正確分類,就是要求其滿足
式中:ai為拉格朗日乘子;c為常數(shù);為可調的權重向量;為松馳變量。
最優(yōu)分類面問題可以表示成如下的約束優(yōu)化問題,即在式(2)的約束下,求函數(shù)
的最小值。這是一個二次規(guī)劃問題,可定義以下的拉格朗日函數(shù):
求式(3)的極小值就是對w和b求拉氏函數(shù)的極小值。求L對W和b的偏微分,并令其等于0,可轉化為如下的對偶問題。
2 應用實例
2.1 建模方式
(1)樣本歸一化處理。歸一化處理有利于避免各個因子之間的量級差異,消除量綱和單位不同對各個因子的影響,因此應對樣本的輸入、輸出參數(shù)進行(0,1)歸一化處理。
(2)確定核函數(shù)。由于核函數(shù)對算法的影響較大,因此選擇一個最好的核函數(shù)極為重要。這里以徑向基函數(shù)作為SVM方法中的核函數(shù),建立推理試驗模型。
(3)核參數(shù)的選擇。采用Cross-validation方法便可得到核的參數(shù)。
2.2 模型參數(shù)的確定
選取葉爾羌河卡群水文站的年徑流量實測資料(1958~2015年)作為研究對象,其中1958~2010年的數(shù)據(jù)作為訓練數(shù)據(jù),2011~2015年的數(shù)據(jù)作為檢驗數(shù)據(jù)。在預報建模中假設未來值和過去值存在某種確定的函數(shù)關系,利用過去的觀測值估計未來值:
式中:q(t)為當前時段徑流量;q(t-n)為n個時段前徑流量。
根據(jù)實際經驗以及研究方便,取n為3,以相對誤差和相對誤差絕對值所占區(qū)域來衡量預報結果。
按前述方法建立SVM的中長期預報模型,其中模型參數(shù)(c,,)?。?.3,0.1,0.25)。選用3層BP模型進行比較,并通過試驗確定最優(yōu)的ANN隱層數(shù)為7。同時把歸一化后的數(shù)據(jù)輸入SVM與BP模型,比較預報效果。檢驗段的實測值及SVM、BP的預報值見表1。
從表1可以看出:在預測階段,SVM模型要比BP模型效果要好,平均相對誤差分別為0.9%和6.4%,說明支持向量機用于徑流量預測比BP神經網絡有更高的精度和魯棒性,是可行的。
3 結論
SVM是一種基于SRM的小樣本學習方法,克服了BP網絡結構難以確定和不易達到全局最優(yōu)的缺陷。SVM算法將問題轉化為二次優(yōu)化問題,得到的解是全局最優(yōu)解;而用BP網絡進行預測得到的解可能是局部最優(yōu)解。因此,SVM預測方案解決了BP網絡方法中無法避免的局部極值問題,在精度上優(yōu)于BP網絡預測方案。
參考文獻:
[1]陳永義,俞小鼎,高學浩,等.處理非線性分類和回歸問題的一種新方法(I)——支持向量機方法簡介[J].應用氣象學報,2004,15(3):351-352.
[2]馮漢中,陳永義.支持向量機回歸方法在實時業(yè)務預報中的應用[J].氣象,2005,31(1):41-44.
[3]黃奕銘.支持向量機在雷雨天氣預報中的應用[J].廣東氣象,2006,28(1):22-24.
[4]張偉,何新林,劉兵.SVM在瑪納斯河流域徑流預測中的應用與研究[J].人民黃河,2008,30(5):35-36.
作者簡介:楊磊(1986- )男,新疆庫爾勒人,大學本科,主要從事水利工程及水政水資源管理工作。