張幸幸 苗 星
(河南師范大學 計算機與信息工程學院,河南 新鄉(xiāng) 453007)
依據(jù)我國煤礦瓦斯涌出量分類的統(tǒng)計數(shù)據(jù),高瓦斯礦井占35%,這些高瓦斯礦嚴重威脅著采煤工作面的安全。瓦斯涌出量的準確預測對于通風系統(tǒng)的設計、瓦斯防治、安全管理有著重要意義。我國從20世紀50年代就開始進行這方面的研究,例如礦山統(tǒng)計法、分源預測法、構造單元分源預測法等[2-3]。
隨著現(xiàn)代技術的迅速發(fā)展,特別是數(shù)學方法和計算機技術的發(fā)展,原有的預測方法和應用范圍得到了拓展,出現(xiàn)了一些新的預測方法,如瓦斯地質數(shù)學模型、速度預測法、灰色系統(tǒng)理論、神經(jīng)網(wǎng)絡等,但這些方法還在探索階段。而近年來新興的支持向量機(support vector machine,SVM)可以為瓦斯涌出量預測提供極大地便利[2],本文首先利用GA 對LS-SVM 中的相關參數(shù)進行優(yōu)化,然后利用LS-SVM 對瓦斯的影響因子進行訓練,進而對瓦斯涌出量進行預測。對比BP 神經(jīng)網(wǎng)絡的預測結果,基于該方法的瓦斯涌出量預測模型具有較高的預測精度,為工程應用奠定了基礎。
遺傳算法是一種借鑒生物界自然選擇和自然遺傳機制的隨機搜索算法,能夠在搜索過程中自動獲取和積累有關搜索空間的知識,并自適應地控制搜索過程以求得最優(yōu)解。
用遺傳算法優(yōu)化LS-SVM 參數(shù)過程如下[4-5]:
Step 1 :設置初始值,如遺傳算法的初始種群規(guī)模、最大遺傳代數(shù)T、交叉概率、變異概率等。
Step 2 :對要優(yōu)化的參數(shù)根據(jù)其設定的范圍進行二進制編碼,隨機產(chǎn)生初始種群。染色體為各參數(shù)二進制順序排列組成,長度即為各參數(shù)二進制長度之和。設置遺傳代數(shù)計數(shù)器t=0。
Step 3 :計算種群中各個個體的適應度。這里將最小二乘支持向量機的預測正確率作為目標函數(shù)值,即個體的適應度,個體對應的參數(shù)的預測正確率越高,則該個體的適應度越大。
Step 4 :根據(jù)個體適應度,按照一定規(guī)則(這里采用輪盤賭法)從當前種群中選出個體進入下一代。
Step 5 :選擇群體中的兩個個體x1、x2 作為父體以某個概率 (交叉概率)進行交叉操作,產(chǎn)生兩個新個體。這里采用單點交叉,交叉概率設為0.8。
Step 6 :隨機選擇種群中的個體以一定的概率(變異概率)進行變異操作,通過隨機改變個體中某些基因而產(chǎn)生新個體。變異概率設為0.05。
Step 7 :終止條件判斷。若t≤T,則轉到步驟2;若t>T 或平均適應度值變化持續(xù)小于某一常數(shù)超過一定代數(shù),則所得到的具有最大適應的個體作為最優(yōu)解輸出,算法終止。
Step 8 :對得到的最優(yōu)解譯碼,得到優(yōu)化的參數(shù)。
SVM[6-8]是一種全新的和強有力的分類和回歸工具,標準的SVM算法是將一個實際問題轉化為一個帶不等式約束的二次凸規(guī)劃問題,而LS-SVM 是將實際問題轉化為求解一組線性方程組的問題,簡化了計算,提高了收斂速度。其具體回歸算法如下[6]:
對于給定的訓練數(shù)據(jù)集s={(x1,y1),(x2,y2),...,(xl,yl)}∈Rn×R,利用如下高維特征空間的線性函數(shù)來擬合樣本集:
f(x)=wTφ(x)+b
式中:φ(x)為輸入空間到高維特征空間的非線性映射;w 為特征空間權系數(shù)向量;b 為偏置。根據(jù)結構風險最小化原理,LS-SVM 回歸可以表示為如下約束優(yōu)化問題:
為了求解上述優(yōu)化問題,需將約束優(yōu)化變?yōu)闊o約束優(yōu)化。引入拉格朗日函數(shù),將目標函數(shù)的優(yōu)化問題變換到對偶空間,則
式中:αi為拉格朗日乘子;λ 為常數(shù);根據(jù)KKT (Karush-Kuhn-Tucker)條件,則?L/?w=0,?L/?b=0,?L/?ei=0,?L/?αi=0,即
對于此式,消去w 和ei可得到如下線性方程組:
式中:ei=[1,...,l]T;α=[α1,...,αl]T;y=[y1,...,yl]T;Q=φ(xi)Tφ(xi);根據(jù)Mercer條件定義核函數(shù)k(xi,xj)=φ(xi)Tφ(xi)。
利用最小二乘法求解上線性方程組,從而解出a 和b,最后得到LS-SVM 回歸函數(shù):
從線性方程組可以看出,只有參數(shù)λ 是待選的,這比標準SVM 待選的參數(shù)少,不再需要指定收斂判據(jù)的精度。所以LS-SVM 算法運行簡單,速度快,精度高。
仿真運用的實驗平臺為Windows 8,4G 內存,軟件為MATLAB(R2013a)。某煤礦回采工作面瓦斯涌出量與影響因素統(tǒng)計表如表1 所示,其中煤層深度(m)、煤層厚度(m)、煤層瓦斯含量(m3·t-1)、煤層間距(m)、日進度(m·d-1)、日產(chǎn)量(t·d-1)分別表示為x1~x6,x0為瓦斯涌出量。
表1 瓦斯涌出量與影響因素統(tǒng)計表(部分)
用前13 組數(shù)據(jù)作訓練樣本,其中x1~x6是訓練樣本集,x0是訓練目標集,則得到基于LS-SVM 的瓦斯涌出量預測模型,模型中的參數(shù)用GA 優(yōu)化后,懲罰系數(shù)C=165.63,μ=63.85。最后用第14-18 組數(shù)據(jù)中x1~x6作為測試集,訓練出瓦斯涌出量x0。同時用神經(jīng)網(wǎng)絡預測第14-18 組數(shù)據(jù)中的瓦斯涌出量x0[9-10],目標收斂趨勢如圖1 所示,實驗預測結果及兩類預測值與表1 中實際值的絕對誤差如表2 所示,二者的平均絕對誤差分別是0.1847 和0.3040,則LS-SVM 對瓦斯涌出量的預測效果明顯比神經(jīng)網(wǎng)絡好。
圖1 神經(jīng)網(wǎng)絡訓練目標值的變化趨勢
表2 第14-18 組瓦斯涌出量預測結果與誤差
本文將基于統(tǒng)計學習理論的LS-SVM 和GA 應用到煤礦瓦斯涌出量的預測研究中,用GA 對LS-SVM 的相關參數(shù)進行優(yōu)化,然后用LS-SVM 進行預測。與神經(jīng)網(wǎng)絡預測的結果相比,LS-SVM 的預測結果更精確,與實際值的誤差更小,訓練速度更快,對進一步解決實際工程問題具有很好的應用前景。
[1]章立清,秦玉金,姜文忠,等.我國礦井瓦斯涌出量預測方法研究現(xiàn)狀及展望[J].煤礦安全,2007,393(8):58-60.
[2]梁華珍.工作面瓦斯涌出量預測的研究與應用[D].安徽:安徽理工大學,2007,06.
[3]王一莉.瓦斯涌出量預測方法及其應用研究[D].南京:南京工業(yè)大學,2005,05.
[4]雷英杰,張善文,李續(xù)武,等.MATLABGA 工具箱及其應用[M].西安:西安電子科技大學出版社,2005.
[5]王克奇,楊少春,戴天虹,等.采用GA 優(yōu)化最小二乘支持向量機參數(shù)的方法[J].計算機應用與軟件,2009,26(7):109-111.
[6]王曉蘭,王明偉.基于小波分解和最小二乘支持向量機的短期風速預測[J].電網(wǎng)技術,2010,34(1):179-184.
[7]朱家元,楊云,張恒喜,等.基于優(yōu)化最小二乘支持向量機的小樣本預測研究[J].航空學報,2004,25(6):565-568.
[8]葉徐靜.基于最小二乘支持向量機的風電功率超短期預測[J].電源學報,2013(2):30-35.
[9]彭望蜀.基于BP 神經(jīng)網(wǎng)絡與支持向量機的股票指數(shù)預測模型比較[J].金融市場,2013(437):71-73.
[10]聶勛科.基于神經(jīng)網(wǎng)絡的污水出水COD 預測模型[J].重慶工學院學報:自然科學,2008,22(8):156-162.