嚴(yán) 超
(河南理工大學(xué) 測(cè)繪與國(guó)土信息工程學(xué)院,河南 焦作 454000)
基于GA-SVM的主要影響角正切求取方法研究
嚴(yán) 超
(河南理工大學(xué) 測(cè)繪與國(guó)土信息工程學(xué)院,河南 焦作 454000)
當(dāng)采取概率積分法進(jìn)行開(kāi)采沉陷預(yù)計(jì)時(shí),主要影響角正切是重要的預(yù)計(jì)參數(shù)之一,它對(duì)確定采空區(qū)上方地表變形的影響范圍具有重要意義。在綜合分析主要影響角正切及其5個(gè)主要影響因素的基礎(chǔ)上,利用遺傳算法(GA)和支持向量機(jī)(SVM)建立了求取主要影響角正切的GA-SVM模型。運(yùn)用遺傳算法(GA)自動(dòng)獲取建立模型的3個(gè)參數(shù),利用篩選出的國(guó)內(nèi)典型地表移動(dòng)觀測(cè)數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和測(cè)試,并將預(yù)測(cè)值與實(shí)際值進(jìn)行對(duì)比。結(jié)果表明,運(yùn)用GA-SVM模型求取的主要影響角正切最小相對(duì)誤差為0.29%,最大相對(duì)誤差為3.08%,求取速度快,能夠滿(mǎn)足實(shí)際工程的精度要求,且模型的泛化能力較強(qiáng),具有一定的實(shí)用價(jià)值。
遺傳算法;支持向量機(jī);主要影響角正切;開(kāi)采沉陷
礦山開(kāi)采沉陷學(xué)研究的核心內(nèi)容之一是對(duì)開(kāi)采引起的地表移動(dòng)和變形進(jìn)行準(zhǔn)確的預(yù)計(jì),主要影響角正切是表征地表移動(dòng)規(guī)律的重要參數(shù)之一。目前常用的求取主要影響角正切的方法是根據(jù)大量的地表移動(dòng)觀測(cè)站的實(shí)測(cè)數(shù)據(jù)進(jìn)行反演,雖然也獲得了較為可靠的結(jié)果,但是耗費(fèi)的資源較大,文獻(xiàn)[1-2]分別運(yùn)用單一的神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對(duì)主要影響角正切的問(wèn)題進(jìn)行了研究,文獻(xiàn)[3]運(yùn)用灰色理論優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對(duì)求取主要影響角正切的速度和精度有了一定的提高,因此,準(zhǔn)確確定主要影響角正切對(duì)開(kāi)采沉陷預(yù)計(jì)具有重要的現(xiàn)實(shí)意義。
支持向量機(jī)(Support Vector Machines,SVM)[4]在解決小樣本、非線(xiàn)性和高維數(shù)等實(shí)際問(wèn)題時(shí)表現(xiàn)出很多優(yōu)勢(shì)。遺傳算法(GA)[5]具有簡(jiǎn)單通用、隨機(jī)搜索、全局搜索和魯棒性強(qiáng)等特點(diǎn)。本文運(yùn)用GA優(yōu)化的SVM建立主要影響角正切與其影響因素之間的非線(xiàn)性回歸關(guān)系,并用收集的樣本進(jìn)行訓(xùn)練和測(cè)試,從而獲得較為精確的主要影響角正切值。
SVM方法是Vapnik等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的一種新的機(jī)器學(xué)習(xí)方法,它根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,通過(guò)適當(dāng)?shù)剡x擇函數(shù)子集及該子集中的判別函數(shù),從而構(gòu)造一個(gè)目標(biāo)函數(shù)將兩類(lèi)模式盡可能地區(qū)分開(kāi)來(lái)。
對(duì)于一個(gè)給定的訓(xùn)練數(shù)據(jù)集
(1)
選取適當(dāng)?shù)膹目臻gRn到H空間的變換Φ:x=Φ(x),適當(dāng)?shù)木圈?0,即不敏感損失函數(shù),合適的懲罰系數(shù)C>0,其作用是用來(lái)平衡最大分類(lèi)邊界和最小分類(lèi)誤差。SVM將回歸分析問(wèn)題轉(zhuǎn)化為以下優(yōu)化問(wèn)題:
(2)
ε.
(3)
(4)
構(gòu)造決策函數(shù)
(5)
引入核函數(shù)[7]替換上述對(duì)偶問(wèn)題中的向量?jī)?nèi)積,即K(xi,x)=Φ(xi)·Φ(x),得到最終的決策函數(shù)
(6)
遺傳算法[5]是Holland等人于1975年提出的模擬生物在優(yōu)勝劣汰、適者生存的自然環(huán)境下,遺傳和進(jìn)化過(guò)程中逐漸形成的一種不僅具有自適應(yīng)能力而且能夠全局性搜索最優(yōu)解的算法。它和傳統(tǒng)的搜索方法不同,它并不是基于多次統(tǒng)計(jì)和單一的評(píng)估函數(shù)的梯度獲得一個(gè)確定性的序列解,而是通過(guò)搜索全局來(lái)獲得最優(yōu)解。
GA對(duì)SVM參數(shù)尋優(yōu)過(guò)程如下[1]:
首先,初始化SVM參數(shù),對(duì)初始值進(jìn)行編碼,隨機(jī)產(chǎn)生遺傳算法的初始種群,將初始種群結(jié)合SVM進(jìn)行選擇和交叉操作,得到適應(yīng)度值,如果該適應(yīng)度值不滿(mǎn)足GA結(jié)束的條件繼續(xù)返回進(jìn)行選擇和交叉操作,如果滿(mǎn)足結(jié)束條件,則通過(guò)SVM的初始模型即可尋得最優(yōu)的參數(shù),最后,用獲取的最優(yōu)參數(shù)返回到SVM中建立GA-SVM模型用于待求問(wèn)題的求解。
3.1 主要影響角正切影響因素
能夠影響主要影響角正切的因素是多方面的,因此,選取合理有效的影響因素是主要影響角正切預(yù)計(jì)是否準(zhǔn)確的關(guān)鍵。根據(jù)文獻(xiàn)[2-3,11],影響主要影響角正切的因素有:①覆巖的巖性影響系數(shù)D:在同等條件下,巖性影響系數(shù)越大,巖性越軟,主要影響角正切越小,影響范圍越大;反之,巖性影響系數(shù)越小,巖性越堅(jiān)硬,主要影響角正切越大,影響范圍越小。②開(kāi)采厚度M:在同等條件下,當(dāng)開(kāi)采厚度較小時(shí),主要影響角正切隨開(kāi)采厚度的增大而增大;當(dāng)開(kāi)采厚度較大時(shí),主要影響角正切隨開(kāi)采厚度的增大有一定的減小趨勢(shì)。③開(kāi)采深度H:一般情況下,主要影響角正切隨開(kāi)采深度的增大而緩慢增大。④工作面斜長(zhǎng)L:在采深及采厚一定的情況下,工作面斜長(zhǎng)增大會(huì)導(dǎo)致地表采動(dòng)程度系數(shù)增大,進(jìn)而導(dǎo)致主要影響角正切增大;當(dāng)達(dá)到充分采動(dòng)后,主要影響角正切趨于穩(wěn)定。⑤煤層傾角α:大量資料研究表明,主要影響角正切隨煤層傾角α的增大而減小,但是變化幅度不明顯。因此,求取的過(guò)程就是要建立上述5個(gè)影響因素與主要影響角正切之間的非線(xiàn)性關(guān)系。
3.2 數(shù)據(jù)來(lái)源
選擇合適的樣本數(shù)據(jù),在一定程度上能夠提高模型的預(yù)測(cè)能力。根據(jù)文獻(xiàn)[3,12-13],篩選出31個(gè)典型的地表移動(dòng)觀測(cè)實(shí)例數(shù)據(jù)作為模型的訓(xùn)練和測(cè)試樣本,將其中的1~28作為訓(xùn)練樣本,29~31作為測(cè)試樣本。試驗(yàn)數(shù)據(jù)如表1所示。
表1 訓(xùn)練和測(cè)試樣本
3.3 實(shí)驗(yàn)參數(shù)的選擇
為提高算法的精度及有效性,增強(qiáng)模型的泛化能力,首先運(yùn)用GA對(duì)模型的懲罰系數(shù)C、不敏感損失函數(shù)ε和核函數(shù)r進(jìn)行參數(shù)尋優(yōu),GA-SVM模型經(jīng)過(guò)200次進(jìn)化計(jì)算得到了一個(gè)最佳適應(yīng)度的穩(wěn)定迭代值,如圖1所示。
圖1 GA-SVM進(jìn)化曲線(xiàn)
最終得到最優(yōu)的結(jié)果為C=2.573 5,ε=0.045 9,r=0.024 8,此時(shí)訓(xùn)練集的最小均方差為0.135 19,經(jīng)過(guò)試驗(yàn)和驗(yàn)證此時(shí)支持向量的總數(shù)為28個(gè)。最后將以上3個(gè)最優(yōu)參數(shù)返回到SVM中建立GA-SVM模型。用該模型對(duì)訓(xùn)練結(jié)果進(jìn)行預(yù)計(jì),結(jié)果如表2所示。
3.4 模型的測(cè)試
將表1中的29~31三組測(cè)試數(shù)據(jù)對(duì)所建立的模型進(jìn)行測(cè)試,測(cè)試結(jié)果如表3所示。由表3可知,主要影響角正切tanβ的預(yù)測(cè)值與實(shí)際值的最大絕對(duì)誤差為0.046 2,最大相對(duì)誤差為3.08%,其精度能夠滿(mǎn)足工程現(xiàn)場(chǎng)的實(shí)際精度要求。
表2 訓(xùn)練結(jié)果
表3 模型測(cè)試結(jié)果
1)將遺傳算法(GA)與支持向量機(jī)(SVM)有效結(jié)合,建立了求取主要影響角正切的GA-SVM模型。在綜合分析了主要影響角正切的5個(gè)影響因素的基礎(chǔ)上,通過(guò)收集的典型觀測(cè)數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和測(cè)試,測(cè)試結(jié)果為模型預(yù)測(cè)值的最大相對(duì)誤差為3.08%,證明采用GA-SVM模型求取主要影響角正切的方法可行,且具有一定的實(shí)用價(jià)值。
2)通過(guò)遺傳算法(GA)自動(dòng)尋取最優(yōu)參數(shù)能夠避免和克服單一支持向量機(jī)模型參數(shù)選取的困難,能夠快速準(zhǔn)確地獲取模型參數(shù),而且不需要人為參與,提高了模型的應(yīng)用效果。
3)由試驗(yàn)可知,模型的預(yù)測(cè)精度在一定程度上與選取的訓(xùn)練樣本有著密切的關(guān)系,目前試驗(yàn)樣本的選擇都是人工篩選并測(cè)試,功過(guò)效率較低,篩選的樣本數(shù)據(jù)不理想會(huì)導(dǎo)致模型建立失敗,因此,試驗(yàn)在樣本數(shù)據(jù)的選取上還存在一定的局限性。
[1] 劉希亮,趙學(xué)勝,陸鋒,等. 基于GA-SVM的露天礦拋擲爆破拋擲率預(yù)測(cè)[J]. 煤炭學(xué)報(bào),2012,37(12):1999-2005.
[2] 高彥濤,譚志祥,鄧喀中. 基于神經(jīng)網(wǎng)絡(luò)的主要影響角正切值求取方法[J]. 煤礦安全,2007(4):30-33.
[3] 魏好,鄧喀中,盧正,等. 基于支持向量機(jī)的主要影響角正切求取方法研究[J]. 金屬礦山,2010(5):120-123.
[4] 陳冰梅,樊曉平,周志明,等.支持向量機(jī)原理及展望[J]. 制造業(yè)自動(dòng)化,2010,32(12):136-138.
[5] 邊霞,米良.遺傳算法理論及其應(yīng)用研究進(jìn)展[J]. 計(jì)算機(jī)應(yīng)用研究,2010,27(7):2425-2429.
[6] 鄧乃揚(yáng),田英杰.支持向量機(jī):理論、算法與拓展[M].北京:科學(xué)出版社,2009.
[7] 高雷阜,張秀麗,佟盼. GA_SJ在SVM核參數(shù)優(yōu)化中的應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用,2015,51(4):110-114.
[8] 吳明圣. 徑向基神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的參數(shù)優(yōu)化方法研究及應(yīng)用[D].長(zhǎng)沙:中南大學(xué),2007.
[9] 宋小杉,蔣曉瑜,羅建華,等. 基于類(lèi)間距的徑向基函數(shù)-支持向量機(jī)核參數(shù)評(píng)價(jià)方法分析[J]. 兵工學(xué)報(bào),2012,33(2):203-208.
[10] 馮守良. 基于RBF網(wǎng)絡(luò)曲線(xiàn)擬合的研究[J]. 黑龍江工程學(xué)院學(xué)報(bào),2015,29(1):23-26.
[11] 吳朝陽(yáng),李寧. AGO-BP神經(jīng)網(wǎng)絡(luò)在主要影響角正切求取中的應(yīng)用[J]. 煤礦安全,2012,43(3):117-120.
[12] 國(guó)家煤炭工業(yè)局. 建筑物、水體、鐵路及主要井巷煤柱留設(shè)與壓煤開(kāi)采規(guī)程[M].北京:煤炭工業(yè)出版社,2000.
[13] 趙保成,譚志祥,鄧喀中. 利用隨機(jī)森林回歸模型計(jì)算主要影響角正切[J]. 金屬礦山,2016(3):172-175.
[責(zé)任編輯:劉文霞]
Research on calculation method of tangent of majorinfluence angle base on GA-SVM
YAN Chao
(School of Surveying and Land Information Engineering,Henan Polytechnic University,Jiaozuo 454000,China)
When the probability integral method for mining subsidence expected is used,the tangent of majorinfluence angle is one of the most important parameters,which is of great significance to determine the influence range of surface deformation above mined out area.This paper, based on the comprehensive analysis of tangent of majorinfluence angle and its five main influence factors,uses GA and SVM to set up a model of GA-SVM to calculate the angent of majorinfluence angle.With GA to obtain the three parameters of model automatically,this paper tests the model by using the typical domestic surface movement observation data,and comparing the prognostic value with actual value.The results show that:the minimum relative error of tangent of majorinfluence angle by using GA-SVM model is 0.29%,the maximum relative error is 3.08%,and the calculating speed is fast,which can meet the accuracy requirements of the actual project. This model has a strong generalization ability and some practical value.
GA;SVM;tangent of majorinfluence angle;mining subsidence
10.19352/j.cnki.issn1671-4679.2016.06.004
2016-07-21
河南省高等學(xué)校科技創(chuàng)新團(tuán)隊(duì)(131RTSTHN029)
嚴(yán) 超(1990-),男,碩士研究生,研究方向:礦區(qū)開(kāi)采沉陷與土地復(fù)墾.
TP18;TD325
A
1671-4679(2016)06-0016-04