王江榮 文 暉 任泰明
(蘭州石化職業(yè)技術(shù)學(xué)院 信息處理與控制工程系,蘭州 730060)
礦井突水嚴重危害著煤炭的開采、礦工的生命和財產(chǎn)安全,因此,對礦井突水的預(yù)測預(yù)報工作顯得十分必要,對煤礦安全生產(chǎn)有著重要意義[1-2]。影響煤礦突水的主要因素(指標或特征)有:含水性、水壓、隔水層厚度、突水系數(shù)、導(dǎo)水性、構(gòu)造發(fā)育、巖性組合、推進步距、工作面斜長等9個因素[3]。這些判別指標之間界限很不明顯,存在一定的模糊性、信息的不精確性以及信息疊加性等,特別是信息的疊加會導(dǎo)致突水狀況誤判的問題。另外,這些判斷指標與礦井突水之間存在著很強的非線性關(guān)系[4]。為此,該文采用主成分分析(PCA,Principal Components Analysis)法對影響突水狀態(tài)的指標數(shù)據(jù)進行信息提煉,把多個彼此相關(guān)聯(lián)的指標變量通過線性組合轉(zhuǎn)化為彼此獨立的樣本指標,有效地提取原突水狀態(tài)的指標變異信息,消除指標間信息疊加造成的影響。模糊神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)功能又具有模糊語言表達能力,同時具有高度非線性擬合能力,是集學(xué)習(xí)、聯(lián)想、識別、自適應(yīng)及模糊信息處理于一體的智能信息處理方法。本文擬用模糊神經(jīng)網(wǎng)絡(luò)對礦井突水樣本數(shù)據(jù)進行判別(突水,不突水),較好地解決了信息的不足、環(huán)境的模糊性以及判斷指標的非線性等問題,并以主成分分析生成的樣本數(shù)據(jù)(或特征向量)作為模糊神經(jīng)網(wǎng)絡(luò)的輸入,用遺傳算法對模型系數(shù)及參數(shù)進行優(yōu)化。從淄博礦井突水案例中選取20個典型底板突水資料作為原始的建模樣本數(shù)據(jù),另選6個原始樣本數(shù)據(jù)作為模型的檢測樣本數(shù)據(jù)。實例仿真結(jié)果表明本文建立的基于主成分分析和遺傳算法的模糊神經(jīng)網(wǎng)絡(luò)礦井突水判斷模型效果優(yōu)于常用的神經(jīng)網(wǎng)絡(luò)和支持向量機回歸等方法,具有一定的借鑒意義。
影響礦井突水的因素是多方面的,且各因素的重要性有所不同。在很多情況下,變量之間有一定的相關(guān)性,從而使得這些變量所提供的信息在一定程度上有所重疊。主成分分析法[5-6]是一種數(shù)據(jù)壓縮和特征信息提取技術(shù),利用該方法對數(shù)據(jù)進行處理,可有效地消除高維數(shù)據(jù)組之間的相關(guān)性,使數(shù)據(jù)降維,數(shù)據(jù)結(jié)構(gòu)簡化,同時保留了所需要的主要信息。
主成分分析法的計算步驟如下:
設(shè)X是一個含有n個數(shù)據(jù)樣本和p個變量的二維數(shù)據(jù)表,X=(xij)n×p。其中列向量(x1j,x2j,…,xnj)Τ對應(yīng)第j個變量。
1.1.1數(shù)據(jù)標準化
利用MATLAB提供的函數(shù)zscore()或利用式(1)消除數(shù)量級和量綱不同造成的影響。
(1)
1.1.2計算樣本各維間相關(guān)系數(shù)矩陣
1.1.3計算特征值與特征向量
利用MATLAB提供的eig()函數(shù)求出相關(guān)系數(shù)矩陣R=(rij)p×p的p個特征值l1,l2,…,lp(l1≥l2≥…≥lp≥0)與相對應(yīng)的特征向量e1,e2,…,ep,從而有Rei=liei。
1.1.4計算貢獻率
1.1.5計算主成分載荷矩陣
設(shè)e1,e2,…,em是根據(jù)1.1.4節(jié)選定的m個主成分特征值對應(yīng)的特征向量,計算標準化后的各變量x1,x2,…,xp在各主成分上的載荷矩陣,其計算公式:
式中:eij為向量ei的第j個分量。經(jīng)過計算后,可以得到的主成分載荷矩陣。主成分yi的表達式為:
yi=li1x1+li2x2+…+lipxpi=1,2,…,m
(2)
這樣可將p維樣本向量(x1,x2,…,xp)轉(zhuǎn)化為新的m維樣本向量(y1,y2,…,ym),達到降維和消除信息重疊(使樣本的各個屬性之間是相互獨立)的目的,并將新的m維向量(y1,y2,…,ym)作為下文模糊神經(jīng)網(wǎng)絡(luò)算法的輸入向量。
T-S(Takagi-Sugeno:T-S)神經(jīng)網(wǎng)絡(luò)具有較強的自學(xué)習(xí)和聯(lián)想功能,人工干預(yù)少,精度較高,對專家知識的利用也較好。但缺點是它不能處理和描述模糊信息,不能很好利用已有的經(jīng)驗知識,對樣本的要求較高;模糊系統(tǒng)相對于神經(jīng)網(wǎng)絡(luò)而言,具有推理過程容易理解、專家知識利用較好、對樣本的要求較低等優(yōu)點,但它同時又存在人工干預(yù)多、推理速度慢、精度較低等缺點,很難實現(xiàn)自適應(yīng)學(xué)習(xí)的功能。將二者有機地結(jié)合起來,可起到優(yōu)勢互補,取長補短[8-9]。
1.2.1T-S模糊神經(jīng)網(wǎng)絡(luò)計算步驟[10-12]
1)對于k維輸入向量y=[y1,y2,…,yk],根據(jù)模糊規(guī)則計算各輸入變量yj的隸屬度,隸屬度函數(shù)采用高斯型:
(3)
2)將各隸屬度進行模糊計算,模糊算子采用連乘算子:
(4)
3)T-S模糊神經(jīng)網(wǎng)絡(luò)輸出數(shù)學(xué)表達式為:
(5)
4)計算誤差
(6)
式中,yd是網(wǎng)絡(luò)期望輸出;yc是網(wǎng)絡(luò)實際輸出。
5)修正系數(shù)和參數(shù)
T-S模糊神經(jīng)網(wǎng)絡(luò)根據(jù)網(wǎng)絡(luò)輸出和期望輸出的誤差平方和e來修正系數(shù)和參數(shù)。
系數(shù)修正表達式:
(7)
式中,m為對應(yīng)層的結(jié)點個數(shù);a 為網(wǎng)絡(luò)學(xué)習(xí)率;yj為網(wǎng)絡(luò)輸入?yún)?shù);ωi為輸入?yún)?shù)隸屬度連乘積。
參數(shù)修正:
(8)
1.2.2基于T-S模糊神經(jīng)網(wǎng)絡(luò)的礦井突水樣本識別模型
采用T-S模糊神經(jīng)網(wǎng)絡(luò)對礦井突水樣本分類,分為T-S模糊神經(jīng)網(wǎng)絡(luò)構(gòu)建、訓(xùn)練和預(yù)測3個部分。模糊神經(jīng)網(wǎng)絡(luò)的構(gòu)建確定了網(wǎng)絡(luò)的輸入和輸出數(shù)量、隸屬度函數(shù)和參數(shù)的個數(shù);模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練采用選定的樣本數(shù)據(jù),測試數(shù)據(jù)選用其它樣本數(shù)據(jù)。
1.2.3實驗數(shù)據(jù)
影響礦井突水的因素有:含水性x1、水壓x2、隔水層厚度x3、突水系數(shù)x4、導(dǎo)水性x5、構(gòu)造發(fā)育x6、巖性組合x7、推進步距x8、工作面斜長x9等9個因素。選取淄博礦井突水案例中20個典型底板突水資料作為原始標準樣本數(shù)據(jù)[3],以這20個樣本數(shù)據(jù)作為建模數(shù)據(jù),具體數(shù)據(jù)見表1。表1中的實際突水性一列里的數(shù)值“1”表示不突水,數(shù)值“2”表示突水。
表1 淄博煤礦突水各影響因素與實際突水量(訓(xùn)練樣本)
注:突水量單位:m3/h;含水性、突水系數(shù)、導(dǎo)水性、構(gòu)造發(fā)育、巖性組合均為量化值,無量綱。
1.2.4數(shù)據(jù)的PCA處理
首先對表1中的樣本數(shù)據(jù)進行標準化處理,然后對標準化處理后的樣本數(shù)據(jù)進行PCA處理。其中,相關(guān)系數(shù)矩陣的特征值及貢獻率見表2。
通過表2中的數(shù)據(jù)可知,取前4個特征值累計貢獻率達84.5308%,根據(jù)累計貢獻率大于80%也可以接受的原則,提取前4個特征值(其中3個大于1)為主成分。根據(jù)PCA主成分表達式的系數(shù)矩陣(主成分的載荷矩陣)得到新因子Y1,Y2,Y3和Y4與原始變量(標準化后)之間的關(guān)系表達式為:
Y1=0x1+0.6315x2+0.5301x3+0.2313x4+
0.0154x5-0.0438x6+0x7+0.4824x8+
0.1784x9
(9)
Y2=0x1+0.0249x2+0.3662x3-0.4707x4-
0.3761x5+0.3625x6+0x7-0.3490x8+
0.4991x9
(10)
Y3=0x1+0.0470x2-0.1587x3+0.4244x4+
0.4746x5+0.6874x6-0x7-0.1440x8+
0.2721x9
(11)
Y4=0x1-0.0632x2+0.2235x3-0.4933x4+
0.7914x5-0.2423x6+0x7-0.0221x8+
0.1309x9
(12)
將4個主成因子Y1,Y2,Y3和Y4作為模糊神經(jīng)網(wǎng)絡(luò)的4個輸入指標。結(jié)合表1,由4個主成分生成新的礦井突水指標,新指標見表3。
表2各項指標相關(guān)系數(shù)矩陣的特征值及貢獻率
主成分序號特征值差值貢獻率%累計貢獻率%12 30660 645032 951432 951421 66160 645023 736756 688131 14620 343416 374473 062540 80280 120811 468384 530850 68200 29849 742994 273660 38360 36635 479799 753470 01730 01730 2466100 000082 6653e-0332 6653e-0333 8076e-032100 0000900100 0000
表3 4個主成分生成的礦井突水狀態(tài)的新判別指標
本文利用遺傳算法工具箱的GUI進行參數(shù)優(yōu)化計算[13]。適應(yīng)度函數(shù)為:
(13)
打開遺傳算法的GUI,在Fitnessfunction窗口輸入@fitess(函數(shù)的計算過程由MATLAB編寫,在此略去),在Number of variables窗口輸入變量數(shù)目104,邊界約束:Lower輸入0.01*ones(1,104);Upper輸入3.5*ones(1,104),種群規(guī)模選50,迭代次為1000,其它參數(shù)選默認值。
訓(xùn)練結(jié)束后,輸出訓(xùn)練樣本是否突水判斷的擬合值,并近似處理,結(jié)果見表3(正確:表3第7列)。和實際突水狀態(tài)值比較,本文方法的預(yù)報值精確率為100%。可見經(jīng)訓(xùn)練樣本創(chuàng)建的突水判斷模型具有很高的精確性和穩(wěn)定性。下面我們對本文所創(chuàng)建的模型作進一步測試,測試樣本見表4。
表4 測試樣本[3]
將表4待判樣本數(shù)據(jù)標準化后代入文中1.2.4節(jié)由PCA提取的4個主成分表達式(9)~(12)得到待測樣本的主成分指標見表5。
表5 待判樣本的判別結(jié)果及有關(guān)數(shù)據(jù)
在MATLAB命令窗口輸出104個優(yōu)化參數(shù)(此處省略),將適應(yīng)度函數(shù)中訓(xùn)練集自變量輸入矩陣換成測試集自變量輸入矩陣(數(shù)據(jù)見表5中主成分所在列),代入優(yōu)化參數(shù)(訓(xùn)練樣本所得)求出6個測試樣本突水性的預(yù)報值,具體結(jié)果見表5。表5數(shù)據(jù)顯示本文方法的預(yù)測正確率為83.33%(錯了一個)。作為比較下面給出另三種方法的預(yù)測結(jié)果(訓(xùn)練樣本和測試樣本不變),具體數(shù)據(jù)見表6。
通過對比表5和表6的預(yù)報值,本文方法的預(yù)報結(jié)果顯然優(yōu)于表6中的方法。究其原因,本文方法充分利用PCA法能消除變量之間相互信息疊加而產(chǎn)生的影響,用少量指標表征突水特性;利用模糊神經(jīng)網(wǎng)很好地解決了突水環(huán)境的模糊性和非線性性。同時發(fā)揮了遺傳算法所具有的全局搜索能力,優(yōu)化了模型的系數(shù)和參數(shù),增強了模型的精確性和穩(wěn)定性。而表6中的方法有著明顯的缺陷,所以誤差較大。
結(jié)合礦井突水的信息特征,本文提出了基于PCA和模糊神經(jīng)網(wǎng)絡(luò)的突水判別預(yù)測方法。在突水判別預(yù)測過程中,利用PCA法處理原始數(shù)據(jù)后,不僅可以用少量的指標變量有效地表征礦井突水特性,而且能消除由于變量之間相互信息疊加而產(chǎn)生的影響。研究結(jié)果表明,對數(shù)據(jù)信息進行PCA法處理后,礦井突水類型(突水或不突水)的判別精度比單純使用模糊神經(jīng)網(wǎng)絡(luò)判別法有較大提高,也比其它一些方法效果要好。
T-S模糊神經(jīng)網(wǎng)絡(luò)的權(quán)系數(shù)和高斯隸屬度函數(shù)參數(shù)較多,采用遺傳算法優(yōu)化后,提高了T-S模糊神經(jīng)網(wǎng)絡(luò)模型計算結(jié)果的穩(wěn)定性,摒棄了模型對權(quán)值選取的主觀性和敏感性,充分發(fā)揮了模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)的各自優(yōu)勢,使模型的泛化能力得到了加強,而且多次運行識別結(jié)果保持一致。優(yōu)化后的T-S模糊神經(jīng)網(wǎng)絡(luò)模型的準確性和穩(wěn)定性遠好于單一的神經(jīng)網(wǎng)絡(luò)和支持向量機回歸等模型,值得礦業(yè)技術(shù)人員借鑒。
[1]張立新,李長洪,趙宇.礦井突水預(yù)測研究現(xiàn)狀及發(fā)展趨勢[J].中國礦業(yè),2009,18(1):88-90
[2]張自政,楊勇,等.模糊評價分類模型在礦井底板突水判別中的應(yīng)用[J].礦業(yè)安全與環(huán)保,2010,37(6):41-43
[3]張文泉.礦井底板突水災(zāi)害的動態(tài)機理及綜合判測和預(yù)報軟件開發(fā)研究[D].青島:山東科技大學(xué),2004:164-166
[4]邱秀梅,王連國.煤層底板突水人工神經(jīng)網(wǎng)絡(luò)預(yù)測[J].山東農(nóng)業(yè)大學(xué)學(xué)報,2002,33(1):62-65
[5]杜紅兵,王雪莉.基于主成分分析法的空管多指標安全綜合評估研究[J].中國安全科學(xué)學(xué)報,2009,19(7):124-128
[6]張文,陳劍平,秦勝武,等.基于主成分分析的FCM法在泥石流分類中的應(yīng)用[J].吉林大學(xué)學(xué)報,2010,40(2):368-372
[7]王英,黃容,段繼紅.基于主成分分析的重慶市房地產(chǎn)供求協(xié)調(diào)關(guān)系的研究[J].工程管理學(xué)報,2012,26(5):089-093
[8]譚濤,任開春,等.模糊神經(jīng)網(wǎng)絡(luò)技術(shù)[J].重慶文理學(xué)院學(xué)報(自然科學(xué)版),2011,30(1):71-74
[9]錢光耀,夏二勇,王滬陽,等.基于遺傳算法和小波神經(jīng)網(wǎng)絡(luò)的傳感器輸出擬合方法研究[J].計量技術(shù),2011(9):3-6
[10]王小川,史峰,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個案例分析[M].北京:北京航空航天大學(xué)出版社,2013:288-289
[11]周潤景,張麗娜.基于MATLAB與fuzzyTECH的模糊與神經(jīng)網(wǎng)絡(luò)設(shè)計[M].北京:電子工業(yè)出版社,2010:196-201
[12]周燕,王里奧.模糊神經(jīng)網(wǎng)絡(luò)在重慶市飲用水原水水質(zhì)評價中的應(yīng)用[J].三峽環(huán)境與生態(tài),2010,3(1):33-35
[13]許國根,賈瑛.模式識別與智能計算的MATLAB實現(xiàn)[M].北京:北京航空航天大學(xué)出版社,2012:175-180
[14]陳果,周伽.小樣本數(shù)據(jù)的支持向量機回歸模型參數(shù)及預(yù)測區(qū)間研究[J].計量學(xué)報,2008,29(1):92-96