阿淑芳,劉寧寧,余生晨,石 強(qiáng)
(1.邢臺(tái)學(xué)院,河北 邢臺(tái) 054000;2. 華北科技學(xué)院 計(jì)算機(jī)學(xué)院,北京 東燕郊 101601;3. 高河能源有限公司,山西 長(zhǎng)治 047100)
基于免疫算法改進(jìn)的反向傳播神經(jīng)元網(wǎng)絡(luò)礦井水害水源識(shí)別研究
阿淑芳1,劉寧寧1,余生晨2,石 強(qiáng)3
(1.邢臺(tái)學(xué)院,河北 邢臺(tái) 054000;2. 華北科技學(xué)院 計(jì)算機(jī)學(xué)院,北京 東燕郊 101601;3. 高河能源有限公司,山西 長(zhǎng)治 047100)
為了提高識(shí)別礦山水害水源(即,判定水的類型)的正確率,利用免疫算法設(shè)計(jì)并優(yōu)化了反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)的結(jié)構(gòu)并求得BPNN的各層權(quán)系數(shù)和閾值的初值,用該初值訓(xùn)練BPNN,獲得最佳的BPNN各層的權(quán)系數(shù)(權(quán)重)和閾值,使其適合識(shí)別礦山水害水源。用訓(xùn)練好的BPNN識(shí)別待判定的水源是哪一種類型的水源,判定水源的危害程度。實(shí)驗(yàn)和潞安集團(tuán)所屬煤礦區(qū)的礦井和鉆孔水樣檢驗(yàn)結(jié)果說明用該方法是有效可行的,識(shí)別礦井水的水源的準(zhǔn)確率可達(dá)到93%。
水源識(shí)別;礦井突水;反向傳播神經(jīng)元網(wǎng)絡(luò);免疫算法
凡是煤礦重大突水,在發(fā)生之前,總有一些預(yù)兆。從水量變化看,一般經(jīng)歷從“濕幫(出汗)、滴水、淋水、流水、突水”的量變到質(zhì)變的過程。在突水預(yù)兆期,及時(shí)捕捉并利用水文地球化學(xué)探測(cè)技術(shù)進(jìn)行水化學(xué)信息分析研究,對(duì)于識(shí)別水的來源以及判斷發(fā)生突水的可能性將具有重要意義,為最大限度地減少人員傷亡和財(cái)產(chǎn)損失贏得寶貴的時(shí)間[1]。目前,常用的水文地球化學(xué)探測(cè)技術(shù)各有優(yōu)缺點(diǎn),能解決一部分問題,但是還不能完全滿足生產(chǎn)的需要[2]。例如,根據(jù)地面水質(zhì)化驗(yàn)的單一指標(biāo)判斷水源的方法在一些復(fù)雜地區(qū)的判斷結(jié)果與實(shí)際有較大的出入。常用的模糊聚類算法的計(jì)算效率很高,但是它的主要缺點(diǎn)是所選定的模型常常不能反映數(shù)據(jù)的概率結(jié)構(gòu)[3],因此,用這些方法所得到的結(jié)果不能反映數(shù)據(jù)構(gòu)造的真實(shí)情況。事實(shí)上,礦井水害水源識(shí)別系統(tǒng)是一項(xiàng)復(fù)雜的工程,并不是一個(gè)簡(jiǎn)單的分類識(shí)別問題,有很多問題需要深入研究[4],本文針對(duì)識(shí)別礦山水害水源的特點(diǎn),利用免疫算法設(shè)計(jì)并優(yōu)化了反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)的結(jié)構(gòu)和參數(shù),借助建立的礦山水害水源數(shù)據(jù)庫,利用免疫算法獲得BPNN的各層權(quán)系數(shù)和閾值的初值,用該初值訓(xùn)練BPNN,獲得BPNN各層的權(quán)系數(shù)(權(quán)重)和閾值,使其適合識(shí)別礦山水害水源。運(yùn)用本文設(shè)計(jì)并優(yōu)化了的反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)識(shí)別一些復(fù)雜的礦井水的來源,取得了較好的效果。實(shí)驗(yàn)和生產(chǎn)實(shí)踐表明用本文研制的方法識(shí)別礦井水的來源,其準(zhǔn)確率可達(dá)到93%。下面對(duì)該方法給以比較詳細(xì)的介紹。
本文建立的水源識(shí)別過程的總體步驟如下:
(1) 首先建立了潞安集團(tuán)所屬礦區(qū)13個(gè)礦井(不包括后來兼并的小礦井)的突水水源的水化學(xué)模型,即建水樣庫 。 這13個(gè)礦井的突水來源主要有砂巖水、奧灰水、太灰水、老空水和地面泉水等,沒有海水、水庫或湖泊水。
(3) 建立判斷突水水源的數(shù)學(xué)判別模型(或方法)。具體建立方法下面將詳述。
(4) 決策響應(yīng)。當(dāng)一個(gè)待識(shí)別的礦井水被判判定為奧灰承壓水,或老窯采空區(qū)積水,即可能會(huì)發(fā)生水害的水源,則可采取預(yù)防措施;當(dāng)判定為其它水源或危害性較小的水源時(shí),可正常采礦。
下面對(duì)上述步驟中遇到的一些問題給出解決的方法。
在地面實(shí)驗(yàn)室水質(zhì)化驗(yàn)的結(jié)果中,各個(gè)化驗(yàn)指標(biāo)的單位是不一致的,有些指標(biāo)的單位為mg/L(毫克/升) ,有些則為 mol/L(模爾/升,1模爾Ca2+(鈣)離子=6.02×1023個(gè)Ca2+離子)。這些指標(biāo)的單位不一致會(huì)導(dǎo)致建立的數(shù)學(xué)判別模型與真實(shí)的實(shí)際數(shù)學(xué)判別模型之間的誤差較大。為了解決這個(gè)問題,也就是要把各個(gè)不同單位的指標(biāo)數(shù)值轉(zhuǎn)化為無單位的數(shù)值,以便進(jìn)行比較和建立判別模型。為此,本論文采用“極差標(biāo)準(zhǔn)化”方法解決這個(gè)問題。
以Mg2+(鎂)離子為例,假設(shè)xi=Mg2+(鎂)離子的第i個(gè)取值,在實(shí)驗(yàn)室觀測(cè)了30個(gè)Mg2+(鎂)離子值,這里n=30。
“極差標(biāo)準(zhǔn)化”是:
3.1 反向傳播神經(jīng)元網(wǎng)絡(luò)的建立
本論文用反向傳播神經(jīng)元網(wǎng)絡(luò)(back propagation neural network,BPNN) 判斷礦井突水水源的類型。
BPNN是對(duì)人腦若干基本特性通過數(shù)學(xué)方法進(jìn)行的抽象和模擬,是一種模仿人腦結(jié)構(gòu)及其功能的非線性信息處理系統(tǒng)。BPNN 的實(shí)質(zhì)體現(xiàn)了網(wǎng)絡(luò)輸入與輸出之間的一種函數(shù)關(guān)系。通過選取不同的模型結(jié)構(gòu)和激活函數(shù),可以形成不同的神經(jīng)網(wǎng)絡(luò),得到不同的輸入、輸出關(guān)系式,并達(dá)到不同的設(shè)計(jì)目的,完成不同的任務(wù)。
神經(jīng)元是神經(jīng)網(wǎng)絡(luò)的基本處理單元,一般情況下,它是一個(gè)多輸入、單輸出的非線形元件。神經(jīng)元輸出除受輸入信號(hào)的影響外,同時(shí)也受到神經(jīng)元內(nèi)部其他因素的影響,所以,在人工神經(jīng)元的建模中,常常還加有一個(gè)額外輸入信號(hào),稱為偏差(bias),有時(shí)也稱為閥值。
例如,一個(gè)具有n個(gè)輸入分量的神經(jīng)元,其中輸入分量xj(j=1,2,…n),相應(yīng)的wj1,wj2,wj3,…,wjn,表示突觸1,2,…,n與第j個(gè)神經(jīng)元的突觸連接強(qiáng)度,即連接權(quán)重。為了方便分析,我們把整個(gè)過程分解為三個(gè)數(shù)學(xué)計(jì)算步驟:
① 加權(quán)——對(duì)每個(gè)輸入信號(hào)進(jìn)行程度不等的加權(quán)計(jì)算;
② 求和——進(jìn)行全部輸入信號(hào)的組合效果的求和計(jì)算;
③ 映射——通過轉(zhuǎn)移函數(shù)計(jì)算輸出結(jié)果。
下面給出以數(shù)學(xué)公式描述的在礦井水害水源識(shí)別中用到的反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)的響應(yīng)過程。
列向量X表示輸入向量為:
X=[x1,x2…xn]T
行向量wj表示神經(jīng)元的連接權(quán)重向量為:
Wj=[wj1,wj2…wjn]
神經(jīng)元j的凈輸入sj為:
公式中θj為閥值。
至此,用公式的形式描述了一個(gè)神經(jīng)元有接受信號(hào)到作出反應(yīng)的過程。
3.2 識(shí)別水源的BPNN網(wǎng)絡(luò)的參數(shù)選取
(1) 變量的選取
x1=溫度;x2=氯;x3=鉀;x4=鈣;x5=鎂;x6=硫酸鹽;x7=PH值;x8=鐵;x9=亞硝酸鹽;x10=碘。
(2) BPNN的結(jié)構(gòu)參數(shù)選取
采用三層神經(jīng)元網(wǎng)絡(luò)較為合適,如果BPNN為四層或更多,則BPNN容易具有“泛性”(即,不收斂,發(fā)散),如果BPNN為二層,則不能很好的完成復(fù)雜的識(shí)別礦山水害水源(即,判定水的類型)的任務(wù)。
輸入層單元數(shù)為10個(gè),對(duì)應(yīng)上面選取的10個(gè)輸入變量;中間層單元數(shù)為15個(gè),輸出層單元數(shù)為3。這樣, 輸入層對(duì)應(yīng)著10個(gè)變量, 輸出的結(jié)果為23=8種可能的情況,即,輸出為:111對(duì)應(yīng)“砂巖水”,110對(duì)應(yīng)“奧灰水”,101對(duì)應(yīng)“太灰水”,100對(duì)應(yīng)“老空水”,011對(duì)應(yīng)“地面泉水”, 010、 001 、000備用。
(3) 輸入變量的處理
BPNN要求輸入的數(shù)據(jù)為“0”和“1”兩種形式,但是,實(shí)際測(cè)量值一般是連續(xù)變化的量值,并非是“0”和“1”,這就需要轉(zhuǎn)化。本文給出的轉(zhuǎn)化函數(shù)是“階躍函數(shù)”?!半A躍函數(shù)”的圖形如圖1所示,其數(shù)學(xué)公式是:
圖1 階躍函數(shù)
(4) 利用免疫算法獲得BPNN的各層權(quán)系數(shù)和閾值的初值
BPNN一次學(xué)習(xí)過程由輸入數(shù)據(jù)的正向傳播和誤差的反向傳播兩個(gè)子過程組成。利用梯度法修正BPNN權(quán)值和閾值,使BPNN輸出誤差平方和最小。該算法要求首先對(duì)BPNN權(quán)值和閾值設(shè)置小的初值。一般情況下,BPNN的權(quán)值和閾值是隨機(jī)產(chǎn)生,根據(jù)這些隨機(jī)產(chǎn)生的權(quán)值和閾值的初始值,訓(xùn)練BPNN所得的解并不一定是全局的最精確解,所產(chǎn)生的BPNN用于識(shí)別水的來源也就有較大的誤差。
圖2 BPNN總誤差E(x)是參數(shù)x的多極值函數(shù)
如圖2所示,反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)的總誤差E(x)是參數(shù)(BPNN的權(quán)值和閾值)x的多極值函數(shù)。當(dāng)總誤差E(x)有多個(gè)局部極小點(diǎn)時(shí),初始的權(quán)值和閾值x選擇不當(dāng)會(huì)使BPNN網(wǎng)絡(luò)收斂于局部極小點(diǎn),而不是全局最小點(diǎn)。如圖2所示,如果BPNN的初值選在N點(diǎn),按BPNN使用的梯度法,只能收斂于最近的極小點(diǎn)T2min,而不會(huì)收斂于全局最小點(diǎn)T1min(精確解)。因此,權(quán)值和閾值的初始值x的選取,對(duì)BPNN求得精確解的結(jié)果影響很大。本文借助基因算法求出BPNN的全局最優(yōu)解(T1min點(diǎn))的近似值(M點(diǎn))后,再將其作為梯度法的初始值,就可以求出BPNN的全局最優(yōu)解(T1min點(diǎn))。
免疫算法是最近幾年受生物免疫系統(tǒng)的啟示而設(shè)計(jì)出來的新型算法。免疫算法本質(zhì)上是一種對(duì)多峰值函數(shù)進(jìn)行搜索及全局尋優(yōu)的新型算法。它具有大規(guī)模并行信息處理能力、強(qiáng)大的學(xué)習(xí)能力、記憶能力、識(shí)別能力、自適應(yīng)性和魯棒性、自組織能力和保持多樣性的能力。在免疫算法中,被求解的問題視為抗原,即抗原對(duì)應(yīng)著目標(biāo)函數(shù)和各種約束條件,抗體則對(duì)應(yīng)于問題的解,即抗體對(duì)應(yīng)著優(yōu)化解,抗體與抗原之間的親和度對(duì)應(yīng)著解與目標(biāo)函數(shù)的匹配。
免疫算法能求得全局最優(yōu)解的原因主要是由選擇和交叉賦予的,而變異則保證了算法能搜索到問題解空間的每一點(diǎn)。這是因?yàn)樽儺惖哪且晃皇请S機(jī)選取的,有可能使變異后的結(jié)果和原值差別很大,例如,對(duì)圖2而言,反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)某一個(gè)閾值用二進(jìn)制表示為11100001(相當(dāng)于N點(diǎn)),當(dāng)它變?yōu)?0011101(相當(dāng)于M點(diǎn))時(shí),則更靠近全局最優(yōu)、最精確解(T1min點(diǎn))。
在免疫算法的交叉運(yùn)算中,交叉的位是隨機(jī)的,這樣也可以使權(quán)值和閾值發(fā)生較大變化。
總之,免疫算法的變異和交叉運(yùn)算是取得全局最優(yōu)解的基礎(chǔ),而選擇運(yùn)算則保留了想要的最優(yōu)解,淘汰了那些不想要的解,從而保證了下一代比上一代在整體上(平均值)更優(yōu)秀。
但是,正是由于免疫算法的變異和交叉運(yùn)算是隨機(jī)的,使得它不是一個(gè)穩(wěn)鍵的求全局最優(yōu)解的方法,一般求不到全局最優(yōu)解的精確解(T1min點(diǎn)),只能是近似解(相當(dāng)于M點(diǎn))。梯度法是穩(wěn)鍵的,會(huì)逐步接近精確解(T1min點(diǎn))。
免疫算法和BPNN使用的梯度法的組合可較快的求得全局最優(yōu)解的精確解(T1min點(diǎn)),例如,在圖2中,從N點(diǎn)出發(fā),用免疫算法求得M點(diǎn),然后,再從M點(diǎn)出發(fā),用梯度法求得全局最優(yōu)解的精確解(T1min點(diǎn))。
(5) 訓(xùn)練BPNN
訓(xùn)練BPNN的目的是確定BPNN各層的權(quán)系數(shù)(權(quán)重)和閾值。
本文對(duì)所研究的礦區(qū)礦井的突水來源——砂巖水、奧灰水、太灰水、老空水和地面泉水等5大類水源各取10個(gè)樣本,共計(jì)50個(gè)樣本,即,模式樣本,用以訓(xùn)練BPNN,即,“學(xué)習(xí)”。
訓(xùn)練BPNN的過程,即,BPNN的學(xué)習(xí)過程,就是通過不斷地向網(wǎng)絡(luò)輸入一些模式樣本,網(wǎng)絡(luò)遵循一定的學(xué)習(xí)規(guī)則,即算法,來不斷地調(diào)整網(wǎng)絡(luò)的各層權(quán)重,使網(wǎng)絡(luò)的輸人和輸出以一定精度向給定的樣本模式逼近,例如,當(dāng)輸入奧灰水指標(biāo)值時(shí),BPNN輸出應(yīng)當(dāng)為110,110代表奧灰水。學(xué)習(xí)方法可以分為兩種:一種為有監(jiān)督學(xué)習(xí)或稱有教師學(xué)習(xí);另一種為無監(jiān)督學(xué)習(xí)或稱無教師學(xué)習(xí)。本論文采用有監(jiān)督學(xué)習(xí)的方式。依據(jù)權(quán)值調(diào)整的方式,學(xué)習(xí)又可以分為離線學(xué)習(xí)和在線學(xué)習(xí)兩種。本論文采用離線學(xué)習(xí)方式。
本文選擇的訓(xùn)練BPNN的樣本集包含50個(gè)樣本,以此來計(jì)算相對(duì)于此樣本集的誤差。如果各層的梯度已知,便可按照學(xué)習(xí)規(guī)則,更新連接權(quán)值和閾值,直至算法收斂。本論文中規(guī)定的算法收斂標(biāo)準(zhǔn)是當(dāng)BPNN的輸入分別為砂巖水、奧灰水、太灰水、老空水和地面泉水等5大類水源的指標(biāo)值時(shí),BPNN的輸出也分別對(duì)應(yīng)著砂巖水、奧灰水、太灰水、老空水和地面泉水。
(6) 用訓(xùn)練好的神經(jīng)元網(wǎng)絡(luò)識(shí)別未知水源
通過上述方法, BPNN各層的權(quán)系數(shù)(權(quán)重)和閾值被確定好后,這樣的BPNN就具有了識(shí)別判斷水的來源(即,判定水的類型)的功能。接著就用訓(xùn)練好的BPNN識(shí)別待判定的水樣數(shù)據(jù)。按照前面的約定,當(dāng)把待判定的水樣數(shù)據(jù)輸入訓(xùn)練好的BPNN后,BPNN輸出為“111”,則,待判定的水樣數(shù)據(jù)是“砂巖水”。其余的,依次類推。
識(shí)別結(jié)果見下面的“實(shí)驗(yàn)結(jié)果與討論” 。
本文用潞安集團(tuán)所屬煤礦區(qū)的礦井和鉆孔水樣,利用在地面對(duì)其水質(zhì)化驗(yàn)的指標(biāo)判斷水源。這些礦區(qū)的礦井水的來源主要分為5大類:砂巖水、奧灰水、太灰水、老空水,地面泉水等。表1給出了用本文研究的方法識(shí)別這些礦區(qū)的礦井水的來源的結(jié)果[5,6,7,8,9]。
表1 用本文研究的方法識(shí)別水害水源的結(jié)果比較
表2 用本文研究的方法識(shí)別水害水源的結(jié)果和部分?jǐn)?shù)據(jù)
由表1和表2可以看出幾種不同的方法對(duì)水害水源的識(shí)別正確率是不同的。運(yùn)用本文研究的方法對(duì)礦井水的來源的正確識(shí)別率是最高的,從而證明本文研究的方法是有效的而且是可行的。
為了提高識(shí)別礦山水害水源(即,判定水的類型)的正確率,針對(duì)識(shí)別礦山水害水源的特點(diǎn),利用免疫算法設(shè)計(jì)并優(yōu)化了反向傳播神經(jīng)元網(wǎng)絡(luò)(BPNN)的結(jié)構(gòu)和參數(shù),借助建立的礦山水害水源數(shù)據(jù)庫,訓(xùn)練BPNN,獲得BPNN各層的權(quán)系數(shù)(權(quán)重)和閾值,使其適合識(shí)別礦山水害水源。首先建立礦區(qū)水源類型庫;然后,構(gòu)建合理的BPNN網(wǎng)絡(luò),設(shè)置其結(jié)構(gòu)參數(shù),對(duì)輸入數(shù)據(jù)進(jìn)行合理處理,以便適合BPNN的要求,對(duì)輸出結(jié)果賦予合理的實(shí)際意義;利用免疫算法獲得BPNN的各層權(quán)系數(shù)和閾值的初值,用該初值訓(xùn)練BPNN,以便獲得該BPNN的各層權(quán)系數(shù)和閾值;檢驗(yàn)訓(xùn)練好的BPNN性能;最后,用訓(xùn)練好的BPNN識(shí)別待判定的水源是哪一種類型的水源,判定水源的危害程度,為進(jìn)一步防治水害提供參考依據(jù),為煤礦安全生產(chǎn)提供保障。對(duì)生產(chǎn)單位提供的多個(gè)樣品的水質(zhì)化驗(yàn)分析的具有多個(gè)指標(biāo)的數(shù)據(jù)進(jìn)行分類識(shí)別。實(shí)驗(yàn)和潞安集團(tuán)所屬煤礦區(qū)的礦井和鉆孔水樣檢驗(yàn)結(jié)果說明用該方法識(shí)別礦井水的水源(即,判定水的類型)的準(zhǔn)確率可達(dá)到93%,同時(shí)也說明本文研究的方法是有效的而且是可行的。
[1] 劉峰. 礦井水害水源的水文地球化學(xué)探測(cè)技術(shù)[J].煤田地質(zhì)與勘探,2007,35(4):20-23.
[2] 鄭綱.模糊聚類分析法預(yù)測(cè)頂板砂巖含水層突水點(diǎn)及突水量[J].煤礦安全, 2004, 35(1): 24-25.
[3] 高衛(wèi)東,何元東,李新社.水化學(xué)法在礦井突水水源判別中的應(yīng)用[J].礦業(yè)安全與環(huán)保, 2011, 28(5): 44-45.
[4] 石磊,徐樓英.基于水化學(xué)特征的聚類分析對(duì)礦井突水水源判別[J].煤炭科學(xué)技術(shù),2010(3):97-100.
[5] 周健,史秀志,王懷勇.礦井突水水源識(shí)別的距離判別分析模型[J].煤炭學(xué)報(bào),2010,35(2):278-282.
[6] 董春江,宋三勝. 判別分析方法在蘆嶺礦井出水水源判別中的應(yīng)用[J].礦業(yè)科學(xué)技術(shù),2000(3):1-4.
[7] 楊本水,王從書.祁東煤礦突水災(zāi)害成因分析[J].煤炭科學(xué)技術(shù),2013(31):41-43.
[8] 張用泰,姜在炳.礦井突水水源類型判別模型及其系統(tǒng)實(shí)現(xiàn)[J].煤田地質(zhì)與勘探,1999,31(3):278-282.
[9] 劉偉稻,等.用層次分析——模糊評(píng)判進(jìn)行底板突水安全性評(píng)價(jià)[J].煤炭學(xué)報(bào),2000(25):278-282.
Research on Relative Technologies of Automatic Recognition of Water Sources Basedon Back Propagation Neural Network Improved by Immune Algorithm
E Shu-Fang1, LIU Ning-ning1,YU Sheng-chen2, SHI Qiang3
(1.XingtaiCollegeofHebei,Xingtai, 054000,China;2.CollegeofComputer,NorthChinaInstituteofScienceandTechnology,Yanjiao, 101601,China; 3.HighRiverEnergyCo.Ltd.,Changzhi, 047100,China)
In order to improve the recognition correct rate of flood water(that is,recognition correct rate of type of water),the structure and the weight coefficient (weight) and threshold of each layer of back-propagation neural network(BPNN) are designed and optimized with Immune Algorithm. The BPNN is trained, to get the optimal weight coefficient (weight) and threshold of each layer of BPNN. Finally, the trained BPNN is used to identify the type of water source to be judged, and the degree of water hazard is determined. Lu'an Group coal mine and drilling water and experimental results show that the method is feasible and efficient, and the detection right rate of flood waters was above 93%.
Headstream recognition; Mine water-bursting ; BPNN; Immune Algorithm
2016-11-06
國(guó)家自然科學(xué)基金(51274100),中央高?;究蒲袠I(yè)務(wù)費(fèi)資助(JSJ1207B , 3142015103)
阿淑芳(1979-),女,河北邢臺(tái)人,碩士,邢臺(tái)學(xué)院講師,研究方向:數(shù)學(xué)應(yīng)用研究、人工智能。E-mail:yusc5291@sina.com
TD745+.21
A
1672-7169(2017)01-0034-06