倪景峰,樂曉瑞,,常立峰,鄧立軍
(1.遼寧工程技術(shù)大學(xué) 安全科學(xué)與工程學(xué)院,遼寧 葫蘆島 125105; 2.遼寧工程技術(shù)大學(xué) 礦山熱動力災(zāi)害與防治教育部重點實驗室,遼寧 葫蘆島 125105; 3.山西瑞通路橋新技術(shù)有限公司,山西 太原 030000)
復(fù)雜通風(fēng)網(wǎng)絡(luò)故障診斷和風(fēng)速傳感器優(yōu)化布置是實現(xiàn)智慧礦山的關(guān)鍵技術(shù)之一,礦井通風(fēng)仿真系統(tǒng)的應(yīng)用與人工智能的蓬勃發(fā)展,使得礦井通風(fēng)智能故障診斷的實現(xiàn)成為可能。故障診斷系統(tǒng)的應(yīng)用具有較大的社會價值和經(jīng)濟(jì)效益,但目前故障診斷系統(tǒng)的研究較少[1-2]。
決策樹由心理學(xué)家和計算機(jī)科學(xué)家E.B.Hunt于1962年提出,其運行速度快、魯棒性好、易擴(kuò)展到大型數(shù)據(jù)庫中、可嵌入式特征選擇等優(yōu)點使其廣泛應(yīng)用于醫(yī)療診斷、股票預(yù)測和目標(biāo)檢測等領(lǐng)域[3-4]。決策樹學(xué)習(xí)算法不僅可以構(gòu)建分類和回歸故障診斷模型,還可以進(jìn)行嵌入式特征選擇,二者在同一過程中完成,是解決礦井通風(fēng)故障診斷與風(fēng)速傳感器優(yōu)化布置的最優(yōu)解決方案。
在礦井通風(fēng)故障智能診斷方面,劉劍等[5]將礦井風(fēng)門失效、巷道冒落變形、巷道堵塞、巷道掘進(jìn)延伸或報廢等現(xiàn)象稱為通風(fēng)系統(tǒng)阻變型故障;郭欣[6]、姚志強(qiáng)[7]利用機(jī)器學(xué)習(xí)的方法對通風(fēng)網(wǎng)絡(luò)和管網(wǎng)進(jìn)行故障診斷,通過礦井通風(fēng)仿真系統(tǒng)建立阻變-風(fēng)量(風(fēng)壓)故障樣本,以分支編號作為分類標(biāo)簽,阻變量作為回歸值,利用支持向量機(jī)對樣本進(jìn)行訓(xùn)練和分類預(yù)測,初步實現(xiàn)礦井通風(fēng)智能診斷。
在傳感器優(yōu)化布置方面,火源探測傳感器優(yōu)化布置[8]和瓦斯傳感器無盲區(qū)優(yōu)化布置[9]等研究相對成熟,但針對故障診斷的風(fēng)速傳感器優(yōu)化布置研究較少。趙丹等[10]、潘競濤等[11]對角聯(lián)巷道傳感器位置優(yōu)化進(jìn)行研究,并在大明礦礦井通風(fēng)故障診斷系統(tǒng)中進(jìn)行實際布置實驗;劉劍等[12-13]在礦井通風(fēng)系統(tǒng)阻變型故障診斷及風(fēng)速傳感器位置優(yōu)化研究中提出 “掃帚模型”的傳感器布置方法;居銀銀[14]提出基于決策樹和特征選擇的神經(jīng)網(wǎng)絡(luò)釣魚網(wǎng)站檢測研究,通過特征選擇減少維度災(zāi)難,提高釣魚網(wǎng)站監(jiān)測能力?,F(xiàn)有的風(fēng)速傳感器優(yōu)化布置主要是通過計算巷道分支相關(guān)度來選擇傳感器布置地點,本質(zhì)是過濾式特征選擇,未將診斷模型的性能作為傳感器布置評價標(biāo)準(zhǔn),難以滿足故障診斷系統(tǒng)需要與傳感器布置相匹配的實際要求。
鑒于此,本文提出1種嵌入式風(fēng)速傳感器優(yōu)化布置方法,構(gòu)建基于決策樹的智能故障診斷系統(tǒng),并在唐安礦進(jìn)行模擬實驗,該方法的步驟如下:
1)利用IMVS構(gòu)建唐安礦礦井通風(fēng)仿真系統(tǒng),通過改變巷道分支風(fēng)阻構(gòu)建空間數(shù)據(jù)集,地理位置靠近的巷道分支產(chǎn)生的故障對通風(fēng)系統(tǒng)的影響相似。
2)對空間數(shù)據(jù)集預(yù)處理,分別確定適合回歸和分類的故障樣本集的無量綱化方式。通過比較ID3和分類與回歸樹(CART)故障診斷準(zhǔn)確率,選擇更適合的決策樹模型。
3)對決策樹進(jìn)行剪枝處理,以獲得更優(yōu)復(fù)雜度的故障診斷模型,降低泛化誤差,提高準(zhǔn)確率。
4)設(shè)置對照實驗,確定風(fēng)速傳感器最優(yōu)布置數(shù)量及布置地點,驗證布置方法的有效性。
本文為礦井通風(fēng)故障診斷提供1種新的嵌入式風(fēng)速傳感器優(yōu)化布置及智能診斷方法,并通過唐安礦驗證模型的有效性。其應(yīng)用可解決風(fēng)速傳感器布置與故障診斷模型不匹配的問題,提高模型故障診斷準(zhǔn)確率。智能診斷系統(tǒng)能夠及時發(fā)現(xiàn)隱患,避免故障可能帶來更大的損失,提高煤礦智能化水平。
礦井通風(fēng)智能故障診斷系統(tǒng)主要由礦井通風(fēng)故障樣本集、故障位置分類判斷模型、故障量回歸預(yù)測模型及風(fēng)速傳感器優(yōu)化布置4個方面構(gòu)成。
數(shù)據(jù)是故障診斷的基礎(chǔ),礦井通風(fēng)故障樣本集是由通風(fēng)網(wǎng)絡(luò)映射產(chǎn)生,具有空間自相關(guān)性[15]。保持唐安礦結(jié)構(gòu)及風(fēng)機(jī)動力不變,改變巷道分支風(fēng)阻模擬通風(fēng)網(wǎng)絡(luò)阻變型故障,利用礦井通風(fēng)仿真系統(tǒng)IMVS[16]生成“阻變地點—阻變故障量—風(fēng)量”關(guān)系的空間數(shù)據(jù)集D。
將礦井通風(fēng)空間數(shù)據(jù)集不同規(guī)格的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一規(guī)格,能夠提高模型收斂速度和提升模型準(zhǔn)確率,避免某個取值范圍較大的特征對模型計算造成影響。其主要處理方式為數(shù)據(jù)歸一化和標(biāo)準(zhǔn)化[17]。不同的模型需要獨特的數(shù)據(jù)處理方式,不能脫離模型評價數(shù)據(jù)預(yù)處理方式的好壞。數(shù)據(jù)歸一化的公式如式(1)所示:
(1)
式中:x*為樣本數(shù)據(jù)歸一化值;x為樣本數(shù)據(jù);max(x)為樣本數(shù)據(jù)最大值;min(x)為樣本數(shù)據(jù)最小值。
數(shù)據(jù)標(biāo)準(zhǔn)化的公式如式(2)所示:
(2)
式中:x′為樣本數(shù)據(jù)標(biāo)準(zhǔn)化值;μ為樣本數(shù)據(jù)均值;σ為樣本數(shù)據(jù)標(biāo)準(zhǔn)差。
在構(gòu)建礦井通風(fēng)故障診斷模型之后,還需要對模型診斷性能進(jìn)行評估。礦井通風(fēng)故障位置判斷的目標(biāo)為盡可能正確地診斷故障地點,因此需對模型使用故障診斷準(zhǔn)確率進(jìn)行度量,其計算如式(3)所示:
(3)
式中:Accuracy為故障診斷準(zhǔn)確率;M為模型正確分類樣本個數(shù);m為故障位置診斷所有樣本數(shù)。
故障量回歸預(yù)測的目標(biāo)為使預(yù)測值與真實值盡可能接近,因此使用均方誤差對模型進(jìn)行度量,如式(4)所示:
(4)
決策樹是1個有向無環(huán)圖,其用樹狀圖的結(jié)構(gòu)來呈現(xiàn)通風(fēng)網(wǎng)絡(luò)故障診斷規(guī)則,以解決故障位置分類判斷和故障量回歸預(yù)測問題[18]。礦井通風(fēng)故障診斷的決策樹模型如圖1所示。由圖1可知,1棵決策樹包含1個根結(jié)點Q1,表示監(jiān)測風(fēng)量,若干對應(yīng)測試特征的內(nèi)部結(jié)點Q2和若干對應(yīng)故障位置和故障量結(jié)果的葉結(jié)點ei,樹杈表示對特征的1次劃分;v表示決策樹劃分時選擇的風(fēng)量。
圖1 礦井通風(fēng)故障診斷的決策樹模型Fig.1 Decision tree model for fault diagnosis of mine ventilation
風(fēng)速傳感器優(yōu)化布置的核心是從所有巷道分支中確定最適合布置傳感器的地點和最優(yōu)布置數(shù)量,即利用最少的特征達(dá)到最優(yōu)的分類和回歸效果[19],嵌入式傳感器布置原理如下:
1)決策樹每次分枝均會選擇對信息熵或基尼系數(shù)影響大的特征,因此,在決策樹模型中選擇排序靠前的特征是對分類、回歸模型影響較大的特征,該特征即為傳感器布置巷道分支。
通過信息增益為準(zhǔn)則來選擇劃分特征的決策樹稱為ID3[20],空間數(shù)據(jù)集D的信息熵Ent(D)定義為式(5),Ent(D)的值越小,則數(shù)據(jù)集D的純度越高。
(5)
式中:D為空間數(shù)據(jù)集;k為1,2,…,|y|;pk為第k類樣本所占的比例。
以基尼指數(shù)作為劃分特征標(biāo)準(zhǔn)的決策樹稱為CART,Gini(D)反應(yīng)從數(shù)據(jù)集D中隨機(jī)抽取2個樣本,其類別標(biāo)記不一樣的概率,Gini(D)越小,則數(shù)據(jù)集的純度越高??臻g數(shù)據(jù)集D的純度用基尼值表示的計算如式(6)所示:
(6)
式中:K為樣本的總類別;Gini(D)為樣本集D的基尼值。
2)將選擇的巷道分支代入到模型中,權(quán)衡模型故障診斷準(zhǔn)確率與風(fēng)速傳感器數(shù)量的關(guān)系,選擇最優(yōu)布置數(shù)量。
嵌入式風(fēng)速傳感器優(yōu)化布置方法將特征選擇與故障診斷訓(xùn)練在同一個算法中進(jìn)行,有效地解決模型與特征選擇不匹配的問題[21]。風(fēng)速傳感器優(yōu)化布置不僅能夠降低監(jiān)測成本,提高傳感器利用率,還是降低數(shù)據(jù)維度、避免維度災(zāi)難重要手段。
唐安煤礦坐落于山西省高平市馬村鎮(zhèn)唐西村西,占地50萬m2,可采資源儲量約1.4億t,巷道分支數(shù)n=88,其中13處巷道分支安設(shè)通風(fēng)調(diào)節(jié)設(shè)施,原始參數(shù)情況下,風(fēng)機(jī)工況點的風(fēng)機(jī)風(fēng)量和網(wǎng)絡(luò)風(fēng)阻分別為107 m3/s,1 874 Pa,構(gòu)建唐安礦空間數(shù)據(jù)集的步驟為:
1)對唐安礦通風(fēng)系統(tǒng)進(jìn)行普查,其內(nèi)容包括記錄巷道、掘進(jìn)工作面、采煤工作面、構(gòu)筑物的參數(shù)和主要結(jié)點標(biāo)高。
2)對唐安礦礦井通風(fēng)系統(tǒng)進(jìn)行阻力測定,確定各段巷道的實際風(fēng)量、風(fēng)阻和阻力系數(shù),測量構(gòu)筑物的風(fēng)量和阻力。
3)構(gòu)建唐安礦礦井通風(fēng)仿真系統(tǒng)IMVS,并綜合調(diào)試。
4)保持通風(fēng)網(wǎng)絡(luò)結(jié)構(gòu)及風(fēng)機(jī)動力不變,通過改變巷道分支風(fēng)阻生成“阻變地點-阻變故障量-風(fēng)量”故障樣本,通過重復(fù)步驟1)~4)生成空間數(shù)據(jù)集D。
將空間數(shù)據(jù)集隨機(jī)劃分為70%的訓(xùn)練樣本和30%的測試樣本,由式(3)可計算出,數(shù)據(jù)標(biāo)準(zhǔn)化的唐安礦通風(fēng)故障位置診斷的十折交叉驗證故障診斷準(zhǔn)確率為85.58%。數(shù)據(jù)歸一化的故障位置診斷的十折交叉驗證故障診斷準(zhǔn)確率為86.3%。對于礦井通風(fēng)故障位置判斷模型,數(shù)據(jù)的歸一化處理準(zhǔn)確率優(yōu)于標(biāo)準(zhǔn)化處理。
數(shù)據(jù)歸一化的唐安礦礦井通風(fēng)故障位置判斷圖如圖2所示。實際阻變位置和預(yù)測阻變位置重合代表故障位置判斷正確。
圖2 唐安礦礦井通風(fēng)故障位置判斷模型Fig.2 Judgment model of mine ventilation fault location in Tang’an mine
唐安礦故障位置判斷的錯誤主要為鄰近巷道分支,其原因為鄰近巷道分支的發(fā)生故障對系統(tǒng)影響相似,故障診斷錯誤在一定程度上不影響故障維修人員對故障地點的判斷。
由式(4)可計算出,空間數(shù)據(jù)集歸一化的唐安礦通風(fēng)故障回歸預(yù)測十折交叉驗證的均方誤差為0.603 1。數(shù)據(jù)標(biāo)準(zhǔn)化的故障量回歸預(yù)測的十折交叉驗證均方誤差為0.286 3,空間數(shù)據(jù)集集標(biāo)準(zhǔn)化處理能明顯提高決策樹回歸準(zhǔn)確率。
空間數(shù)據(jù)集標(biāo)準(zhǔn)化的唐安礦礦井通風(fēng)巷道分支故障量回歸預(yù)測圖如圖3所示。
圖3 唐安礦礦井通風(fēng)巷道分支故障量回歸預(yù)測模型Fig.3 Regressive prediction model of branch fault quantity in mine ventilation roadway of Tang’an mine
本文使用貝爾實驗室設(shè)計的開源圖表工具graphviz對決策樹進(jìn)行可視化,以CART可視化的前2層為例對決策樹進(jìn)行解釋,如圖4所示。
圖4 唐安礦通風(fēng)網(wǎng)絡(luò)故障診斷CART前2層可視化圖Fig.4 Visualization diagram for first two layers of fault diagnosis CART on ventilation network in Tang’an mine
決策樹每個方框中包含的數(shù)據(jù)有特征劃分值qi,將結(jié)點劃分為2類;根結(jié)點的樣本數(shù)為1 253,經(jīng)過劃分將樣本分為1 186和67;決策樹將基尼系數(shù)高的特征作為根結(jié)點,該特征也是對決策樹影響最大的特征;劃分比例value,根據(jù)劃分結(jié)果class將每種分類結(jié)果按比例放置在value中。
根據(jù)式(3)計算,礦井通風(fēng)故障診斷ID3決策樹故障位置分類十折交叉驗證的平均故障診斷準(zhǔn)確率為84.9%,其故障診斷準(zhǔn)確率低于CART決策樹。
唐安礦巷道CART決策樹基尼系數(shù)最高的20條巷道分支基尼系數(shù)見表1。其中,num為基尼值排序;label為巷道分支編號;gini為基尼系數(shù);samples為樣本數(shù)。
表1 唐安礦巷道分支基尼系數(shù)Table 1 Gini coefficients of roadway branch in Tang’an mine
唐安礦通風(fēng)網(wǎng)絡(luò)風(fēng)速傳感器優(yōu)化布置圖如圖5所示,標(biāo)注Qi的巷道分支為風(fēng)速傳感器布置巷道。嵌入式風(fēng)速傳感器布置能夠在算法運行過程中自動忽略相似和冗余特征。
圖5 唐安礦通風(fēng)網(wǎng)絡(luò)風(fēng)速傳感器優(yōu)化布置Fig.5 Optimized layout of wind speed sensors in ventilation network of Tang’an Mine
風(fēng)速傳感器數(shù)量的選擇需要多次構(gòu)建決策樹模型,不斷減少特征數(shù)來權(quán)衡準(zhǔn)確率和特征數(shù)量之間的平衡。以基尼系數(shù)從大到小的順序選擇傳感器布置點,風(fēng)速傳感器布置數(shù)量與隨機(jī)布置對比如圖6所示。
圖6 唐安礦風(fēng)速傳感器布置數(shù)量優(yōu)化Fig.6 Optimization on layout number of wind speed sensors in Tang’an mine
由圖6可知,風(fēng)速傳感器的數(shù)量與故障診斷準(zhǔn)確率成正比,基尼系數(shù)大的巷道分支對準(zhǔn)確率影響較大。隨著風(fēng)速傳感器布置數(shù)量的增加,模型故障診斷準(zhǔn)確率的提升放緩。選擇基尼系數(shù)最大的15條巷道分支作為風(fēng)速傳感器布置點,根據(jù)式(3)計算其故障診斷準(zhǔn)確率為84.5%,高于隨機(jī)對照組的故障診斷準(zhǔn)確率68.2%。
決策樹學(xué)習(xí)算法會傾向于過擬合,使得模型泛化能力下降。決策樹剪枝處理能夠有效地降低模型復(fù)雜度,提升故障診斷準(zhǔn)確率。
選擇故障診斷準(zhǔn)確率更高的CART決策樹進(jìn)行剪枝處理,決策樹最大深度對準(zhǔn)確率影響關(guān)系如圖7所示。由圖7可知,當(dāng)最大深度小于45時,決策樹擬合不足,不足以刻畫模型。當(dāng)最大深度大于45時,模型過擬合,故障診斷準(zhǔn)確率下降。
圖7 決策樹最大深度剪枝效果Fig.7 Pruning effect on maximum depth of decision tree
決策樹葉結(jié)點最小樣本數(shù)min_samples_leaf與故障診斷準(zhǔn)確率關(guān)系圖如圖8所示。由圖8可知,當(dāng)葉結(jié)點最小樣本數(shù)為6時,故障診斷準(zhǔn)確率最高。
圖8 決策樹葉結(jié)點最小樣本數(shù)剪枝效果Fig.8 Pruning effect of minimum sample number for leaf node of decision tree
當(dāng)葉結(jié)點最小樣本數(shù)為6,最大深度為45時,CART決策樹泛化誤差最小,故障診斷準(zhǔn)確率最高為91.1%。
1)決策樹學(xué)習(xí)算法不僅能夠構(gòu)建礦井通風(fēng)故障位置判斷分類模型、故障量預(yù)測回歸模型,還能對嵌入式風(fēng)速傳感器優(yōu)化布置。
2)礦井通風(fēng)空間數(shù)據(jù)集由礦井通風(fēng)網(wǎng)絡(luò)映射產(chǎn)生,具有空間自相關(guān)性的特點。嵌入式特征選擇由算法本身刪除相似特征與冗余特征,解決故障診斷算法與風(fēng)速傳感器匹配度低的問題。
3)空間數(shù)據(jù)集歸一化能夠提高故障位置判斷分類模型準(zhǔn)確率,標(biāo)準(zhǔn)化能夠提高故障量預(yù)測回歸模型準(zhǔn)確率。
4)CART準(zhǔn)確率略高于ID3決策樹,決策樹剪枝處理能夠降低泛化誤差,提高模型故障診斷準(zhǔn)確率。
5)選擇基尼系數(shù)最高的15條巷道分支作為風(fēng)速傳感器布置地點,其故障診斷準(zhǔn)確率優(yōu)于隨機(jī)布置對照組。隨著風(fēng)速傳感器布置數(shù)量的增加,故障診斷準(zhǔn)確率提升放緩。
中國安全生產(chǎn)科學(xué)技術(shù)2021年2期