田曉紅, 何新衛(wèi)
(1.陜西能源職業(yè)技術(shù)學(xué)院, 煤炭與化工產(chǎn)業(yè)學(xué)院, 陜西, 咸陽 712000; 2.西安愛生技術(shù)集團(tuán)公司, 陜西, 西安 710065)
在我國(guó)甚至世界范圍中,煤炭等礦藏都是至關(guān)重要的礦物質(zhì)資源,在國(guó)家發(fā)展經(jīng)濟(jì)的過程中發(fā)揮著重要的促進(jìn)作用[1]。但是煤礦深埋地底,在挖掘開采過程中會(huì)遇到各種阻力,而且也存在復(fù)雜的安全隱患。煤礦挖掘的大部分生產(chǎn)工作都存在潛在安全風(fēng)險(xiǎn),一旦危險(xiǎn)爆發(fā),會(huì)造成極大經(jīng)濟(jì)損失,煤礦行業(yè)本身就是安全隱患較高的行業(yè),許多影響因素都會(huì)干擾煤礦工程的安全生產(chǎn)[2-4]。影響煤礦企業(yè)安全生產(chǎn)的因素包括設(shè)備、環(huán)境、人員、管理等。設(shè)備因素指煤礦企業(yè)沒有依照國(guó)家標(biāo)準(zhǔn)購(gòu)買規(guī)定的設(shè)備,同時(shí)沒有定期維護(hù),設(shè)備無法正常運(yùn)行,設(shè)備空間無法滿足正常作業(yè);環(huán)境因素指煤礦礦井周邊環(huán)境,包含巖石層、粉塵、地質(zhì)條件隱患等;人員因素指工作人員不安全操作行為,或者不符合規(guī)范進(jìn)行工作,例如酒后、帶病工作等,也存在無證上崗、未經(jīng)培訓(xùn)等情況;管理因素主要指職工教育培訓(xùn)不足、制度不合理等[5-7]。
大數(shù)據(jù)主要指有限時(shí)間范圍中使用常規(guī)軟件捕捉、處理、管理數(shù)據(jù)集合,使用新處理模式實(shí)現(xiàn)更強(qiáng)大的洞察發(fā)現(xiàn)力、更強(qiáng)的決策力、高效流程優(yōu)化能力等情況下多樣化、海量、高增長(zhǎng)率的信息資產(chǎn)。近年來,大數(shù)據(jù)與云計(jì)算技術(shù)緊密結(jié)合,發(fā)揮重要影響力。移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等新興計(jì)算形態(tài)助力大數(shù)據(jù)革命,讓大數(shù)據(jù)發(fā)揮更大的影響力[8]。聚類分析是把抽象對(duì)象或者物理內(nèi)容集合分組成的根據(jù)類似對(duì)象組合而成的數(shù)個(gè)分類分析過程。大數(shù)據(jù)聚類是人類一種重要行為,其目標(biāo)就是在相似的基礎(chǔ)上對(duì)大數(shù)據(jù)分類[9]。聚類從多個(gè)領(lǐng)域發(fā)展而來,來源包含計(jì)算機(jī)科學(xué)、數(shù)學(xué)、生物學(xué)、統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)學(xué)。在不同的應(yīng)用領(lǐng)域均飛速發(fā)展大數(shù)據(jù)聚類技術(shù),使用聚類描述大數(shù)據(jù),對(duì)不同數(shù)據(jù)之間的相似性實(shí)行衡量,把數(shù)據(jù)源分類到不同的簇中,實(shí)現(xiàn)大數(shù)據(jù)的歸類分析。
對(duì)于煤礦安全風(fēng)險(xiǎn)評(píng)估與預(yù)警,有學(xué)者[10]提出煤礦安全隱患風(fēng)險(xiǎn)評(píng)價(jià)研究方法,綜合評(píng)價(jià)研究區(qū)域的隱患風(fēng)險(xiǎn),計(jì)算得出綜合隱患風(fēng)險(xiǎn)值,與區(qū)域?qū)嶋H情況設(shè)定預(yù)警等級(jí),評(píng)估煤礦隱患和風(fēng)險(xiǎn)趨勢(shì),但該方法在數(shù)據(jù)運(yùn)算時(shí)間上存在一定欠缺,不能實(shí)現(xiàn)良好的效率;還有學(xué)者[11]提出基于AHP和模糊數(shù)學(xué)的區(qū)域煤礦安全風(fēng)險(xiǎn)評(píng)價(jià)方法,該方法通過層次分析法評(píng)價(jià)煤礦區(qū)域安全情況,但是在預(yù)警方面的工作不夠完善,還需要進(jìn)一步改善。
本文將大數(shù)據(jù)技術(shù)作為基礎(chǔ),利用聚類算法獲得指標(biāo)體系,研究煤礦安全風(fēng)險(xiǎn)智能評(píng)價(jià)和預(yù)警。
在評(píng)價(jià)和預(yù)警煤礦安全風(fēng)險(xiǎn)之前,本文使用大數(shù)據(jù)聚類方法確定評(píng)價(jià)指標(biāo)。運(yùn)用離散型時(shí)間序列分析方法建立多維離散數(shù)據(jù)信息流模型,提取多維離散數(shù)據(jù)信息流時(shí)延尺度特征值,將這些時(shí)延尺度特征值作為多維離散數(shù)據(jù)目標(biāo)函數(shù),同時(shí)對(duì)該目標(biāo)函數(shù)求解,獲得最優(yōu)聚類中心[12],具體流程如下。
使用并統(tǒng)計(jì)大數(shù)據(jù)流的早期階段,建立多維離散數(shù)據(jù)變量時(shí)間序列{xn},N表示該時(shí)間序列的樣本長(zhǎng)度。樣本數(shù)據(jù)流分類特征屬性設(shè)定為X和Y,為實(shí)現(xiàn)數(shù)據(jù)映射處理,樣本數(shù)據(jù)使用空間重構(gòu)分析方法實(shí)行分析,選取最優(yōu)延遲和最小漸入維數(shù)τ和m,假如數(shù)據(jù)特征平均速度得到滿足,使用式(1)表示多維離散數(shù)據(jù)信息流模型:
xn=x(t0+nΔt)=h[z(t0+nΔt)]+wn
(1)
式中,t0、z與wn分別表示聚類中心檢索、時(shí)延尺度特征和時(shí)延尺度,h代表多維離散數(shù)據(jù)時(shí)間序列各單獨(dú)樣本相似特征向量。
數(shù)據(jù)離散性時(shí)間序列特征通過計(jì)算多維數(shù)據(jù)關(guān)聯(lián)度表示,數(shù)據(jù)離散性時(shí)間序列特征分布軌跡通過重構(gòu)相空間獲得:
X=[x(t0),x(t0+Δt),…,x(t0+(K-1)Δt)]
(2)
式中,x(t0)與J分別表示樣本采集時(shí)間和多維數(shù)據(jù)相關(guān)系數(shù),m與Δt分別表示嵌入維數(shù)和抽樣時(shí)間間隔,K=N-(m-1)J代表大數(shù)據(jù)時(shí)間序列分類最大屬性。多維離散數(shù)據(jù)特征時(shí)間序列向量模型通過數(shù)據(jù)投射法獲得:
{x(t0+iΔt)},i=0,1,2,…,N-1
(3)
使用式(4)表示特征空間多維離散數(shù)據(jù)矢量:
X=(xn,xn-τ,…,xn-(m-1)τ)
(4)
式中,τ代表多維離散數(shù)據(jù)時(shí)間延遲。
時(shí)延尺度輸入特征是上文中構(gòu)建的大數(shù)據(jù)流,建立對(duì)應(yīng)數(shù)據(jù)目標(biāo)函數(shù)時(shí)依據(jù)特征值屬性,式(5)表示大數(shù)據(jù)屬性集的分布模型:
(5)
式中,ai與bi分別表示數(shù)據(jù)采樣幅值和大數(shù)據(jù)最優(yōu)分類屬性;a0和xn-1分別表示初始數(shù)據(jù)采樣幅值和具有相同數(shù)量時(shí)間序列,搜索時(shí)使用模糊C均值聚類算法,由此得出有限數(shù)據(jù)集向量:
X={x1,x2,…,xn}∈R
(6)
式中,R表示大數(shù)據(jù)屬性集的隨機(jī)變量。
經(jīng)屬性集分類,獲得多維離散數(shù)據(jù)流數(shù)據(jù)樣本數(shù)量n。使用式(7)表示樣本xi(i=1,2,…n)的多維離散數(shù)據(jù)信息增益矢量:
xi=(xi1,xi2,…,xin)T
(7)
在數(shù)據(jù)集內(nèi)選取k個(gè)實(shí)例,獲得多維離散數(shù)據(jù)目標(biāo)函數(shù)最優(yōu)聚類中心:
(8)
式中,μik表示聚類中心非劣解,c表示常數(shù),dik與djk均表示樣本大數(shù)。
1.2.1 煤礦安全風(fēng)險(xiǎn)指標(biāo)體系
根據(jù)上文大數(shù)據(jù)聚類后的計(jì)算結(jié)果,結(jié)合分析并判斷煤礦危險(xiǎn)源,根據(jù)專家評(píng)價(jià)和相關(guān)參考文獻(xiàn),遵循可操作性、完整性、科學(xué)性等原則,從5個(gè)方面分析煤礦安全風(fēng)險(xiǎn)影響因素,建立風(fēng)險(xiǎn)預(yù)警指標(biāo)體系,詳見圖1。本文指標(biāo)體系中,第一層為目標(biāo)層,第二層為一級(jí)指標(biāo),包含人員因素、設(shè)備因素、環(huán)境因素、管理因素、信息因素等5個(gè)因素。各因素下又劃分出18個(gè)二級(jí)指標(biāo),針對(duì)這些指標(biāo)體系,開展以下分析。
圖1 煤礦安全風(fēng)險(xiǎn)智能評(píng)價(jià)指標(biāo)體系
1.2.2 煤礦安全風(fēng)險(xiǎn)可拓模型
通過可拓論,建立煤礦安全風(fēng)險(xiǎn)智能評(píng)價(jià)和預(yù)警的節(jié)域矩陣、典域矩陣、待評(píng)物元矩陣;基于此,計(jì)算并分析煤礦安全風(fēng)險(xiǎn)可拓模型關(guān)聯(lián)函數(shù)值和關(guān)聯(lián)度,以此評(píng)定煤礦安全風(fēng)險(xiǎn)等級(jí)[13]。根據(jù)行業(yè)標(biāo)準(zhǔn)和相關(guān)規(guī)章制度煤礦安全風(fēng)險(xiǎn)等級(jí)分為5個(gè)等級(jí),分別為1級(jí)(輕度預(yù)警、極弱)、2級(jí)(低度預(yù)警、弱)、3級(jí)(中度預(yù)警、一般)、4級(jí)(重度預(yù)警、高)、5級(jí)(巨度預(yù)警、極高)。
(1) 預(yù)警指標(biāo)物元確定。假設(shè)將煤礦安全風(fēng)險(xiǎn)預(yù)警等級(jí)和安全風(fēng)險(xiǎn)預(yù)警指標(biāo)分別設(shè)定為m個(gè)和n個(gè),使用式(9)表示經(jīng)典域:
(9)
式中,Nj(j=1,2,…,m)和Nj(j=1,2,…,n)分別表示風(fēng)險(xiǎn)等級(jí)和預(yù)警指標(biāo),vjn代表第n個(gè)預(yù)警指標(biāo)在第j個(gè)等級(jí)內(nèi)的量值區(qū)間,ajn代表預(yù)警指標(biāo)量值和風(fēng)險(xiǎn)等級(jí)區(qū)間最小值,bjn代表預(yù)警指標(biāo)量值和風(fēng)險(xiǎn)等級(jí)區(qū)間最大值[14]。
設(shè)p為風(fēng)險(xiǎn)等級(jí),使用式(10)表示節(jié)域:
(10)
式中,p與Np分別表示全體風(fēng)險(xiǎn)等級(jí)和風(fēng)險(xiǎn)等級(jí)的預(yù)警對(duì)象;vpn代表p有關(guān)預(yù)警指標(biāo)特征cn的取值范圍,同時(shí)也表示節(jié)域。
設(shè)P表示預(yù)警對(duì)象,則有式(11)表示建立的待評(píng)價(jià)物元:
(11)
式中,vn為cn的實(shí)際量化指標(biāo)值。
(2) 預(yù)警指標(biāo)關(guān)聯(lián)度計(jì)算。使用式(11)表示預(yù)警指標(biāo)關(guān)聯(lián)函數(shù):
(12)
式中,ρ(vi,vji)與ρ(vi,vpi)分別表示有限區(qū)間vji到點(diǎn)vi的距離和有限區(qū)間vpi到點(diǎn)vi的距離,vji與vpi分別表示經(jīng)典域和節(jié)域的量值區(qū)間,vi表示待評(píng)物元的量化指標(biāo)值。使用式(13)定義風(fēng)險(xiǎn)等級(jí)j和預(yù)警指標(biāo)i的關(guān)聯(lián)函數(shù)kj(vi):
(13)
(3)指標(biāo)權(quán)重計(jì)算。權(quán)重計(jì)算運(yùn)用熵權(quán)法,設(shè)kj(vi)與rji相等,建立矩陣:
R=(rji)m*n,(j=1,2,…,m;i=1,2,…,n)
(14)
使用式(15)定義預(yù)警指標(biāo)熵Hi:
(15)
通過式(16)定義預(yù)警指標(biāo)權(quán)重:
(16)
(4)綜合關(guān)聯(lián)度和風(fēng)險(xiǎn)等級(jí)的確定。利用式(17)定義等級(jí)j和預(yù)警對(duì)象p的綜合關(guān)聯(lián)度Kj(p):
(17)
每?jī)蓚€(gè)事物間的關(guān)聯(lián)程度使用關(guān)聯(lián)度表征,相關(guān)性的優(yōu)劣由關(guān)聯(lián)度值決定,值越接近于1說明相關(guān)性越好[15],根據(jù)關(guān)聯(lián)度最大原則判斷預(yù)警對(duì)象的風(fēng)險(xiǎn)等級(jí):
Kj0(p)=maxKj(p)
(18)
以某市煤礦工程作為研究對(duì)象用于驗(yàn)證本文方法性能,該工程總投資16億元,礦井產(chǎn)量每年190萬噸,于2015年6月開挖井筒。煤層埋藏較淺,傾角呈現(xiàn)平緩狀態(tài),主要包含中厚煤層,局部為厚煤層,總體煤層結(jié)構(gòu)簡(jiǎn)單,存儲(chǔ)量穩(wěn)定,地質(zhì)結(jié)構(gòu)和水文結(jié)構(gòu)均屬中等復(fù)雜,使用本文方法智能評(píng)價(jià)并預(yù)警該區(qū)域煤礦安全風(fēng)險(xiǎn)。為獲得參照結(jié)果,邀請(qǐng)部分專家使用問卷調(diào)查法對(duì)相關(guān)指標(biāo)實(shí)行評(píng)價(jià),得出真實(shí)評(píng)價(jià)結(jié)果。為使結(jié)果具有對(duì)比性,同時(shí)使用煤礦安全隱患風(fēng)險(xiǎn)評(píng)價(jià)研究方法[10](下文簡(jiǎn)稱對(duì)比方法1)和基于AHP和模糊數(shù)學(xué)的區(qū)域煤礦安全風(fēng)險(xiǎn)評(píng)價(jià)方法[11](下文簡(jiǎn)稱對(duì)比方法2),評(píng)價(jià)研究區(qū)域的煤礦安全風(fēng)險(xiǎn)。
分析3種方法在海量煤礦安全信息下,數(shù)據(jù)聚類計(jì)算所耗費(fèi)之間,統(tǒng)計(jì)結(jié)果見圖2。從圖2能夠看出,隨著數(shù)據(jù)節(jié)點(diǎn)的增加3種方法的計(jì)算時(shí)間均有不同程度上升,2種對(duì)比方法的上升速度較快,當(dāng)數(shù)據(jù)節(jié)點(diǎn)個(gè)數(shù)達(dá)到1 100個(gè)時(shí),2種對(duì)比方法的計(jì)算時(shí)間分別達(dá)到5 min和6 min,而本文方法此時(shí)的計(jì)算時(shí)間仍舊不超過2 min??傮w來看,本文方法在計(jì)算數(shù)據(jù)時(shí)技術(shù)數(shù)據(jù)節(jié)點(diǎn)增加,計(jì)算時(shí)間始終保持在一個(gè)平穩(wěn)的趨勢(shì)中,由此可以看出,本文方法在計(jì)算大數(shù)據(jù)時(shí)具有較高的計(jì)算效率。
圖2 聚類時(shí)間對(duì)比結(jié)果
本文方法指標(biāo)體系中包含5種一級(jí)指標(biāo),每種指標(biāo)數(shù)據(jù)樣本不同,通過專家問卷調(diào)查結(jié)果統(tǒng)計(jì)實(shí)際大數(shù)據(jù)分類結(jié)果,對(duì)比3種方法在數(shù)據(jù)分類時(shí)聚類結(jié)果與實(shí)際分類結(jié)果的擬合度,結(jié)果見圖3。從圖3能夠看出,本文方法的聚類結(jié)果與真實(shí)結(jié)果最為接近,證明本文方法聚類結(jié)果比較理想。
圖3 擬合度對(duì)比結(jié)果
以二級(jí)指標(biāo)中的“月平均培訓(xùn)時(shí)間”為例使用本文方法評(píng)價(jià)該指標(biāo)和風(fēng)險(xiǎn)等級(jí)之間的關(guān)聯(lián)度為(-0.382 9,-0.166 4,0.461 3,-0.194 4,-0.398 6),按照關(guān)聯(lián)度最大原則,風(fēng)險(xiǎn)等級(jí)和該指標(biāo)的最大關(guān)聯(lián)度是0.461 3,風(fēng)險(xiǎn)等級(jí)為三級(jí),劃定為中度預(yù)警。通過計(jì)算獲得各項(xiàng)一級(jí)指標(biāo)的權(quán)重為[0.161 1, 0.418 7,0.186 8,0.211 0,0.033 5],從權(quán)重結(jié)果中能夠看出,設(shè)備因素的權(quán)重值最大,信息因素的權(quán)重值最小,由此可以證明設(shè)備因素對(duì)煤礦安全影響最大。使用本文方法計(jì)算得出目標(biāo)層、一級(jí)指標(biāo)和風(fēng)險(xiǎn)等級(jí)之間的關(guān)聯(lián)度,按照關(guān)聯(lián)度最大原則獲得安全風(fēng)險(xiǎn)預(yù)警等級(jí)和各個(gè)風(fēng)險(xiǎn)評(píng)估物元綜合關(guān)聯(lián)度,結(jié)果見表1。
表1 風(fēng)險(xiǎn)等級(jí)與關(guān)聯(lián)度結(jié)果
分析表1可知,設(shè)備因素的安全風(fēng)險(xiǎn)等級(jí)為2級(jí)屬于低警狀態(tài),風(fēng)險(xiǎn)較低,而信息元素安全風(fēng)險(xiǎn)等級(jí)為4級(jí),屬于重度預(yù)警,具有較高風(fēng)險(xiǎn),在實(shí)際開展冶礦工程時(shí)需要著重注意,其余指標(biāo)均為3級(jí)風(fēng)險(xiǎn)等級(jí),可以劃分為中度預(yù)警,屬于一般預(yù)警,在冶礦工程中需要適當(dāng)調(diào)整。
綜合實(shí)驗(yàn)結(jié)果,該研究區(qū)域的煤礦工程存在安全隱患,前期開展過程中,開采深度逐漸加深,粉塵、水患等問題都比較嚴(yán)重,隨著進(jìn)度的開展,各種問題得到妥善解決。經(jīng)專家統(tǒng)計(jì)評(píng)分,該煤礦的安全等級(jí)為3級(jí),與本文研究結(jié)果基本一致,綜合各實(shí)驗(yàn)結(jié)果,本文方法在智能評(píng)估與預(yù)警煤礦安全風(fēng)險(xiǎn)時(shí)具有比較準(zhǔn)確的評(píng)價(jià)結(jié)果,定量評(píng)估結(jié)果較好。
本文使用大數(shù)據(jù)技術(shù),通過聚類計(jì)算得出智能評(píng)價(jià)和預(yù)警的指標(biāo)體系,從煤礦風(fēng)險(xiǎn)的5個(gè)影響因素中共選取18個(gè)預(yù)警指標(biāo)展開風(fēng)險(xiǎn)評(píng)估,使用可拓理論構(gòu)建模型,利用熵權(quán)法確定指標(biāo)權(quán)重,由此構(gòu)建高精準(zhǔn)性的煤礦風(fēng)險(xiǎn)智能評(píng)估和預(yù)警模型。通過綜合關(guān)聯(lián)函數(shù)計(jì)算獲得各影響因素的風(fēng)險(xiǎn)預(yù)警等級(jí),保持在3級(jí)以內(nèi),風(fēng)險(xiǎn)情況可接受但仍需進(jìn)一步完善,具有較高參考價(jià)值。