王亞棟,賈俊偉,譚韋君,雷 萌
(1.山西天地王坡煤業(yè)有限公司,山西 晉城 048000;2.天地(常州)自動(dòng)化有限公司,江蘇 常州 213125;3.中國(guó)礦業(yè)大學(xué) 信息與控制工程學(xué)院,江蘇 徐州 221116)
煤矸石作為煤炭開采和加工過(guò)程中產(chǎn)生的副產(chǎn)品,其含碳量較低,燃燒性能不佳。當(dāng)煤矸石混入煤炭中時(shí),會(huì)顯著降低煤炭的發(fā)熱效率[1]。因此,在煤炭被輸送至市場(chǎng)前,對(duì)煤矸石進(jìn)行有效的識(shí)別和分選至關(guān)重要[2-3]。目前,煤矸石的分選主要依賴人工揀選、濕選和干選等方法[4]。人工揀選雖具有一定的靈活性,但在追求高效率的現(xiàn)代生產(chǎn)環(huán)境下,其效率和準(zhǔn)確性均顯不足,同時(shí)高強(qiáng)度的勞動(dòng)也可能引起工人的健康問(wèn)題。濕法分選雖然在一定程度上提高了效率,但其復(fù)雜的工藝流程和大量的水資源消耗可能導(dǎo)致嚴(yán)重的環(huán)境污染。干選法主要包括破碎法、射線法和圖像識(shí)別法[5-7],其中破碎法成本較低,但普適性較差;射線法輻射性較強(qiáng),需要加裝隔離設(shè)備,設(shè)備成本較高;圖像識(shí)別法易受光照和粉塵的影響,難以達(dá)到生產(chǎn)要求。
近紅外光譜分析(NIRS)技術(shù)憑借快速、實(shí)時(shí)、無(wú)需化學(xué)試劑和對(duì)環(huán)境無(wú)害的特性,在煤炭的定性和定量分析領(lǐng)域得到了廣泛的認(rèn)可和應(yīng)用[8]。楊恩等[9]將光譜探頭安裝于采煤機(jī)上,通過(guò)分析煤巖界面的近紅外反射光譜曲線,實(shí)現(xiàn)了煤巖界面分布的快速精確探測(cè)。Yu 等[10]通過(guò)改進(jìn)線性判別分析算法,并結(jié)合近紅外光譜技術(shù)對(duì)煤產(chǎn)地進(jìn)行檢測(cè),識(shí)別準(zhǔn)確率達(dá)97.21%。Zou 等[11]基于近紅外光譜技術(shù)和改進(jìn)的U 型網(wǎng)絡(luò),挖掘多個(gè)煤質(zhì)工業(yè)參數(shù)的關(guān)聯(lián)特性,實(shí)現(xiàn)了多煤質(zhì)參數(shù)的協(xié)同預(yù)測(cè)。宋亮等[12]通過(guò)建立標(biāo)準(zhǔn)化差異煤炭指數(shù)模型分析可見光-近紅外光譜,實(shí)現(xiàn)了煙煤與褐煤的分類。Xiao等[13]將局部感受野與極限學(xué)習(xí)機(jī)結(jié)合,基于可見-近紅外光譜,實(shí)現(xiàn)了煙煤、無(wú)煙煤、褐煤等煤種的分類。也有部分研究人員將近紅外光譜應(yīng)用于煤矸石識(shí)別領(lǐng)域。李廉潔等[14]采用特征波長(zhǎng)篩選策略,基于可見-近紅外光譜高光譜成像,實(shí)現(xiàn)了黑色背景下塊狀煤與矸石的識(shí)別。但針對(duì)煤與矸石的近紅外光譜智能識(shí)別研究尚處于起步階段。
以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心的深度學(xué)習(xí)技術(shù)能夠高效、自主地挖掘數(shù)據(jù)內(nèi)蘊(yùn)藏的潛在特征,應(yīng)用范圍廣泛,覆蓋計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、醫(yī)學(xué)信號(hào)處理和語(yǔ)音識(shí)別等領(lǐng)域[15-16]。
基于上述背景,本文從河南、河北、山東3個(gè)煤礦產(chǎn)區(qū)采集了不同煤種的430組煤和矸石樣本,構(gòu)建了國(guó)內(nèi)首個(gè)開源的煤炭與矸石近紅外光譜數(shù)據(jù)集,通過(guò)迭代計(jì)算歐氏距離以識(shí)別并剔除異常光譜,確保數(shù)據(jù)集的質(zhì)量和代表性。同時(shí)通過(guò)融合深度學(xué)習(xí)和近紅外光譜分析技術(shù),構(gòu)建了基于一維殘差網(wǎng)絡(luò)(1D-ResNet)的分類模型,用于煤與矸石的快速識(shí)別(相關(guān)數(shù)據(jù)和代碼開源于:https://github.com/usefulbbs/Coal-Gangue)。
煤炭作為一種天然形成的化石燃料,其化學(xué)組成和物理性質(zhì)受到地質(zhì)成因和成礦環(huán)境的顯著影響。由于不同地區(qū)的地質(zhì)條件差異,煤炭展現(xiàn)出多樣的性質(zhì)特征[17]。為豐富實(shí)驗(yàn)樣本、增加樣本的多樣性,實(shí)驗(yàn)分別從河南、河北和山東3 個(gè)省份采集了430 組煤炭和矸石樣本,每個(gè)產(chǎn)地的樣本數(shù)量如表1 所示。在河南與河北境內(nèi)所采集的主要是無(wú)煙煤,其含碳量與燃點(diǎn)較高,密度、硬度較大,燃燒時(shí)無(wú)煙產(chǎn)生,廣泛用作化工業(yè)重要原料和民用生活燃料;在山東省內(nèi)所采集的煤炭主要為焦煤,屬于中等變質(zhì)煙煤,發(fā)熱量高、粘結(jié)性強(qiáng),是煉焦的重要原料。
表1 不同產(chǎn)地的煤和矸石樣本數(shù)量Table 1 Number of coal and gangue samples from different regions
根據(jù)我國(guó)煤炭開采的相關(guān)標(biāo)準(zhǔn)和規(guī)定,并結(jié)合對(duì)我國(guó)礦井的實(shí)地調(diào)研,確定本實(shí)驗(yàn)的環(huán)境條件為:采集溫度(20±10)℃,相對(duì)濕度50%±20%,并在正常大氣壓強(qiáng)下進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)使用VIAVI公司生產(chǎn)的高性能便攜式近紅外光譜儀MicroNIRTMPro采集樣本的光譜數(shù)據(jù)。為了確保測(cè)量的準(zhǔn)確性和重復(fù)性,對(duì)每個(gè)樣本進(jìn)行5 次掃描,以掃描結(jié)果的均值作為最終測(cè)量數(shù)據(jù)。鑒于煤與矸石均屬于固體樣本,采集時(shí)將儀器設(shè)置為漫反射模式,并固定儀器與樣品的距離為20 mm,以獲得最佳的光譜反射效果。光譜波長(zhǎng)范圍為908.1~1676.2 nm,涵蓋了125 個(gè)不同的波長(zhǎng)點(diǎn),可為分析提供豐富的光譜信息。為保持?jǐn)?shù)據(jù)的一致性和可靠性,每隔10 min 進(jìn)行一次背景校正,確保光譜數(shù)據(jù)的穩(wěn)定性和準(zhǔn)確性。樣本的近紅外光譜是典型的一維數(shù)據(jù),圖1給出了煤和矸石各25個(gè)樣品的近紅外光譜圖。
圖1 部分樣本的近紅外光譜圖Fig.1 Near infrared spectra of a few samples
在樣本光譜采集的過(guò)程中,環(huán)境的變化或不恰當(dāng)?shù)牟僮骶赡軙?huì)導(dǎo)致數(shù)據(jù)集中出現(xiàn)與正常光譜顯著不同的異常值。這些異常值的存在不僅會(huì)干擾數(shù)據(jù)分析,還可能誤導(dǎo)模型的訓(xùn)練過(guò)程,從而影響最終的測(cè)試結(jié)果。因此,建模之前需對(duì)光譜數(shù)據(jù)進(jìn)行細(xì)致的異常值檢測(cè)和剔除。
歐幾里得距離(ED),即歐氏距離,是歐幾里得空間中兩點(diǎn)間的直線距離,常用于衡量數(shù)據(jù)間的相異度。 光譜數(shù)據(jù)集Xm×n=[x1,x2,...,xm]中樣本間的歐氏距離可表示為:
式中,xi為第i個(gè)樣本的光譜,包含n個(gè)特征點(diǎn),i= 1,2,...,m;xj為第j個(gè)樣本的光譜,包含n個(gè)特征點(diǎn),j= 1,2,...,m;xik為第i個(gè)樣本光譜的第k個(gè)特征點(diǎn),k= 1,2,...,n;xjk為第j個(gè)樣本光譜的第k個(gè)特征點(diǎn),k= 1,2,...,n。
對(duì)于采集到的樣本,其分布近似遵循正態(tài)分布。實(shí)驗(yàn)通過(guò)采用迭代方法和3-sigma 準(zhǔn)則,逐步剔除樣本光譜數(shù)據(jù)集中的異常值,具體步驟如下:
Step1:計(jì)算數(shù)據(jù)集Xm×n的平均光譜xˉ,平均光譜代表了光譜數(shù)據(jù)集的綜合屬性,能反映數(shù)據(jù)的總體趨勢(shì);
Step2:根據(jù)公式(1)計(jì)算各樣本光譜到xˉ的歐氏距離{D(xi,xˉ)|i= 1,2,...,m};
Step3:按照99.7%的置信度檢測(cè)異常值,利用3σ準(zhǔn)則將檢測(cè)閾值設(shè)置為D標(biāo)準(zhǔn)差的3倍(3σ)。其中,平均值:
標(biāo)準(zhǔn)差:
Step4:當(dāng)|D(xi,) -μ| ≥3σ時(shí),即判定xi為異常值并剔除。當(dāng)有異常值被剔除時(shí),須重新計(jì)算新數(shù)據(jù)集的。重復(fù)以上步驟,直至無(wú)異常值出現(xiàn)。
通過(guò)上述過(guò)程從數(shù)據(jù)集中移除可能導(dǎo)致模型訓(xùn)練偏差的異常光譜,從而保證模型的泛化能力和測(cè)試結(jié)果的可靠性。
殘差網(wǎng)絡(luò)(ResNet)是一種高效的深度學(xué)習(xí)結(jié)構(gòu)。在其訓(xùn)練過(guò)程中,網(wǎng)絡(luò)各層的參數(shù)和非線性映射函數(shù)會(huì)逐步調(diào)整優(yōu)化,以最小化網(wǎng)絡(luò)輸出與實(shí)際標(biāo)簽之間的損失函數(shù)。這一優(yōu)化過(guò)程確保了近紅外光譜輸入在經(jīng)ResNet處理后提取的特征與目標(biāo)標(biāo)簽之間的對(duì)應(yīng)性。具體而言,網(wǎng)絡(luò)通過(guò)賦予對(duì)最終預(yù)測(cè)結(jié)果有正向影響的特征更高的權(quán)重,同時(shí)降低可能引入誤差的噪聲成分的權(quán)重,以此提高模型的準(zhǔn)確性和魯棒性。
殘差網(wǎng)絡(luò)構(gòu)建在殘差模塊之上,通過(guò)加入“短路連接”實(shí)現(xiàn)恒等映射。典型的殘差模塊如圖2 所示。恒等映射可通過(guò)跨越兩個(gè)卷積層的直接連接,實(shí)現(xiàn)模塊的輸入與主路徑輸出的疊加。這樣的設(shè)計(jì)允許梯度在訓(xùn)練過(guò)程中直接傳遞,無(wú)需經(jīng)過(guò)多層非線性變換,極大地減輕了梯度消失的問(wèn)題。此外,這種短路連接還有助于網(wǎng)絡(luò)更有效地學(xué)習(xí)恒等映射,從而使更深層次的網(wǎng)絡(luò)訓(xùn)練變得更加穩(wěn)定和高效。
圖2 殘差模塊結(jié)構(gòu)圖Fig.2 Structure of the residual module
原始的ResNet結(jié)構(gòu)主要是為二維圖像數(shù)據(jù)設(shè)計(jì)的。近紅外光譜是一種一維數(shù)據(jù),需要在網(wǎng)絡(luò)設(shè)計(jì)上進(jìn)行調(diào)整以適應(yīng)其特性[18]。首先,將常規(guī)的二維卷積層替換為一維卷積層,使卷積核可在光譜數(shù)據(jù)上沿一個(gè)維度進(jìn)行卷積操作。其次,在考慮光譜數(shù)據(jù)特性和處理需求的基礎(chǔ)上,將網(wǎng)絡(luò)的超參數(shù)設(shè)置如下:殘差模塊中卷積層的數(shù)量為2,卷積核大小為3,滑動(dòng)步長(zhǎng)和填充數(shù)量均為1,其中的激活函數(shù)采用指數(shù)線性單元(ELU):
式中,s為ELU單元的輸入值;α為可調(diào)節(jié)參數(shù)。
ELU 可以避免神經(jīng)網(wǎng)絡(luò)在變得更深時(shí)出現(xiàn)梯度消失問(wèn)題。與線性整流函數(shù)(ReLU)不同,ELU 會(huì)在輸入為正時(shí)直接輸出該值,而在輸入為負(fù)時(shí)輸出一個(gè)小的負(fù)數(shù)。這種設(shè)計(jì)既避免了ReLU 的“死區(qū)”問(wèn)題,又可以減少噪聲的影響。
殘差模塊的輸出維度(卷積核數(shù)量)需要根據(jù)模塊所在的位置進(jìn)行調(diào)整,1D-ResNet 的結(jié)構(gòu)和數(shù)據(jù)維度變化如表2 所示。初始單個(gè)樣本的光譜維度為(1,125),以其作為網(wǎng)絡(luò)的輸入數(shù)據(jù)。在輸出維度中,第一維表示輸入數(shù)據(jù)的批大小( Batch size),第二維表示特征維度,第三維表示網(wǎng)絡(luò)通道數(shù)。
表2 1D-ResNet網(wǎng)絡(luò)參數(shù)Table 2 Parameters of the 1D-ResNet network
1D-ResNet 的網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。批歸一化層(BN)用于加快和穩(wěn)定訓(xùn)練過(guò)程,最大池化層用于壓縮特征圖大小,保留顯著信息[18-20]。殘差模塊保存了原始輸入信息,有效緩解了梯度消失問(wèn)題。Flatten用于將多維的輸入一維化。全連接層作為分類器,輸出的兩個(gè)數(shù)值經(jīng)Softmax函數(shù)處理后作為每個(gè)類別的條件概率。
圖3 1D-ResNet的結(jié)構(gòu)圖Fig.3 Structure diagram of 1D-ResNet
針對(duì)煤和矸石的二分類任務(wù),在模型訓(xùn)練時(shí)采用交叉熵?fù)p失函數(shù)(Loss)進(jìn)行分類:
式中,y為真實(shí)的標(biāo)簽值(0或1);p為預(yù)測(cè)標(biāo)簽為1的概率值。
模型預(yù)測(cè)的準(zhǔn)確率A按照下式進(jìn)行計(jì)算:
式中PT為正確分類為煤的樣本個(gè)數(shù);PF為錯(cuò)誤分類為煤的樣本個(gè)數(shù);NT為正確分類為矸石的個(gè)數(shù);NF為錯(cuò)誤分類為矸石的個(gè)數(shù)。
實(shí)驗(yàn)采用五折交叉驗(yàn)證對(duì)模型進(jìn)行評(píng)估,將樣本隨機(jī)均分成5 份,每次選擇其中1 份作為測(cè)試集,其余4份作為訓(xùn)練集,共進(jìn)行5次實(shí)驗(yàn)。為了避免樣本不平衡對(duì)實(shí)驗(yàn)結(jié)果的影響,在樣本劃分時(shí),每一份樣本中煤和矸石的數(shù)量大致相當(dāng)。最后,取5次預(yù)測(cè)準(zhǔn)確率的平均值用于衡量模型的性能。該方法能夠全面評(píng)估模型在不同數(shù)據(jù)集上的泛化能力和穩(wěn)定性,從而確保得出的結(jié)論基于全面和均衡的數(shù)據(jù)分析。
為避免異常值的干擾,本實(shí)驗(yàn)按照樣本來(lái)源地和類別,基于歐氏距離對(duì)異常樣本進(jìn)行迭代剔除。異常值的判定過(guò)程如圖4 所示,在對(duì)河南矸石樣本集進(jìn)行第1次迭代時(shí),2#樣本與平均光譜的歐氏距離超出了閾值,因此被作為異常值剔除,在第2 次迭代時(shí)未發(fā)現(xiàn)異常值,迭代終止。類似地,山東煤炭中的46#樣本被當(dāng)作異常值剔除,其余樣本集中未發(fā)現(xiàn)異常值。
圖4 河南矸石數(shù)據(jù)異常值第1輪迭代(A)和第2輪迭代(B)剔除過(guò)程,以及山東煤數(shù)據(jù)異常值第1輪迭代(C)和第2輪迭代(D)剔除過(guò)程Fig.4 The exclusion process of outliers in the first iteration(A) and the second iteration(B) for abnormal values in Henan gangue data,as well as the exclusion process in the first iteration(C) and the second iteration(D)for abnormal values in Shandong coal data
圖5 展示了河南矸石和山東煤中異常樣本光譜與正常樣本光譜的對(duì)比。圖中實(shí)線表示正常光譜,虛線表示異常光譜。盡管正常樣本和異常樣本的光譜在整體趨勢(shì)上相似,但在吸光度值上存在顯著差異。這種差異可能源于測(cè)量設(shè)備的偏差或操作人員引入的誤差,這些因素會(huì)對(duì)模型的最終預(yù)測(cè)結(jié)果帶來(lái)不利影響。
圖5 河南矸石光譜數(shù)據(jù)集(A)和山東煤光譜數(shù)據(jù)集(B)中異常樣本與正常樣本光譜對(duì)比示意圖Fig. 5 Comparison schematic of spectral data between abnormal samples and normal samples for the Henan gangue spectral dataset(A) and the Shandong coal spectral dataset(B)
圖6 展示了1D-ResNet 在訓(xùn)練過(guò)程中損失變化的曲線圖。在該圖中,實(shí)線代表訓(xùn)練集的五折平均損失變化,虛線則表示測(cè)試集的五折平均損失變化。在訓(xùn)練的初期階段(0~約400輪),訓(xùn)練集和測(cè)試集對(duì)應(yīng)的損失迅速下降,表明1D-ResNet 具有良好的學(xué)習(xí)和擬合能力,能在標(biāo)簽的引導(dǎo)下快速、準(zhǔn)確地調(diào)整模型參數(shù)實(shí)現(xiàn)模型的有效訓(xùn)練。之后,損失曲線趨于平穩(wěn)并維持在一個(gè)較低的水平,表明模型在經(jīng)過(guò)充分訓(xùn)練后,已達(dá)到較好的收斂狀態(tài)。此時(shí),模型的性能在訓(xùn)練集和測(cè)試集上表現(xiàn)出一致性,說(shuō)明1D-ResNet 在處理此類數(shù)據(jù)時(shí)具有較好的泛化能力。這種穩(wěn)定的損失趨勢(shì)也表明了模型對(duì)于捕捉煤矸石光譜特征的有效性,同時(shí)避免了過(guò)擬合的問(wèn)題,確保了模型在實(shí)際應(yīng)用中的可靠性和預(yù)測(cè)準(zhǔn)確性。
圖6 五折交叉驗(yàn)證平均損失變化曲線Fig.6 Five-fold cross-validation average loss change curve
為客觀評(píng)價(jià)1D-ResNet 的性能,本實(shí)驗(yàn)將其與近紅外光譜領(lǐng)域中常用的分類模型進(jìn)行了對(duì)比,包括支持向量機(jī)(SVM)、決策樹(DT)、隨機(jī)森林(RF)和K近鄰(KNN)。使用五折交叉驗(yàn)證對(duì)每種方法進(jìn)行評(píng)估,得到對(duì)應(yīng)的模型參數(shù)量、每一百個(gè)樣本的平均推理時(shí)間和分類準(zhǔn)確率,結(jié)果如表3所示。
表3 不同模型實(shí)驗(yàn)結(jié)果對(duì)比Table 3 Comparison of experimental results of different models
在傳統(tǒng)方法中,SVM 的性能較好,五折交叉驗(yàn)證準(zhǔn)確率為93.92%。1D-ResNet 的預(yù)測(cè)準(zhǔn)確率高達(dá)96.26%,明顯優(yōu)于其它方法,表明由殘差模塊構(gòu)成的網(wǎng)絡(luò)模型,能較好地分析樣本光譜特征,學(xué)習(xí)煤與矸石光譜間的差異。雖然1D-ResNet每一百個(gè)樣本的平均推理時(shí)間為16.230 ms,長(zhǎng)于其它模型,但已滿足實(shí)際應(yīng)用需求,這一時(shí)間上的輕微犧牲并不會(huì)對(duì)其有效性產(chǎn)生顯著影響。
在傳統(tǒng)的煤矸石識(shí)別方法中,人工分選和機(jī)械濕選存在效率低、消耗大量水資源等問(wèn)題。為解決此問(wèn)題,本文融合近紅外光譜分析技術(shù)和深度學(xué)習(xí)方法,實(shí)現(xiàn)了快速、有效的煤矸石識(shí)別。通過(guò)采集不同產(chǎn)地不同煤種的430 組煤和矸石樣本,增強(qiáng)了實(shí)驗(yàn)結(jié)果的普適性和可靠性,并提供了更具代表性的數(shù)據(jù)基礎(chǔ)。采集樣本的近紅外光譜后,利用歐氏距離剔除了數(shù)據(jù)集中的異常值,并構(gòu)建了基于1DResNet 的識(shí)別模型,該模型能夠自動(dòng)學(xué)習(xí)光譜的內(nèi)在特征。五折交叉驗(yàn)證結(jié)果表明,模型的分類準(zhǔn)確率達(dá)96.26%,優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法(SVM 和隨機(jī)森林等)。該文為煤矸石識(shí)別提供了一種快速實(shí)用、簡(jiǎn)潔高效的分析方法。