劉 濤, 李 博, 夏 蕊, 李 瑞, 王學(xué)文
太原理工大學(xué)機(jī)械與運(yùn)載工程學(xué)院煤礦綜采裝備山西省重點(diǎn)實(shí)驗(yàn)室, 山西 太原 030024
中國(guó)是全球最大的煤炭生產(chǎn)國(guó)與消費(fèi)國(guó), 煤炭長(zhǎng)久以來(lái)就是中國(guó)的第一能源, 占據(jù)一次能源的60%左右[1]。 在煤炭開(kāi)采過(guò)程中, 沒(méi)有經(jīng)過(guò)任何處理的煤炭稱為原煤。 在現(xiàn)代化機(jī)械開(kāi)采過(guò)程中, 由于開(kāi)采環(huán)境的限制, 原煤中往往包含著大量矸石, 含矸率的上升會(huì)影響原煤質(zhì)量[2]。 煤矸分選是實(shí)現(xiàn)煤炭高效潔凈利用的必經(jīng)步驟。
目前我國(guó)已采用的煤矸分選方法中, 人工選矸無(wú)法保證分選質(zhì)量, 且工作環(huán)境惡劣, 危害工人的身體健康; 動(dòng)篩跳汰選矸以及重介質(zhì)淺槽選矸均需要消耗大量的水資源; 復(fù)合干法選矸會(huì)產(chǎn)生嚴(yán)重的粉塵, 并且分選精度也較低; 基于圖像識(shí)別的選矸方法[3], 容易受到周圍光照條件以及粉塵的影響; 基于射線識(shí)別的選矸方法[4], 具有輻射危害。 而可見(jiàn)-近紅外光譜識(shí)別技術(shù)具有高速、 可靠、 準(zhǔn)確等優(yōu)點(diǎn), 是煤矸分選的最佳方法之一。
雖然已有一些基于可見(jiàn)-近紅外光譜對(duì)煤和矸石的性質(zhì)[5-7]、 種類[8-9]等問(wèn)題的探討, 但在不同工況下基于光譜數(shù)據(jù)進(jìn)行煤和矸石識(shí)別的研究還較少。 Yang等對(duì)煤和碳質(zhì)頁(yè)巖的光譜特性進(jìn)行研究, 并對(duì)6種典型煙煤、 碳質(zhì)頁(yè)巖樣品在350~2 500 nm波長(zhǎng)范圍內(nèi)的光譜反射率進(jìn)行了分析[10]; Le等采集了不同種類煤的近紅外光譜數(shù)據(jù), 利用卷積神經(jīng)網(wǎng)絡(luò)提取光譜特征, 并應(yīng)用極限學(xué)習(xí)機(jī)算法構(gòu)建了基于光譜特征數(shù)據(jù)的預(yù)測(cè)分析模型[11]。 此外, 也有少數(shù)研究人員對(duì)不同工況下煤巖近紅外光譜數(shù)據(jù)的性質(zhì)進(jìn)行研究, 但這些研究并沒(méi)有結(jié)合識(shí)別算法進(jìn)行有效分析。 周悅等在實(shí)驗(yàn)室利用光譜儀采集常見(jiàn)探測(cè)距離與探測(cè)角度下的4種典型煤巖的近紅外漫反射光譜, 對(duì)其光譜特征進(jìn)行分析, 并利用余弦相似度與皮爾遜相關(guān)系數(shù)兩種模型分別進(jìn)行煤巖定性分析[12]; 丁震等通過(guò)對(duì)煤和矸石近紅外反射光譜特征分析, 發(fā)現(xiàn)探測(cè)距離和粉塵濃度變化對(duì)煤矸近紅外反射光譜曲線波形和吸收谷位置無(wú)明顯影響[13]。
本研究的具體目標(biāo)是:(1)在實(shí)驗(yàn)室中模擬煤矸分選過(guò)程中不同探測(cè)角度、 探測(cè)距離、 光照角度三種工況, 并分析不同工況下煤和矸石可見(jiàn)-近紅外光譜的差異; (2)對(duì)采集的光譜數(shù)據(jù)進(jìn)行預(yù)處理, 探究不同工況下各識(shí)別算法的可行性; (3)分析不同工況對(duì)煤矸識(shí)別準(zhǔn)確率影響的主次順序, 用正交試驗(yàn)法尋找最優(yōu)的工況條件, 為可見(jiàn)-近紅外光譜技術(shù)在煤矸識(shí)別領(lǐng)域的實(shí)際應(yīng)用提供理論基礎(chǔ)。
實(shí)驗(yàn)樣本為山西太原西銘煤礦的焦煤以及黑色矸石, 樣本中煤和矸石的數(shù)量均為40塊, 樣本高度在15~55 mm之間。 在實(shí)驗(yàn)前, 將所有樣本放到室內(nèi)環(huán)境下靜置, 并對(duì)實(shí)驗(yàn)樣本進(jìn)行排序標(biāo)號(hào), 每次實(shí)驗(yàn)中樣本的采集順序不變。 圖1為實(shí)驗(yàn)樣本圖片, 其中圖1(a)為煤的部分樣本, 圖1(b)為矸石的部分樣本, 從圖中可以看出樣本的煤和矸石顏色相近, 難以直接識(shí)別。
圖1 實(shí)驗(yàn)部分煤樣本(a)與矸石樣本(b)
針對(duì)實(shí)際分選過(guò)程中不同光纖探頭探測(cè)角度、 光纖探頭探測(cè)距離、 鹵素?zé)艄庹战嵌热N工況, 在實(shí)驗(yàn)室中進(jìn)行工況模擬實(shí)驗(yàn)。 圖2為搭建的可見(jiàn)-近紅外光譜采集裝置的實(shí)物照片以及原理圖, 將100 W的鹵素?zé)?LT05114 12V/100w MR16, LAITE, China)固定在燈架上用作光源, 光纖探頭(1SMA1s-SI0.6-1.5m, SL, China)固定在探頭支架上用于光譜的采集。 光譜儀(Oceanview optics usb 2000+, Ocean Insight, USA)一端與光纖探頭直接連接, 另一端通過(guò)USB3.0接口與采集計(jì)算機(jī)相連, 利用與光譜儀配套的專業(yè)Oceanview軟件實(shí)時(shí)采集和顯示樣本光譜數(shù)據(jù)。 通過(guò)調(diào)節(jié)燈架的角度可以改變鹵素?zé)艄庹战嵌? 探頭支架可以調(diào)節(jié)光纖探頭與樣本之間的探測(cè)角度及探測(cè)距離。 此外, 為了更加貼合實(shí)際工況, 以純黑色皮帶為背景。
圖2 可見(jiàn)-近紅外光譜采集裝置(a)與原理圖(b)
試驗(yàn)中, 將鹵素?zé)艄庠垂潭ㄔ跇颖咀髠?cè), 設(shè)定光源與探頭水平距離為50 cm, 與黑色皮帶垂直距離為45 cm。 采集數(shù)據(jù)時(shí), 提前將光譜儀和鹵素?zé)舸蜷_(kāi), 等待30 min后設(shè)備穩(wěn)定再進(jìn)行試驗(yàn), 將樣本放置到黑色皮帶上, 積分時(shí)間設(shè)置為11 ms。 此外, 在正式實(shí)驗(yàn)開(kāi)始前進(jìn)行預(yù)實(shí)驗(yàn), 通過(guò)觀察采集軟件實(shí)時(shí)顯示的光譜波形, 校正樣本的擺放位置和角度, 并記錄樣本擺放情況, 使每次實(shí)驗(yàn)各樣本在三維空間上的擺放姿態(tài)基本相同, 降低由樣本擺放位置或角度差異引起的誤差。 同時(shí), 為了減少照明不均勻以及儀器暗電流的干擾, 需要對(duì)采集的光譜數(shù)據(jù)進(jìn)行黑白校正, 將整個(gè)試驗(yàn)臺(tái)置于防光黑布中, 使樣品不受外界雜散光的干擾, 在相同的環(huán)境下, 利用反射率接近100%的聚四氟乙烯白板采集白參考, 再采集黑色皮帶作為黑參考, 樣品反射率的計(jì)算公式如式(1)所示
(1)
式(1)中:R為樣品的光譜反射率;Iorigin為樣品的反射光譜強(qiáng)度;Iwhite為白參考的反射光譜強(qiáng)度;Iblack為黑參考的反射光譜強(qiáng)度。
1.3.1 單因素試驗(yàn)
(1)由于煤和矸石各表面粗糙度不同, 因此光纖探頭檢測(cè)角度的變化會(huì)影響光譜數(shù)據(jù)的采集。 為此, 在靜止條件下, 通過(guò)改變光纖探頭的探測(cè)角度, 來(lái)模擬樣本被檢測(cè)角度的變化。 在采集不同探測(cè)角度下光譜數(shù)據(jù)的試驗(yàn)過(guò)程中, 設(shè)定探測(cè)距離為20 cm、 光照角度為35°, 將光纖探頭相對(duì)于豎直方向的角度設(shè)為試驗(yàn)變量, 設(shè)置0°、 10°、 20°、 30°共4個(gè)水平, 單次誤差不大于0.5°。
(2)由于煤和矸石樣本高度不一, 以及檢測(cè)過(guò)程中可能出現(xiàn)的樣本堆疊等現(xiàn)象, 因此樣本表面到光纖探頭的距離并不固定, 探測(cè)距離的變化會(huì)對(duì)光譜數(shù)據(jù)的采集產(chǎn)生一定的影響。 為此, 通過(guò)改變光纖探頭的探測(cè)距離, 模擬樣本被測(cè)距離的變化。 在采集不同探測(cè)距離下光譜數(shù)據(jù)的試驗(yàn)過(guò)程中, 設(shè)定探測(cè)角度為0°、 光照角度為35°, 將光纖探頭到樣本的垂直距離設(shè)為試驗(yàn)變量, 設(shè)置10、 15、 20和25 cm共4個(gè)水平, 單次誤差不大于1 mm。
(3)采集數(shù)據(jù)過(guò)程中, 作為光源的鹵素?zé)魺o(wú)法均勻照射在傳送機(jī)構(gòu)上, 距離光源中心不同的區(qū)域, 光強(qiáng)也不一致。 為此, 通過(guò)在靜止條件下改變光源的光照角度, 模擬樣本所受光照角度的變化。 在采集不同光照角度下光譜數(shù)據(jù)的試驗(yàn)過(guò)程中, 設(shè)定探測(cè)距離為20 cm、 探測(cè)角度為0°, 將鹵素?zé)粝鄬?duì)于豎直方向的角度設(shè)為試驗(yàn)變量, 設(shè)置15°、 25°、 35°、 45°共4個(gè)水平, 單次誤差不大于0.5°。
1.3.2 多因素試驗(yàn)
實(shí)際生產(chǎn)環(huán)境中, 煤和矸石受到的是多因素的影響, 工況更為復(fù)雜惡劣, 例如光照角度過(guò)大的同時(shí)探測(cè)距離過(guò)大, 都會(huì)影響光譜數(shù)據(jù)采集的穩(wěn)定性, 從而降低煤矸識(shí)別的準(zhǔn)確率。
正交試驗(yàn)設(shè)計(jì), 是研究多因素多水平的一種試驗(yàn)設(shè)計(jì)方法[14]。 該設(shè)計(jì)方法可以依托正交表, 根據(jù)正交性在全部試驗(yàn)中選出部分具有代表性的點(diǎn)進(jìn)行試驗(yàn), 這些有代表性的點(diǎn)具備均勻分散, 整齊可比的特點(diǎn), 可實(shí)現(xiàn)以最少的試驗(yàn)次數(shù)達(dá)到與大量全面試驗(yàn)等效的結(jié)果。 綜合考慮后, 選用三因素四水平的L16正交試驗(yàn)方案表, 如表1所示, 表格中因素A為探測(cè)距離, 因素B為探測(cè)角度, 因素C為光照角度。 正交試驗(yàn)表的選用以及相關(guān)計(jì)算均借助軟件Minitab 19來(lái)完成, 正交試驗(yàn)設(shè)計(jì)表見(jiàn)表2。
表1 因素水平表
表2 正交試驗(yàn)設(shè)計(jì)表
由于受到儀器自身或外界環(huán)境的干擾, 采集的可見(jiàn)-近紅外光譜信號(hào)中既含有有用的信息, 也包含著儀器噪聲, 雜散光等無(wú)關(guān)信息, 因此在建模前需要對(duì)采集的原始光譜進(jìn)行預(yù)處理。 采用的預(yù)處理方法為Savitzky-Golay(SG)卷積平滑和標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transformation, SNV)。 SG卷積平滑是光譜分析中常用的預(yù)處理方法, 能有效提高光譜的平滑性, 并降低噪聲的干擾。 SNV法可以消除表面散射, 固體顆粒大小和光程變化對(duì)反射光譜的影響。 所有數(shù)據(jù)預(yù)處理均借助軟件Matlab R2018b完成。
由于原始光譜波長(zhǎng)最大和最小端有相當(dāng)大的隨機(jī)噪聲, 故只取481~903 nm(1 248個(gè)變量)范圍內(nèi)的光譜進(jìn)行分析。 圖3(a)為按序號(hào)選取的前20塊煤和矸石樣本在探測(cè)角度35°, 探測(cè)距離20 cm, 光照角度15°條件下的原始平均反射光譜, 從圖3(a)中可以看出, 由于隨機(jī)噪聲的影響, 原始光譜曲線含有較多的毛刺, 光譜的吸收特征不夠明顯, 因此需要經(jīng)過(guò)預(yù)處理來(lái)消除噪聲的干擾。
圖3 樣本原始光譜(a)及預(yù)處理后光譜(b)
圖3(b)為經(jīng)SG卷積平滑處理后的反射光譜曲線, 經(jīng)過(guò)預(yù)處理后, 光譜波形特征更明顯。 由于煤分子結(jié)構(gòu)的特點(diǎn), 其吸收光譜多集中于中紅外波段, 因此在圖3(b)中, 煤的可見(jiàn)-近紅外漫反射光譜曲線在481~903 nm波段之間沒(méi)有較為明顯的吸收谷。 同時(shí), 由于樣本中焦煤和矸石均為黑色, 反射能量少, 因此譜線上仍有一定噪聲。 從圖3(b)中樣本光譜在800~900 nm波段的局部放大圖中可以看出, 雖然預(yù)處理后煤和黑矸的光譜形狀大致相似, 但在825和900 nm附近仍存在一定差異。 此外, 由于在可見(jiàn)-近紅外波段, 煤分子的芳構(gòu)化程度高, 且芳香分子中電子躍遷趨向于長(zhǎng)波長(zhǎng)方向, 因此煤在該波段長(zhǎng)波方向的光譜系數(shù)大, 整體反射率較低且反射光譜的斜率小于矸石。
從圖4中可以看出, 不同工況下煤和矸石的反射率變化趨勢(shì)基本一致。 由圖4(a)、 (d)可知, 在探測(cè)角度0°~20°之間, 隨著探測(cè)角度的增大, 煤和矸石反射率呈現(xiàn)增大的趨勢(shì), 在探測(cè)角度30°時(shí)的反射率最低, 推測(cè)是由于樣本的表面顆粒不均勻且粗糙度不同, 導(dǎo)致探測(cè)角度改變時(shí)光譜的反射率也發(fā)生變化。 由圖4(b)、 (e)可知, 在探測(cè)距離10~25 cm之間, 樣本的反射率隨著探測(cè)距離的升高而增大。 主要是因?yàn)樘綔y(cè)距離的上升引起光程差變化, 導(dǎo)致黑白校正時(shí)白參考反射強(qiáng)度降低, 平均反射率上升。 由圖4(c)、 (f)可知, 在不同光照角度下樣本反射率大小依次為光照角度45°、 25°、 35°、 15°。 主要原因是鹵素?zé)艄庹战嵌鹊牟煌瑢?dǎo)致樣本受到的光照強(qiáng)度不同, 從而引起光譜的平均反射率發(fā)生改變。
圖4 不同探測(cè)角度下煤(a)和矸(d)、 不同探測(cè)距離下煤(b)和矸(e)、 不同光照角度下煤(c)和矸(f)的平均光譜
2.2.1 AdaBoost算法
決策樹(shù)(decision tree, DT)中的分類決策樹(shù)模型是一種對(duì)實(shí)例進(jìn)行分類的樹(shù)形結(jié)構(gòu), 由結(jié)點(diǎn)和有向邊組成, 可以將其看做一個(gè)if-then規(guī)則的結(jié)合, 是最常用的分類算法之一。
AdaBoost(adaptive boosting)算法[15]是一種常用的集成算法, 在分類問(wèn)題中, 該算法通過(guò)改變訓(xùn)練樣本的權(quán)重, 學(xué)習(xí)多個(gè)分類器, 并將這些分類器進(jìn)行線性組合, 提高模型的性能。 集成學(xué)習(xí)不僅擁有更好的預(yù)測(cè)性能, 而且解決了單個(gè)學(xué)習(xí)器容易欠擬合或過(guò)擬合的問(wèn)題。 本工作采用的AdaBoost算法是把多個(gè)決策樹(shù)預(yù)測(cè)模型作為弱分類器, 之后通過(guò)算法改變權(quán)重構(gòu)成強(qiáng)分類器。
2.2.2 建模方法及評(píng)價(jià)指標(biāo)
為了獲得可靠的分類結(jié)果, 選用決策樹(shù)(DT)、 K近鄰(k-nearest neighbor, KNN)、 偏最小二乘判別分析(partial least squares discriminant analysis, PLS-DA)、 支持向量機(jī)(support vector machines, SVM)、 AdaBoost共5種分類算法進(jìn)行判別模型的建立。 所有數(shù)據(jù)訓(xùn)練均借助軟件PyCharm Community Edition 2021.2.2, 環(huán)境Python 3.9來(lái)實(shí)現(xiàn)。 基于校正集訓(xùn)練判別模型, 基于預(yù)測(cè)集對(duì)模型進(jìn)行性能評(píng)估, 將煤作為正類, 矸石作為負(fù)類, 將正確率(accuracy)作為模型評(píng)價(jià)的指標(biāo), 正確率的計(jì)算公式如式(2)所示
(2)
式(2)中:TP為實(shí)際為煤, 預(yù)測(cè)為煤的數(shù)量;TN為實(shí)際為矸石, 預(yù)測(cè)為矸石的數(shù)量;FP為實(shí)際為矸石, 預(yù)測(cè)為煤的數(shù)量;FN為實(shí)際為煤, 預(yù)測(cè)為矸石的數(shù)量。
2.3.1 單因素下建模方法對(duì)比
將采集的可見(jiàn)-近紅外光譜數(shù)據(jù)按照7∶3的比例隨機(jī)劃分為校正集和預(yù)測(cè)集。 對(duì)原始數(shù)據(jù)進(jìn)行SNV+SG卷積平滑預(yù)處理后, 基于校正集訓(xùn)練DT、 KNN、 PLS-DA、 SVM、 AdaBoost模型, 這些模型在不同工況下預(yù)測(cè)集的分類結(jié)果如表3所示。
表3 不同工況下各模型的訓(xùn)練結(jié)果
分析試驗(yàn)數(shù)據(jù)可得, SNV+SG卷積平滑的預(yù)處理方法結(jié)合AdaBoost模型的表現(xiàn)最為優(yōu)異, 在各個(gè)工況下對(duì)煤和矸石的識(shí)別準(zhǔn)確率均可以達(dá)到100%。 SVM模型的分類表現(xiàn)較為優(yōu)異, 識(shí)別準(zhǔn)確率均在95.83%及以上; PLS-DA模型的識(shí)別準(zhǔn)確率均為95.83%; KNN模型的準(zhǔn)確率維持在91.67%~95.83%之間; 決策樹(shù)的識(shí)別準(zhǔn)確率在83.33%~100%之間。 此外, 計(jì)算模型準(zhǔn)確率的均值可以得到, 在探測(cè)角度0°、 探測(cè)距離20 、 光照角度35°條件下的模型準(zhǔn)確率均值最高, 為98.33%。
2.3.2 多因素下建模方法對(duì)比
分析單因素試驗(yàn)的結(jié)果可得, AdaBoost模型在各個(gè)預(yù)測(cè)集上的表現(xiàn)最佳, 但該模型計(jì)算時(shí)間相對(duì)較長(zhǎng), 在單因素的12次試驗(yàn)中平均計(jì)算時(shí)間為0.6s。 由于SNV+SG卷積平滑的預(yù)處理方法結(jié)合SVM模型同樣具有較高的魯棒性和泛化性, 而且SVM模型在單因素的12次試驗(yàn)中平均計(jì)算時(shí)間僅為0.01 s, 因此在正交試驗(yàn)中, 采用SNV+SG卷積平滑結(jié)合SVM模型進(jìn)行煤矸識(shí)別。
正交試驗(yàn)的數(shù)據(jù)采集方法為: 在每種工況(每個(gè)試驗(yàn)號(hào))條件下進(jìn)行光譜數(shù)據(jù)采集, 把不同工況下, 原始光譜數(shù)據(jù)和預(yù)處理后光譜數(shù)據(jù)中測(cè)定的準(zhǔn)確率分別記入試驗(yàn)結(jié)果中, 如表4所示。 對(duì)試驗(yàn)結(jié)果進(jìn)行主次因素分析, 如表5所示。 表5中, 某一試驗(yàn)因素的Ti代表該因素在第i個(gè)水平下的試驗(yàn)數(shù)據(jù)之和,ti為某一因素在第i個(gè)水平下的均值,R為某一因素在試驗(yàn)范圍內(nèi)其試驗(yàn)數(shù)據(jù)的變化幅值。
表4 正交試驗(yàn)結(jié)果
表5 正交試驗(yàn)數(shù)據(jù)分析
以各因素的水平為橫坐標(biāo), 以相應(yīng)水平下的ti為縱坐標(biāo), 畫(huà)出試驗(yàn)因素與準(zhǔn)確率均值關(guān)系的趨勢(shì)圖, 如圖5(a)所示。 在原始數(shù)據(jù)中, 因素C的ti波動(dòng)最劇烈, 而因素A和B的ti變化幅度基本相同。 根據(jù)正交表的綜合可比性以及趨勢(shì)圖可以得出, 各因素對(duì)煤矸識(shí)別準(zhǔn)確率的影響次序從大到小為C>B>A。 從準(zhǔn)確率均值可以看出, 在因素A、 B、 C中表現(xiàn)最優(yōu)的條件分別是水平1、 水平3、 水平1。
圖5 原始(a)和預(yù)處理(b)數(shù)據(jù)中各因素水平與準(zhǔn)確率關(guān)系
畫(huà)出預(yù)處理后數(shù)據(jù)中各因素水平與準(zhǔn)確率關(guān)系的趨勢(shì)圖, 如圖5(b)所示。 在預(yù)處理后的數(shù)據(jù)中, 因素C的ti波動(dòng)仍然最劇烈, 而因素B比因素A的ti變化幅度大。 同時(shí), 從R值大小來(lái)看, 因素C對(duì)識(shí)別準(zhǔn)確率的影響最大, 因素A和B對(duì)準(zhǔn)確率的影響程度相同。 與原始數(shù)據(jù)相比, 各個(gè)因素下表現(xiàn)較優(yōu)的條件都發(fā)生了改變, 在因素A、 B、 C中表現(xiàn)最優(yōu)的條件分別是水平3、 水平1、 水平3。 根據(jù)正交表的綜合可比性以及趨勢(shì)圖可以得出, 各因素對(duì)煤矸識(shí)別準(zhǔn)確率的影響依次為C>B>A。 因素C對(duì)煤矸識(shí)別準(zhǔn)確率影響較大的原因是, 當(dāng)光照角度發(fā)生變化后, 光源中心與探測(cè)中心產(chǎn)生偏離, 被測(cè)樣本所受的光照強(qiáng)度發(fā)生改變, 造成光譜有效信息在采集過(guò)程中的缺失, 從而導(dǎo)致識(shí)別準(zhǔn)確率的下降。
對(duì)原始數(shù)據(jù)和預(yù)處理后數(shù)據(jù)的準(zhǔn)確率均值變化趨勢(shì)進(jìn)行比較, 預(yù)處理后的數(shù)據(jù)變化幅度更小, 表明預(yù)處理后不同工況對(duì)樣本識(shí)別準(zhǔn)確率的影響有所降低。 同時(shí), 可以根據(jù)單因素試驗(yàn)的結(jié)果以及表5選出A3、 B1、 C3作為預(yù)處理后數(shù)據(jù)中的最優(yōu)水平組合。
隨機(jī)選擇一組條件, 與尋找的最優(yōu)水平組合下的條件進(jìn)行3次重復(fù)對(duì)照試驗(yàn), 來(lái)驗(yàn)證最優(yōu)組條件是否優(yōu)于其他組合。 隨機(jī)選擇的條件為探測(cè)角度0°、 探測(cè)距離20、 光照角度45°。 對(duì)照試驗(yàn)的結(jié)果如表6所示, 從表中可以得出, 最優(yōu)組的試驗(yàn)準(zhǔn)確率在各個(gè)模型上均等于或大于隨機(jī)組的結(jié)果, 最優(yōu)組的平均分類準(zhǔn)確率均大于隨機(jī)組。 試驗(yàn)證明最優(yōu)組條件下識(shí)別模型的表現(xiàn)優(yōu)于其他組合。
表6 對(duì)照試驗(yàn)
對(duì)煤矸分選過(guò)程中的不同探測(cè)角度、 探測(cè)距離、 光照角度三種工況進(jìn)行模擬試驗(yàn), 并分別在單因素條件以及正交試驗(yàn)設(shè)計(jì)的條件下, 采集可見(jiàn)-近紅外光譜數(shù)據(jù)進(jìn)行分析, 得到以下結(jié)論:
(1)在可見(jiàn)-近紅外波段, 不同工況下煤和矸石的反射光譜吸收峰差異并不明顯, 煤的反射率較低且反射光譜的斜率小于矸石, 隨著工況的變化, 樣本自身的反射率也會(huì)發(fā)生改變, 但煤和矸石的反射率變化趨勢(shì)基本一致。
(2)單因素條件下, SNV+SG卷積平滑的預(yù)處理方法結(jié)合AdaBoost模型的表現(xiàn)最為優(yōu)異, 在各個(gè)工況下識(shí)別準(zhǔn)確率均為100%。 正交試驗(yàn)條件下, 在原始數(shù)據(jù)和預(yù)處理后數(shù)據(jù)中, 三種工況對(duì)識(shí)別準(zhǔn)確率的影響次序從大到小為不同光照角度、 探測(cè)距離、 探測(cè)角度。 同時(shí), 可以選出探測(cè)角度0°、 探測(cè)距離20、 光照角度35°, 作為預(yù)處理后數(shù)據(jù)中的最優(yōu)水平組合。 此外, 對(duì)比原始數(shù)據(jù)和預(yù)處理后數(shù)據(jù)的實(shí)驗(yàn)結(jié)果可以得出, 選用合適的預(yù)處理方法和建模方法可以降低工況對(duì)準(zhǔn)確率的影響。
(3)研究結(jié)果對(duì)不同環(huán)境下煤矸識(shí)別最優(yōu)工況條件的尋找具有借鑒意義, 也為可見(jiàn)-近紅外光譜技術(shù)在煤矸識(shí)別領(lǐng)域的實(shí)際應(yīng)用提供了參考。