周 悅, 王世博, 葛世榮, 王賽亞, 向 陽, 楊 恩, 呂淵博
中國礦業(yè)大學機電工程學院, 江蘇 徐州 221116
綜放開采方法是我國特厚煤層礦區(qū)實現(xiàn)高產(chǎn)高效的主要技術(shù)途徑, 煤矸識別是實現(xiàn)綜放開采自動化放煤控制的關(guān)鍵核心技術(shù)[1]。 半個世紀以來, 眾多學者研究了多種區(qū)分煤與巖石的方法, 如天然射線探測[2]、 聲波探測[3]、 熱紅外探測[4]、 圖像分析[5]等, 然而對從煤和巖的物質(zhì)本質(zhì)屬性上進行區(qū)分的研究報道相對較少。 近紅外反射光譜技術(shù)是一種高信噪比、 實時、 低廉、 針對原位物質(zhì)的光譜分析技術(shù), 其中反射光譜是獲取物質(zhì)屬性的主要途徑, 識別機理為被測物質(zhì)所含的特定化學成分和組成結(jié)構(gòu)在特定波長處產(chǎn)生特定的光譜反射吸收特性, 近紅外反射光譜分析技術(shù)不僅在煤礦和巖礦遙感等定性識別探測領(lǐng)域得到了應(yīng)用[6], 而且已在煤炭、 礦物、 土壤等成分定量分析檢測領(lǐng)域中得到了較多應(yīng)用; 王妍[7]基于偏最小二乘(PLSR)建立鋁土礦內(nèi)部成分Al2O3含量與其近紅外光譜之間的定量數(shù)學關(guān)系模型, 此模型穩(wěn)定性較高, 預(yù)測能力較強。 楊恩等[8]建立了PCA-SVM、 GRB-KPCA-SVM兩種識別模型實現(xiàn)了可見-近紅外光譜波段對煤與炭質(zhì)頁巖的識別。 李明等搭建構(gòu)造基于SVM算法與LVQ算法的定性分析模型, 完成基于近紅外光譜分析技術(shù)的煤產(chǎn)地的快速鑒別。 在利用多波段、 高光譜的遙感數(shù)據(jù)來識別地物時, 人們發(fā)現(xiàn)角度信息對地物的光譜特征有影響[9]。
由于放落在后部刮板輸送機的煤巖體形狀不規(guī)則與堆積高度不確定, 即使近紅外探測裝置固定, 煤巖近紅外光譜的探測距離與探測角度仍不斷變化。 而探測條件(探測距離、 入射角度、 方位角、 探測角度等)會對煤巖的反射光譜產(chǎn)生一定的影響[9]。 同時, 綜放工作面的煤巖均為塊狀試樣。 收集了某礦井綜放工作面賦存的碳質(zhì)泥巖、 砂質(zhì)泥巖、 砂巖和氣煤塊狀試樣4種, 試驗研究了不同探測距離與角度下煤巖近紅外漫反射光譜的光譜特性以及最佳預(yù)處理方法與定性分析模型。
圖1為塊狀煤巖試樣漫反射光譜采集裝置的實物照片和工作原理示意圖。 100 W的鹵素聚光燈與帶準直鏡的光纖探頭固定在可調(diào)向滑臺上, 光纖探頭通過Y型光纖分別與荷蘭AvaSpec-NIR512近紅外光譜儀(波長范圍1 000~2 500 nm, 波長精度3 nm)、 激光指示光源連接。 激光指示光源用于指示光纖探頭的收光范圍。 采集計算機通過USB3.0與光譜儀連接, 實時顯示并采集煤樣樣品的漫反射光譜。 可調(diào)向滑臺可以調(diào)整光纖頭與煤巖樣品之間的距離和角度。 實驗中, 光纖探頭與煤巖樣品之間的距離設(shè)定為1.3, 1.4和1.5 m, 鹵素聚光燈與試樣表面中心的垂直距離設(shè)定為40 cm, 入射角度≤40°、 探測角度≤40°、 方位角5°和相位角0°。 從某煤礦綜放工作面現(xiàn)場收集了炭質(zhì)泥巖、 砂質(zhì)泥巖、 砂巖、 氣煤塊狀試樣4種, 列于表1中。
表1 實驗試樣
測量試樣表面反射光譜時, 試樣固定, 入射與探測角從初始0°(天頂角處)開始, 在同一組測量距離下, 通過實驗室內(nèi)的可調(diào)向滑臺, 每隔10°改變照射與探測角一次, 共改變5次[見圖1(b)中的0°, 10°, 20°, 30°和40°], 在每個方向上采集試樣上同一區(qū)域的10 條光譜曲線, 計算這10條光譜曲線的平均值作為該試樣在此方向上最終的反射光譜曲線, 進行3組實驗最終得到75條(計算平均值之后)光譜曲線。 光譜儀的2個邊緣波段1 000~1 100和2 400~2 500 nm具有較強的電流噪聲, 因此只取1 100~2 400 nm波段內(nèi)光譜數(shù)據(jù)。
圖1 塊狀煤巖試樣反射光譜采集裝置
圖2為5個塊狀煤巖試樣在不同探測條件下的近紅外漫反射光譜曲線。 由圖2(a)—(d)可知, 所有巖樣在1 400和1 900 nm附近有較明顯的吸收谷, 在2 300 nm附近出現(xiàn)微弱吸收谷, 其中巖3在2 200 nm附近出現(xiàn)明顯的吸收谷, 巖2在2 200 nm附近出現(xiàn)微弱的雙吸收谷, 巖1與巖4在2 200 nm附近出現(xiàn)明顯的雙吸收谷。 由圖2(e)可知, 煤樣反射光譜曲線在1 100~2 400 nm沒有明顯的吸收谷, 主要是因為煤分子結(jié)構(gòu)的特點, 其吸收光譜的研究多集中于中紅外波段, 所以其近紅外漫反射光譜曲線在1 100~2 400 nm之間沒有較明顯的吸收谷。 在1 100~2 000 nm范圍內(nèi)吸收谷的出現(xiàn)主要為礦物晶格中的羥基與水分子中的羥基振動引起的, 其中, 1 400 nm附近為O—H伸縮振動的第一倍頻處, 此處的吸收谷應(yīng)主要是由試樣內(nèi)部的結(jié)構(gòu)水引起的, 1 900 nm附近為H—O—H鍵和O—H伸縮的組合頻處, 此處的吸收谷應(yīng)主要是由試樣中的吸附水引起的[10], 該吸收谷測量時受溫度和濕度影響, 另外, 由于[OH]帶的頻率一般比H2O高, 從圖2(a)—(d)可知, 光譜曲線的1 400 nm附近的吸收谷較1 900 nm附近的吸收谷尖窄。 2 200 nm為Al—OH的診斷波段, 此外, 高嶺石的存在會使光譜曲線在2 160 nm附近出現(xiàn)雙吸收谷, 而巖1與巖4在2 160 nm附近的雙吸收峰較巖2更明顯, 推測是因為巖1與巖4中的高嶺石含量較巖2高。 2 300 nm波段附近有微弱吸收是因為存在少量的Mg, Mg—OH在此波段附近的振動造成吸收谷。
圖2 煤巖試樣在探測距離與角度下的光譜反射率曲線
為增強光譜吸收特征, 利用Savitzky-Golay卷積平滑、 標準正態(tài)變量變換、 一階微分三種方法對圖2中所有75條煤巖反射光譜曲線作預(yù)處理。 三種預(yù)處理方法的核心求解算法如下:
(1) 一階微分(FD)
(1)
(2) Savitzky-Golay卷積平滑
(2)
(3) 標準正態(tài)變量變換(SNV)
(3)
xi, λ, A=-lgxi, λ
(4)
(5)
隨機選擇2條煤樣與8條巖樣的光譜預(yù)處理結(jié)果作說明, 圖3(a)—(c)為10條反射光譜曲線經(jīng)一階微分、 Savitzky-Golay卷積平滑、 標準正態(tài)變量變換后的反射光譜曲線。 由圖3知, 經(jīng)過三種預(yù)處理方法后, 光譜曲線反射吸收波形特征更明顯。
圖3 三種方法預(yù)處理后的煤巖樣光譜曲線
為了根據(jù)煤巖的反射光譜進行煤巖定性分析, 從75條光譜曲線中隨機選擇30條為訓練樣本, 不同探測距離與角度下的煤樣10條, 巖樣20條。 其余45條光譜曲線作為測試樣本, 其中煤樣5條, 巖樣40條。 由以上分析可知, 光譜反射率受探測條件的影響, 光譜曲線波形與吸收谷位置受探測條件的影響不明顯, 因此, 為有效的消除探測條件對光譜反射率的影響, 利用注重衡量向量方向上差異, 不注重數(shù)值差異的余弦相似度、 皮爾遜相關(guān)系數(shù)這兩種識別模型分別進行煤巖定性分析, 兩種模型的核心計算方法如下:
余弦相似度
(6)
皮爾遜相關(guān)系數(shù)
(7)
(8)
由式(6)知, 余弦相似度就是計算兩個向量A與B之間的余弦值, 余弦值越接近1, 就表明夾角越接近0°, 也就是兩個向量越相似; 由式(7)知, 皮爾遜相關(guān)系數(shù)就是在計算余弦夾角值之前先求向量中所有元素的均值, 然后將向量中每一元素值減去此均值, 再求余弦相似度。
表2與表3分別為在1 100~2 400 nm波段范圍內(nèi)的煤巖漫反射光譜曲線經(jīng)過三種預(yù)處理后在余弦相似度、 皮爾遜相關(guān)系數(shù)兩種模型下的預(yù)測準確率。 由表2可知, 在Savitzky-Golay卷積平滑預(yù)處理下: 不同探測距離與角度下煤巖光譜曲線的類別預(yù)測率均維持在100%, 探測條件的變化并不影響識別率; 在一階微分預(yù)處理下: 僅在探測距離1.5 m、 探測角0°情況下的類別預(yù)測率為80%, 整體預(yù)測率為98%左右, 探測條件的變化對預(yù)測率產(chǎn)生微弱的影響; 在標準正態(tài)變量變換預(yù)處理下: 探測條件的變化使煤巖識別率產(chǎn)生較大的波動, 且其預(yù)測率較低。 由表3可知, 在Savitzky-Golay卷積平滑預(yù)處理下: 僅在探測距離1.3 m、 探測角30°下的類別預(yù)測率為80%, 整體的類別預(yù)測率為98%左右, 探測條件的變化對識別率產(chǎn)生微弱的影響; 在一階微分預(yù)處理下: 僅在探測距離1.5 m、 探測角0°下的類別預(yù)測率為80%, 整體的類別識別率在98%左右, 探測條件的變化對識別率產(chǎn)生微弱的影響; 在標準正態(tài)變量變換預(yù)處理下: 探測條件的變化使煤巖識別率產(chǎn)生明顯的波動, 其整體預(yù)測率相對較低。 對比表2與表3可知, Savitzky-Golay卷積平滑預(yù)處理后的預(yù)測效果較佳, 推測是因為此預(yù)處理方法通過平滑有效的消除光譜曲線中的噪聲以及消除探測條件對光譜曲線波形的影響, 使不同探測條件下的煤巖識別率均較高; SNV預(yù)處理后的光譜在兩種模型下的預(yù)測率均相對較差, 推測是因為本實驗條件中的顆粒度差異引起的散射現(xiàn)象并不明顯, 而在使用SNV預(yù)處理過程中卻明顯地減弱了目標因素的信息。
表2 1 100~2 400 nm波段內(nèi)的余弦相似度模型下的預(yù)測率
表3 1 100~2 400 nm波段內(nèi)的皮爾遜相關(guān)系數(shù)模型下的識別率
(1)探測角度與距離對光譜曲線波形和吸收谷位置無明顯影響, 但明顯影響光譜反射率。 在1.3 m探測距離下, 光譜反射率隨著探測角度的增大而增大; 在1.4和1.5 m探測距離下, 光譜反射率隨著探測角度的增大而減小。 在10°, 20°和30°探測角度下, 光譜反射率隨著探測距離的增大而增大; 在40°和90°探測角度下, 光譜曲線的反射率隨著探測距離的增大而降低。
(2)Savitzky-Golay卷積平滑有效的消除探測角度與高度對煤巖光譜的影響, 其中, 在余弦相似度模型下: Savitzky-Golay卷積平滑預(yù)處理有效的消除探測條件對光譜曲線波形的影響, 其整體分類效果最佳, 一階微分預(yù)處理后的分類效果次之, 標準正態(tài)變量變換預(yù)處理后的分類效果相對較差。 在皮爾遜相關(guān)系數(shù)模型下: Savitzky-Golay卷積平滑與一階微分預(yù)處理后的整體分類效果相對較好, 標準正態(tài)變量變換預(yù)處理后的分類效果相對較差。
(3)綜合對比上述幾種預(yù)處理后模型的性能, 可得出試驗中存在的影響因素應(yīng)主要是噪聲與基線干擾。 本研究結(jié)果可以為在不同探測角度與探測距離下直接利用近紅外漫反射光譜波形進行識別煤巖時選擇最佳預(yù)處理方法以及定性分析模型提供參考。