文/李望發(fā)
煤礦井下的人員安全問題一直是煤炭科學關注的焦點,隨著科技的發(fā)展,采掘自動化和無人化是煤炭開采技術的方向。目前有基于物理的雷達、射線和紅外探測等方法,但是這類方法識別不穩(wěn)定,識別率低?;谝曈X的煤巖識別技術具有實時監(jiān)控、非接觸式、易于實施等優(yōu)點,引起眾多學者關注。文獻[1]通過提取煤巖圖像的不同尺度下的小波系數(shù)的均值、方差和角二階矩等信息進行級聯(lián),然后采用SVM分類器進行分類,但是計算量大;文獻[2]提取煤巖圖像曲波變換的不同層的系數(shù)進行級聯(lián),然后采用SVM分類器進行識別,但是識別率不高;文獻[3]采用自學習字典結合局部約束線性編碼進行特征提取,然后用SVM分類器進行識別,提高了識別率,但是耗時較長。SVM分類器是煤巖識別中常用的分類器,但是SVM分類器存在魯棒性差的問題,特別是在多種特征融合的識別中如果只進行特征的平行拼接,會造成煤巖特征表達不夠充分。
近年來,多核學習是機器學習領域研究的熱點問題之一,在模式識別、目標檢測等有著廣泛的應用。特別是當訓練樣本數(shù)據(jù)異構、樣本分布不均時,用單個核函數(shù)構建的支持向量機不能有效地解決分類問題,而多核學習能有效結合多種核函數(shù)種類和參數(shù)的優(yōu)點,提高泛化分類能力。
筆者提出基于多核學習的煤巖圖像特征融合與識別方法,采用不同的核組合對不同的特征進行多核學習,從而進行特征融合,而不是原來的特征直接級聯(lián),對于每個特征,訓練出最佳的SVM核組合以及各自的核權重,構成每個特征的核矩陣,最后將每個核矩陣組合起來再進行多核權重學習,得到二級權重,最后將學習得到的權重與對應的核矩陣相乘再求和,構成最終的核矩陣,對測試樣本的特征進行多核SVM分類。如圖1所示。
圖1:所提出方法的總體框架
多核學習(multiple kernel learning)是支持向量機的的擴展,是魯棒性和靈活性更強的基于核的學習模型,將數(shù)據(jù)投影到不同的核空間進行映射,能使數(shù)據(jù)在新的合成的空間進行更好的表達,從而提高分類精度。多核學習的重點是如何學習到各個核的權重系數(shù),一般模型為優(yōu)化分類器中核的線性組合:
其中主要算法有:基于半定規(guī)劃(SPD)的多核學習算法、基于二次約束型二次規(guī)劃(QCQP)的多核學習算法、基于半無限線性規(guī)劃(SILP)的多核學習算法、基于超核(Hyperkernels)的多核學習算法、簡單的多核學習算法(Simple MKL)、基于分組Lasso多核學習算法。本文采用簡單的多核學習算法(Simple MKL),因為其收斂快,計算復雜度低和相對成熟。簡單的多核學習(Simple MKL)將多核學習問題轉化為光滑且凸的優(yōu)化問題,然后采用迭代的方法先固定dm然后結合支持向量機訓練算法構建分類超平面,根據(jù)梯度下降方向更新dm。Simple MKL將多核學習問題轉化為如下優(yōu)化問題:
圖2:煤巖樣本圖像
式(4)的拉格朗日函數(shù)為:
表1:不同的特征融合方法的正確識別率
表2:不同煤巖識別方法的正確識別率
圖3:傳統(tǒng)MKL方法與傳統(tǒng)SVM方法比較
將(6)代入(5),則對偶問題為:
將(7)代入(2),最終得到的優(yōu)化公式如下:
上面的優(yōu)化問題只是針對單組數(shù)據(jù)進行的多核學習,在多種特征的圖像中,通過簡單的級聯(lián)不能充分表達煤巖圖像特征,針對上述問題,本文提出基于多核學習的煤巖圖像特征融合方法,在第一種特征中用一組核學習,得到對應的一組權重參數(shù),在第二種特征值用一組核學習,得到另一組權重參數(shù),然后將兩種參數(shù)分別代入到對應的核矩陣組成新的矩陣,再進行多核學習,從而得到第三組權重,在測試階段,三組權重組合成新的多核SVM分類器,進行識別。
其中T為特征種類數(shù),λt為對應特征的核矩陣的權重,kt為特征t的核矩陣,K*為總的多特征多核SVM的核矩陣。將(1)代入(9),得到:
在訓練時,先求出相應的dm,使然后令訓練出λt, 將dtm、λt代入(10),最后得到多特征融合的多核矩陣K。則由傳統(tǒng)的SVM得到的最后的判決函數(shù)如下:
一般的多核學習方法在初始化階段每個權重dm的值相等,為保證收斂速度,在開始我們隨機產(chǎn)生和為1的權重dm,使收斂速度加快。
為驗證所提出方法的有效性,以井下常見的煙煤、無煙煤和頁巖、砂巖為研究對象進行仿真實驗。本文涉及的方法均在MATLAB R2014a平臺上進行實驗驗證,并在配置為Intel Core i5-3210M 、2.50 GHz CPU,4 GB RAM的PC機下運行。
實驗樣本選取不同光照、不同角度的煙煤、無煙煤、頁巖和砂巖灰度圖像各60幅,共240幅,分為煤(煙煤、無煙煤)和巖(頁巖、砂巖)兩類,圖像大小為180×200,灰度級為256,圖像格式為jpg格式。部分煤巖樣本圖像如圖2所示。
為了驗證本文提出的多核學習算法的泛化能力,實驗中采用以下3種底層紋理特征描述子對煤巖圖像進行特征表示:
2.2.1 LBP特征
基本LBP算子特征提取。在3×3窗口內,以窗口中心像素灰度值為閾值,將相鄰八個像素的灰度值與其進行比較,若某像素的灰度值大于閾值,則將該像素的位置標記為1,否則為0。這樣3×3鄰域內的8個像素經(jīng)比較可產(chǎn)生8位二進制數(shù),可提取到256維的LBP特征向量。
2.2.2 Gabor特征
Gabor特征是一種可以描述圖像紋理信息的一種圖像特征,選取5個尺度,6個方向進行特征計算,得到30維特征向量。
2.2.3 灰度共生矩陣(GLCM)特征原始圖像灰度級數(shù)256級,為了減少計算量,壓縮圖像灰度級到16。步距d=1,分別計算0°、45°、90°、135°四個方向上的灰度共生矩陣,求每個方向灰度共生矩陣的能量、熵、慣性矩和相關,得到最終16維紋理特征。
對于rbf核與poly核,找到最佳的參數(shù)為σ=0.75和d=2,本次實驗取該兩種核函數(shù)進行實驗。
取煤巖樣本的GLCM特征和LBP特征,取一半樣本做訓練集,剩下的做測試集,重復十次,取結果的平均值,得到結果如下:
由圖3可看出,傳統(tǒng)MKL的識別率優(yōu)于傳統(tǒng)的SVM方法。
傳統(tǒng)的MKL只是SVM的多核擴展,本文提出的多特征多核支持向量機(feature fusion multiple kernel support vector machine)能對不同特征進行加權融合。然后我們對GLCM特征+SVM、LBP特征+SVM、本文提出的多特征融合多核SVM進行實驗,并且兩種特征都用最佳參數(shù)的核系數(shù)(GLCM特征的高斯核系數(shù)σ=[0.75,2],多項式核系數(shù)d=2,LBP特征的高斯核σ=[0.5,2],多項式核d=2),取煤和巖樣本各120張,每次實驗中每種樣本的數(shù)目依次為50、60、70、80、90,并從兩種樣本中取剩下圖片中的30張作為測試樣本。
從圖4可以看出,在測試樣本在70之前,多核多特征融合的學習方法明顯優(yōu)于單核的SVM方法,在測試樣本為60個,也就是50%的樣本數(shù)時識別率最高,達到98.33%。隨著測試樣本的增多,后期可能存在過擬合的風險,因此要控制測試樣本的比例。
通過2.1的方式構建訓練集和測試集,做了10組實驗,對實驗結果取平均值。參與比較的是通過級聯(lián)的特征融合與分類器融合,圖像特征選擇GLCM、Gabor、LBP。如表1所示。
通過與簡單的空間級聯(lián)方法的比較發(fā)現(xiàn),多特征融合的多核學習方法的煤巖識別率高于通過級聯(lián)的方法,表明從煤巖圖像中提取來的不同特征,經(jīng)過多核方法的融合,更能從圖像中提取各種異構的特征,多核融合發(fā)掘圖像的特征表達能力更強,從而提高識別率?;诓煌卣鹘M合的識別率分別提高了11.66%、7.50%、4.17%,說明簡單的級聯(lián)還不夠充分挖掘煤巖的特征信息,若利用樣本的類別的異構信息,則能更好地挖掘特征。
參與比較的其他方法有小波變換各層特征系數(shù)級聯(lián)SVM識別方法和基于曲波變換各層特征系數(shù)級聯(lián)SVM識別方法。綜合考慮煤巖正確識別率和時間復雜度,LBP+GLCM組合特征的表現(xiàn)最好,在比較時采用的是基于LBP+GLCM的特征融合的識別方法。不同煤巖識別方法的正確識別率如表2所示。
從表2中數(shù)據(jù)得出,本文提出的多特征融合多核學習方法的煤巖識別率高于其他兩種方法,說明了從特征加權與多核學習角度來改善煤巖圖像的識別性能是今后提高煤巖正確識別率的又一條重要的途徑。
圖4:本文提出的多核學習方法和傳統(tǒng)的SVM方法比較
(1)本文提出的多特征多核學習方法,充分利用單特征的異構信息和多類別特征信息進行融合,提高了區(qū)分煤巖圖像的能力,使得不同類別的特征能用不同的核表示,提高泛化能力,優(yōu)于傳統(tǒng)的SVM分類,從而達到更好的分類識別效果。
(2)與其它特征融合方法相比較,提出的多核學習方法具有更高的煤巖正確識別率,驗證了所提出方法的有效性。
(3)另外從多核學習和多特征融合角度提高煤巖圖像識別正確率,為進一步研究煤巖界面的自動檢測提供了一種新的思路。