宋佳聲 王永堅 戴樂陽
(1.集美大學輪機工程學院 福建廈門 361021;2.福建省船舶與海洋工程重點實驗室 福建廈門 361021)
散落于潤滑系統(tǒng)中的大量磨損顆粒蘊含著當前機械設備的磨損狀態(tài)信息[1]。為了監(jiān)測設備的磨損狀態(tài),鐵譜分析技術首先通過在線或者離線光學成像系統(tǒng)獲取含有這些磨粒的鐵譜圖像,再通過圖像分割方法找出其中的磨粒區(qū)域,進而分析設備磨損性質和狀態(tài)。鐵譜圖像的分割是自動化鐵譜分析技術的關鍵步驟,它對于自動監(jiān)測設備磨損狀態(tài)有著重要的意義。所謂分割是指將鐵譜圖像劃分為2個或多個區(qū)域,直到所有感興趣的目標(磨粒)被劃分出來為止。在分割的結果(圖像分割出來的區(qū)域)中,一般把感興趣的目標所對應的區(qū)域稱為前景,比如鐵譜圖像的磨粒區(qū)域,其他的區(qū)域稱為背景。雖然前景磨粒所呈現(xiàn)的形態(tài)復雜多變,但其背景區(qū)域的灰度卻相對一致?;阼F譜圖像這一特征,閾值法常常被用于鐵譜圖像的分割,因為閾值法正是基于一致性假設的圖像分割方法。傳統(tǒng)閾值法包括最大方差法[2]、最大熵法[3]和最小誤差法[4],它們在鐵譜圖像分割中被廣泛使用。比如,樊紅衛(wèi)等[5]針對鐵譜圖像背景特征,提出了基于反相操作的鐵譜圖像的灰度圖,據(jù)此采用三段式閾值法分割該灰度圖。金路和王靜秋[6]將閾值法和形態(tài)學方法結合,提高了鐵譜圖像的分割精度。溫廣瑞等[7]首先基于差商構造第一類可接受函數(shù)和第二類可接受函數(shù),然后結合實驗數(shù)據(jù)確定兩類誤差,選取同時滿足兩類誤差的最小灰度值作為分割閾值。邱麗娟等[8]將Otsu法與聚類算法結合實現(xiàn)了對彩色磨粒的分割。魯秋菊和拓守恒[9]針對多閾值選取的問題提出了自適應步長方案實現(xiàn)對彩色圖像的全局分割。徐守坤等[10]在Otsu法的基礎上結合均勻性測度函數(shù)實現(xiàn)閾值的自適應選擇以完成對水面圖像的閾值分割。
然而,目前探討這3種傳統(tǒng)閾值法在鐵譜圖像分割中應用比較的文獻卻鮮有見到。為了探究它們在鐵譜圖像分割中的不同之處,并進一步討論閾值法對鐵譜圖像分割的適應性,本文作者從算法原理和實驗2個角度對3種傳統(tǒng)閾值法進行了比較分析。
將鐵譜灰度圖像定義為二維空間函數(shù)I(x,y):R2→R,它定義了從二維像素空間到灰度值的映射函數(shù)。首先,應用某種方法根據(jù)圖像某些屬性確定一個閾值t。然后,將圖像每一個像素的灰度值與之比較,得到一個邏輯矩陣(圖像)B(x,y),如式(1)所示,其中等于1的區(qū)域一般對應于前景目標。
(1)
對于一個給定的灰度圖像,假設任意灰度值(灰階)i的分布范圍為[1,2,......,L],并且設定灰度值等于灰階i的像素個數(shù)為ni,則圖像的總像素個數(shù)為N=n1+n2+......+nL。針對在該圖像灰階統(tǒng)計的直方圖中,灰階i的概率密度函數(shù)估計為
(2)
如前所述,在某個閾值t下圖像所有像素被劃分為2個集合C1和C2,從灰階的角度可以計算相應的各階中心矩統(tǒng)計量。對于集合C1中的灰階統(tǒng)計,則有:
(3)
(4)
(5)
對于C2中的各灰階統(tǒng)計,則有
(6)
(7)
(8)
其中的ωi、μi和σi分別是集合Ci的權重、均值和標準方差?;谶@些統(tǒng)計量提出最優(yōu)化準則以確定最優(yōu)的分割閾值,最為常用和基本的有以下幾種:
(9)
(2)最大熵值法(Maximum Entropy[2],后文簡稱為MaxEntropy法):基于任意閾值t分割出前景C1和背景C2區(qū)域,根據(jù)公式(3)、(4)、(5)和(6)計算相應的權重和均值,并代入式(10)求解C1和C2區(qū)域的熵值H1(t)和H2(t),進一步求解熵值H最大時所對應的閾值t*,據(jù)此分割出前景目標。
(10)
(11)
分割實驗的原始數(shù)據(jù)是30幅標準灰度鐵譜圖像[11],分割目的是準確分割出視場中出現(xiàn)的主要磨粒。分割結果將和手工標定的Ground Truth數(shù)據(jù)比較,最后輸出都是一個邏輯圖像,邏輯“1”表示對應于磨粒前景,邏輯“0”表示對應于背景。采用了像素級的評價指標,為此對任意像素的分類定義如圖1所示。矩形區(qū)域表示整體圖像,其中虛線橢圓所圍區(qū)域表示真實的磨粒區(qū)域,實線橢圓所圍區(qū)域表示算法分割出的磨粒區(qū)域,如此將整個矩形圖像空間分成了4個區(qū)域(TN、FN、FP和FP),分別采用不同的圖案填充。
圖1 TP、TN、FP、FN的定義
基于該定義,表1列出了6種經(jīng)常被采用的像素級評價指標及其計算方法[12-13]??紤]到其中每2個指標是互補關系,文中選用檢出率DR、誤檢率FAR和準確度Accuracy這3個指標。檢出率反映算法所分割出的磨粒完整度,誤檢率FAR反映出算法檢出的磨粒中有多少比例是不可信的,其值越大說明分割中有效的磨粒占比越少。準確度是一個綜合性指標,能夠評價算法的優(yōu)劣。
表1 鐵譜圖像分割評估指標
3種自適應閾值法對30幅鐵譜圖像進行分割,并將分割結果與Ground Truth比照,計算3個評價指標。3種方法的準確率如圖2所示。可知,有5個圖像的分割結果存在差異,其余25組數(shù)據(jù)采用3種算法的準確度是比較接近的。因此,下面將30幅鐵譜圖像分為兩組討論,一組是分割結果接近的25幅圖像,另外一組是分割結果差異顯著的3幅圖像(14號、20號和21號)。
圖2 3種自適應閾值算法對30幅鐵譜圖像分割的準確度
(1) 第1組鐵譜圖像分割結果比較分析
由表2可知,Otsu方法的檢出率最低,但其誤檢率也最低;最大熵值法檢出率最高,誤檢率也比較低;最大誤差法檢出率與最大熵值法接近,但其誤檢率最大;3種方法在綜合評價指標準確度(Accuracy)上表現(xiàn)比較接近,偏差小于0.01。這些數(shù)據(jù)表明,對于一般的鐵譜圖像分割問題,3種方法的分割結果基本一致。圖3更直接地說明了表2所得到的統(tǒng)計結果,Otsu法分割的誤檢最少,MinErr法卻將很多背景噪聲誤檢為前景目標。之所以會有這樣的差異,是因為它們選用了不同的閾值。圖4顯示了對圖3中原圖分割時所采用的3種閾值,分別為82、34和23,這些閾值分別對應著相應目標函數(shù)曲線的最大值或最小值點。圖4所示分別是類間方差函數(shù)曲線、熵值曲線、最小誤差估計曲線和灰度分布的概率密度估計曲線(直方圖),相應的極值點t*用“▼”標示。
表2 3種自適應閾值算法分割結果評價指標均值
圖3 3種算法的分割結果Fig 3 Segmentation results of three thresholding methods (a)Otsu method;(b)MaxEntropy method;(c)MinErr method
(2)第2組鐵譜圖像分割結果比較分析
在圖2中,3種分割算法的準確度出現(xiàn)較大差異的是14號、20號和21號鐵譜圖像,現(xiàn)將它們的分割圖像顯示如表3所示。Otsu法的誤檢率都超過90%,MaxEntropy法和MinErr法的平均誤檢率分別為29%和1.5%,平均準確度依次為0.650 1、0.976 3和0.964 9??梢?,Otsu法對于這3幅圖像的分割結果基本是錯誤的,而MaxEntropy法和MinErr法的分割結果接近。其中,MinErr法的誤檢率極小,但因其檢出率不高而在準確度上稍小于MaxEntropy法。FAN和XIE[14]從熵值理論上重新推演了MinErr法的目標函數(shù),也就是說,它只是采用了不同熵值表達下的最優(yōu)解,這也解釋了為什么其分割結果與MaxEntropy法趨同。
表3 3種閾值法分割結果的比較
另外,從圖像灰度分布來看,第一組25幅圖像的灰度分布呈現(xiàn)出雙峰模態(tài)特征,但第二組3幅圖像的直方圖則完全不同(見表3)。首先,它們有著極其相似的分布概率圖。然后,它們都呈現(xiàn)出單峰模態(tài),或者占比極其懸殊的雙峰模態(tài)。圖5顯示了第21號鐵譜圖像的灰度直方圖,并給出了3種方法在分割該樣本時所采用的閾值。如果對圖中分布曲線進行平滑處理則會呈現(xiàn)單峰分布特征,Otsu法選擇的閾值試圖將主峰分開為2個權重相似的分布,得到最小的類間誤差。而MinErr法則依然用2個高斯分布模擬其概率分布,并在波谷位置找到閾值,使得這樣雙模態(tài)假設下的誤差最小。
圖5 鐵譜圖像21號的灰度直方圖及3種分割算法的閾值
(1)最大類間方差法、最大熵值法和最小誤差法是3種基于直方圖的閾值分割法,它們采用了不同的目標函數(shù),在極值化這些函數(shù)過程中產(chǎn)生了不同的閾值。
(2)30組鐵譜圖像的分割實驗表明,在對有著不同的灰度分布特點的鐵譜圖像進行分割時,3種方法的表現(xiàn)差異明顯:當鐵譜圖像灰度呈現(xiàn)明顯的雙峰分布,且磨粒目標區(qū)域和背景區(qū)域在面積上差異并不懸殊時,3種方法的分割結果有著相似的準確度,最大類間方差法的分割效果略好于其他兩者;當鐵譜圖像灰度呈現(xiàn)單峰(磨粒區(qū)域的灰度值與背景接近),或者磨粒區(qū)域占比較小時,最小誤差法有著最優(yōu)的分割效果,最大方差法則不能正確分割出磨粒目標。因此,在鐵譜分析過程中,應該根據(jù)鐵譜圖像的灰度分布特點選擇相應的閾值分割算法。