李文斌 李瑞華
摘 要:為了解決傳統(tǒng)K-means聚類算法對舌圖像中舌苔舌質(zhì)分離效果不穩(wěn)定的問題,提出了一種優(yōu)化K-means聚類的舌苔舌質(zhì)分離模型。模型綜合RGB,HSV,L*a*b* 3種顏色空間的特性,將單通道舌圖像像素作為聚類樣本集合,以一定的規(guī)則從集合中選取2個舌圖像通道的像素作為聚類樣本,并利用單通道舌圖像分布直方圖的峰值確定初始聚類中心點,最后通過聚類實現(xiàn)舌苔舌質(zhì)分離。實驗結果表明,選擇用雙通道舌圖像作為聚類樣本比用三通道或者單通道舌圖像聚類效果更優(yōu),且提出的初始聚類中心點的確定方法相比于傳統(tǒng)K-means聚類算法更準確、穩(wěn)定地使舌苔舌質(zhì)分離。所提方法可以很好地實現(xiàn)舌苔舌質(zhì)分離,為中醫(yī)舌診客觀化的研究提供了新的方法和思路,具有一定的實用價值。
關鍵詞:計算機圖像處理;舌診客觀化;舌苔舌質(zhì)分離;K-means聚類;顏色空間;分布直方圖
中圖分類號:TP39141文獻標識碼:A
doi: 10.7535/hbgykj.2020yx05002
收稿日期:2020-03-24;修回日期:2020-07-13;責任編輯:陳書欣
基金項目:河北省自然科學基金(F2016403055);河北省高等學??茖W研究計劃項目(ZD2016005)
第一作者簡介:李文斌(1974—),男,江西南昌人,教授,博士,主要從事大數(shù)據(jù)與機器學習等方面的研究。
E-mail:25304189@qq.com
李文斌,李瑞華.
一種優(yōu)化K-means聚類的舌苔舌質(zhì)分離方法[J].河北工業(yè)科技,2020,37(5):300-308.
LI Wenbin,LI Ruihua.
A separation method of tongue coating and body with optimized K-means clustering
[J].Hebei Journal of Industrial Science and Technology,2020,37(5):300-308.
A separation method of tongue coating and body
with optimized K-means clustering
LI Wenbin, LI Ruihua
(College of Information Engineering, Hebei GEO University, Shijiazhuang, Hebei 050031, China)
Abstract:
In order to solve the problem that the traditional K-means clustering algorithm was not stable for the separation of tongue coating and body in tongue image, an optimized K-means clustering model for tongue coating and body separation was proposed. The three color space characteristics of RGB, HSV andL*a*b* were integrated in the model, the pixels of single-channel tongue image were taken as the clustering sample set and the pixels of two tongue image channels from the set with certain rules were selected as clustering samples. The peak value of the single-channel tongue image distribution histogram was used to determine the initial cluster center point, and finally the tongue coating and body were separated through cluster. The experimental results show that the effect of this model by using two-channel tongue images as clustering samples is better than that of three-channel or single-channel tongue image clustering, and compared to the traditional K-means clustering algorithm, the method of determining the initial clustering center point on the tongue coating and body separation is more accurate and stable. The method can achieve the separation of tongue coating and body, which provides a new method and idea for tongue diagnosis objectification in traditional Chinese medicine, and has certain practical value.
Keywords:
computer image processing; tongue diagnosis objectification; tongue coating and body separation; K-means clustering; color space; distribution histogram
舌診屬于中醫(yī)四診“望、聞、問、切”中的望診,中醫(yī)認為,舌苔由胃氣所生,舌苔變化可反映臟腑的寒、熱、虛、實。傳統(tǒng)中醫(yī)舌診往往受到醫(yī)師經(jīng)驗水平、臨床閱歷以及診察環(huán)境的限制,診斷結果常產(chǎn)生偏差[1],且該方法很難對舌像狀況進行量化,一定程度上限制了中醫(yī)臨床療效的提高。因此,
將標準化、客觀化研究引入傳統(tǒng)中醫(yī)舌診是中醫(yī)現(xiàn)代化進程的一項重要內(nèi)容。
中醫(yī)舌診客觀化包括舌分割、舌苔舌質(zhì)分離和計算機自動診斷3個步驟。舌分割指從舌、嘴唇(包含牙齒)以及嘴部周圍皮膚組成的圖像中,自動分離出舌體的過程;舌苔舌質(zhì)分離指從舌圖像中將舌苔和舌質(zhì)部分分離的過程,本質(zhì)都屬于圖像分割;計算機等對舌苔和舌質(zhì)圖像的顏色、紋理、輪廓等信息進行分析,并與舌診圖片庫進行比較,得出舌像分析結果。
國內(nèi)外學者從20世紀80年代開始,利用計算機圖像技術對舌像進行了數(shù)字化分析,開始了對舌診客觀化的探索。近年來,中醫(yī)舌診客觀化方法大量涌現(xiàn)。劉明等[2]在高光譜圖像上進行了舌苔位置的判斷和提取,為下一步計算機自動診斷做好準備。高清河等[3]利用數(shù)字圖像處理技術,詳細研究了舌像的特征提取,并利用圖像濾波實現(xiàn)了舌像分割和舌苔舌質(zhì)的分離。王學民等[4]設計了一種基于雙光源的舌質(zhì)舌苔分離系統(tǒng),研究了白、綠光源對舌質(zhì)舌苔分離效果的影響,用Snakes及聚類算法實現(xiàn)了舌苔舌質(zhì)的分離。韓立博等[5]提出一種基于直方圖均衡化的伽馬校正和K-means聚類的舌苔、舌質(zhì)分離方法。逢甲大學邱創(chuàng)干利用影像處理技術對舌苔性質(zhì)做定量分析研究,其方法已經(jīng)成為行業(yè)研究者的共識。
舌苔舌質(zhì)分離[6]方法主要可歸納為2類:基于閾值的分離法和基于聚類的分離法。傳統(tǒng)閾值分離法通常根據(jù)專家提供的數(shù)據(jù)和實驗結果確定經(jīng)驗閾值,利用該閾值對舌像進行二值化,進而分離舌苔和舌質(zhì)。然而舌苔和舌質(zhì)顏色種類諸多,用單一固定的閾值分離舌苔和舌質(zhì),大大降低了舌像集的分離準確率。文獻\在傳統(tǒng)閾值分離法的基礎上,提出使用多個色彩通道動態(tài)選取閾值,但某些舌苔和舌質(zhì)灰度級極其相似,舌苔和舌質(zhì)可能會交匯出現(xiàn),呈現(xiàn)苔中有質(zhì)、質(zhì)中有苔的情況,影響舌苔舌質(zhì)分離。
與基于閾值的分離法相比,基于聚類的分離法自適應性更強,且減小了舌苔舌質(zhì)交匯造成的分離誤差。文獻\將舌圖像分別投影到R通道(RGB顏色空間分量)、L*通道(L*a*b*顏色空間[9]分量)、a*通道(L*a*b*顏色空間分量)和H通道(HSV顏色空間[10]分量)上,并對各通道舌圖像像素進行K-means聚類得到2個集合,比較后發(fā)現(xiàn)a*通道舌圖像聚類效果最好。然而,K-means聚類算法對初始中心點位置極其敏感,隨機選擇的初始聚類中心點可能會導致聚類結果陷入局部最優(yōu)解。文獻\通過為每張舌圖像挑選2個最適合的通道作為聚類樣本進行K-means聚類,但提出的RG屬性對拍攝環(huán)境的依賴程度較高,其他研究者很難將其實驗條件完全復制。文獻\提出將彩色圖像由RGB顏色空間轉(zhuǎn)換為L*a*b*顏色空間,避免了因RGB顏色空間各色彩通道高度線性相關[13]而引起的誤差。待分割圖像每個像素由L*,a*,b*3個分量組合表示,將所有像素作為聚類樣本進行K-means聚類,可以獲得較好的分割效果?;谏疃葘W習的方法因準確率高而受到廣泛關注,但其訓練需要大量的樣本數(shù)據(jù),且因醫(yī)學圖像的特殊性,影響了此方法在舌苔舌質(zhì)分離的應用。
以上述研究內(nèi)容為基礎,提出一種基于K-means聚類算法的舌苔舌質(zhì)分離模型(tongue coating and body separation, TCBS)。模型考慮了多種顏色空間的性質(zhì),保證了可見光色譜獲取的廣泛性。為避免K-means聚類算法陷入局部最優(yōu)解的情況,模型利用單通道舌圖像像素分布直方圖為聚類選取了合適的初始聚類中心點。
1?TCBS模型
TCBS模型由舌分割、舌圖像預處理和舌苔舌質(zhì)分離3部分組成,如圖1所示。首先,對獲取到的圖像用GrabCut分割算法[14]得到只包含舌的圖像。
然后,將RGB舌圖像轉(zhuǎn)換為單通道灰度圖像。將任意2個單通道舌圖像像素值對應組合,得到舌圖像的雙通道表示。接著,依據(jù)像素分布直方圖確定合適的雙通道舌圖像K-means聚類初始中心點。最后,根據(jù)得到的初始中心點將雙通道舌圖像聚為2類,記錄各類像素點位置坐標,將分離的2類坐標還原在RGB舌圖像評價效果最好的2個通道組合,得到舌苔和舌質(zhì)。
1.1?舌分割
所謂圖像分割指的是根據(jù)灰度、顏色、紋理和形狀等特征把圖像劃分成若干互不交疊的區(qū)域,并使這些特征在同一區(qū)域內(nèi)呈現(xiàn)出相似性,而在不同區(qū)域間呈現(xiàn)出明顯的差異性。圖像分割算法包括:基于閾值的分割、基于邊緣的分割、基于區(qū)域的分割、基于圖論的分割和基于能量泛函的分割等方法。TCBS模型采用基于圖論的分割算法GrabCut實現(xiàn)交互式舌圖像分割。GrabCut是基于GraphCut算法的原理改進而來,利用高斯混合模型來描述像素的分布,并采用迭代估計法實現(xiàn)能量最小化,是目前比較優(yōu)秀實用的算法之一[15]。GrabCut算法的基本原理和步驟包括:1)用框選出目標區(qū)域,將選框以外的部分視為背景區(qū)域,將選框以內(nèi)的區(qū)域視為可能的前景區(qū)域;2)計算前景和背景的高斯混合模型;3)依據(jù)圖像像素點建立一個圖,對該圖求最小分割。如此循環(huán)直至收斂,由此判斷選框內(nèi)的前景區(qū)與背景區(qū)。
圖2 a)為舌分割時帶選框的圖像,圖2 b)為CrabCut從目標區(qū)域中識別出的前景區(qū)(即舌體),圖2 c)為去除黑色背景后得到的舌圖像,將其大小統(tǒng)一設置為300像素×300像素。從圖2中不難看出,GrabCut算法非常適合于舌分割。
1.2?舌圖像預處理
目前,多數(shù)舌苔舌質(zhì)分離方法都是基于單通道灰度圖像,再將分離過后的灰度圖像轉(zhuǎn)化為RGB彩色舌圖像。然而,單通道灰度圖像由于未考慮到其他通道對舌圖像的影響而導致分離結果不準確。所以考慮選2個通道來改進這一缺點,文獻\均在2個通道上進行舌圖像處理?;诖?,TCBS模型也選擇2個通道為研究對象。
1.2.1?獲取聚類樣本點
聚類樣本點的選擇對聚類算法來說至關重要。HSV顏色空間從人的視覺出發(fā),用色調(diào)、飽和度和亮度作為顏色的表達方式,不用考慮光照等的影響,這種顏色表述方式容易理解,符合人們的思維習慣。L*a*b*顏色空間覆蓋了全部的可見光色譜,相比于其他的模型,它可以更準確地表述各種色彩。由于舌苔的顏色一般為白色、黃色和灰黑色,而舌質(zhì)顏色一般為淡紅色、深紅色和暗紅色,所以應選擇可以將以上顏色有效區(qū)分開的顏色空間分量值作為K-means聚類的樣本點。RGB顏色空間的R通道舌圖像的聚類結果會受到光照不均勻等因素的影響,出現(xiàn)舌苔和舌質(zhì)分割錯誤甚至分割完全失敗的情況;HSV顏色空間的H通道聚類結果一般,會呈現(xiàn)分割不完全的狀態(tài),所以TCBS模型選擇B,G,V,L*,a*和b*6個分量。圖3給出了上述6個單通道舌圖像、L*a*b*顏色空間舌圖像以及HSV顏色空間舌圖像。值得一提的是:RGB顏色空間不能直接轉(zhuǎn)換為L*a*b*顏色空間,需要借助CIE XYZ顏色空間,把RGB顏色空間轉(zhuǎn)換到CIE XYZ顏色空間,再把CIE XYZ顏色空間轉(zhuǎn)換到L*a*b*顏色空間。HSV顏色空間可以用相關公式由RGB顏色空間得到。
將上述6個單通道舌圖像像素值兩兩對應組合,共得到15種組合,分別為{B,G},{B,V},{B,L*},{B,a*},{B,b*},{G,V},{G,L*},{G,a*},{G,b*},{V,L*},{V,a*},{V,b*},{L*,a*},{L*,b*},{a*,b*}。由此可知,聚類樣本點為雙通道舌圖像像素值。TCBS模型對上述15組聚類樣本點分別聚類,選擇分離效果最好的舌苔和舌質(zhì),并記錄對應的2個通道。
1.2.2?獲得初始聚類中心點
目前,多數(shù)舌苔舌質(zhì)分離方法在選用K-means算法實現(xiàn)時,均未考慮初始聚類中心點對分離效果的影響。然而傳統(tǒng)K-means算法會由于隨機選擇
初始聚類中心點而導致算法效果不穩(wěn)定,可能使算法陷入局部最優(yōu)解的情況,因此提出了一種確定K-means初始聚類中心點的方法。
K-means算法初始聚類中心點的確定主要依據(jù)各通道舌圖像像素的分布直方圖。TCBS模型首先為6個通道評分,然后針對每組聚類樣本點,依據(jù)得分高的通道分布直方圖來確定該組初始聚類中心點。具體評分過程和確定初始聚類中心點步驟如下所述。TCBS模型借鑒文獻\和文獻\中的方法對各通道進行評分,主要步驟包括:畫各通道分布直方圖、對各分布直方圖求閉運算、對閉運算后直方圖的輪廓平滑化、對各通道進行評分。
1)畫各通道分布直方圖。如圖4所示,直方圖的橫坐標為該通道像素值的取值范圍,即[0,255],縱坐標為各像素值對應的像素點的個數(shù)。TCBS模型按式(1)對分布直方圖的縱坐標進行歸一化處理(舌圖像大?。?00像素×300像素):
y′(i)=y(i)y_max(i)×300,(1)
式中:y(i)為各像素值對應像素點的個數(shù);y_max(i)為{y(1),y(2),…}中的最大值;y′(i)為歸一化后的結果。
2)各分布直方圖求閉運算。為了對分布直方圖的輪廓進行平滑化處理以便更明顯地觀察峰值,首先對以上分布直方圖進行閉運算,即對直方圖先做膨脹再做腐蝕運算。膨脹將與分布直方圖連接的所有部分合到一起,使邊界向外部擴張,填補圖像中出現(xiàn)的空洞;腐蝕則消除圖像邊界點,使邊界向內(nèi)部收縮,可以消除一些對整體圖像意義不大的部分??梢?,閉運算對分布直方圖中的近鄰進行了連接,填充分布直方圖內(nèi)細小空洞,平滑了其邊界,從而便于提取分布直方圖的輪廓,如圖5所示。
3)對直方圖輪廓平滑化。為了便于通道評分時的面積計算和更明顯地觀察直方圖的峰值,需要對直方圖的輪廓進行平滑化處理。TCBS模型采用的平滑化分布函數(shù)如式(2)所示:
Y(i)=300-min_rowi,(2)
式中:Y(i)表示平滑化分布函數(shù),i是各通道對應的像素值,也是分布直方圖輪廓的列值;min_rowi是輪廓圖中第i列像素點中灰度值不為0的像素點行數(shù)的最小值。
4)對各通道進行評分。評分公式如式(3)所示。
G=s_ip1+s_ip2s_all×dis×i_p1i_min,(3)
式中:G為通道的直方圖得分結果;s_ip1為直方圖最高峰所覆蓋的面積;s_ip2為直方圖第2峰所覆蓋的面積;s_all為整個平滑化分布直方圖所覆蓋的面積,dis為最高峰和第2峰之間的距離,i_p1為最高峰所對應的像素值;i_min為最高峰和第2峰之間谷底所對應的像素值。
s_ip1=Y(i_p1)+∑5m=1(Y(i_p1-m)+
Y(i_p1+m)),(4)
s_ip2=Y(i_p2)+∑5m=1(Y(i_p2-m)+
Y(i_p2+m)),(5)
s_all=∑255i=0Y(i),(6)
dis=|i_p1-i_p2|,(7)
式中i_p2確定方法如下:i_p2選取除去s_ip1所包含的范圍內(nèi)使得平滑化分布直方圖達到最高點的列值,且若以該點為中心,左右2個點均遞減,則選擇該點為i_p2。
求出6個通道得分之后,每組確定初始聚類中心點的方法如下。
1)假設某通道組合{f1,f2},f1和f2對應的得分分別為s_f1和s_f2。
2)如果s_f1>s_f2,從f1對應的輪廓平滑化分布直方圖中找到最高峰、第2峰所對應的像素值,設為i_p1,i_p2。遍歷該雙通道舌圖像的所有像素點,找到f1通道的像素值為i_p1的所有像素點,并求這些像素點的f2通道的像素值的平均值,設為i_p1′;再找到f1通道的像素值為i_p2的所有像素點,并求這些像素點的f2通道的像素值的平均值,設為i_p2′。將((i_p1,i_p1′),(i_p2,i_p2′))作為初始聚類中心點(質(zhì)心)。
3)如果s_f1 1.3?舌苔舌質(zhì)分離 將15組兩通道樣本點都聚為2類,記錄每組中各類的像素點坐標,然后每組依據(jù)像素點坐標將2個類別還原為原始RGB彩色圖像。此時,共得到15組舌苔和舌質(zhì),然后對每組聚類效果進行評價,挑選效果最好的組合,作為該舌圖像的舌苔和舌質(zhì)分離結果。具體的聚類步驟如算法1所示。 算法1?基于聚類的苔質(zhì)分離算法。 輸入:一幅由2個通道(設為{f1,f2})表示的圖像。 輸出:2類結果,分別為舌苔、舌質(zhì)。 1)將k值設定為2; 2)將f1和f2對應的得分分別設定為s_f1和s_f2; 3)for i=the first pixel to the last pixel //遍歷圖像的90 000個像素點; 4)判斷s_f1和s_f2的大小,確定初始聚類中心(質(zhì)心); 5)計算每一個像素點與其質(zhì)心的距離,將像素點劃分到較近的質(zhì)心所屬的類別; 6)重復第5步,直到收斂。 顯然,將不同的組合輸入算法1,將得到不同的苔質(zhì)分離結果。 文獻\采用CH指數(shù)、I指數(shù)、avgbwp指數(shù)的方式對不同的聚類結果進行評價。然而,在實驗中發(fā)現(xiàn),由于舌苔在舌體上分布存在不連續(xù)等復雜性因素,通過文獻中的方法將最好的分離結果比較出來具有一定的難度。因此,TCBS模型采用如式(8)所示的苔質(zhì)分離效果指數(shù)對每種分離結果進行比較。dit_s值越小表示該組合的效果越好。 dit_s=|s_r-s_x|s_r,(8) 式中:dit_s表示相對面積差,s_r表示人工手動分離舌苔的面積,s_x表示當前組合分離出的舌苔面積。 按式(8)對15種聚類結果進行比較,其結果如圖6所示??梢?,效果最好的組合為屬性組合{G,b*},TCBS模型則將{G,b*}對應的聚類結果作為最終的輸出結果,如圖7所示。 2?實驗設計與分析 為驗證本文方法的有效性及適用性,將其與當前主流的舌苔舌質(zhì)分離方法進行對比。實驗所選用的醫(yī)學舌圖像(共50張,大?。?00像素×300像素)均來自《中醫(yī)舌診大全》。 2.1?不同方法分離結果及分析 比較了TCBS模型與目前主流的舌苔舌質(zhì)分離方法的實驗結果,具體方法如下所述: 1)隨機選擇初始聚類中心點的情況下,RGB三通道舌圖像像素聚類(以下簡稱random_RGB); 2)確定初始聚類中心點的情況下,RGB三通道舌圖像像素聚類(以下簡稱determine_RGB); 3)隨機選擇初始聚類中心點的情況下,HSV三通道舌圖像像素聚類(以下簡稱random_HSV); 4)確定初始聚類中心點的情況下,HSV三通道舌圖像像素聚類(以下簡稱determine_HSV); 5)隨機選擇初始聚類中心點的情況下,L*a*b*三通道舌圖像像素聚類(以下簡稱random_L*a*b*); 6)確定初始聚類中心點的情況下L*a*b*三通道舌圖像像素聚類(以下簡稱determine_L*a*b*); 7)隨機選擇初始聚類中心點的情況下,a*單通道舌圖像像素聚類(以下簡稱random_a*); 8)確定初始聚類中心點的情況下,a*單通道舌圖像像素聚類(以下簡稱determine_a*)。 圖8顯示了上述各方法與本文方法的分離結果, 其中第1列表示原始圖像,第2列表示舌圖像,第3列表示分離得到的舌苔圖像,第4列表示分離得到的舌質(zhì)圖像。 圖8 a)、c)、e)、g)表示K-means算法在隨機選擇初始聚類中心點的情況下,對不同顏色空間舌苔舌質(zhì)的分離結果,圖8 b)、d)、f)、h)表示K-means算法在用本文方法確定了初始聚類中心點后對不同顏色空間舌苔舌質(zhì)分離的結果,圖8 i)表示TCBS模型分離得到的舌苔和舌質(zhì)。 圖8分離結果的原因分析如下。 1) 確定了初始聚類中心點的聚類算法的分離結果比隨機選擇初始聚類中心點的結果更準確。產(chǎn)生這種分離結果的原因是:隨機選擇初始聚類中心點,每次聚類結果不穩(wěn)定,且隨機選出的2個中心點并不能完全反映出舌苔和舌質(zhì)的像素信息。本文利用單通道舌圖像分布直方圖的最高峰和第2峰來確定初始聚類中心點,最高峰和第2峰代表了在舌圖像上色彩分布最多的2個像素值,所以確定的2個初始聚類中心點可以很好地反映出舌苔和舌質(zhì)的像素信息。所以用選出的點作為初始聚類中心點得到的聚類結果更穩(wěn)定且更準確。 2) TCBS模型選用的雙通道舌圖像比其他顏色空間舌圖像的分離效果更好。產(chǎn)生這種分離結果的原因是:RGB,HSV,L*a*b*3種顏色空間,各自的單通道分量之間相關性太強,3個通道并不是真正意義上的互補,作為聚類樣本沒有考慮到其他一些顏色空間信息對聚類結果的影響。單通道舌圖像直接作為聚類樣本只考慮了一個通道對聚類效果的影響,而忽略了其他顏色空間。TCBS模型選用的雙通道舌圖像綜合了3個顏色空間的單通道,選擇影響力最大的2個通道作為聚類樣本,所以聚類效果優(yōu)于其他顏色空間舌圖像。 為了更直觀地顯示圖8得到的分離結果,且進一步驗證TCBS模型的可行性,采用下述MSE相似度(如式(9)所示)、均值哈希相似度(mean hash similarity)、差值哈希相似度(difference hash similarity) 和相對面積差(relative area difference)(如式(8)所示)4種評價指數(shù)作為評價標準。使人工分離得到的舌苔作為基準,將TCBS模型得到的舌苔與上述8種方法得到的舌苔圖像進行對比。 MSE=1mn∑m-1i=0 ∑n-1j=0[I(i,j)-K(i,j)]2,(9) 式中:m和n分別表示圖像的寬和高,I和K分別表示2張測試圖片對應的像素值,即將2張測試圖片對應位置的像素值相減,然后將結果累積起來即可。 上述4種評價指數(shù)均表示值越小分離效果越理想,為了更直觀的比較,采用式(10)對上述各方法進行了歸一化處理。 Ni=Ni∑i=ni=1Ni,(10) 式中:Ni為歸一化后的第i種方法的指數(shù)值;Ni為第i種方法。 圖9為TCBS模型與上述8種舌苔舌質(zhì)分離結果的對比。 從圖9不難看出,TCBS模型4個指標的值均小于其他8種方法得到的指數(shù)值,驗證了雙通道組合方法分離結果優(yōu)于單通道和三通道方法。從圖9也可以看出,對于同一顏色空間(如RGB顏色空間),隨機選擇初始聚類中心點的聚類方法(如random_RGB)的上述4種評價指數(shù)基本上都大于確定初始聚類中心點的聚類方法(如determine_RGB)的指數(shù)值。由于4種評價指數(shù)均是值越小,聚類效果越理想,所以進一步驗證了本文提出的確定初始聚類中心點方法的可用性。 2.2?TCBS模型有效性驗證 為驗證TCBS模型的有效性,將50張原始圖像數(shù)據(jù)集均用TCBS模型處理,得到舌苔和舌質(zhì)。統(tǒng)計每張圖像分離效果最好的2個通道,共得到100個通道,計算各通道的占比,最后得出G和L*通道占比最高。G通道為綠色通道,而舌質(zhì)一般為紅色,舌苔一般為白色、黃色和灰黑色,在該通道下各顏色可以更明顯得到顯示;另外,一般情況下,舌苔的反光能力強于舌質(zhì),所以L*通道能更明顯地區(qū)分舌苔和舌質(zhì)。鑒于此,50張舌圖像聚類樣本點可以直接選擇用G和L*2個通道舌圖像像素值。對樣本點聚類,再還原為RGB彩色圖像,得到舌苔和舌質(zhì)圖像。數(shù)據(jù)集90%的圖像可以取得較好的結果。圖10給出了在50張圖像數(shù)據(jù)集上任意選擇的3張原始圖像,用G和L* 2個通道舌圖像像素值作為聚類樣本,聚類得到的舌苔和舌質(zhì)分離結果。直觀上看,TCBS模型對白、黃、灰黑苔的分離結果均比較理想。由此證明TCBS模型的有效性。 3?結?語 提出一種基于K-means聚類的舌苔舌質(zhì)分離方法,為舌診客觀化相關研究提供了新思路。通過對任一張舌圖像的B,G,V,L*,a*,b* 6個通道中選出的2個通道像素值進行聚類并分析,得出雙通道舌圖像聚類效果比三通道和單通道舌圖像更好;通過單通道舌圖像分布直方圖的峰值來確定K-means算法初始聚類中心點,提高了舌苔舌質(zhì)分離方法的精確性和穩(wěn)定性。本文對50張舌圖像數(shù)據(jù)集進行實驗并對結果進行分析,發(fā)現(xiàn)90%以上的圖像可以取得較好的舌苔舌質(zhì)分離結果。由此可見,該選取通道的方法和確定初始聚類中心點的方法具有一定的實用性。 但是,上述方法對舌苔不明顯的舌圖像分離效果不佳,下一步工作將繼續(xù)擴大數(shù)據(jù)集,綜合考慮舌苔、舌質(zhì)的性質(zhì),改善這種不足,并設計自動化舌診系統(tǒng)用于初步診斷患者病情,得到相應的診斷建議。 參考文獻/References: [1]?鄭豐. 開放環(huán)境下中醫(yī)舌象檢測與分割方法研究[D]. 廈門:廈門大學,2017. ZHENG Feng. Research on Tongue Detection and Tongue Segmentation in Open Environment[D]. Xiamen:Xiamen University, 2017. [2]?劉明,趙靜,李剛, 等.高光譜成像用于中醫(yī)舌診舌苔信息提取[J].光譜學與光譜分析,2017,37(1):162-165. LIU Ming, ZHAO Jing, LI Gang, et al. Tongue coat information extraction of the traditional chinese medicine with hyperspectral image[J]. Spectroscopy and Spectral Analysis, 2017,37(1):162-165. [3]?高清河,剛晶,王和禹,等.舌診圖像分割和特征提取的方法研究與應用[J].中國中醫(yī)藥現(xiàn)代遠程教育,2017,15(13):147-149. GAO Qinghe, GANG Jing, WANG Heyu, et al. Research and application of tongue image segmentation and feature extraction method in traditional chinese medicine[J].Chinese Medicine Modern Distance Education of China, 2017,15(13):147-149. [4]?王學民,呂元婷,王瑞云,等.基于雙光源的舌質(zhì)舌苔分離方法研究[J].納米技術與精密工程,2016,14(6):434-439. WANG Xuemin, LYU Yuanting, WANG Ruiyun, et al. Research on separation method of tongue body and coating based on double light sources[J].Nanotechnology and Precision Engineering, 2016,14(6):434-439. [5]?韓立博,胡廣芹,張新峰,等.基于直方圖均衡化的伽馬校正和K-means聚類的舌象苔質(zhì)分離方法[J].北京生物醫(yī)學工程,2019,38(1):1-6. HAN Libo, HU Guangqin, ZHANG Xinfeng, et al. Separation method of tongue coating and body of tongue image based on histogram equalization and gamma correction and K-means clustering[J]. Beijing Biomedical Engineering, 2019,38(1):1-6. [6]?KAWANABE T, KAMARUDIN N D, OOI C Y, et al. Quantification of tongue colour using machine learning in Kampo medicine[J]. European Journal of Integrative Medicine, 2016, 8(6):932-941. [7]?陳海燕,卜佳俊,龔一萍,等.一種基于多色彩通道動態(tài)閾值的舌苔舌質(zhì)分離算法[J].北京生物醫(yī)學工程,2006,25(5):466-469. CHEN Haiyan, BU Jiajun, GONG Yiping, et al. The algorithm of tongue body and tongue coating separation based on the dynamic threshold of multiple color channels[J].Beijing Biomedical Engineering, 2006,25(5):466-469. [8]?郭宙,楊學智,司銀楚,等.基于K-均值聚類的常用色彩空間舌質(zhì)舌苔分割研究[J].北京中醫(yī)藥大學學報,2009,32(12):819-821. GUO Zhou, YANG Xuezhi, SI Yinchu, et al. Segmentation of tongue body and fur based on common color spaces of K-means clustering[J].Journal of Beijing University of Traditional Chinese Medicine,2009,32(12):819-821. [9]?SOARES L, ALVES A. Analysis of colorimetry using the CIE-L*a*b* system and the photocatalytic activity of photochromic films[J]. Materials Research Bulletin, 2018, 105:318-321. [10]MARKCHOM T, LIPIKORN R. Thin cloud removal using local minimization and logarithm image transformation in HSI color space[C]// 2018 4th International Conference on Frontiers of Signal Processing (ICFSP). Poitiers:IEEE, 2018:88552064. [11]李兆龍,蘇育挺.一種基于聚類的舌苔舌質(zhì)分離方法[J].南開大學學報(自然科學版),2017,50(4):52-56. LI Zhaolong, SU Yuting. A kind of method for separation between tongue coating and nature based on clustering[J].Acta Scientiarum Naturalium Universitatis Nankaiensis,2017,50(4):52-56. [12]霍鳳財,孫雪婷,任偉建,等.Lab空間的改進k-means算法彩色圖像分割[J].吉林大學學報(信息科學版),2019,37(2):148-154. HUO Fengcai, SUN Xueting, REN Weijian, et al. Improved k-means algorithm based on lab space for color image segmentation[J]. Journal of Jilin University ( Information Science Edition),2019,37(2):148-154. [13]GARCJA-LAMONT F, CERVANTES J, LPEZ-CHAU A, et al. Contrast enhancement of rgb color images by histogram equalization of color vectors′ intensities[C]// Intelligent Computing Methodologies. Wuhan:[s.n.],2018:443-455. [14]TANG M, AYED I B, MARIN D, et al. Secrets of GrabCut and kernel K-means[C]//International Conference on Computer Vision (ICCV 2015).[S.l.]:[s.n.], 2015:1555-1563. [15]JAISAKTHI S M, MIRUNALINI P, ARAVINDAN C. Automated skin lesion segmentation of dermoscopic images using grabcut and k-means algorithms[J]. IET Computer Vision, 2018, 12(8):1088-1095.