闞紅星 張璐瑤 董昌武
1(安徽中醫(yī)藥大學(xué)醫(yī)藥信息工程學(xué)院, 合肥 230012)2(安徽中醫(yī)藥大學(xué)中醫(yī)臨床學(xué)院, 合肥 230012)
一種2型糖尿病中醫(yī)證型的舌圖像識(shí)別方法
闞紅星1#張璐瑤1*董昌武2
1(安徽中醫(yī)藥大學(xué)醫(yī)藥信息工程學(xué)院, 合肥 230012)2(安徽中醫(yī)藥大學(xué)中醫(yī)臨床學(xué)院, 合肥 230012)
舌診是2型糖尿病辨證方法之一,為降低因外界光線、醫(yī)生經(jīng)驗(yàn)等因素造成的臨床2型糖尿病舌象診斷誤差,提出一種2型糖尿病中醫(yī)證型的舌圖像識(shí)別方法。首先,通過色差校正,獲得校正后舌象圖像;其次,基于不同顏色空間特性,運(yùn)用快速K均值聚類方法分離圖像背景區(qū)域與舌體區(qū)域,再對舌體區(qū)域圖像運(yùn)用Ohta色度閾值法分離出舌質(zhì)區(qū)域和舌苔區(qū)域;然后,根據(jù)2型糖尿病3種證型的舌象特征,提取舌體、舌苔及舌質(zhì)區(qū)域的顏色、裂紋和胖大特征值;最后,使用隨機(jī)森林作為分類器訓(xùn)練識(shí)別數(shù)據(jù),并與支持向量機(jī)的方案進(jìn)行對比。通過對218例數(shù)據(jù)訓(xùn)練識(shí)別,得出隨機(jī)森林方法平均識(shí)別準(zhǔn)確率為90.37%,比支持向量機(jī)方法提高了10.74%。結(jié)果表明,在2型糖尿病中醫(yī)證型分類識(shí)別方面,隨機(jī)森林方法更準(zhǔn)確,且提出的舌圖像識(shí)別方法可以實(shí)現(xiàn)2型糖尿病的中醫(yī)證型識(shí)別。
2型糖尿?。恢嗅t(yī)證型;舌圖像識(shí)別;隨機(jī)森林
傳統(tǒng)的中醫(yī)舌診依賴于外界光線、醫(yī)生經(jīng)驗(yàn)以及診斷知識(shí),使得診斷結(jié)果往往具有主觀性,重復(fù)性差,這給舌診的臨床診斷、科學(xué)研究等工作帶來諸多不便。近幾年,舌診客觀化研究受到普遍重視,且已有工作證明圖像分析技術(shù)用于舌診客觀化是可行的[1]。目前,舌診客觀化側(cè)重于舌圖像分析處理基礎(chǔ)研究和基于顏色特征的某一疾病不同類別舌圖像分類研究[2-4]。近來,還有些學(xué)者關(guān)注特殊舌體的圖像識(shí)別研究,如齒痕舌特征提取[5]、裂紋舌識(shí)別[6]、胖瘦舌分析[7]等。
當(dāng)前的舌象客觀化研究從不同側(cè)面促進(jìn)了中醫(yī)舌象診斷的發(fā)展,然而還沒有人利用舌象識(shí)別技術(shù)對中醫(yī)的“證型”進(jìn)行研究。實(shí)際上,中醫(yī)的精髓就是辨證論治,醫(yī)生通過辨別“證型”,得到疾病的病因、性質(zhì)、部位以及邪正之間的關(guān)系,然后才能準(zhǔn)確施治。因此,利用舌圖像識(shí)別技術(shù)研究患者中醫(yī)證型,在臨床上具有重要意義。另外,目前舌圖像分類識(shí)別大都采用支持向量機(jī)等單分類器方法[8]。支持向量機(jī)方法在小樣本高維數(shù)據(jù)上具有分類精度高、魯棒性強(qiáng)等優(yōu)點(diǎn),可以較好地解決二分類識(shí)別問題[9-10]。但是,在多分類問題上,由于支持向量機(jī)方法通過多個(gè)二分類器組合方式處理多分類問題,使得計(jì)算量加大,識(shí)別效果和性能是否滿意還有待進(jìn)一步驗(yàn)證。隨機(jī)森林是一種組合分類器,分類精度比支持向量機(jī)等單分類器高,具有不易過擬合、抗噪聲能力強(qiáng)、訓(xùn)練速度快且易實(shí)現(xiàn)等特點(diǎn)[11],適合中醫(yī)證型復(fù)雜、多樣的識(shí)別要求。
針對目前中醫(yī)舌診客觀化研究的不足以及中醫(yī)臨床診斷中辨證論治的需要,筆者提出一種2型糖尿病中醫(yī)證型的舌圖像識(shí)別方法。首先根據(jù)中醫(yī)舌診與2型糖尿病中醫(yī)證型的辯證關(guān)系,選擇2型糖尿病中較為典型的3種中醫(yī)證型作為目標(biāo)證型,運(yùn)用圖像處理方法提取出舌圖像顏色、紋理、邊緣等多種特征信息,并使用隨機(jī)森林法對多種特征信息分類,以達(dá)到2型糖尿病3種中醫(yī)證型識(shí)別的目的。
2型糖尿病中醫(yī)證型的舌圖像識(shí)別流程包括色差校正、舌圖像分割、特征提取和分類器識(shí)別4個(gè)階段,具體流程如圖1所示。
圖1 2型糖尿病中醫(yī)證型舌圖像識(shí)別算法流程Fig.1 T2DM syndrome tongue image recognition algorithm flow chart
1.1 數(shù)據(jù)采集
1)數(shù)據(jù)采集:采集218例2型糖尿病患者舌象彩色圖像和臨床醫(yī)生現(xiàn)場證型辨別結(jié)果。其中,氣陰兩虛夾瘀證舌象圖像130例,熱盛傷津證59例,陰陽兩虛證29例。受試者均簽署知情同意書。氣陰兩虛夾瘀證和熱盛傷津證屬于2型糖尿病早中期證型[12],這兩種證型的樣本量占總樣本量的76%。而陰陽兩虛證屬于中晚期證型[13],樣本量整體偏少。另外,有數(shù)據(jù)表明,相比熱盛傷津證,臨床氣陰兩虛夾瘀證型患者人數(shù)偏多[12]。
2)入選標(biāo)準(zhǔn):年齡 (62.3±15.7) 歲(30~85歲),早晨空腹情況下血糖值高于6.0的已確診2型糖尿病患者。
3)拍攝要求:拍攝模式調(diào)為自動(dòng)白平衡模式,患者室內(nèi)正對窗口端坐,自然伸舌,舌面平展,舌尖自然下垂,色差校正色卡舉在相機(jī)視線內(nèi),拍攝舌圖像。
1.2 證型類別及舌診標(biāo)準(zhǔn)
本研究參考《中藥新藥臨床研究指導(dǎo)原則》[14]中給出的消渴病證型診斷標(biāo)準(zhǔn),以熱盛傷津證、氣陰兩虛夾瘀證和陰陽兩虛證作為研究目標(biāo)證型。
1)熱盛傷津證:舌質(zhì)紅,舌苔黃。
2)氣陰兩虛夾瘀證:舌質(zhì)暗紅、紅絳,苔薄白、薄黃,或有裂紋。
3)陰陽兩虛證:舌質(zhì)淡白,舌苔白,舌體有齒痕。
1.3 色差校正
(1)
1.4 舌圖像分割
舌圖像分割包括舌體分割、舌質(zhì)和舌苔分離兩個(gè)部分。
1.4.1 舌體分割
舌圖像在不同顏色空間下,像素灰度值分布不同。舌體分割則根據(jù)此特性將舌圖像從RGB顏色空間分別轉(zhuǎn)為HSI顏色空間和YCbCr顏色空間,提取I分量和Cb分量的灰度圖像并進(jìn)行與運(yùn)算處理,獲得舌體初始輪廓;然后對初始輪廓進(jìn)行Otsu閾值分割,提取出舌體區(qū)域;由于舌體區(qū)域邊緣不夠平滑,且舌中區(qū)域因亮斑存在孔洞現(xiàn)象,因此使用形態(tài)學(xué)開運(yùn)算進(jìn)行修補(bǔ)處理,最后提取到完整的舌體輪廓。
1.4.2 舌質(zhì)舌苔分離
舌苔有厚薄之分,需要采用兩種方法結(jié)合的方式解決苔質(zhì)分割問題。對厚舌苔圖像,舌苔區(qū)域顏色與舌質(zhì)顏色區(qū)別較大,適合使用聚類方法。采用快速K均值聚類方法,可以較好地分離舌苔與舌質(zhì)區(qū)域。對于薄舌苔圖像,由于舌苔覆蓋面大且顏色淺,采用基于Ohta色度閾值法,將RGB圖像顏色分量線性轉(zhuǎn)換,得到不同色度分量,完成苔質(zhì)區(qū)域的分離。Ohta色度閾值與RGB轉(zhuǎn)換方式為
(2)
對I′分量圖像二值化處理,可提取薄舌苔圖像苔質(zhì)區(qū)域。
1.5 特征提取
圖像特征提取的好壞,直接影響分類識(shí)別的準(zhǔn)確度。參照本文1.2節(jié)舌診標(biāo)準(zhǔn),3種證型舌象可通過苔質(zhì)顏色、有無裂紋、有無齒痕等特征區(qū)分,本研究選擇顏色特征、裂紋特征、齒痕特征作為舌圖像分類識(shí)別特征。為方便接下來的分類識(shí)別,這里用Mj表示第j(j=1,2,…,n)個(gè)特征。
1.5.1 顏色特征提取
舌圖像顏色特征包括兩部分:舌質(zhì)顏色和舌苔顏色。由于數(shù)碼相機(jī)是基于三基色疊加原理拍攝彩色圖像,對顏色的冷暖、飽和度等信息缺失。在舌圖像顏色特征提取過程中,通常選擇HSI顏色空間作為顏色特征空間。常見的舌質(zhì)顏色有暗紅色、紅色、淡紅色、淡暗色和紫色,舌苔顏色常見有白色、黃色。分析3種證型舌質(zhì)顏色和舌苔顏色可知,其中5種舌質(zhì)顏色可通過色調(diào)分量(H)和飽和度(S)區(qū)分,舌苔顏色可利用色調(diào)分量(H)區(qū)分。標(biāo)記舌質(zhì)顏色H、S特征分量分別為M1、M2,舌苔顏色H分量為M3。
1.5.2 裂紋特征提取
裂紋舌是舌面見多少不等、深淺不一、形狀各異裂紋的一種特殊舌。裂紋一般出現(xiàn)在舌中區(qū)域,如果在整張舌圖像背景下選取裂紋特征,往往提取不到。因此,裂紋特征提取的設(shè)計(jì)思想是設(shè)定一個(gè)裂紋檢測區(qū)域,通過檢測裂紋區(qū)域中像素分布比例來判斷有無裂紋。首先,將舌象圖像劃分為9小塊,選取第2行第2列區(qū)域作為裂紋檢測區(qū)域;然后,通過快速K均值聚類方法,得到裂紋區(qū)域;最后,計(jì)算裂紋區(qū)域像素點(diǎn)數(shù)占整張舌象圖像像素個(gè)數(shù)的比例。沒有裂紋的舌象圖像,裂紋區(qū)域像素點(diǎn)數(shù)極低或者占大半以上,其裂紋比例接近0或高于50%;有裂紋的舌象圖像,裂紋區(qū)域的像素比例區(qū)間為[0.1~0.45],標(biāo)記裂紋比例特征為M4。
1.5.3 齒痕特征提取
齒痕舌是舌體區(qū)域出現(xiàn)齒痕情況,一般位于舌體下半部分的兩側(cè)。齒痕舌體邊緣形狀復(fù)雜,可以通過舌體的圓形度特征,檢測舌體邊緣是否存在齒痕情況。圓形度r的計(jì)算公式為
(3)
式中,A為目標(biāo)的面積,T為目標(biāo)周長。
假設(shè)(xi,yi)為舌體邊緣點(diǎn)坐標(biāo),N為像素總數(shù)目,則周長T的計(jì)算公式為
(4)
舌體下半部分越趨于圓形,其圓形度系數(shù)r越趨向于1;舌體形狀越不規(guī)則,r值越大,可反映被測量邊界的復(fù)雜程度。通過圓形度特征,可以有效檢測出齒痕舌,標(biāo)記為M5。
1.6 數(shù)據(jù)分組
在分類識(shí)別之前,需對樣本特征數(shù)據(jù)分組,具體步驟如下。
步驟1:從氣陰兩虛夾瘀證(130例)中,隨機(jī)抽取65例作為本批次氣陰兩虛夾瘀證訓(xùn)練數(shù)據(jù)集Tr1,剩下65例作為本批次氣陰兩虛夾瘀證測試數(shù)據(jù)集Te1;從熱盛傷津證(59例)中,隨機(jī)抽取30例作為本批次熱盛傷津證訓(xùn)練數(shù)據(jù)集Tr2,剩下29例作為本批次熱盛傷津證的測試數(shù)據(jù)集Te2;從陰陽兩虛證(29例)中,隨機(jī)抽取15例作為本批次陰陽兩虛證訓(xùn)練數(shù)據(jù)集Tr3,剩下14例作為本批次陰陽兩虛證測試數(shù)據(jù)集Te3。
步驟2:將Tr1、Tr2、Tr3組成本批次訓(xùn)練樣本集數(shù)據(jù)Traindata1,將Te1、Te2、Te3組成本批次測試樣本集數(shù)據(jù)Testdata1,得到第一批實(shí)驗(yàn)數(shù)據(jù)Data1。
步驟3:參照步驟1、2,繼續(xù)抽取特征數(shù)據(jù)4次,共得到5組實(shí)驗(yàn)數(shù)據(jù)(Data1,Data2,Data3,Data4,Data5)。
1.7 隨機(jī)森林分類識(shí)別
隨機(jī)森林(random forest, RF)是一種集成學(xué)習(xí)算法,是由多個(gè)決策樹合并在一起形成的組合識(shí)別模型[11]。它的基本原理是采用遞歸分割思想,將當(dāng)前樣本集分割成兩份子樣本集,接著對子樣本集進(jìn)行遞歸分割,直到最后樣本集只有一個(gè)樣本或同為一個(gè)類別。
隨機(jī)森林分類識(shí)別分為兩個(gè)過程:根據(jù)訓(xùn)練集數(shù)據(jù)訓(xùn)練分類模型和根據(jù)分類模型識(shí)別測試集類別??倶颖景凑针S機(jī)抽選方式分為訓(xùn)練集S和測試集T,每例樣本包含M1~M5屬性變量和一個(gè)L標(biāo)簽變量。隨機(jī)森林分類識(shí)別器的算法步驟如下:
1) 在訓(xùn)練集S中,有放回地隨機(jī)抽取樣本N個(gè);
2) 輸入特征參數(shù)個(gè)數(shù)mtry,該值可以由用戶自行設(shè)置,默認(rèn)值為特征變量總維數(shù)(mall)的平方根值;
3) 設(shè)定抽取次數(shù)ntree,即需要多少棵決策樹完成分類;
4) 訓(xùn)練完成,生成隨機(jī)森林模型model;
5) 將測試集數(shù)據(jù)輸入model中進(jìn)行預(yù)測,模型返回的預(yù)測數(shù)據(jù)值即為測試集的分類結(jié)果。
在地基的施工過程中,地下水問題是常見的問題之一。如果對地下水的處理方式不當(dāng),不僅會(huì)影響地基的質(zhì)量,還會(huì)影響民用建筑的安全。在地基或樁基礎(chǔ)的施工過程中,若地下水位較高,應(yīng)采用合適的排水或止水方法。例如,可采用多樁抽水的方式降低地下水位。而地下水位較低時(shí),可采用單樁抽水的方式,以降低地下水的水位。
鑒于3種證型訓(xùn)練測試數(shù)據(jù)均屬于小樣本數(shù)據(jù),為客觀評價(jià)隨機(jī)森林法識(shí)別性能的優(yōu)劣,本研究選擇支持向量機(jī)法(supportvectormachine,SVM)作為對照組。
1.8 分類方法性能對比
為評價(jià)分類方法識(shí)別性能,一般以靈敏度(sensitivity, SE)、特異性(specificity, SP)和準(zhǔn)確率(accuracy, ACC)等參數(shù)表達(dá)[17]。對于多分類的分類方法,則在每個(gè)類別的基礎(chǔ)上,分別運(yùn)用上述參數(shù)進(jìn)行評價(jià)。
對于每幅舌象圖像,若醫(yī)生診斷某樣本屬于某一證型,分類算法識(shí)別出相同或者不同的結(jié)果,則分別稱為真陽性(TP)和假陰性(FN);同理,若醫(yī)生診斷某樣本不屬于某一證型,分類算法給出相同或不同的結(jié)果,則分別稱為真陰性(TN)和假陽性(FP)。靈敏度(SE)、特異性(SP)、準(zhǔn)確率(ACC)等參數(shù)的計(jì)算公式為
(5)
(6)
(7)
在舌圖像色差校正階段,統(tǒng)一色差值為7.07。在舌圖像分割和苔質(zhì)分離階段,設(shè)定聚類區(qū)域數(shù)目為3,得到舌體分割結(jié)果如圖2所示,得到苔質(zhì)分離結(jié)果如圖3所示。
圖2 舌體分割。(a)舌圖像;(b)舌體初始輪廓;(c)二值化后舌體輪廓Fig.2 Tongue body segmentation. (a)Tongue image; (b) Initial outline of tongue body; (c) The outline of tongue body after binarization
圖3 苔質(zhì)分離(上為厚舌苔圖像,下為薄舌苔圖像)。(a)舌體圖像;(b)舌苔區(qū)域;(c)舌質(zhì)區(qū)域Fig.3 Tongue coating and tongue nature separation (The top are thick coating tongue images, the bottom are thin coating tongue images). (a)Tongue body image; (b) Tongue coating area; (c) Tongue nature area
2.1 特征提取
表1 舌質(zhì)顏色特征值
表2 舌苔顏色特征值
表3 裂紋特征值
表4 齒痕特征
2.2 證型分類識(shí)別
對5組數(shù)據(jù)分別用隨機(jī)森林法和支持向量機(jī)法訓(xùn)練識(shí)別,得到實(shí)驗(yàn)結(jié)果見表5、6。
表5 隨機(jī)森林法分類識(shí)別結(jié)果
表6 支持向量機(jī)法分類識(shí)別結(jié)果
觀察表5、6數(shù)據(jù)可知,隨機(jī)森林法的5組數(shù)據(jù)識(shí)別準(zhǔn)確率均高于支持向量機(jī)法的準(zhǔn)確率。本研究以5組數(shù)據(jù)平均識(shí)別率表示分類方法的識(shí)別準(zhǔn)確度,支持向量機(jī)法的平均識(shí)別準(zhǔn)確率為79.63%,隨機(jī)森林法的平均準(zhǔn)確率為90.37%,比支持向量機(jī)法提高了10.74%。
對兩種分類方法進(jìn)行靈敏度、特異性和識(shí)別準(zhǔn)確率參數(shù)測試,得到的結(jié)果見表7。
表7 隨機(jī)森林法與支持向量機(jī)法比較
觀察表7的數(shù)據(jù),在氣陰兩虛夾瘀證的分類識(shí)別過程中,隨機(jī)森林法與支持向量機(jī)法的靈敏度分別為95.38%和93.85%,說明兩種方法正確識(shí)別氣陰兩虛夾瘀證樣本量相當(dāng);支持向量機(jī)法的識(shí)別準(zhǔn)確率(69.32%)高于隨機(jī)森林法的識(shí)別準(zhǔn)確率,表明在整個(gè)測試集樣本中支持向量機(jī)法識(shí)別出的氣陰兩虛夾瘀證樣本量多。然而在特異性方面,隨機(jī)森林法的特異性值高于支持向量機(jī)法的特異性值,說明支持向量機(jī)法將非氣陰兩虛夾瘀證中錯(cuò)分為氣陰兩虛夾瘀證的樣本量偏多,因而造成支持向量機(jī)法的準(zhǔn)確率高于隨機(jī)森林法的準(zhǔn)確率。這一情況表明,支持向量機(jī)法在氣陰兩虛夾瘀證模型訓(xùn)練中出現(xiàn)了過擬合問題。
在熱盛傷津證和陰陽兩虛證的分類識(shí)別過程中,在靈敏度、特異性和準(zhǔn)確率方面,隨機(jī)森林法均高于支持向量機(jī)法,表明對熱盛傷津證和陰陽兩虛證的識(shí)別隨機(jī)森林法更準(zhǔn)確。
綜合比較表5~7數(shù)據(jù),得出在2型糖尿病3種中醫(yī)證型分類識(shí)別問題上,隨機(jī)森林法的性能優(yōu)于支持向量機(jī)法的性能。
實(shí)驗(yàn)對兩種分類方法正確分類識(shí)別的結(jié)果展開分析,得到相同類別標(biāo)簽的數(shù)據(jù)包含著不同特征組合,如表8所示。
表8 舌象分類結(jié)果
氣陰兩虛夾瘀證多見于疾病早中期,陰虛火旺傷陰耗氣,導(dǎo)致氣陰兩虛發(fā)生,氣虛運(yùn)血無力,陰虛燥熱,津虧血少導(dǎo)致血瘀,造成舌象上舌質(zhì)顏色偏暗,舌苔多主白色,或有裂紋舌、齒痕舌出現(xiàn)。熱盛傷津證多見于疾病初期,由于陰津虧耗,燥熱偏盛造成舌質(zhì)偏紅、舌苔黃或有裂紋舌出現(xiàn)。陰陽兩虛證則屬病程較長者,病久則以陰虛為主,陰損及陽,舌象以淡舌為主,舌苔白,或有齒痕舌。表8中的3種證型舌象特征與特征組合規(guī)律相符合,說明本研究的分類識(shí)別結(jié)果符合臨床2型糖尿病中醫(yī)證型舌診規(guī)律,實(shí)驗(yàn)結(jié)果具有一定的科學(xué)參考價(jià)值。
本研究首次嘗試運(yùn)用圖像處理和機(jī)器學(xué)習(xí)方法,對舌圖像進(jìn)行中醫(yī)證型識(shí)別,并取得了令人滿意的結(jié)果。這與以往的中醫(yī)證型自動(dòng)化識(shí)別研究[18-19]不同,選用的為2型糖尿病患者舌圖像特征,表明運(yùn)用圖像識(shí)別技術(shù)可以實(shí)現(xiàn)中醫(yī)證型的“自動(dòng)”識(shí)別,彌補(bǔ)了當(dāng)前舌診客觀化研究的不足。另外,本研究在特征提取階段提出了設(shè)定裂紋檢測區(qū)來提取裂紋特征,該方法比傳統(tǒng)裂紋舌檢測方法[20]更簡便、有效;在分類識(shí)別階段,發(fā)現(xiàn)在樣本分布不均衡情況下,支持向量機(jī)法容易出現(xiàn)過擬合問題,而隨機(jī)森林法識(shí)別性能較優(yōu),最后得出在多分類不均衡分布樣本識(shí)別問題上,隨機(jī)森林方法更適合,驗(yàn)證了文獻(xiàn)[21-22]的觀點(diǎn)。
然而,本研究也存在不足之處:樣本量少的證型錯(cuò)分率較高。由于陰陽兩虛證屬于糖尿病晚期證型,樣本量總體偏少,分類器無法準(zhǔn)確學(xué)習(xí)。為提高不均衡樣本證型的識(shí)別準(zhǔn)確率,今后還需改進(jìn)識(shí)別方法,進(jìn)一步完善2型糖尿病中醫(yī)證型舌圖像識(shí)別的研究。
本研究從舌診與2型糖尿病中醫(yī)證型之間關(guān)系的角度出發(fā),提出一種2型糖尿病的中醫(yī)證型舌圖像識(shí)別方法:首先對舌圖像做色差校正和圖像分割處理,然后針對不同證型舌象特點(diǎn),逐步提取苔質(zhì)區(qū)域顏色特征、舌體區(qū)域裂紋和齒痕特征,最后利用隨機(jī)森林構(gòu)建分類模型,完成2型糖尿病3種證型分類識(shí)別。在研究思路方面,提出根據(jù)舌圖像特征識(shí)別2型糖尿病3種中醫(yī)證型,比以往單證型識(shí)別的臨床研究意義更大;在研究方法方面,將支持向量機(jī)法作為對照組,得出隨機(jī)森林法識(shí)別性能更優(yōu)的結(jié)論,驗(yàn)證了本研究提出的2型糖尿病中醫(yī)證型識(shí)別方法可行、有效。
但需要注意的是,總樣本中的陰陽兩虛證樣本量較少,且總體特征數(shù)目不高,隨機(jī)森林方法可否在大樣本數(shù)據(jù)集上有如此優(yōu)秀的分類準(zhǔn)確率是后續(xù)研究的內(nèi)容。還有,舌診對2型糖尿病中醫(yī)證型辨證有較大影響,但不代表僅憑舌診就可確診其中醫(yī)證型,因此臨床“辨證”與實(shí)驗(yàn)舌診分類結(jié)果存在一定偏差是可以理解的。再者,臨床醫(yī)生“辨證”時(shí)常以患者主訴為基準(zhǔn),結(jié)合舌診和脈診等綜合辯證,在今后的舌診客觀化研究中,如果能加入患者主訴信息,其識(shí)別精準(zhǔn)度應(yīng)該會(huì)更高,更符合臨床“辨證”規(guī)律,這也是筆者下一步的研究方向。
[1] 徐貴華,王憶勤,李福鳳. 計(jì)算機(jī)技術(shù)在中醫(yī)舌象客觀化研究中的應(yīng)用進(jìn)展[J]. 上海中醫(yī)藥大學(xué)學(xué)報(bào),2005,19(2):56-59.
[2] 張利,許家佗,何太文. 舌象圖像分割技術(shù)的研究與應(yīng)用進(jìn)展[J].中華中醫(yī)藥雜志,2010,25(4):565-567.
[3] 岳小強(qiáng). 舌質(zhì)顏色的模式識(shí)別及原發(fā)性肝癌患者舌色的臨床研究[D]. 上海:第二軍醫(yī)大學(xué), 2005.
[4] 師晶麗,沈祥立,張大成,等. 舌診客觀化圖像識(shí)別在原發(fā)性腎小球疾病辨證分型的研究[J]. 中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2009,15(2):120-122.
[5] 朱穆朗瑪,陸萍,夏春明,等.基于道格拉斯-普克法提取55例齒痕舌圖像特征研究[J]. 中華中醫(yī)藥學(xué)刊,2014,32(9):2138-2140.
[6] 覃海松,黃忠朝,趙于前,等. 一種新的MLBP-Otsu算法及在舌裂紋分割中的應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用,2014,50(23):151-155.
[7] 張康,金石,杜建強(qiáng),等. 基于圖像的舌體胖瘦分析[J]. 時(shí)珍國醫(yī)國藥,2014,25(5):1263-1266.
[8] 吳喜慶,陸小左. 中醫(yī)客觀化療效評價(jià)研究進(jìn)展[J]. 現(xiàn)代中西醫(yī)結(jié)合雜志,2014,23(13):1475-1477.
[9] 焦月,張新峰,卓力. 中醫(yī)舌象樣本分類中加權(quán)SVM的應(yīng)用研究[J]. 測控技術(shù),2010,29(5):1-4.
[10] 胡康達(dá),符紅光,孔祥振. 分級聚類支持向量機(jī)在中醫(yī)舌像分類中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用,2010,30(S2):272-273.
[11] Breiman L. Random forest [J].Machine Learning, 2001, 45(1):5-32.
[12] 淦家榮,陳岳祺. 2型糖尿病中醫(yī)辨證分型研究[J]. 云南中醫(yī)學(xué)院學(xué)報(bào),2012,35(5):41-45.
[13] 嚴(yán)倩華,余江毅. 2型糖尿病診治研究進(jìn)展[J]. 實(shí)用中醫(yī)藥雜志,2010,26(2):130-132.
[14] 鄭筱萸. 中藥新藥臨床研究指導(dǎo)原則(試行)[M]. 北京:中國醫(yī)藥科技出版社,2002:233-237.
[15] Chang CC, Lin CJ. Libsvm: a library for support vector machines[CP/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm,2009-08-16/2015-04-04.
[16] Hsu CW, Chang CC, Lin CJ. A practical guide to support vector classification [J]. 臺(tái)北:臺(tái)灣大學(xué)資訊工程學(xué)系, 2003, 67(5):1-12.
[17] Akobeng AK. Understanding diagnostic tests 2: Likelihood ratios, pre- and post-test probabilities and their use in clinical practice [J].ACTA Paediatrica, 2007, 96(4):487-491.
[18] 許朝霞,王憶勤,顏建軍,等. 基于支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)的心血管疾病中醫(yī)證候分類識(shí)別研究[J]. 北京中醫(yī)藥大學(xué)學(xué)報(bào),2011,34(8):539-543.
[19] 徐璡,許朝霞,許文杰,等. 基于貝葉斯網(wǎng)絡(luò)原理的835例冠心病病例中醫(yī)證候分類研究[J]. 上海中醫(yī)藥雜志,2014,48(1):10-13.
[20] 施展,周昌樂. 舌象裂紋提取及特征分析[J]. 計(jì)算機(jī)科學(xué)與發(fā)展,2007,17(5):245-248.
[21] 李建更,高志坤. 隨機(jī)森林針對小樣本數(shù)據(jù)類權(quán)重設(shè)置[J]. 計(jì)算機(jī)工程與應(yīng)用,2009,45(26):131-133.
[22] 尹華,胡玉平. 基于隨機(jī)森林的不平衡特征選擇算法[J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,53(5):59-65.
A Tongue Image Recognition Method Based on Type II Diabetes Traditional Chinese Medicine Syndrome Classification
Kan Hongxing1#Zhang Luyao1*Dong Changwu2
1(SchoolofMedicalInformationTechnology,AnhuiUniversityTraditionalChineseMedicine,Hefei230012,China)2(ClinicalCollegeofTraditionalChineseMedicine,AnhuiUniversityTraditionalChineseMedicine,Hefei230012,China)
Tongue diagnosis is one of the methods of type II diabetes traditional Chinese medicine (TCM) syndrome differentiation. In order to reduce the diagnostic deviation caused by external light and the doctor′s experience, a tongue image recognition method was proposed in this paper according to the TCM for syndrome classification of type II diabetes. Firstly, the corrected tongue image was obtained by color-calibration. Secondly, based on the difference between the color space, tongue image was divided into background and tongue area using fast K-mean clustering method,and then tongue area was separated into tongue body area and tongue fur area using Ohta color threshing method. Thirdly, according to the type IIdiabetes TCM tongue features, the color features, crack features and dental indentations features were extracted form tongue body area, tongue fur and tongue nature area. Finally, the random forest was used as the classifier to train tongue features data, and compared with the support vector machine method. The proposed method has been tested in 218 tongue image cases. Experimental results showed that the average recognition accuracy of random forest methods was 90.37%, which was increased by 10.74% compared with that of the support vector machine method, suggesting the random forest method was more accurate and efficient for type II diabetes TCM syndrome classifications.
type II diabetes; traditional Chinese medicine (TCM) syndrome; tongue image recognition; random forest
10.3969/j.issn.0258-8021. 2016. 06.003
2015-06-23, 錄用日期:2016-08-20
安徽省自然科學(xué)基金(11040606M187); 2016年安徽中醫(yī)藥大學(xué)青年科學(xué)研究基金(2016qn004);安徽省科技廳公益性研究聯(lián)動(dòng)計(jì)劃項(xiàng)目(1604f0804032)
R318
A
0258-8021(2016) 06-0658-07
# 中國生物醫(yī)學(xué)工程學(xué)會(huì)高級會(huì)員(Senior member, Chinese Society of Biomedical Engineering)
*通信作者(Corresponding author), E-mail: yymozly@163.com