朱景濤, 李 陽, 劉佳男, 李陳生
(長(zhǎng)春工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 吉林 長(zhǎng)春 130012)
(d) 提取侯選ROI圖像(結(jié)節(jié)) (f) 提取侯選ROI圖像(假陽)
?
不變矩混合核支持向量機(jī)的肺結(jié)節(jié)識(shí)別
朱景濤, 李 陽*, 劉佳男, 李陳生
(長(zhǎng)春工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 吉林 長(zhǎng)春 130012)
在形態(tài)學(xué)特征、灰度特征和紋理特征的13維特征基礎(chǔ)上,加入7種不變矩特征來刻畫肺結(jié)節(jié),采用混合核SVM算法對(duì)肺結(jié)節(jié)進(jìn)行識(shí)別。首先,從CT圖像中提取270個(gè)包含190個(gè)假陽和80個(gè)結(jié)節(jié)的感興趣區(qū)域(ROI),計(jì)算ROI的20維特征,然后進(jìn)行5折交叉驗(yàn)證。最后用混合核SVM算法進(jìn)行識(shí)別。結(jié)果表明,混合核SVM 算法的準(zhǔn)確度(ACC)指標(biāo)達(dá)到94.80%,敏感度(SEN)指標(biāo)達(dá)到87.00%。
圖像識(shí)別; 肺結(jié)節(jié); 混合核函數(shù); 支持向量機(jī); 不變矩特征
肺癌是世界上死亡率最高的癌癥,近年來已成為全球男性居民的第一死因[1]。若能對(duì)肺癌做到早期診斷與治療,5年生存率將從14%上升到49%[2]。因此,腫瘤的早期診斷與治療是提高肺癌患者生存率的關(guān)鍵。肺癌的早期在CT(Computed Tomography)上表征多為肺結(jié)節(jié),肺結(jié)節(jié)是一種直徑介于3~30 mm之間的單發(fā)圓形或類圓形致密影,肺結(jié)節(jié)的檢測(cè)和識(shí)別是肺計(jì)算機(jī)輔助診斷系統(tǒng)(Computer Aided Detection, CAD)的核心模塊。肺結(jié)節(jié)主要分為孤立型結(jié)節(jié)、粘連肺壁型結(jié)節(jié)、粘連血管型結(jié)節(jié)、磨玻璃型結(jié)節(jié)及空洞型結(jié)節(jié)[3]。
現(xiàn)階段肺結(jié)節(jié)的識(shí)別方法主要有貝葉斯分類器、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)和支持向量機(jī)(Support Vector Machine, SVM)[3-7]等,SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,在圖像以及其他很多領(lǐng)域應(yīng)用較為廣泛[8-9]。劉露[5]等使用SVM算法對(duì)胸部CT圖像中孤立型肺結(jié)節(jié)進(jìn)行識(shí)別,準(zhǔn)確度可達(dá)71.67%。文獻(xiàn)[6]采用代價(jià)敏感型SVM算法,針對(duì)正負(fù)類樣本不均衡現(xiàn)象,對(duì)結(jié)節(jié)與非結(jié)節(jié)樣本分別采用不同的懲罰系數(shù),使識(shí)別敏感度可達(dá)92%。張婧[7]博士提出了一種結(jié)合規(guī)則的SVM算法,并將其應(yīng)用于肺結(jié)節(jié)識(shí)別。文中在形態(tài)學(xué)特征、灰度特征和紋理特征的13維特征[7]基礎(chǔ)上,引入7種不變矩特征,分別描述了肺結(jié)節(jié)的方向和非對(duì)稱度等信息,并用混合核SVM算法對(duì)肺結(jié)節(jié)進(jìn)行識(shí)別。
肺結(jié)節(jié)檢測(cè)系統(tǒng)通常由肺部CT圖像數(shù)據(jù)的采集、醫(yī)學(xué)圖像預(yù)處理、肺實(shí)質(zhì)分割、候選結(jié)節(jié)提取及肺結(jié)節(jié)識(shí)別等部分組成。肺結(jié)節(jié)識(shí)別是肺CAD的最后一部分,也是CAD的核心模塊。
肺CAD步驟如下:
1)肺部CT圖像數(shù)據(jù)的采集。肺部CT圖像數(shù)據(jù)的采集主要是從醫(yī)院或者標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)收集CT圖像數(shù)據(jù)。
2)圖像的預(yù)處理。醫(yī)學(xué)圖像預(yù)處理主要去掉圖片的背景及文字信息。
3)肺實(shí)質(zhì)分割。肺實(shí)質(zhì)分割用于左右肺的分開。
4)候選結(jié)節(jié)感興趣區(qū)域( Region of Interesting, ROI)的提取。候選結(jié)節(jié)提取的目的主要是突出肺結(jié)節(jié),抑制其他解剖部位。
5)ROI特征的選擇與提取。文中在13維特征的基礎(chǔ)上加入7種不變矩特征,以期提高檢測(cè)準(zhǔn)確度。
6)肺結(jié)節(jié)的識(shí)別。肺結(jié)節(jié)識(shí)別是系統(tǒng)的核心部分,用于對(duì)提取的感興趣區(qū)域(ROI)進(jìn)行肺結(jié)節(jié)的識(shí)別,以剔除假陽。
肺CAD處理流程對(duì)應(yīng)圖片如圖1所示。
(a) 原始圖像 (b) 預(yù)處理后的圖像 (c) 肺實(shí)質(zhì)分割后的圖像
(d) 提取侯選ROI圖像(結(jié)節(jié)) (f) 提取侯選ROI圖像(假陽)
圖1 肺CAD處理流程對(duì)應(yīng)圖片
矩是概率與統(tǒng)計(jì)中的一個(gè)概念,是隨機(jī)變量的一種數(shù)字特征。不變矩是一種高度濃縮的圖像特征,具有平移、灰度、尺度以及旋轉(zhuǎn)不變性。低階矩可以與物體的質(zhì)量、質(zhì)心位置、方向信息、非對(duì)稱度信息、峭度信息等聯(lián)系起來[10]。肺結(jié)節(jié)本身具有非對(duì)稱度、方向等信息,因而不變矩能較好地描述肺結(jié)節(jié)的形態(tài)特征。肺結(jié)節(jié)表面的光滑程度用矩值的大小來描述,矩值越大,表面越粗糙,肺結(jié)節(jié)的置惡性越大。
其中
由二階矩和三階矩可推出7種不變矩組:
由ηpq表示的歸一化中心矩定義為
式中
其中p+q=2,3,…。
這些矩組對(duì)于平移、尺度變化、鏡像和旋轉(zhuǎn)是不變的[11]。
通過上式直接計(jì)算得到不變矩組,在完成了ROI特征提取后,需要進(jìn)行肺結(jié)節(jié)識(shí)別,以去除假陽。由于高斯徑向基(RBF)核的學(xué)習(xí)能力與多項(xiàng)式核的推廣能力較強(qiáng),故使用RBF核與多項(xiàng)式核構(gòu)造的混合核函數(shù)支持向量機(jī)算法完成肺結(jié)節(jié)識(shí)別?;旌虾撕瘮?shù)的表示式為:
m----權(quán)重系數(shù);
C----懲罰系數(shù);
d=2,3,…,n
式中:d----多項(xiàng)式核函數(shù)的階數(shù);
式中:s----RBF核的核寬度。
實(shí)驗(yàn)選用了臺(tái)灣大學(xué)林智仁實(shí)驗(yàn)室的libsvm工具箱在Matlab 2013a平臺(tái)下進(jìn)行仿真實(shí)驗(yàn),將含有80個(gè)結(jié)節(jié)和190個(gè)假陽的270組數(shù)據(jù)隨機(jī)分為170組訓(xùn)練數(shù)據(jù)與100組測(cè)試數(shù)據(jù),并在訓(xùn)練集上進(jìn)行5折交叉驗(yàn)證。在13維特征的基礎(chǔ)上加入式(4)中的7種不變矩特征,然后將混合核SVM的肺結(jié)節(jié)識(shí)別結(jié)果與單核情況下的線性核SVM、多項(xiàng)式核SVM、RBF核SVM進(jìn)行比較。
懲罰參數(shù)C選取在2-9到29之間,RBF核參數(shù)s選取為2-7到27之間,兩種參數(shù)以乘以2的方式遞進(jìn)。多項(xiàng)式核函數(shù)的階數(shù)d較小時(shí),泛化能力較強(qiáng),為體現(xiàn)非線性特點(diǎn),故將d選取為2~3的正整數(shù)。權(quán)重系數(shù)m影響基本核在混合核中所占有的分量,故選為0到1,步長(zhǎng)細(xì)化為0.01。實(shí)驗(yàn)中采用全局的一種參數(shù)搜索方法,即網(wǎng)格算法,在libsvm網(wǎng)站的SVM使用指南中提到了這種參數(shù)搜索方法[12]。
實(shí)驗(yàn)指標(biāo)用敏感度(SEN)和準(zhǔn)確度(ACC)分別衡量肺結(jié)節(jié)檢出率與整體識(shí)別效果,所得結(jié)果見表1。
表1 不同核函數(shù)SVM算法的肺結(jié)節(jié)識(shí)別結(jié)果%
核函數(shù)準(zhǔn)確度(ACC)敏感度(SEN)線性核SVM93.7086.94RBF核SVM93.7088.37多項(xiàng)式核SVM91.8084.50混合核SVM94.8087.00
實(shí)驗(yàn)結(jié)果表明,在引入7種不變矩特征后,混合核SVM 算法的準(zhǔn)確度指標(biāo)為94.80%,比線性核SVM和RBF核SVM高1.10%,比多項(xiàng)式核SVM高3.00%,高于單核SVM,一定程度提高了肺結(jié)節(jié)識(shí)別的準(zhǔn)確率;敏感度指標(biāo)為87.00%,結(jié)節(jié)檢出率也較高。在準(zhǔn)確度指標(biāo)上,混合核SVM算法識(shí)別效果最好;在敏感度指標(biāo)上,混合核SVM算法識(shí)別效果僅次于RBF核SVM。
使用混合核SVM算法,在形態(tài)學(xué)特征、灰度特征和紋理特征的13維特征基礎(chǔ)上加入7種不變矩特征對(duì)肺結(jié)節(jié)進(jìn)行識(shí)別。比較了不同SVM算法對(duì)肺結(jié)節(jié)在加入7種不變矩特征后的識(shí)別結(jié)果。在引入不變矩特征后,混合核SVM 算法的準(zhǔn)確度指標(biāo)為94.80%,比其他所有的單核SVM都高,敏感度指標(biāo)達(dá)到了87.00%,結(jié)節(jié)檢出率也較高。混合核SVM對(duì)肺結(jié)節(jié)的識(shí)別結(jié)果比單核SVM好。下一步將通過參數(shù)尋優(yōu),尋找更優(yōu)的參數(shù)和更合適的特征,以期提高肺結(jié)節(jié)識(shí)別的結(jié)果。
[1] Greenlee R T, Murray T, Bolden S. Wingo PA:Cancer statistics[J]. CA Cancer J Clin,2000,50:7-33.
[2] Lin D T, Yan C R, Chen W T. Autonomous detection of pulmonary nodules on CT images with a neural network-based fuzzy system[J]. Computerized Medical Imaging and Graphics,2005,29(6):447-458.
[3] 李陽,史東承,王珂,等.基于圖像模式的肺結(jié)節(jié)識(shí)別[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2013(S1):463-467.
[4] Paola Campadelli, Elena Casiraghi, Giorgio Valentini. Support vector machines for candidate nodules classification[J]. Neurocomputing,2005,68:281-288.
[5] 劉露,劉宛予,楚春雨,等.胸部CT圖像中孤立性肺結(jié)節(jié)良惡性快速分類[J].光學(xué)精密工程,2009(8):2060-2068.
[6] Yang Li, Dunwei Wen, Ke Wang, et al. Mixed kernel function SVM for lung nodule recognition[J]. Lecture Notes in Computer Science (LNCS),2013,8157(2):449-458.
[7] 張婧,李彬,田聯(lián)房,等.結(jié)合規(guī)則和SVM方法的肺結(jié)節(jié)識(shí)別[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2011,39(2):125-129,147.
[8] 唐奇,王紅瑞,許新宜,等.基于混合核函數(shù)SVM水文時(shí)序模型及其應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2014,34(2):521-529.
[9] 邢吉生,楊禮,尚祖飛,等.支持向量機(jī)在視頻運(yùn)動(dòng)目標(biāo)分析中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào):理學(xué)版,2013,51(1):107-110.
[10] 王云慧,馬軍山,孫軍.基于邊緣檢測(cè)的七階矩方法[J].計(jì)算機(jī)應(yīng)用,2010,30:159-161.
[11] Gonzalez R C, Woods R E.數(shù)字圖像處理[M].3版.阮秋琦,阮宇智,譯.北京:電子工業(yè)出版社,2014:542-543.
[12] Lin H T, Lin C J. A study on sigmoid kernels for SVM and the training of non-PSD kernels by SMO-type methods[EB/OL]. (2013-10-29)[2016-07-17]. http://www.csie.ntu.edu.tw/-cjlin/libsvm.
Invariant moment mixed kernel SVM for Lung Nodule Recognition
ZHU Jingtao, LI Yang*, LIU Jianan, LI Chensheng
(School of Computer Science & Engineering, Changchun University of Technology, Changchun 130012, China)
Based on 13-dimensional features from morphological, gray and texture, seven invariant moments features are added to represent lung nodule, and the mixed kernel SVM algorithm is applied to recognize the nodule. First, 270 ROI (regions of interest) including 190 negative samples and 80 positive samples are extract from the CT images, then 20-dimensional features of the ROI are calculated for five-fold cross-validation. Finally, the mixed kernel SVM recognize the nodules. Results show that the accuracy (ACC) of the mixed kernel SVM is 94.80% and the sensitivity (SEN) is 87.00%.
image recognition; lung nodule; mixed kernel function; SVM; invariant moments feathers.
10.15923/j.cnki.cn22-1382/t.2017.1.12
2016-07-17
吉林省科技廳科技發(fā)展計(jì)劃項(xiàng)目(201201129); 吉林省教育廳科研專項(xiàng)項(xiàng)目(2014142); 長(zhǎng)春工業(yè)大學(xué)理工科基金項(xiàng)目(2011LG04); 長(zhǎng)春工業(yè)大學(xué)創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目(2014CXCY099)
朱景濤(1988-),男,漢族,湖北武漢人,長(zhǎng)春工業(yè)大學(xué)碩士研究生,主要從事醫(yī)學(xué)圖像處理方向研究,E-mail:neme_sis@foxmail.com. *通訊作者:李 陽(1979-),女,漢族,吉林長(zhǎng)春人,長(zhǎng)春工業(yè)大學(xué)講師,博士,主要從事醫(yī)學(xué)圖像處理及模式識(shí)別方向研究,E-mail:liyangyaya1979@sina.com.
TP 391
A
1674-1374(2017)01-0062-04