周顯國
吉林省人民醫(yī)院 信息中心,吉林 長春 130021
基于梯度方向直方圖特征和支持向量機的醫(yī)學(xué)影像分類方法
周顯國
吉林省人民醫(yī)院信息中心,吉林長春130021
隨著計算機技術(shù)和數(shù)據(jù)庫技術(shù)的發(fā)展,圖片存檔及通信系統(tǒng)(Picture Archiving and Communication Systems,PACS)在醫(yī)院得到了普遍的應(yīng)用,醫(yī)院每天會產(chǎn)生大量的醫(yī)學(xué)影像數(shù)據(jù)[1]。如何檢索醫(yī)學(xué)影像,使海量的醫(yī)學(xué)影像為科研和臨床診斷服務(wù),成為當(dāng)前醫(yī)學(xué)影像領(lǐng)域研究的熱點。現(xiàn)有PACS只能提供基于文本的、按照病人名字和流水號進行檢索的手段,不能滿足臨床醫(yī)生按照圖像內(nèi)容檢索出一些相似的歷史病歷或檢索出圖像內(nèi)容滿足某一圖像語義的影像用于診斷的需要[2]。
基于內(nèi)容的圖像檢索技術(shù)主要是根據(jù)圖像的一些低級視覺特征[3],如顏色、紋理、圖像對象的形狀以及他們之間的空間關(guān)系等作為圖像的索引,計算示例查詢圖像和圖像數(shù)據(jù)庫中圖像的相似距離,按照相似度匹配進行檢索。其主要目的是要克服基于文本圖像檢索技術(shù)的局限性?;趦?nèi)容的圖像檢索技術(shù)具有如下特點:
(1)直接從圖像的內(nèi)容中提取線索。這一特點使得基于內(nèi)容的圖像檢索技術(shù)突波了傳統(tǒng)的基于關(guān)鍵詞檢索的局限,可直接對圖像本身進行分析并提取特征,使得檢索能夠更加接近目標(biāo)。
(2)提取特征的方法多種多樣。從圖像中可以提取的特征包括顏色、紋理、形狀、邊緣和目標(biāo)輪廓等。
(3)基于內(nèi)容的圖像檢索是一種近似匹配。在檢索中,可以采取逐步求精的算法,每一層中間結(jié)果都是一個集合,不斷減小集合的范圍,直到定位到近似目標(biāo)[3]。
法國國家計算機科學(xué)及自動控制研究所DALAL等于2005年提出了一種解決人體目標(biāo)檢測的圖像描述子,即梯度方向直方圖(Histogramof Oriented Gradient,HOG),該方法使用HOG特征來提取人體的外形信息和運動信息,形成豐富的特征集[4]。
梯度方向直方圖特征是在尺度不變特征變換(ScaleInvariant Feature Transform)的基礎(chǔ)上發(fā)展而來的,能很好地刻畫圖像的邊緣方向特征。因此本文采用它作為醫(yī)學(xué)圖像檢索系統(tǒng)的描述子。支持向量機具有訓(xùn)練方便、容易使用、泛化能力較好的優(yōu)點,因此本文采用它作為醫(yī)學(xué)影像分類系統(tǒng)的分類器[5]。
近年來,由于HOG特征能很好地描述圖像的邊緣方向特征,因此廣泛應(yīng)用在計算機視覺的其他領(lǐng)域中,如目標(biāo)識別與跟蹤、圖像檢索、人體行為分析和遙感圖像分類等。該特征的計算方法,見圖l。
圖1 HOG特征計算示意圖
具體的計算步驟如下:
(1)計算圖像中每個像素點梯度方向,一般可以采用[-1,0,1]和[-1,0,1]T獲取水平方向和垂直方向上的梯度分量d x和d y。
(2)對于每個像素,根據(jù)d x和d y可計算出梯度的方向角θ=a r ct a n(d y/d x),將該角度的范圍轉(zhuǎn)化到[0,π],然后每20°角量化為一個方向區(qū)間,共9個區(qū)間0,1,2,...,8。
(3)選取一個16×16大小的圖像塊,根據(jù)量化后的區(qū)間,以每個像素的梯度幅值作為權(quán)重,計算16×16圖像塊中每個8×8圖像子塊的梯度方向直方圖特征,并將2×2=4個直方圖特征串聯(lián)起來。
(4)對每個16×16的直方圖特征(4x9=36維)進行歸一化,設(shè)直方圖特征為v∈R36,vi表示直方圖的第i維特征,v'i表示歸一化后的值,一般可以有如下的三種歸一化方式[5]:
(5)將每個16×16塊的直方圖特征串聯(lián)起來,作為最終的直方圖特征。
另外,在計算直方圖特征的時候,也可以采用三線性插值和高斯加權(quán),從而使得構(gòu)建出來的特征更加魯棒[6]。
支持向量機(Support Vector Machine,SVM)是一種根據(jù)結(jié)構(gòu)風(fēng)險最小化原則,在使訓(xùn)練樣本分類誤差極小化的前提下,盡量提高分類器的推廣能力的機器學(xué)習(xí)方法,目前已廣泛應(yīng)用在分類、回歸等應(yīng)用中。其分類函數(shù)如下:
張衡誕生于南陽郡漢水流域白河之畔的西鄂縣(今河南南陽市石橋鎮(zhèn)),是中國東漢時期偉大的天文學(xué)家、地震學(xué)家和發(fā)明家。他提出渾天說,發(fā)明渾天儀,開啟了中國航天遙測技術(shù);他探索地震起因,發(fā)明了世界上最早的地動儀。
其中αi表示支持向量的權(quán)重,yi表示樣本的類別標(biāo)簽,其值為+1或者-1,K(X,Xi)為核函數(shù),常見的核函數(shù)有:線性核函數(shù)K(X,Xi)=(X,Xi);多項式核函數(shù)K(X,Xi)=(a+XtXi)d;徑向基函數(shù)K(X,Xi)=e x p(-C||X-Xi||);Sigmoid函數(shù)K(X,Xi)=1/(1+e x p(-XtXi))。
關(guān)于支持向量機的訓(xùn)練,目前常用的方法是序列最小優(yōu)化算法(Sequential Minimum optimal,SM)。
4.1數(shù)據(jù)集與實驗參數(shù)設(shè)置
本文采用的數(shù)據(jù)集為mageCLEF,該數(shù)據(jù)集包括訓(xùn)練集和測試集,共有2000張圖片,分為31類,其中測試圖片999張,訓(xùn)練圖片1001張。
實驗中,將所有的圖片都歸一化到64×128,然后進行HOG特征提取,HOG特征向量的維度是3780維,具體的參數(shù)如下:塊的大小是16×16,梯度計算采用[-1,0,1]和[-1,0,1]T,方向角量化為9個區(qū)間,歸一化方式采用L1-norm,直方圖建立的過程中采用了三線性插值的方法[6]。
實驗中采用的分類器是libsvm,是一個簡單、易于使用和快速有效的SVM模式識別與回歸的軟件包,不但提供了編譯好的可在Windows系列系統(tǒng)的執(zhí)行文件,還提供了源代碼,方便改進、修改以及在其他操作系統(tǒng)上應(yīng)用。該軟件對S V M所涉及的參數(shù)調(diào)節(jié)相對比較少,提供了很多的默認參數(shù),利用這些默認參數(shù)可以解決很多問題;還提供了交互檢驗功能。核函數(shù)分別采用線性核、多項式核、徑向基函數(shù)和Sigmoid函數(shù),各個核函數(shù)的參數(shù)均使用工具箱的默認值。
4.2性能評估
ImageCLEF共包含31個類,采用線性核函數(shù)獲得了較好的結(jié)果,其相應(yīng)的混淆矩陣,見表1。
表1 基于線性核函數(shù)的醫(yī)學(xué)圖像分類混淆矩陣
各個核函數(shù)的總體分類性能比較,見圖2。其中,線性核函數(shù)的分類性能最好,平均的分類正確率為36.74%,多項式核、徑向基函數(shù)和S i g mo i d函數(shù)的分類性能相當(dāng),約10%左右。
圖2 各個核函數(shù)的性能比較
本文利用HOG特征和支持向量機對醫(yī)學(xué)圖像進行分類,并比較了不同核函數(shù)的性能,實現(xiàn)了從低層視覺特征到對象語義的映射,為臨床不同語義層次的檢索提供了條件。由于分類之間的類內(nèi)差異性大,類間差異性小,因此難以獲得較好的分類性能。未來擬考慮采用貝葉斯網(wǎng)絡(luò)融合對象語義提取高層語義的多層語義建模方法,對多類別的圖像進行分類。
[參考文獻]
[1] 張驪峰,章魯.醫(yī)學(xué)影像數(shù)據(jù)庫的索引及檢索技術(shù)的研究[J].國際生物醫(yī)學(xué)工程雜志,2007,30(3):159-163.
[2] 張九妹,杜建軍,姚宗,等.利用基于內(nèi)容的圖像檢索技術(shù)的眼底圖像計算機輔助診斷系統(tǒng)[J].中國生物醫(yī)學(xué)工程學(xué)報, 2012,31(5):785-789.
[3] 王惠鋒,孫正興.基于內(nèi)容的圖像檢索中的語義處理方法[J].中國圖象圖形學(xué)報,2001,6(10):945-952.
[4] 余勝,謝莉.基于邊緣梯度方向直方圖的圖像檢索[J].科技視界,2012,(20):26-27.
[5] 申海洋,李月娥,張?zhí)?基于邊緣方向直方圖相關(guān)性匹配的圖像檢索[J].計算機應(yīng)用,2013,(7):194-197.
[6] 李博,楊丹,張小洪.一種新的基于梯度方向直方圖的圖像配準方法[J].計算機應(yīng)用研究,2007,24(3):312-314.
作者郵箱:zxg2004zxg@126.com
[中圖分類號]TP399
[文獻標(biāo)志碼]B
doi:10.3969/j.issn.1674-1633.2014.02.044
[文章編號]1674-1633(2014)02-0132-02
收稿日期:2013-05-03修回日期:2013-09-18
Classif i cation Method for Medical Images Based on HOG Features and SVM
ZHOU Xian-guo
Information Center, Jilin Province People's Hospital, Changchun Jilin 130021, China
[摘要]本文闡述了基于內(nèi)容的圖像檢索技術(shù)的特點,采用梯度方向直方圖(HOG)特征來描述圖片的邊緣特征,利用支持向量機(SVM)對多類別的圖片進行分類,并比較了幾種核函數(shù)對分類效果的影響,指出基于HOG特征和支持向量機的分類方法可以輔助醫(yī)護人員進行醫(yī)學(xué)影像檢索。
[關(guān)鍵詞]PACS;醫(yī)學(xué)影像分類;梯度方向直方圖特征;支持向量機
Abstract:This paper introduces the characteristics of content-based image retrieval technology, and describes the edge features of medical images with histogramof oriented gradient features. Then these images are classif i ed with support vector machine. The effect of several kernel functions on classif i cation results is also discussed in this paper. This paper points out that the classif i cation method based on HOG and SVMcan help medical staff retrieve medical imags.
Key words:PACS; medical image classif i cation; histogramof oriented gradient; support vector machine