王巖
摘要:肝穿刺病理學(xué)檢查主要在醫(yī)學(xué)中用于各種肝臟疾病的鑒別與診斷,了解肝臟病變的程度和活動(dòng)性,發(fā)現(xiàn)早期、靜止期或尚在代償期的肝硬化,判別臨床治療。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的一個(gè)重要組成部分,在圖像識(shí)別方面有很多重要應(yīng)用。針對(duì)肝穿刺圖像分類中病理圖像分類問題,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的分類方法。設(shè)計(jì)并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),得到用于分類的模型。實(shí)驗(yàn)結(jié)果表明,該方法可以有效地對(duì)其進(jìn)行分類,提高識(shí)別準(zhǔn)確率。
關(guān)鍵詞:肝穿刺圖像;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);圖像識(shí)別;人工智能
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)25-0203-03
Application of Convolution Neural Network in Image Classification of Liver Puncture
WANG Yan
(Institute of Computer Application, China Academy of Engineering Physics, Mianyang 621900, China)
Abstract:Liver biopsy is mainly used for the identification and diagnosis of various liver diseases in medicine. It was used to diagnose the degree and activity of liver lesions, and to detect early, static or compensatory cirrhosis of the liver, and to identify clinical treatment. As an important part of deep learning, convolution neural network has many important applications in image recognition. A method based on convolution neural network was proposed to classify the pathological images in liver biopsy image classification. The experimental results show that this method can effectively classify and improve the recognition accuracy.
Key words:liver biopsy image; convolution neural network; deep learning; image recognition; artificial intelligence
肝穿刺就是肝臟組織活檢。目前在醫(yī)學(xué)領(lǐng)域方面多用于多種肝臟疾病的鑒別診斷,如鑒別黃疸的性質(zhì)和產(chǎn)生的原因,了解肝臟病變的程度和活動(dòng)性,為各型病毒性肝炎的病原學(xué)診斷提供依據(jù),發(fā)現(xiàn)早期、靜止期或尚在代償期的肝硬化,尤其在確定肝纖維化嚴(yán)重程度上是國際公認(rèn)的標(biāo)準(zhǔn)。由于其準(zhǔn)確率可以達(dá)到80%以上,故被認(rèn)為是目前比較好的檢查手段。
在檢測過程中,在B超、CT的定位和引導(dǎo)下經(jīng)皮膚穿刺,獲取樣本后再通過顯微鏡觀察肝臟組織和細(xì)胞形態(tài)。傳統(tǒng)的分類方法受限于醫(yī)師的經(jīng)驗(yàn)、判斷標(biāo)準(zhǔn)的主觀性差異和病變特征的非線性特點(diǎn),會(huì)對(duì)檢測結(jié)果的準(zhǔn)確率造成一定程度的影響[1]。近幾年在計(jì)算機(jī)方向熱門的人工智能技術(shù),尤其是在圖像處理領(lǐng)域應(yīng)用廣泛的深度學(xué)習(xí)算法,在醫(yī)學(xué)圖像領(lǐng)域也有很多的應(yīng)用。為了消除傳統(tǒng)方法中,由于人的原因而造成的準(zhǔn)確率受影響的問題,本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的肝穿刺圖像分類的方法,對(duì)圖像進(jìn)行基本的判斷。進(jìn)而希望可以作為一個(gè)輔助手段來幫助醫(yī)師進(jìn)行判斷。另一方面,也可以減輕醫(yī)師的工作量,為患者節(jié)約檢驗(yàn)成本。
本實(shí)驗(yàn)所采用的樣本主要分為三個(gè)類別---健康、輕微病變、嚴(yán)重病變,如圖1所示。
隨著病變程度的不同,損傷區(qū)域的特征也不同。因此,很難設(shè)計(jì)一種將病變區(qū)域和背景區(qū)域可以很好區(qū)分的特征提取算法。而深度學(xué)習(xí)就是用來進(jìn)行特征提取、訓(xùn)練然后進(jìn)行分類的一個(gè)很好的工具。而作為深度學(xué)習(xí)中重要組成部分的卷積神經(jīng)網(wǎng)絡(luò),則是近幾年被國內(nèi)廣泛應(yīng)用的一種人工神經(jīng)網(wǎng)絡(luò)。本文也是基于這種人工神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)。
卷積神經(jīng)網(wǎng)絡(luò)是受貓視覺皮層生理研究啟發(fā),有人提出了卷積神經(jīng)網(wǎng)絡(luò)。而后Yann Lecun最早將其成功應(yīng)用于MNIST手寫體數(shù)字識(shí)別任務(wù)中[2],并持續(xù)保持了其在該問題上的霸主地位。由此,卷積神經(jīng)網(wǎng)絡(luò)開始被大眾所熟知。近年來卷積神經(jīng)網(wǎng)絡(luò)在多個(gè)領(lǐng)域都開始發(fā)揮自己的優(yōu)勢,如醫(yī)學(xué)圖像識(shí)別及分類[3]、語音識(shí)別[4]、人臉識(shí)別[5]、行為判斷[6]、情感預(yù)測[7]等。
本文以肝穿刺圖像自動(dòng)分類為目標(biāo),設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)方法。通過對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,得到所需的分類器。本文內(nèi)容的具體安排如下:第二節(jié)介紹深度學(xué)習(xí)及卷積神經(jīng)網(wǎng)絡(luò)的基本原理;第三節(jié)介紹本實(shí)驗(yàn)中所用的卷積神經(jīng)網(wǎng)絡(luò)的模型;第四節(jié)中介紹實(shí)驗(yàn)數(shù)據(jù)以及處理方式;第五節(jié)介紹實(shí)驗(yàn)結(jié)果及分析;第六節(jié)總結(jié)與展望。
1 深度學(xué)習(xí)及卷積神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)的結(jié)構(gòu)基礎(chǔ)是多層神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)則是一種特殊的多層神經(jīng)網(wǎng)絡(luò)。在生物體的神經(jīng)網(wǎng)絡(luò)中,每個(gè)神經(jīng)元與其他神經(jīng)元之間相連。當(dāng)神經(jīng)元發(fā)生興奮時(shí),就會(huì)向相鄰的神經(jīng)元之間發(fā)送神經(jīng)遞質(zhì),從而改變這些神經(jīng)元內(nèi)部的電位,產(chǎn)生相應(yīng)的變化。多層神經(jīng)網(wǎng)絡(luò)和生物的神經(jīng)網(wǎng)絡(luò)類似,它是由輸入層、隱藏層、輸出層組成的。相鄰的各個(gè)位于不同層的神經(jīng)元節(jié)點(diǎn)間均有權(quán)值相連接。如圖2所示,展示了一個(gè)具有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)。
其對(duì)應(yīng)的公式(1)如下:
[a(2)1=f(ω(1)11x1+ω(1)12x2+ω(1)13x3+b(1)1)]
[a(2)2=f(ω(1)21x1+ω(1)22x2+ω(1)23x3+b(1)2)] (1)
[a(2)3=f(ω(1)31x1+ω(1)32x2+ω(1)33x3+b(1)3)]
[hω,b(x)=a(3)1=f(ω(2)11a(2)1+ω(2)12a(2)2+ω(2)13a(2)3+b(2)1)]
其中[ω] 為層間的參數(shù)矩陣,[b] 為偏移參數(shù)向量,[x] 為輸入,[f] 為激活函數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)與普通的人工神經(jīng)網(wǎng)絡(luò)的區(qū)別在于,卷積神經(jīng)網(wǎng)絡(luò)在原來的人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了特征學(xué)習(xí)部分,而這部分就是模擬人腦在對(duì)接收到的信號(hào)處理上的分級(jí)的方法。具體操作就是在全連接層前加入了由卷積層和下采樣層構(gòu)成的特征抽取器。在卷積神經(jīng)網(wǎng)絡(luò)中的每一個(gè)卷積層中,又包含了若干個(gè)特征平面,每個(gè)特征平面由一些矩陣排列的神經(jīng)元組成。卷積核的初始化一般是以一個(gè)隨機(jī)小數(shù)的矩陣的形式,在訓(xùn)練的過程中得到合適的權(quán)值。下采樣也叫作池化,通常包括均值下采樣和最大值下采樣兩種形式。卷積和下采樣很大程度地簡化了網(wǎng)絡(luò)模型的復(fù)雜程度,減少了模型的參數(shù)。
2 實(shí)驗(yàn)所用到的網(wǎng)絡(luò)模型
本實(shí)驗(yàn)中所采用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖3所示:
如上圖,其中Conv表示卷積層,Sub表示下采樣層,F(xiàn)c表示全連接層。該網(wǎng)絡(luò)結(jié)構(gòu)中卷積層和下采樣層交替出現(xiàn)。在卷積層中,樣本會(huì)經(jīng)過卷積核的卷積計(jì)算等一系列處理,形成特征圖。在下采樣層中,樣本數(shù)據(jù)會(huì)根據(jù)下采樣算子進(jìn)行下采樣操作。
在本文網(wǎng)絡(luò)模型的卷積層中,采用的是修正線性單元(Rectified linear unit,ReLU)激活函數(shù)。而在前兩個(gè)全連接層中采用的是雙曲正切函數(shù)(Tanh)作為激活函數(shù)。在最后一層全連接層采用softmax激活函數(shù)。為了防止卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)過擬合問題,本文采用了Dropout技術(shù)[8]。
3 實(shí)驗(yàn)數(shù)據(jù)
數(shù)據(jù)集是對(duì)分類其中參數(shù)進(jìn)行分類的樣本,對(duì)于分類器的最終效果影響很大。本實(shí)驗(yàn)中所用的數(shù)據(jù)為肝穿刺圖像,目前在醫(yī)學(xué)圖像處理領(lǐng)域里,尚未存在一個(gè)標(biāo)準(zhǔn)化的肝穿刺圖像數(shù)據(jù)集,且本實(shí)驗(yàn)中的應(yīng)用背景是肝穿刺活檢樣本的分類,訓(xùn)練所需的數(shù)據(jù)集也應(yīng)取自實(shí)際醫(yī)院中進(jìn)行肝穿刺檢測的患者,故樣本收集難度較大。
為了有一個(gè)標(biāo)準(zhǔn)的訓(xùn)練及檢測數(shù)據(jù)集,本實(shí)驗(yàn)進(jìn)行前對(duì)其他圖像處理方向的領(lǐng)域進(jìn)行了調(diào)研,分析了他們的標(biāo)準(zhǔn)數(shù)據(jù)集。發(fā)現(xiàn)其有幾個(gè)共同的特點(diǎn):1、數(shù)據(jù)集中數(shù)據(jù)的量很大,通常圖片數(shù)目超過5000張且每個(gè)類中圖片的數(shù)目相差不大;2、與訓(xùn)練數(shù)據(jù)集相類似,分別設(shè)置了對(duì)應(yīng)的測試樣本數(shù)據(jù)集,用來對(duì)其訓(xùn)練好的模型進(jìn)行測試。并且訓(xùn)練數(shù)據(jù)集和測試樣本數(shù)據(jù)集中的數(shù)據(jù)不重復(fù),保證了測試結(jié)果的真實(shí)性。而本實(shí)驗(yàn)所原有的數(shù)據(jù)由于病患群體的特殊性,導(dǎo)致三個(gè)類別的樣本數(shù)目分部嚴(yán)重不均衡。健康類圖片的樣本數(shù)目遠(yuǎn)遠(yuǎn)多于其他兩個(gè)類的樣本數(shù)目。
通過對(duì)上述樣本數(shù)據(jù)集及自有樣本集的分析。本實(shí)驗(yàn)通過調(diào)研發(fā)現(xiàn),對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行旋轉(zhuǎn)、翻折等操作可以產(chǎn)生大量可用的偽數(shù)據(jù)樣本[9]。增加可用的樣本數(shù)量且不會(huì)影響模型的訓(xùn)練。如圖4來擴(kuò)展兩個(gè)數(shù)量不多的樣本庫,使其數(shù)量與健康類數(shù)量相差不大,以保證訓(xùn)練效果。
受到原始數(shù)據(jù)集的影響,本次實(shí)驗(yàn)所用的數(shù)據(jù)集仍達(dá)不到公開數(shù)據(jù)集的樣本數(shù)量。經(jīng)過對(duì)數(shù)據(jù)集進(jìn)行處理后,本次實(shí)驗(yàn)所用的訓(xùn)練集為健康樣本720張,輕微病變類樣本612張,嚴(yán)重病變類樣本584張,共計(jì)1916張。而測試集中的健康類樣本為104張,輕微病變樣本為86張,嚴(yán)重病變類樣本82張,共計(jì)272張。且訓(xùn)練集和測試集中的樣本無重復(fù)。
4 實(shí)驗(yàn)結(jié)果及分析
本次實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境為Windows 7系統(tǒng)+TensorFlow+python3.5,應(yīng)用GPU對(duì)卷積運(yùn)算進(jìn)行加速,所用GPU型號(hào)為GTX1050Ti。在本次實(shí)驗(yàn)中,由于設(shè)備性能受限,只進(jìn)行了400次循環(huán),學(xué)習(xí)率設(shè)置為0.001。采用分批訓(xùn)練方式,每批次含有樣本數(shù)目70個(gè),訓(xùn)練樣本集分為28個(gè) 批次。這樣訓(xùn)練的好處是相比于逐一訓(xùn)練是有全局性的,也提高了提高機(jī)器的使用率。而相對(duì)于整體訓(xùn)練來說,能大幅度節(jié)約訓(xùn)練時(shí)間。當(dāng)所有訓(xùn)練樣本批次訓(xùn)練完畢后,一次循環(huán)完成。如此往復(fù)進(jìn)行400次循環(huán),共計(jì)11200個(gè)批次。
圖4是使用tensorboard記錄的訓(xùn)練圖中準(zhǔn)確率的變化情況??梢钥闯鲈谕瓿?0000個(gè)批次訓(xùn)練時(shí)準(zhǔn)確率已經(jīng)達(dá)到88.47%。最終,在400次循環(huán)完成后,用測試集進(jìn)行測試的準(zhǔn)確率為91.54%。
對(duì)實(shí)驗(yàn)中數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn),測試集中分類錯(cuò)誤的圖片大部分都在輕微病變類測試樣本中,是因?yàn)閷?duì)于病變程度的界定目前沒有一個(gè)準(zhǔn)確的界定方式,模型只能根據(jù)訓(xùn)練數(shù)據(jù)中,它所學(xué)到的訓(xùn)練數(shù)據(jù)樣本的特征進(jìn)行分辨,所以才造成這種問題。
5 總結(jié)
在本文和相關(guān)工作中,設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,從而獲得分類器模型的方法,并在肝穿刺圖像分類中取得了比較好的效果。在制作數(shù)據(jù)集的過程中,利用圖像的各種變換方式,獲取了一定數(shù)量的偽數(shù)據(jù);依據(jù)分類結(jié)果,給出病變程度的診斷。肝穿刺圖像的這種分類方法在現(xiàn)有數(shù)據(jù)中達(dá)到了預(yù)期的效果。
對(duì)比于傳統(tǒng)的依靠醫(yī)師主觀經(jīng)驗(yàn)進(jìn)行判別的診斷方法,本實(shí)驗(yàn)證明了采用卷積神經(jīng)網(wǎng)絡(luò)也可以進(jìn)行判別,且準(zhǔn)確率高于傳統(tǒng)方法的平均準(zhǔn)確率。在今后的研究工作中,會(huì)進(jìn)一步對(duì)卷積神經(jīng)網(wǎng)絡(luò)在圖像處理方面進(jìn)行探索、學(xué)習(xí)、研究,并在實(shí)際中加以應(yīng)用,繼續(xù)提升識(shí)別效果以及識(shí)別準(zhǔn)確率。
參考文獻(xiàn):
[1] 楊晶晶, 王騫, 宣曉華. 基于深度卷積神經(jīng)網(wǎng)絡(luò)算法的肺結(jié)節(jié)檢測模型[J]. 數(shù)學(xué)建模及其應(yīng)用, 2017(4).
[2] Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.
[3] Hatipoglu N, Bilgin G. Classification of histopathological images using convolutional neural network[C]// International Conference on Image Processing Theory, TOOLS and Applications. IEEE, 2015:1-6.
[4]張晴晴, 劉勇, 王智超,等. 卷積神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用[J]. 網(wǎng)絡(luò)新媒體技術(shù), 2014, 3(6):39-42.
[5]葉浪. 基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別研究[D]. 東南大學(xué), 2015.
[6] Park E, Han X, Berg T L, et al. Combining multiple sources of knowledge in deep CNNs for action recognition[C]// IEEE Winter Conference on Applications of Computer Vision. IEEE Computer Society, 2016:1-8.
[7]蔡國永, 夏彬彬, CAIGuoyong,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖文融合媒體情感預(yù)測[J]. 計(jì)算機(jī)應(yīng)用, 2016, 36(2):428-431.
[8] Murphy K, Van G B, Schilham A M, et al. A large-scale evaluation of automatic pulmonary nodule detection in chest CT using local image features and k-nearest-neighbourclassification[J]. Medical Image Analysis, 2009, 13(5):757-770.
[9]劉巖. 卷積神經(jīng)網(wǎng)絡(luò)在光學(xué)元件損傷檢測中的應(yīng)用[J]. 電腦知識(shí)與技術(shù), 2017, 13(4):178-182.
[10]周飛燕, 金林鵬, 董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2017, 40(6):1229-1251.
[11]呂國豪, 羅四維, 黃雅平,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的正則化方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(9):1891-1900.
[12]許可. 卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別上的應(yīng)用的研究[D]. 浙江大學(xué), 2012.
[13] 陳先昌. 基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 浙江工商大學(xué), 2014.
[14]郭以河, 張閩峰, 孟家榕,等. 肝穿刺活檢標(biāo)本處理方法的改進(jìn)[J]. 臨床與實(shí)驗(yàn)病理學(xué)雜志, 2004, 20(6):747-748.
[15]徐成潤, 張閩峰, 鄭瑞丹,等. 4200例肝穿刺活檢組織病理與臨床分析[J]. 肝臟, 2008, 13(2):115-117.
[16]周春輝, 孫雷, 李曉楠,等. 127例乙型病毒性肝炎肝穿刺活檢結(jié)果的比較分析[J]. 臨床肝膽病雜志, 2005, 21(5):271-272.
【通聯(lián)編輯:唐一東】