張新斌 康昌春 李文琿
摘 要:在最近幾年中,醫(yī)學(xué)影像技術(shù)發(fā)展迅猛,進(jìn)入到大數(shù)據(jù)的新階段。怎樣從大量的醫(yī)學(xué)圖像數(shù)據(jù)內(nèi)篩選出重要的信息,顯然是醫(yī)學(xué)辨識圖像過程中的一個(gè)挑戰(zhàn)。深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)興起的新領(lǐng)域。經(jīng)由人腦的模擬構(gòu)建起分層模型,它可以有效地化解傳統(tǒng)式機(jī)器學(xué)習(xí)法無法挑選出醫(yī)學(xué)圖像內(nèi)所包藏的信息內(nèi)容,體現(xiàn)出不可小覷的智能化特征提取、建構(gòu)復(fù)雜化的模型結(jié)構(gòu)以及有效的特征表達(dá)性能。更為關(guān)鍵的是,深度學(xué)習(xí)法可以通過像素級的最初數(shù)據(jù)逐步地通過底層至高層的途徑來提取特征,其為化解辨識醫(yī)學(xué)圖像所碰到的新問題指出了新的方向。本論文闡述深度學(xué)習(xí)的概念,簡述主要的模型結(jié)構(gòu),以乳腺腫瘤X線圖像數(shù)據(jù)的歸類為例,研究基于深度學(xué)習(xí)網(wǎng)絡(luò)探析醫(yī)學(xué)影像大數(shù)據(jù)的相關(guān)課題。
關(guān)鍵詞:深度學(xué)習(xí);醫(yī)學(xué)影像;大數(shù)據(jù)
中圖分類號:R445;TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2018)08-0084-03
Abstract:In recent years,medical imaging technology has developed rapidly and has entered a new stage of big data. How to filter important information from a large number of medical image data is clearly a challenge in the process of medical identification. Deep learning belongs to the new field of machine learning. Based on the simulation of human brain,a hierarchical model is constructed. It can effectively resolve the traditional machine learning method,which can not pick out the information contained in medical images,and embody the intelligent feature extraction,construction complex model structure and effective feature expression performance,and more critical is the depth study. The method can extract features through the initial data from the first to the high level through the initial data of the pixel level,which is a new direction for resolving the new problems encountered in the identification of medical images. This paper expounds the concept of deep learning and describes the main model structure. It takes the classification of the X-ray image data of breast tumor as an example,and analyses the related subjects of the big data of medical images based on the depth learning network.
Keywords:deep learning;medical image;big data
0 引 言
從2006年迄今,深度學(xué)習(xí)即被當(dāng)作機(jī)器學(xué)習(xí)范圍的重要分支誕生。它應(yīng)用數(shù)層的復(fù)雜結(jié)構(gòu)或通過數(shù)重非線性的變換組成數(shù)個(gè)處理層,并對數(shù)據(jù)加以處理。在最近幾年中,深度學(xué)習(xí)廣泛地在語音與音頻辨識、計(jì)算機(jī)視覺、自然語言處理以及生物信息學(xué)等范圍均獲得了明顯的成果。由于深度學(xué)習(xí)廣泛地運(yùn)用于數(shù)據(jù)的分析方面,具有極為可觀的運(yùn)用前景,已被贊譽(yù)成2013年迄今的十大最為重要的一項(xiàng)突破性技術(shù)。
醫(yī)療關(guān)系著百姓的生命健康。當(dāng)下醫(yī)療的數(shù)據(jù)量并不小,然而能否使用好海量的醫(yī)療數(shù)據(jù)是醫(yī)療領(lǐng)域是否可以做出明顯貢獻(xiàn)的一項(xiàng)重要指標(biāo)。當(dāng)然,醫(yī)療數(shù)據(jù)量亦存在著不少的問題:醫(yī)療的數(shù)據(jù)多元化,主要的類型有圖像、文字、視頻以及磁等;因?yàn)椴捎玫脑O(shè)備存在著區(qū)別,數(shù)據(jù)質(zhì)量也存在著顯著的區(qū)別;數(shù)據(jù)呈現(xiàn)出波動的特點(diǎn),隨著時(shí)間與特定的事件改變;因?yàn)閭€(gè)體之間的區(qū)別,疾病的規(guī)律并無普遍的適用性等。因此,可以借助于深度學(xué)習(xí)的方法來化解醫(yī)學(xué)影像大數(shù)據(jù)所存在的一系列問題。
1 深度學(xué)習(xí)理論概述
1.1 深度學(xué)習(xí)的概念
深度學(xué)習(xí)來源于人工神經(jīng)網(wǎng)絡(luò)的相關(guān)分析。含數(shù)隱層的感知器即為就一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)主要經(jīng)由組合低層特點(diǎn)構(gòu)建起更為抽象化的高層方式來表達(dá)屬性種類或是特點(diǎn),用挖掘數(shù)據(jù)的分布式特點(diǎn)加以表達(dá)。深度學(xué)習(xí)法模擬的是人類的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),經(jīng)由組合數(shù)個(gè)非線性的處理層來逐層地處理最初的數(shù)據(jù),通過數(shù)據(jù)內(nèi)得到各個(gè)層次的抽象特點(diǎn),且應(yīng)用在分類的預(yù)測方面。深度學(xué)習(xí)的長處在于通過非監(jiān)督式或是半監(jiān)督式的特點(diǎn)學(xué)習(xí)與分層特征獲得高效的計(jì)算方法來取代人工的獲取特點(diǎn)。
通過一個(gè)輸入內(nèi)產(chǎn)生相應(yīng)的輸出所關(guān)涉的計(jì)算能夠經(jīng)由流向圖(flow graph)的方式加以表達(dá)。流向圖屬于一類可以表達(dá)計(jì)算功能的圖。在此類型的圖內(nèi),每個(gè)節(jié)點(diǎn)所表示的是基礎(chǔ)的計(jì)算及其所包括的數(shù)個(gè)隱層以及其中深度學(xué)習(xí)所對應(yīng)的模型。而模型內(nèi)含數(shù)個(gè)隱層化的數(shù)據(jù)信息,運(yùn)算的結(jié)果被運(yùn)用至此節(jié)點(diǎn)相應(yīng)的子節(jié)點(diǎn)數(shù)值之中。顧及到運(yùn)算的集合情況,其能夠被同意在每個(gè)節(jié)點(diǎn)與可能性的圖結(jié)構(gòu)內(nèi),同時(shí)也界定了函數(shù)族的具體形式。輸入的節(jié)點(diǎn)并無分節(jié)點(diǎn),且輸出的節(jié)點(diǎn)也無分節(jié)點(diǎn)。
此類流向圖比較特殊的屬性為深度(depth),即由單個(gè)輸入至單個(gè)輸出最長渠道的長度。以往的前饋式神經(jīng)網(wǎng)絡(luò)可以被看作擁有等于層數(shù)的深度(比如對于輸出層為隱層數(shù)加1)。SVMs有深度2(一個(gè)對應(yīng)于核輸出或者特征空間,另一個(gè)對應(yīng)于所產(chǎn)生輸出的線性混合)。人工智能化分析的趨勢之一在于憑借于“專家系統(tǒng)”工具,從上至下地通過許多“若-那么(If-Then)”的相關(guān)規(guī)則加以界定。人工式神經(jīng)網(wǎng)絡(luò)(Artifical Neural Network)意味著另外的一類從下至上的途徑。神經(jīng)網(wǎng)絡(luò)概念并無嚴(yán)格的正式界定。其基本特征在于嘗試著仿照大腦結(jié)構(gòu)的神經(jīng)元內(nèi)部進(jìn)行傳遞,處置相關(guān)的信息。
1.2 主要的模型類型
深度學(xué)習(xí)的不少模型結(jié)構(gòu)已經(jīng)被運(yùn)用至醫(yī)學(xué)影像的大數(shù)據(jù)內(nèi)。常見的模型類型包括如下的幾種:稀疏編碼網(wǎng)絡(luò)(HierarchicalSparse Coding,HSC)、受限玻爾茲曼機(jī)(Restricted Bohzmann Machines,RBM)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、棧式自編碼器(Stacked Autcr—Encoders,SAE)以及深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)等。
2 基于深度學(xué)習(xí)網(wǎng)絡(luò)探析醫(yī)學(xué)影像大數(shù)據(jù)——以乳腺腫瘤X線圖像數(shù)據(jù)的歸類為例
通過抽象化的數(shù)據(jù)特點(diǎn)可知,基于深度學(xué)習(xí)網(wǎng)絡(luò)能夠強(qiáng)化總體的分類功能。當(dāng)然,盲目地加大網(wǎng)絡(luò)深度亦可以弱化它所具有的泛化功能,產(chǎn)生過擬合的后果。因而,需基于具體的現(xiàn)實(shí)運(yùn)用與數(shù)據(jù)集信息挑選恰當(dāng)?shù)木W(wǎng)絡(luò)深度類型。隱含層節(jié)點(diǎn)數(shù)指標(biāo)亦為對網(wǎng)絡(luò)的分類功能產(chǎn)生影響的另一個(gè)比較重要的因素,如果隱含層對應(yīng)的節(jié)點(diǎn)數(shù)并不多,即會造成網(wǎng)絡(luò)中神經(jīng)元內(nèi)部連接的規(guī)模并不大,導(dǎo)致提取的準(zhǔn)備分類的數(shù)據(jù)內(nèi)部特點(diǎn)數(shù)量并不多,不足以實(shí)現(xiàn)分類的目標(biāo);如果隱含層所包含的節(jié)點(diǎn)數(shù)過大,除卻造成過擬合后果之外,還會造成總體性網(wǎng)絡(luò)的反應(yīng)速度遲緩,致使出現(xiàn)訓(xùn)練與檢測的時(shí)間太長等情況。
因而,本論文將隱含層的節(jié)點(diǎn)數(shù)應(yīng)用在探討適合于乳腺腫瘤的x線圖像歸類的深度學(xué)習(xí)的網(wǎng)絡(luò)模型中。根據(jù)相關(guān)的實(shí)驗(yàn)結(jié)果可知,最適合于DBN,SAE與CNN的深度學(xué)習(xí)模型依次為{1024-100.150-200-300-600.1000-6,1024-100.150-200-300-600.1000-6,1-12C.12S-36C-36S-72C-72S.120C.120C-120C-240-100-6}。若采納此類型的網(wǎng)絡(luò)結(jié)構(gòu)模型進(jìn)行分類,Spec,Sen與Acc的分類指標(biāo)依次最高。在對它們進(jìn)行比對后發(fā)現(xiàn),CNN就Ace指標(biāo)的性能最佳,Spec與Sen存在著不足,DBN與SAE大體一致,原因在于DBN與SAE的結(jié)構(gòu)模型極為近似。通過6類畸形化的乳腺X線圖像得到SAE,ANN,CNN以及DBN進(jìn)行功能的分類之后,可以界定適合于乳腺腫瘤的X線圖像歸類的CNN,DBN與SAE的網(wǎng)絡(luò)模型結(jié)構(gòu),據(jù)此,把它依次和ANN展開比對分析可知,ANN的輸入特點(diǎn)采用的是其提取的特點(diǎn),并采納10折交叉驗(yàn)證法加以研究。基于結(jié)果發(fā)現(xiàn),DBN與ANN比對后可知,分類的性能均得以改進(jìn),原因在于CNN,DBN與SAE都采納了深度學(xué)習(xí)的模型結(jié)構(gòu)。當(dāng)訓(xùn)練的次數(shù)遞增時(shí),總體則表現(xiàn)出下降的走向,且CNN的錯(cuò)誤率處于最低的程度,其次為SAE與DBN,最后為ANN。就總體訓(xùn)練的走向而言,ANN出現(xiàn)分類上的錯(cuò)誤概率浮動改變最為明顯,呈現(xiàn)出明顯的隨機(jī)性,總體分類的穩(wěn)定性欠佳,原因在于ANN最初的權(quán)值存在著明顯的隨機(jī)性,總體網(wǎng)絡(luò)易陷入到局部性的最優(yōu)。深度學(xué)習(xí)的網(wǎng)絡(luò)模型結(jié)構(gòu)所具有的分類功能顯著地好過以往的ANN網(wǎng)絡(luò)模型結(jié)構(gòu)。就4類網(wǎng)絡(luò)模型的結(jié)構(gòu)分類相應(yīng)的混淆矩陣可知,SAE、CNN與DBN的各個(gè)種類的分類正確率都超出ANN。因而,此3種網(wǎng)絡(luò)模型結(jié)構(gòu)處于MIAS非正常時(shí)分類顯著地好過以往的ANN計(jì)算方法。有關(guān)ANN、CNN、SAE、DBN在分類的特異性、敏感性以及精度的結(jié)果統(tǒng)計(jì)情況如表1~表4所示。
3 結(jié) 論
深度學(xué)習(xí)必須擁有大量、優(yōu)質(zhì)的數(shù)據(jù)加以應(yīng)用,特別是它和醫(yī)學(xué)方面的有機(jī)結(jié)合,其特點(diǎn)更加明顯地體現(xiàn)出來。監(jiān)督學(xué)習(xí)必須要有人類專家的標(biāo)記型數(shù)據(jù),且及時(shí)地傳教給機(jī)器精確的答案,才可以產(chǎn)生出更為精確的結(jié)果。作為機(jī)器學(xué)習(xí)的一個(gè)新出現(xiàn)的領(lǐng)域,深度學(xué)習(xí)在處理圖像與計(jì)算機(jī)視覺領(lǐng)域的成功,替醫(yī)學(xué)學(xué)科的圖像辨識提供了新的發(fā)展路徑。當(dāng)然,雖然當(dāng)下深度學(xué)習(xí)已在醫(yī)學(xué)圖像辨識中獲得了一定的研究成果,但從整體上說,深度學(xué)習(xí)運(yùn)用于醫(yī)學(xué)圖像辨識領(lǐng)域依舊處在最初的階段,將來還有不少的問題需加以解決。
參考文獻(xiàn):
[1] 呂鴻蒙,趙地,遲學(xué)斌.基于增強(qiáng)AlexNet的深度學(xué)習(xí)的阿爾茨海默病的早期診斷 [J].計(jì)算機(jī)科學(xué),2017,44(S1):50-60.
[2] 孫志遠(yuǎn),魯成祥,史忠植,等.深度學(xué)習(xí)研究與進(jìn)展 [J].計(jì)算機(jī)科學(xué),2016,43(2):1-8.
[3] 李淵,駱志剛,管乃洋,等.生物醫(yī)學(xué)數(shù)據(jù)分析中的深度學(xué)習(xí)方法應(yīng)用 [J].生物化學(xué)與生物物理進(jìn)展,2016,43(5):472-483.
[4] Haykin S.神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí) [M].申富饒,徐燁,鄭俊,等,譯.北京:機(jī)械工業(yè)出版社,2011.
作者簡介:張新斌(1985-),男,漢族,山東濟(jì)南人,科員,助理工程師,碩士。研究方向:醫(yī)療信息化。