石陸魁,杜偉昉,馬紅祺,張 軍+
(1.河北工業(yè)大學(xué) 人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津 300401;2.河北工業(yè)大學(xué) 河北省大數(shù)據(jù)計(jì)算重點(diǎn)實(shí)驗(yàn)室,天津 300401)
基于傳統(tǒng)機(jī)器學(xué)習(xí)的肺癌檢測(cè)方法依賴于人為標(biāo)注的感興趣區(qū)域,而且需要按照預(yù)先設(shè)定的特征提取方法來提取病灶特征,難以實(shí)現(xiàn)自動(dòng)化[1-4]?;谏疃葘W(xué)習(xí)的肺癌檢測(cè)方法通過網(wǎng)絡(luò)自主學(xué)習(xí)并提取特征[5,6],排除了人為因素的影響。Dou等[7]提出一種使用三維卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)來減少自動(dòng)檢測(cè)肺結(jié)節(jié)中假陽(yáng)性的方法。與二維神經(jīng)網(wǎng)絡(luò)相比,三維網(wǎng)絡(luò)架構(gòu)可以提取更豐富的空間信息,從而獲得更具代表性的特征。Ju-lian 等[8]用32×32×32大小的圖像塊作為3D-CNN的輸入,對(duì)肺部CT圖像進(jìn)行結(jié)節(jié)和惡性檢測(cè),在肺癌檢測(cè)任務(wù)上取得了不錯(cuò)的結(jié)果,但其未考慮其它尺度的輸入大小對(duì)檢測(cè)任務(wù)的影響。另外,由于標(biāo)注CT圖像的專業(yè)性強(qiáng),帶標(biāo)注的數(shù)據(jù)不足,而且肺結(jié)節(jié)大小各異且征象較為復(fù)雜,使得結(jié)節(jié)檢測(cè)存在一定困難。同時(shí)由于小尺度輸入的結(jié)節(jié)檢測(cè)網(wǎng)絡(luò)很難獲取到大區(qū)域病灶的整體特征,從而影響肺癌的識(shí)別。針對(duì)上述問題,本文在3D-CNN基礎(chǔ)上,基于遷移學(xué)習(xí)提出了一種多尺度和特征融合的肺癌識(shí)別方法。在Kaggle Data Science Bowl 2017數(shù)據(jù)集[9]上驗(yàn)證了該方法的有效性。
在Kaggle Data Science Bowl 2017競(jìng)賽中,Julian等提出了一種3D-CNN模型,用來檢測(cè)肺結(jié)節(jié)。該結(jié)節(jié)檢測(cè)模型為多任務(wù)學(xué)習(xí)模型,在進(jìn)行結(jié)節(jié)概率預(yù)測(cè)的同時(shí)可評(píng)估其惡性程度。網(wǎng)絡(luò)模型如圖1所示。
圖1 3D-CNN結(jié)節(jié)檢測(cè)模型
該模型基于行為識(shí)別網(wǎng)絡(luò)C3D,共包含9個(gè)卷積層和5個(gè)池化層。模型中前六層卷積、第七層卷積分別采用3×3×3、2×2×2大小的卷積核,最后兩個(gè)并列的卷積層卷積核大小為1×1×1。前7個(gè)卷積層均采用relu激活函數(shù),用于預(yù)測(cè)結(jié)節(jié)概率的卷積層采用sigmoid函數(shù),預(yù)測(cè)惡性程度的卷積層未使用激活函數(shù)。池化層多采用最大池化。
該模型采用遷移學(xué)習(xí)方法,首先用32×32×32大小的肺結(jié)節(jié)數(shù)據(jù)訓(xùn)練該模型;然后,在預(yù)測(cè)階段,通過向網(wǎng)絡(luò)輸入同樣大小的圖像來判斷該區(qū)域包含惡性信息的可能性;最后,基于此信息和結(jié)節(jié)坐標(biāo)等其它特征,估計(jì)該患者發(fā)展成肺癌的概率。訓(xùn)練數(shù)據(jù)來自LUNA16數(shù)據(jù)集[10]。根據(jù)結(jié)節(jié)的輪廓點(diǎn)坐標(biāo)從CT中切割出三維肺結(jié)節(jié)訓(xùn)練3D-CNN。基于LUNA16數(shù)據(jù)集切取的訓(xùn)練集樣本類型和數(shù)量見表1。
表1 訓(xùn)練集樣本
LUNA16數(shù)據(jù)集和Kaggle數(shù)據(jù)集的特點(diǎn)如下:
(1)LUNA16是LIDC數(shù)據(jù)集的一個(gè)子集,包含了888個(gè)病例的CT影像,其中共有1186個(gè)結(jié)節(jié),直徑范圍為3 mm~30 mm,這些結(jié)節(jié)分別由4名影像科醫(yī)生進(jìn)行標(biāo)注。在注釋文件中給出了4名放射學(xué)專家對(duì)每張CT片中出現(xiàn)的結(jié)節(jié)的定義,包括結(jié)節(jié)的主要CT征象,如毛刺征、分葉征、鈣化等以及結(jié)節(jié)的惡性程度。對(duì)于直徑大于等于 3 mm 的結(jié)節(jié),給出了輪廓點(diǎn)的坐標(biāo),直徑小于3 mm的結(jié)節(jié)給出了中心點(diǎn)的坐標(biāo);
(2)Kaggle Data Science Bowl 2017數(shù)據(jù)集共包含2101個(gè)病例CT影像。它是一個(gè)two-stage的比賽,兩個(gè)階段用的測(cè)試集不同。其中,stage1中包含1595個(gè)具有癌癥標(biāo)簽的CT影像,1397個(gè)作為訓(xùn)練集,198個(gè)作為驗(yàn)證集;stage2中包含506個(gè)無癌癥標(biāo)簽的數(shù)據(jù)。與LUNA16數(shù)據(jù)集不同的是,此數(shù)據(jù)集沒有標(biāo)記結(jié)節(jié)。
肺結(jié)節(jié)的檢測(cè)結(jié)果影響著最終肺癌識(shí)別的準(zhǔn)確性,而輸入圖片的尺寸對(duì)檢測(cè)模型的性能影響相當(dāng)明顯。肺結(jié)節(jié)通常是指肺實(shí)質(zhì)內(nèi)直徑不超過3 cm的類圓形病灶,臨床上把直徑大于3 cm的病灶稱為肺部腫塊。一般認(rèn)為,肺結(jié)節(jié)的直徑越大,其為惡性的概率越大(直徑大于3 cm的病灶多為惡性),從而發(fā)展成癌癥的可能性越大。Julian等僅用32×32×32大小的圖像塊作為輸入,對(duì)于直徑大于3 cm的病灶,只能局部投入網(wǎng)絡(luò),導(dǎo)致網(wǎng)絡(luò)提取不到其概貌特征。另外,Kaggle數(shù)據(jù)集中存在大于3 cm的肺腫塊,其致病人患癌的概率大大升高。要想檢測(cè)到此類區(qū)域,需向網(wǎng)絡(luò)輸入更大尺度的圖像。
Julian等提出的模型是一個(gè)特殊的卷積神經(jīng)網(wǎng)絡(luò)——全卷積網(wǎng)絡(luò)(fully convolutional networks,F(xiàn)CN),與經(jīng)典的CNN只能輸入特定尺寸的圖像不同,F(xiàn)CN可以接受任意尺寸的輸入圖像,小尺度輸入時(shí)網(wǎng)絡(luò)注重細(xì)節(jié)特征,大尺度輸入時(shí)網(wǎng)絡(luò)能夠抓住概貌特征。
為了檢測(cè)不同大小的結(jié)節(jié)、充分描述結(jié)節(jié)的詳細(xì)特征,基于Julian等提出的預(yù)訓(xùn)練的3D-CNN,用多尺度輸入方式在Kaggle數(shù)據(jù)集上檢測(cè)結(jié)節(jié),建立基于多尺度和特征融合的肺癌識(shí)別模型。為了減小漏診的概率,首先以滑窗的方式檢測(cè)肺結(jié)節(jié),然后提取結(jié)節(jié)特征并預(yù)測(cè)得到結(jié)節(jié)的概率和惡性程度,最后根據(jù)網(wǎng)絡(luò)提取的特征用XGBoost算法預(yù)測(cè)肺癌。
結(jié)節(jié)檢測(cè)網(wǎng)絡(luò)輸出結(jié)果的好壞在一定程度上受限于輸入圖像尺寸的大小。其主要影響如下:
(1)當(dāng)網(wǎng)絡(luò)輸入圖像較小時(shí),如輸入圖像塊尺度為32×32×32時(shí),其適用于提取小結(jié)節(jié)的特征,也可提取大結(jié)節(jié)的分葉、毛刺、棘突等細(xì)微特征的形狀和分布,但其獲取不到大結(jié)節(jié)或肺腫塊的整體特征;
(2)當(dāng)網(wǎng)絡(luò)輸入圖像較大時(shí),如輸入圖像塊尺度為64×64×64時(shí),其適用于描述肺結(jié)節(jié)和肺腫塊的體積、概貌等整體特征。
為此,根據(jù)肺結(jié)節(jié)和肺腫塊的直徑大小,測(cè)試圖像采用3種不同尺度,分別為32×32×32、48×48×48、64×64×64。不同尺度的圖像塊投入網(wǎng)絡(luò)會(huì)得到不同大小的輸出結(jié)果,3個(gè)不同尺度圖像塊的網(wǎng)絡(luò)實(shí)際輸出結(jié)果大小分別為1×1×1、2×2×2、3×3×3。為降低肺結(jié)節(jié)的漏檢率,取網(wǎng)絡(luò)最后輸出特征圖中體素的最大值作為檢測(cè)到的結(jié)節(jié)最終特征,如圖2所示,當(dāng)以48×48×48的圖像塊輸入時(shí),網(wǎng)絡(luò)最后輸出一個(gè)2×2×2大小的特征圖,取8個(gè)體素中的最大值作為該圖像塊的結(jié)節(jié)概率或惡性程度。
圖2 網(wǎng)絡(luò)輸出結(jié)果的選取方式
在3個(gè)尺度下,均以CT圖像中惡性程度最大的結(jié)節(jié)作為每個(gè)病例肺癌識(shí)別的主要依據(jù)。在肺癌識(shí)別階段,首先將多尺度的結(jié)節(jié)檢測(cè)結(jié)果進(jìn)行組合,然后利用XGBoost回歸模型預(yù)測(cè)患肺癌的概率。小尺度和大尺度之間相互補(bǔ)充,對(duì)不同大小結(jié)節(jié)的特征提取都取得較好的結(jié)果?;诙喑叨鹊姆伟┳R(shí)別模型如圖3所示。
圖3 基于多尺度的肺癌識(shí)別模型
特征融合方法可以降低單一特征固有缺陷對(duì)識(shí)別任務(wù)的影響,實(shí)現(xiàn)多特征互補(bǔ),提高整體表達(dá)能力,使圖像識(shí)別方法具有更好的魯棒性和更準(zhǔn)確的識(shí)別結(jié)果?;谏疃葘W(xué)習(xí)的特征融合通常是把網(wǎng)絡(luò)隱層提取到的特征圖進(jìn)行融合,然后將融合后的特征投入分類器得到最終結(jié)果。
由于結(jié)節(jié)檢測(cè)網(wǎng)絡(luò)最后提取出的特征太少,不能滿足XGBoost回歸模型的訓(xùn)練,使得肺癌預(yù)測(cè)結(jié)果不甚滿意。為了改進(jìn)這一不足,將網(wǎng)絡(luò)提取的瓶頸層特征和輸出層特征融合來進(jìn)行肺癌預(yù)測(cè)。以32×32×32大小的圖像塊作為網(wǎng)絡(luò)輸入時(shí)為例,將瓶頸層64個(gè)1×1×1的特征和網(wǎng)絡(luò)最后輸出的結(jié)節(jié)概率、惡性程度和區(qū)域坐標(biāo)等特征融合,即將所有的特征向量按照串行的方式組合在一起,形成一個(gè)新的特征向量,再識(shí)別肺癌。融合后的特征不僅包含結(jié)節(jié)的陽(yáng)性概率和惡性程度兩個(gè)屬性,還包含了深度神經(jīng)網(wǎng)絡(luò)提取到的多個(gè)高級(jí)特征,對(duì)肺部病灶的特征描述更加全面,有利于集成分類器對(duì)病變做出診斷。
多個(gè)尺度特征融合時(shí),每個(gè)尺度的瓶頸層和輸出層特征融合后,再將3個(gè)尺度的特征相組合。該方法可從病灶的細(xì)節(jié)特征、概貌特征、細(xì)節(jié)加概貌特征3個(gè)角度檢測(cè)不同大小的病灶區(qū)域,從而降低肺結(jié)節(jié)的漏診率。當(dāng)結(jié)節(jié)檢測(cè)網(wǎng)絡(luò)輸入圖像塊的尺寸為48×48×48和64×64×64時(shí),網(wǎng)絡(luò)提取的瓶頸層和輸出層的特征圖尺寸大于1×1×1,最終的取值方式參見2.1節(jié)的網(wǎng)絡(luò)輸出結(jié)果的選取方式。基于多尺度和特征融合的肺癌識(shí)別模型如圖4所示。
圖4 基于多尺度和特征融合的肺癌識(shí)別模型
另外,一個(gè)已訓(xùn)練的XGBoost模型能夠自動(dòng)計(jì)算特征重要性,在多尺度和特征融合的基礎(chǔ)上,對(duì)多個(gè)尺度融合后的特征按照特征重要性程度自動(dòng)進(jìn)行選擇來訓(xùn)練集成分類器,這在一定程度上擴(kuò)大了有效特征的決策權(quán),減小了噪聲特征對(duì)分類器訓(xùn)練的影響,對(duì)肺癌預(yù)測(cè)更為有利。圖5以7個(gè)特征為例展示了XGBoost模型給出的肺癌識(shí)別中每個(gè)特征的特征重要性得分,分?jǐn)?shù)越高表明該特征對(duì)肺癌識(shí)別的決策權(quán)越大。
圖5 特征重要性
根據(jù)深度神經(jīng)網(wǎng)絡(luò)提取出Kaggle數(shù)據(jù)集中所有病人的結(jié)節(jié)信息等特征,用訓(xùn)練集的特征和對(duì)應(yīng)的癌癥標(biāo)簽訓(xùn)練XGBoost回歸模型,再在測(cè)試集上進(jìn)行癌癥預(yù)測(cè)。
結(jié)節(jié)的惡性程度與其體積、部位、邊緣特征等密切相關(guān),惡性越大表明該患者已患肺癌或未來一段時(shí)間內(nèi)患癌的可能性極大,所以結(jié)節(jié)的惡性程度是識(shí)別肺癌的重要特征。Julian等的肺癌預(yù)測(cè)方法是用病人惡性最大的結(jié)節(jié)特征訓(xùn)練XGBoost模型并預(yù)測(cè)肺癌。從結(jié)節(jié)惡性程度角度出發(fā),本文在多尺度和特征融合基礎(chǔ)上,設(shè)計(jì)了兩種多尺度的肺癌識(shí)別策略。兩種策略均采用病人惡性程度最大的結(jié)節(jié)特征向量訓(xùn)練XGBoost模型,然后在3個(gè)尺度下檢測(cè)出的每個(gè)病人的所有結(jié)節(jié)上做預(yù)測(cè),取病人在各尺度下所有結(jié)節(jié)中的最大預(yù)測(cè)概率作為該病人的癌癥預(yù)測(cè)結(jié)果。最后以病人為單位,對(duì)3個(gè)尺度的癌癥預(yù)測(cè)結(jié)果取均值作為最終的患癌概率。兩種肺癌識(shí)別策略的區(qū)別如下:
多尺度差異性識(shí)別策略:從3個(gè)尺度的差異性角度出發(fā),3個(gè)不同尺度分別對(duì)應(yīng)訓(xùn)練3個(gè)XGBoost回歸模型。在每個(gè)尺度下,利用各自的XGBoost模型在病人的所有結(jié)節(jié)上預(yù)測(cè)患癌概率。
多尺度互補(bǔ)性識(shí)別策略:從3個(gè)尺度的互補(bǔ)性角度出發(fā),3個(gè)尺度共同訓(xùn)練同一XGBoost回歸模型,利用該模型在3個(gè)尺度下分別做預(yù)測(cè)。
為驗(yàn)證所提模型的有效性,在Kaggle Data Science Bowl 2017數(shù)據(jù)集上進(jìn)行了測(cè)試。目的是根據(jù)這些既無結(jié)節(jié)標(biāo)記也無癌癥標(biāo)簽的CT影像預(yù)測(cè)出它未來一年內(nèi)患肺癌的概率。實(shí)驗(yàn)利用Ubuntu16.04系統(tǒng)進(jìn)行仿真,CPU配置為Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz,GPU配置為兩張Nvidia的Tesla P100顯卡,使用CUDA8.0和cuDNN6.0并行計(jì)算,在Keras2.2.4深度學(xué)習(xí)框架上構(gòu)建網(wǎng)絡(luò)模型,其后端為TensorFlow1.4,代碼運(yùn)行于Python3.5環(huán)境下。
實(shí)驗(yàn)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)是將預(yù)測(cè)集506個(gè)病人的肺癌預(yù)測(cè)結(jié)果提交到Kaggle官網(wǎng),官網(wǎng)反饋一個(gè)損失值,損失值越低,說明肺癌識(shí)別方法越有效。該損失值的計(jì)算公式為
(1)
為了方便肺癌識(shí)別結(jié)果比較,除采用LogLoss作為評(píng)價(jià)指標(biāo)外,本文在stage1的198個(gè)驗(yàn)證集上還采用了敏感性(Sensitivity)、特異性(Specificity)和準(zhǔn)確率(Accuracy)這3種度量方式,公式定義分別如下所示
(2)
(3)
(4)
其中,TP表示肺癌被正確分類的個(gè)數(shù);FP表示非肺癌卻被識(shí)別為肺癌的個(gè)數(shù);FN表示肺癌被分類為非肺癌的個(gè)數(shù);TN表示非肺癌被正確分類的個(gè)數(shù)。
將Kaggle數(shù)據(jù)集的stage1和stage2數(shù)據(jù)投入訓(xùn)練好的3D-CNN后,網(wǎng)絡(luò)會(huì)檢測(cè)出每個(gè)病人的所有候選肺結(jié)節(jié),且檢測(cè)出的結(jié)節(jié)概率大小不一,為了更高效地識(shí)別肺癌,僅采用概率大于0.6的結(jié)節(jié)來進(jìn)行肺癌預(yù)測(cè)。本文在Julian等方法的基礎(chǔ)上進(jìn)行了改進(jìn),且在改進(jìn)前復(fù)現(xiàn)了其方法,得到LogLoss值為0.419 46。本文以LogLoss作為主要評(píng)價(jià)指標(biāo),敏感性、特異性和準(zhǔn)確率為輔助評(píng)價(jià)指標(biāo)。驗(yàn)證集的最終結(jié)果以0.5為臨界值:若預(yù)測(cè)概率大于等于0.5,則判定為肺癌;若小于0.5,則判定為非肺癌。臨界值的選擇會(huì)在一定程度上影響肺癌的識(shí)別結(jié)果,所以驗(yàn)證集的評(píng)估結(jié)果僅供參考。實(shí)驗(yàn)包括3個(gè)部分:多尺度的有效性驗(yàn)證、特征融合的有效性驗(yàn)證和對(duì)比實(shí)驗(yàn)。
為了驗(yàn)證多尺度輸入對(duì)肺癌識(shí)別效果的影響,根據(jù)前面提到的多尺度輸入方法進(jìn)行結(jié)節(jié)檢測(cè),再進(jìn)一步識(shí)別肺癌。首先,在32、48、64這3個(gè)尺度下分別進(jìn)行了結(jié)節(jié)檢測(cè)和肺癌預(yù)測(cè),在肺癌識(shí)別階段,用到網(wǎng)絡(luò)提取的結(jié)節(jié)的最大惡性、最大惡性結(jié)節(jié)的z軸坐標(biāo)和Julian等的可疑組織檢測(cè)器檢測(cè)出的mass特征。然后,將網(wǎng)絡(luò)在3個(gè)尺度下輸出的特征進(jìn)行組合后識(shí)別肺癌。另外,Julian等用3D-CNN檢測(cè)結(jié)節(jié)時(shí)的批次大小為128,本文改進(jìn)實(shí)驗(yàn)的批次大小均為64。所以復(fù)現(xiàn)結(jié)果和32尺度輸入的結(jié)果稍有不同,但差異不大。多尺度輸入時(shí)的實(shí)驗(yàn)結(jié)果見表2。
表2 多尺度的肺癌識(shí)別結(jié)果
實(shí)驗(yàn)結(jié)果表明,3個(gè)尺度的特征組合在一定程度上降低了預(yù)測(cè)集的損失。另外,敏感性較其它3個(gè)單尺度有所提高,降低了漏診率;特異性較單尺度時(shí)稍有降低;肺癌識(shí)別的準(zhǔn)確率優(yōu)于單尺度。
由于網(wǎng)絡(luò)末層提取的特征單一,不足以描述病灶的詳細(xì)特征,本實(shí)驗(yàn)從多個(gè)角度出發(fā),將網(wǎng)絡(luò)瓶頸層提取的64個(gè)特征和網(wǎng)絡(luò)輸出的特征相融合,經(jīng)數(shù)據(jù)歸一化處理后再預(yù)測(cè)肺癌。本節(jié)實(shí)驗(yàn)進(jìn)行肺癌識(shí)別的特征有:每個(gè)病人惡性最大結(jié)節(jié)的瓶頸層64個(gè)特征、輸出層兩個(gè)特征、z軸坐標(biāo)和Julian等的mass特征。首先,針對(duì)單尺度進(jìn)行了特征融合;其次,將3個(gè)尺度的融合后的特征進(jìn)行組合來預(yù)測(cè)肺癌;然后,在3個(gè)尺度特征組合的基礎(chǔ)上,按照特征的重要性自動(dòng)提取前90個(gè)特征識(shí)別肺癌;最后,按照多尺度差異性識(shí)別策略和多尺度互補(bǔ)性識(shí)別策略分別進(jìn)行了實(shí)驗(yàn)。表3列出了兩種識(shí)別策略的樣本量大小,即檢測(cè)出的符合條件的肺結(jié)節(jié)數(shù)量。特征融合的實(shí)驗(yàn)結(jié)果見表4。
從實(shí)驗(yàn)結(jié)果可以看出,在單尺度下,特征融合后的結(jié)果普遍好于特征融合之前。3個(gè)尺度的特征融合時(shí),驗(yàn)證
表3 兩種多尺度肺癌識(shí)別策略的數(shù)據(jù)集大小
表4 特征融合的肺癌識(shí)別結(jié)果
集的識(shí)別結(jié)果要優(yōu)于融合之前,但是損失值卻高于先前,原因是瓶頸層的特征存在噪聲干擾。所以,在3個(gè)尺度特征融合的基礎(chǔ)上,按照特征重要性選擇了部分有效特征,實(shí)驗(yàn)結(jié)果表明該方法優(yōu)于選擇特征之前,也好于特征融合之前。從損失值上可看出,多尺度差異性識(shí)別策略和互補(bǔ)性識(shí)別策略都達(dá)到了較好的識(shí)別效果,多尺度互補(bǔ)性識(shí)別效果尤為顯著,進(jìn)一步驗(yàn)證了所提出的多尺度方法的有效性。
近兩千支隊(duì)伍參加了Kaggle舉辦的Data Science Bowl 2017競(jìng)賽,官網(wǎng)公布了部分隊(duì)伍的排名結(jié)果。近兩年,一些醫(yī)學(xué)圖像領(lǐng)域的專家、學(xué)者也對(duì)此數(shù)據(jù)集做了相關(guān)實(shí)驗(yàn)。為了更好地與本文的實(shí)驗(yàn)結(jié)果相比較,表5給出了部分競(jìng)賽排名結(jié)果。比賽結(jié)束后,第一名團(tuán)隊(duì)改變了訓(xùn)練方案,得到了更優(yōu)的結(jié)果0.3989,然而其在分類精度上仍有待提高[5]。本文實(shí)驗(yàn)結(jié)果不僅好于Julian本人的方法,且優(yōu)于其整個(gè)團(tuán)隊(duì)[6]的識(shí)別結(jié)果。
表5 競(jìng)賽排名
為了進(jìn)一步驗(yàn)證所提模型的有效性,與其它文獻(xiàn)中的模型進(jìn)行比較,結(jié)果見表6。表中“-”標(biāo)志表示文獻(xiàn)未給出該評(píng)價(jià)指標(biāo)的實(shí)驗(yàn)結(jié)果。
表6 同其它模型的比較結(jié)果
實(shí)驗(yàn)結(jié)果表明,與其它文獻(xiàn)中的方法相比,本文所提方法取得了較高的分類精度,且優(yōu)于Kaggle競(jìng)賽中第一名的結(jié)果;在敏感性上,結(jié)果不太理想,會(huì)增加肺癌的漏診率;在特異性上,取得了滿意的結(jié)果??傮w上,所提方法在肺癌識(shí)別任務(wù)上成效較為理想。
通過肺部CT圖像可以檢測(cè)出肺部疾病,幫助患者及時(shí)得到有效治療。本文為提高肺癌的識(shí)別精度,提出了一種基于多尺度和特征融合的肺癌識(shí)別方法。實(shí)驗(yàn)結(jié)果表明,多尺度的方法更能完善惡性結(jié)節(jié)的有效特征,特征融合方法能夠充分描述結(jié)節(jié)的詳細(xì)特征,均有利于后續(xù)的癌癥診斷。所提出的方法在Kaggle數(shù)據(jù)集上損失值更低,且識(shí)別精度較高。
未來工作可深入研究并改進(jìn)3D深度神經(jīng)網(wǎng)絡(luò)算法,同時(shí)構(gòu)建更為有效的病理特征以提高肺癌識(shí)別的敏感性。另外,早期患者的隨診情況也對(duì)肺癌識(shí)別起到關(guān)鍵作用。若肺結(jié)節(jié)在短期內(nèi)變化明顯,其致癌風(fēng)險(xiǎn)極高。所以,對(duì)病人多個(gè)階段的肺部CT圖像進(jìn)行識(shí)別并關(guān)聯(lián)也是未來研究的一個(gè)方向。