鄧 輝,張 潔
(南京郵電大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 南京 210023)
皮膚癌是世界上最常見的癌癥之一。由于黑色素瘤皮膚癌致命程度較高,黑色素瘤與非黑色素瘤皮膚鏡圖像之間的識別分類引起了研究人員和醫(yī)學(xué)工作者的極大關(guān)注。僅在美國,美國癌癥協(xié)會估計(jì)2022年將新增99 780例黑色素瘤患者,約有7 650人將死于黑色素瘤[1]。培養(yǎng)一名合格的皮膚科醫(yī)生需要花費(fèi)較長的時(shí)間和資金成本,這在一定程度上也加劇了欠發(fā)達(dá)地區(qū)的醫(yī)療資源短缺問題。為了改善這種情況,研發(fā)基于皮膚鏡檢查的計(jì)算機(jī)輔助診斷系統(tǒng)具有重要意義。
傳統(tǒng)醫(yī)學(xué)影像分析的主流方法通常由兩個(gè)典型模塊構(gòu)成:人工設(shè)計(jì)的圖像特征和模式分類器。常用的特征包括局部二值模式、方向梯度直方圖以及尺度不變特征變換等,常用的模式分類器包括K最近鄰分類器、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯分類器以及支持向量機(jī)等。雖然傳統(tǒng)方法在醫(yī)學(xué)圖像分析領(lǐng)域中取得了一定成功,但是黑色素瘤與非黑色素瘤存在類間差距小、類內(nèi)差距大的問題,即便是皮膚病專家也難以憑借肉眼取得較高的識別準(zhǔn)確率;其次,由于皮膚表面存在顏色差異、毛發(fā)、邊界模糊等干擾信息,而且隨著醫(yī)學(xué)圖像形態(tài)種類不斷增加以及分辨率的不斷提高,越來越多復(fù)雜、精細(xì)、高級的醫(yī)學(xué)圖像分析任務(wù)需求被提出,基于手工設(shè)計(jì)特征的傳統(tǒng)方法面臨嚴(yán)峻挑戰(zhàn)。近十幾年來,隨著人工智能的迅速發(fā)展,深度學(xué)習(xí)在圖像分類、目標(biāo)檢測、自然語言處理、語音識別等方面取得了巨大成功。不過,面臨缺乏準(zhǔn)確標(biāo)注的皮膚鏡圖像以及樣本分布極不平衡的情況,將深度學(xué)習(xí)應(yīng)用在皮膚病變分類上同時(shí)提高診斷準(zhǔn)確率是一項(xiàng)意義非凡且兼具挑戰(zhàn)的任務(wù)。
Pomponiu等人[2]提出了一個(gè)皮膚病變分類系統(tǒng),第一步是進(jìn)行包含數(shù)據(jù)增強(qiáng)的預(yù)處理,下一步操作是使用預(yù)訓(xùn)練的AlexNet卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,最后,決定性步驟是通過使用K近鄰(KNN)算法實(shí)現(xiàn)的。該算法在包含399張圖像的數(shù)據(jù)庫上獲得了良好的效果,其特異性為95.18%,靈敏度為92.1%,準(zhǔn)確率為93.64%。Codella等人[3]為了提取一些特征,也使用了AlexNet卷積神經(jīng)網(wǎng)絡(luò)。這篇論文使用了用于皮膚病變檢測的最著名的數(shù)據(jù)庫之一,即ISIC數(shù)據(jù)庫,該數(shù)據(jù)庫由2 624幅皮膚鏡圖像組成,包括黑色素瘤和非黑色素瘤圖像。同時(shí),他們使用了來自稀疏編碼的特征、低級手工特征和深度殘差網(wǎng)絡(luò)對AlexNet網(wǎng)絡(luò)的輸出進(jìn)行調(diào)整。為了對圖像進(jìn)行分類,使用了支持向量機(jī)(SVM),最終準(zhǔn)確率為93.1%,特異性為92.8%,靈敏度為94.9%。
Yang等人[4]使用帶有CAM(Class Activation Mapping)的多任務(wù)CNN來同時(shí)診斷和定位皮膚鏡圖像中的皮膚病變。獲得的CAM突出顯示了圖像中的感興趣區(qū)域(ROI),通常覆蓋了整個(gè)病變區(qū)域。Kwasigroch等人[5]在包含10 000張良性和惡性病變圖像的數(shù)據(jù)庫上使用VGG19獲得了最好的結(jié)果,靈敏度達(dá)到95%。他還證明利用在自然圖片上預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)上提取的特征所訓(xùn)練的線性分類器具有較高的準(zhǔn)確性[6],該系統(tǒng)能夠成功鑒別多達(dá)十種類型的皮膚病變。
胡海根等人[7]針對黑色素瘤分類任務(wù)中存在的對比度低、毛發(fā)干擾、數(shù)據(jù)量偏少以及數(shù)據(jù)不均衡等問題,提出了一種基于掩蓋的數(shù)據(jù)增強(qiáng)與深度殘差網(wǎng)絡(luò)相結(jié)合的集成分類方法。第一步是基于掩蓋訓(xùn)練圖像部分區(qū)域?qū)?shù)據(jù)進(jìn)行增強(qiáng),其次,利用ResNet50進(jìn)行特征提取,最后,用提取來的特征構(gòu)建兩個(gè)有一定差異的分類結(jié)構(gòu)模型,并進(jìn)行模型集成。實(shí)驗(yàn)結(jié)果表明,該模型能在樣本較少的數(shù)據(jù)集上取得良好的分類效果,多項(xiàng)性能指標(biāo)優(yōu)于ISIC2016挑戰(zhàn)賽的前五名。
趙宸[8]提出了一種基于自注意力的樣式生成對抗網(wǎng)絡(luò)和基于SE注意力機(jī)制的ResNeXt-50相結(jié)合的皮膚癌圖像樣本生成與分類框架,用來解決以黑色素瘤為代表的皮膚癌分類任務(wù)中存在的樣本數(shù)量、權(quán)重不均衡,以及圖像質(zhì)量較差引起的診斷困難等問題。該框架使用基于自注意力機(jī)制的樣式生成對抗網(wǎng)絡(luò)對分辨率較低的皮膚癌變圖像進(jìn)行重構(gòu),從而得到高質(zhì)量的皮膚癌變圖像。最后使用SE-ResNeXt-50對圖像進(jìn)行分類,更好地提取圖像不同層次特征圖的信息。實(shí)驗(yàn)結(jié)果表明,該框架生成的樣本圖像質(zhì)量較高,分類BMA高達(dá)94.71%,且提高了皮膚病變圖像分類的準(zhǔn)確性,從而幫助皮膚科醫(yī)生快速高效地對不同類型皮膚病變進(jìn)行診斷。
基于上述分析,針對皮膚癌分類任務(wù)中深層次網(wǎng)絡(luò)容易過擬合、黑色素瘤分類準(zhǔn)確率不高等問題,該文提出了一種基于遷移學(xué)習(xí)和改進(jìn)的ResNet50模型[9]的黑色素瘤分類模型MC-Net。該模型對輸入主干進(jìn)行改進(jìn),摒棄了傳統(tǒng)的7×7大卷積核,而是采用3×3的卷積核與深度可分離卷積的組合,在保持感受野不變的同時(shí)降低參數(shù)數(shù)量;減少了殘差塊中的部分BN層和激活層,使用GELU函數(shù)代替ReLU函數(shù),并將特征相加后的激活層移到殘差塊內(nèi)部,以此來加強(qiáng)模型的特征表達(dá)能力;添加了CA注意力機(jī)制,除了能捕獲跨通道信息,還能捕獲方向感知和位置敏感信息,有助于模型更準(zhǔn)確地定位和識別重點(diǎn)信息。在上述工作的基礎(chǔ)上,利用遷移學(xué)習(xí)初始化網(wǎng)絡(luò)模型的部分參數(shù),接著在增強(qiáng)后的數(shù)據(jù)集上進(jìn)行訓(xùn)練,通過持續(xù)的反向傳播來微調(diào)預(yù)訓(xùn)練的分類模型的權(quán)重,進(jìn)一步提升模型的分類性能。
該文對ResNet50神經(jīng)網(wǎng)絡(luò)模型的輸入主干和殘差塊重新進(jìn)行了設(shè)計(jì),并且引入了CA注意力機(jī)制,基于遷移學(xué)習(xí)方法,使用在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練好的權(quán)重初始化MC-Net模型,凍結(jié)除全連接層以外的所有層,然后在皮膚病變數(shù)據(jù)集上進(jìn)行訓(xùn)練,微調(diào)整個(gè)網(wǎng)絡(luò)。具體過程如圖1所示。
圖1 皮膚癌分類方法流程
深度網(wǎng)絡(luò)隨著網(wǎng)絡(luò)層數(shù)的不斷加深會出現(xiàn)退化問題以及梯度消失問題,雖然殘差網(wǎng)絡(luò)ResNet設(shè)計(jì)了一種殘差模塊可以訓(xùn)練更深層次的網(wǎng)絡(luò),但是卻面臨著信息丟失、計(jì)算量過大以及復(fù)雜度過高等問題。該文以ResNet50網(wǎng)絡(luò)結(jié)構(gòu)為基礎(chǔ)模型,通過改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)以創(chuàng)造新的結(jié)構(gòu)來解決如上問題,并增加了CA注意力機(jī)制,提高了皮膚病變分類的準(zhǔn)確率。
ResNet50網(wǎng)絡(luò)主要由輸入主干、卷積部分以及輸出層組成。網(wǎng)絡(luò)的輸入是大小為224×224的皮膚鏡圖像,輸入主干包括一個(gè)步幅為2、通道數(shù)為64的7×7大卷積核和一個(gè)大小為3×3、步幅為2的最大池化層。卷積部分包括4個(gè)后續(xù)階段,分別是Stage1~Stage4。其中,從Stage1開始,每個(gè)階段都由一個(gè)下采樣模塊開頭,緊接著是若干普通殘差模塊,前者是主網(wǎng)絡(luò)路徑上和分支路徑上都有卷積層,而后者只有主網(wǎng)絡(luò)路徑上有卷積層,分支路徑?jīng)]有卷積層。Stage4結(jié)束后,在最后殘差塊后面連接了一個(gè)平均池化層,網(wǎng)絡(luò)的最后一層為全連接層。
1.2.1 輸入主干的改進(jìn)
通過觀察可知,ResNet50網(wǎng)絡(luò)結(jié)構(gòu)的輸入主干主要由一個(gè)7×7卷積核和最大池化層[10]組成,且卷積層的計(jì)算成本為卷積核寬度或者高度的平方,因此,文中模型將輸入主干中卷積核大小為7×7的標(biāo)準(zhǔn)卷積替換成一個(gè)3×3的標(biāo)準(zhǔn)卷積和深度可分離卷積[11]的組合,以降低卷積過程中的計(jì)算量,并且加深網(wǎng)絡(luò)的深度,深度可分離卷積和輸入主干的結(jié)構(gòu)分別如圖2、圖3所示。
圖2 深度可分離卷積
圖3 輸入主干
首先,輸出通道大小為3的3×3標(biāo)準(zhǔn)卷積,經(jīng)過批量歸一化層后再接上一個(gè)最大池化層,然后在池化層輸出的特征圖上應(yīng)用深度卷積,在2D卷積中分別使用3個(gè)尺寸為7×7×1的卷積核,而不使用大小為7×7×3的單個(gè)卷積核,每個(gè)卷積核僅對輸入層的1個(gè)通道做卷積,最終得到大小為224×224×3的輸出圖像,與原來的深度保持不變。其次是擴(kuò)大深度,使用大小為1×1×3的卷積核做逐點(diǎn)卷積,每個(gè)卷積核對輸入圖像做卷積后能得到一個(gè)大小為224×224×1的映射,經(jīng)過64次逐點(diǎn)卷積,就可以得到一個(gè)大小為224×224×64的輸出圖像。深度可分離卷積不僅擁有和卷積核大小為7×7的標(biāo)準(zhǔn)卷積相同的感受野,而且改進(jìn)后的輸入主干的參數(shù)量僅為原來大卷積核參數(shù)量的44.6%,在保證輸出信息和原來一致的情況下大幅降低了分類網(wǎng)絡(luò)的計(jì)算成本,加深了網(wǎng)絡(luò)的深度,提高了模型的分類準(zhǔn)確率。
1.2.2 殘差塊的優(yōu)化
該文采用三層的殘差結(jié)構(gòu),使用GELU函數(shù)[12]代替ReLU函數(shù),防止網(wǎng)絡(luò)出現(xiàn)“dying relu”的問題。GELU函數(shù)受到dropout、ReLU等機(jī)制的影響,隨著x的降低,它被歸零的概率會升高,對于ReLU函數(shù)來說,這個(gè)界限就是0,若輸入少于零就會被歸為0,而GELU函數(shù)不僅保留了概率性,同時(shí)也保留了對輸入的依賴性,其近似計(jì)算公式如式(1),
GELU(X) =0.5×x(1+
(1)
可以看出,當(dāng)x越大的時(shí)候,就越有可能被保留,x越小就越有可能被歸置為0。這一機(jī)制為激活函數(shù)[13]引入了隨機(jī)性,有效提高了所訓(xùn)練模型的魯棒性。文獻(xiàn)[14-15]認(rèn)為過多BN層和激活層可能會對模型性能產(chǎn)生一些不利影響,于是去除了殘差塊中第一個(gè)卷積后面的BN層和激活層,在1×1卷積后接上3×3卷積,以提高模型的特征學(xué)習(xí)能力。最后,調(diào)整GELU函數(shù)的位置,將特征相加后使用的激活函數(shù)移入殘差塊內(nèi)部最開始的位置,加強(qiáng)模型的表達(dá)能力。改進(jìn)后的下采樣模塊(Conv Block)和普通殘差塊(Identity Block)的結(jié)構(gòu)如圖4所示,MC-Net模型使用所改進(jìn)的殘差塊代替原來ResNet50模型中的殘差塊,分支網(wǎng)絡(luò)路徑保持不變,僅對主網(wǎng)絡(luò)路徑進(jìn)行調(diào)整。
圖4 改進(jìn)后的殘差模塊
Hou等人[16]認(rèn)為現(xiàn)有的注意力機(jī)制多是采用最大池化/平均池化來對通道進(jìn)行處理,這會損失圖像的空間信息,而且由于輕量級網(wǎng)絡(luò)負(fù)擔(dān)不起大多數(shù)注意力機(jī)制的計(jì)算開銷,導(dǎo)致了注意力機(jī)制在輕量級網(wǎng)絡(luò)中的應(yīng)用十分滯后。因此,他們提出了一種全新的CA(Coordinate Attention)注意力機(jī)制。該機(jī)制將位置信息加入到通道注意力中,使得網(wǎng)絡(luò)能夠在避免大量計(jì)算開銷的前提下參與較大的區(qū)域。CA注意力機(jī)制的實(shí)現(xiàn)方式如圖5所示,Coordinate Attention將通道注意力分解為沿著兩個(gè)不同方向聚合特征的1D特征編碼過程,首先,將輸入特征圖分別沿著寬度和高度兩個(gè)方向進(jìn)行全局平均池化;接著,將得到的寬度和高度兩個(gè)方向的特征圖拼接在一起然后送入共享的卷積核為1×1的卷積模塊中,并將維度降低為原來的C/r;之后,經(jīng)過批量歸一化處理和非線性激活函數(shù)得到形如C/r×1×(W+H)的特征圖F,再將特征圖分別按照原來的寬度和高度進(jìn)行1×1卷積分別得到和原來通道數(shù)一致的特征圖FH和FW,經(jīng)過Sigmoid激活函數(shù)后分別得到特征圖在高度和寬度上的注意力權(quán)重δh和δw;最后,在原始特征圖上通過乘法加權(quán)計(jì)算,得到在寬度和高度方向上帶有注意力權(quán)重的特征圖,如式(2)所示:
yc(i,j)=xc(i,j)×δh(i)×δw(j)
(2)
圖5 CA注意力機(jī)制模塊
本研究在主干網(wǎng)絡(luò)中融入CA注意力機(jī)制,將其置于每個(gè)殘差模塊中的3×3卷積層后,在不顯著增加網(wǎng)絡(luò)復(fù)雜度的前提下,提升模型的表征能力。MC-Net模型的完整結(jié)構(gòu)見表1,輸入圖像的尺寸為3×224×224,In_channels和Out_channels為經(jīng)過每個(gè)Stage的輸入和輸出通道數(shù),Output_size為圖像經(jīng)過任一Stage后輸出的圖像大小。
ResNet50模型參數(shù)量較大,而樣本數(shù)據(jù)量較小,如果將其直接在皮膚病數(shù)據(jù)集上進(jìn)行訓(xùn)練,往往不能達(dá)到最佳的分類效果。通常使用遷移學(xué)習(xí)來解決這一問題。遷移學(xué)習(xí)[17]是將學(xué)習(xí)到的關(guān)于A的知識或應(yīng)用到不同但相關(guān)的B上來,從而更好地解決問題B。使用預(yù)訓(xùn)練好的權(quán)重對網(wǎng)絡(luò)進(jìn)行初始化,然后將其遷移到目標(biāo)數(shù)據(jù)集上進(jìn)行微調(diào)訓(xùn)練,從而提高分類精度,并且節(jié)省了訓(xùn)練時(shí)間。該文使用的遷移學(xué)習(xí)方式是先預(yù)訓(xùn)練然后微調(diào),使用在大型數(shù)據(jù)集ImageNet上預(yù)訓(xùn)練好的權(quán)重參數(shù)代替隨機(jī)初始化參數(shù)對MC-Net模型進(jìn)行初始化,相較于ResNet50模型,由于MC-Net模型部分結(jié)構(gòu)發(fā)生了改變,因此只能遷移二者相同部分的模型參數(shù),余下參數(shù)依舊采用隨機(jī)初始化。然后,凍結(jié)模型起始部分層的參數(shù)使其不參與訓(xùn)練,在目標(biāo)數(shù)據(jù)集上使用較小的學(xué)習(xí)率重新訓(xùn)練后面的層,得到新的權(quán)重。在這個(gè)過程中,通過多次嘗試找到凍結(jié)層和重新訓(xùn)練層之間的最佳搭配。相比訓(xùn)練一個(gè)全新的網(wǎng)絡(luò),遷移學(xué)習(xí)有助于網(wǎng)絡(luò)快速收斂,提升網(wǎng)絡(luò)的分類效果。
表1 MC-Net的完整結(jié)構(gòu)
原始數(shù)據(jù)來自黑色素瘤檢測的皮膚病變分析競賽的HAM10000數(shù)據(jù)集。該數(shù)據(jù)集由10 015張皮膚鏡圖像組成,分為黑色素瘤和非黑色素瘤兩類,其中包含1 113張黑色素瘤圖像和8 902張非黑色素瘤圖像。病例包括色素性病變領(lǐng)域所有重要診斷類別的代表性集合:光化性角化病和上皮內(nèi)癌(鮑恩病)、基底細(xì)胞癌、良性角化病樣病變、皮膚纖維瘤、黑色素瘤、黑色素細(xì)胞痣和血管病變。超過50%的病變經(jīng)過了組織病理學(xué)的證實(shí),其余病例的基本情況是由隨訪檢查、專家共識確認(rèn)的。
盡管HAM10000數(shù)據(jù)集中的皮膚鏡圖像在亮度、顏色、分辨率等方面已經(jīng)進(jìn)行了整理和標(biāo)準(zhǔn)化,但是仍然存在毛發(fā)遮擋影響診斷結(jié)果以及樣本分布極不均勻的問題。針對皮膚鏡圖像中的毛發(fā)遮擋信息,引入文獻(xiàn)[18]提出的黑素瘤圖像毛發(fā)遮擋信息的非監(jiān)督修復(fù)算法自動去除原始圖像中的毛發(fā)遮擋,同時(shí)對毛發(fā)遮擋部位的信息進(jìn)行了修復(fù)。圖6是皮膚鏡圖像修復(fù)前后的對比。
圖6 毛發(fā)遮擋修復(fù)前后對比
由于數(shù)據(jù)集中樣本分布極不均勻,對黑色素瘤組進(jìn)行數(shù)據(jù)增強(qiáng),使得圖像數(shù)量與非黑色素瘤組相似。根據(jù)皮膚鏡圖像的特性,該文使用了包括隨機(jī)翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪等在內(nèi)的傳統(tǒng)數(shù)據(jù)增強(qiáng)方式[19],解決了黑色素瘤組數(shù)據(jù)量不足的問題,增強(qiáng)了模型的泛化能力。增強(qiáng)后的數(shù)據(jù)集(包含10 000張圖像)變成了含有17 805張圖像的平衡數(shù)據(jù)集,其中包括8 903張黑色素瘤圖像和8 902張非黑色素瘤圖像。本實(shí)驗(yàn)中,將增強(qiáng)后的數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集、測試集三個(gè)獨(dú)立且互不交叉的數(shù)據(jù)集,比例為6∶2∶2。
實(shí)驗(yàn)在Windows10 64位平臺環(huán)境下運(yùn)行,基本配置是AMD Ryzen 7 5800X,16 GB DDR4內(nèi)存,NVIDIA GTX3080 Ti獨(dú)立顯卡,深度學(xué)習(xí)框架為Pytorch。
采用AC、F1-score作為模型的評估指標(biāo),其中AC代表分類的準(zhǔn)確度,定義如下:
(3)
F1-score是分類模型查準(zhǔn)率和查全率的一種調(diào)和平均,其定義如下:
(4)
其中,TP、TN、FP、FN分別代表真正例、真負(fù)例、假正例、假負(fù)例的樣本個(gè)數(shù)。查準(zhǔn)率(P)和查全率(R)能對每個(gè)類別進(jìn)行性能評價(jià)。F1值為綜合考慮查準(zhǔn)率和查全率的評價(jià)。一般來說,F(xiàn)1值越高,單個(gè)類別分類性能越好。
為了驗(yàn)證所提方法的有效性,同時(shí)確定改進(jìn)的結(jié)構(gòu)在性能改善中所起到的作用,在驗(yàn)證集上進(jìn)行了消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。
表2 不同結(jié)構(gòu)對分類效果的影響
表2展示了實(shí)驗(yàn)中改進(jìn)的各個(gè)模塊對實(shí)驗(yàn)結(jié)果的影響。由實(shí)驗(yàn)數(shù)據(jù)可知,利用3×3標(biāo)準(zhǔn)卷積和深度可分離卷積的組合代替原輸入主干的7×7大卷積核時(shí),性能獲得了較大提升(AC提升了2.78%),實(shí)驗(yàn)中對殘差結(jié)塊進(jìn)行優(yōu)化以及添加CA注意力模塊時(shí),實(shí)驗(yàn)結(jié)果均有一定程度提升。當(dāng)未對數(shù)據(jù)集使用數(shù)據(jù)增強(qiáng)時(shí),分類模型的準(zhǔn)確率有明顯下降,足以驗(yàn)證所提方法的有效性,并且驗(yàn)證了對數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)能夠有效提升網(wǎng)絡(luò)模型的性能。
將文中方法與AlexNet[20]、VGG19[21]、MobileNet-V2[22]、DenseNet-121[23]、EfficientNet-B0[24]等五種主流深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行性能對比,以下模型均使用在大型數(shù)據(jù)集ImageNet上預(yù)訓(xùn)練的權(quán)重參數(shù)進(jìn)行初始化,結(jié)果如表3所示。
表3 不同模型性能比較
結(jié)合表2、表3的實(shí)驗(yàn)結(jié)果可知,提出的皮膚癌分類算法在該數(shù)據(jù)集上的準(zhǔn)確率和F1值顯著優(yōu)于其他網(wǎng)絡(luò)。在準(zhǔn)確率和F1指標(biāo)上,AlexNet最低,分別是87.2%和87.4%。使用文中方法改進(jìn)的ResNet在該數(shù)據(jù)集上的準(zhǔn)確率為94.87%,而其他神經(jīng)網(wǎng)絡(luò)中準(zhǔn)確率最高的是EfficientNet-B0,準(zhǔn)確率為93.5%,說明了文中方法具備優(yōu)異的皮膚癌分類性能。將遷移學(xué)習(xí)與文中方法結(jié)合,準(zhǔn)確率進(jìn)一步提高至95.4%,F(xiàn)1值達(dá)到了95.6%。不難看出,將遷移學(xué)習(xí)與文中方法結(jié)合能夠有效提升分類模型的性能,不僅降低了訓(xùn)練成本,還能顯著加快網(wǎng)絡(luò)的收斂速度,具有一定應(yīng)用價(jià)值。
針對臨床上使用皮膚鏡檢查黑色素瘤費(fèi)時(shí)、費(fèi)力的問題,提出了一種基于遷移學(xué)習(xí)的皮膚癌分類方法:主要是對ResNet-50網(wǎng)絡(luò)的基本結(jié)構(gòu)進(jìn)行了改進(jìn),網(wǎng)絡(luò)中添加CBAM注意力機(jī)制來增強(qiáng)網(wǎng)絡(luò)對重要特征的關(guān)注程度,并進(jìn)行遷移學(xué)習(xí)。首先,使用一個(gè)3×3的標(biāo)準(zhǔn)卷積、最大池化層和深度可分離卷積的組合代替原輸入主干中的7×7大卷積核,這樣做既可以降低卷積過程中的計(jì)算量,又可以保持和原來相同的感受野;用Hard-Swish函數(shù)代替ReLU函數(shù),同時(shí)使用LN替換BN,可以提高網(wǎng)絡(luò)的表達(dá)能力;使用空洞卷積和標(biāo)準(zhǔn)卷積的組合來聚合CBAM注意力中的空間上下文信息,提高對空間特征的編碼能力,在感受野保持不變的前提下,減少了參數(shù)數(shù)量。實(shí)驗(yàn)結(jié)果表明,該方法在增強(qiáng)后的HAM10000數(shù)據(jù)集上取得了很好的分類效果,優(yōu)于其他主流分類網(wǎng)絡(luò),結(jié)合遷移學(xué)習(xí)訓(xùn)練后,分類準(zhǔn)確率達(dá)到96.0%,有效提高了皮膚癌診斷的效果。