楊茹怡 陳 宏 蔡葉華 李 梅
2020年全球癌癥統(tǒng)計數(shù)據(jù)表明,乳腺癌已成為威脅女性健康的首位高發(fā)癌癥[1],因此,對于乳腺癌的早期發(fā)現(xiàn)、診斷和治療顯得尤為關(guān)鍵。近年來,深度學(xué)習(xí)在計算機視覺領(lǐng)域得到了廣泛的應(yīng)用[2],其在醫(yī)學(xué)圖像分類領(lǐng)域的應(yīng)用中取得了一系列的成果[3]。多示例學(xué)習(xí)(multiple instance learning, MIL)是由監(jiān)督型學(xué)習(xí)算法演變出的一種方法,定義“包”為多個示例的集合,具有廣泛的應(yīng)用。本研究旨在探討基于超聲視頻的深度神經(jīng)網(wǎng)絡(luò)多示例學(xué)習(xí)模型在乳腺結(jié)節(jié)良惡性鑒別診斷中的應(yīng)用價值。
收集上海市靜安區(qū)中心醫(yī)院普外科乳腺結(jié)節(jié)手術(shù)病例285例,術(shù)后病理證實良性結(jié)節(jié)216例,惡性結(jié)節(jié)69例,術(shù)前均行超聲檢查,對病灶區(qū)進行縱切面連續(xù)掃查并獲取超聲影像視頻完整資料,觀察病灶的邊界、形態(tài)、內(nèi)部回聲、有無鈣化、彩色多普勒血流圖像。
基于乳腺結(jié)節(jié)超聲圖像的影像組學(xué)分析流程主要包括以下步驟。(1)圖像預(yù)處理:獲取視頻圖像后,需要進行分幀處理并抽取靜態(tài)圖像中含有病灶的圖像樣本,以獲取含病灶信息的圖像數(shù)據(jù)集。(2)U-net圖像分割:采用U-net 分割網(wǎng)絡(luò)對乳腺超聲圖像進行分割,并經(jīng)過后處理得到較為精準的分割掩模圖像。(3)特征提?。夯谠己≡顖D像及其對應(yīng)的掩模圖像,通過PyRadiomics 提取圖像病灶特征。(4)兩階段特征選擇:利用t檢驗和最小絕對收縮和選擇算法(LASSO)進行兩階段的特征選擇,實現(xiàn)高維特征信息的降維。(5) 分類判決:采用邏輯回歸(logistic regression, LR)算法對乳腺結(jié)節(jié)良惡性進行分類。
2.1 圖像預(yù)處理
在進行定量分析之前,首先對乳腺超聲視頻進行分幀處理,將dicom 格式的視頻圖像轉(zhuǎn)換為一系列靜態(tài)圖像,然后根據(jù)人工定位的病灶出現(xiàn)的起止位置,抽取出靜態(tài)圖像中含有病灶的圖像子集。
2.2 U-net圖像分割
近年來,U-net 網(wǎng)絡(luò)架構(gòu)在醫(yī)學(xué)圖像處理領(lǐng)域中被廣泛應(yīng)用,尤其在醫(yī)學(xué)圖像分割方面表現(xiàn)出了卓越的性能。該網(wǎng)絡(luò)采用編碼和解碼的思想進行圖像分割,具有完全對稱的網(wǎng)絡(luò)架構(gòu),并通過跳躍連接部分使用拼接操作進行特征融合。相比于其他分割網(wǎng)絡(luò),U-net 具有靈活、簡單的優(yōu)點,已成為醫(yī)療圖像分割的主流方法。本研究利用訓(xùn)練好的基于現(xiàn)有數(shù)據(jù)集的U-net 分割網(wǎng)絡(luò)模型,對乳腺超聲靜態(tài)圖像進行分割推理,并采用開閉運算技術(shù)對其結(jié)果進行后處理,以獲得更為精準的分割掩模圖像(圖1)。
圖1 分割效果圖(a~e為不同的病灶)
2.3 特征提取
PyRadiomics 是一個開源的python 軟件包,可用于從醫(yī)學(xué)圖像中提取影像組學(xué)特征,支持3D 圖像特征提取。圖像可以是原始圖像或經(jīng)過濾波器處理的派生圖像。本研究使用了PyRadiomics 提取影像組學(xué)特征,其中包括基于原始圖像、高斯濾波器的拉普拉斯算子和小波濾波后的派生圖像。高斯濾波器的拉普拉斯算子是一種邊緣增強濾波器,參數(shù)sigma 可以設(shè)置,低sigma 值增強精細紋理,高sigma 值增強粗糙紋理。本研究sigma參數(shù)分別設(shè)置為3和5。小波濾波涵蓋了8 種不同的組合模式,包括高通和低通濾波器。
本研究將每位患者的一組超聲靜態(tài)原始圖像以及相應(yīng)的分割掩模圖像分別合并為nii 格式的三維圖像時間序列;然后依據(jù)原圖像與掩模圖像分別提取3 種圖像類型下的影像組學(xué)特征。本研究每種圖像類型提取了7 種影像組學(xué)特征,分別是:(1)一階統(tǒng)計量特征;(2)3D 形狀特征;(3)灰度共生矩陣特征;(4)灰度級運行長度矩陣特征;(5)灰度級尺寸區(qū)域矩陣特征;(6)灰度級依賴性矩陣特征;(7)相鄰灰調(diào)差異矩陣特征。
2.4 兩階段特征選擇
利用t檢驗和LASSO 進行兩階段的特征選擇。首先,采用t檢驗選擇出具有統(tǒng)計學(xué)差異的特征,其次,通過LASSO 對經(jīng)過t檢驗篩選后的特征子集進行降維處理,去除冗余信息和無關(guān)特征,從而選擇出對診斷有益的特征子集。
2.5 LR分類
本研究采用邏輯回歸算法對乳腺結(jié)節(jié)進行良惡性分類,選取篩選出的特征子集作為LR 分類器的輸入數(shù)據(jù)。將特征子集以8∶2 的比例劃分為訓(xùn)練集和測試集,并在訓(xùn)練集上訓(xùn)練分類器。通過網(wǎng)格搜索調(diào)整LR 模型的核函數(shù)參數(shù)獲取最優(yōu)模型,再將其應(yīng)用于測試集進行分類判決。分類效果評估采用以下5 個指標:受試者工作特征(ROC)曲線的曲線下面積(AUC)、準確度、靈敏度、特異度和約登指數(shù)。
共使用乳腺結(jié)節(jié)手術(shù)病例285 例,術(shù)后病理證實良性結(jié)節(jié)216例,惡性結(jié)節(jié)69例。其中良、惡性乳腺腫塊患者平均年齡分別為(41.35±11.64) 歲、(50.37±10.86)歲,訓(xùn)練集和測試集患者比例為8∶2,平均年齡分別為(46.66±13.05) 歲、(46.99±11.06)歲。超聲診斷為惡性病例中:US BI-RADS 3類占4.3%;US BI-RADS 4A 類占17.5%;US BIRADS 4B 類占29%;US BI-RADS 4C 類占39.1%;US BI-RADS 5類占10.1%;。
使用PyRadiomics 對圖像進行特征提取后,基于3 種圖像類型共獲得了1 051 個特征,經(jīng)過兩階段特征選擇后,共保留了17個特征。
使用LR 算法進行分類,其中AUC 達到0.89,準確度為86.0%,靈敏度為85.7%,特異度為86.0%,約登指數(shù)為71.8%。同時,本文根據(jù)分類指標繪制了ROC曲線和混淆矩陣,如圖2和圖3所示。
圖2 乳腺結(jié)節(jié)良惡性分類ROC曲線
圖3 乳腺結(jié)節(jié)良惡性分類混淆矩陣
目前,超聲是我國診斷及篩查乳腺癌的主要手段,但較依賴操作者經(jīng)驗,診斷結(jié)果差異較大[4]。為此,建立乳腺超聲圖像計算機輔助診斷系統(tǒng),用于輔助乳腺腫瘤的分類,可以有效提高臨床診斷效率,降低誤診率,對于乳腺疾病的防控任務(wù)具有重要的意義[5]。
深度學(xué)習(xí)算法已經(jīng)在乳腺圖像分析領(lǐng)域取得了多項研究成果[6],但由于深度學(xué)習(xí)算法的復(fù)雜性和靈活性,其模型的構(gòu)建仍然面臨著許多挑戰(zhàn)[7]?,F(xiàn)有的計算機輔助診斷系統(tǒng)主要采用S-Detect[8]進行單幀圖像分析,雖然可以提高就診效率,但客觀性缺失。例如,如何從視頻序列中選擇代表此病例的單幀圖像,不同的醫(yī)生可能選取不同的圖像,這會影響計算機診斷的準確性。為了解決這個問題,本研究采用基于U-net和PyRadiomics的深度學(xué)習(xí)與影像組學(xué)相結(jié)合的方法對乳腺腫瘤視頻序列進行分析,能夠獲取連續(xù)的超聲視頻中含有病灶信息的超聲圖像,以更精準地進行乳腺腫瘤診斷。
本研究運用深度學(xué)習(xí)對超聲視頻序列中提取特征圖像進行了處理。利用PyRadiomics 提取圖像病灶特征,并將原始圖像與經(jīng)過高斯濾波器、拉普拉斯算子和小波濾波器處理后的派生圖像進行比較。針對高維特征信息,使用t檢驗和LASSO 進行兩階段的特征選擇,并將其降維,最終選取了17 種特征,多數(shù)取于小波濾波后的派生圖像,得到對診斷有益的特征子集。通過對LR 算法模型的訓(xùn)練,我們獲得了分類準確度、靈敏度以及曲線下面積分別為86.0%、85.7%和0.890 的良好結(jié)果。有研究者使用遷移學(xué)習(xí)來克服模型訓(xùn)練時數(shù)據(jù)量有限的這一限制[9],余美慧等[10]基于ResNet-50 建立的第2 次遷移學(xué)習(xí)模型鑒別診斷乳腺腫塊良惡性的準確度為88.0%,靈敏度為82.7%,曲線下面積為0.915。本研究的模型靈敏度高于遷移學(xué)習(xí)模型的靈敏度,但由于數(shù)據(jù)量有限,準確度稍低。
綜上所述, 本研究采用了基于U -net 和PyRadiomics 的深度學(xué)習(xí)方法,并將其與影像組學(xué)相結(jié)合,以提高乳腺結(jié)節(jié)良惡性鑒別診斷的效能,克服單幀圖像的缺陷,減少人為主觀因素對結(jié)果的影響,可為臨床醫(yī)師提供決策參考,具有較高的臨床應(yīng)用價值。但本研究也具有一定的局限性,數(shù)據(jù)量較少,結(jié)果可能會有一定的偏移誤差,需要多中心大樣本量的研究驗證。