余其徽 ,袁海霞 ,張燕群 ,俞 清 ,季正標(biāo) ,張 麒,5 ,王文平
(1.上海先進(jìn)通信與數(shù)據(jù)科學(xué)研究院(上海大學(xué)),上海 200444;2.上海大學(xué)通信與信息工程學(xué)院,上海 200444;3.復(fù)旦大學(xué)附屬中山醫(yī)院超聲科,上海 200032;4.復(fù)旦大學(xué)附屬中山醫(yī)院廈門(mén)醫(yī)院超聲科,福建 廈門(mén) 361015;5.杭州依圖醫(yī)療研究院,浙江 杭州 310000)
近年來(lái),膽囊息肉樣病變的發(fā)病率逐年升高,較為常見(jiàn)的兩種息肉類型是膽囊膽固醇性息肉和膽囊腺瘤。前者不會(huì)發(fā)生惡變,稱為假性息肉;而后者是一種起源于腺上皮的真性息肉,易發(fā)生不典型增生并發(fā)展為膽囊癌,屬于癌前病變的一種[1-2]。目前,超聲檢查是區(qū)分膽囊真假性息肉首選的影像學(xué)方法。對(duì)于膽囊真性息肉,及時(shí)的膽囊切除術(shù)非常必要。臨床外科學(xué)指南建議對(duì)于直徑大于1 cm 的膽囊息肉進(jìn)行膽囊切除術(shù),但這經(jīng)常受到學(xué)者和臨床醫(yī)生的質(zhì)疑。他們認(rèn)為,直徑大于1 cm 的膽囊息肉中有許多良性息肉。如對(duì)良性息肉進(jìn)行膽囊切除手術(shù),會(huì)對(duì)患者的健康造成巨大的傷害,且占用公共衛(wèi)生資源。同時(shí),直徑小于1 cm 的息肉也可能是真性息肉,僅超聲觀察其生長(zhǎng)顯然不合理[3-4]。因此,臨床亟需一種可廣泛應(yīng)用的新技術(shù),在術(shù)前盡早鑒別膽囊真假性息肉,從而僅對(duì)真性息肉進(jìn)行膽囊切除術(shù),降低醫(yī)療資源的浪費(fèi),提高患者的生存質(zhì)量。
近年來(lái),隨著人工智能的迅猛發(fā)展,許多學(xué)者在醫(yī)學(xué)影像領(lǐng)域取得了一定的進(jìn)展。Dalmis 等提出人工智能多參數(shù)乳腺磁共振成像方法,實(shí)現(xiàn)了乳腺良惡性的病變分類[5]。Colling 等將圖像分析和機(jī)器學(xué)習(xí)應(yīng)用于組織病理學(xué),加快了組織病理學(xué)在臨床實(shí)踐中的發(fā)展[6]。Weisberg 等將放射組學(xué)特征與深度學(xué)習(xí)模型相結(jié)合,實(shí)現(xiàn)了良好的胰腺癌早期診斷性能[7]。因此,考慮到計(jì)算機(jī)可能利用高維信息捕捉到宏觀醫(yī)學(xué)影像上的變化,其分辨率遠(yuǎn)遠(yuǎn)超過(guò)人眼的分辨率[8-9]。將基于計(jì)算機(jī)輔助分析超聲圖像,可獲取客觀的影像學(xué)特征,以鑒別膽囊良惡性息肉,為醫(yī)生的臨床決策提供精確、可靠的診斷建議。
本研究回顧性分析了經(jīng)手術(shù)病理證實(shí)的膽囊膽固醇性息肉和膽囊腺瘤患者術(shù)前超聲二維圖像,通過(guò)計(jì)算機(jī)提取分析多組影像學(xué)特征,以期盡早發(fā)現(xiàn)這兩種疾病的影像差異,從而輔助鑒別膽囊膽固醇性息肉和膽囊腺瘤。
首先,采集膽囊膽固醇息肉和膽囊腺瘤的超聲圖像并進(jìn)行圖像分割,以確定病灶位置。接著,用計(jì)算機(jī)提取病灶的空域、形態(tài)兩類量化特征,并通過(guò)統(tǒng)計(jì)學(xué)分析對(duì)特征進(jìn)行選擇。最后,使用這些特征用于支持向量機(jī)(support vector machine,SVM)算法分類判決。膽囊膽固醇息肉和膽囊腺瘤的圖像分析流程如圖 1 所示。
圖1 膽囊膽固醇息肉和膽囊腺瘤的圖像分析流程圖Fig.1 Image analysis process of gallbladder cholesterol polyp and gallbladder adenoma
本文研究的病例超聲圖像來(lái)自于復(fù)旦大學(xué)附屬中山醫(yī)院超聲科,共獲得68 例患者69 個(gè)膽囊息肉術(shù)前超聲圖像資料。所有病例均行膽囊切除術(shù)并獲得手術(shù)病理結(jié)果。其中,膽囊膽固醇息肉37 例38 個(gè)病灶,膽囊管狀腺腺瘤31 例31 個(gè)病灶。病灶直徑0.7~4.1 cm。超聲檢查儀器包括:Canon Aplio500(日本),Mindray Resona7s (中國(guó)),Hitachi Ascendus(日本)彩色多普勒超聲診斷儀,探頭頻率3.5~5.0 MHz。患者超聲檢查前須空腹(禁食8 h 以上)。超聲檢查時(shí),病灶局部放大并顯示病變最大切面,測(cè)量病灶最大直徑,并存儲(chǔ)病灶原始超聲圖像。
在進(jìn)行超聲圖像定量分析前,首先要確定病灶區(qū)域。膽囊腺瘤超聲圖像病灶處理如圖2 所示。由于膽囊息肉、周邊血管、腺體等組織器官結(jié)構(gòu)復(fù)雜,圖像自動(dòng)分割技術(shù)并不能很好地對(duì)病灶進(jìn)行準(zhǔn)確分割。因此,本文由具有豐富臨床經(jīng)驗(yàn)的醫(yī)生手動(dòng)勾勒超聲圖像中的病灶輪廓,如圖2(a)所示。接著,對(duì)超聲圖像進(jìn)行二值化處理,得到掩膜圖像,如圖2(b)所示。其中,掩膜圖像中白色像素點(diǎn)對(duì)應(yīng)超聲圖像中的病灶區(qū)域,黑色像素點(diǎn)對(duì)應(yīng)超聲圖像中的非病灶背景區(qū)域。
圖2 膽囊腺瘤超聲圖像的病灶處理Fig.2 Lesion processing based on the ultrasound image of gallbladder adenoma
本文將基于原始超聲圖像及其對(duì)應(yīng)的掩膜圖像提取病灶的影像學(xué)特征,包括空域特征和形態(tài)特征。首先,本文提取了病灶的空域特征??沼蛱卣靼ㄒ浑A統(tǒng)計(jì)量特征和灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征。一階統(tǒng)計(jì)量特征基于超聲灰度圖提取,包括:病灶內(nèi)部像素的變異系數(shù),其為離散程度的一個(gè)歸一化量度,定義為標(biāo)準(zhǔn)差與平均值之比;相對(duì)中值比,其定義為病灶區(qū)域像素中值和參考區(qū)域 (病灶往外擴(kuò)若干像素形成的矩形區(qū)域)像素中值的對(duì)應(yīng)比值;相對(duì)均值比,其定義為病灶區(qū)域像素均值和參考區(qū)域 (病灶往外擴(kuò)若干像素形成的矩形區(qū)域)像素均值的對(duì)應(yīng)比值。
灰度共生矩陣是一種重要的紋理分析方法,其定義為圖像上間隔距離為d和方向?yàn)棣鹊膬蓚€(gè)像素同時(shí)出現(xiàn)的聯(lián)合概率分布G(i,j;d,θ)。共生矩陣的一個(gè)元素不僅可以反映像素的分布特性,也可以反映具有相同灰度或接近灰度的像素點(diǎn)之間的位置分布特性[10]。本文求取GLCM 特征時(shí),為簡(jiǎn)化計(jì)算量,將原來(lái)的256 個(gè)灰度級(jí)重新量化到 8 個(gè)灰度級(jí),即得到 8×8 的灰度共生矩陣G(i,j)(i=1,2,...,8;j=1,2,...,8)。同時(shí),設(shè)定方向θ=0°,45°,90°,135°;距離d=1,2,...,15 像素。提取的GLCM 特征包括對(duì)比度和均一度。對(duì)比度反映原圖像中病灶區(qū)域灰度值局部變化的情況。該值越大,說(shuō)明病灶局部灰度變化越大。均一度反映原圖像中紋理的相似度或同質(zhì)性。該值越大,說(shuō)明病灶局部間的灰度越接近、分布越均勻。
接著,本文提取了病灶的形態(tài)特征,如圖3 所示。該類特征包括擬合橢圓的長(zhǎng)軸長(zhǎng)度和短軸長(zhǎng)度,擬合橢圓是與病灶有相同標(biāo)準(zhǔn)二階中心距的圖形(橢圓所示)以及病灶的周長(zhǎng),其定義為病灶(不規(guī)則曲線所示)區(qū)域最外層像素點(diǎn)的個(gè)數(shù)。
圖3 病灶形態(tài)學(xué)特征的示意圖Fig.3 Schematic diagram illustrating morphological features of lesion
本文對(duì)提取的所有影像學(xué)特征進(jìn)行了統(tǒng)計(jì)學(xué)檢驗(yàn)。假設(shè)特征參數(shù)對(duì)應(yīng)的數(shù)據(jù)為正態(tài)分布,采用非配對(duì)t檢驗(yàn);否則,采用KW 檢驗(yàn)。其中,統(tǒng)計(jì)學(xué)檢驗(yàn)輸出概率p值小于0.05 表示有統(tǒng)計(jì)學(xué)差異,保留有統(tǒng)計(jì)學(xué)意義的特征,并依據(jù)這些特征進(jìn)行后續(xù)的分類判決。
由于醫(yī)學(xué)數(shù)據(jù)獲取的局限性及涉及的倫理問(wèn)題,本文采集的膽囊息肉超聲樣本屬于小樣本集??紤]到SVM 對(duì)小樣本集具有很高的適用性,本文選用SVM 算法對(duì)膽囊息肉進(jìn)行分類判決。SVM 算法通過(guò)尋找一個(gè)決策邊界來(lái)最大化兩組之間的邊界。這是一種非常流行的分類方法[11-12]。在本試驗(yàn)中,SVM 分類算法流程如圖4 所示。圖4 中,實(shí)線表示采用訓(xùn)練集訓(xùn)練,虛線表示使用測(cè)試集測(cè)試。
圖4 SVM 分類算法流程圖Fig.4 Flowchart of SVM classification algorithm
先按照7 ∶3 的比例將數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集。在訓(xùn)練集上,本文分別采用5 次交叉驗(yàn)證方法,得到與空域特征相對(duì)應(yīng)的最優(yōu)模型A 和形態(tài)特征相對(duì)應(yīng)的最優(yōu)模型B。為集成A、B 兩類模型,本文將模型A 訓(xùn)練集的輸出概率值Pa和模型B 訓(xùn)練集的輸出概率值Pb整合為特征c。對(duì)于每一個(gè)病例,c的定義如下:
然后,本文調(diào)整特征c的分類得分閾值以優(yōu)化集成模型。其中,約登指數(shù)(youden index,Yi)作為參考指標(biāo),訓(xùn)練集Yi 最大值對(duì)應(yīng)的最優(yōu)分類得分閾值被用于測(cè)試集分類。最后,本文分析了模型A、模型B 和集成模型對(duì)應(yīng)的測(cè)試集分類性能;同時(shí),為了量化測(cè)試集的分類能力,通過(guò)10 次樣本集隨機(jī)劃分,重復(fù)試驗(yàn)評(píng)估后取平均值作為測(cè)試集的評(píng)估結(jié)果。其中,本文采用的評(píng)估指標(biāo)包括分類精度(accuracy,Acc)、分類靈敏度(sensitivity,Sen)、特異性(specificity,Spc)、受試者工作特征(receiver operating characteristic,ROS)和曲線下面積(area under the curve,AUC)。
所有入組病例均經(jīng)手術(shù)病理證實(shí),包括膽囊膽固醇性息肉37 例38 個(gè)病灶。膽囊腺瘤31 例31 個(gè)病灶。所有病例的病灶統(tǒng)計(jì)學(xué)分析結(jié)果如表1 所示。當(dāng)特征參數(shù)對(duì)應(yīng)的數(shù)據(jù)為正態(tài)分布時(shí),給出對(duì)應(yīng)特征的均值和標(biāo)準(zhǔn)差。否則,給出對(duì)應(yīng)特征的中位數(shù)和四分位數(shù)。
表1 所有病例的病灶區(qū)域統(tǒng)計(jì)學(xué)分析Tab.1 Quantitative analysis results for lesion regions of all patients
在表2 中,從空域特征來(lái)看,對(duì)比度、均一度和相對(duì)中值比對(duì)膽囊膽固醇性息肉和膽囊腺瘤的鑒別有很大的參考價(jià)值(p<0.001)。相較于膽囊膽固醇性息肉,膽囊腺瘤的變異系數(shù)和對(duì)比度值更小,均一度更大,表明膽囊腺瘤的病灶區(qū)域的像素分布更均勻;同時(shí),膽囊腺瘤的相對(duì)中值比和相對(duì)均值比更小,表明膽囊腺瘤的內(nèi)部高亮區(qū)域相對(duì)占比更少。從形態(tài)特征來(lái)看,長(zhǎng)軸長(zhǎng)度、短軸長(zhǎng)度和病灶的周長(zhǎng)對(duì)膽囊膽固醇性息肉和膽囊腺瘤的鑒別有較大的參考作用(p<0.001),相較于膽囊膽固醇性息肉,膽囊腺瘤的長(zhǎng)軸長(zhǎng)度、短軸長(zhǎng)度和周長(zhǎng)更大,表明膽囊腺瘤的病灶區(qū)域外周輪廓更大,并且形態(tài)更不規(guī)則。
膽囊膽固醇息肉和膽囊腺瘤的超聲圖像如圖5所示。
圖5 膽囊膽固醇息肉和膽囊腺瘤的超聲圖像Fig.5 Ultrasound image of gallbladder cholesterol polyps and gallbladder tubular adenoma
通過(guò)超聲圖像影像學(xué)分析,膽囊腺瘤的均一度參數(shù)值(0.640)明顯高于膽囊膽固醇息肉的均一度參數(shù)值(0.494)。分析結(jié)果表明,膽囊腺瘤病灶區(qū)域的像素分布較膽固醇性息肉更均勻。該特征有助于區(qū)分膽固醇息肉和膽囊腺瘤,對(duì)兩種疾病的鑒別診斷有一定的潛在價(jià)值。
使用SVM 分類算法,本文分別得到5 個(gè)空間特征對(duì)應(yīng)的最優(yōu)模型A 和3 個(gè)形態(tài)特征對(duì)應(yīng)的最優(yōu)模型B以及集成模型。測(cè)試集的分類性能如表2 所示。
表2 測(cè)試集的分類結(jié)果Tab.2 Classification results of the test set
分類結(jié)果表明,與空域模型A 的分類性能相比,形態(tài)模型B 的Acc 更高,但Sen 和Spc 相對(duì)更不平衡。
不同模型的ROC 曲線如圖6 所示。
圖6 不同模型的ROC 曲線Fig.6 ROC curves of different models
當(dāng)集成模型A 和B 之后,測(cè)試集的Acc、Sen 和Spc 分別提高到0.905、0.910 和0.900。此時(shí),平均分類得分閾值為0.351。同時(shí),從圖6 中可以看出,集成模型的AUC(0.927)最高,形態(tài)模型AUC(0.919)高于空間模型AUC(0.882)。
本研究嘗試將人工智能影像學(xué)技術(shù)應(yīng)用于69例膽囊息肉的二維超聲圖像分析,以區(qū)分膽囊膽固醇息肉和膽囊腺瘤??沼蛱卣餮芯匡@示,與膽囊膽固醇息肉相比,膽囊腺瘤的病灶區(qū)域像素分布更均勻(均一度;p<0.001),息肉內(nèi)部高亮區(qū)域相對(duì)占比更少(相對(duì)中值比;p<0.001),膽囊腺瘤的這些影像學(xué)特征與其病理特征密切相關(guān),表明均一度和相對(duì)中值比等特征確實(shí)具有潛在的分類能力,與文獻(xiàn)報(bào)道相符[13]。同時(shí),形態(tài)特征研究表明,相較于膽囊膽固醇性息肉,膽囊腺瘤的病灶區(qū)域形態(tài)周長(zhǎng)更大(周長(zhǎng);p<0.001)。但膽囊腺瘤的平均直徑大于膽囊膽固醇息肉,并不能表示較大的病灶中沒(méi)有膽固醇息肉、較小的病灶中不存在膽囊腺瘤。這種僅依靠息肉的大小和形狀來(lái)鑒別膽囊真假性息肉的方法過(guò)于簡(jiǎn)單化。因此,以考慮結(jié)合病灶空域和形態(tài)特征來(lái)鑒別膽囊腺瘤和膽固醇息肉為宜。本文SVM 集成模型分類準(zhǔn)確率、敏感性、特異性分別達(dá)到90.5%、91.0%、90.0%,曲線下面積為0.927,表明借助計(jì)算機(jī)輔助分析膽囊息肉超聲圖像,有助于臨床醫(yī)生從其潛在的形態(tài)和空域特征中獲益,從而對(duì)膽囊真假性息肉進(jìn)行準(zhǔn)確鑒別。
本研究也存在一定的局限性。首先,本文初步將人工智能技術(shù)應(yīng)用于膽囊真性息肉與假性息肉鑒別,病例數(shù)還相對(duì)較少,需積累更多的病例以進(jìn)一步驗(yàn)證方法的有效性及模型的泛化能力,從而為臨床診斷提供更可靠的參數(shù)和診斷界值。其次,后續(xù)的研究將嘗試提取更多的超聲影像定量特征,并結(jié)合彈性超聲、超聲造影等多模態(tài)超聲技術(shù)獲取多模態(tài)超聲特征,從而更全面、準(zhǔn)確地表征膽囊息肉屬性,實(shí)現(xiàn)更精準(zhǔn)的真假性息肉鑒別。