鄧莎莎,薛蘊菁*,劉琦,王友森,徐雪,趙錫海,劉柏韻
1.福建醫(yī)科大學(xué)附屬協(xié)和醫(yī)院影像科,福建 福州 350001;2.長沙市第一醫(yī)院放射科,湖南 長沙 410005;3.清華大學(xué)醫(yī)學(xué)院生物醫(yī)學(xué)工程系生物醫(yī)學(xué)影像研究中心,北京 100084;4.北京推想科技有限公司,北京 100000; *通信作者 薛蘊菁 xueyunjing@126.com
肺癌是全球范圍內(nèi)發(fā)病率和死亡率最高的惡性腫瘤[1]。由于肺部結(jié)節(jié)較小,位置較深,常表現(xiàn)為不典型征象,因此肺結(jié)節(jié)篩查一直是臨床難題[2]。隨著CT成像技術(shù)的不斷進步,肺結(jié)節(jié)的檢出率大幅度提升[3-4]?;谏疃葘W(xué)習(xí)的智能輔助軟件(deep learning based computer aided diagnosis system,DL-CAD)進一步提升了CT 肺結(jié)節(jié)篩查效率,且模型魯棒性強,檢出率不受輻射劑量、患者年齡和掃描設(shè)備的影響[5-7]。深度學(xué)習(xí)技術(shù)還可以實現(xiàn)對肺結(jié)節(jié)良惡性的診斷[8-10],能否獲得準(zhǔn)確的診斷結(jié)果取決于圖像質(zhì)量的高低,而不同的成像參數(shù)(如不同的算法)是影響CT 圖像質(zhì)量的關(guān)鍵因素之一[11-12]。目前,關(guān)于不同的CT成像參數(shù)對DL-CAD 診斷肺結(jié)節(jié)良惡性效能的影響鮮有研究。本研究擬探討不同CT成像參數(shù)對DL-CAD 診斷肺結(jié)節(jié)良惡性效能的影響,并確定最優(yōu)成像參數(shù)。
1.1 研究對象 納入2018年11月—2019年4月于福建醫(yī)科大學(xué)附屬協(xié)和醫(yī)院就診的肺部發(fā)現(xiàn)結(jié)節(jié)且擬行胸外科手術(shù)治療的133例患者,男59例,女74例;年齡17~79歲,平均(55.2±12.0)歲。納入標(biāo)準(zhǔn):①肺內(nèi)孤立性結(jié)節(jié);②經(jīng)病理結(jié)果證實肺結(jié)節(jié)良惡性診斷;③具有完整的臨床及影像資料。排除標(biāo)準(zhǔn):①肺不張、胸腔積液、肺水腫等;②腎功能不全(腎小球濾過率< 60 ml/min);③碘過敏史、甲亢等。7例CT重建圖像無法應(yīng)用DL-CAD檢測到肺結(jié)節(jié)病灶,最終納入126例患者共169個肺結(jié)節(jié),直徑0.4~2.3 cm。術(shù)后病理結(jié)果證實169個肺結(jié)節(jié)中,良性結(jié)節(jié)35個,惡性結(jié)節(jié)134個。本研究經(jīng)本院倫理審查委員會審查通過,并取得患者知情同意。
1.2 儀器與方法 采用GE Revolution 256排CT儀行全肺平掃及增強掃描?;颊呷⊙雠P位,頭先進,掃描范圍自胸廓入口至肺底部。掃描參數(shù):管電流10~740 mAs,管電壓120 kV,螺距0.992∶1,層間距5 mm。增強掃描靜脈團注對比劑碘佛醇(350 mgI/ml)50 ml,流速3 ml/s,隨后以同樣流速注入生理鹽水30 ml。采集注入對比劑后的60 s圖像,并將其定義為增強延遲期圖像。
1.3 圖像分析與處理
1.3.1 CT圖像預(yù)處理 每例患者根據(jù)CT平掃或增強成像及不同的圖像重建算法(bone算法或standard重建算法)和后置迭代重建算法(30% ASIR-V或50% ASIR-V)生成4組重建圖像:組1(增強掃描+30% ASIR-V+bone 算法)、組2(平掃+30% ASIR-V+bone算法)、組3(增強掃描+50% ASIR-V+bone算法)和組4(增強掃描+30% ASIR-V+standard算法)。
1.3.2 DL-CAD診斷肺結(jié)節(jié)良惡性 將4組圖像分別傳輸至DL-CAD系統(tǒng)進行分析。由一名放射科醫(yī)師記錄不同圖像組別使用DL-CAD分析肺結(jié)節(jié)的惡性概率值以及良惡性診斷結(jié)果。
1.3.3 病理檢查 所有患者在完成CT檢查后均行術(shù)后組織病理學(xué)檢查,并最終確定病灶的良惡性。
1.4 統(tǒng)計學(xué)方法 采用SPSS 21.0軟件,計算不同CT成像參數(shù)下DL-CAD對肺結(jié)節(jié)良惡性的診斷效能。采用配對χ2檢驗比較不同成像參數(shù)下DL-CAD整體效能的差異。采用MedCalc 16.8.4.0軟件計算不同成像參數(shù)下DL-CAD的受試者工作特征(ROC)曲線下面積(AUC),并用Delong檢驗比較不同CT成像參數(shù)下DL-CAD的AUC值的差異。P<0.05表示差異有統(tǒng)計學(xué)意義。
2.1 CT增強和平掃模式下DL-CAD診斷肺結(jié)節(jié)良惡性效能比較 CT增強和平掃模式(組1比組2)的敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值和準(zhǔn)確率差異無統(tǒng)計學(xué)意義(χ2=3.368,P>0.05),兩組AUC差異有統(tǒng)計學(xué)意義(P<0.001),見表1、圖1。
圖1 女,50歲,右上肺浸潤性腺癌(1.0 cm×0.9 cm×0.6 cm,紅色框)。A~C(黑色框)為不同CT成像參數(shù)DL-CAD診斷肺結(jié)節(jié)的惡性概率值。A.平掃+30% ASIR-V+bone算法,惡性概率為57.58%;B.增強掃描+30% ASIR-V+bone算法,惡性概率為79.87%;C.增強掃描+30% ASIR-V+standard算法,惡性概率為56.75%
2.2 不同重建算法下DL-CAD診斷肺結(jié)節(jié)良惡性效能比較 應(yīng)用DL-CAD診斷肺結(jié)節(jié)良惡性,bone和standard重建算法(組1比組4)的敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值和準(zhǔn)確率差異均有統(tǒng)計學(xué)意義(χ2=5.882,P<0.05),兩組AUC差異有統(tǒng)計學(xué)意義(P<0.05),見表1。
表1 不同組別DL-CAD診斷肺結(jié)節(jié)良惡性效能比較
2.3 不同后置ASIR-V下DL-CAD診斷肺結(jié)節(jié)良惡性效能比較 應(yīng)用DL-CAD診斷肺結(jié)節(jié)良惡性,30% ASIR-V和50% ASIR-V(組1比組3)的敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值和準(zhǔn)確率差異無統(tǒng)計學(xué)意義(χ2=0.444,P>0.05),兩組AUC差異無統(tǒng)計學(xué)意義(P>0.05)。
3.1 CT增強和平掃模式下DL-CAD診斷肺結(jié)節(jié)良惡性效能比較 肺結(jié)節(jié)的良惡性診斷仍具挑戰(zhàn)。臨床上不確定的肺結(jié)節(jié)經(jīng)外科手術(shù)證明約50%為良性。良性肺結(jié)節(jié)和惡性肺結(jié)節(jié)的血管分布及脈管系統(tǒng)存在明顯的差異,CT增強掃描可提高鑒別良惡性肺結(jié)節(jié)的幾率,使手術(shù)切除良性率下降到30%[13]。本研究發(fā)現(xiàn),DL-CAD對肺結(jié)節(jié)良惡性的診斷效能在CT增強模式下優(yōu)于平掃模式。陳疆紅等[14]應(yīng)用人工智能對86例惡性結(jié)節(jié)進行良惡性診斷,提出CT增強模式并不能提高肺結(jié)節(jié)的良惡性診斷效能。本研究病例包含35例良性結(jié)節(jié),發(fā)現(xiàn)CT增強模式下AUC顯著提高,陰性預(yù)測值和特異度稍有提高,其原因可能是惡性肺結(jié)節(jié)經(jīng)過CT增強掃描后,分葉征、毛刺征、胸膜凹陷征、空泡征等惡性征象顯示更為清楚,從而提高了DL-CAD對肺結(jié)節(jié)良惡性的診斷效能。
3.2 不同重建算法下DL-CAD診斷肺結(jié)節(jié)良惡性效能比較 本研究發(fā)現(xiàn):不同算法下DL-CAD肺結(jié)節(jié)良惡性診斷效能有顯著差異,與standard算法相比,bone算法下DL-CAD診斷肺結(jié)節(jié)良惡性有較好的效能,其原因可能為不同算法下空間頻率和噪聲不同,對于肺結(jié)節(jié)惡性征象提取不同[15]。
3.3 不同后置ASIR-V下DL-CAD診斷肺結(jié)節(jié)良惡性效能比較 ASIR-V是介于自適應(yīng)統(tǒng)計迭代重組與基于模型迭代重組之間的一種重組方法[16],可降低重建圖像噪聲,提高圖像質(zhì)量[17]。賈永軍等[18]在bone算法下,探討0% ASIR-V、30% ASIR-V、60% ASIR-V下深度學(xué)習(xí)對診斷肺結(jié)節(jié)良惡性效能的影響,發(fā)現(xiàn)30% ASIR-V與60% ASIR-V診斷肺結(jié)節(jié)良惡性的效能無顯著差異。本研究發(fā)現(xiàn):應(yīng)用DL-CAD評估肺結(jié)節(jié)良惡性的診斷效能時,30% ASIR-V與50% ASIR-V無顯著差異,其原因可能是不同權(quán)重的ASIR-V下,肺結(jié)節(jié)的直徑、體積和CT值具有高度一致性[19],并不影響DLCAD診斷肺結(jié)節(jié)良惡性的效能。
本研究增強掃描+30% ASIR-V+bone算法比平掃+30% ASIR-V+bone算法與增強掃描+30% ASIR-V+ bone算法比增強掃描+30% ASIR-V+standard算法發(fā)現(xiàn)不同CT成像參數(shù)(CT增強或平掃模式,不同重建算法)會影響DL-CAD診斷肺結(jié)節(jié)良惡性的效能。與平掃成像參數(shù)相比,除敏感度外,增強掃描下DLCAD診斷效能稍高。與standard算法成像參數(shù)相比,bone算法條件下DL-CAD特異度、陽性預(yù)測值、AUC值稍高。綜合比較,增強掃描+30% ASIR-V+bone算法條件下DL-CAD診斷效能較平掃+30% ASIR-V+bone算法、增強掃描+30% ASIR-V+standard算法稍高,而增強掃描+30% ASIR-V+bone算法比增強掃描+50% ASIR-V+ bone算法的診斷效能無顯著差異。因此,DLCAD在CT增強模式下,使用bone算法,并應(yīng)用30% ASIR-V或50% ASIR-V后置迭代重建算法,對肺結(jié)節(jié)良惡性具有較好的診斷效能。
3.4 本研究的局限性 ①本研究納入169個肺結(jié)節(jié),其中良性結(jié)節(jié)僅35個,可能存在數(shù)據(jù)偏移,但良性和惡性病例的發(fā)生率在臨床實踐中代表了預(yù)期人群。②本研究僅探討了4組不同CT成像參數(shù)對DL-CAD診斷效能的影響,未來需納入更多成像參數(shù)(如不同層厚)進一步研究。
本研究發(fā)現(xiàn):成像參數(shù)的變化會影響DL-CAD診斷肺結(jié)節(jié)良惡性的效能,因此人工智能肺結(jié)節(jié)診斷的模型需要在良好魯棒性的同時,進一步提升鑒別良惡性的準(zhǔn)確率:①肺結(jié)節(jié)良惡性診斷模型訓(xùn)練時應(yīng)使用更標(biāo)準(zhǔn)化的成像參數(shù)實現(xiàn)精準(zhǔn)診斷;②本研究納入的良性結(jié)節(jié)均是臨床診斷中的疑難結(jié)節(jié),同時發(fā)現(xiàn)DL-CAD的陰性預(yù)測值偏低,模型訓(xùn)練時更應(yīng)該加大這類肺結(jié)節(jié)的學(xué)習(xí);③本研究為單中心研究,后續(xù)將結(jié)合多中心,制訂一個更完善的CT成像方案,進一步驗證其有效性。
總之,在CT增強模式下,使用bone算法,并應(yīng)用30% ASIR-V或50% ASIR-V,DL-CAD對肺結(jié)節(jié)良惡性有較好的診斷效能。在未來的研究中,應(yīng)考慮不同CT圖像成像參數(shù)對DL-CAD診斷肺結(jié)節(jié)良惡性效能的影響,從而得到更精準(zhǔn)的診斷。