汪瓊 孫婷婷 范鴻禹 顧俊 伍建林
目前我國醫(yī)學(xué)影像數(shù)據(jù)年增長率約30%,而放射科醫(yī)師數(shù)量增長率不足4%,兩者增長率的不匹配表明放射科醫(yī)師閱讀影像數(shù)據(jù)和做出診斷的工作壓力巨大[1]。隨著我國臨床醫(yī)學(xué)規(guī)培制度的廣泛推行,越來越多的規(guī)培醫(yī)師成為影像科室書寫報告的主力,但由于基礎(chǔ)知識和臨床經(jīng)驗不足,胸部CT閱片時常易漏診、誤診肺結(jié)節(jié),而部分肺結(jié)節(jié)可能是早期肺癌的重要CT征象。肺癌的發(fā)病率與死亡率在全球癌癥中居首位[2-4],因此肺癌的早期診斷和及時治療具有重要意義。近年來人工智能(artificial intelligence,AI)發(fā)展迅速,能自動提取肺結(jié)節(jié)位置、大小、形態(tài)信息,還能進(jìn)一步提供肺結(jié)節(jié)分類(實性、亞實性及鈣化等),在肺結(jié)節(jié)智能化檢測方面顯示出明顯優(yōu)勢[5-9]。本研究旨在探討AI軟件能否輔助提高不同年資的規(guī)培醫(yī)師對肺結(jié)節(jié)的檢測效能及其臨床應(yīng)用價值,以期減輕醫(yī)師工作負(fù)擔(dān),降低漏診風(fēng)險。
1.1 研究對象 回顧性收集2019年1月1—31日在大連大學(xué)附屬中山醫(yī)院接受常規(guī)胸部CT檢查的病人181例,其中男82例,女99例,年齡25~78歲,平均(51.47±10.50)歲。納入標(biāo)準(zhǔn):①CT影像上至少包含1枚肺結(jié)節(jié);②有1 mm薄層CT影像;③結(jié)節(jié)直徑為1 mm~3 cm。排除標(biāo)準(zhǔn):①合并有嚴(yán)重肺氣腫、急性肺感染、胸腔積液、肺結(jié)核、彌漫性轉(zhuǎn)移或間質(zhì)性肺疾病者;②影像有運(yùn)動偽影者。
1.2 設(shè)備與方法 采用Siemens Somatom Definition雙源CT、Somatom Definition AS 64層CT設(shè)備進(jìn)行肺部掃描。掃描參數(shù):管電壓100~120 kV,管電流200~280 mA,掃描層厚 5 mm,層間距 5 mm,螺距為1.0,矩陣 512×512,視野(FOV)500 mm×500 mm,準(zhǔn)直器寬度64×0.625 mm,旋轉(zhuǎn)時間0.5 s/r,重建層厚1 mm,層間距1 mm,使用骨算法重建。所有病人均在吸氣末進(jìn)行肺部CT掃描,取仰臥位,雙手上舉,掃描范圍自胸廓入口至肋膈角(包括全肺組織)。采用肺窗(窗寬 1 500 HU,窗位 -600 HU)及縱隔窗(窗寬360 HU,窗位50 HU)觀察影像。
1.3 AI輔助軟件 采用基于深度學(xué)習(xí)模型的北京推想公司提供的InferRead CT Lung Research軟件(Infervision)在1 mm薄層CT影像上進(jìn)行閱讀,該系統(tǒng)使用卷積神經(jīng)網(wǎng)絡(luò)模型,可自動批量對CT影像數(shù)據(jù)進(jìn)行肺結(jié)節(jié)識別和標(biāo)記,并以方框標(biāo)記備選病灶,每個病灶僅選一個最大直徑的層面顯示標(biāo)記并給出相應(yīng)的編號。
1.4 肺結(jié)節(jié)分類與影像分析 依據(jù)文獻(xiàn)[10-13]將肺結(jié)節(jié)按照密度分為4類:①實性結(jié)節(jié),呈圓形或類圓形密度增高影,其密度掩蓋病灶中血管和支氣管影。②純磨玻璃密度結(jié)節(jié)(pure ground-glass nodule,pGGN),肺窗上呈云霧狀密度增高影,整個病灶內(nèi)血管和支氣管影可辨;縱隔窗上結(jié)節(jié)不顯示。③混合磨玻璃密度結(jié)節(jié) (mixed ground-glass nodule,mGGN)或稱部分實性結(jié)節(jié),圓形或類圓形邊界清楚的局灶密度增高影,部分病灶內(nèi)血管和支氣管影可識別;縱隔窗上僅顯示病灶實性成分。④鈣化結(jié)節(jié),呈圓形或類圓形邊界清楚的完全鈣鹽沉積的結(jié)節(jié)灶(如肺結(jié)節(jié)僅出現(xiàn)部分鈣化則歸為實性結(jié)節(jié))。依據(jù)肺結(jié)節(jié)最長軸及最短軸的平均直徑分為<5 mm、5~10 mm 和>10 mm 3 組。
由2名有10年以上胸部影像診斷工作經(jīng)驗的副主任醫(yī)師在CT橫斷面薄層影像 (1 mm)上參考AI結(jié)果仔細(xì)觀察、確認(rèn)病灶并標(biāo)注,判斷結(jié)節(jié)類型,記錄結(jié)節(jié)大小,再通過多平面重組、最大密度投影技術(shù)判斷結(jié)節(jié)的真實性,以2人的一致性意見及結(jié)節(jié)大小的平均值作為真結(jié)節(jié)參照標(biāo)準(zhǔn);當(dāng)意見不同時則請上級醫(yī)師會診確定。然后選擇低、高年資規(guī)培醫(yī)師各2名(低年資指本科畢業(yè)后即參加規(guī)培訓(xùn)練且不足1年;高年資指規(guī)培訓(xùn)練第3年)分別獨(dú)立閱片。為避免之前獨(dú)立閱片的記憶干擾,1個月洗脫期后再由相同的低、高年資規(guī)培醫(yī)師在AI軟件輔助下分別進(jìn)行閱片,均記錄每個結(jié)節(jié)的大小和密度,以2名低/高年資規(guī)培醫(yī)師檢出真、假陽性結(jié)節(jié)數(shù)及結(jié)節(jié)大小的平均值作為各組最終結(jié)果。
1.5 統(tǒng)計學(xué)方法 采用SPSS 20.0統(tǒng)計軟件對數(shù)據(jù)進(jìn)行統(tǒng)計分析。計數(shù)資料以%表示,2組間比較采用χ2檢驗。符合正態(tài)分布的計量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,2組間比較采用配對 t檢驗,非正態(tài)分布的計量資料以中位數(shù)(四分位距)[M(P25,P75)]表示,2組間比較采用Wilcoxon秩和檢驗。分別計算低、高年資規(guī)培醫(yī)師檢出不同肺結(jié)節(jié)的敏感度及假陽性結(jié)節(jié)數(shù)。以P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 不同密度、大小真結(jié)節(jié)分布 181例病人肺部CT影像上確定的真結(jié)節(jié)共1 232個,其中實性結(jié)節(jié)754 個(61.2%),pGGN 220 個(17.9%),mGGN 65 個(5.2%),鈣化結(jié)節(jié) 193 個(15.7%);<5 mm 結(jié)節(jié) 958個(77.8%),5~10 mm 結(jié)節(jié) 174 個(14.1%),>10 mm結(jié)節(jié) 100個(8.1%)。
2.2 不同年資規(guī)培醫(yī)師獨(dú)立閱片結(jié)果比較 高年資者檢測實性肺結(jié)節(jié)、<5 mm結(jié)節(jié)的敏感度高于低年資者(均P<0.05),兩者對其他類型結(jié)節(jié)的檢測敏感度差異均無統(tǒng)計學(xué)意義(均P>0.05)。低、高年資規(guī)培醫(yī)師檢出>10 mm結(jié)節(jié)假陽性結(jié)節(jié)數(shù)的差異無統(tǒng)計學(xué)意義(P>0.05),而檢測其他性質(zhì)及大小的假陽性結(jié)節(jié)數(shù)均為低年資規(guī)培醫(yī)師多于高年資規(guī)培醫(yī)師(均 P<0.05)。 詳見表 1、圖 1。
2.3 不同年資規(guī)培醫(yī)師AI輔助閱片檢測肺結(jié)節(jié)結(jié)果比較 在AI輔助閱片下,高年資者檢測實性結(jié)節(jié)、pGGN、鈣化結(jié)節(jié)及<5 mm結(jié)節(jié)、5~10 mm結(jié)節(jié)的敏感度高于低年資者,低、高年資規(guī)培醫(yī)師檢測mGGN及>10 mm結(jié)節(jié)的敏感度差異均無統(tǒng)計學(xué)意義(均P>0.05)。兩者除檢測>10 mm結(jié)節(jié)假陽性結(jié)節(jié)數(shù)的差異無統(tǒng)計學(xué)意義外(P>0.05),檢測其余肺結(jié)節(jié)的假陽性結(jié)節(jié)數(shù)均為高年資規(guī)培醫(yī)師少于低年資規(guī)培醫(yī)師(均P<0.05)。詳見表2。
2.4 低年資規(guī)培醫(yī)師獨(dú)立閱片與AI輔助閱片檢測肺結(jié)節(jié)結(jié)果比較 低年資規(guī)培醫(yī)師在AI輔助閱片時檢測實性結(jié)節(jié)(χ2=217.509,P<0.001)、pGGN(χ2=37.487,P<0.001)、mGGN(χ2=10.518,P=0.001)、<5 mm結(jié)節(jié)(χ2=208.056,P<0.001)、5~10 mm 結(jié)節(jié)(χ2=14.59,P<0.001)的敏感度均高于獨(dú)立閱片時,其中以實性結(jié)節(jié)及<5 mm肺結(jié)節(jié)敏感度的提高最為顯著(圖2),分別提高了約37%和33%,而檢測鈣化結(jié)節(jié)(χ2=2.240,P=0.134)、>10 mm 結(jié)節(jié)(χ2=0.363,P=0.547)的敏感度差異無統(tǒng)計學(xué)意義。除檢測>10 mm結(jié)節(jié)的假陽性結(jié)節(jié)數(shù)的差異無統(tǒng)計學(xué)意義(z=3.419,P=0.110)外,低年資規(guī)培醫(yī)師檢測實性結(jié)節(jié)(t=0.878,P<0.001)、鈣化結(jié)節(jié)(t=2.264,P=0.024)、<5 mm 肺結(jié)節(jié)(t=5.264,P<0.001)及 5~10 mm 肺結(jié)節(jié)(t=3.545,P<0.001)的假陽性結(jié)節(jié)數(shù)均較獨(dú)立閱片時減少,而檢測pGGN(t=3.192,P=0.001)、mGGN(t=3.879,P<0.001)的假陽性結(jié)節(jié)數(shù)增多。
表1 低、高年資規(guī)培醫(yī)師獨(dú)立閱片檢測肺結(jié)節(jié)結(jié)果比較
圖1 病人女,30歲,咳嗽喘息2 d。胸部高分辨力CT檢查橫斷面肺窗影像示左肺上葉下舌段血管旁實性結(jié)節(jié),平均直徑約4 mm。高年資規(guī)培醫(yī)師檢測出該結(jié)節(jié)(箭頭),低年資規(guī)培醫(yī)師檢測時漏診。
2.5 高年資規(guī)培醫(yī)師獨(dú)立閱片與AI輔助閱片檢測肺結(jié)節(jié)結(jié)果比較 高年資規(guī)培醫(yī)師在AI輔助閱片時檢測實性結(jié)節(jié)(χ2=198.294,P<0.001)、pGGN(χ2=63.674,P<0.001)、mGGN(χ2=5.992,P=0.014)、鈣化結(jié)節(jié)(χ2=36.031,P<0.001)、<5 mm 結(jié)節(jié)(χ2=317.906,P<0.001)、5~10 mm 結(jié)節(jié)(χ2=29.715,P<0.001)的敏感度均高于其獨(dú)立閱片,其中以pGGN及<5 mm肺結(jié)節(jié)敏感度的提高最為顯著(圖3),分別提高了約38%和39%,而檢測>10 mm結(jié)節(jié)的敏感度差異無統(tǒng)計學(xué)意義(χ2=2.607,P=0.106)。 除檢測>10 mm 結(jié)節(jié)的假陽性結(jié)節(jié)數(shù)差異無統(tǒng)計學(xué)意義 (z=0.577,P=0.564)外,高年資規(guī)培醫(yī)師在AI輔助閱片時檢測實性 結(jié) 節(jié) (t=1.736,P <0.001)、pGGN (t=2.400,P=0.016)、mGGN (t=1.633,P<0.001)、 鈣化結(jié)節(jié) (t=0.632,P<0.001)、<5 mm 肺結(jié)節(jié) (t=2.572,P=0.010)及 5~10 mm 肺結(jié)節(jié)(t=2.021,P=0.043)的假陽性結(jié)節(jié)數(shù)均較獨(dú)立閱片時減少。
表2 低、高年資規(guī)培醫(yī)師在AI輔助下檢測肺結(jié)節(jié)結(jié)果比較
圖2 病人女,62歲,頭暈。胸部高分辨力CT橫斷面肺窗影像示右肺上葉前段血管旁實性結(jié)節(jié),平均直徑約3 mm,低年資規(guī)培醫(yī)師在AI輔助下敏感檢測出該結(jié)節(jié)(方框),而在獨(dú)立閱片時漏診。
圖3 病人女,60歲,胸悶氣短。胸部高分辨力CT橫斷面肺窗影像示右肺上葉后段血管旁pGGN,平均直徑約3 mm。高年資規(guī)培醫(yī)師在AI輔助下檢測出該結(jié)節(jié)(方框),而在獨(dú)立閱片時漏診。
在肺部CT影像上,實性結(jié)節(jié)、亞實性結(jié)節(jié)(包括pGGN和mGGN)與鈣化結(jié)節(jié)是較為常見的征象,但通常直徑較小,易位于胸膜下、血管旁與縱隔旁等隱蔽部位,故對缺乏臨床經(jīng)驗的規(guī)培醫(yī)師來說具有挑戰(zhàn)性,從而導(dǎo)致很高的漏診率。本研究顯示,低、高年資規(guī)培醫(yī)師在獨(dú)立閱片時,其對pGGN、mGGN、鈣化結(jié)節(jié)及5~10 mm、>10 mm肺結(jié)節(jié)檢出敏感度的差異并無統(tǒng)計學(xué)意義,但對pGGN檢出敏感度不足45%,其余4種均可達(dá)55%以上,這可能與pGGN密度較淺淡、邊界欠清,易于漏診或誤判有關(guān),而mGGN呈混合密度,內(nèi)可見實性成分,鈣化結(jié)節(jié)密度高且邊界清楚,5~10 mm及>10 mm肺結(jié)節(jié)的直徑較大,低、高年資規(guī)培醫(yī)師均較易發(fā)現(xiàn)這些病灶。此外,高年資規(guī)培醫(yī)師對實性結(jié)節(jié)、<5 mm結(jié)節(jié)的檢測敏感度略高于低年資規(guī)培醫(yī)師,且假陽性結(jié)節(jié)數(shù)明顯少于后者,該結(jié)果表明高年資規(guī)培醫(yī)師經(jīng)過2年多規(guī)范化培訓(xùn)掌握了一定的影像學(xué)基礎(chǔ)知識和閱片技能,能夠較低年資規(guī)培醫(yī)師更準(zhǔn)確地識別肺實性結(jié)節(jié)及<5 mm肺結(jié)節(jié),從而減少假陽性結(jié)節(jié)數(shù),但仍缺乏足夠的工作經(jīng)驗和訓(xùn)練數(shù)量的積累及臨床思維,因而實性結(jié)節(jié)及<5 mm肺結(jié)節(jié)檢出敏感度很低。
本研究還顯示AI輔助軟件對于提高低年資規(guī)培醫(yī)師檢測實性結(jié)節(jié)、高年資規(guī)培醫(yī)師檢測pGGN的敏感度尤為顯著,分別提高了約37%、38%;同時低、高年資規(guī)培醫(yī)師均明顯提高<5 mm肺結(jié)節(jié)的檢測敏感度,分別提高了約33%、39%。李等[13]研究顯示,相比人工閱片,AI額外檢測出的肺結(jié)節(jié)多為直徑<5 mm及5~10 mm的結(jié)節(jié)、實性結(jié)節(jié)及pGGN。本研究結(jié)果與其結(jié)果較為一致。還有多項研究[1,14-15]顯示AI技術(shù)用于肺結(jié)節(jié)篩查要優(yōu)于影像科醫(yī)師,但這些研究的研究對象多為影像診斷醫(yī)師或本科臨床實習(xí)生,而本研究中研究對象為參加住院醫(yī)師規(guī)范化培訓(xùn)的本科畢業(yè)的學(xué)員,這類人群在既往研究中較少涉及,且在國家大力推行規(guī)培制度的背景下本研究具有一定的臨床應(yīng)用價值。
本研究表明在AI軟件的輔助下無論是低年資還是高年資規(guī)培醫(yī)師均提高了不同肺結(jié)節(jié)的檢測敏感度,同時高年資規(guī)培醫(yī)師還減少了不同密度、不同大小肺結(jié)節(jié)檢測的假陽性結(jié)節(jié)數(shù),但低年資規(guī)培醫(yī)師檢測pGGN、mGGN的假陽性結(jié)節(jié)數(shù)卻增多??赡茉蚴牵孩俅罅緾T影像數(shù)據(jù)的閱讀和長時間、高強(qiáng)度的壓力,使得閱片者難以全程保持精力高度集中,從而容易漏診那些密度較淺淡亞實性結(jié)節(jié)或直徑<5 mm的結(jié)節(jié);而AI輔助軟件可以敏感、高效檢出這些結(jié)節(jié)。②高年資規(guī)培醫(yī)師具有一定知識儲備和養(yǎng)成注重結(jié)合臨床的診斷習(xí)慣,故對那些缺少臨床意義的極微小結(jié)節(jié)進(jìn)行了過濾,而低年資規(guī)培醫(yī)師缺乏臨床思維和感性認(rèn)識,更加依賴于AI輔助檢測的結(jié)果。
本研究中雖然AI能夠大幅度提高低年資規(guī)培醫(yī)師對各種肺結(jié)節(jié)檢測的敏感度,但增加的假陽性結(jié)節(jié)數(shù)也未能避免。其原因是低年資規(guī)培醫(yī)師尚不具備完全區(qū)分亞實性結(jié)節(jié)與其他感染灶、血管斷面、瘢痕灶及墜積效應(yīng)等的能力,有時結(jié)節(jié)周圍模糊不清也影響其判斷[10,16]。實性肺結(jié)節(jié)較亞實性結(jié)節(jié)易于判斷,故低年資規(guī)培醫(yī)師結(jié)合AI輔助軟件對實性結(jié)節(jié)檢測效能提升最大。對高年資規(guī)培醫(yī)師來說,借助AI輔助軟件不僅可明顯提高肺結(jié)節(jié)檢出的敏感度,還可運(yùn)用專業(yè)知識和臨床經(jīng)驗有效甄別和過濾掉那些假陽性結(jié)節(jié),其臨床實際獲益更大;相對其他密度肺結(jié)節(jié)來說,高年資規(guī)培醫(yī)師更易漏診pGGN,故應(yīng)用AI輔助軟件可有效提高對pGGN的檢測效能。持續(xù)存在的肺pGGN在病理上多為肺腺癌或其癌前病變[17-18],有研究[19-20]表明pGGN成為肺腺癌的概率高于實性結(jié)節(jié),故AI對高年資規(guī)培醫(yī)師pGGN檢測效能的提高更具臨床意義。同時,本研究也間接反映了住院醫(yī)師規(guī)范化培訓(xùn)的臨床成效,經(jīng)過近3年規(guī)范化培訓(xùn)的高年資規(guī)培醫(yī)師在檢出和甄別不同密度、不同大小的肺結(jié)節(jié)方面較低年資規(guī)培醫(yī)生均有較大提高,AI實際輔助診斷的效能也更高,值得在臨床推廣和應(yīng)用。
本研究尚存在以下局限性:①本研究真結(jié)節(jié)參照標(biāo)準(zhǔn)未能獲得病理學(xué)診斷;②樣本量不大,測量數(shù)據(jù)和統(tǒng)計結(jié)果可能存在偏倚;③本研究結(jié)果僅反映特定參數(shù)、特定算法的AI軟件性能,并不能驗證其他AI軟件的結(jié)果。
綜上所述,對仍處于初級階段的接受規(guī)范化培訓(xùn)的影像診斷醫(yī)師來說,AI輔助軟件確實能夠大幅度有效提高CT上不同肺結(jié)節(jié)的檢測效能,從而提升工作效率和部分緩解醫(yī)生資源不足的矛盾,但應(yīng)注重低年資規(guī)培醫(yī)師專業(yè)基礎(chǔ)知識和臨床鑒別診斷思維的訓(xùn)練與培養(yǎng),以有效減少假陽性結(jié)節(jié)數(shù)和避免對AI輔助軟件的過度依賴。同時今后還需開展多中心、更廣泛的聯(lián)合研究以進(jìn)一步驗證AI的實際臨床診斷效能。