范鴻禹,孫丹丹,張 清,伍建林
(大連大學(xué)附屬中山醫(yī)院放射科,遼寧 大連 116001)
近年來,隨著我國住院醫(yī)師規(guī)范化培訓(xùn)政策的廣泛實施,影像科規(guī)培醫(yī)師已逐漸成為一線閱片的主力軍,但因閱片量大、規(guī)培醫(yī)師自身能力或經(jīng)驗不足,常導(dǎo)致漏診、誤診發(fā)生,尤其是在肺結(jié)節(jié)的診斷方面[1]。因此,如何提高規(guī)培醫(yī)師對肺結(jié)節(jié)的檢測效能并縮短閱片時間,已成為臨床工作的重點。計算機硬件水平的提升和深度學(xué)習(xí)等核心技術(shù)的發(fā)展,推動了人工智能的發(fā)展,在醫(yī)學(xué)影像領(lǐng)域,人工智能擁有人腦遠(yuǎn)不能及的計算和圖像識別能力,能對數(shù)據(jù)及圖像進(jìn)行高效的分析和識別,在肺結(jié)節(jié)篩查方面具有良好的輔助診斷作用[2-3]。本研究旨在探討不同年資規(guī)培醫(yī)師在CT 獨立閱片及應(yīng)用人工智能輔助閱片模式下對肺內(nèi)結(jié)節(jié)的檢測效能是否有差異,并分析低年資規(guī)培醫(yī)師在應(yīng)用人工智能輔助閱片后,能否達(dá)到高年資規(guī)培醫(yī)師對肺結(jié)節(jié)的檢測水平。
1.1 一般資料 收集2019 年1 月在我院行常規(guī)胸部CT 掃描的254 例患者。排除有胸部手術(shù)史、肺內(nèi)彌漫性疾病、胸腔積液、肺實變或不張,以及胸部CT 圖像存在呼吸、運動偽影重影響觀測者。共納入180 例,其中男92 例,女88 例。本研究已獲得患者及醫(yī)院倫理審核委員會的批準(zhǔn)。
1.2 儀器與方法 胸部CT 掃描采用Siemens 雙源CT 機(Siemens Somatom Definition Flash)?;颊呷⊙雠P位,單次深吸氣后屏氣掃描,掃描范圍從胸廓入口至肋膈角以下水平。掃描參數(shù):120 kV,130 mAs,探測器準(zhǔn)直128×0.6 mm,機架旋轉(zhuǎn)時間為0.5 s/周,螺距1.2,開啟CAREDose4D 技術(shù)。重建層厚1.0 mm,窗寬1 600~2 000 HU,窗位-800~-600 HU。
1.3 圖像分析 CT 掃描獲得的DICOM 圖像傳輸至人工智能輔助診斷服務(wù)器(InferRead CT Lung Research,Infervision,Beijing,China)上。由2 名低年資規(guī)培醫(yī)師(規(guī)培3~6 個月,已完成胸部CT 報告4 000~5 000 份)及2 名高年資規(guī)培醫(yī)師(規(guī)培30~33 個月,已完成胸部CT 報告15 000 份以上)閱片,在閱片前統(tǒng)一培訓(xùn)。4 位醫(yī)師標(biāo)注肺結(jié)節(jié)時保證環(huán)境安靜,每閱片30 min 休息10 min,上下午各閱片約150 min。
閱片分2 個階段,首先由4 名規(guī)培醫(yī)師在不借助人工智能軟件輔助條件下,對180 例胸部CT 圖像獨立閱片,并記錄結(jié)節(jié)的位置、大小、密度及閱片時間。
經(jīng)2 周洗脫期后,4 名醫(yī)師再次對相同CT 圖像借助人工智能軟件自動閱片篩查出肺結(jié)節(jié)后,并根據(jù)軟件閱片結(jié)果再次閱片,記錄結(jié)節(jié)的位置、大小、密度及閱片時間。
1.4 金標(biāo)準(zhǔn)制訂 首先由2 名具有10 年以上胸部影像診斷工作經(jīng)驗的高年資放射科醫(yī)師在借助人工智能軟件下閱片,即高年資醫(yī)師A 結(jié)合人工智能軟件綜合閱片,標(biāo)注肺結(jié)節(jié),并將結(jié)果交給高年資醫(yī)師B,由醫(yī)師B 結(jié)合人工智能軟件再次閱片并對高年資醫(yī)師A 的標(biāo)注結(jié)果進(jìn)行檢驗,意見不一致時交由第3 名具有15 年以上胸部影像診斷經(jīng)驗的主任醫(yī)師最后判定,最終達(dá)成一致意見。
分別將每名低、高年資規(guī)培醫(yī)師在獨立閱片、借助人工智能軟件閱片模式下對肺結(jié)節(jié)的閱片結(jié)果與金標(biāo)準(zhǔn)進(jìn)行比對,記錄每例患者的真陽性、假陽性及假陰性結(jié)節(jié)數(shù),計算敏感度及人均假陽性結(jié)節(jié)數(shù)。敏感度=真陽性結(jié)節(jié)數(shù)/金標(biāo)準(zhǔn)結(jié)節(jié)數(shù),人均假陽性結(jié)節(jié)數(shù)=假陽性結(jié)節(jié)數(shù)/患者總例數(shù)。
1.5 統(tǒng)計學(xué)分析 應(yīng)用SPSS 20.0 統(tǒng)計學(xué)軟件進(jìn)行數(shù)據(jù)分析。采用Kappa 檢驗分析2 名低年資及2 名高年資醫(yī)師對肺結(jié)節(jié)檢測的一致性,K<0.4 表示一致性較差,0.4≤K<0.75 表示一致性中等,K≥0.75表示一致性較好。本研究中各醫(yī)師組對結(jié)節(jié)檢測情況的一致性較好(低年資醫(yī)師組:K=0.86;高年資醫(yī)師組:K=0.82),故分別取2 名低年資醫(yī)師及2 名高年資醫(yī)師對肺結(jié)節(jié)檢測結(jié)果的平均值進(jìn)行比較。本研究數(shù)據(jù)均不滿足正態(tài)分布,故采用Wilcoxon 秩檢驗(配對樣本),比較低、高年資規(guī)培醫(yī)師獨立閱片及在人工智能輔助下的診斷敏感度、假陽性率和閱片時間的差異。以P<0.05 為差異有統(tǒng)計學(xué)意義。
2.1 低年資規(guī)培醫(yī)師獨立閱片與借助人工智能閱片對肺結(jié)節(jié)檢出情況比較 180 例通過金標(biāo)準(zhǔn)共確定1 208 個結(jié)節(jié),低年資規(guī)培醫(yī)師獨立閱片檢出真陽性結(jié)節(jié)573 個,假陽性結(jié)節(jié)(誤診結(jié)節(jié)數(shù))267 個,假陰性結(jié)節(jié)(漏診結(jié)節(jié)數(shù))635 個;借助人工智能閱片后檢出真陽性結(jié)節(jié)931 個,假陽性結(jié)節(jié)162 個,假陰性結(jié)節(jié)277 個。
低年資規(guī)培醫(yī)師借助人工智能閱片檢出結(jié)節(jié)的敏感度(77.07%,931/1 208)高于獨立閱片模式(47.43%,573/1 208),人均假陽性結(jié)節(jié)數(shù)(0.90 個)低于獨立閱片模式(1.48 個)(P<0.01),閱片時間[(361.07±163.07)s]少于獨立閱片時間[(429.11±132.61)s],差異均有統(tǒng)計學(xué)意義(均P<0.01)(圖1)。
2.2 高年資規(guī)培醫(yī)師獨立閱片與借助人工智能閱片對肺結(jié)節(jié)檢出情況比較 高年資規(guī)培醫(yī)師獨立閱片檢出真陽性結(jié)節(jié)610 個,假陽性結(jié)節(jié)87 個,假陰性結(jié)節(jié)598 個;借助人工智能閱片后檢出真陽性結(jié)節(jié)982 個,假陽性結(jié)節(jié)49 個,假陰性結(jié)節(jié)226 個。高年資規(guī)培醫(yī)師借助人工智能閱片檢出結(jié)節(jié)的敏感度(81.29%,982/1 208)高于獨立閱片模式(50.50%,610/1 208),人均假陽性結(jié)節(jié)數(shù)(0.27 個)低于獨立閱片模式(0.48 個),差異均有統(tǒng)計學(xué)意義(均P<0.01);高年資規(guī)培醫(yī)師獨立閱片時間[(367.22±120.52)s]與借助人工智能閱片時間[(380.16±135.40)s],差異無統(tǒng)計學(xué)意義(P>0.05)(圖2)。
2.3 低年資規(guī)培醫(yī)師借助人工智能閱片與高年資規(guī)培醫(yī)師獨立閱片比較 低年資規(guī)培醫(yī)師借助人工智能閱片對肺結(jié)節(jié)檢出的敏感度(77.07%,931/1 208)高于高年資規(guī)培醫(yī)師獨立閱片(50.50%,610/1 208),但人均假陽性結(jié)節(jié)數(shù)(0.90 個)高于高年資規(guī)培醫(yī)師獨立閱片(0.48 個),差異均有統(tǒng)計學(xué)意義(均P<0.01);低年資規(guī)培醫(yī)師借助人工智能閱片時間[(361.07±163.07)s]與高年資獨立閱片時間[(367.22±120.52)s],差異無統(tǒng)計學(xué)意義(P>0.05)。
3.1 低年資規(guī)培醫(yī)師獨立閱片與借助人工智能閱片模式分析 本研究發(fā)現(xiàn)借助人工智能閱片后,低年資規(guī)培醫(yī)師對肺結(jié)節(jié)的檢測效能明顯提升,檢測時間縮短,提高了工作效率。
我院放射科日常在崗書寫影像報告人員約32 名,規(guī)培醫(yī)師24 名,其中低年資規(guī)培醫(yī)師約占1/4。每天上千份影像報告大多由規(guī)培研究生進(jìn)行初寫工作,因其工作經(jīng)驗較少,想同時保障數(shù)量與質(zhì)量較困難。本研究低年資規(guī)培醫(yī)師單獨閱片結(jié)節(jié)檢出敏感度僅47.43%,人均假陽性結(jié)節(jié)數(shù)達(dá)1.48 個,筆者推測可能是由于低年資規(guī)培醫(yī)師工作時間較短,經(jīng)驗不足,對肺結(jié)節(jié)的識別度較低,且當(dāng)結(jié)節(jié)直徑小(特別是<4 mm)、密度低、與肺紋理延續(xù)、位于血管旁時,易造成漏診、誤診,與邵亞軍等[4]觀點一致。低年資規(guī)培醫(yī)師借助人工智能后,診斷效能明顯提升,敏感度提高至77.07%,人均假陽性結(jié)節(jié)數(shù)下降至0.90 個,與文獻(xiàn)[5-11]報道一致。圖1 顯示了在右肺上葉尖后段有一直徑約0.5 cm 的實性小結(jié)節(jié),在低年資醫(yī)師獨立閱片時漏診,而在其借助人工智能閱片后被檢出,分析其原因可能是低年資規(guī)培醫(yī)師將其誤認(rèn)為血管斷面。此外,人工智能借助深度學(xué)習(xí)模式,對肺門、胸膜下、血管旁及一些非實性結(jié)節(jié)的檢測能力較高[12-14],可彌補低年資醫(yī)師經(jīng)驗或能力不足導(dǎo)致的漏診,降低假陽性率,提高診斷準(zhǔn)確率。
3.2 高年資規(guī)培醫(yī)師獨立閱片與借助人工智能閱片模式分析 高年資規(guī)培醫(yī)師經(jīng)過約30 個月的住院醫(yī)師規(guī)范化培訓(xùn)后,其基礎(chǔ)理論水平及臨床工作能力普遍高于低年資規(guī)培醫(yī)師[15]。本研究中高年資規(guī)培醫(yī)師對肺結(jié)節(jié)檢測水平提高,但與金標(biāo)準(zhǔn)仍存在一定差距,原因可能為工作量較大、易出現(xiàn)疲勞狀態(tài)、診斷水平及環(huán)境等多種因素影響,導(dǎo)致漏診、誤診,特別是對較小病變、與血管距離較近且直徑類似于血管的病灶,人工智能可充當(dāng)“第2 雙眼睛”,進(jìn)行準(zhǔn)確的輔助診斷,以彌補工作中的不足[16-18]。本研究中雖然高年資規(guī)培醫(yī)師已積累了一定的診斷經(jīng)驗,但借助人工智能輔助可明顯提高診斷準(zhǔn)確率。圖2 顯示右肺下葉前基底段見一直徑約0.2 cm 的粟粒結(jié)節(jié),該結(jié)節(jié)位于血管旁,位置較隱蔽,高年資醫(yī)師獨立閱片時漏診,而借助人工智能后將其檢出。Teague 等[19]報道,在人工智能輔助下,具有2~4 年工作經(jīng)驗的住院醫(yī)師對肺結(jié)節(jié)檢測敏感度均有提升。Sahiner 等[20]指出,使用有潛力的高性能CAD 系統(tǒng),可提高放射科醫(yī)師對孤立性肺結(jié)節(jié)的檢測能力,尤其是易遺漏的小結(jié)節(jié)。本研究發(fā)現(xiàn),低、高年資規(guī)培醫(yī)師獨立閱片模式下對肺結(jié)節(jié)檢測的敏感度相似,但高年資規(guī)培醫(yī)師人均假陽性結(jié)節(jié)數(shù)(0.48 個)明顯低于低年資規(guī)培醫(yī)師(1.48 個)。因此,能否借助人工智能輔助低年資醫(yī)師,使其縮短培訓(xùn)時長,快速應(yīng)對臨床工作,需進(jìn)一步研究。
3.3 低年資規(guī)培醫(yī)師借助人工智能與高年資規(guī)培醫(yī)師獨立閱片模式分析 本研究中,雖然低年資規(guī)培醫(yī)師借助人工智能閱片模式較高年資規(guī)培醫(yī)師獨立閱片模式多誤診75 個結(jié)節(jié),但前者對結(jié)節(jié)檢出的敏感度超過后者,多檢出321 個結(jié)節(jié),可明顯提高對肺結(jié)節(jié)檢出的數(shù)量,診斷出更多結(jié)節(jié)。實際工作中因?qū)嵭杏跋駡蟾鎻?fù)審制度,上級審核醫(yī)師需審閱多名低年資規(guī)培醫(yī)師閱片結(jié)果,工作量及壓力更大,若低年資規(guī)培醫(yī)師漏診結(jié)節(jié),會增加審核醫(yī)師漏診風(fēng)險,而對于誤診結(jié)節(jié),審核醫(yī)師較易進(jìn)行診斷并二次排除(圖3),因此對于低年資規(guī)培醫(yī)師而言,增加結(jié)節(jié)檢出、減少漏診,才是首要條件。因此,借助人工智能,不但對低年資規(guī)培醫(yī)師快速檢出肺結(jié)節(jié)有較大幫助,同時還可有效降低審核醫(yī)師壓力,提高科室整體工作效率。
此外,本研究還存在一定的局限性:①不同的人工智能模型診斷效能不一,本研究結(jié)果僅代表本人工智能軟件的診斷效能。②未將結(jié)節(jié)按不同大小、密度進(jìn)行細(xì)分統(tǒng)計,有待于今后深入研究。
綜上所述,人工智能輔助軟件對低、高年資規(guī)培醫(yī)師肺結(jié)節(jié)檢測效能均有提升,且大幅縮短低年資規(guī)培醫(yī)師閱片時間。低年資規(guī)培醫(yī)師在人工智能軟件輔助下,盡管誤診結(jié)節(jié)稍多于高年資規(guī)培醫(yī)師獨立閱片,但前者檢出的真結(jié)節(jié)數(shù)目遠(yuǎn)超后者。
圖1 女,31 歲 圖1a 胸部CT 平掃肺窗示右肺上葉尖后段見一直徑約0.5 cm 的實性小結(jié)節(jié)(白箭),低年資醫(yī)師獨立閱片時該結(jié)節(jié)被漏診 圖1b 人工智能提示右肺上葉尖后段的小結(jié)節(jié)(綠框),低年資規(guī)培醫(yī)師借助人工智能閱片時該結(jié)節(jié)被檢出 圖2 男,42 歲 圖2a 胸部CT平掃肺窗示右肺下葉前基底段見一直徑約0.2 cm 的粟粒結(jié)節(jié)(白箭),位于血管旁,高年資醫(yī)師獨立閱片時該結(jié)節(jié)被漏診 圖2b 人工智能提示右肺下葉前基底段的粟粒結(jié)節(jié)(綠框),高年資醫(yī)師借助人工智能閱片后,該結(jié)節(jié)被檢出,另左肺下葉外基底段見一粟粒結(jié)節(jié)(黃框),在獨立閱片及人工智能輔助下均被檢出 圖3 男,49 歲 圖3a 低年資規(guī)培醫(yī)師獨立閱片未發(fā)現(xiàn)左肺下葉的“結(jié)節(jié)”,人工智能提示左肺下葉外基底段存在一直徑約0.3 cm 的微結(jié)節(jié)(箭頭)。低年資醫(yī)師借助人工智能閱片考慮該“結(jié)節(jié)”為真性結(jié)節(jié) 圖3b 高年資醫(yī)師經(jīng)三維重建后核定,該“結(jié)節(jié)”實為支氣管內(nèi)痰栓