胡瓊潔, 陳沖, 王玉錦, 胡玉娜, 潘月影, 楊朝霞, 艾濤, 孫子燕, 管漢雄, 夏黎明
肺是惡性腫瘤轉移的第三大常見部位,僅次于淋巴結和肝臟。大約1/3的患者在疾病過程中會發(fā)生肺轉移。 早期識別肺部轉移對于患者至關重要,可通過更積極和多學科綜合治療的方法,如肺轉移瘤的切除術或放療等,治療后患者可長期存活甚至治愈[1-3]。計算機斷層掃描(CT),而非胸部X線攝影檢查,是評估肺轉移、隨訪和監(jiān)測治療反應的最有效且安全的檢查手段[4]。此外,這類患者需要反復多次接受胸部CT檢查,其累計輻射劑量增加,低劑量計算機斷層掃描(low dose CT,LDCT)被推薦用于此類患者。
隨著胸部CT在健康體檢及腫瘤患者隨訪復查中越來越廣泛的應用,影像科醫(yī)生的工作量與日俱增。目前我國醫(yī)學影像數(shù)據(jù)年增長率約30%,而放射科醫(yī)師數(shù)量增長率約4%,兩者嚴重的不匹配意味著放射科醫(yī)師處理影像數(shù)據(jù)的壓力越來越大,承擔巨大的負荷。同時,為了最大限度提高肺結節(jié)的檢出率和病灶細節(jié)的顯示,LDCT篩查需要在薄層、不同對比度的CT圖像(層厚1~1.25 mm)上進行觀察,加上至少3種圖像對比(肺窗、縱隔窗、骨窗),每個患者所需觀察的圖像將近1000幅,進一步增加了影像醫(yī)師的工作負擔,容易產(chǎn)生視覺疲勞,降低了工作效率和診斷準確性,導致對肺結節(jié)的漏檢和誤判[5]。研究表明胸外惡性腫瘤患者肺結節(jié)CT漏診約1/3,其中約20%的結節(jié)是惡性的[6]。大部分漏診肺結節(jié)常因體積較小而被漏診。特別對于剛接觸影像的實習學生而言,CT漏診率更高。
研究表明使用計算機輔助檢測系統(tǒng)(computer-aided detection,CAD)明顯提高肺結節(jié)檢出的敏感性[7-11]。Awai等[7]闡述了在標準劑量CT掃描中,使用CAD的肺結節(jié)的檢出率高于不使用CAD的檢出率。Doo等[11]研究表明使用體模CAD對于肺結節(jié)檢出率明顯提高。目前尚缺乏CAD對低劑量CT肺部結節(jié)檢出率影響,特別是詳細的臨床研究的相關報道。Zhao等[5]發(fā)現(xiàn)CAD在肺癌篩查中具有重要價值,可提高肺結節(jié)檢測的敏感性??筛纳圃u估低劑量肺癌篩查CT的閱片者的一致性和隨訪建議,在排除小結節(jié)的情況下[12,13]。有兩篇文獻在標準劑量胸部CT中探討CAD對胸外惡性腫瘤患者肺結節(jié)的檢出率[14,15],并未見關于CAD在低劑量胸部CT對胸外惡性腫瘤患者檢測結節(jié)敏感性的報道。本研究我們假設基于卷積神經(jīng)網(wǎng)絡(CNN)的人工智能CAD系統(tǒng)對于實習醫(yī)生在低劑量兩種CT掃描劑量中對肺結節(jié)的診斷性能顯著提高,包括對胸外惡性腫瘤患者的小結節(jié)。評估CAD對亞實性肺結節(jié)檢出的敏感性相關研究相對較少[16],因此本研究根據(jù)結節(jié)密度特征(實性,亞實性和鈣化結節(jié))、結節(jié)直徑(<4 mm,4~8 mm,>8 mm)和結節(jié)分布(胸膜下或非胸膜下)分別比較肺結節(jié)檢測的敏感性。
使用CAD發(fā)現(xiàn)肺結節(jié)的閱片模式主要有3種:包括第一閱片者,第二閱片者(second-reader,SR)和共同閱片者(concurrent-reader,CR)。研究表明使用CAD作為第二閱片者花費的時間更長,因為需要閱片兩次[17]。許多研究表明了第二閱片者模式的有效性[7-10,18-23],而迄今僅有少數(shù)關于胸部CT共同閱片模式的相關研究。先前的研究中CAD共同閱片模式的評估結果不一致。如,一項研究中表明共同閱片模式,肺結節(jié)檢測的靈敏度從56.5%提高到66.5%[24],但另一項研究中[17]使用CAD共同閱片模式診斷的敏感性無顯著性差異。Beyer等[17]發(fā)現(xiàn)CAD共同閱片模式可以顯著減少閱片時間,Matsumoto等[24]研究未發(fā)現(xiàn)CAD共同閱片模式對閱片時間的影響。此外,尚未見CAD共同讀片模式在低劑量胸部CT情況下對肺結節(jié)檢測影響的相關報道。我們假設,CAD的共同讀片模式提高肺結節(jié)診斷敏感性或減少閱片時間。
本研究系統(tǒng)地評價實習醫(yī)師使用CAD作為第二閱片者和共同閱片者在低劑量胸部LDCT肺結節(jié)檢出中的作用。
本前瞻性研究獲得華中科技大學同濟醫(yī)學院附屬同濟醫(yī)院倫理委員會的批準,并且所有受試者簽署了書面知情同意書。2017年7-12月,共招募了129名胸外惡性腫瘤患者,這些患者計劃進行胸部多層螺旋CT檢查以監(jiān)測或者評價肺轉移情況。招募受試者時排除年齡<18歲和孕婦。本研究排除了肺腫塊>100 mm或肺疾病如嚴重肺氣腫、急性肺部感染、胸腔積液、肺結核或肺結節(jié)病的患者。60名患者被納入研究。其中,104例(88.89%)檢測出肺結節(jié),13例(11.11%)未檢測出肺結節(jié)。
表1 低劑量CT:無CAD、共同閱片和第二閱片模式檢測結節(jié)所用時間
注:UR=無CAD模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
所有患者均以仰臥位吸氣末屏氣時掃描。采用64排探測器CT掃描(Discovery CT750 HD,GE Healthcare)。掃描參數(shù):準直器寬度64×0.625 mm;螺距1.375:1;圖像矩陣512×512。行低劑量CT(BMI≥22:120 kVp,n=88;BMI<22:100 kVp,n=41;20 mAs;NI=30)平掃。 層厚、層間距分別為1.25 mm、1.25 mm,使用ASIR 60%及標準重建方式。
使用CAD系統(tǒng)(推想公司)CAD標記,該系統(tǒng)使用卷積神經(jīng)網(wǎng)絡(CNN)模型。將CAD應用于標準劑量和低劑量胸部CT。軟件識別的候選病灶用圓圈標記。每個病變僅一個層面上顯示CAD標記(即顯示病變的最大直徑層面)。
閱讀疲勞是影響觀察者結節(jié)診斷敏感性的一個重要因素。并且不同醫(yī)生診斷敏感性存在差異。為此,隨機選擇60例用于研究在低劑量胸部CT中,實習醫(yī)師在3種不同閱片模式下肺結節(jié)檢測的敏感性。3名實習醫(yī)師指定為觀察員A、B、C(工作年限小于1年)。3名實習生在沒有CAD的情況下獨立讀片,8周后以CR模式讀片,6周后以SR模式讀片。觀察者以1到4共4級對每個標記結節(jié)的進行評級,其中4代表最高置信度(確定是結節(jié)),得分1代表最低置信度(可能不是結節(jié))[25]。他們根據(jù)自己的需要調整窗寬、窗位、放大和縮小、和使用最大密度投影(MIP)厚片圖像。記錄真陽性率(TP)和假陽性率(FP)和讀取時間。通過檢測的結節(jié)數(shù)除以結節(jié)總數(shù)來計算TP比率。 FP率計算為每個CT圖像中假陽性結節(jié)的個數(shù)。此外,要求3名讀片者手動測量結節(jié)的平均直徑。采用FROC(free-response receiver operating characteristic)解析(JAFROC 4.2.1,www.devchakraborty.com)分析了獨立讀片、CR模式和SR模式下的檢出性能[25-28]。肺結節(jié)參考標準是由3個沒有參與讀片研究的胸部放射科醫(yī)師(20年以上經(jīng)驗)所達成的共識確定:3名醫(yī)生閱片2次,兩次閱片之間間隔3個月。所有高年資胸部放射科醫(yī)師都認同的CAD檢出的結節(jié)亦納入?yún)⒖紭藴省?在研究之前,所有觀察者都接受了使用CAD系統(tǒng)的培訓。 此外,根據(jù)結節(jié)最長直徑(< 4 mm,4~8 mm,>8 mm),結節(jié)性質(實性,亞實性和鈣化結節(jié))和位置(胸膜下或非胸膜下)對肺結節(jié)檢測的敏感性進行了總體比較和每個亞組的比較.
應用SPSS 18.0統(tǒng)計學軟件進行數(shù)據(jù)分析。使用Kolmogrov-Smirnov檢驗驗證獨立讀片,第二讀片SR模式,共同讀片CR模式下低劑量CT圖像真陽性率,假陽性率以及讀片時間是否滿足正態(tài)分布。符合正態(tài)分布用配對t檢驗或方差分析來比較正態(tài)變量,不滿足正態(tài)分布使用Wilcoxon秩和檢驗或K-W檢驗。FROC曲線下面積使用ANOVA方法。P<0.05為差異有統(tǒng)計學意義。
首批參加研究受試者81例,其中女44例,男37例,平均年齡(50.63±9.54)歲,年齡范圍29~78歲;BMI(23.82±1.5)kg/m2,BMI范圍22~28kg/m2;采用120 kVp的低劑量CT掃描。第二批參加研究受試者36例,其中女18例,男18例,平均年齡(48.53±13.25)歲,年齡范圍22~76歲,BMI(20.58±0.87)kg/m2,BMI范圍(18.5~22)kg/m2;采用100 kVp的低劑量CT掃描。經(jīng)初步分析,第二批參加研究的36例受試者的輻射劑量更低。隨機選取60個病例納入本次研究。診斷參考標準:低劑量CT(LDCT)圖像共338個結節(jié)(98.48%)。
3名觀察者在獨立閱讀、CR和SR模式下的閱讀時間如表1。低劑量CT圖像, CR模式[(259±168) s]閱讀時間明顯短于獨立閱片模式[(341±206) s,P<0.0001]和SR模式[(363±165) s,P<0.0001]。
低劑量CT,CAD作為CR模式的平均敏感度(67.36%)顯著高于不使用CAD的平均敏感度(40.83%,P<0.001),而與CAD作為SR模式的平均敏感度(68.34%,P>0.05)無統(tǒng)計學差異。在亞組分析中,對于<8 mm的結節(jié),CR模式的平均敏感性高于不使用CAD(P<0.001)。CAD作為CR模式的FP率(5.31/CT)高于不使用CAD (3.28/CT,P<0.0001),而與CAD作為SR模式的FP率(5.23/CT,P=0.263)無統(tǒng)計學差異(表2、3)。
表2 低劑量CT無CAD模式、共同閱片和第二閱片者模式結節(jié)檢測結果(真陽性率和假陽性率)
注:UR=無輔助模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
表3 低劑量CT:無CAD,共同閱片模式和第二閱片者模式肺結節(jié)檢出結果
注:UR=無輔助模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
圖1 FROC曲線代表3名實習醫(yī)師使用共同讀片模式(綠線)、第二讀片者模式(紫線)和無CAD模式(紅線)檢測肺結節(jié)的平均性能。
觀察者平均的JAFROC FOM在CR模式下為0.59(95%置信區(qū)間:0.53,0.65),在無CAD模式下為0.44(95%置信區(qū)間:0.37,0.52),差異有顯著性差異(P<0.0001);SR模式的平均FOM值為0.60(95%置信區(qū)間為0.51,0.69),CR模式與SR模式的FOM值無統(tǒng)計學差異(表4,圖1、2,P=0.675)。
表4 結節(jié)檢測的結果: FOM
注:UR=無輔助模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
CT檢查是醫(yī)療輻射暴露最重要因素。近年來,隨著人們對輻射危害的關注,低劑量胸部CT越來越廣泛地應用[29]。美國國家肺癌篩查試驗(national lung screening trial,NLST)表明,低劑量CT降低了肺癌死亡率[30]。此外,累計輻射劑量的增加引起人們的注意,尤其對于肺部感染的監(jiān)測,評價和監(jiān)測肺部轉移治療反應,這類患者需要反復多次進行胸部CT檢查[4]。因此也被推薦使用低劑量CT檢查。本研究系統(tǒng)地評估CAD作為第二閱片者和共同閱片者兩種模式下肺結節(jié)檢出的效能。盡管實習醫(yī)師在低劑量胸部CT圖像上容易漏診結節(jié),且需要很長的時間來檢測結節(jié),但CAD(在第二讀片者和共同讀片模式中)顯著提高了肺結節(jié)診斷敏感性,同時使用CAD作為共同讀片模式縮短了閱片時間。此外,低劑量并沒有影響實習醫(yī)師肺結節(jié)檢出的假陽性率。
圖2 48歲,男,直腸癌患者。 a) 實習醫(yī)師不使用CAD時無一人在低劑量CT上檢測到結節(jié)(直徑約2mm); b) 在共同閱片和第二讀片者模式中, 2名實習醫(yī)師正確識別了該結節(jié); c) 7個月后,肺結節(jié)明顯增大。
許多研究顯示了第二讀片者SR模式[7-10,12,13]的有效性。同樣,我們發(fā)現(xiàn)不論是常規(guī)劑量還是低劑量CT對于<8 mm結節(jié),使用CAD作為第二閱片者比較于未使用 CAD,顯著提高實習醫(yī)生的診斷準確度(P<0.001)。
使用CAD系統(tǒng)作為第二閱片者模式,不可避免地延長讀取時間。雖然有許多研究表明使用CAD作為第二閱片者模式[7-10,18-23]提高肺結節(jié)敏感性的有存在性,但關于CAD作為共同閱片模式的研究很少[17,24,31]。此外,使用CAD作為共同閱片模式在診斷肺結節(jié)的敏感性和閱片時間方面存在爭議,并且在低劑量胸部CT,以共同閱片模式使用CAD對肺結節(jié)診斷的影響還未見報道。Beyer等的研究使用CR模式與未使用CAD相比,顯著地減少了閱片時間,但對診斷敏感度沒有影響[17]。他們認為共同讀片模式的靈敏度沒有增加,可能是由于閱片速度的加快,對CT圖像的視覺分析不太徹底。最近一項研究表明相比獨立閱片CR模式閱片時間并沒有縮短,但診斷敏感度提高[24]。相反,F(xiàn)oti等[31]研究發(fā)現(xiàn)CR模式既沒有縮短閱片時間,也沒有顯著地提高肺結節(jié)檢出的敏感性。本研究我們比較了未使用CAD與CAD作為共同讀片模式在低劑量胸部CT,閱片時間和肺結節(jié)診斷敏感度的差異。 我們發(fā)現(xiàn)與未使用CAD模式相比,CR模式不僅顯著地減少了讀片時間,而且還增加了實習生在LDCT肺結節(jié)檢測的敏感度。 CR模式下(259 s)的讀片時間明顯短于無CAD模式(341 s,P<0.01)和SR模式(363 s,P<0.01)。未使用CAD模式的閱片時間在我們的研究中是直接記錄的;而先前的研究中[17,24,31],未使用CAD模式下的閱片時間則是從先前的2次閱片中提取的,所以本研究的結果可靠性更高。共同閱片模式的敏感度(67.36%)高于未使用CAD模式(40.83%,P<0.001),而與第二閱片模型相比,敏感度(68.36%,P>0.05)無統(tǒng)計學差異。在低輻射劑量水平,圖像噪聲隨著輻射劑量減少而增加[5]。盡管實習醫(yī)師在低劑量胸部CT圖像上容易漏診結節(jié),且需要較長的時間才能檢出結節(jié),但使用CAD在共同閱片模式可顯著提高診斷敏感度,且縮短閱片時間。隨著使用CAD的敏感度的增加,假陽性率也增加[32]。我們發(fā)現(xiàn)CR模式中的平均FP率(5.31/CT)比未使用CAD模式高(3.28/CT,P<0.0001),而使用CAD在CR和SR兩種模式平均FP率(5.23/CT,P=0.263)無統(tǒng)計學差異。
JAFROC FOM于2004年首次提出[26],是研究真陽性率與假陽性率新指標[25,27,28]。值得注意的是,我們的研究在低劑量CT使用CAD作為共同閱片者模式的JAFROC FOM顯著高于未使用CAD(P<0.001),而CAD作為共同閱片者比較于作為第二閱片者JAFROC FOM無統(tǒng)計學差異(P>0.05)。 因此,CR模式有益于低劑量CT實習醫(yī)師。
本研究局限性在于首先沒有可利用的外部參考標準(如組織學證據(jù)),而是3個高年資胸部放射科醫(yī)師(超過20年的工作時間)兩次CT閱片的共識作內部參照標準。這一局限性在評價CAD效能的研究中非常普遍。其次,真陽性率相對較低,假陽性率相對較高。然而,考慮到我們研究中90%的結節(jié)直徑<4 mm,也相對解釋為什么本研究中的敏感度相對較低。其次,人類解讀圖像時的差異不可避免,需要更大多中心的研究來證實我們的觀察結果。最后,本研究結果僅代表一個特定算法的在特定參數(shù)時CAD的表現(xiàn),不能直接用于其它CAD。然而,本研究的重點是讀片者和CAD之間的交互,而非CAD的性能本身。
總之,我們在臨床上證明了盡管實習醫(yī)師在低劑量胸部CT獨立閱片時容易漏診結節(jié),但CAD在共同讀片和第二讀片者模式均顯著提高包括小結節(jié)在內的肺結節(jié)的診斷敏感性。并且以共同讀片模式使用CAD顯著地縮短了讀片時間。