江桂蓮,陳疆紅,胡志海,鐘朝輝,王大為
1.首都醫(yī)科大學附屬北京友誼醫(yī)院 放射科,北京 100059;2.北京推想科技有限公司 全球臨床科研合作學院,北京 100025
根據(jù)2015年中國癌癥中心報道,肺癌已成為我國發(fā)病率及致死率最高的癌癥[1],約三分之二的患者初診時已經(jīng)是中晚期,有明顯的淋巴和血管遠處轉移的傾向。對于中晚期患者而言,肺癌的預后效果很差,平均五年生存率低于20%[2],Ⅳ期肺癌患者五年生存率低至5.3%[3]。相比之下,Ⅰ期肺癌患者手術切除后10年生存率可達72%[4]??梢姡缙诜伟┖Y查對患者的預后、生存時間乃至生存質量具有重要意義。胸部低劑量CT(Low Dose CT,LDCT)是肺結節(jié)篩查的常規(guī)手段,研究表明LDCT篩查可以有效降低肺癌死亡率達20%[5]。然而,CT檢查量增長與放射科醫(yī)生數(shù)量之間日趨不均衡,加上每個患者的胸部CT圖像有400層左右,這些都容易導致閱片醫(yī)生因為疲勞或不專注等原因產(chǎn)生漏診。
近幾年,基于深度學習的新一代人工智能(Artificial Intelligence,AI)技術迅速發(fā)展。在醫(yī)學影像領域,AI系統(tǒng)已經(jīng)被成功應用于放射、病理、皮膚醫(yī)學等的圖像分析,與醫(yī)學專家相比,診斷速度更快、診斷準確率基本持平[7]。因此,AI技術是提高醫(yī)生診斷效率、減輕臨床工作負擔的潛在有效手段之一。
值得指出的是,肺部CT檢查的圖像質量受到許多因素的影響,如成像方法、層厚和劑量等。能譜CT利用X線高低能量瞬時切換技術,獲得多組單能圖像,不同單能圖像組織CT值、對比度及噪聲不同。目前認為低千電子伏特(Kiloelectron Volt,keV)圖像組織對比度較大,較高能量圖像及混合能量圖像更易于小病灶的檢出及診斷,且低keV圖像的CT值更能反映結節(jié)的性質[6]。因此,本研究應用商品化的AI肺結節(jié)篩查系統(tǒng),將其與能譜CT的單能圖像結合,在臨床使用中驗證其檢測肺結節(jié)的有效性的同時,篩選最佳的單能圖像以保證AI系統(tǒng)最優(yōu)的肺結節(jié)檢出率。同時,根據(jù)肺結節(jié)位置的不同(分為肺外帶、肺內帶、支氣管血管樹旁、胸膜下四類),評估人工智能系統(tǒng)對能譜CT單能圖像中肺結節(jié)的檢出效能以及對于不同位置結節(jié)檢出的準確性。
回顧性收集2018年11月—2019年3月首都醫(yī)科大學附屬北京友誼醫(yī)院放射科行胸部能譜CT掃描的住院患者30例,其中男15例,女15例,平均年齡61.8歲。收集標準:病例年齡>18歲,因胸部占位性病變入院檢查者。排除標準:兩肺在視野內不能完全可見;有呼吸運動偽影;影像不符合DICOM標準;醫(yī)生難以識別診斷。
1.2.1 能譜CT數(shù)據(jù)采集
采用GE Revolution CT(GE Healthcare,Wisconsin,USA)掃描機行能譜胸部CT平掃?;颊哐雠P,頭先進,以胸骨柄為定位中心,患者深吸氣并屏氣。掃描范圍從肺尖到橫膈以下。掃描參數(shù)為:螺距0.992:1,球管轉速0.5 s/r,掃描層厚5 mm,重建層厚0.625 mm,準直器寬度80 mm,DFOV 35 cm,管電壓為80 kV和140 kV瞬時(0.25 ms)切換,自動毫安技術,噪聲指數(shù)NI=12。掃描完成后將原始圖像載入寶石能譜成像瀏覽器(GSI viewer)重建40、55、70、85、100 keV共5組單能量圖像。
1.2.2 圖像分析
來自首都醫(yī)科大學附屬北京友誼醫(yī)院放射科、具有5年以上肺部讀片經(jīng)驗的2名主治及以上醫(yī)生,在基于深度學習的AI肺結節(jié)篩查系統(tǒng)(北京推想科技有限公司,InferRead CT Lung)的輔助下背靠背對胸部能譜CT中120 kVp-like序列(相當于74 keV序列)圖像進行肺結節(jié)標注,當2名醫(yī)生的標注結果出現(xiàn)分歧時,由第3名具有20年肺部讀片經(jīng)驗的主任醫(yī)師進行仲裁,由此制定出該數(shù)據(jù)集中肺結節(jié)的“金標準”。金標準制定過程中,標注醫(yī)生同時記錄了每個結節(jié)所在的位置,按照不同位置分為肺外帶(結節(jié)距胸膜≤15 mm)結節(jié)、肺內帶(結節(jié)距胸膜>15 mm)結節(jié)、支氣管血管樹旁結節(jié)和胸膜下結節(jié)四類。利用人工智能系統(tǒng)分別對30例胸部能譜CT序列的40、55、70、85、100 keV單能量圖像進行讀片篩查,記錄檢出結節(jié)的總數(shù)及每個結節(jié)位置,將AI系統(tǒng)的篩查結果與“金標準”進行比對,計算其在不同單能圖像中對不同位置肺結節(jié)的檢出率。
本研究數(shù)據(jù)分析均使用SPSS 19.0(IBM Corp.,Armonk,NY,USA)完成。通過與金標準比對,統(tǒng)計不同單能量圖像中檢出的真陽性結節(jié)數(shù),假陽性結節(jié)數(shù)和假陰性結節(jié)數(shù),計算敏感度,假陽性率和陽性預測值,其中,假陽性率定義為每個CT掃描的平均假陽性結節(jié)數(shù)(假陽性數(shù)/CT掃描數(shù)),陽性預測值定義為真陽性結節(jié)與所有檢出結節(jié)的比值[8]。對于不同單能量圖像中不同位置肺結節(jié)的檢測敏感性和陽性預測值采用同樣的方式統(tǒng)計和計算。最后利用χ2檢驗或Fisher精確檢驗(當頻數(shù)小于5時)比較各組間敏感度和陽性預測值的差異,通過單因素方差分析比較各組間假陽性率差異,P<0.05代表有統(tǒng)計學差異。
在入組的30例能譜CT平掃圖像中,三名放射科專家共計標注了224個肺結節(jié),包含86個肺外帶結節(jié)、34個肺內帶結節(jié)、41個支氣管血管樹旁結節(jié)和63個胸膜下結節(jié)。
利用AI肺結節(jié)篩查系統(tǒng)對臨床中常用的CT序列(120 kVp-like)圖像進行肺結節(jié)檢測,共計檢測到349個結節(jié),與金標準比對后發(fā)現(xiàn),AI系統(tǒng)檢測到真陽性結節(jié)218個,假陽性結節(jié)131個,假陰性結節(jié)6個,檢測敏感度為97.3%,陽性預測值為62%,假陽性率為4.37%??梢?,AI肺結節(jié)篩查系統(tǒng)在臨床上具有較好的表現(xiàn)。
利用AI肺結節(jié)篩查系統(tǒng)分別對40、55、70、85、100 keV的單能圖像進行結節(jié)檢測(圖1),分別檢出280、314、339、349和360個結節(jié),其中真陽性結節(jié)數(shù)分別為167、201、216、215和208個,結果如表1所示。5組單能量圖像結節(jié)檢出敏感性存在顯著性差異(P=0.000),40 keV圖像結節(jié)檢出敏感性顯著低于其余4組,其中70 keV圖像對結節(jié)檢出具有最高的敏感性(96.43%)。假陽性率隨keV升高呈增加的趨勢,各組間無顯著差異(P=0.358)。陽性預測值各組間無顯著性差異(P=0.402),其中55 keV和70 keV具有較高的陽性預測值(分別為64%和63.7%)。綜上,能譜CT的70 keV單能圖像更適合AI系統(tǒng)進行結節(jié)篩查。
圖1 右肺中葉內段結節(jié),靠近血管旁
表1 AI肺結節(jié)篩查系統(tǒng)在單能圖像間的檢測性能比較
將AI系統(tǒng)在不同單能量圖像中檢測的肺結節(jié)進行位置分類,分別在肺外帶、肺內帶、支氣管血管樹旁及胸膜下四個位置統(tǒng)計肺結節(jié)總數(shù)和真陽性結節(jié)數(shù),計算敏感性、陽性預測值及對應P值,詳見表2~3。不同單能量圖像中,檢出四個位置肺結節(jié)的敏感性無統(tǒng)計學差異(P>0.05);在5組單能量圖像間,針對肺外帶結節(jié),70 keV及以上組單能圖像的檢測敏感度顯著高于40、55 keV;針對肺內帶結節(jié),55 keV及以上組單能圖像的檢測敏感度顯著高于40 keV。針對支氣管血管樹旁結節(jié),70 keV及以上組單能圖像的檢測敏感度顯著高于40及55 keV;針對胸膜下結節(jié),不同單能量組間檢測敏感度無顯著差異(P=0.079)。值得注意的是,在各組單能量圖像中,支氣管血管樹旁結節(jié)的陽性預測值顯著低于肺外帶、肺內帶和胸膜下結節(jié)的陽性預測值(P=0.00)。在不同單能量圖像間,四個位置肺結節(jié)陽性預測值無顯著差異。綜上,70 keV及以上單能圖像可以保證對不同位置的肺結節(jié)比較穩(wěn)定的檢出敏感性。而40、55 keV圖像在對對比度較低的小結節(jié)進行檢測時,可能有一定的優(yōu)勢(圖2)。
表2 AI肺結節(jié)篩查系統(tǒng)在不同單能圖像中檢測不同位置結節(jié)的效能情況
表3 AI肺結節(jié)篩查系統(tǒng)對不同位置肺結節(jié)在不同單能圖像中的檢出效能情況
圖2 左肺上葉下舌段實性結節(jié)
目前,肺癌已成為國內外發(fā)病率及致死率最高的癌癥。由于臨床大多數(shù)肺癌患者就診時已處于晚期階段,術后5年生存率不足10%[9],所以早期診斷對提高患者生存率至關重要。胸部CT平掃是進行肺癌篩查的最常規(guī)手段。早期肺癌多表現(xiàn)為肺部結節(jié),它們尺寸小、對比度低、形狀異質化高[10],使結節(jié)的檢出存在很多挑戰(zhàn)。能譜CT成像能夠獲取40~140 keV不同的X線能量的單能量圖像,低keV單能量圖像上肺結節(jié)CT值高,不同組織結構之間的對比增強,但噪聲增加;而高keV單能量圖像上肺結節(jié)CT值降低,不同組織結構之間的對比降低,同時噪聲降低;不同單能量圖像的圖像特點可能為不同類型的肺結節(jié)檢出提供更多的信息。本研究將能譜胸部CT平掃不同單能量圖像應用于人工智能系統(tǒng),測試在圖像的CT值、對比度及噪聲等圖像細節(jié)發(fā)生變化時(即不同keV單能量圖像),對肺結節(jié)檢出率的影響。這在之前未見相關文獻報道。同時本研究著重考察結節(jié)位置對人工智能系統(tǒng)結節(jié)檢出的影響。
本研究中,人工智能系統(tǒng)對40 keV圖像的結節(jié)檢出率(74.56%)顯著低于其余單能圖像組,其中70 keV圖像檢出的真陽性結節(jié)最多,具有最高的結節(jié)檢出敏感性(96.43%)。一項針對胸部雙能CT孤立性肺結節(jié)成像研究表明[11],70 keV時圖像信噪比與對比噪聲比最高,選擇60 keV以上單能譜圖像可提高孤立性肺結節(jié)的檢出率。以往的許多研究顯示,70 keV圖像信噪比高,有利于實質臟器接近等密度小病灶的發(fā)現(xiàn)和檢出,這在一定程度上解釋了本研究中70 keV單能量圖像相比其他單能量組,檢出的真陽性結節(jié)數(shù)最多。此外,一項針對肺部圖像數(shù)據(jù)庫聯(lián)盟的綜述總結了2017—2018年使用深度學習算法對肺結節(jié)檢出的22項研究,結節(jié)檢出的敏感性在83.1%~96.6%[12],本研究中是在臨床環(huán)境中驗證商品化AI肺結節(jié)篩查系統(tǒng)的效能,其結節(jié)檢出的敏感性依舊有很好的表現(xiàn),在70 keV單能圖像中達到96.43%。
當前,人工智能系統(tǒng)在表現(xiàn)出結節(jié)檢出高敏感性的同時,也伴隨著較高的假陽性率的問題。在本研究中,隨著keV增加,檢出結節(jié)數(shù)增加,檢出假陽性結節(jié)也呈增加的趨勢,導致假陽性率的增加(3.77~5.07),最終引起陽性預測值逐漸降低。這可能是由于隨著keV的增加,雖然圖像的對比度降低,但是圖像的層次增加,人工智能系統(tǒng)從豐富的圖像層次中可以提取到更細微的特征,從而導致檢出結節(jié)的增加,假陽性率的增加。對比以往17項人工智能系統(tǒng)研究,AI系統(tǒng)的假陽性率的中位數(shù)是每掃描4.1個[4],我們使用的AI系統(tǒng)假陽性率是每掃描3.77~5.07個,基本與之前的研究持平。
此外,本研究發(fā)現(xiàn)不同單能量圖像對不同位置的肺結節(jié)的檢出敏感性沒有差異,這與Marten等[13]的研究發(fā)現(xiàn)一致,結節(jié)位置對CAD系統(tǒng)或放射醫(yī)師對結節(jié)的檢出沒有顯著影響。但也有研究提出相反的結果。一項檢查肺結節(jié)位置對檢出率影像的研究將肺結節(jié)分為3組:對孤立性結節(jié)的檢出敏感性為97.4%,近胸膜結節(jié)為92.3%,近血管結節(jié)為94.1%[14]。大多數(shù)未被檢出的結節(jié)位于近胸膜或近血管,因為這些結節(jié)與周圍的軟組織結構可能不能輕易的分辨。研究結果的不一致可能與所采用的AI系統(tǒng)、訓練樣本及研究對象、肺結節(jié)大小等不同有關。此外,我們發(fā)現(xiàn)在不同單能圖像組中,支氣管血管樹旁結節(jié)陽性預測值顯著低于肺內帶、肺外帶及胸膜下結節(jié)。這一結果說明肺結節(jié)檢出的敏感性沒有受到結節(jié)位置的影響,而支氣管血管樹旁較肺內外帶及胸膜下檢出了較多的假陽性結節(jié)。一些假陽性結節(jié)和真正的肺結節(jié)在形態(tài)學的表現(xiàn)上非常相似,這可能是導致肺結節(jié)識別假陽性率高的原因之一。而在本研究中,近血管支氣管旁的假陽性結節(jié)數(shù)目最多,這一結果也被許多研究證實。Li等[8]研究表明,DL-CAD引起假陽性結節(jié)的最常見的5種原因包括:正常肺血管、胸膜結節(jié)和增厚、肺門、纖維化和偽影。一項關于減少假陽性結節(jié)檢出的算法研究指出,對于量化脊柱異常來說很重要的骨刺,常被認為是假陽性結節(jié),其他典型的假陽性結節(jié)包括結節(jié)樣組織、大血管、縱膈組織和瘢痕等[15]。因此,如何減少近血管旁的假陽性結節(jié)是人工智能系統(tǒng)仍需努力的方向,充滿挑戰(zhàn)。
對于不同位置的肺部結節(jié),70 keV及以上單能圖像對不同位置的肺結節(jié)表現(xiàn)出比較穩(wěn)定的檢出敏感性。而40及55 keV圖像對對比度較低的小結節(jié)可能有一定的優(yōu)勢(圖2)。70 keV及以上圖像因為其豐富的圖像層次使AI系統(tǒng)能提取到更多信息,尤其70 keV圖像,因為其信噪比及對比噪聲比較好,可取得最好的結節(jié)檢出敏感性,因此是本研究中最優(yōu)單能圖像。
本研究的局限性在于:樣本數(shù)量有限,肺內帶結節(jié)為34個,支氣管血管樹旁結節(jié)為41個,今后應擴大樣本量,對實驗結果進行進一步驗證。
能譜CT中70 keV單能圖像能使AI肺結節(jié)篩查系統(tǒng)獲得較高檢測敏感性、較低假陽性率以及較高陽性預測值,因此是適合該AI系統(tǒng)的最優(yōu)單能量圖像。而在不同單能量圖像中,結節(jié)位置對人工智能系統(tǒng)結節(jié)檢出沒有顯著影響。此外,肺血管誤認是假陽性結節(jié)產(chǎn)生的最主要原因之一。