熊 英 陸霓虹
1.大理大學(xué)公共衛(wèi)生學(xué)院,云南昆明 671003;2.昆明市第三人民醫(yī)院呼吸與危重癥醫(yī)學(xué)科 云南省傳染性疾病臨床醫(yī)學(xué)中心,云南昆明 650041
國際癌癥研究機構(gòu)(International Agency for Research on Cancer,IARC)公布的數(shù)據(jù)顯示,2020年中國肺癌的發(fā)病率(56.3/100 000)和病死率(49.4/100 000)均居于所有惡性腫瘤的首位[1]。通常肺癌患者五年生存率約為18%,但是其中的ⅠA期患者卻大于75%[2],故早期發(fā)現(xiàn)肺癌,可以極大地提高其生存率。為大幅度降低肺癌的病死率,可以在肺結(jié)節(jié)(pulmonary nodule,PN)高危人群中進行低劑量CT篩檢,發(fā)現(xiàn)PN并進行管理,盡可能發(fā)現(xiàn)早期肺癌,提高患者的生存率。目前PN的診療方面存在良性結(jié)節(jié)診療過度和惡性結(jié)節(jié)診療不足的問題,考慮到成本-效益問題,應(yīng)綜合評估,然后對PN人群進行分類管理,盡量減少不必要的侵入性檢查,取得更大的收益。在臨床工作中,對于PN良惡性的判斷多數(shù)是基于醫(yī)生的經(jīng)驗性判斷,這可能缺乏一定的客觀性。迄今為止,已有許多預(yù)判PN的良惡性的診斷模型被開發(fā)出來,本研究就PN危險因素和良惡性預(yù)測模型做一綜述,并對未來PN的管理模式提出了設(shè)想。
隨著年齡的增長,PN的檢出率也隨之增加,且呈現(xiàn)線性增長趨勢[3-5]。有相關(guān)研究表明,小于40歲的人群中,PN檢出率低于3%,而年齡大于60歲人群中,檢出率可高達50%[6]。隨著機體向老年化發(fā)展,免疫力在逐步降低,細胞的自我修復(fù)能力降低,抵抗有害暴露因素的能力在逐步減弱,容易發(fā)生各種疾病[7]。
性別是否和PN發(fā)生相關(guān),尚有爭議,但是在兩個納入上萬人的研究中[4,7],均發(fā)現(xiàn)男性人群中有更高的PN檢出率,猜測這可能與男性人群有更高的吸煙率以及更多的不良生活習(xí)慣有關(guān)[8]。
吸煙可以通過直接損傷細胞DNA或影響細胞轉(zhuǎn)錄翻譯的過程引起細胞惡性變,從而成為PN發(fā)生的誘因[9]。在Gould的研究中,發(fā)現(xiàn)吸煙人群肺部結(jié)節(jié)的檢出率明顯高于非吸煙人群,吸煙是誘發(fā)肺癌的獨立危險因素(OR=7.9)[10]。一項肺癌篩檢的研究結(jié)果顯示,在>50歲的吸煙者人群中,PN的檢出率接近50%,而10%的吸煙者在隨后1年的隨訪中會出現(xiàn)新發(fā)的PN[11]。Kwon等[12]發(fā)現(xiàn)在中度和重度吸煙人群中,PN的發(fā)生率明顯增高。
PN常見于癌癥患者,這些病變通常被認為是肺部轉(zhuǎn)移,但對于一些有肺癌危險因素的患者,如煙草暴露,新的PN并不總是代表轉(zhuǎn)移。Beller等發(fā)現(xiàn)50%的PN為肺轉(zhuǎn)移,26%為原發(fā)性肺癌[13]。Rena等報道了131例有腫瘤病史的PN患者,轉(zhuǎn)移性疾病、原發(fā)性肺癌和良性疾病分別占49%、44%和7%[14]。研究表明,家族腫瘤史和既往腫瘤史均是PN的獨立危險因素[8,11]。
室內(nèi)空氣污染物包括家庭空氣污染物(household air pollution,HAP)、二手煙、家具釋放的甲醛、燃氣產(chǎn)生的氮氧化合物以及建筑材料所含的揮發(fā)性有機化合物等[5]。在一項基于中國北方人群的研究中發(fā)現(xiàn),二手煙及廚房油煙的暴露可能是發(fā)生PN的危險因素之一,在單因素分析中及多因素分析中,二手煙及廚房油煙暴露組與非暴露組的肺結(jié)節(jié)發(fā)生率均有統(tǒng)計學(xué)意義,提示上述兩種因素可能是發(fā)生肺結(jié)節(jié)的獨立危險因素[3]。
有學(xué)者認為高血壓是發(fā)生PN的獨立危險因素,其風(fēng)險比為1.222,但具體機制不清[8]。在一項病例對照研究[15]中,經(jīng)單因素及l(fā)ogistic回歸分析后得出幽門螺桿菌(Hp)感染是發(fā)生PN的獨立危險因素。抑郁、焦慮及工作和生活壓力也與PN的發(fā)生密切相關(guān)[16]。
2.1.1 早期經(jīng)典傳統(tǒng)模型 傳統(tǒng)模型通常是提取PN患者的流行病學(xué)特征,如年齡、性別等因素,再加上影像學(xué)特征(結(jié)節(jié)大小、毛刺征、胸膜牽拉征等),或者聯(lián)合腫瘤標(biāo)志物,而常采用的模型建立方法是二元logistic回歸。最開始建立的良惡性預(yù)測模型是梅奧醫(yī)學(xué)中心建立的梅奧模型(mayo model)[17],是基于二元logistic回歸方法建立的,其納入的研究對象為胸片發(fā)現(xiàn)的629例孤立性PN患者,通過單因素和二元logistic回歸分析,得到了6個預(yù)測因子(表1),訓(xùn)練組和驗證組的受試者工作特征曲線下面積(area under curve,AUC)分別為0.833和0.801。類似的模型還有Brock模型(Brock model)[18],亦被稱作Pan Can模型或McWilliams模型,也采用了二元logistic回歸方法,預(yù)測因子有9個(表1),其訓(xùn)練組和驗證組的AUC分別為0.942和0.970;與梅奧模型不同的是,Brock模型是基于低劑量CT建立的模型,故有泛化到體檢人群中評估PN良惡性的潛質(zhì)。更多的還有VA模型[19],但卻是基于退伍軍人的數(shù)據(jù)建立的,缺乏女性樣本,故臨床實用價值有限。另外,國內(nèi)開發(fā)的模型中比較經(jīng)典的是北大模型(PKUPH模型)[20],納入了6個獨立預(yù)測因子(表2)。
表1 四個傳統(tǒng)經(jīng)典模型對比表
表2 近期其他模型匯總表
2.1.2 其他基于logistic回歸建立的模型 目前所建立的數(shù)學(xué)模型大都基于二元logistic回歸,所納入的病例大都來自于單中心,惡性占比大且數(shù)量有限,所建立的模型大都缺乏外部驗證;而近期主要是在研究變量選擇方面進行創(chuàng)新,其中就包括了miRNA、蛋白生物標(biāo)志物、18F-FDG PET/CT等。
隨著放射影像學(xué)技術(shù)的發(fā)展和應(yīng)用,放射科醫(yī)師承擔(dān)了海量的閱片任務(wù),為了改變這種現(xiàn)狀并協(xié)助醫(yī)師診斷,計算機輔助診斷(computer-aided diagnosis,CADx)系統(tǒng)應(yīng)運而生。誠然,人工智能學(xué)科下有諸多構(gòu)建CADx系統(tǒng)的方法,如機器學(xué)習(xí)
(決策樹、隨機森林、邏輯回歸、支持向量機、K均值聚類算法等)和深度學(xué)習(xí)(卷積神經(jīng)網(wǎng)絡(luò)和深度置信網(wǎng)絡(luò)),但大多數(shù)良惡性預(yù)測模型構(gòu)建采用的是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN),它具有結(jié)構(gòu)相對簡單、訓(xùn)練參數(shù)少和適應(yīng)能力強等優(yōu)點,相對于其他方法,CNN有著更為強大圖像識別和分類能力,而且即使圖像發(fā)生一定的平移、縮放、傾斜等變形,CNN的輸出也不會發(fā)生改變。在大多數(shù)研究中,其預(yù)測效能較好,AUC大多在0.85以上,在良惡性的預(yù)測上,與有經(jīng)驗的放射科醫(yī)師及臨床醫(yī)師無統(tǒng)計學(xué)意義,甚至可能效果更好[26]。但人工智能畢竟不能像人類醫(yī)師一樣,可以提取影像學(xué)上,可能具有惡性病理意義的特征(如毛刺、血管集束征、胸膜凹陷征等),并且大多模型的構(gòu)建并沒有考慮患者的臨床特征和實驗室數(shù)據(jù),故該模型的作用只是為臨床判斷提供一個相對可靠的參考,它不能代替臨床醫(yī)生作出最后的決定。但隨著中國農(nóng)村肺癌發(fā)病率的不斷上升和經(jīng)驗醫(yī)師的缺乏,人工智能可能是臨床醫(yī)生用作PN患者影像學(xué)解釋的極佳補充工具。
最近的一項研究中,研究者把人工智能的判讀分析結(jié)果用于構(gòu)建新的數(shù)學(xué)模型,其AUC接近0.9,并且在結(jié)合循環(huán)中攜帶異常遺傳物質(zhì)細胞的檢測結(jié)果后,其模型靈敏度和特異度均超過80%[27];同樣地,AI分析結(jié)果也可用于圖形計算工具(如諾模圖),在多中心的驗證隊列中,構(gòu)建的諾模圖總體預(yù)測準(zhǔn)確度為91.6%,靈敏度和特異度分別為86.03%和85.88%[28]。
現(xiàn)在PN的分類管理大都是基于結(jié)節(jié)直徑的,但是有時候直徑測量所產(chǎn)生的誤差可能大于體積測量,而且相對于二維的直徑,三維的體積(可以通過AI實現(xiàn))可能對于PN的大小變化會更敏感,利用體積建立預(yù)測模型可能比直徑效果更好。
從圖1中可見,結(jié)節(jié)B比結(jié)節(jié)A直徑僅變化了10%,但是其體積卻增大了33.1%;結(jié)節(jié)D相較于結(jié)節(jié)C直徑只增加了2 mm,但體積幾乎增加了
圖1 肺結(jié)節(jié)模擬圖
一倍,這從視覺效果上就有非常明顯的區(qū)別了。結(jié)節(jié)直徑的測量通常只是基于一個掃描層面,相較體積測量存在較大的誤判可能性;而且大多情況下PN并不是完美的球形,測量出的直徑不能有效代表其體積。故采用體積進行分類管理可能會比直徑更具敏感性,可以盡量縮短惡性結(jié)節(jié)患者確診的時間,增加患者的生存率。
研究發(fā)生PN的危險因素,可以為其一級和二級預(yù)防提供線索及依據(jù)。PN的發(fā)生和諸多因素相關(guān),例如年齡、吸煙、家族及個人腫瘤史等。目前建立的數(shù)學(xué)模型其預(yù)測效能依然欠佳,而且各地區(qū)之前建立的模型可能相互之間并不適用,如相較于歐美,亞洲結(jié)核病發(fā)病率更高,由于肺結(jié)核好發(fā)于肺上葉,也會有PN的影像學(xué)特征,故在模型中納入是否位于上葉,可能在亞洲地區(qū)并不適用。而且用于建立模型的人群中,其惡性結(jié)節(jié)占比太大,可能不適用于廣大的體檢人群。所以還需要更多的多中心數(shù)據(jù)去完善模型,改善其靈敏度和特異度。
利用AI建立的程序模型有一定的前景,目前已用于輔助放射科醫(yī)師的診斷,AI可以幫助其加快診斷的進程,減少因?qū)Υ罅酷t(yī)學(xué)圖像進行分類而導(dǎo)致的精神疲勞。并且可以綜合各方面的數(shù)據(jù),構(gòu)建圖形計算工具,如諾模圖。相較于結(jié)節(jié)直徑,結(jié)節(jié)體積能更加真實地反映其大小,且對其變化更具敏感性,未來在PN的管理中,體積監(jiān)測或更具前景。