王曉妍,潘麗娜,高蓓莉,徐志紅#,胡家安#
(上海交通大學醫(yī)學院附屬瑞金醫(yī)院a.住院醫(yī)師規(guī)范化培訓全科基地;b.老年病科;c.呼吸與危重癥學科,上海 200025)
全球癌癥數(shù)據(jù)分析表明,2012 年肺癌約占所有新發(fā)癌癥的13%,是導致癌癥死亡的主要原因[1]。受當前檢查方式、體檢意識、醫(yī)療資源分配等因素影響,多數(shù)肺癌患者確診時已為晚期,失去了最佳的治療時機,5 年生存率僅為19.7%[2]。2015 年,精準醫(yī)療的概念被首次提出,指應(yīng)用現(xiàn)代生物信息及遺傳技術(shù)結(jié)合患者生活環(huán)境及臨床數(shù)據(jù)等,實現(xiàn)精準的疾病診斷,并制定個性化的預防和診療方案。隨著影像技術(shù)的創(chuàng)新及人工智能的發(fā)展,影像組學(radiomics)和影像基因組學(radiogenomics)應(yīng)運而生,以此分析腫瘤影像學特征與分子表型之間的關(guān)系,增加了臨床診斷客觀性,對指導個體化治療和預后評價具有重大意義。影像組學是通過借助計算機軟件高通量地從醫(yī)學影像(CT、MRI、PET 等)中提取定量特征,然后利用統(tǒng)計學和(或)計算機學習的方法,篩選出最有價值的影像學特征,來協(xié)助臨床疾病診治的影像分析方法[3]。影像基因組學則是將基因組學與多種成像特征(如大小、體積、紋理特征等)聯(lián)系起來,用于分析腫瘤影像學特征與分子表型之間關(guān)系的影像分析方法[4]。有多項研究證實了影像基因組學在指導腦膠質(zhì)瘤等疾病診療中應(yīng)用的可行性,而本文將就影像組學與影像基因組學在肺癌診療中的應(yīng)用作一綜述。
美國國家癌癥研究所將影像組學方法的基本框架分為,①圖像數(shù)據(jù)獲取和重建;②圖像分割與繪制;③特征提取和量化;④分析建立數(shù)據(jù)庫和數(shù)據(jù)共享[5]。數(shù)據(jù)重建指利用獲取的圖像數(shù)據(jù)創(chuàng)建適當?shù)臄?shù)據(jù)集,其數(shù)據(jù)可來源于CT、MRI 等結(jié)構(gòu)性影像技術(shù),亦可來源于PET 等功能影像技術(shù),然后利用醫(yī)學圖像分割方法將圖像分割成腫瘤、正常組織和其他感興趣區(qū)。目標感興趣區(qū)域的圖像分割可通過手動、自動或半自動地完成,每種方法各有優(yōu)缺點。自動和半自動分割方法有更高的可重復性,但某些情況下不如手動分割那么精確;手動分割傾向于讀取者間的可變性,且更耗時。基于人工智能的發(fā)展,目前正在研發(fā)自動的、可重復性的快速、準確且耗時少的分割工具,如區(qū)域增長法、水平設(shè)置法、動態(tài)輪廓(蛇形)算法等[6],圖像分割完成后即可提取感興趣區(qū)域的影像特征。所提取的特征主要包括兩類,一類為定性描述的常用術(shù)語,如形狀、大小、密度、邊緣、血管生成等;另一類為定量描述病變異質(zhì)性的不可視特征,如直方圖、紋理、小波(包含低頻與高頻,L 和H)、高斯拉普拉斯算子(Laplacian-of-Gaussian,LoG)、灰度共現(xiàn)矩陣(grey level co-occurrence matrix,GLCM)、鄰域灰度色調(diào)差矩陣、灰度級區(qū)域矩陣及分形維等,需特定計算機輔助技術(shù)進行提取。已有研究證明,影像組學在阿爾茨海默病診斷研究中的應(yīng)用價值;影像組學在胰腺腫瘤等病變中的研究聚焦于腫瘤的診斷與鑒別診斷、生物學行為的評價、預后評估以及放化療的療效評估等方面,提高了對腫瘤病變的診斷效能,更精準地監(jiān)測腫瘤的進展、預測腫瘤的預后,為個體化及精準化治療作出貢獻。
在影像基因組學中,提取定性和(或)定量成像特征并與其基因組學相關(guān)聯(lián),然后運用機器深入學習算法等技術(shù)分析影像特征。深度學習卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network)可以執(zhí)行大量紋理分析和數(shù)據(jù)訓練,以創(chuàng)建預測算法,分析定量數(shù)據(jù)時考慮一個特定的臨床問題,如病變表型與腫瘤組織學或遺傳變體的相關(guān)性、良惡性組織分類、對治療反應(yīng)的預測及治療反應(yīng)的評估等,最后需要使用內(nèi)部和(或)外部數(shù)據(jù)集驗證模型對結(jié)果進行驗證。目前,基于MRI 的影像基因組學已成為乳腺癌及腦膠質(zhì)瘤精準分類的一種新興手段。
目前已有多項研究表明,基于定量成像的影像組學對于肺部良、惡性結(jié)節(jié)有一定的鑒別能力。Kamiya 等[7]的研究發(fā)現(xiàn),相比于良性結(jié)節(jié),惡性肺結(jié)節(jié)的CT 圖像密度直方圖表現(xiàn)出了更高的峰度和更低的偏度,表明CT 圖像密度直方圖的峰度和偏度可能有助于區(qū)分肺良、惡性結(jié)節(jié)。Choi 等[8]發(fā)現(xiàn),包含2 個影像組學特征——邊界框前后維和反差矩標準差的模型SVM-LASS,對診斷肺結(jié)節(jié)良、惡性的準確率更高(84.6%),邊界框前后維較大或反差矩標準差較小的肺結(jié)節(jié)更可能是惡性的。Balagurunathan 等[9]也發(fā)現(xiàn),影像組學可應(yīng)用于肺結(jié)節(jié)良、惡性的判別,且其預測惡性腫瘤的能力[其受試者工作特征曲線下面積(area under the curve,AUC)為0.85]優(yōu)于肺癌相關(guān)的臨床風險因素(AUC 為0.82),其中基于紋理的定量特征在預測癌癥狀態(tài)方面表現(xiàn)出更大的優(yōu)勢(AUC 為0.88)。Zhu 等[10]利用多變量分析,從485 個影像組定量特征中提取出5 個相關(guān)度極高的最佳影像特征,即X3_fos最大值、X0_GLCM_ 最大概率、X2_GLCM_ 集群趨勢、X6_GLCM 方差及X1_GLRLM_RLN,其AUC 分別為0.718、0.845、0.872、0.788、0.787,靈敏度分別為0.532、0.660、0.766、0.745、0.574,特異度分別為0.810、0.929、0.905、0.786、0.857,以此建立分類模型分析其與腫瘤組織學分型的相關(guān)性,并驗證該模型可良好的區(qū)分肺腺癌和鱗狀細胞癌,其AUC 為0.905,靈敏度為0.830,特異度為0.929。也有研究發(fā)現(xiàn),影像組學可應(yīng)用于肺癌放療、化療及免疫治療反應(yīng)的預測與監(jiān)測[11]。盡管各組之間的研究對象缺乏一致性,但影像組學在肺癌診斷中的可應(yīng)用性是有目共睹的,這將支持影像組學在臨床腫瘤診療中的進一步應(yīng)用。
一些分子遺傳學標志物在腫瘤發(fā)生過程中起著重要作用。既往基因組研究顯示,肺癌的驅(qū)動基因包括表皮生長因子受體(epidermal growth factor receptor,EGFR)、kirsten 鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)、c-ros原癌基因1、轉(zhuǎn)染重排(rearranged during transfection,RET)基因等,其中EGFR 突變最早被發(fā)現(xiàn),近年來針對ALK 重排及KRAS 突變的研究逐漸增加。
1.EGFR 突變及其亞型:Gevaert 等[12]發(fā)現(xiàn),腫瘤邊緣明顯不規(guī)則(毛刺、分葉或邊界不清)與EGFR 突變相關(guān),野生型EGFR 腫瘤與肺氣腫及氣道異常有關(guān),利用包含肺氣腫、氣道異常、毛玻璃成分百分比和腫瘤邊緣類型4 個變量的預測模型,預測EGFR 突變狀態(tài)的AUC 為0.89。一項薈萃分析則表明,腫瘤大小、空洞、支氣管充氣征、分葉和毛刺征單獨均未顯示出與EGFR 突變間具有統(tǒng)計學相關(guān)性,但亞實性病灶傾向于存在EGFR 突變[13],這可能為患者正確選擇分子靶向治療提供重要線索。在應(yīng)用多參數(shù)建模和定量成像后,Sacconi等[14]發(fā)現(xiàn),CT 值均數(shù)≤4.77、標準差≥93.18 及偏度≥0.72 與晚期肺腺癌EGFR 突變相關(guān)(P 值分別為0.000 1、0.000 1、0.045 9)。外顯子19 和21 缺失是肺腺癌中EGFR 突變最常見的亞型,以及無進展生存期和腫瘤反應(yīng)的最強預測生物標志物。Zhao 等[15]校正了年齡、性別和吸煙史后發(fā)現(xiàn),支氣管充氣征是EGFR 外顯子19 缺失的獨立預測因子(P=0.007)。Shi等[16]發(fā)現(xiàn),與EGFR 外顯子19 缺失相關(guān)的影像特征包括腫瘤較小[平均直徑為(28.51±14.07)mm](P<0.000 1)、胸膜凹陷征(P=0.003 4)及肺無纖維化(P<0.000 1),而毛刺(P=0.009 5)、亞實性病灶(P<0.000 1)與外顯子21 突變相關(guān)。
2.ALK 重排、KRAS 突變等:Rizzo 等[17]研究發(fā)現(xiàn),支氣管充氣征、胸膜凹陷與EGFR 突變相關(guān),胸腔積液與ALK 重排相關(guān),圓形病灶及非腫瘤所在肺葉結(jié)節(jié)則與KRAS 突變相關(guān)。Wang 等[18]研究了經(jīng)病理證實的Ⅰ期肺腺癌患者的CT 特征與KRAS 突變間的關(guān)系,發(fā)現(xiàn)毛刺征與KRAS 突變相關(guān)。在應(yīng)用多參數(shù)建模和定量成像后,Rios Velazquez 等[19]觀察了763 例肺腺癌患者的26 個影像組學特征,單因素分析顯示,LHL 方差、HLL GLCM 和熵、LoG3 GLCM 逆方差、LoG3 RLGL短期強度及HHH RLGL 長期強度等16 個特征與EGFR 突變相關(guān),提示發(fā)生EGFR 突變的腫瘤更不均質(zhì),且LHL 方差、HLL GLCM 和熵、LoG3 RLGL 短期強度、中位數(shù)、LoG3 GLCM反方差、HHH GLCM 相關(guān)及LLL 總能量等14 個影像組學特征可區(qū)分EGFR 突變陽性及KRAS 突變陽性病例(AUC=0.80),如LLL 總能量在EGFR 突 變的腫瘤中不足,而在KRAS 突變的腫瘤中則過高。當結(jié)合由年齡、性別、吸煙狀況、種族和臨床分期組成的臨床特征預測模型(AUC=0.81)可顯著提高預測的準確率(AUC=0.86,特異度為87%,準確率達79%)。Yoon 等[20]使用影像組學方法對47 例ALK 重排型及17 例c-ros 原癌基因1 或RET 陽性患者進行分析,結(jié)果顯示,ALK 重排型病變具有臨床分期晚、中央型、最大標準攝取值更高且1、2、3 體素距離同質(zhì)及2 體素距離總均值較大的特點(P=0.042、0.017、0.005、0.030、0.023、0.028 和0.049)。Plodkowski 等[21]研究發(fā)現(xiàn),RET 陽性組肺腺癌患者的CT 特征與EGFR 突變組相似,病灶多位于中心,c-ros 原癌基因1 重排組患者的病灶則多見于肺周邊部。
雖然目前結(jié)果統(tǒng)一性相對較差,但都表明影像基因組學在肺癌診療中應(yīng)用的可行性,期待未來大樣本的多中心研究明確影像組學與基因組學之間聯(lián)系,進一步指導個體化治療。
1.治療療效預測:EGFR 基因突變的發(fā)現(xiàn)及其酪氨酸激酶抑制劑(tyrosine kinase inhibitor,TKI)的成功應(yīng)用,開啟了晚期非小細胞肺癌靶向治療的時代。隨著研究的不斷深入和拓展,多種分子驅(qū)動基因陸續(xù)被發(fā)現(xiàn),對這些特定突變位點的靶向藥物及個體化治療也逐漸進入臨床。有研究通過分析敏感者的病理標本發(fā)現(xiàn),EGFR-TKI 治療有效與EGFR 激酶結(jié)構(gòu)域突變有關(guān)。所以不少學者將目光置于影像組學及影像基因組學對肺癌分子靶向治療療效的預測。Aerts 等[22]在2014 年利用描述圖像強度、形狀、紋理及多尺度小波這4 項特征,從119 例肺癌及頭頸癌患者的CT 特征中提取了440 個定量影像特征,發(fā)現(xiàn)一些定量影像特征與患者的預后密切相關(guān),進一步利用基因富集方法分析發(fā)現(xiàn)預后相關(guān)定量影像特征能夠捕獲腫瘤內(nèi)異質(zhì)性,可能與潛在基因表達模式相關(guān),如HLH、RLGL 小波灰階不均與基因表達中的蛋白質(zhì)復雜結(jié)合相關(guān),RLGL 灰階不均與DNA 重組相關(guān)。隨后,其團隊在2016 年觀察了47 例早期非小細胞肺癌患者使用吉非替尼治療前、后的影像組學特征,發(fā)現(xiàn)治療前的影像組學特征Laws_Energy-10 及Gabor_Energy-dir135-w3(AUC=0.67 及0.74,P=0.03 及0.0003)能夠預測TKI 敏感性EGFR 突變,治療后Gabor_Energy-dir135-w3 的增加與吉非替尼治療效果較佳相關(guān),證明基于影像學的表型分型可用于TKI 敏感與耐藥患者群體之間的分類和治療反應(yīng)的預估[23]。Yamamoto 等[24]的一項多中心回顧性研究收集了47 例ALK 重排型病例及125 例ALK 野生型病例,對其24 項CT 特征及6 項臨床特征進行分析,結(jié)果顯示<60 歲及中央型、胸膜尾缺失、大量胸腔積液對預測ALK 重排具有一定價值,ALK 重排目前為公認的小分子ATP 競爭性TKI——克唑替尼的治療靶點,研究各特征與克唑替尼治療療效的相關(guān)性時發(fā)現(xiàn),腫瘤增大、邊緣形狀發(fā)生變化及腫瘤周圍出現(xiàn)紊亂的血管征象提示療效不佳,表明可以此模型識別對克唑替尼治療效果不佳的患者。
2.生存及復發(fā)預測:Lee 等[25]研究EGFR 相關(guān)臨床Ⅰ期非小細胞肺癌患者18F-FDG-PET/CT 特征時發(fā)現(xiàn),在最大標準攝取值>5.0,直徑>2.43 cm,磨玻璃模糊度≤50%的腫瘤中,EGFR 過表達更顯著,同時利用Cox 比例風險模型進行多變量分析顯示,最大標準攝取值>4.0 及腫瘤內(nèi)空洞表現(xiàn)是預后不良的相關(guān)因素。Mattonen 等[26]研究了45 例早期肺癌患者放療后6 個月內(nèi)的CT 增強圖像,發(fā)現(xiàn)5 個影像組學特征(最小灰度、GLCM 同質(zhì)、GLCM 相關(guān)、GLCM 能量、灰階均勻)對局部復發(fā)具有良好的鑒別能力,其組成預測模型的AUC 為0.85,假陽性率為24%,假陰性率為23%。表明建立一個基于影像組學的臨床決策支持系統(tǒng),可能對肺癌患者放療后早期復發(fā)的盡早干預具有指導意義。Coroller 等[27]從肺腺癌CT 增強圖像中基于小波偏斜度、GLCM 簇狀陰影及LoG 偏斜度3個特征提取了635 個影像組學特征進行分析及驗證,嚴格根據(jù)可信區(qū)間>0.6 和偽發(fā)現(xiàn)率<5%的標準,發(fā)現(xiàn)35 個特征與遠處轉(zhuǎn)移具有相關(guān)性,LHL 小波偏度、LoG_sigma 5_mm_2D偏度、LoG_sigma_2_mm_2D 峰度、LoG_sigma_2_mm_3D 標準差及LoG_sigma_2_mm_3D 熵等12 個特征與高生存率有相關(guān)性,提示該影像組學特征模型可能為臨床提供腫瘤是否轉(zhuǎn)移及患者生存期等相關(guān)信息,這與Starkov 等[28]研究結(jié)果一致。Chaddad 等[29]發(fā)現(xiàn)基于3 種不同類型的紋理特征,GLCM、NGTDM 鄰域灰度色調(diào)差矩陣和GLZM 灰度級區(qū)域矩陣的預測模型可用作非小細胞肺癌患者的生存預判指標。按病理分型及TNM 分期研究發(fā)現(xiàn),在大細胞癌中有5 個影像組學特征(粗糙度、紋理強度、灰階不均、區(qū)域大小不均和表面積)、T2期腫瘤中8 個特征(相關(guān)度、粗糙度、紋理強度、大區(qū)域/高灰階強度、灰階不均、區(qū)域大小不均、體積和表面積)、N0期患者中6 個特征(相關(guān)度、相異度、紋理強度、大區(qū)域/高灰階強度、灰階不均和表面積)、Ⅰ期肺癌患者中11 個特征(相關(guān)度、逆矩、相異度、粗糙度、紋理強度、大區(qū)域/高灰階強度、灰階不均、區(qū)域大小不均、區(qū)域大小百分比、分數(shù)衍射和表面積)與生存時間相關(guān),相關(guān)系數(shù)r 的絕對值介于0.30~0.49,各組中灰階不均值、區(qū)域大小不均值及大區(qū)域/高灰階強度低于中位數(shù)時一般提示較高的生存率。
可見,影像組學與影像基因組學對肺癌患者生存及預后評估有一定的指導意義,未來可作為肺癌患者一種相對價格低廉、無創(chuàng)性的復查的監(jiān)測手段。
在當前精準醫(yī)療的時代,雖然遺傳基因組學提高了個體化治療的精準性,但其成本很高,且臨床推廣有限,影像基因組學涉及定性和(或)定量成像的表型對特定遺傳圖譜特性進行識別,具有指導治療決策的選擇,改善治療效果的潛力,并且具有無創(chuàng)性及價格相對低廉的優(yōu)點,這也使其有機會成為多次評估治療反應(yīng)的手段。影像學和影像基因組學可以極大地改變醫(yī)學實踐,特別是在腫瘤學方面。肺癌分子遺傳學特性與多種影像技術(shù)的結(jié)合將是未來肺癌分子診斷與治療的必然趨勢。但關(guān)于肺癌影像基因組學的研究尚處于起步階段,目前尚存在局限性,如樣本量小,圖像分割可重復性差,影像分析標準難以統(tǒng)一,資源共享受限,以及缺乏大數(shù)據(jù)支持等,限制了其發(fā)展,未來需要開展技術(shù)推廣培訓以及多中心臨床研究。相信隨著數(shù)據(jù)庫建設(shè)的日益完善與機器學習新算法的出現(xiàn),腫瘤定量成像在診斷、治療反應(yīng)和預測預后等方面的潛能將被進一步發(fā)掘出來。