李保勛,彭雨琴,覃尉峰,肖芳,黎浩江,陳俊偉,李佳凝,胡芷瑄,毛家驥,沈君*
腦轉(zhuǎn)移瘤是最常見的顱內(nèi)惡性腫瘤[1-2],其發(fā)生率是顱內(nèi)原發(fā)惡性腦腫瘤的10倍[3],且發(fā)病率隨著影像檢查手段的發(fā)展與患者生存期的延長仍在持續(xù)上升[4]。肺癌是腦轉(zhuǎn)移瘤最常見的原發(fā)腫瘤來源[5]。肺癌腦轉(zhuǎn)移患者預后很差,接受放療、化療、手術治療等常規(guī)療法后的無進展生存期為4~5個月[6-7]、總生存期僅為4~15 個月[8]。針對存在表皮生長因子受體(epidermal growth factor receptor, EGFR)基因突變的肺癌腦轉(zhuǎn)移患者,采用表皮生長因子受體酪氨酸激酶抑制劑(epidermal growth factor receptor-tyrosine kinase inhibitor, EGFR-TKI)進行靶向治療能夠顯著改善患者的預后及生存[9-11],將患者無進展生存期延長至10.0~16.5 個月[6,12],總生存期延長至25 個月[13]。然而,明確腦轉(zhuǎn)移瘤的EGFR 基因突變狀態(tài)需要對腦轉(zhuǎn)移瘤進行活檢或手術切除后病理學檢測,這對患者創(chuàng)傷很大,可能會導致術后出血、肺栓塞和腦脊液漏等嚴重并發(fā)癥[14-15]。另一種替代方案是直接根據(jù)肺癌原發(fā)灶的EGFR 基因突變狀態(tài)判斷腦轉(zhuǎn)移瘤的EGFR 基因突變狀態(tài)。然而,既往研究發(fā)現(xiàn),高達63%肺癌原發(fā)灶與腦轉(zhuǎn)移瘤之間的EGFR 基因突變狀態(tài)并不一致[16-18]。目前有數(shù)項利用頭顱MRI 圖像的人工智能手段預測肺癌腦轉(zhuǎn)移瘤EGFR 基因突變狀態(tài)的研究,但是部分研究默認腦轉(zhuǎn)移瘤EGFR 基因突變狀態(tài)與肺癌的EGFR 基因突變狀態(tài)一致,并未對腦轉(zhuǎn)移瘤進行基因檢測[19-20],這將極大地影響模型構(gòu)建的準確性。還有部分研究為單中心研究,沒有對模型進行外部測試[21-22],導致模型的泛化能力存疑。如何無創(chuàng)、精準預測肺癌腦轉(zhuǎn)移瘤的EGFR 基因突變狀態(tài),對于篩選EGFR-TKI 靶向治療的潛在受益患者,改善肺癌腦轉(zhuǎn)移瘤患者的預后具有重要價值,仍有待進一步研究。本研究旨在開發(fā)和驗證基于肺癌腦轉(zhuǎn)移瘤多參數(shù)MRI 影像組學預測模型,探索模型在無創(chuàng)預測肺癌腦轉(zhuǎn)移瘤EGFR 基因突變狀態(tài)的價值,為肺癌腦轉(zhuǎn)移患者提供個體化治療管理。
本研究為多中心回顧性研究,本研究遵循《赫爾辛基宣言》對倫理學的要求,經(jīng)中山大學孫逸仙紀念醫(yī)院醫(yī)學倫理委員會、中國科學技術大學附屬第一醫(yī)院(安徽省立醫(yī)院)醫(yī)學研究倫理委員會和中山大學腫瘤防治中心倫理委員會批準,免除受試者知情同意,批準文號:SYSKY-2022-314-01、2022-RE-283、B2002-520-01。回顧性分析2016 年12 月至2021 年10 月在中山大學孫逸仙紀念醫(yī)院、中山大學腫瘤防治中心、安徽省立醫(yī)院接收診治的肺癌腦轉(zhuǎn)移患者臨床及影像資料。納入標準:(1)原發(fā)腫瘤經(jīng)手術或活檢病理證實為肺癌;(2)腦腫瘤經(jīng)手術病理證實為肺癌腦轉(zhuǎn)移瘤;(3)腦轉(zhuǎn)移瘤進行了EGFR基因?qū)W檢測;(4)在腦轉(zhuǎn)移瘤手術前2 周內(nèi)進行了頭顱MRI 檢查,包括T2WI 及增強T1WI(contrast enhanced T1WI, CE-T1WI)圖像。排除標準:(1)患者臨床、病理或影像資料不全;(2)既往存在其他惡性腫瘤;(3)由于運動偽影導致MRI圖像質(zhì)量差。最終納入103例肺癌腦轉(zhuǎn)移患者,共118個腦轉(zhuǎn)移瘤,以中山大學腫瘤防治中心和安徽省立醫(yī)院80 例患者為訓練集,共89 個腦轉(zhuǎn)移瘤(EGFR突變型49個,EGFR野生型40個),中山大學孫逸仙紀念醫(yī)院23 例患者為測試集,共29 個腦轉(zhuǎn)移瘤(EGFR突變型23個,EGFR野生型6個)。
采用突變擴增系統(tǒng)(amplification refractory mutation system, ARMS)和第二代DNA 測序技術(next-generation sequencing, NGS)對腦轉(zhuǎn)移瘤組織病理切片進行EGFR基因突變狀態(tài)檢測。
中山大學孫逸仙紀念醫(yī)院入組患者檢查設備采用Philips Intera 1.5 T(荷蘭)、Philips Achieva 3.0 T(荷蘭)、Siemens Avanto 1.5 T(德國)磁共振掃描儀,安徽省立醫(yī)院入組患者檢查設備采用Philips Achieva 3.0 T(荷蘭)、Genetic electric Discover 750w 3.0 T(美國)、Siemens Avanto 1.5 T(德國),中山大學腫瘤防治中心入組患者檢查設備采用Philips Achieva 3.0 T(荷蘭)、Siemens Triotim 3.0 T(德國)、Siemens Prisma 3.0 T(德國)、Genetic electric Discover 750w 3.0 T(美國)、Genetic electric Signa HDxt 3.0 T(美國)、United imaging uMR 790 3.0 T(中國)。中山大學孫逸仙紀念醫(yī)院掃描序列及參數(shù):CE-T1WI(TR 260 ms,TE 6 ms,矩陣480×480,F(xiàn)OV 230 mm×230 mm);T2WI(TR 3 000 ms,TE 105 ms,矩陣672×672,F(xiàn)OV 230 mm×230 mm)。安徽省立醫(yī)院掃描序列及參數(shù):CE-T1WI(TR 250 ms,TE 2.3 ms,矩陣512×512,F(xiàn)OV 230 mm×230 mm);T2WI(TR 3 280 ms,TE 80 ms,矩陣672×672,F(xiàn)OV 240 mm×240 mm)。中山大學腫瘤防治中心掃描序列及參數(shù):CE-T1WI(TR 270 ms,TE 2.5、105 ms,矩 陣480×480,F(xiàn)OV 210 mm×210 mm);T2WI(TR 4 000 ms,TE 100、105 ms,矩陣352×352,F(xiàn)OV 220 mm×220 mm)。掃描層厚均為5.0 mm,層間距均為1.0 mm。采用的對比劑包括釓雙胺注射液(歐乃影,通用電氣藥業(yè)有限公司,美國)、釓噴酸葡胺注射液(馬根維顯,拜耳醫(yī)藥保健有限公司,德國)、釓噴酸葡胺注射液(廣州康臣藥業(yè)有限公司,中國)和釓布醇注射液(加樂顯,拜耳醫(yī)藥保健有限公司,德國),使用高壓注射器經(jīng)肘正中靜脈注射對比劑,注射劑量0.2 mL/kg(0.1 mmol/kg),注射速率2.5 mL/s,5 min 后采集CE-T1WI圖像。
通過電子病歷系統(tǒng)獲取患者臨床資料,包括患者年齡、性別、肺癌病理類型。通過患者影像報告獲取患者影像特征,包括腦轉(zhuǎn)移瘤數(shù)目、腦轉(zhuǎn)移瘤直徑。當腦轉(zhuǎn)移瘤數(shù)目≥2時記為多發(fā)。
頭顱MRI圖像均從各中心的影像歸檔和通信系統(tǒng)(picture archiving and communication system, PACS)導出,圖像數(shù)據(jù)以DICOM 格式保存。將數(shù)據(jù)導入ITK-SNAP 3.6.0 軟件,使用Elastix 軟件(http://elastix.isi.uu.nl/)對T2WI 和CE-T1WI 圖像進行配準。由具有3年神經(jīng)影像診斷的放射科住院醫(yī)師(醫(yī)師1)在不知患者臨床資料的情況下在CE-T1WI圖像橫斷位上逐層沿腦轉(zhuǎn)移瘤強化邊緣勾畫腦轉(zhuǎn)移瘤感興趣體積(volume of interest, VOI)并標注,將基于CE-T1WI圖像勾畫的腦轉(zhuǎn)移瘤VOI 復制并與T2WI 圖像的腦轉(zhuǎn)移瘤配準,獲得基于T2WI 圖像的腦轉(zhuǎn)移瘤VOI。兩周后,醫(yī)師1 隨機選擇數(shù)據(jù)集中30 個腦轉(zhuǎn)移瘤進行勾畫并標注,由具有11 年神經(jīng)影像診斷的放射科副主任醫(yī)師(醫(yī)師2)采用相同的方法對該30 個腦轉(zhuǎn)移瘤進行勾畫并標注。腦轉(zhuǎn)移瘤VOI 勾畫示意圖如圖1所示。
圖1 腦轉(zhuǎn)移瘤感興趣體積勾畫示意圖。CE-T1WI:增強T1WI;VOI:感興趣體積。Fig.1 Schematic diagram of volume of interest selection.CE-T1WI:contrast enhanced T1WI; VOI: volume of interest.
首先采用N4ITK 偏差校正算法,消除不同磁共振掃描儀可能存在的非生物差異,以實現(xiàn)圖像強度的標準正態(tài)分布。然后對所有圖像進行1 mm×1 mm×1 mm 體素重采樣,保證在提取三維特征時保持所有方向的均勻縮放。使用HD-BET 工具剔除顱骨后[23],采用Z-score 算法對圖像強度進行歸一化處理。使用Python 3.8.3 編寫的開源PyRadiomics 3.0.1 軟件包對圖像進行影像組學特征提取。影像組學特征包括306個一階特征,14個形態(tài)特征,1 275個二階及高階紋理特征,每位患者共提取3 190 個影像組學特征。
計算醫(yī)師自身(醫(yī)師1 第一次勾畫與醫(yī)師1 第二次勾畫)與兩名醫(yī)師間(醫(yī)師1 第二次勾畫與醫(yī)師2 第一次勾畫)影像組學特征的組內(nèi)相關系數(shù)(intra-class correlation coefficient, ICC),保留ICC>0.75的特征。然后采用最大相關最小冗余(maximum relevance minimum redundancy, mRMR)算法對特征進行降維。隨后,采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)-logistics回歸算法聯(lián)合5 折交叉驗證方法篩選出具有預測EGFR 基因突變狀態(tài)價值的特征并進行建模。根據(jù)最終篩選所得特征及其系數(shù)加權(quán)求和計算影像組學評分(radiomics score, Rad-score)。
估算影像組學模型構(gòu)建所需樣本量,根據(jù)隋蓮玉等[19]的研究,將預計曲線下面積(area under the curve, AUC)設置為0.823,并且設置犯Ⅰ類錯誤的概率不超過5%,犯Ⅱ類錯誤的概率不超過10%,假陽性率的下界設置為0,假陽性率的上界設置為1,EGFR 突變型與野生型腦轉(zhuǎn)移瘤的樣本量比例設置為1∶1,根據(jù)PASS 15 軟件樣本量估算的結(jié)果,總計需要納入30 個腦轉(zhuǎn)移瘤,其中15 個EGFR 突變型腦轉(zhuǎn)移瘤,15個EGFR野生型腦轉(zhuǎn)移瘤。統(tǒng)計學分析采用SPSS 26.0及R 4.2.2軟件進行分析。使用ICC描述VOI勾畫結(jié)果的一致性,ICC>0.75表示特征具有良好的一致性。符合正態(tài)分布的計量資料采用均數(shù)±標準差表示,采用獨立樣本t檢驗對組間差異進行評估,不符合正態(tài)分布的定量資料采用中位數(shù)(上四分位數(shù),下四分位數(shù))表示,采用Mann-WhitneyU檢驗對組間差異進行評估,定性資料采用卡方檢驗及Fisher精確檢驗對組間差異進行評估。采用受試者工作特征(receiver operating characteristic, ROC)曲線的AUC評價影像組學模型對EGFR 基因突變狀態(tài)的預測效能。采用校準曲線和Hosmer-Lemeshow(HL)檢驗評價模型校準度。采用決策曲線(decision curve analysis,DCA)對預測EGFR基因突變狀態(tài)不同閾值概率下的凈獲益進行量化,評估預測模型的臨床應用價值。P<0.05認為差異有統(tǒng)計學意義。
本研究最終納入103例患者,共118個腦轉(zhuǎn)移瘤病灶,其中訓練集肺腺癌患者79 例,小細胞肺癌患者1例;測試集肺腺癌患者17例,小細胞肺癌患者3例,肺鱗癌患者3例。訓練集和測試集的年齡、性別、病理類型、腦轉(zhuǎn)移瘤數(shù)目、腦轉(zhuǎn)移瘤直徑在EGFR突變型及野生型組間差異均無統(tǒng)計學意義(P>0.05),詳見表1。
表1 肺癌腦轉(zhuǎn)移患者基本臨床資料及影像特征Tab.1 Clinical characteristics and MRI features of lung cancer patients with brain metastases
每位患者在T2WI 及CE-T1WI 圖像上共提取3 190個影像組學特征,這些影像組學特征的醫(yī)師內(nèi)部及醫(yī)師之間ICC分別為0.798~0.981、0.776~0.961。對訓練集影像組學特征進行mRMR 及LASSO-logistics回歸分析篩選出9個影像組學特征并構(gòu)建模型,篩選出的影像組學特征包括了基于CE-T1WI序列篩選出4 個組學特征和基于T2WI 序列篩選出5 個組學特征。LASSO 回歸分析過程如圖2 所示。通過對最終篩選所得特征及其系數(shù)加權(quán)求和計算Rad-score,計算公式見式(1)。
圖2 影像組學特征篩選示意圖。黑色虛線定義為最佳λ,通過5折交叉驗證方法篩選出9個系數(shù)非0的影像組學特征。AUC:曲線下面積。Fig.2 Illustration of radiomics feature selection.The black dotted line is defined as the optimal λ, and 9 radiomics features with non-zero coefficients are selected by the 5-fold cross-validation via minimum criteria.AUC: area under the curve.
訓練集及驗證集中每例肺癌腦轉(zhuǎn)移患者的Rad-score如圖3所示。
圖3 訓練集(3A)及測試集(3B)中肺癌腦轉(zhuǎn)移患者的Rad-score。EGFR:表皮生長因子受體。Fig.3 The radiomics score of lung cancer patients with brain metastases in the training (3A) and test (3B) sets.EGFR: epidermal growth factor receptor.
影像組學模型的預測效能如圖4所示。影像組學模型在訓練集中預測EGFR 基因突變狀態(tài)的AUC 值為0.828,準確度為76.4%,敏感度為81.6%,特異度為70.0%。影像組學模型在測試集中預測EGFR基因突變狀態(tài)的AUC值為0.783,準確度為82.8%,敏感度為95.7%,特異度為33.3%。通過校準曲線驗證模型效能,組學模型訓練集和測試集的校準曲線顯示EGFR基因突變狀態(tài)的預測概率與實際概率具有較好的一致性(HL>0.05),組學模型具有較好的校準度(圖5A)。臨床決策曲線顯示組學模型在13.8%~87.2%的閾值范圍內(nèi)具有較強的臨床適用性(圖5B)。
圖4 訓練集(4A)及測試集(4B)組學模型的受試者工作特征(ROC)曲線及曲線下面積(AUC)。Fig.4 The receiver operating characteristic (ROC) curve and the area under the curve (AUC) of the radiomics model in the training (4A) and test (4B) sets.
圖5 組學模型的校準曲線(5A)和臨床決策曲線(5B)。HL:Hosmer-Lemeshow檢驗。Fig.5 The calibration curve (5A) and decision curve analysis (5B) of the radiomics model.HL: Hosmer-Lemeshow test.
本研究為多中心回顧性研究,基于MRI T2WI及CE-T1WI 圖像提取了3 190 個影像組學特征,采用mRMR 和LASSO-logistics 回歸算法篩選出9 個影像組學特征并構(gòu)建模型,并通過外部測試集驗證模型的預測效能,明確了該模型在預測腦轉(zhuǎn)移瘤EGFR基因突變情況的價值。研究結(jié)果表明,該模型可以良好地區(qū)分EGFR突變型與野生型的腦轉(zhuǎn)移瘤,可成為肺癌腦轉(zhuǎn)移患者腦轉(zhuǎn)移瘤EGFR 基因突變狀態(tài)的無創(chuàng)評估手段。
EGFR-TKI在治療EGFR突變型的肺癌腦轉(zhuǎn)移患者領域取得了令人矚目的效果[24-26],及時、準確地判斷肺癌腦轉(zhuǎn)移瘤EGFR基因突變狀態(tài)對患者后續(xù)制訂個性化治療方案至關重要[27-29]。目前在臨床上通常需要對腦轉(zhuǎn)移瘤進行侵入性活檢或手術切除才能明確腦轉(zhuǎn)移瘤的基因突變狀態(tài),但是侵入性檢查可能會導致術后出血、腦脊液漏等嚴重并發(fā)癥,對于部分無法耐受手術的患者,難以獲得準確的腦轉(zhuǎn)移瘤EGFR基因突變狀態(tài)。本研究構(gòu)建的影像組學模型預測EGFR突變型腦轉(zhuǎn)移瘤的準確率達到86.1%,取得了良好的預測效能。因此,本研究為無創(chuàng)預測肺癌腦轉(zhuǎn)移瘤的EGFR 基因突變狀態(tài),篩選EGFR-TKI 靶向治療的潛在受益患者提供了有力工具,對于改善肺癌腦轉(zhuǎn)移瘤患者的預后具有重要價值。
本研究開發(fā)的影像組學模型是根據(jù)多中心數(shù)據(jù)構(gòu)建并驗證,為了獲得準確的腦轉(zhuǎn)移瘤EGFR基因突變狀態(tài),本研究納入的患者均接受了肺癌腦轉(zhuǎn)移瘤手術切除并進行基因檢測,為腦轉(zhuǎn)移瘤本身的EGFR基因突變狀態(tài)提供了精確的數(shù)據(jù),保證了本研究構(gòu)建模型的可靠性。此外,本研究納入了所有病理類型的肺癌患者,增加了預測模型在不同病理亞型肺癌腦轉(zhuǎn)移瘤中的泛用性。
既往亦有一些利用頭顱MRI無創(chuàng)預測腦轉(zhuǎn)移瘤EGFR基因突變狀態(tài)的研究。隋蓮玉等[19]從146例肺腺癌患者腦轉(zhuǎn)移瘤的CE-T1WI、FLAIR和擴散加權(quán)成像(diffusion weighted imaging, DWI)圖像提取影像組學特征,采用多因素逐步回歸方法構(gòu)建模型,其中多序列組合模型效能最高,驗證集AUC為0.823。CHEN等[20]從110 例肺癌患者腦轉(zhuǎn)移瘤的T2WI-FLAIR 和CE-T1WI 圖像提取影像組學特征,采用隨機森林的方法構(gòu)建模型,預測EGFR 基因突變狀態(tài)的AUC 為0.912。然而,以上兩項研究均為單中心研究,缺乏對模型的外部測試,構(gòu)建模型的泛化能力及對于其他數(shù)據(jù)集的應用效能難以確定。
WANG 等[21]從52 例肺腺癌患者腦轉(zhuǎn)移瘤的CE-T1WI、T2WI、T2WI-FLAIR和DWI圖像提取影像組學特征并構(gòu)建模型,其中T2-FLAIR 模型效能最好,測試集AUC 值為0.871。JUNG 等[22]通過對74 例肺癌患者腦轉(zhuǎn)移瘤的最小ADC 值與標準化ADC 值的比值預測肺癌腦轉(zhuǎn)移瘤的基因突變狀態(tài)。以上兩項研究均只檢測了肺癌原發(fā)灶的基因突變狀態(tài),并假設肺癌原發(fā)灶與腦轉(zhuǎn)移瘤的基因突變狀態(tài)一致。既往有研究[30-31]表明,高達63%的原發(fā)性肺癌和腦轉(zhuǎn)移瘤的基因突變狀態(tài)并不一致,這可能會極大地影響以上兩項研究構(gòu)建模型的準確性。
本研究具有以下局限性:(1)本研究為回顧性研究,可能會導致選擇偏倚;(2)本研究的樣本量相對較小,尤其是非肺腺癌腦轉(zhuǎn)移瘤的患者較少,模型的效能需要更大樣本量的數(shù)據(jù)集進行驗證;(3)由于部分中心并未將DWI檢查作為腦轉(zhuǎn)移瘤的常規(guī)檢查項目,因此本研究僅從T2WI 及CE-T1WI 圖像中提取了影像組學特征。未來將基于DWI提取的影像組學特征納入預測模型,這可能會進一步提高模型的預測能力。
綜上所述,基于T2WI 及CE-T1WI MRI 影像組學特征構(gòu)建的影像組學模型在預測肺癌患者腦轉(zhuǎn)移瘤EGFR基因突變狀態(tài)中具有較高的預測效能,為肺癌腦轉(zhuǎn)移瘤患者提供一種無創(chuàng)評估腦轉(zhuǎn)移瘤EGFR基因狀態(tài)的方法,為肺癌腦轉(zhuǎn)移瘤患者個體化治療方案的選擇及臨床醫(yī)生的決策提供科學依據(jù)。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻聲明:沈君設計本研究方案,對稿件重要的智力內(nèi)容進行了修改并最后定稿,獲得了國家自然科學基金項目資助;李保勛起草和撰寫稿件,勾畫圖像VOI并提取影像組學特征,獲取、分析和解釋本研究的數(shù)據(jù);彭雨琴、覃尉峰、肖芳、黎浩江、陳俊偉、李佳凝、胡芷瑄獲取、分析或解釋本研究的數(shù)據(jù),對稿件重要的智力內(nèi)容進行了修改;毛家驥勾畫圖像VOI,分析及解釋本研究的數(shù)據(jù),對稿件重要的智力內(nèi)容進行了修改;全體作者都同意發(fā)表最后的修改稿,同意對本研究的所有方面負責,確保本研究的準確性和誠信。