包陳政任 張 榕 陳新杰 劉子蔚 胡秋根,*
1.南方醫(yī)科大學(xué)順德醫(yī)院附屬陳村醫(yī)院(佛山市順德區(qū)第一人民醫(yī)院附屬陳村醫(yī)院)放射科 (廣東 佛山 528313)
2.南方醫(yī)科大學(xué)順德醫(yī)院(佛山市順德區(qū)第一人民醫(yī)院)放射科 (廣東 佛山 528308)
肺癌是全球癌癥發(fā)病率第二、死亡率最高的腫瘤,其中肺腺癌是最常見的病理組織學(xué)類型[1]。根據(jù)2021年WHO肺腫瘤最新分類,將肺腺癌分為腺體前驅(qū)病變和浸潤性肺腺癌,其中前者包括不典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)和原位癌(adenocarcinoma in situ,AIS),后者包括微浸潤性肺腺癌(minimally invasive adenocarcinoma,MIA),浸潤性肺腺癌(invasive nonmucinous adenocarcinoma,IAC)[2]。不同病理組織學(xué)亞型,臨床處理方式不同,腺體前驅(qū)病變預(yù)后良好,主要以隨訪監(jiān)測為主[3]。MIA具有微浸潤性,IAC患者的復(fù)發(fā)率較高,預(yù)后較差,兩者通常采用肺葉切除術(shù)治療[4-6],因此,術(shù)前區(qū)分腺體前驅(qū)病變與浸潤性肺腺癌可以幫助臨床醫(yī)生對肺磨玻璃結(jié)節(jié)(ground glass nodule,GGN)進(jìn)行評估,以改善臨床決策并避免過度治療或治療不足。
影像學(xué)特征(如分葉征、毛刺征、空氣支氣管征、胸膜牽拉征、月牙征[7]、微血管穿行征等)與GGN的浸潤性有關(guān)[8-9],這些都為主觀特征,個(gè)人診斷水平及臨床經(jīng)驗(yàn)對GGN的評估存在差異性,并且對于較小的GGN,影像征象不顯著。影像組學(xué)是指從影像圖像中提取大量圖像特征的高通量,并可以通過機(jī)器學(xué)習(xí)方法,以量化腫瘤組織的特征,并提供腫瘤詳細(xì)和全面的影像組學(xué)特征[10-11]。與傳統(tǒng)的生物標(biāo)志物相比,基于影像組學(xué)是三維特征,圖像采集過程易于執(zhí)行,無創(chuàng)且成本低[12]。一些研究表明,基于影像組學(xué)的特征通過使用不同的醫(yī)學(xué)成像方式,如:CT,磁共振成像(MRI)和正電子發(fā)射斷層掃描(PET-CT)來區(qū)分腫瘤亞型的價(jià)值[13-16]。
本研究的目的是探討基于CT影像組學(xué)特征區(qū)分腺體前驅(qū)病變與浸潤性肺腺癌的能力,并開發(fā)一種結(jié)合CT影像組學(xué)和臨床放射學(xué)特征的Nomogram圖,以提供個(gè)性化、術(shù)前評估GGN患者的無創(chuàng)預(yù)測工具。
1.1 臨床資料回顧性收集在南方醫(yī)科大學(xué)順德醫(yī)院2018年5月2022年7月經(jīng)手術(shù)后的219例GGN患者臨床、影像及病理資料。
納入標(biāo)準(zhǔn):GGN<30mm;術(shù)前常規(guī)做胸部CT檢查;具有完整的影像、臨床及病理資料。排除標(biāo)準(zhǔn):圖像顯示不清,病理不明確;術(shù)前經(jīng)過肺結(jié)節(jié)治療(如放化療、靶向藥物等腫瘤相關(guān)性治療);存在其他腫瘤患者。該研究得到了南方醫(yī)科大學(xué)順德醫(yī)院醫(yī)學(xué)倫理委員會(huì)批準(zhǔn)。
1.2 圖像采集所有患者都進(jìn)行全肺CT掃描,掃描儀器為Toshiba Aquilion Prime 80排、Siemens Smoatom Definition AS 64排和Siemens Smoatom Definition Flash 64排多層螺旋CT掃描儀。掃描方式:所有患者掃描前進(jìn)行呼吸訓(xùn)練,深吸氣后屏住氣進(jìn)行全肺掃描。掃描參數(shù)如下:管電壓:120KV,管電流:250~300mA,F(xiàn)OV:350~400mm,螺距:0.81.0,準(zhǔn)直:0.6×128,重建厚度:0.6mm~1mm,掃描結(jié)束后進(jìn)行圖像多平面重建,并將圖像傳輸至PACS系統(tǒng)。
1.3 圖像分析及影像組學(xué)特征提取由兩位具有15年影像診斷經(jīng)驗(yàn)的高級職稱醫(yī)師進(jìn)行雙盲法閱片,并記錄肺結(jié)節(jié)的影像學(xué)特征,如GGN的大小、GGN的密度,分葉征、胸膜牽拉征、毛刺征、微血管穿行征、空泡征、空氣支氣管征、月牙征,遇到分歧時(shí),由第三位具有20年影像診斷經(jīng)驗(yàn)的高級職稱醫(yī)師進(jìn)行閱片,協(xié)商一致方式解決。
肺結(jié)節(jié)靶區(qū)勾畫由具有15年影像診斷經(jīng)驗(yàn)的醫(yī)師使用深睿軟件(https://keyan.deepwise.com/login)進(jìn)行感興趣區(qū)(volume of interesting,VOI)半自動(dòng)勾畫,使用方法如下:將影像圖像(DICOM格式)傳輸至深睿軟件系統(tǒng),并在肺結(jié)節(jié)每個(gè)層面沿邊緣進(jìn)行勾畫,避開血管、支氣管、心臟、胸膜等區(qū)域,并由另一位具有20年影像診斷經(jīng)驗(yàn)的高級職稱醫(yī)師進(jìn)行確認(rèn),肺結(jié)節(jié)感興趣區(qū)勾畫后,使用開源PyRadiomics軟件包從每個(gè)結(jié)節(jié)中提取了總共2107個(gè)影像組學(xué)特征。
1.4 影像組學(xué)模型構(gòu)建按照7:3的比例隨機(jī)分為訓(xùn)練組和驗(yàn)證組。為了避免模型擬合過度和提高模型的泛化性,我們對提取的影像組學(xué)特征進(jìn)行了由粗到細(xì)的特征篩選。首先,使用組內(nèi)及組間相關(guān)系數(shù)法進(jìn)行特征篩選;其次,進(jìn)行獨(dú)立樣本T檢驗(yàn)或秩和檢驗(yàn),選擇兩組之間的顯著特征,以P<0.05為顯著,保留1381個(gè)顯著特征。隨后,進(jìn)行Pearson或Spearman相關(guān)性分析,以降低特征之間冗余度,刪除相關(guān)性大于0.6的特征,最終保留45個(gè)低相關(guān)的特征。最后,為了防止模型出現(xiàn)過度擬合的現(xiàn)象,我們利彈性網(wǎng)絡(luò)用(Elastic net)-logistic算法對重要建模特征進(jìn)行篩選,具體公式如下:
Note:λ控制懲罰項(xiàng)的大小,α控制兩種誤差項(xiàng)(L1和L2)的權(quán)重。
進(jìn)一步得到影像組學(xué)特征的最優(yōu)子集,此為AAH/AIS和MIA/IAC的評估構(gòu)建影像組學(xué)特征。每個(gè)GGN的影像組學(xué)得分(Radscore)是通過所選特征的線性組合計(jì)算的,這些特征由各自的系數(shù)加權(quán),并根據(jù)Logistic回歸算法,建立最終的影像組學(xué)模型(Radiomic model)(圖1A、C)。
1.5 臨床特征篩選及模型構(gòu)建采用單因素Logistic回歸篩選P<0.05的臨床-影像特征,再根據(jù)赤池信息量準(zhǔn)則(akaike information criterion,AIC),通過向前/向后逐步Logistic回歸得到AIC最小的臨床模型。
1.6 構(gòu)建聯(lián)合模型及模型性能評估采用Logistic回歸算法,將重要的臨床特征和Radscore整合,構(gòu)建臨床-放射組學(xué)聯(lián)合模型(combined model),并使用ROC曲線評估模型性能。
1.7 統(tǒng)計(jì)分析計(jì)量資料符合正態(tài)分布采用()表示,計(jì)數(shù)資料采用百分比(%)表示。連續(xù)變量采用獨(dú)立樣本T檢驗(yàn)或秩和檢驗(yàn),分類變量采用卡方檢驗(yàn)。采用受試者工作特征(ROC)曲線下面積(AUC)評價(jià)模型的性能。所有統(tǒng)計(jì)分析均使用R語言(4.2.1)軟件進(jìn)行。P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
2.1 臨床資料和放射學(xué)特征比較本研究納入了南方醫(yī)科大學(xué)順德醫(yī)院的219例單發(fā)GGN患者的術(shù)前資料,其中男性52例(23.74%),女性167例(76.26%)。兩組之間性別、年齡、空泡征、空氣支氣管征、瘤肺邊界、微血管穿行、GGN密度、GGN位置均無統(tǒng)計(jì)學(xué)意義(P>0.05),月牙征、分葉征、毛刺征、胸膜牽拉征、GGN長度和CT值具有統(tǒng)計(jì)學(xué)意義(P<0.05)(表1)。
表1 兩組GGN患者影像特征及臨床資料比較
2.2 影像組學(xué)特征篩選和影像組學(xué)得分建立經(jīng)過從粗到細(xì)的特征篩選,共獲得9個(gè)非零系數(shù)特征,根據(jù)公式計(jì)算每位患者的Radscore,(Radscore=0.1689×log.sigma.4.0.mm.3D_glszm_SmallAreaEmphasis+0.0321×log.sigma.5.0.mm.3D_glszm_SmallAreaEmphasis+0.1981×lbp.3D.k_firstorder_Skewness-0.0812×lbp.2D_firstorder_10Percentile-0.1195×bp.3D.k_glcm_Imc2-0.0896×log.sigma.2.0.mm.3D_firstorder_90Percentile-0.0770×log.sigma.2.0.mm.3D_glszm_SmallAreaLowGrayLevelEmphasis-0.0579×square_glszm_GrayLevelNonUniformityNormalized-0.0632×wavelet.LLL_gldm_LargeDependenceLowGrayLeve lEmphasis),并構(gòu)建最終的影像組學(xué)模型(Radiomic model),模型在訓(xùn)練組中的AUC為0.806(95% CI:0.7350.874),驗(yàn)證組中AUC為0.814(95% CI:0.7030.913)(圖2A、B)。
2.3 臨床模型的建立由單因素Logistic分析可知,GGN長度,CT值、毛刺征、月牙征、胸膜牽拉征等臨床和影像學(xué)特征與肺結(jié)節(jié)病理侵襲性顯著相關(guān)(P<0.05)。然后,通過基于AIC的向前/向后逐步回歸分析,得到最優(yōu)臨床模型(clinical model)(表2)。臨床模型在訓(xùn)練組中的AUC為0.753(95% CI:0.6740.828),驗(yàn)證組中模型的AUC為0.742(95% CI:0.6210.851)(圖2A、B)。
表2 基于AIC準(zhǔn)則的逐步回歸分析結(jié)果
2.4 聯(lián)合模型建立、性能評估及臨床應(yīng)用結(jié)合臨床-影像獨(dú)立危險(xiǎn)因素和radscore,運(yùn)用Logistics算法構(gòu)建臨床-放射組學(xué)聯(lián)合模型(combined model)。Combined model模型在訓(xùn)練組中的AUC為0.843(95% CI:0.8040.898),驗(yàn)證組中AUC為0.869(95%CI:0.8480.927)(圖2A、B),這表明combined model模型預(yù)測GGN的病理浸潤性比radiomic model、clinical model具有更好的鑒別性能。同時(shí)采用Nomogram圖(圖2C)可視化該模型,nomogram圖包括radscore和CT值、胸膜牽拉征、月牙征。校準(zhǔn)曲線顯示預(yù)測概率與實(shí)際概率關(guān)系密切(圖3A、B),表明預(yù)測的可靠性高。臨床決策曲線(DCA)表明,使用combined model預(yù)測GGN病理浸潤性比其它兩個(gè)模型具有更多收益。
近年來,肺磨玻璃結(jié)節(jié)的檢出率大幅提高,但其良惡性鑒別仍存在較大的困難,特別是對浸潤性的評估仍然是一個(gè)難點(diǎn)。為了更精準(zhǔn)地評估肺磨玻璃結(jié)節(jié)的浸潤性,并能用于個(gè)體化術(shù)前預(yù)測,本研究基于臨床、影像組學(xué)開發(fā)并驗(yàn)證了一個(gè)包含影像組學(xué)特征和臨床-放射學(xué)特征的nomogram模型,結(jié)果表明,該模型的鑒別性能良好,可為術(shù)前準(zhǔn)確評估GGN的病理浸潤性提供一個(gè)無創(chuàng)、迅捷工具,有利于臨床對GGN治療及管理。
腫瘤的浸潤性可以引起GGN形態(tài)學(xué)的改變,如腫瘤的長度、CT值、分葉征、毛刺征等,我們的nomogram最終納入了9個(gè)影像組學(xué)特征和3個(gè)臨床-放射學(xué)特征,在我們的研究中,CT值、胸膜牽拉征、月牙征被證明是預(yù)測GGN病理浸潤性的獨(dú)立危險(xiǎn)因素。AAH和AIS是以純磨玻璃結(jié)節(jié)為主,隨著浸潤性的增加,GGN的密度也逐漸的增加,IAC的平均CT值最高,我們的研究與She[17]的一致,表明平均CT值的增加反應(yīng)了GGN的異質(zhì)性增加,實(shí)質(zhì)成分的增加表明腫瘤向浸潤性轉(zhuǎn)變的可能性大[18]。IAC中胸膜牽拉征出現(xiàn)頻率高與其內(nèi)部實(shí)性成分收縮相關(guān),Lee等[19]的研究顯示分葉和胸膜凹陷可以鑒別浸潤性和浸潤前病變,本研究與Huang[20]等研究相似。俞慧波[7]等研究發(fā)現(xiàn),月牙征是預(yù)測純磨玻璃肺結(jié)節(jié)浸潤性的重要征象,其病理是次級小葉間隔在肺內(nèi)分布很多,組織學(xué)上是橫向排列的疏松結(jié)締組織,早期肺腺癌難以突破次級小葉間隔,腫瘤細(xì)胞從間隔不完整的肺組織附壁生長,受到小葉間隔阻擋及內(nèi)部的收縮力牽拉形成凹陷,浸潤性腺癌對周圍間質(zhì)、脈管等浸犯較腺體前驅(qū)病變更加顯著,此征象對GGN的浸潤性評估具有較高特異性,需在CT橫軸面、冠狀面及矢狀面多平面重組圖像上連續(xù)觀察,在我們的研究中,月牙征為預(yù)測GGN的獨(dú)立危險(xiǎn)因素,并納入了nomogram模型中。腫瘤大小一直是評估GGN浸潤性的一個(gè)重要的征象,但是在我們的研究中不是獨(dú)立危險(xiǎn)因素,我們分析其原因可能是因?yàn)槲覀冄芯康腉GN較小,測量存在誤差,也有研究認(rèn)為,鑒別浸潤前肺腺癌與浸潤性肺腺癌的診斷閾值尚無統(tǒng)一定論。部分學(xué)者指出,瘤肺邊界在AAH/AIS組和MIA/IAC組間無顯著差異[21-22],在本研究中,瘤肺邊界不是作為評估GGN病理浸潤性的獨(dú)立危險(xiǎn)因素,后續(xù)需進(jìn)一步擴(kuò)大樣本來證實(shí)瘤肺邊界在與GGN病理浸潤性之間的關(guān)系??张菡?、空氣支氣管征、毛刺征及微血管穿行征不是預(yù)測GGN病理浸潤性的獨(dú)立危險(xiǎn)因素,GGN都是圓形、類圓形,因此存在毛刺征較少,其在預(yù)測GGN浸潤性存在一定的商議,也有研究認(rèn)為[23-24],空泡征、空氣支氣管征和毛刺征不足以作為GGN浸潤性的特異性征象。有研究表明[25],GGN內(nèi)血管的發(fā)生率主要與其大小及結(jié)節(jié)與胸膜的距離有關(guān),而與其病理性質(zhì)無關(guān),早期肺腺癌中微血管的存在,不是其浸潤性的一個(gè)特異特征。
本研究中影像組學(xué)模型由9個(gè)影像學(xué)特征組成,包括紋理特征及一階特征,紋理特征描述了VOI內(nèi)像素強(qiáng)度的空間關(guān)系,并進(jìn)一步分為灰度區(qū)域大小矩陣(GLSZM,n=4)、灰度共生矩陣(GLCM,n=1)、灰度依賴矩陣(GLDM,n=1),它們都是二階及高級紋理特征,這些特征能夠反應(yīng)圖像體素之間空間排列關(guān)系,既往有研究表明紋理特征對GGN輪廓的變化表現(xiàn)最穩(wěn)定,可用于區(qū)分浸潤前病變和浸潤性肺腺癌[26-27],CT像素灰度強(qiáng)度與GGN浸潤性具有相關(guān)性,像素越高,表明紋理的異質(zhì)性越大。Firstorder是一階特征,其描述VOI的強(qiáng)度直方圖特征,在我們的研究中存在4個(gè)一階特征,表明其對GGN的浸潤性敏感度較高。利用ROC曲線下面積評估三個(gè)模型的性能,聯(lián)合模型預(yù)測GGN病理浸潤性具有更好的鑒別性能,在訓(xùn)練組中AUC為0.843(95% CI:0.804~0.898),驗(yàn)證組中AUC為0.869(95% CI:0.848~0.927),我們使用nomogram圖對模型的變量進(jìn)行可視化,從而可以協(xié)助臨床醫(yī)生更易理解模型,并確定是否需要手術(shù)治療或隨訪監(jiān)測,為診斷GGN是否存在浸潤性提供輔助參考意見。
本研究具有一定的局限性。首先,本研究中的GGN來自三個(gè)不同的掃描儀器,由于掃描參數(shù)不同,可能會(huì)存在潛在的影響。其次,對GGN進(jìn)行感興趣區(qū)勾畫,部分血管、支氣管等不可避免的包括在內(nèi),從而對影像組學(xué)特征提取可能存在一定影響。第三,本研究為回顧性研究,收集數(shù)據(jù)具有一定偏倚。
綜上所述,本研究開發(fā)并驗(yàn)證了一個(gè)nomogram模型,結(jié)合了臨床及影像組學(xué)特征,可以有效評估GGN的病理浸潤性,nomogram模型可以作為指導(dǎo)臨床醫(yī)生個(gè)體診斷和選擇最佳干預(yù)措施的潛在工具。