張慧鑫,田興倉,馬云帆
近年來隨著胸部CT在肺癌早期篩查中大范圍的應用,越來越多的肺部磨玻璃結節(jié)(GGN)得以發(fā)現(xiàn)。GGN與早期肺腺癌密切相關[1]。肺腺癌病理亞型不同,治療和預后也不盡相同,非浸潤性肺腺癌只需要行亞肺葉切除即可達到或接近100%的五年生存率[2],而浸潤性肺腺癌(IAC)往往需要行肺葉切除及淋巴結清掃。若能在術前對GGN有一個準確的病理亞型診斷,就可以既能保證患者的預后,又能減少部分患者不必要的手術創(chuàng)傷。目前臨床上術前主要采用傳統(tǒng)的二維平面圖像特征區(qū)分GGN的病理亞型,準確性較低,不能完全達到臨床要求。而新興的影像組學方法可自動、高通量地從CT圖像中獲得GGN三維結構特征的數(shù)字信息,可提高對GGN分型的精確程度。本研究通過回顧性分析184例行手術治療且病理診斷明確的GGN,建立影像組學模型并驗證其預測GGN型肺腺癌病理亞型(IAC與非IAC)的準確性。
1.1 一般資料:收集2017年1月至2020年11月在寧夏醫(yī)科大學總醫(yī)院普胸外科手術切除GGN患者共180例,其中男性52例、女性128例,年齡范圍21~75歲,平均年齡(55.2±11.4)歲。180例患者CT影像學資料中共有GGN 184例(有4名患者有2個GGN)。以7∶3的比例將184 例GGN隨機分為訓練組及驗證組,其中訓練組有129例GGN,驗證組有55例GGN。本研究中肺腺癌病理亞型分為IAC和非IAC,非IAC包括非典型腺瘤性增生(AAH)、原位腺癌(AIS)及微浸潤性腺癌(MIA)。本研究經(jīng)寧夏醫(yī)科大學總醫(yī)院醫(yī)學科研倫理審查委員會批準(編號2020650)。
1.1.1 納入標準:①進行術前胸部CT檢查并手術治療;②胸部CT圖像肺結節(jié)顯示為GGN;③胸部CT包含1.0 mm薄層圖像;④病理診斷為肺腺癌且病灶直徑≤2 cm。
1.2 圖像采集和分割:采用PHILIPS 64、Simens Cardiac 64、GE Revolution 64螺旋CT掃描。掃描參數(shù)為管電壓120 kVp,管電流自動調節(jié),重建層厚1 mm。所有圖像掃描完成后統(tǒng)一重建為1mm厚的薄層CT圖像,采用高分辨肺算法,窗寬1500 HU,窗位700 HU。圖像分割由2名具有10年以上胸部疾病影像診斷經(jīng)驗的放射科醫(yī)生使用3D-Slicer軟件以全手動法對CT上GGN病灶感興趣區(qū)(ROI)進行勾畫。一位經(jīng)過影像組學課程培訓的放射科醫(yī)師對所有符合納入標準的樣本圖像進行兩次 ROI的勾畫,再由另一位高年資放射科醫(yī)師與勾畫醫(yī)師共同對所有的ROI進行選擇。如果兩位醫(yī)師對于感興趣區(qū)域的勾畫產(chǎn)生了不同意見,則通過二人協(xié)商決定。
1.3 放射組學特征提取及篩選:ROI勾畫完成后使用PyRadiomics工具包計算ROI內(nèi)GGN的影像組學特征。PyRadiomics中實現(xiàn)的所有五個要素都用于特征提取,包括強度特征(n=18)、紋理特征(n= 68)、形狀特征(n=14)、小波特征(n=688)及高斯特征的拉普拉斯算子(n=172),每個病變共提取960個影像組學特征。為了減少過度擬合或本研究影像組學模型中的任何類型的偏差,使用了兩個特征選擇步驟。首先,根據(jù)主要隊列中IAC組和非IAC組之間的單變量統(tǒng)計檢驗選擇最佳特征。其次將具有最小絕對收縮和選擇算子(LASSO)罰分的正則化多元邏輯回歸應用于主要隊列數(shù)據(jù)。使用LASSO算法調節(jié)權重參數(shù)λ將部分特征的系數(shù)抑制為零,從而實現(xiàn)對特征的篩選。
1.4 建立預測模型:應用支持向量機(SVM)的方法在訓練組(129例)中根據(jù)篩選出的影像組學特征建立對肺腺癌病理亞型的預測模型,并進行參數(shù)優(yōu)化,在訓練過程中通過交叉驗證的方法再次進行參數(shù)的調整。最后分別在訓練組(129例)和驗證組(55例)中算出預測靈敏度及特異度,使用受試者工作特征曲線(ROC)對模型的預測能力進行最終評估。
1.5 統(tǒng)計學方法:采用SPSS 22.0統(tǒng)計軟件,臨床資料中的計數(shù)資料采用χ2檢驗進行比較,若研究總樣本量<40或最小理論頻數(shù)<1時,則使用Fisher確切概率法。對于臨床資料及定量特征中計量資料,首先判斷這些資料能否通過正態(tài)性檢驗或方差齊性檢驗,若能通過就使用獨立樣本t檢驗,若不能通過則使用兩獨立樣本Mann-Whitney U檢驗。使用Delong檢驗比較影像組學模型及影像組學聯(lián)合定性定量特征模型間效能差異是否具有統(tǒng)計學意義。采用ROC對影像組學模型的預測性能進行評估,同時在定量評估方面使用ROC圖像的曲線下面積(AUC),以P<0.05為差異有統(tǒng)計學意義。
2.1 患者一般臨床資料單因素分析結果:性別和病變位置與GGN的病理亞型差異無統(tǒng)計學意義(P>0.05);而年齡和CT圖像結節(jié)最大直徑與GGN病理亞型之間的差異有統(tǒng)計學意義(P<0.05),見表1。
表1 患者一般臨床資料單因素分析結果
2.2 影像組學特征:從患者CT影像圖像的ROI中共提取960個影像組學特征,首先經(jīng)過t檢驗方法獲得676個影像組學特征,再經(jīng)過LASSO回歸降維方法,篩選出7個系數(shù)非0的影像組學特征,見表2。
表2 篩選后的影像組學特征
2.3 影像組學特征模型的建立及模型效能評價:根據(jù)129例訓練組的樣本數(shù)據(jù),使用進行特征篩選后所保留的7個影像組學特征來構建SVM模型, 通過計算訓練組和驗證組的ROC 曲線下面積,評估本研究所建立的影像組學模型的預測效能。最終該模型在訓練組的AUC(95%CI)值為0.94(0.89~0.99),準確度為91%、靈敏度為95%、特異度為84%;驗證組的AUC(95%CI)值為0.88(0.83~0.93),準確度為83%、靈敏度為84%、特異度為81%,見表3。此外Delong檢驗顯示在訓練組和測試組中影像組學模型的AUC差異無統(tǒng)計學意義(P>0.05),表明影像組學特征在磨玻璃結節(jié)模型對肺腺癌病理亞型預測方面具有較高的效能。
表3 影像組學模型在訓練組和驗證組的檢驗效能
本研究通過回顧性分析184例行手術治療且病理明確診斷的GGN,建立影像組學模型,并驗證其預測肺腺癌病理亞型(浸潤與非浸潤)的準確性,為在術前制定GGN型肺腺癌個體化診療策略提供了依據(jù)。
國際肺癌研究協(xié)會、美國胸科學會和歐洲呼吸學會組成的聯(lián)合工作組在2011年提出了肺腺癌的病理新分類,分別是AAH、AIS、MIA和IAC。根據(jù)新分類,腫瘤不同的侵襲狀態(tài)(IAC與AAH、AIS、MIA)對肺腺癌的預后有著顯著影響[3]。因此,GGN的定性診斷對指導臨床及預后具有重要的作用。但是與實性結節(jié)相比,GGN的病理活檢獲取非常困難,所以GGN對于影像學診斷提出了更高的要求。
影像組學又稱放射組學,2012年由荷蘭學者Lambin[4]使用CT圖像提出的一種能改善圖像分析的創(chuàng)新方法。影像組學能夠自動高通量地提取醫(yī)學圖像的數(shù)字信息,應用手動、全自動或者半自動的分割方法對醫(yī)學圖像的感興趣區(qū)域ROI進行勾畫,并從中獲取許多影像組學特征,利用不同的方法篩選出最有意義一些特征,并建立組學模型,應用于臨床診斷[5-7]、治療[8-11]、預后評估[12-14]等方面,以此實現(xiàn)疾病精準診療。影像組學中的特征與傳統(tǒng)影像圖像分析相比,最大的優(yōu)勢是能定量量化腫瘤內(nèi)的異質性,如將既往的肉眼觀察所得的結節(jié)直徑、毛刺征、分葉征、空氣支氣管征等圖像信息轉化為能體現(xiàn)結節(jié)三維結構特征的數(shù)字信息,這一優(yōu)勢提高了肺結節(jié)診斷、分型的精確程度。國內(nèi)外已有不少利用影像組學技術來診斷和預測疾病預后的研究,而對于預測GGN型肺腺癌病理亞型,目前還沒有一種影像組學模型能投入臨床使用。
本研究使用影像組學的方法提取了GGN的五大類共960個特征,通過t檢驗和LASSO 回歸,最終篩選得到7個組學特征,均屬于紋理特征,分別為1個灰度依賴矩陣特征(wavelet-HLH gldm Zone Entropy),5個灰度共生矩陣特征(wavelet-LHH glcm Imc2、wavelet-LHL glcm Maximum Probability、log-sigma-1-0-mm-3D glcm Joint Entropy、origina lglcm Cluster Tendency、wavelet-LHL glcm Joint Entropy)及1個灰度大小區(qū)域矩陣特征(wavelet-HLL glszm Small Area Low Gray Level Emphasis)。
影像組學中,圖像紋理代表ROI灰度的差異,在粗糙紋理化材料圖像的表面,高點和低點(灰度值)具有較高的變化率[15]。紋理分析與肉眼觀察CT圖像相比,可以對腫瘤異質性進行一種客觀的可量化評估[16]。灰度依賴性矩陣(GLDM)能夠量化圖像中的灰度依賴性。Zone Entropy代表區(qū)域熵,指的是測量區(qū)域大小和灰度等級分布中的不確定性或隨機性,它的值越高表示紋理圖案中的異質性越高。本研究中,經(jīng)過小波變換的區(qū)域熵越大說明紋理圖案異質性越大,越有可能為浸潤腺癌。灰度共生矩陣(GLCM)主要用來描述圖像灰度級的空間分布。Joint Entropy是聯(lián)合熵,指的是鄰域強度值中隨機性或可變性的量度,本研究結果顯示經(jīng)過小波和Log變換的聯(lián)合熵越大,該圖像越有可能是浸潤性腺癌。Maximum Probability 反映了ROI中頻率最高的相鄰灰度成對出現(xiàn)的概率,概率越小紋理模式越復雜,在本研究中,它的值越小,代表圖像紋理模式越復雜,越有可能為浸潤腺癌。Cluster Tendency代表聚類趨勢,本研究結果顯示此特征值的升高反映了浸潤性GGN的局部圖像內(nèi)部更相似,更能聚集為類。Imc2 是一個能將紋理的復雜性量化的指標,它的數(shù)值越小,越有可能為浸潤性腺癌。灰度大小區(qū)域矩陣(GLSZM)量化圖像中的灰度區(qū)域描述了圖像的區(qū)域同質和變化特性[17]。與GLCM和GLRLM不同,GLSZM與旋轉無關,僅針對 ROI 中的所有方向計算一個矩陣。Small Area Low Gray Level Emphasis測量的是圖像中較低灰度值占全部圖像的比例,本研究中它的值越小表示圖像密度較高的區(qū)域越大,可以理解為GGN的實性比例越大則越有可能為浸潤性腺癌,這一結果與Lee等人[18]的研究結果一致。
本研究根據(jù)上述方法篩選出7個特征構建的支持向量機模型,訓練組的AUC(95%CI)值為0.94(0.89~0.99),準確度為91.00%、靈敏度95.00%、特異度為84.00%,驗證組AUC的(95%CI) 值為0.88(0.83~0.93),準確度為83.00%、靈敏度84.00%、特異度為81.00%。此模型在訓練組和驗證組中的靈敏度均偏高,說明該模型在判斷結節(jié)病理亞型是否為浸潤性腺癌時不易遺漏,而在訓練組和驗證組中特異度均較低,說明該模型在一定程度上容易將原位腺癌及微浸潤腺癌判斷為浸潤性腺癌,假陽性率偏高,因此本模型的普適性仍需改進。這可能因為研究收集的病例中病理診斷為浸潤性腺癌的患者偏多(約為總病例數(shù)的61%),對應的ROI 數(shù)據(jù)比例高,故靈敏度偏高;而病理診斷為AAH/AIS/MIA偏少(不足總病例數(shù)的40%),相對應的ROI 數(shù)據(jù)偏少,故特異度較低。今后的研究中應該注意收集病例的平衡性。訓練組和驗證組的準確率均不大于95%,驗證組為83%,可能是因為本研究總樣本量偏少,根據(jù)7∶3進行分組后訓練組數(shù)據(jù)較少,由此導致建立的模型準確度偏低。
本研究還存在一些局限性。本研究為回顧性研究,選取的樣本均來自同一醫(yī)院,根據(jù)納入標準選入的樣本存在一定程度的偏倚;由于GGN的影像學特性,勾畫結節(jié)邊緣時難免混入氣管、血管或正常肺組織,特征提取時可能存在誤差。為了提高模型的普適性和準確度,今后還需進行多中心、更大樣本的研究,并應用更精準的勾畫軟件使影像組學特征能夠更為準確地判斷磨玻璃結節(jié)型肺腺癌的病理亞型。