譚明瑜,趙偉,馬偉玲,孫英麗,金倞,李銘
隨著低劑量CT(low-dose computed tomography,LDCT)肺部疾病篩查的廣泛推廣,臨床上表現為磨玻璃樣的肺小結節(jié)(ground-glass nodules,GGNs)越來越常見[1],其中很大一部分結節(jié)的直徑小于10 mm。大多數亞厘米大小的GGNs最后被病理證實為早期肺腺癌,但目前對這類病變的治療方案以及管理策略還存在較大的爭議。一般來講,不典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)和原位腺癌(adenocarcinomas in Situ,AIS)等浸潤前期病變的生長速率較慢,只需要定期隨訪即可,即使后期需行手術治療,患者的5年生存率也接近100%;而微浸潤性腺癌(minimally invasive adenocarcinoma,MIA)和浸潤性腺癌(invasive adenocarcinoma,IA)等浸潤性病變一般需要擇期或立即手術治療[2-3]。因此,在術前準確診斷肺腺癌的浸潤程度顯然十分重要。
盡管以往已經有多位研究者推薦以10 mm為界值來區(qū)分GGNs肺腺癌的浸潤前病變與浸潤性病變[4-5],但仍有不少亞厘米級的GGNs最后被證實為MIA或IA[6-7]。由于亞厘米大小的肺腺癌處于腫瘤的早期階段,發(fā)展緩慢,較少出現傳統的提示為惡性的影像學征象,臨床上診斷相對困難。近年來通過挖掘隱藏在圖像之中的大量肉眼不可見、具有很大臨床價值的信息來輔助臨床決策制定、進而達到精準醫(yī)療的方法,也就是影像組學,已經成為研究熱點[8-9]。
目前,關于影像組學鑒別肺腺癌浸潤程度的研究相對較少,尤其是針對亞厘米級的GGNs。本研究旨在探討基于術前薄層CT圖像的三維影像組學分析在預測亞厘米級磨玻璃樣肺腺癌浸潤程度中的臨床應用價值。
本研究為回顧性分析,已經我院倫理委員會批準,豁免患者知情同意書。
回顧性分析華東醫(yī)院2013年1月-2017年7月符合本研究要求的394例患者共446個亞厘米大小磨玻璃結節(jié)的影像學資料。納入標準:①具有完整的肺部薄層CT平掃圖像;②CT圖像上結節(jié)最大直徑≤10mm;③在CT圖像上表現為磨玻璃結節(jié),包括純磨玻璃結節(jié)和部分實性結節(jié);④經手術病理證實為肺腺癌。排除標準:①術前接受過新輔助放化療等相關治療;②圖像質量不佳,影響定量分析。記錄患者的臨床資料,包括年齡、性別、吸煙史等。
將2013年1月-2015年12月收治的253例患者共286個結節(jié)作為訓練集:男74例,女212例;年齡22~77歲,平均(54.4±11.4)歲。
將2016年1月-2017年7月收治的141例患者共160個結節(jié)作為驗證集:男45例,女115例;年齡16~80歲,平均(54.5±13.4)歲。
CT掃描機型包括GE Discovery CT750 HD、GE LightSpeed VCT 64排、Somatom Definition Flash、Somatom Sension 16,各CT機型的掃描參數及掃描的結節(jié)數量詳見表1。所有患者取仰臥位,在深吸氣后屏氣狀態(tài)下進行掃描。本研究選用距手術時間最近的一次CT平掃圖像進行后續(xù)的分析,兩者的間隔時間為1~96天,中位數為7天。
所有的CT圖像先由PACS以DICOM格式導出,然后導入開源醫(yī)療圖像處理及導航軟件3D Slicer 4.8.0(Brigham and Women’s Hospital),對肺結節(jié)進行標注(圖1~2)。先由一位低年資醫(yī)師使用軟件內標注工具在所有肺結節(jié)所在層面的CT圖像上逐層對結節(jié)進行感興趣區(qū)(ROI)的勾畫,盡可能剔除結節(jié)外的血管、支氣管以及胸膜等結構,隨后由一位高年資醫(yī)師對標注結果進行審核、修改,包括位置、邊界等信息,最后每個結節(jié)所有層面的ROI融合成其容積感興趣區(qū)(volume of interest,VOI),所有結節(jié)的VOI內的全部CT數據以NII(脫敏格式)格式導出用于后續(xù)影像組學特征的提取。
表1 各CT機型的掃描參數及結節(jié)數量
圖1 a~d) 患者,女,22歲,右肺上葉GGO,經病理證實為原位癌,采用3D-slicer軟件逐層對結節(jié)進行分割和標注。 圖2 a~d) 患者,男,58歲,左肺上葉GGO,經病理證實為浸潤性腺癌,采用3D-slicer軟件逐層對結節(jié)進行分割和標注。
使用Matlab 2016b軟件對446個GGNs進行像素歸一化處理后,每個結節(jié)共提取了475個影像組學特征,包括灰度直方圖特征、灰度共生矩陣特征(gray-level co-occurrence matrix,GLCM)和灰度游程矩陣特征(gray-level run lengths matrix,GLRLM)[10]。所有計算影像組學特征的公式詳見以往的研究[11]。
對提取的475個特征進行可重復性分析,分析方法:總樣本的446個結節(jié)中隨機選取60個GGNs,讓兩位分別有7年和16年胸部影像診斷經驗的放射科醫(yī)師分別獨立進行病灶的分割和標注。一個月后,有7年經驗的醫(yī)師再對這60個結節(jié)進行分割。采用組內相關系數(inter-class correlation,ICC)對2位醫(yī)師勾畫的不同ROI所得到的475個特征進行一致性分析,ICC>0.75認為其一致性較好。其余的386個結節(jié)均由具有7年經驗的醫(yī)師進行分割,由具有16年經驗的醫(yī)師進行審核(具體實驗流程見圖3)。
所有患者的CT圖像均由2位放射科醫(yī)師(分別有25年和15年胸部影像診斷經驗)獨立進行評估,對CT形態(tài)學特征的評估內容:結節(jié)的大小、類型(窗位-700HU,窗寬1500HU)、形態(tài)、邊界、CT值及鄰近血管改變等。結節(jié)大小的測量取橫軸面的最大徑,類型分為純磨玻璃結節(jié)和混合磨玻璃結節(jié),形態(tài)包括圓形、卵圓形和不規(guī)則形,邊界分為清晰(定義為無分葉和毛刺)和不清晰,胸膜牽拉定義為連結結節(jié)和胸膜之間的細小纖維灶,血管改變定義為穿過病灶的血管增粗、扭曲或病灶周圍血管聚集[12],支氣管改變定義為穿過病灶的支氣管增粗、扭曲或者支氣管阻塞。CT值為3次ROI測量值的平均值,勾畫ROI是盡可能避開血管和支氣管。
圖3 研究步驟和流程示意圖。
所有GGNs的病理結果均由具有5年以上臨床經驗的病理科醫(yī)師按照最新的指南進行評估[3],分為AAH、AIS、MIA和IA,其AAH和AIS定義為浸潤前病變,MIA和IA定義為浸潤性病變。
本研究中采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)的方法在訓練集中篩選出具有鑒別意義的特征[13],隨后基于篩選出的特征來計算影像組學標簽值。分析臨床特征、傳統影像學征象以及影像學標簽在訓練集的兩組病變之間的差異,將差異有統計學意義的特征納入多因素回歸分析,建立Logistic回歸模型。對回歸模型的獨立驗證在驗證集上進行,內部驗證在低年資醫(yī)師第二次標注的60例數據和高年資醫(yī)師第一次標注的60例數據上進行。使用AUC值來評價列線圖的效能。
分別使用R 3.4.3(http://www.Rproject.org)、SPSS 23.0和MedCalc軟件對數據進行統計學分析。對連續(xù)變量使用獨立樣本t檢驗或克瓦氏H檢驗(Kruskal-Wallis H)檢驗,對分類變量使用卡方檢驗。LASSO算法使用“glmnet”工具包進行特征降維,篩選出具有鑒別診斷價值的影像組學特征。多因素回歸分析用于模型的建立,ROC曲線用于評價多變量logistic回歸模型的預測效能。以P<0.05為差異有統計學意義。
446個GGNs中,134個(30.04%)為浸潤前病變,312個(69.96%)為浸潤性病變。訓練集和驗證集中患者的基本臨床信息和影像學征象詳見表3。統計分析結果顯示,訓練集和驗證集中結節(jié)的大小、類型、邊界、形態(tài)、血管改變及CT值在浸潤前病變及浸潤性病變間的差異均有統計學意義(P<0.05),其余臨床特征及傳統影像學征象的組間差異無統計學意義(P>0.05)。
對醫(yī)師提取的影像組學特征進行可重復性分析,低年資醫(yī)師兩次標注獲得的各項紋理參數值的一致性均較好,ICC為0.7883~0.9914;低年資醫(yī)師與高年資醫(yī)師對同一組結節(jié)(60例)進行標注后獲得的各項紋理參數比較,一致性均較好,ICC為0.7513~0.9787。由此得到的127個較為穩(wěn)定的特征被納入后續(xù)分析。隨后,在286個結節(jié)組成的訓練集中,采用LASSO算法篩選出13個對鑒別亞厘米肺腺癌浸潤程度最具價值的特征(圖4)。每個結節(jié)可根據公式(1)計算得到相應的影像組學標簽(radiomic signature,RS):
RS=3.037495+0.1483×mean_50_0+6.75E-08×Correlation_45_90_0+0.00211967×mean_50_1-1.36E-05×LRE_0_1-0.0002457×Contrast_45_90_1+0.00166204×SD_25_1.5-0.0087193×LRE_0_1.5-0.0513177×LRE_90_1.5+1.72E-05×Contrast_0_135_1.5-1.68E-05×Contrast_ 45_90_1.5+0.00417945×SD_10_2+2.53E-05×Contrast _45_45_2+6.69E-05×RLN_135_2.5
(1)
訓練集和驗證集中浸潤性病變的影像組學標簽值均高于浸潤前期病變(表2),差異均有統計學意義(P<0.05)。ROC曲線分析結果顯示,在訓練集和驗證集中影像組學標簽的AUC值分別為0.696(95%CI:0.630~0.760)和0.674(95%CI:0.588~0.761)。
在GGOs的臨床資料、常規(guī)CT征象及影像組學標簽中,有7個特征在浸潤性和非浸潤性GGOs組間的差異有統計學意義(表2),將這7個特征納入多因素logistic回歸分析,結果顯示,CT值和影像組學標簽為獨立預測因素(表3)。基于這2個獨立危險因素建立logistic回歸模型:
logit(P)=3.170+0.06×CT值+1.068×影像組學標簽
(2)
在訓練集中(圖5),回歸模型、CT值和影像組學標簽鑒別浸潤性和非浸潤性GGOs的AUC分別為0.785(95%CI:0.730~0.840,敏感度為72.9%,特異度為71.1%)、0.742(95%CI:0.681~0.802,敏感度為72.4%,特異度為68.7%)和0.696(95%CI:0.630~0.760,敏感度為52.7%,特異度為78.3%),回歸方程的預測效能優(yōu)于CT值和影像組學標簽,且差異有統計學意義(P=0.0392;P=0.0007)。在驗證集中(圖6),回歸模型、CT值和影像組學標簽鑒別浸潤性和非浸潤性GGOs的AUC分別為0.704(95%CI:0.618~0.790,敏感度為62.4%,特異度為70.6%)、0.683(95%CI:0.595~0.772,敏感度為65.1%,特異度為64.7%)、0.674(95%CI:0.588~0.761,敏感度為55.0%,特異度為72.5%),回歸模型的預測效能優(yōu)于CT值,兩者間的差異有統計學意義(P=0.0074)。
表3 影像表現及影像組學標簽的多因素回歸分析結果
本研究結果顯示,基于CT值和影像組學標簽建立的回歸模型能較好地無創(chuàng)性預測亞厘米大小肺腺癌的浸潤程度,ROC曲線下面積(AUC)為0.704,高于CT值及影像組學標簽的AUC(分別為0.683和0.674),回歸模型的預測效能優(yōu)于CT值(P<0.05)。雖然驗證集中回歸模型的AUC值與影像組學標簽間的差異無統計學意義,但仍可見影像組學標簽預測效能相對較高的趨勢。
本研究分析了影像組學特征、臨床特征以及傳統影像學征象在鑒別亞厘米大小磨玻璃樣肺腺癌浸潤程度方面的價值,結果顯示,大部分臨床特征及影像特征在浸潤前期病變及浸潤性病變之間的差異無統計學意義,筆者分析可能的原因:首先,對這些形態(tài)學特征鑒別GGNs的浸潤程度的價值,尚存在一定的爭議[14],有研究表明直徑不能作為判定良、惡性的依據[15-16];圓形磨玻璃結節(jié)為惡性的可能性要大于多邊形[17];另有研究發(fā)現大約有50%的炎性病變中也會出現空洞征[18]。此外,以磨玻璃結節(jié)為主要表現的肺腺癌,往往處于腫瘤早期階段,提示惡性可能的影像學征象往往出現較少。本研究中經多因素分析,最終僅CT值和影像組學標簽為獨立預測因素,CT值增高與病變的良、惡性有關,這與以往的研究結果基本一致[19-20],通常認為CT值的升高是腫瘤細胞增多所致[21]。
圖4 利用Lasso算法篩選有鑒別意義的影像組學特征。a)lasso模型中使用十倍交叉驗證方法,篩選出效能最好的特征集合,垂直虛線表示最佳λ取值對應的log(λ)值,本研究共選出13個特征;b)lasso模型中使用十倍交叉驗證方法篩選出的組學特征的特征系數收斂圖,圖中的每一條曲線代表了每一個自變量系數的變化軌跡。 圖5 訓練集中l(wèi)ogistic回歸模型的ROC曲線。 圖6 驗證集中l(wèi)ogistic回歸模型的ROC曲線。
盡管影像組學在醫(yī)學中的應用十分廣泛,但特征的穩(wěn)定性(主要與掃描參數 、病灶的分割等因素有關)以及冗余性都是研究者需要關注的問題。本研究中所納入的均為亞厘米大小的磨玻璃結節(jié),手動分割病灶不僅受到主觀因素的影響,病灶本身也給分割帶來了難度,比如直徑過小、邊界欠清等。此外,本研究提取的影像組學學特征為三維特征,容易受到像素之間空間位置的影響。因此,本研究中采用了像素大小歸一化處理、可重復性分析以及LASSO降維等措施來避免特征不穩(wěn)定以及冗余性帶來的影響,最終篩選出13個穩(wěn)定且預測效能較好的影像組學特征來建立影像組學標簽,其ROC曲線下面積(AUC)為 0.674(95%CI:0.630~0.760)。Xue等[22]學者也進行了類似的研究,所建立的影像組學列線圖預測磨玻璃結節(jié)浸潤程度的AUC為0.79(95%CI:0.71~0.88)。而本研究中的研究對象是亞厘米級的磨玻璃結節(jié),診斷難度更大。根據影像組學理論,我們所提取的特征能夠反映腫瘤的空間異質性、微環(huán)境和基因表達狀態(tài)等[23]。但是要準確解釋影像組學特征與復雜生物學模式之間的確切聯系仍然具有很大的挑戰(zhàn)性。其實,將多個影像組學特征合并成一個影像組學標簽的做法能夠簡化分析流程,更有利于臨床的實際應用[11,24]。本研究中所建立的logistic回歸模型能夠很好地區(qū)分浸潤前病變和浸潤性病變,證明了這種方法的可行性。
本研究存在以下不足:其一,為單中心回顧性研究,僅僅納入亞厘米大小的GGNs,樣本數量有限,不排除存在數據選擇偏移的可能;其二,本研究納入的病例采用了幾種不同的CT機型進行掃描,掃描條件和參數存在一定的差異,也可能對分析結果產生一定的影響。因此,本研究的結論可能尚需要進一步采用前瞻性、多中心、標準化和大樣本的研究來驗證。
總之,本研究分析了GGNs的傳統影像學和影像組學兩方面的危險因素,在兼顧實用性和準確性的基礎上,結合CT值和影像組學標簽,建立了一個能夠更好地預測亞厘米GGNs浸潤程度的logistic回歸模型,相比傳統影像學方法,此模型具有較好的預測價值,有望用來輔助臨床決策。