張白霖,戴振暉,朱琳,楊耕,朱遠(yuǎn)湖,招什武,蔡春雅,李飛,王學(xué)濤
臨床放射圖像的計(jì)算機(jī)輔助分析提供了針對(duì)個(gè)性化醫(yī)療的大規(guī)模數(shù)據(jù)分析方法[1-2],比如通過(guò)分析整個(gè)腫瘤的圖像而不是選擇性獲取樣本活檢來(lái)推斷腫瘤表型。在表型變異性會(huì)影響臨床結(jié)果的前提下[3],醫(yī)學(xué)成像提供了一種有效且無(wú)創(chuàng)的方法來(lái)確定預(yù)后。這種方法具有巨大的潛力,可以被用來(lái)支持個(gè)性化臨床決策[4]。對(duì)基于圖像的標(biāo)記(即放射影像組學(xué))的研究表明,醫(yī)學(xué)斷層影像中蘊(yùn)藏著相比于人眼可見(jiàn)更多的預(yù)后信息[4-8]。為了推廣應(yīng)用于臨床,首先需要在模體中測(cè)試特征可再現(xiàn)性,然后再在不同環(huán)境和多個(gè)獨(dú)立機(jī)構(gòu)中基于患者來(lái)驗(yàn)證模型[5-13]。
研究表明特征重現(xiàn)性可能受圖像采集參數(shù)差異的影響,如切片厚度和重建算法[14-17]。由于臨床圖像采集參數(shù)是不同醫(yī)院之間圖像差異的主要來(lái)源之一,類似診斷影像的質(zhì)量保證(Quality Assurance,QA)可以使用模體來(lái)測(cè)試和比較影像組學(xué)特征。假設(shè)簡(jiǎn)單模體中已經(jīng)不穩(wěn)定的特征,不可能在更嚴(yán)格的條件下變得穩(wěn)定。
本研究中,筆者選取3臺(tái)不同型號(hào)的計(jì)算機(jī)斷層掃描設(shè)備CT 對(duì)簡(jiǎn)單模體進(jìn)行掃描成像。分析了部分掃描參數(shù)對(duì)影像組學(xué)特征的影響。之所以選擇CT,因?yàn)檫@個(gè)圖像模態(tài)更加普及,具有完善的校準(zhǔn)、質(zhì)量保證和日常維護(hù),并且是用于放射治療的主要成像模態(tài)。
COPDGene Phantom II(Phantom Laboratory,Greenwich,NY,USA)是一種被定量圖像生物標(biāo)志物聯(lián)盟技術(shù)委員會(huì)推薦用于臨床試驗(yàn)的胸部CT 模體。如圖1a 所示,外部由聚氨酯環(huán)模擬組織衰減,而內(nèi)部橢圓體(橫截面橢圓長(zhǎng)軸和短軸分別為25 和15 cm)模擬肺衰減。內(nèi)部橢圓體有許多圓柱形空腔,用于填充泡沫、丙烯酸和水[18-19]。
3Dmultimodality Abdominal Phantom (CIRS,Norfolk,Virginia,USA)是一種用于各種模態(tài)影像(CT、MR、US)引導(dǎo)肝組織活檢訓(xùn)練的模體。如圖1b所示,體模中包含了肝、門(mén)靜脈、腎臟、肺底、腹主動(dòng)脈、腔靜脈、腰椎和6 個(gè)最低的肋骨。勾畫(huà)了一大一小兩個(gè)肝病變區(qū)域。
圖1 使用的模體Fig.1 phantoms used in the study
3 臺(tái)不同的CT 設(shè)備,按照胸腹部放療計(jì)劃設(shè)計(jì)標(biāo)準(zhǔn)進(jìn)行CT 掃描,產(chǎn)生各設(shè)備的基線參考影像,基線掃描參數(shù)如表1所示。改變掃描參數(shù):(1)設(shè)置重建層厚(1、3、5 mm);(2)使用不同重建核函數(shù);(3)設(shè)置不同曝光時(shí)間(50、100、300 mAs),獲得多組不同參數(shù)條件下的掃描圖像。
基于Pyradiomics 庫(kù)使用Python 語(yǔ)言編寫(xiě)程序,讀取CT 影像及感興趣區(qū)域(ROI)提取影像組學(xué)特征共851 個(gè),包括基于影像灰度18 個(gè)、基于形態(tài)14個(gè)、基于紋理75 個(gè)以及經(jīng)小波變化濾波后提取的特征744 個(gè)。紋理特征具體分為灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)24 個(gè)、灰度相關(guān)矩陣(Gray-Level Dependence Matrix,GLDM)14 個(gè)、灰度行程矩陣(Grey-Level Runlength Matrix,GLRLM)16 個(gè)、灰度區(qū)域大小矩陣(Gray-Level Size Zone Matrix,GLSZM)16 個(gè)、局部灰度差分矩陣(Neighbourhood Grey-tone Difference,NGTDM)5 個(gè)。
表1 3臺(tái)設(shè)備的基線掃描參數(shù)Tab.1 Baseline scan parameters of 3 machines
使用變異系數(shù)(Coefficient of Variation,CV)評(píng)估特征受掃描參數(shù)改變的影響,CV 定義為標(biāo)準(zhǔn)差與平均值之比,以CV 判斷特征可再現(xiàn)性,認(rèn)為CV 小于10%的特征具有可再現(xiàn)性。
對(duì)于同一設(shè)備,其他掃描條件固定,設(shè)置不同重建層厚(1、3、5 mm),各掃描2個(gè)模體。以CV小于10%篩選特征。圖2顯示3臺(tái)設(shè)備的特征篩選情況,在3臺(tái)設(shè)備中均不滿足條件的特征占81.6%(694/851),在至少一臺(tái)設(shè)備中滿足條件的特征占18.4%(157/851),在3臺(tái)設(shè)備中均滿足條件的特征占8.8%(75/851)??梢?jiàn),重建層厚對(duì)特征可再現(xiàn)性的影響明顯。
圖2 不同層厚對(duì)特征可再現(xiàn)性影響Fig.2 Influence of different thickness on feature reproducibility
圖3顯示兩個(gè)模體的特征篩選情況,模體A 中滿足條件的特征占25.6(218/851),模體B 中滿足條件的特征占10.6%(90/851)。說(shuō)明重建層厚不同,對(duì)模體A的特征可再現(xiàn)性影響小于模體B。
圖3 不同模體比較Fig.3 Comparison of different phantoms
對(duì)于同一設(shè)備,其他掃描條件固定,使用不同重建核函數(shù)掃描重建2個(gè)模體。設(shè)備A使用的重建核函數(shù)有B31f、B41f、B60f、B75f、B80f;設(shè)備B使用的重建核函數(shù)有B、A、C、D;設(shè)備C使用的重建核函數(shù)有I30f、I40f、I44f、I49f、I50f、I70f。以CV小于10%篩選特征。圖4顯示3臺(tái)設(shè)備的特征篩選情況,在3臺(tái)設(shè)備中均不滿足條件的特征占46.4%(395/851),在至少一臺(tái)設(shè)備中滿足條件的特征占總數(shù)的53.6%(456/851),在3臺(tái)設(shè)備中均滿足條件的特征占12.1%(96/851),31.7%(270/851)的特征只在單一設(shè)備中達(dá)到可再現(xiàn)性要求。
圖4 不同重建核函數(shù)對(duì)特征可再現(xiàn)性影響Fig.4 Influence of different reconstruction kernel on feature reproducibility
使用設(shè)備A 和設(shè)備B,設(shè)置不同曝光時(shí)間(50、100、300 mAs),其他掃描條件固定,分別掃描兩種模體,以CV 小于10%篩選特征。圖5顯示兩個(gè)模體的特征篩選情況。在2 臺(tái)設(shè)備中均滿足條件的特征占32.8%(280/851)。54%(460/851)的特征只在單一設(shè)備中達(dá)到可再現(xiàn)性要求。
圖5 不同曝光時(shí)間對(duì)特征可再現(xiàn)性影響Fig.5 Influence of different current-exposure time on feature reproducibility
因?yàn)椴杉瘏?shù)和重建技術(shù)的差異,單中心或者多中心研究中提取的影像組學(xué)特征,其泛化是存在疑問(wèn)的。本研究分析了部分掃描參數(shù)對(duì)影像組學(xué)特征的影響,結(jié)果顯示,圖像層厚、重建核函數(shù)、曝光時(shí)間對(duì)影像組學(xué)特征的影響都是不可忽略的,圖像層厚不同影響了81.6%的特征,有近五成特征受到重建核函數(shù)和曝光時(shí)間的影響。并且不同設(shè)備受影響的特征不完全相同,說(shuō)明設(shè)備間的差異也是不可忽略的。Berenguer 等[18]利用一臺(tái)CT 設(shè)備對(duì)一個(gè)盆腔體模進(jìn)行不同重建核函數(shù)的掃描成像,提取特征并對(duì)比分析特征重現(xiàn)性,有43.1%(76/177)的特征認(rèn)為具有重現(xiàn)性,與本研究結(jié)果相近。
本研究使用的模體廠家明確說(shuō)明非設(shè)計(jì)用于影像組學(xué)特征研究,目前不存在一個(gè)用于影像組學(xué)研究的經(jīng)典模體。本研究中已證實(shí)重現(xiàn)性不佳的影像組學(xué)特征,不可能在多中心多設(shè)備人體研究中有理想的重現(xiàn)性。需要注意的是,因?yàn)轶w模內(nèi)的幾何結(jié)構(gòu)過(guò)于簡(jiǎn)單且密度均勻,人體器官和腫瘤組織中紋理特征以及形態(tài)特征的復(fù)雜性,并未在這2個(gè)模體中很好地體現(xiàn)。本研究所用模體B結(jié)構(gòu)比模體A復(fù)雜,模體B中提取的影像組學(xué)特征受影響的程度更大,所以,剩余特征的重現(xiàn)性需要經(jīng)過(guò)更多包含逼真腫瘤信息的模體的驗(yàn)證。Mackin 等[19]設(shè)計(jì)出包含10 個(gè)暗盒的模體,其中包含3D 打印不同填充度的ABS 塑料、不同種類的木頭、切碎的橡膠顆粒、固體樹(shù)脂及類骨材料,多設(shè)備掃描,研究紋理特征的可再現(xiàn)性。
目前在影像組學(xué)特征標(biāo)準(zhǔn)化方面已有一些工作,包括專業(yè)術(shù)語(yǔ)的命名以及特征值計(jì)算。而本工作顯示出CT 掃描參數(shù)差異對(duì)大部分特征重現(xiàn)性不可忽略的影響,影像組學(xué)特征數(shù)據(jù)標(biāo)準(zhǔn)化還有一段路要走。在此之前,應(yīng)用影像組學(xué)建立模型研究臨床問(wèn)題時(shí),為了避免該因素對(duì)預(yù)測(cè)模型的不利影響,可行的方式有:(1)在限定的適用范圍(某臺(tái)設(shè)備的某種掃描參數(shù))內(nèi)建立預(yù)測(cè)模型;(2)想辦法建立不同掃描參數(shù)間特征的關(guān)系,借助修正因子減弱掃描參數(shù)對(duì)特征的影響。有小組運(yùn)用機(jī)器學(xué)習(xí)建立不同掃描參數(shù)之間特征的轉(zhuǎn)換關(guān)系。