CT radiomics-based machine learning models in diagnosis for symptomatic carotid artery plaque
LIJing12,WANGKaifeng3,ZHANGMeilan12,SONGBowen12,ZHAO Fengqiao2,DUHai2
GraduateSchlBatouedicalolgoferongoliUiesityfenceamp;chologyotouina;t ofRadiologydontalialdosoa;olofsicicalieeseicalUeity 350001,China.
[Abstract]Objective:Toexplorethediagnosticeficiencyofthemachinelearning modelsbasedonCTradiomics features for symptomaticcarotidplaques.Methods:TeclinicaldataandheadandneckCTAimagesof18Opatientswereretrospectively analyzed.Atotalof18Opatientsweredivided intoasymptomaticgroup(54cases)andanasymptomaticgroup(126cases) basedonwhethertherewereischemiceventsintheipsilateraleye(transientmonocular blindnessortransientamaurosisor retinalinfarction)orischemiceventsinthecerebralhemispheres(transientischemicatackorstroke)withinthepast6months. 180caseswererandomlydividedintoatrainingset(144cases)andatestset(36cases)ataratioof8:2.Theradiomics featuresextracted from CTA images of the training set were selected through Mann-Whitney υ test,Spearman correlation analysis,andLASSOalgorithm.Themostoptimalfeatureswereretainedtoconstructfivemachinelearningmodels,XGBoost, SVM,LR,LightGBMandExtraTres.ROCcurvewasused toevaluate themodels’eficiency.Results:Inthetestset,the AUCsof the five modelsreachedO.723-0.786.ThepredictiveperformanceofExtraTresandLightGBMmodelsperformed well.TheAUC,sesitivitysecificityofExtrareesmodelinthetrainingsetwreO.781.663,0.761,andtoseintstet were0.786,0.643,0.875.AndtheAUC,sensitivityspecificityofLightGBMmodelinthetrainingsetwereO.829,0.735, 0.804 and those in the test set were O.77,0.643,0.875,respectively. Conclusion ∵ Machine learning models based on CT radiomics features can effectively identify symptomatic carotid plaques.
[Keywords] Carotid plaque;Tomography,X-ray computed;Machine learning;Radiomics;Symptomatic
腦卒中是全球第二大死亡因素[1]。缺血性腦卒中是最常見的類型,占我國腦卒中的 69.6%~ 70.8%[2] 。2020年全球 30~79 歲人群中頸動脈斑塊的患病率約 20%[3] 。研究證實,對于癥狀性頸動脈斑塊患者,支架置入術(shù)較動脈內(nèi)膜切除術(shù)發(fā)生非致殘性卒中的風(fēng)險更高,而動脈內(nèi)膜切除術(shù)在預(yù)防無癥狀性頸動脈斑塊卒中方面效果不大[4]。目前卒中預(yù)測主要基于斑塊段管腔狹窄程度,但斑塊結(jié)構(gòu)和組成也起著重要作用,因此,無創(chuàng)識別癥狀性頸動脈斑塊有助于臨床治療策略的選擇,并可改善風(fēng)險分層。目前,臨床最常用的檢查手段為CTA,其具有無創(chuàng)、操作簡單、空間分辨力高等特點[5]。影像組學(xué)是從影像圖像中高通量地提取大量圖像特征[,用于疾病的診斷、預(yù)后評估及腫瘤的分期、分型等方面[7-9]。機器學(xué)習(xí)是人工智能的一個子集,基于影像組學(xué)特征構(gòu)建的機器學(xué)習(xí)模型可學(xué)習(xí)不同數(shù)據(jù)類型的內(nèi)部特征,以輔助臨床醫(yī)師決策[10]。本研究旨在開發(fā)基于CT影像組學(xué)特征的多種機器學(xué)習(xí)模型,并分析其對癥狀性頸動脈斑塊的診斷效能,幫助臨床對無癥狀頸動脈高危斑塊的個性化管理。
1資料與方法
1.1一般資料
收集2020年1月至2022年3月在市中心醫(yī)院行頭頸部CTA的患者180例(268個頸動脈斑塊),其中男136例,女44例。納入標準: ① 經(jīng)CTA檢查確診頸動脈斑塊; ② 臨床資料可明確在過去6個月內(nèi)有無缺血性卒中或短暫性腦缺血發(fā)作(transientischemicattack,TIA); ③ 臨床和影像資料完整。排除標準: ① 有頸動脈內(nèi)膜剝脫術(shù)和支架植入術(shù)史;② 頸動脈閉塞; ③ 有后循環(huán)癥狀; ④CTA 圖像質(zhì)量差; ⑤CTA 顯示顱內(nèi)動脈異常病變,如煙霧病、顱內(nèi)動脈瘤等; ⑥ 其他頸動脈病變,如頸動脈夾層、頸動脈瘤等。
180例根據(jù)過去6個月內(nèi)有無引起同側(cè)眼缺血事件(短暫性單眼失明、一過性黑蒙或視網(wǎng)膜梗死)或大腦半球缺血事件(短暫性缺血發(fā)作或卒中)4分為癥狀組(54例)和無癥狀組(126例)。以8:2的比例隨機分為訓(xùn)練集(144例)和測試集(36例)。本研究經(jīng)醫(yī)院倫理委員會批準(批號:2025-078),免除患者知情同意。
1.2儀器與方法
采用GERevolution256排CT掃描儀,患者取仰臥位,掃描范圍從主動脈弓至顱頂。掃描參數(shù):100kV ,自動管電流 100~350mA ),矩陣 512×512 ,探測器寬度 40mm ,視野 25cm×25cm ,層厚、層距均為 0.625mm 。經(jīng)肘正中靜脈注射 20mL 生理鹽水,后以 4.0~5.0mL/s 流率注射碘海醇 40~50mL ,再注射生理鹽水 20mL ,動態(tài)監(jiān)測降主動脈衰減閥值達245HU后2s觸發(fā)采集。將獲得的圖像傳輸至工作站進一步分析。
1.3影像組學(xué)模型構(gòu)建
1.3.1圖像分割與特征提取以DICOM格式收集影像圖像行重采樣、歸一化預(yù)處理。由2位具有5年工作經(jīng)驗的影像醫(yī)師分析圖像,并在ITK-SNAP軟件(版本3.8)上對斑塊進行逐層勾畫獲得VOI,VOI包括鈣化與非鈣化斑塊區(qū)域(圖1)。2位醫(yī)師意見不同時經(jīng)協(xié)商解決或由1位工作15年的上級醫(yī)師審核。
一致性分析:2位醫(yī)師對隨機選取的30例CT圖像行VOI分割和特征提取,使用ICC檢驗,評估特征提取的一致性。為檢驗觀察者內(nèi)部的一致性,其中1位醫(yī)師于1周后行二次勾畫和特征提取,并將提取的特征與第1次比較, ICCgt;0.75 的特征用于后續(xù)分析。1.3.2影像組學(xué)特征篩選使用Pyradiomics模塊(https//github.com/Radiomics/pyradiomics)進行影像組學(xué)特征提取。應(yīng)用 Z -score來標準化數(shù)據(jù),取所有特征的平均值為0,標準差為1,以確保均勻性。后使用Mann-Whitney U 檢驗進行特征選擇,保留 Plt;0.05 的特征。為解決特征之間的冗余,計算Spearman相關(guān)系數(shù),剔除相關(guān)系數(shù) gt;0.9 的特征。為優(yōu)化保留特征,采用貪婪遞歸刪除策略,在每次迭代中刪除最高冗余特征。使用最小絕對收縮和選擇算子(leastabsoluteshrinkage and selection operator,LASSO)算法和10倍交叉驗證識別非零系數(shù)的特征用于模型構(gòu)建。
圖1癥狀性頸動脈斑塊與無癥狀性頸動脈斑塊的VOI獲取注:圖 1a~1d 患者,男,74歲,右側(cè)頸動脈分叉處癥狀性頸動脈斑塊。斑塊最大位置管腔呈重度狹窄,黑色圓圈所在位置為管腔,白色十字所在位置為斑塊,黑箭所指為斑塊潰瘍形成,圖1c為ROI(紅色區(qū)域),圖1d為VOI。圖1e~1h患者,男,57歲,右側(cè)頸內(nèi)動脈起始部無癥狀性頸動脈斑塊。斑塊最大位置管腔呈中度狹窄,圖1g為ROI(紅色區(qū)域),圖1h為VOI
1.3.3模型構(gòu)建及驗證將篩選后的影像組學(xué)特征,分別使用極致梯度提升(eXtreme gradient boosting,XGBoost)支持向量機(support vector machines,SVM)、邏輯回歸(logisticregression,LR)融合輕量級梯度提升機(light gradient boosting machine,LightGBM)、極度隨機數(shù)(extremely randomized trees,ExtraTrees)
1.4統(tǒng)計學(xué)分析
使用SPSS26.0及Python(版本3.9)軟件進行數(shù)據(jù)分析。計數(shù)資料以例表示,組間比較行 χ2 檢驗。計量資料以 表示,組間比較行獨立樣本 χt 檢驗或Mann-Whitney U 檢驗。采用校準曲線和決策曲線評估模型的校準度及臨床凈收益。使用DeLong檢驗比較模型間AUC的差異。以 Plt;0.05 為差異有統(tǒng)計學(xué)意義。
2結(jié)果
2.12組一般資料比較
2組除年齡外,性別、總膽固醇(TC)、甘油三酯(TG)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)、斑塊段管腔狹窄程度、高血壓、糖尿病、斑塊位置差異均無統(tǒng)計學(xué)意義(均 Pgt;0.05 。2位醫(yī)師對隨機選取的30例圖像特征提取的一致性良好( ICCgt;0.85 )。
表1無癥狀組和癥狀組一般資料比較
:TC為總膽固醇,HDL-C為高密度脂蛋白膽固醇,LDL-C為低密度脂蛋白膽固醇,TG為甘油三酯?!盀閠值,為 U 值,為x2值。
2.2機器學(xué)習(xí)模型構(gòu)建
訓(xùn)練集圖像共提取1835個影像組學(xué)特征,剔除 ICC?0.75 的特征,通過Mann-Whitney U 檢驗篩選保留 Plt;0.05 的33個特征,經(jīng)Spearman相關(guān)分析刪除冗余特征后篩選出14個特征,經(jīng)LASSO算法篩選后保留6個最有意義的特征,分別為original_glszm_ZonePercentage、wavelet_LLH_glcm_InverseVariance,wavelet_LHL_firstorder_Mean、exponential_glcm_InverseVariance、original_shape_Sphericity、gradi-ent_glcm_Idn,特征權(quán)重見圖2,隨后進行機器學(xué)習(xí)模型的構(gòu)建。
圖2最終篩選出6種特征的權(quán)重圖
2.3 機器學(xué)習(xí)模型效能比較
5種機器學(xué)習(xí)模型在訓(xùn)練集及測試集中均表現(xiàn)出良好的診斷效能(圖3)。測試集中各機器學(xué)習(xí)模型的AUC均 gt;0.7 ,其中ExtraTrees和LightGBM模型的診斷效能較好且較穩(wěn)定,AUC分別為0.786( 95%CI 0.611~0.961) 和 0.770(95%CI0.592~ 0.949),并在測試集中表現(xiàn)出較高的敏感度及特異度(表2,3)。XGBoost模型在訓(xùn)練集和驗證集的結(jié)果差距較大,且不穩(wěn)定;而LR模型的敏感度在訓(xùn)練集中低于其他模型。校準曲線表明,5種機器學(xué)習(xí)模型在訓(xùn)練集和測試集對癥狀性頸動脈斑塊的預(yù)測和實際間擬合良好(圖4)。決策曲線分析顯示,訓(xùn)練集和驗證集中5種機器學(xué)習(xí)模型對診斷癥狀性頸動脈斑塊的凈收益較好(圖5)。DeLong檢驗表明,測試集中5種機器學(xué)習(xí)模型的AUC差異無統(tǒng)計學(xué)意義( Pgt; 0.05)(圖6。
表2訓(xùn)練集中機器學(xué)習(xí)模型對癥狀性頸動脈斑塊的診斷效能
注:LightGBM為融合輕量級梯度提升機,XGBoost為極致梯度提升,ExtraTrees為極度隨機數(shù),SVM為支持向量機,LR為邏輯回歸。
表3測試集中機器學(xué)習(xí)模型對癥狀性頸動脈斑塊的診斷效能
注:LightGBM為融合輕量級梯度提升機,XGBoost為極致梯度提升,ExtraTres為極度隨機數(shù),SVM為支持向量機,LR為邏輯回歸。
3討論
本研究通過對頸動脈CTA圖像提取影像組學(xué)特征,應(yīng)用多種機器學(xué)習(xí)模型來區(qū)分癥狀性與無癥狀性頸動脈斑塊。5種機器學(xué)習(xí)模型均表現(xiàn)出良好的診斷效能,可用于識別癥狀性頸動脈斑塊。
3.1無癥狀性與癥狀性頸動脈斑塊的鑒別意義
癥狀性頸動脈斑塊與無癥狀性頸動脈斑塊的治療方法不同\",癥狀性頸動脈斑塊多需臨床干預(yù),如行手術(shù)治療或支架置入等;而無癥狀性頸動脈斑塊多以藥物治療為主,以穩(wěn)定斑塊為目標。有研究顯示,影像組學(xué)分析可用于識別癥狀性頸動脈斑塊,Zaccagna等[12]基于CT紋理影像組學(xué)特征識別癥狀性頸動脈斑塊,AUC最高達0.81。本研究基于CT影像組學(xué)特征的機器學(xué)習(xí)模型對癥狀性頸動脈斑塊的預(yù)測效能良好,其在測試集中AUC達 0.723~0.786 與文獻報道一致。
3.2影像組學(xué)鑒別癥狀性頸動脈斑塊的優(yōu)勢
目前,越來越多的研究表明頸動脈斑塊易損性與斑塊段管腔狹窄程度有關(guān),且與斑塊成分,如血管炎癥、斑塊內(nèi)出血、富含脂質(zhì)的壞死核心和纖維帽等密切相關(guān)[13-14]。不同斑塊成分的CT值也不同,但由于部分容積效應(yīng),肉眼很難識別斑塊的內(nèi)部成分;而影像組學(xué)是一種非侵入性的方法,通過智能計算在原始圖像的基礎(chǔ)上構(gòu)建模型,獲取肉眼看不見的特征,為疾病的診斷、預(yù)后和個體化治療提供依據(jù)[15]。一項納入中、重度頸動脈斑塊段管腔狹窄患者(狹窄程度 gt;50% )的研究顯示,與常規(guī)特征模型相比,影像組學(xué)模型提高了對癥狀性斑塊的診斷效能(AUC分別為 0.706,0.858)[16] ;而本研究納入輕、中、重度管腔狹窄的斑塊,對癥狀性斑塊的判讀范圍更廣泛。Shi等[17]發(fā)現(xiàn),相較于僅納入臨床信息(同型半胱氨酸)及影像特征(包括斑塊潰瘍及頸動脈緣征)構(gòu)建的傳統(tǒng)模型,影像組學(xué)模型對癥狀性頸動脈斑塊的診斷效能更好。本研究基于CT影像組學(xué)特征構(gòu)建的5種機器學(xué)習(xí)模型在測試集中AUC均 gt;0.7 ,證實其對癥狀性頸動脈斑塊具有良好的診斷效能,與陳超等[18]的研究結(jié)果一致。
圖35種機器模型的ROC曲線注:圖3a為訓(xùn)練集,圖3b為測試集,LightGBM 為融合輕量級梯度提升機,XGBoost為極致梯度提升,ExtraTrees為極度隨機數(shù), SVM為支持向量機,LR為邏輯回歸圖45種機器學(xué)習(xí)模型的校準曲線注: 圖4a為訓(xùn)練集,圖4b為測試集圖55種機器學(xué)習(xí)模型的決策曲線注:圖5a 為訓(xùn)練集,圖5b為測試集,圖6測試集中各個模型的DeLong檢驗
3.3機器學(xué)習(xí)模型的臨床應(yīng)用價值
機器學(xué)習(xí)已廣泛應(yīng)用于大數(shù)據(jù)分析,其可自動學(xué)習(xí)數(shù)據(jù)模式并優(yōu)化模型參數(shù)。很多因素可影響模型的預(yù)測效能,如圖像質(zhì)量、ROI的勾畫、構(gòu)建模型的方法等[19]。本研究使用5種機器學(xué)習(xí)模型用于預(yù)測癥狀性頸動脈斑塊,其中,ExtraTrees和LightGBM模型在訓(xùn)練集和驗證集中展現(xiàn)出來良好且穩(wěn)定的預(yù)測效能。ExtraTrees模型是隨機現(xiàn)在分割值,使得決策樹有多樣性和非相關(guān)性,可有效抑制過擬合[20];LightGBM在預(yù)測精度、模型穩(wěn)定性和計算效率等方面性能優(yōu)越;而SVM模型的穩(wěn)定性需有充足的空間包容測試樣本[21]。本研究樣本量較小,可能是導(dǎo)致結(jié)果欠佳的原因;LR模型僅能處理線性數(shù)據(jù)[22],且易欠擬合,分類精度不高,這可能是其在本研究訓(xùn)練集中敏感度較低(0.408)的原因;傳統(tǒng)模型XGBoost,如樣本存在噪聲,可能難以了解潛在信號且該模型并不適用于回歸模型[22],導(dǎo)致其在本研究訓(xùn)練集和驗證集的結(jié)果差距較大(AUC分別為0.955、0.728),且不穩(wěn)定。Dong等[16基于CT影像組學(xué)特征選取XGBoost、SVM和LR3種機器學(xué)習(xí)模型對癥狀性頸動脈斑塊進行識別,結(jié)果顯示,LR模型的診斷效能最好(AUC為0.858),但該研究僅選擇了3種機器學(xué)習(xí)模型且納入樣本量較?。?20例),本研究選取了5種常見的機器學(xué)習(xí)模型且樣本量更大。
本研究存在的局限性: ① 樣本量較小,可能使結(jié)果產(chǎn)生偏差,雖然使用10倍交叉驗證防止模型過擬合,但仍需更大樣本量的前瞻性研究評估模型的準確性和穩(wěn)定性; ② 為單中心研究,缺少外部驗證檢驗?zāi)P偷钠者m性; ③ 盡可能排除其他引起同側(cè)眼缺血事件或大腦半球缺血事件的病因,但仍無法確保這些癥狀均由頸動脈粥樣硬化斑塊引起。
綜上所述,基于CT影像組學(xué)特征的機器學(xué)習(xí)模型對癥狀性頸動脈斑塊的診斷效能良好,可輔助臨床決策和個性化治療。
[參考文獻]
[1] GBD 2019 STROKE COLLABORATORS. Global,regional, and national burden of stroke and its risk factors,1990- 2019:a systematic analysis for the global burden of disease study 2019[J]. Lancet Neurol,2021,20(10):795- 820.
[2]彭斌,吳波.中國急性缺血性腦卒中診治指南2018[J]. 中華神經(jīng)科雜志,2018,51(9):666-682.
[3]SONG P,F(xiàn)ANG Z,WANG H,et al. Global and regionalprevalence,burden,and risk factors for carotid atherosclerosis:asystematic review,meta-analysis,and modelling study[J].Lancet Glob Health,202O,8(5): e721-e729.
[4]BONATI L H,JANSEN O,DE BORST G J,et al. Management of atherosclerotic extracranial carotid artery stenosis[J]. Lancet Neurol,2022,21(3):273-283.
[5]RAJIAH P.Updates in vascular computed tomography [J].Radiol Clin North Am,2020,58(4):671-691.
[6]LAMBIN P,RIOS-VELAZQUEZ E,LEIJENAAR R,et al.Radiomics:extracting more information from medical images using advanced feature analysis[J]. Eur J Cancer,2012,48(4):441-446.
[7]LI X,WU M,WU M,et al.A radiomics and genomicsderived model for predicting metastasis and prognosis incolorectal cancer[J].Carcinogenesis,2O24,45(3): 170-180.
[8]JIANG W,MENG R,CHENG Y,et al. Intra- and peritumoral based radiomics for assessment of lymphovascular invasion in invasive breast cancer[J].J Magn Reson Imaging,2024,59(2):613-625.
[9] ZHANG L,WANG Y,PENG ΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔΔ al. The progress of multimodal imaging combination and subregion based radiomics research of cancers[J]. Int JBiol Sci,2022,18 (8) :3458-3469.
[10]TRAN K A,KONDRASHOVA O,BRADLEY A,et al. Deep learning in cancer diagnosis,prognosis and treatment selection[J].Genome Med,2021,13(1):152.
[11] NAYLOR R,RANTNER B,ANCETTI S,et al. Editor’s choice- European society for vascular surgery (esvs) 2023 clinical practice guidelines on the management of atherosclerotic carotid and vertebral artery disease [J].Eur J Vasc Endovasc Surg,2023,65(1):7-111.
[12]ZACCAGNA F,GANESHAN B,ARCA M,et al. CT texture-basedradiomicsanalysisofcarotid arteries identifiesvulnerable patients:apreliminaryoutcome study[J]. Neuroradiology,2021,63(7) :1043-1052.
[13]KRAMER C M,TREIMAN G S. Vulnerable plaque in carotid arterieswithout“significant”stenosis:unmasking the hidden links to stroke[J]. J Am Coll Cardiol, 2020,76(19):2223-2225.
[14]SCHWARZF,BAYER-KARPINSKA A,POPPERT H, et al.Serial carotid MRI identifies rupture of a vulnerable plaque resulting in amaurosisfugax[J]. Neurology, 2013,80(12):1171-1172.
[15] GILLIES R J,KINAHAN P E,HRICAK H. Radiomics : images are more than pictures,they are data[J]. Radiology,278:563-577.
[16]DONG Z,ZHOU C,LI H,et al. Radiomics versus conventional assessment to identify:symptomatic participantsat carotid computed tomography angiography [J].Cerebrovasc Dis,2022,51(5):647-654.
[17] SHI J,SUN Y,HOU J,et al. Radiomics signatures of carotid plaque on computed tomography angiography: anapproach to identifysymptomatic plaques[J].Clin Neuroradiol,2023,33(4):931-941.
[18]陳超,李增暉,胥文瀚,等.基于CTA的影像組學(xué)特征識 別癥狀性頸動脈斑塊[J].中國醫(yī)學(xué)計算機成像雜志, 2023,29(4):360-366.
[19]GUIOT J,VAIDYANATHAN A,DEPREZ L,et al. A review in radiomics:making personalized medicinea realityvia routine imaging[J].Med Res Rev,2022,42 (1) :426-440.
[20]GREENERJ G,KANDATHIL S M,MOFFAT L,et al. Aguide to machine learning for biologists[J].Nat Rev Mol Cell Biol,2022,23(1):40-55.
[21] SCHOBER P,VETTER T R. Logistic regression in medical research[J]. Anesth Analg,2021,132(2) :365- 366.
[22]GREENERJG,KANDATHIL S M,MOFFAT L,et al. Aguide to machine learning for biologists[J].Nat Rev Mol Cell Biol,2022,23(1):40-55.
(收稿日期 2024-06-18)
中國中西醫(yī)結(jié)合影像學(xué)雜志2025年4期