1cm甲狀腺乳頭狀癌的臨床價值"/>
摘 " "要 " "目的 " "探討SHAP值在XGBoost超聲模型中診斷最大徑gt;1 cm甲狀腺乳頭狀癌(PTC)的臨床價值。方法 " "選取我院經(jīng)手術(shù)病理證實的138例PTC患者(145枚結(jié)節(jié))和127例結(jié)節(jié)性甲狀腺腫(NG)患者(141枚),將286枚結(jié)節(jié)以8∶2的比例隨機分為訓練集(PTC 114枚,NG 115枚)和測試集(PTC 31枚,NG 26枚),比較訓練集與測試集,以及訓練集中PTC與NG超聲檢查結(jié)果的差異?;谟柧毤瘶?gòu)建XGBoost超聲模型;繪制受試者工作特征(ROC)曲線分析XGBoost超聲模型對訓練集和測試集中PTC的診斷效能,校準曲線分析模型的校準度。通過SHAP值解析XGBoost超聲模型,明確各超聲因素診斷PTC的權(quán)重。結(jié)果 " "訓練集與測試集結(jié)節(jié)實性占比比較差異有統(tǒng)計學意義(Plt;0.05),邊緣模糊/不規(guī)則/腺外侵犯、縱橫比(A/T)gt;1、超聲灰階比值(UGSR)lt;0.83、微鈣化占比比較差異均無統(tǒng)計學意義。訓練集中PTC與NG A/Tgt;1、UGSRlt;0.83、微鈣化、邊緣模糊/不規(guī)則/腺外侵犯、實性占比比較差異均有統(tǒng)計學意義(均Plt;0.001)。ROC曲線分析顯示,XGBoost超聲模型診斷訓練集和測試集中PTC的曲線下面積分別為0.941(95%可信區(qū)間:0.895~0.987)和0.921(95%可信區(qū)間:0.846~0.996),準確率、靈敏度、特異度分別為88.0%、92.9%、83.2%和86.0%、93.5%、77.5%。校準曲線分析顯示,XGBoost超聲模型診斷訓練集和測試集中PTC的校準度均較好。通過SHAP值解析XGBoost超聲模型,結(jié)果顯示各超聲因素對診斷PTC均為正向貢獻,其權(quán)重從高到低依次為:UGSRlt;0.83、實性、邊緣模糊/不規(guī)則/腺外侵犯、微鈣化和A/Tgt;1。結(jié)論 " "利用SHAP值對XGBoost超聲模型進行解析可以實現(xiàn)各超聲因素診斷效能的量化,在診斷最大徑gt;1 cm PTC中具有較好的臨床應用價值。
關(guān)鍵詞 " "超聲檢查;甲狀腺乳頭狀癌;超聲灰階比值;SHAP值;XGBoost
[中圖法分類號]R445.1;R736.1 " " [文獻標識碼]A
Clinical value of SHAP value in the diagnosis of papillary thyroid carcinoma with a maximum diametergt;1 cm by XGBoost "ultrasound model
QIAN Jiahong1,XIE Yayu1,ZHU Hanlin2,WANG Pan3,HU Chunfeng4,HAN Zhijiang4
1.Department of Ultrasound,the Third People’s Hospital of Xiaoshan,Hangzhou 311251,China.2.Department of Radiology,
3.Department of Ultrasound,the Ninth People’s Hospital of Hangzhou,Hangzhou 311225,China.4.Department of
Radiology,Hangzhou First People’s Hospital Affiliated to West Lake University,Hangzhou 310006,China
ABSTRACT " "Objective " "To evaluate the clinical value of SHAP value in XGBoost-based ultrasound model for diagnosing papillary thyroid carcinoma(PTC) with a maximum diametergt;1 cm.Method " "A total of 138 PTC patients(145 nodules) and 127 nodular goiter(NG) patients(141 nodules) confirmed by surgical pathology in out hospital were enrolled.The 286 nodules were randomly divided into a training set(114 PTC,115 NG) and a testing set(31 PTC,26 NG) at a ratio of 8∶2.Ultrasound features were compared between the training and testing sets,as well as between PTC and NG nodules in the training set.A XGBoost ultrasound model was constructed using the training set.Receiver operating characteristic(ROC) curve was drawn to assess the diagnostic performance,and calibration curve evaluated the calibration of the model.SHAP value was used to interpret the model and quantify the contribution of each ultrasound feature "for PTC diagnosis.Results " "There was significant difference in solid composition proportion between the training and testing sets(Plt;0.05),while there were no significant differences in the proportion of ill-defined/irregular/extrathyroidal extension margins,aspect ratio(A/T)gt;1,ultrasound grayscale ratio(UGSR)lt;0.83,and microcalcifications.In the training set,PTC nodules exhibited significantly higher proportion of A/Tgt;1,UGSRlt;0.83,microcalcifications,ill-defined/irregular/extrathyroidal extension margins,and solid composition compared to NG nodules(all Plt;0.001).ROC curve analysis showed the area under the curve(AUC) of XGBoost model in the training and testing sets were 0.941(95%CI:0.895~0.987) and 0.921 (95%CI:0.846~0.996),respectively,with accuracies of 88.0% and 86.0%,sensitivities of 92.9% and 93.5%,and specificities of 87.2% and 77.5%,respectively.Calibration curve indicated good model fit for both sets.SHAP interpretation revealed that all ultrasound features positively contributed to PTC diagnosis,ranked by weight as follows: UGSRlt;0.83,solid composition,ill-defined/irregular/extrathyroidal extension margins,microcalcifications,and A/Tgt;1.Conclusion " "SHAP-based interpretation of the XGBoost ultrasound model quantifies the diagnostic impact of ultrasound features,demonstrating good clinical value for diagnosing PTC with a maximum diametergt;1 cm.
KEY WORDS " "Ultrasonography;Papillary thyroid carcinoma;Ultrasound grayscale ratio;SHAP values;XGBoost
甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)具有相對惰性的生物學行為,患者首診時淋巴結(jié)轉(zhuǎn)移率約為20%~90%,其中最大徑gt;1 cm的PTC患者淋巴結(jié)轉(zhuǎn)移率達78.4%[1],準確對其進行定性診斷具有重要的臨床意義。目前,甲狀腺結(jié)節(jié)超聲診斷指南已有多個版本[2],如美國放射學會發(fā)布的甲狀腺影像報告與數(shù)據(jù)系統(tǒng)(American College of Radiology Thyroid Imaging Reporting and Data Systems,ACR-TIRADS)、韓國放射學會和甲狀腺放射學會聯(lián)合發(fā)布的甲狀腺影像報告與數(shù)據(jù)系統(tǒng)(Korean Thyroid Imaging Reporting and Data Systems,K-TIRADS)及中華醫(yī)學會超聲醫(yī)學分會發(fā)布的甲狀腺影像報告與數(shù)據(jù)系統(tǒng)(Chinese Thyroid Imaging Reporting and Data Systems,C-TIRADS),盡管這些指南通過結(jié)構(gòu)化評估提高了診斷標準化程度,然而不同版本對超聲征象的解讀規(guī)則和權(quán)重分配存在顯著差異。C-TIRADS雖更適用于我國人群[3],但對結(jié)節(jié)回聲性質(zhì)的判斷存在較大的主觀差異,且邊緣模糊/不規(guī)則/腺外侵犯、內(nèi)部極低回聲、實性、縱橫比(A/T)gt;1和微鈣化這5項超聲征象在甲狀腺良惡性結(jié)節(jié)診斷中的貢獻各不相同,但C-TIRADS賦予其相等的分值,故臨床應用存在局限。近年來,可解釋性機器學習技術(shù)為彌補上述不足提供了新思路?;诓┺恼摰腟HAP值能夠量化各特征變量對模型預測結(jié)果的貢獻,而XGBoost算法憑借其高效的集成學習機制,在醫(yī)學影像特征分析中表現(xiàn)出卓越性能。本研究通過構(gòu)建XGBoost超聲模型,以SHAP值解析超聲因素對最大徑gt;1 cm PTC的判別貢獻度,旨在為優(yōu)化C-TIRADS的權(quán)重分配提供參考依據(jù)。
資料與方法
一、研究對象
選取2022年6月至2023年11月西湖大學附屬杭州市第一人民醫(yī)院經(jīng)病理確診的PTC患者138例(145枚結(jié)節(jié))和結(jié)節(jié)性甲狀腺腫患者127例(141枚結(jié)節(jié))。PTC中男34例,女104例,年齡16~78歲,平均(43.1±12.9)歲,結(jié)節(jié)最大徑11~65 mm,中位數(shù)17.0(13.0,21.0)mm;NG中男26例,女101例,年齡21~77歲,平均(54.7±11.3)歲,結(jié)節(jié)最大徑11~75 mm,中位數(shù)23.0(16.0,35.5)mm。PTC與NG患者一般資料比較差異均無統(tǒng)計學意義。排除標準:①結(jié)節(jié)最大徑≤1 cm;②結(jié)節(jié)以囊性成分或鈣化為主。將286枚結(jié)節(jié)以8∶2的比例隨機分為訓練集(PTC 114枚,NG 115枚)和測試集(PTC 31枚,NG 26枚)。本研究經(jīng)我院醫(yī)學倫理委員會批準(批準號:ZN-20230828-0188-01),所有患者均知情同意。
二、儀器與方法
1.超聲檢查:使用GE Logiq E11彩色多普勒超聲診斷儀,探頭頻率4~13 MHz?;颊呷⊙雠P位,充分暴露甲狀腺區(qū)域,依次掃查甲狀腺左右葉及峽部,記錄結(jié)節(jié)數(shù)量、最大徑、A/T、邊緣、內(nèi)部回聲及鈣化情況。通過 RADinfo閱片系統(tǒng),在同一增益水平測量甲狀腺結(jié)節(jié)及周圍正常甲狀腺組織的灰階值,測量結(jié)節(jié)感興趣區(qū)(ROI) 時需避開鈣化和囊性區(qū)域;測量周圍正常甲狀腺組織的灰階值時,其ROI應與結(jié)節(jié)的ROI一致。計算超聲灰階比值(UGSR),公式為:UGSR=同一增益水平甲狀腺結(jié)節(jié)灰階值/甲狀腺周圍正常組織灰階值。
2.XGBoost超聲模型的構(gòu)建及應用:比較訓練集中PTC患者與NG患者超聲檢查結(jié)果的差異,采用XGBoost算法基于差異有統(tǒng)計學意義的超聲因素構(gòu)建XGBoost超聲模型;通過SHAP值解析XGBoost超聲模型,明確各超聲因素診斷PTC的權(quán)重。
三、統(tǒng)計學處理
應用SPSS 25.0統(tǒng)計軟件和Python語言(3.71版本),計數(shù)資料以頻數(shù)或率表示,采用 χ2檢驗?;谑茉囌吖ぷ魈卣鳎≧OC)曲線獲取訓練集中UGSR診斷PTC的截斷值,將其轉(zhuǎn)為二分類變量進行統(tǒng)計分析;繪制ROC曲線分析XGBoost超聲模型對訓練集和測試集中PTC的診斷效能;校準曲線評估模型的校準度。Plt;0.05為差異有統(tǒng)計學意義。
結(jié) "果
一、UGSR診斷訓練集中PTC的截斷值及效能分析
ROC曲線分析顯示,UGSR診斷訓練集中PTC的曲線下面積(AUC)為0.814,對應的截斷值為0.83,診斷靈敏度和特異度分別為91.7%和63.5%。本研究將UGSRlt;0.83賦值為1,UGSR≥0.83賦值為0,進行分類變量比較。見圖1。
二、訓練集與測試集超聲檢查結(jié)果比較
訓練集與測試集結(jié)節(jié)實性占比比較差異有統(tǒng)計學意義(Plt;0.05),邊緣模糊/不規(guī)則/腺外侵犯、A/Tgt;1、UGSRlt;0.83、微鈣化占比比較差異均無統(tǒng)計學意義。見表1。
三、訓練集中PTC與NG超聲檢查結(jié)果比較
訓練集中PTC與NG A/Tgt;1、UGSRlt;0.83、微鈣化、邊緣模糊/不規(guī)則/腺外侵犯、實性占比比較差異均有統(tǒng)計學意義(均Plt;0.001)。見表2和圖2。
四、XGBoost超聲模型的構(gòu)建及診斷效能分析
納入A/Tgt;1、UGSRlt;0.83、微鈣化、邊緣模糊/不規(guī)則/腺外侵犯、實性構(gòu)建XGBoost超聲模型。ROC曲線分析顯示,XGBoost超聲模型診斷訓練集和測試集中PTC的曲線下面積(AUC)分別為0.941(95%可信區(qū)間:0.895~0.987)和0.921(95%可信區(qū)間:0.846~0.996),準確率、靈敏度、特異度分別為88.0%、92.9%、83.2%和86.0%、93.5%、77.5%。見圖3。校準曲線分析顯示,XGBoost超聲模型診斷訓練集和測試集中PTC的預測曲線與理想曲線貼合,校準度均較好。見圖4。
五、XGBoost超聲模型的SHAP值解析
各超聲因素對診斷PTC均為正向貢獻,其權(quán)重從高到低依次為:UGSRlt;0.83、實性、邊緣模糊/不規(guī)則/腺外侵犯、微鈣化和A/Tgt;1,絕對SHAP值分別約為1.31、1.12、0.72、0.57、0.25。見圖5。
討 "論
目前,不同版本甲狀腺結(jié)節(jié)診斷指南中的超聲征象評估標準存在差異,且對其權(quán)重的定義不夠明確[2-4]?;谧畲髲絞t;1 cm PTC相較于微小結(jié)節(jié)具有更高的淋巴結(jié)轉(zhuǎn)移率[1]這一特征,本研究區(qū)別于既往聚焦甲狀腺微小癌的研究[5-7],旨在系統(tǒng)探討超聲因素(回聲、微鈣化、結(jié)構(gòu)、形態(tài)及邊緣)在鑒別最大徑gt;1 cm PTC與NG中的權(quán)重分配機制。本團隊前期[5-7]研究已表明UGSR對甲狀腺微小癌具有重要的鑒別診斷價值,但在最大徑gt;1 cm PTC 中,其診斷價值尚未明確,因此需要引入新的定量指標分析各超聲因素權(quán)重。本研究通過構(gòu)建XGBoost超聲模型,并結(jié)合SHAP值[8]解析多特征交互效應,實現(xiàn)超聲診斷最大徑gt;1 cm PTC的可解釋性量化。
傳統(tǒng)依靠頸前帶狀肌與甲狀腺回聲對比來劃分甲狀腺病變回聲(如無回聲、極低回聲、低回聲、等回聲、高回聲五類)的方式受觀察者主觀判斷影響大,從而在一定程度上降低了回聲在PTC診斷中的作用。本研究將回聲強度以UGSR表示,可有效降低不同超聲儀器、操作人員、增益、動態(tài)設置等因素導致回聲判斷的不穩(wěn)定性。本研究ROC曲線分析顯示,UGSR診斷PTC的AUC為0.814,對應的截斷值為0.83,診斷靈敏度和特異度分別為91.7%和63.5%,提示其具有一定的診斷潛力,為臨床提供了新的參考依據(jù)。此外,本研究中UGSR診斷最大徑gt;1 cm PTC的截斷值(0.83)明顯高于前期研究[6]報道(0.68~0.70),分析原因為隨著結(jié)節(jié)的增大,可能導致更多的結(jié)構(gòu)異質(zhì)性,如血管增生在超聲圖像上表現(xiàn)為高回聲或等回聲,使UGSR的截斷值偏高。本研究結(jié)果顯示,訓練集中PTC與NG在結(jié)節(jié)A/Tgt;1、UGSRlt;0.83、微鈣化、邊緣模糊/不規(guī)則/腺外侵犯、實性占比方面比較差異均有統(tǒng)計學意義(均Plt;0.001),反映了PTC的惡性生物學行為。與既往研究[4]結(jié)果一致。分析原因可能為PTC組織成分排列緊湊,纖維化明顯,存在砂粒體,且呈浸潤性生長,與NG的良性生物學行為有明顯差異。
AUC是評估模型性能的重要指標,既往Zheng等[9]和Zhang等[10]基于甲狀腺結(jié)節(jié)的結(jié)構(gòu)、回聲、形態(tài)、邊緣、強回聲灶建立Logistic回歸模型,其診斷甲狀腺結(jié)節(jié)良惡性的AUC為0.685~0.924。本研究基于C-TIRADS選取了A/Tgt;1、UGSRlt;0.83、微鈣化、邊緣模糊/不規(guī)則/腺外侵犯、實性共5個超聲因素構(gòu)建模型,ROC曲線分析顯示XGBoost超聲模型診斷訓練集和測試集中PTC的AUC分別為0.941和0.921,高于上述研究,分析與以下因素有關(guān):①既往研究基于TIRADS選取超聲因素,而本研究除UGSR外均依據(jù)C-TIRADS選取超聲因素,更適合我國患者;②本研究用UGSR代替?zhèn)鹘y(tǒng)回聲,減少了觀察者主觀判斷的不穩(wěn)定性,提高了模型的診斷效能;③既往研究均未設置獨立測試集對模型進行驗證,導致模型的穩(wěn)健性和泛化能力無法得到充分檢驗,存在過擬合風險。本研究設置獨立測試集,ROC曲線分析和校準曲線分析均證實XGBoost超聲模型具有較好的穩(wěn)健性和泛化能力。
現(xiàn)有研究[11-12]大多依賴比值比評估單一特征或線性模型的全局關(guān)聯(lián),而SHAP值能夠評估機器學習模型中多特征間的交互或非線性關(guān)系,提供更全面的診斷信息。本研究結(jié)果顯示,各超聲因素對診斷PTC均為正向貢獻,其權(quán)重從高到低依次為:UGSRlt;0.83、實性、邊緣模糊/不規(guī)則/腺外侵犯、微鈣化和A/Tgt;1。其中“UGSRlt;0.83”的SHAP值最高,為1.31,其機制可能與PTC分化程度低、間質(zhì)成分少有關(guān),隨著結(jié)節(jié)增大,血管和纖維組織增生,導致回聲出現(xiàn)變化[13];“實性”的SHAP值為1.12,其機制一方面為PTC囊變較NG少,另一方面為本研究納入樣本排除了以囊性成分為主的結(jié)節(jié),其中大多為NG,導致其權(quán)重出現(xiàn)一定程度降低;“邊緣模糊/不規(guī)則/腺外侵犯”的SHAP值為0.72,其機制與瘤體浸潤性生長方式有關(guān);“微鈣化”的SHAP值為0.57,其機制為鈣化是PTC的重要征象,主要部分為砂粒體,組織來源可能是發(fā)生貧血性梗死的乳頭結(jié)構(gòu),也可能是間質(zhì)成分中的纖維膠原化[14],但操作者易將微小囊壁、濃縮膠體等誤判為微鈣化,一定程度上會降低其在模型中的權(quán)重;“A/Tgt;1”的SHAP值僅為0.25,其機制一方面與最大徑gt;1 cm PTC在前后方向生長時易受到甲狀腺被膜的限制而向左右/上下方向生長有關(guān),另一方面可能與結(jié)節(jié)內(nèi)部纖維膠原化的各乳頭結(jié)構(gòu)相互牽拉有關(guān)[14],從而降低了該因素在模型中的權(quán)重。在實際應用中,臨床醫(yī)師可以利用SHAP值在制定診斷標準時區(qū)分各因素的權(quán)重。
綜上所述, 利用SHAP值對XGBoost超聲模型進行解析可以實現(xiàn)各超聲因素診斷效能的量化,在診斷最大徑gt;1 cm PTC中具有較好的臨床應用價值。但本研究為回顧性研究,樣本量有限,所得結(jié)果有待今后行大樣本、前瞻性、多中心研究深入探討。
參考文獻
[1] Sun H,Zhao X,Wang X,et al.Correlation analysis of risk factors for cervical lymphatic metastasis in papillary thyroid carcinoma[J].Diagn Pathol,2024,19(1):13.
[2] Zhu H,Yang Y,Wu S,et al.Diagnostic performance of US-based FNAB criteria of the 2020 Chinese guideline for malignant thyroid nodules:comparison with the 2017 American College of Radiology guideline,the 2015 American Thyroid Association guideline,and the 2016 Korean Thyroid Association Guideline[J].Quant Imaging Med Surg,2021,11(8):3604-3618.
[3] Qi Q,Zhou A,Guo S,et al.Explore the diagnostic efficiency of Chinese thyroid imaging reporting and data systems by comparing with the other four systems(ACR TI-RADS,Kwak-TIRADS,KSThR-TIRADS,and EU-TIRADS):a single-center study[J].Front Endocrinol,2021,12(10):706978.
[4] 中華醫(yī)學會超聲醫(yī)學分會淺表器官和血管學組,中國甲狀腺與乳腺超聲人工智能聯(lián)盟.2020甲狀腺結(jié)節(jié)超聲惡性危險分層中國指南:C-TIRADS[J].中華超聲影像學雜志,2021,30(3):185-200.
[5] Han Z,F(xiàn)eng N,Lu Y,et al.A control study on the value of the ultrasound grayscale ratio for the differential diagnosis of thyroid micropapillary carcinoma and micronodular goiter in two medical centers[J].Front Oncol,2021,10(1):625238.
[6] Feng N,Wei P,Kong X,et al.The value of ultrasound grayscale ratio in the diagnosis of papillary thyroid microcarcinomas and benign micronodules in patients with Hashimoto’s thyroiditis:a two-center controlled study[J].Front Endocrino,2022,13(8):949847.
[7] Gong Y,Yao X,Yu L,et al.Ultrasound grayscale ratio:a reliable parameter for differentiating between papillary thyroid microcarcinoma and micronodular goiter[J].BMC Endocr Disord,2022,22(1):75.
[8] Li X,Zhou Y,Dvornek NC,et al.Efficient Shapley explanation for features importance estimation under uncertainty[J].Med Image Comput Comput Assist Interv,2020,12261(9):792-801.
[9] Zheng Y,Xu S,Zheng Z,et al.Ultrasonic classification of multicategory thyroid nodules based on Logistic regression[J].Ultrasound Q,2020,36(2):146-157.
[10] Zhang X,Ze Y,Sang J,et al.Risk factors and diagnostic prediction models for papillary thyroid carcinoma[J].Front Endocrinol,2022,13(9):938008.
[11] 李子鳳,王金萍,朱琳,等.常規(guī)超聲聯(lián)合剪切波彈性成像多參數(shù)權(quán)重法鑒別甲狀腺結(jié)節(jié)的臨床價值[J].臨床超聲醫(yī)學雜志,2023,25(9):696-700.
[12] 留碧麗,夏文霞,李敏,等.超聲檢查及引導穿刺活檢在甲狀腺微小結(jié)節(jié)良惡性中的鑒別診斷價值[J].醫(yī)學影像學雜志,2021,31(11):1864-1867.
[13] Seyrek NC,Baser H,Topaloglu O,et al.Ultrasonographicalclinical and histopathological features of 1264 nodules with papillary thyroid carcinoma and microcarcinoma based on tumor size[J].Arch Endocrinol Metab,2021,64(5):533-541.
[14] 虞紅珍,徐天宇,程嵐卿,等.甲狀腺結(jié)節(jié)超聲C-TIRADS 5征象的組織病理結(jié)構(gòu)影響因素分析[J].臨床與實驗病理學雜志,2023,39(4):433-438.
(收稿日期:2024-07-02)