曾鳳霞,劉仁懿,曾 輝,陳衛(wèi)國,秦耿耿
(南方醫(yī)科大學南方醫(yī)院放射科,廣東 廣州 510515)
肝細胞癌(hepatocellular carcinoma, HCC)是全球第二大癌癥相關(guān)死亡疾病[1],占原發(fā)性肝癌的90%,術(shù)后復發(fā)率和轉(zhuǎn)移率均較高[2],5年復發(fā)率高達45%~60%[3-4]。分化程度是決定HCC侵襲性的重要因素,低分化HCC易發(fā)生轉(zhuǎn)移,預后差,準確預測分化程度有助于早期干預及評估預后[5]。目前主要通過病理組織學檢查評價HCC分化程度,而穿刺活檢存在并發(fā)癥風險[6]。作為新興的醫(yī)學圖像處理方法,影像組學已在腫瘤研究領(lǐng)域顯示出巨大潛力[7]。本研究觀察臨床、CT影像組學及融合模型預測HCC分化程度的效能。
1.1 研究對象 回顧性分析2014年1月—2019年12月330例于南方醫(yī)科大學南方醫(yī)院經(jīng)病理證實的HCC患者,男284例,女46例,年齡18~87歲,平均(52.5±12.0)歲。納入標準:①年齡≥18歲;②病理學診斷為HCC,且分化程度明確;③CT檢查前未經(jīng)任何治療,且與穿刺或手術(shù)時間間隔≤3個月;④CT圖像質(zhì)量符合診斷要求。根據(jù)HCC分化程度將患者分為高分化組(n=85)、中分化組(n=161)及低分化組(n=84)。檢查前患者均簽署知情同意書。
1.2 儀器與方法 采用Siemens Somatom Definition CT機/Philips Brilliance 64排CT掃描儀。囑患者仰臥,行上腹部軸位CT平掃,掃描參數(shù):管電壓120 kVp,管電流80 mAs,旋轉(zhuǎn)時間0.5 s/0.8 s,層間距0/5 mm,層厚5 mm。之后經(jīng)肘前靜脈以2.0~3.0 ml/s流率注射優(yōu)維顯370對比劑(1.0~1.5 ml/kg體質(zhì)量),分別于開始注射后30~35 s、60~65 s、120 s采集動脈期、門靜脈期、延遲期CT圖像。見圖1。
圖1 患者男,50歲,低分化HCC A~D.分別為平掃、動脈期、門靜脈期及延遲期CT圖像,臨床模型預測低分化HCC概率為0.33,影像組學模型預測概率為0.56,融合模型為0.61; E.病理圖(HE,×400)
1.3 圖像分析 將CT圖像輸入至ITK-SNAP軟件,由1名具有5年工作經(jīng)驗的放射科醫(yī)師在不知曉病理結(jié)果的情況下針對顯示病灶最大層面平掃及增強CT圖像勾畫ROI并測量或評估病灶基本征象,包括病灶直徑、形態(tài)、密度、邊界及包膜,以及有無肝硬化、靜脈內(nèi)癌栓、膽管擴張、非環(huán)狀動脈期高強化及非邊緣廓清等,并經(jīng)另1名具有10年以上工作經(jīng)驗的放射科醫(yī)師確認,意見不一致時經(jīng)協(xié)商達成共識。采用Python 3.7/Pyradiomics 2.2.0/Sklearn 0.20.3等開源軟件提取ROI的影像組學特征,并采用t檢驗、假陽性率檢驗、主成分分析等方法減少特征冗余。
1.4 臨床資料 記錄血清谷丙轉(zhuǎn)氨酶(glutamic-pyruvic transaminase, GPT)、谷草轉(zhuǎn)氨酶(glutamic-oxaloacetic transaminase, GOT)、甲胎蛋白(alpha-fetal protein, AFP)、總膽紅素(total bilirubin, TBIL)、白蛋白(albumin, ALB)及血小板(platelet, PLT)等。
1.5 模型構(gòu)建與驗證 將每組HCC患者按3∶1比例隨機納入訓練集和測試集。通過10倍交叉驗證法訓練訓練集,并選擇評估性能最佳模型,利用測試集數(shù)據(jù)評估模型預測效能。以局部可解釋性技術(shù)SHAP(shapley additive explanation)計算每個特征的重要性,SHAP值=原始預測值-刪除1個特征后預測值,結(jié)果為正數(shù)表示該特征支持預測,即該特征與分化程度呈正相關(guān),負數(shù)則表示預測不受支持,即該特征與分化程度呈負相關(guān)。將篩選得出的影像組學特征、臨床資料及CT征象納入支持向量機,分別構(gòu)建臨床模型(臨床資料+CT征象)、影像組學模型(組學特征)及融合模型(臨床資料+CT征象+影像組學特征)。
1.6 統(tǒng)計學分析 采用SPSS 22.0及Medcalc軟件進行統(tǒng)計學分析。以±s表示計量資料,組間比較采用t檢驗;以頻數(shù)表示計數(shù)資料,組間比較采用獨立樣本χ2檢驗。繪制受試者工作特征(receiver operating characteristic, ROC)曲線,計算曲線下面積(area under the curve, AUC)評價各模型的預測效能,AUC>0.90為診斷效能好,0.75 2.1 臨床資料 3組間性別、年齡、GPT、TBIL及ALB差異均無統(tǒng)計學意義(P均>0.05)。中、低分化組間GOT存在顯著差異(t=-2.27,P=0.02);高、低分化組間PLT存在顯著差異(t=2.25,P=0.03);高分化組與中、低分化組AFP差異均具有統(tǒng)計學意義(P均<0.05),見表1。 表1 不同分化程度HCC患者臨床資料比較 2.2 CT征象 3組間病灶邊界及形態(tài)差異均具有統(tǒng)計學意義(P均<0.05);高分化組與中、低分化組間病灶直徑、密度及靜脈內(nèi)癌栓情況差異均有統(tǒng)計學意義(P均<0.05);高、中分化組間肝內(nèi)膽管擴張情況差異顯著(χ2=6.14,P=0.01);高、低分化組間非動脈期高強化情況差異顯著(χ2=4.98,P=0.03),見表2。 表2 不同分化程度HCC的CT征象比較 2.3 CT影像組學特征 共于訓練集中提取428個影像組學特征,其中形狀特征56個、一階特征72個、灰度特征140個、紋理特征160個。通過特征篩選及10倍交叉驗證后調(diào)整模型參數(shù),最終CT影像組學模型共納入109個特征用于鑒別高、中分化HCC,84個鑒別中、低分化HCC,159個鑒別高、低分化HCC。 2.4 模型效能 3種模型鑒別中、低分化HCC的效能均一般,臨床模型AUC為0.58,影像組學模型及融合模型的AUC均為0.64(P均>0.05),見表3及圖2。其中CT影像組學模型鑒別高、中分化HCC,融合模型鑒別高、低分化HCC的AUC最高,分別為0.80、0.88,但與其他模型差異均無統(tǒng)計學意義(P均>0.05)。 表3 各模型鑒別不同分化程度HCC的效能 圖2 各模型鑒別不同分化程度HCC的ROC曲線 A.高、低分化HCC; B.高、中分化HCC; C.中、低分化HCC 2.5 篩選特征 根據(jù)SHAP圖(圖3),鑒別高、中分化HCC的前10個重要特征中,6個來自門靜脈期組學特征,來自平掃和延遲期各2個;鑒別高、低分化HCC的前10個重要特征中,臨床及影像征象各5個。CT影像組學特征中,與分化程度相關(guān)性較高者包括灰度區(qū)域大小矩陣(gray-level size zone matrix, GLSZM)、灰度共生矩陣(gray-level cooccurrence matrix, GLCM)、灰度依賴矩陣及一階特征等。AFP水平、邊界、密度、形態(tài)及表征紋理一致性的GLSZM及表征灰度空間分布特征的GLCM等與分化程度呈正相關(guān),門靜脈期病灶灰度值的90%百分位數(shù)及中位數(shù)等與分化程度呈負相關(guān)。 圖3 鑒別高、低分化HCC(A)與高、中分化HCC(B)效能最優(yōu)模型的特征SHAP圖(接近紅色表示特征值高,接近藍色表示特征值低) 既往HCC影像組學研究多集中于評價不同類型醫(yī)學影像學征象與HCC分化程度的關(guān)系。YOON等[8]認為HCC強化模式與其分化程度相關(guān),但本研究所見非環(huán)狀動脈期高強化僅在高、低分化組間具有顯著差異,非邊緣廓清在各組間均無顯著統(tǒng)計學差異,可能與腫瘤異質(zhì)性及樣本差異有關(guān)。多項研究[9-10]表明,病灶大小是預測HCC分化程度的重要因素,中分化HCC直徑大于高分化HCC;本研究結(jié)果與之相符。本研究臨床模型對于鑒別高、低分化HCC具有較好效能,但鑒別高、中分化及中、低分化HCC的效能均一般,提示根據(jù)肉眼所見影像學征象區(qū)分分化程度差異較小的HCC存在局限性。 組學特征可有效評估HCC的生物學特性及預后[11-12]。本研究中,CT影像組學模型鑒別高分化與中、低分化HCC的AUC較高,提示其具有較高效能;融合模型鑒別高、低分化HCC效能較高,但鑒別高、中分化HCC的AUC略低于CT影像組學模型,可能由于納入了冗余特征,而篩選特征時刪去了部分有用特征,導致模型效能降低。本研究3種模型鑒別中、低分化HCC的效能均一般,可能與中分化與低分化HCC惡性程度均較高,其影像學表現(xiàn)差異較小以及樣本量有關(guān)。 目前支持向量機、隨機森林和人工神經(jīng)網(wǎng)絡(luò)等機器學習方法均不具有可解釋性,導致相應(yīng)影像組學模型亦缺乏可解釋性[13]。本研究采用SHAP技術(shù)計算模型納入特征的重要性,增加了模型的可解釋性;AFP水平、病灶邊界、密度、形態(tài)等在鑒別高、低分化HCC時重要性較高,與既往文獻[14]報道相符。CT影像組學特征中,表征紋理一致性的GLSZM、表征灰度空間分布特征的GLCM、反映ROI內(nèi)像素強度分布的一階特征與HCC分化程度相關(guān)性較高;其中平掃圖像中灰度不均勻性與模型輸出值呈負相關(guān),即病灶灰度越不均勻,HCC為低分化的可能性越大。本研究SHAP圖示門靜脈期一階特征中的灰度第90百分位數(shù)值與模型輸出值呈負相關(guān),表明對比劑清除越慢,越傾向于高分化HCC。根據(jù)影像組學特征可較好地評估腫瘤的異質(zhì)性,捕捉肉眼不可見的重要信息,為評估HCC分化程度及精準治療提供理論依據(jù)。 綜上,本研究構(gòu)建3種術(shù)前預測HCC分化程度模型,在不增加額外掃描時間及費用的前提下獲得了較好預測效能,其中臨床模型評估高、低分化HCC的效能較高,影像組學模型評估高分化與中、低分化HCC的較能較高,融合模型評估高、低分化HCC的效能較高,提示其有望成為術(shù)前評估HCC分化程度提供有效的輔助手段。但本研究樣本構(gòu)成均一性有所欠缺,以中分化HCC居多;僅于病灶最大徑層面勾畫ROI,缺乏三維影像組學特征信息;且單一模態(tài)成像對病灶細節(jié)顯示不足,有待進一步深入觀察。2 結(jié)果
3 討論