高麗麗 潘仕達 張亦瑾 高學松 蘇楠 徐琍 段雪飛
原發(fā)性膽汁性膽管炎(PBC)是一種自身免疫性的肝內(nèi)膽汁淤積性疾病,可慢性進展至終末期肝病,病因和具體發(fā)病機制尚不清楚[1]。據(jù)最新報道,全球的年發(fā)病率為0.23/10 萬~ 5.31/10 萬,患病率為1.91/10 萬~ 40.20/10 萬,呈逐年上升的趨勢[2]。我國目前缺乏基于人群的流行病學證據(jù),一項薈萃分析的研究顯示,我國PBC 的患病率大約有20.5/10 萬[3]。熊去氧膽酸(UDCA)是目前唯一安全有效的一線治療藥物,遺憾的是,臨床上仍有40%的患者應(yīng)答不佳。這些應(yīng)答不佳的患者長期預(yù)后差、生存率低[4]。目前越來越多二線藥物在不同的臨床試驗中顯示有效,因此在臨床上早期識別應(yīng)答不佳的患者,對這些患者加強監(jiān)測,及時加用二線用藥,對于改善這部分患者的預(yù)后意義重大[5]。
以2016 年1 月至2018 年1 月經(jīng)首都醫(yī)科大學附屬北京地壇醫(yī)院以及中國人民解放軍總醫(yī)院第五醫(yī)學中心確診的106 例PBC 患者為建模組。PBC 的診斷主要依據(jù)2021 年中華醫(yī)學會肝病學分會更新的《PBC 診斷和治療指南》,需符合三項診斷標準中的兩項:①存在膽汁淤積的生物化學證據(jù),且影像學檢查排除了肝外或肝內(nèi)大膽管梗阻;②抗線粒體抗體(AMA)/AMA-M2 陽性,或其他PBC 特異性自身抗體(抗gp210 抗體、抗sp100 抗體)陽性;③組織學上有非化膿性破壞性膽管炎和小膽管破壞的證據(jù)[1]。排除合并其他自身免疫性肝病、系統(tǒng)自身免疫性疾病、代謝相關(guān)脂肪性肝病、各種病毒性肝炎、長期大量飲酒、半年內(nèi)使用可疑肝損傷藥物、原發(fā)性肝癌、其他肝臟腫瘤及臨床資料不完整者。建模組患者需接受UDCA 標準治療13~15 mg/(kg·d)滿1 年。根據(jù)巴黎Ⅱ標準及1 年后檢查結(jié)果,分為應(yīng)答不佳組(n = 38)和完全應(yīng)答組(n = 68)。巴黎Ⅱ標準為:應(yīng)用UDCA 1 年后,患者堿性磷酸酶(ALP)<1.5 正常上限(ULN),AST<1.5 ULN 和總膽紅素<1 mg/dL[1]。
以2018 年1 月至6 月初次就診于地壇醫(yī)院的47 例PBC 患者為驗證組,入組及排除標準同建模組。本研究經(jīng)地壇醫(yī)院倫理委員會審查通過[批件號:京地倫科字[2017]第(055)-01 號],且所有患者均知情同意,患者本人或患者法定代理人簽署知情同意書。
符合建模組入組條件的患者,記錄患者姓名、年齡、性別。記錄患者基線時的肝腎功能、血脂、血糖、血電解質(zhì)、血常規(guī)、凝血功能、自身抗體、特種蛋白、輔助性T 淋巴細胞亞群及自然殺傷細胞。記錄腹部彩色多普勒超聲(彩超)檢查,包括腹水、門靜脈直徑。符合驗證組入組條件的患者完善上述檢查,并給予標準劑量UDCA 治療1年。所有驗證組患者均隨訪1 年。
采用SPSS 26.0(SPSS Inc, Chicago, IL, USA)進行統(tǒng)計分析,使用GraphPad Prism 9.0.2 對統(tǒng)計結(jié)果進行作圖。正態(tài)分布資料以表示,采用Student-t 檢驗進行比較。非正態(tài)分布的資料以M(P25,P75)表示,比較采用Mann-Whitney U 檢驗。計數(shù)資料以頻數(shù)(%)表示。以單因素分析為基礎(chǔ),選擇有統(tǒng)計學意義(P < 0.05)及臨床意義較大的變量進行多因素logistic 回歸分析(進入法),并進行最優(yōu)質(zhì)型擬合建立預(yù)測UDCA 療效的logistic 回歸模型,繪制受試者操作特征 (ROC) 曲線評估模型對其療效的預(yù)測概率,ROC 曲線下面積(AUC)評估預(yù)測性能的準確度,計算該模型的靈敏度和特異度。以P < 0.05 為差異有統(tǒng)計學意義。
建模組患者治療前臨床特點見表1。
表1 建模組PBC 患者治療前的臨床特點
標準UDCA 治療1 年后,根據(jù)檢查結(jié)果,參照巴黎Ⅱ標準,將建模組分為應(yīng)答不佳組與完全應(yīng)答組。將建模組基線資料進行單因素分析,結(jié)果發(fā)現(xiàn)初次就診時的膽堿酯酶、堿性磷酸酶、直接膽紅素、γ-谷氨酰轉(zhuǎn)肽酶、球蛋白、甘油三酯、總膽固醇、LDL-C、ESR、CD4+T 淋巴細胞計數(shù)、CD8+T 淋巴細胞計數(shù)在2 組之間存在統(tǒng)計學差異,可能與應(yīng)答不佳相關(guān)。見表2。
表2 與應(yīng)答不佳相關(guān)指標的單因素分析
以單因素分析為基礎(chǔ),選擇有統(tǒng)計學意義及臨床意義較大的變量進行多因素logistic 回歸分析(進入法),并進行最優(yōu)質(zhì)型擬合建立預(yù)測UDCA 療效的logistic 回歸模型,根據(jù)多因素非條件logistic 回歸分析結(jié)果,將患者初次就診時的膽堿酯酶、堿性磷酸酶、直接膽紅素納入模型?;貧w模型為:Y = 0.000339×膽堿酯酶(U/L)+2.227292×(是否低于2ULN 的ALP;1=是,2=否)+0.024151×直接膽紅素(μmol/L )。繪制ROC 曲線,ROC AUC 評估該模型對應(yīng)答不佳預(yù)測的靈敏度為88.6%,特異度為84.8%。見圖1A。
最終47 例患者完成隨訪,代入回歸模型中進行驗證,繪制ROC 曲線。根據(jù)ROC AUC 評估該模型,該模型對應(yīng)答不佳的預(yù)測能力為0.81(95%CI 0.69~0.94),見圖1B。近期一項國際多中心的大樣本研究也建立了預(yù)測應(yīng)答不佳的模型,該模型基于患者就診時年齡、從確診到治療的間隔時間、治療前ALP、治療過程中ALP 變化值、治療前總膽紅素、治療前轉(zhuǎn)氨酶,其預(yù)測能力評分為0.83(95% CI 0.79~0.87)[6]。雖 然 本 研 究 的 模 型預(yù)測能力評分不及該模型,但我們的指標更簡單,易操作。
圖1 UDCA 應(yīng)答不佳logistic 回歸模型ROC 曲線
PBC 是一種慢性進行性肝內(nèi)膽汁淤積性肝臟疾病,既往被認為是一種少見病。隨著診療技術(shù)的不斷進步,目前發(fā)現(xiàn)PBC 并不少見,且發(fā)病率和患病率呈逐年上升趨勢[2]。PBC 的一線治療藥物為UDCA,其有效性和安全性都得到業(yè)界一致認可[7-8]。一般對UDCA 完全應(yīng)答的患者,臨床預(yù)后均較好[9]。臨床上仍有40%的患者對UDCA 應(yīng)答不佳,這部分患者長期預(yù)后差、生存率低。目前越來越多的二線藥物被證明可以改善UDCA 應(yīng)答不佳患者的預(yù)后,及早鑒別UDCA 應(yīng)答不佳臨床意義重大[10-12]。
經(jīng)過單因素及多因素分析,本研究的模型中納入了ALP、直接膽紅素及膽堿酯酶3 個指標。ALP 的升高代表早期膽汁淤積,而直接膽紅素異常則提示疾病已經(jīng)到晚期的可能[13]。直接膽紅素與間接膽紅素(IBIL)共同組成總膽紅素。直接膽紅素是由IBLI 入肝后受肝內(nèi)葡萄糖醛酸基轉(zhuǎn)移酶的作用與葡萄糖醛酸結(jié)合生成的[14]。相較于總膽紅素、IBIL,多數(shù)學者認為直接膽紅素更能反映肝臟的病變情況[15]。膽堿酯酶在肝臟上皮細胞的內(nèi)質(zhì)網(wǎng)內(nèi)合成,是一種相關(guān)激素酶,屬于非特異性酯酶[16]。膽堿酯酶半衰期為 8~12 d,只可在肝臟內(nèi)合成,表達水平可反映肝臟上皮細胞內(nèi)質(zhì)網(wǎng)和線粒體的活性,可用于評估肝臟上皮細胞的功能狀態(tài)[17]。因膽堿酯酶受影響的因素較少,所以在肝臟功能狀態(tài)的評估中具有較高的靈敏度及準確性[18]。另外,本研究模型納入的指標簡單,基本所有醫(yī)院都能完成檢測。模型的靈敏度和特異度也較高,比較容易在臨床上廣泛推廣。
表3 與應(yīng)答不佳相關(guān)指標的多因素分析
目前國際上尚無統(tǒng)一的判斷UDCA 治療后的應(yīng)答標準,常見的有8 種,包括二分類標準的巴黎Ⅰ標準、巴黎Ⅱ標準、巴塞羅那標準、梅奧標準、多倫多標準、鹿特丹標準,以及最近的連續(xù)評分系統(tǒng):UK-PBC 標準、GLOBE 標準[1,19-21]。這些標準大多以UDCA 治療1 年作為評估生化應(yīng)答的時間點。但治療1 年后如評估為應(yīng)答不佳,再加用二線治療,患者則會錯過1 年的治療時間。在此期間疾病可能進展,從而影響部分患者,尤其是分期較晚患者的臨床預(yù)后。我們的模型只應(yīng)用患者就診基線時的指標,縮短了判定生化應(yīng)答的時間,為應(yīng)答不佳患者爭取治療時間。最近的國際多中心大樣本研究,也采用治療前的指標,可見應(yīng)用治療前的指標評估UDCA 應(yīng)答不佳是國內(nèi)外的一致需求[6]。
綜上所述,我們基于治療前的ALP、直接膽紅素、膽堿酯酶,建立了一個預(yù)測UDCA 應(yīng)答不佳的模型,納入指標簡單、無創(chuàng),容易被患者接受,且方便在臨床上推廣。當然本研究也存在不足之處:首先,我們建模的樣本量并不夠多,需要多中心、大樣本的數(shù)據(jù)進一步驗證該模型的建立是否合理;其次,我們的驗證組樣本量更少,對于該模型的驗證評價結(jié)果仍需擴大樣本量達到更精確判定的目的。