吳淑彬,王文志,吳 聰
經(jīng)皮冠狀動脈介入(percutaneous coronary intervention,PCI)可保證心肌缺血再灌注,進而改善預后,降低病死率。PCI術后支架內(nèi)再狹窄(in-stent restenosis,ISR)影響病人遠期預后[1]。PCI后ISR是一個復雜的過程,血管內(nèi)新生動脈硬化及急性血栓形成是主要的病理基礎,多種細胞因子參與血管平滑肌細胞向內(nèi)膜遷移和增殖,在遷移過程中發(fā)生了高分化的收縮型轉化為低分化的合成型,分泌大量膠原、彈力蛋白、纖維連接蛋白、層黏連蛋白、多糖等基質(zhì),沉積在血管壁,導致ISR發(fā)生[2]。血管內(nèi)皮損傷認為是PCI術后ISR的始動因素,其中糖脂代謝發(fā)揮著重要作用。ISR的發(fā)生常見于有慢性病史[3](糖尿病、高脂血癥)、復雜病變(旁路移植、分叉和病變長度較長)[4]、生化指標異常[低密度脂蛋白膽固醇(LDL-C)、胰島素抵抗指數(shù)等][5]的病人,其中LDL-C、胰島素抵抗指數(shù)等糖脂代謝已確定為PCI術后病人ISR風險的預測因素[6]。既往研究多采用邏輯回歸構建預測模型,但特征空間較大時,邏輯回歸性能不好[7]。隨機森林算法是一種新型的高度靈活的機器學習算法,不需假設數(shù)據(jù)符合某種分布和獨立性。隨機森林對多元共線性不敏感,結果對缺失數(shù)據(jù)較穩(wěn)健,可較好地預測多個解釋變量的作用。本研究引入隨機森林算法并基于糖脂代謝構建PCI病人ISR風險構建預測模型,旨在為PCI術后ISR的防治提供依據(jù),現(xiàn)報道如下。
1.1 病例選擇標準 納入標準:符合冠心病PCI治療適應證[8];首次接受PCI治療;具有較完整的臨床資料。排除標準:合并急性感染;既往有冠狀動脈旁路移植術病史;合并心源性休克、嚴重的室性心律失常等心臟疾病。
1.2 研究方案
1.2.1 研究思路 經(jīng)醫(yī)院倫理委員會批準,所有病人或家屬均簽署知情同意書。選取2018年7月—2020年10月我院接受PCI治療的325例病人,收集病人一般資料,并于PCI術后抽取靜脈血,檢測糖脂代謝指標。隨訪12個月,根據(jù)病人是否發(fā)生ISR分為ISR組和非ISR組,篩選術后ISR的影響因素,同時將病人隨機分為80%(訓練集)和20%(驗證集),構建隨機森林的集成分類算法模型,繪制受試者工作特征(ROC)曲線評估預測模型效能。
1.2.2 隨機森林的集成分類算法模型的構建及驗證 建模:收集病人臨床資料,包括人口學特征、PCI治療情況、支架類型等數(shù)據(jù)集。本研究樣本量為320例,以是否發(fā)生ISR為結局變量,引起病人術后ISR發(fā)生的變量作為解釋變量,采用Bootstrap自助法在原始數(shù)據(jù)中有放回地抽取出n個訓練樣本后建立n棵樹,這n棵樹組成一個隨機森林,進行數(shù)據(jù)綜合判別及分類;在生成樹過程中,從每個樹的節(jié)點處的所有變量中隨機抽取m個變量,通過m個變量選擇分類能力最強的變量進行數(shù)據(jù)分類。驗證:在Bootstrap中將剩余的未抽取的數(shù)據(jù)作為測試樣本,主要用于驗證每棵樹的性能。繪制ROC曲線驗證建立的模型。
1.2.3 治療方案 參照《中國經(jīng)皮冠狀動脈介入治療指南(2016)》中的操作方法進行,PCI前后分別給予阿司匹林和氯吡格雷等治療,同時靜脈注射肝素1×104U保證PCI術前激活的凝血時間。若有必要,在支架植入前進行球囊擴張,支架植入后,予以標準藥物治療。
1.2.4 資料收集 人口信息:年齡、性別和體質(zhì)指數(shù)(BMI);心血管危險因素:吸煙(定義為每日吸煙≥5支,連續(xù)1年以上)、高血壓[收縮壓≥140mmHg(1 mmHg=0.133 kPa)和(或)舒張壓≥90 mmHg]、糖尿病[既往診斷為糖尿病和(或)入院后多次測量空腹血糖≥7.0 mmol/L,餐后2 h血糖≥11.1 mmol/L]、高脂血癥、冠心病家族史。冠狀動脈介入情況:采用冠狀動脈造影定量分析技術對靶血管進行判讀,同時記錄病變支數(shù)(單支、多支病變)、支架個數(shù)、靶血管支架長度及最小支架直徑。
1.2.5 實驗室檢查 PCI術后抽取病人肘靜脈血4 mL,置于無菌采血管中抗凝,以3 000 r/min離心10 min,置于冰箱待測,采用全自動生化儀免疫分析儀(型號:Cobas8000型)以比色法檢測三酰甘油(TG)、以酶比色法測量血清肌酐(Scr)、總膽固醇(TC)、高密度脂蛋白膽固醇(HDL-C)、LDL-C并計算三酰甘油與高密度脂蛋白膽固醇比值(TG/HDL-C);以乳膠增強免疫比濁法測量超敏C反應蛋白(hs-CRP)、糖化血紅蛋白(HbA1c)水平;采用氧化酶法測量總膽紅素(TBIL)、空腹血糖(FBG)并計算三酰甘油-血糖指數(shù)(TyG)。檢測前對儀器進行校準,嚴格按照試劑說明書操作。
1.2.6 術后用藥 PCI術后治療阿司匹林、他汀類藥物、β受體阻滯劑、血管緊張素轉換酶抑制劑(ACEI)/血管緊張素受體阻滯劑(ARB)等。
1.3 隨訪及ISR評估 嚴格控制病人血糖、血脂、尿酸等,指導病人戒煙限酒。出院后每個月門診定期隨訪1次,隨訪12個月,記錄終點事件ISR發(fā)生情況,參照《中國經(jīng)皮冠狀動脈介入治療指南(2016)》指南[8]中關于ISR定義:與PCI后立即評估的管腔相比,12個月隨訪時支架植入段管腔狹窄≥50%。
1.4 質(zhì)量控制 嚴格按照納入與排除標準,確保病人資料真實可信,病人資料由專人收集并核對,對數(shù)據(jù)進行平行雙錄入,保證數(shù)據(jù)輸入準確無誤。
2.1 隨訪結果 截至2021年11月1日,最終320例病人獲得隨訪,其中36例(11.25%)病人發(fā)生ISR作為ISR組,284例(88.75%)病人未發(fā)生ISR作為非ISR組。
2.2 兩組臨床資料比較 ISR組年齡、TG/HDL-C、HbA1c、TyG、hs-CRP水平及高脂血癥比例、糖尿病比例高于非ISR組,差異有統(tǒng)計學意義(P<0.05)。詳見表1。
表1 兩組臨床資料比較
2.3 隨機森林模型的變量重要程度分析 根據(jù)隨機森林模型預測精度平均下降值對隨機森林模型各變量的重要程度進行排序,依次為TG/HDL-C、HbA1c、TyG、hs-CRP、糖尿病、高脂血癥、年齡。詳見圖1。
圖1 隨機森林模型中各特征的重要程度
2.4 隨機森林的集成分類算法模型構建 使用梯度提升回歸樹算法對隨機森林模型進行分析,從199棵決策樹開始,擴展的隨機森林算法誤差(均方差)逐漸趨于平緩,表明隨機森林算法的泛化能力逐漸增強。詳見圖2。
圖2 決策樹數(shù)目與OOB估計平均值的關系
2.5 基于糖脂代謝的PCI病人ISR風險預測模型效能 ROC曲線結果顯示,基于糖脂代謝的PCI病人ISR風險隨機森林預測模型的ROC曲線下面積(AUC)為0.916。詳見圖3。
圖3 基于糖脂代謝的PCI病人ISR風險預測模型的ROC曲線圖
PCI為介入心臟病學的技術革命性變化,該技術表現(xiàn)出較大的性能,可減少重復血管再生的必要性[9]。臨床研究表明,PCI的快速發(fā)展和血管內(nèi)超聲的廣泛應用,使得PCI適應證擴大,ISR發(fā)生率隨之增加[10]。由于支架動脈的易損性和內(nèi)皮再生的作用,支架部位具有明顯的新生內(nèi)膜增生,導致內(nèi)皮細胞功能障礙、異位增殖和血管平滑肌細胞遷移及炎癥反應等[11],在此過程中與炎癥密切相關的胰島素抵抗、血脂異常受到關注。循證醫(yī)學研究證據(jù)表明,脂質(zhì)代謝異常是冠心病的重要危險因素,降脂治療后,60%~70%病人可能發(fā)生冠心病[12]。Han等[13]研究顯示,TG是心血管疾病病人血管硬化的關鍵因素之一。有研究顯示,TG/HDL-C比值可評估冠心病的發(fā)病風險[14],提示TG/HDL-C可作為心血管疾病病人死亡的獨立預測因子。低TG/HDL-C水平主要表現(xiàn)為大的、非致動脈粥樣硬化的LDL-C顆粒;相反,高TG/HDL-C水平主要表現(xiàn)為小而致密的促動脈粥樣硬化LDL-C顆粒,與動脈粥樣硬化的發(fā)生和進展密切相關。TG/HDL-C比值是血管變化[15]、胰島素抵抗[16]和高脂血癥[17]的獨立危險因素的標志物。Caliskan等[18]一項研究中度冠心病風險受試者的風險標志物與頸動脈內(nèi)膜-中層厚度(cIMT)進展之間的關聯(lián)研究中,TG/HDL-C比值可獨立預測cIMT進展。本研究中ISR組TG/HDL-C比值較非ISR組高,且隨機森林預測模型顯示TG/HDL-C比值為排名首位的預測因素,說明TG/HDL-C比值對預測ISR具有重要意義。與TG/HDL-C高水平時,在脂質(zhì)交換和脂解過程中產(chǎn)生小而致密的LDL-C,可加重粥樣硬化,進而增加ISR發(fā)生風險。提示臨床重視脂代謝紊亂的控制和血脂異常的防治。
除脂代謝外,糖代謝水平在ISR中發(fā)揮著重要作用。TyG認為是胰島素抵抗的標志物[19]。隨著臨床研究深入,相關研究表明,TyG與高脂血癥[20]、動脈粥樣硬化甚至動脈粥樣硬化的進展[21]等心血管事件風險密切相關。相較于低TyG病人,高TyG病人更易罹患高脂血癥、糖尿病,對合并糖尿病病人,通過TyG可識別心血管風險較高的病人;對未合并糖尿病病人,即使FPG已達到指南目標,通過TyG仍可識別心血管風險增加的病人[22]。TyG不僅與冠狀動脈粥樣硬化和鈣化的快速進展呈正相關,并且是穩(wěn)定性冠心病病人長期預后不良的獨立危險因素。有研究顯示,TyG與男性和女性的臂踝脈搏波速度和冠狀動脈進展測量的動脈僵硬度相關[23]。本研究結果表明,TyG是ISR發(fā)生的獨立預測因子。因此推測,TyG與各種心臟代謝危險因素密切相關,通過誘導炎癥、氧化應激和代謝改變導致內(nèi)皮功能障礙,可能解釋了這種關聯(lián)。
在糖代謝方面,高血糖可能與ISR發(fā)生發(fā)展有關。一項單中心、前瞻性研究表明,PCI術前糖尿病病人發(fā)生主要心血管不良事件的風險高于非糖尿病病人[24]。一項回顧性研究表明,與血糖控制不佳的病人相比,在PCI非隨訪時血糖控制良好病人與主要不良心血管事件發(fā)生率降低相關[25]。本研究結果顯示,HbA1c水平可預測ISR發(fā)生,可能由高血糖直接或間接刺激活性氧、炎癥和代謝細胞因子產(chǎn)生,這些均不利于心肌和血管重塑。另有研究顯示,葡萄糖穩(wěn)態(tài)失調(diào)與內(nèi)皮功能障礙和心血管事件的高風險有關,內(nèi)皮功能障礙是ISR發(fā)生的重要預測因素[26]。內(nèi)皮功能障礙和延遲再內(nèi)皮化可能是高血糖條件下ISR發(fā)展的重要潛在機制。
本研究引入隨機森林算法,對醫(yī)學數(shù)據(jù)中的混雜數(shù)據(jù)、缺失值或離群值及較高維度的數(shù)據(jù)進行處理,通過多個決策樹對數(shù)據(jù)進行綜合分類及關聯(lián)性檢驗、預測和解釋,這些處理不易出現(xiàn)過擬合,使預測的精度更高。本研究結果顯示,hs-CRP、糖尿病、高脂血癥、年齡是ISR的獨立預測因素。以下原因可解釋本研究結果:①hs-CRP升高提示局部炎癥反應增強,激活血小板和纖維蛋白原招募到支架誘導的動脈壁直接損傷中,進一步促進動脈粥樣硬化斑塊再狹窄,增加再狹窄風險;②糖尿病病人可能存在晚期糖基化終末產(chǎn)物水平升高,活性氧增加,加速動脈粥樣硬化,最終導致再狹窄;③高脂血癥導致血液黏稠度增加,使血小板、巨噬細胞等在血管內(nèi)膜表面沉積,刺激血管平滑肌細胞釋放生長因子,導致血管平滑肌細胞增殖,增加再狹窄風險;④老年病人動脈壁較厚,抗凝能力下降,更易發(fā)生動脈粥樣硬化,導致再狹窄。繪制ROC曲線顯示,基于糖脂代謝的PCI病人ISR風險因素構建的隨機森林預測模型的AUC為0.916,證實該預測模型應用價值高。
綜上所述,TG/HDL-C、HbA1c、TyG、hs-CRP、糖尿病、高脂血癥、年齡在PCI病人ISR過程中發(fā)揮著重要作用,基于TG/HDL-C、HbA1c、TyG的PCI病人ISR風險的隨機森林預測模型對ISR風險具有一定預測價值。ISR是一個多環(huán)節(jié)、多因素共同參與的復雜過程。由于條件限制,本研究僅收集PCI治療后數(shù)據(jù),未考慮到糖脂代謝水平的動態(tài)性;其次,隨訪觀察時間有限,糖脂代謝水平對遠期ISR的預示作用有待進一步研究。