高松林,覃 雁,張 鵬,謝蘭芳,徐 哲,梁 菲,黃貴華
1.廣西中醫(yī)藥大學,廣西 南寧 530000
2.柳州市中醫(yī)醫(yī)院,廣西 柳州 545000
3.廣西中醫(yī)藥大學第一附屬醫(yī)院,廣西 南寧 530000
潰瘍性結(jié)腸炎(ulcerative colitis,UC)是一種以結(jié)腸、直腸炎癥為特征的慢性非特異性炎癥性疾病[1]。UC 是炎癥性腸?。╥nflammatory bowel disease,IBD)的一種,在過去的30 年里,IBD 在我國的年發(fā)病率逐漸上升,達到3.01/10 萬,年患病率為47.06/10 萬[2]。2023 年全世界UC 的患病率估計為500 萬例,并且發(fā)病率呈上升趨勢[3]。UC 根據(jù)內(nèi)鏡下表現(xiàn)和臨床癥狀可分為活動期和緩解期,活動期UC 患者常有腹痛、腹瀉、黏液膿血便等典型臨床癥狀,是臨床治療的重點和難點[4]。UC 是結(jié)直腸癌的高風險致病因素之一,UC 患者發(fā)生結(jié)直腸癌的風險是普通人群的2~3 倍[5-6]。目前,活動期UC 的治療方案旨在調(diào)節(jié)免疫系統(tǒng)和腸道炎癥以緩解癥狀,主要使用柳氮磺吡啶、糖皮質(zhì)激素、免疫抑制劑和其他生物制劑進行治療,但是療效有限、副作用明顯、復發(fā)率高或價格昂貴[7-10]。因此,迫切需要發(fā)現(xiàn)新的、更安全的和更有效的藥物。
銅是維持人體健康的重要微量元素,細胞內(nèi)銅濃度保持在一個相對較低的范圍內(nèi),適度增加可引起細胞毒性,甚至導致細胞死亡[11-12]。銅死亡是一種由銅過量引發(fā)的新型細胞死亡方式,在這個過程中銅離子直接與線粒體呼吸中三羧酸循環(huán)中的脂肪?;M分結(jié)合,導致脂肪?;鞍拙奂丸F硫簇蛋白丟失,引起蛋白質(zhì)毒性應激,最終導致細胞死亡[13]。UC 患者中血清銅較正常人明顯升高[14]。銅代謝中含結(jié)構(gòu)域Murr1 蛋白(copper metabolism Murr1 domain,COMMD)1 是COMMD 蛋白家族中第1 個確定的成員,對銅穩(wěn)態(tài)起著重要的作用,COMMD1 的缺失會導致肝細胞銅累積[15-16]。COMMD1 的表達或功能降低可能與UC 的發(fā)病機制有關[17]。COMMD1 是核因子-κB(nuclear factor kappa B,NF-κB)的負性調(diào)節(jié)因子,在控制腸道炎癥和抑制結(jié)腸炎相關癌癥的進展方面具有重要作用[18]。多篇研究報道銅死亡在類風濕性關節(jié)炎、系統(tǒng)性紅斑狼瘡、銀屑病等多種免疫系統(tǒng)疾病中發(fā)揮著重要的作用,UC 與這些疾病具有類似的發(fā)病機制[19-22]。目前尚缺乏活動期UC 中銅死亡相關的研究,本研究通過生物信息學方法探討活動期UC 中銅死亡相關基因的潛在調(diào)控機制和診斷生物標志物,并預測可以通過調(diào)節(jié)銅死亡治療活動期UC 的中藥,旨在為活動期UC 的診斷和個性化治療提供新思路。
從GEO 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)下載活動期UC 的表達數(shù)據(jù)集(GSE11223、GSE87466、GSE87473 和GSE92415)。GSE11223 數(shù)據(jù)集中有132 個結(jié)腸樣本,包括63 例活動期UC 患者樣本和69 例健康受試者樣本(對照),作為訓練集。GSE87466 和GSE92415 數(shù)據(jù)集均有87 例活動期UC 患者樣本和21 例健康受試者樣本,GSE87473有106 例活動期UC 患者樣本和21 例健康受試者樣本,三者作為驗證集。使用“l(fā)imma” R 包對GSE11223、GSE87466、GSE87473 和GSE92415 數(shù)據(jù)集中的數(shù)據(jù)進行標準化處理,包括注釋和校正。從已發(fā)表的文獻中獲取與銅死亡相關的基因(cuproptosis-related genes,CRG),獲得了19 個基因[23-25]。技術路線流程如圖1 所示。
圖1 技術路線流程Fig.1 Technical route flow
以P<0.05 為篩選條件,運用“l(fā)imma” R 包和Wilcox 檢驗分析GSE11223 數(shù)據(jù)集中活動期UC 和對照組中差異表達的銅死亡相關基因(differentially expressed cuproptosis-related genes,DECRGs)。運用“pheatmap”和“ggpubr” R 包對結(jié)果進行可視化。為了解銅死亡基因調(diào)節(jié)因子之間的相關性,運用“corrplot”和“circlize” R 包對DECRGs 進行相關性分析并展示。
運用CIBERSORT 算法計算活動期UC 組和對照組中的免疫細胞浸潤程度,P<0.05 表示具有統(tǒng)計學意義,應用“ggpubr” R 包構(gòu)建箱線圖。應用“l(fā)imma”和“corrplot” R 包分析DECRGs 和免疫細胞之間的相關性,并運用“ggplot2” R 包繪制相關性熱圖。
“ConsensusClusterPlus”軟件包用于計算無監(jiān)督聚類的數(shù)量及其穩(wěn)定性[26]。為了分析活動期UC 患者中與DECRGs 相關的潛在亞型,根據(jù)DECRGs 的表達量運用“ConsensusClusterPlus” R 包進行無監(jiān)督共識聚類分析,使用k-means 算法將63 個活動期UC 樣本分類為集群,k值定義為從1 到9 以生成不同的子類型。通過判斷不同k值下的共識聚類、矩陣累積分布函數(shù)(uniform clustering cumulative distribution function,CDF)曲線和一致性聚類得分,得到最可靠的聚類分析結(jié)果。使用主成分分析(principal component analysis,PCA)對分型的結(jié)果進行評估,使用R 包“ggpubr”比較不同亞型中DECRGs 的基因表達譜,P<0.05 代表具有顯著性,運用R 包作圖進行可視化。
應用CIBERSORT 算法和“l(fā)imma”“reshape2”“ggpubr”等R 包對不同亞型進行免疫浸潤分析,比較不同亞型之間免疫細胞浸潤的差異,并以熱圖和箱型圖進行展示。
GSVA 是一種通過表達譜計算基因集富集的非參數(shù)、無監(jiān)督方法,用于識別各種樣本群體中生物過程和途徑之間的差異[27]。運用“GSVA”和“GSEABase” R 包進行GSVA 富集分析,以闡明不同亞型之間基因富集集的差異。從MSigDB 數(shù)據(jù)庫下載“c2.cp.kegg.v7.4.symbols”文件,運用“l(fā)imma”包比較不同亞型之間的GSVA 評分來識別基因差異表達的途徑,P<0.05 作為判斷差異有統(tǒng)計學意義的標準。
基于DECRGs 分型后的基因表達文件,使用“WGCNA” R 包對活動期UC 疾病基因表達矩陣中波動最大的前25%的基因進行WGCNA,篩選分型后GSE11223 數(shù)據(jù)集的核心模塊和基因。使用pickSoftThreshold 函數(shù)獲得相鄰函數(shù)中加權參數(shù)的最佳值,并用作后續(xù)網(wǎng)絡構(gòu)建的軟閾值。隨后建立加權鄰接矩陣,并將其轉(zhuǎn)換為拓撲重疊矩陣(topological overlap matrix,TOM),并通過基于1-TOM 相異矩陣的分層聚類創(chuàng)建基因模塊,找出模塊間的相似性,將相關檢驗P值最小的模塊確定為活動性UC 分型基因的關鍵基因模塊。
結(jié)合“caret”“randomForest”“kernlab”“ggplot2”和“xgboost” R 包構(gòu)建隨機森林(random forest,RF)、支持向量機(support vector machine,SVM)、極限梯度上升(eXtreme gradient boosting,XGB)模型和廣義線性模型(generalized linear models,GLM)4 種機器學習模型。提取了WGCNA 中核心基因的表達量,并用4 種模型對結(jié)果進行了預測。通過繪制殘差箱線圖、累積殘差分布圖和接收器工作特性(receiver operating characteristic,ROC)曲線來評價模型的準確性,以確定最佳機器學習模型。對每個模型基因進行重要性評分,篩選重要性排名前5 的基因作為活動期UC 疾病的特征基因。
提取最佳機器學習模型中5 個疾病特征基因的表達量,使用“rms”和“rmda” R 包構(gòu)建列線圖對每個特征基因進行評分,最后基于綜合評分評估患者患病的概率。通過校準曲線評估預期概率和實際結(jié)果之間的一致程度,使用決策曲線評估列線圖的臨床實用性和優(yōu)勢。根據(jù)最佳機器學習模型中疾病特征基因的表達量,在GSE87466、GSE87473 和GSE92415 3 個數(shù)據(jù)集上進行驗證,繪制ROC 曲線驗證預測結(jié)果。
運用“l(fā)imma”“corrplot”和“circlize” R 包分析疾病特征基因和DECRGs 之間的表達相關性。
將 DECRGs 和活動期 UC 特征基因輸入Coremine Medical 數(shù)據(jù)庫(https://www.coremine.com/),以P<0.05 為閾值檢索對應的中藥。將檢索到的中藥根據(jù)《中國藥典》2020 年版對中藥名稱進行規(guī)范化,未收錄的中藥不進行統(tǒng)計,再導入中醫(yī)傳承計算平臺(V3.5)中進行分析。
通過Wilcox 檢驗確定活動期UC 組中有11 個CRG 的表達與對照組中的表達差異顯著。NOD 樣受體熱蛋白結(jié)構(gòu)域相關蛋白3(NOD-like receptor thermal protein domain associated protein 3,NLRP3)在活動期UC 患者樣本中顯著上調(diào),而核轉(zhuǎn)錄因子E2 相關因子2(nuclear factor erythroid 2-like-2,NFE2L2)、溶質(zhì)載體家族31 成員1(solute carrier family 31 member 1,SLC31A1)、鐵氧還蛋白1(ferredoxin 1,F(xiàn)DX1)、硫辛酸合成酶(lipoic acid synthase,LIAS)、二氫硫辛酰胺脫氫酶(dihydrolipoyl dehydrogenase,DLD)、二氫硫辛酰轉(zhuǎn)乙?;福╠ihydrolipoyl acetyltransferase,DLAT)、丙酮酸脫氫酶E1 α1 亞基(pyruvate dehydrogenase E1 subunit alpha 1,PDHA1)、谷氨酰胺酶(glutaminase,GLS)、二氫硫辛胺支鏈轉(zhuǎn)酰基酶E2(dihydrolipoamide branched chain transacylase E2,DBT)和甘氨酸裂解系統(tǒng)H 蛋白(glycine cleavage system protein H,GCSH)在活動期UC 患者樣本中顯著下調(diào)(P<0.05)(圖2-A、B)。隨后,對這些基因進行了相關性分析發(fā)現(xiàn)PDHA1與LIAS、DLAT,DBT與PDHA1,DLD與GCSH、DLAT、PDHA1、DBT,NFE2L2與PDHA1、DBT、DLD,F(xiàn)DX1與DLAT、PDHA1、SLC31A1、DBT、DLD、NFE2L2呈顯著的正相關(圖3)。NLRP3與其他基因呈負相關,其中與DBT負相關性最顯著。
圖2 活動期UC 中的DECRGsFig.2 DECRGs in active UC
圖3 DECRGs 間的相關性分析Fig.3 Correlation analysis of DECRGs
為了研究活動期UC 的免疫微環(huán)境,使用CIBERSORT 算法評估活動期UC 組與對照組之間的免疫細胞浸潤水平(圖4-A)。與對照組相比,活動期UC 組激活的記憶性CD4+T 細胞(T cells CD4 memory activated)、靜息NK 細胞(NK cells resting)、M0 巨噬細胞(macrophages M0)、激活的肥大細胞(dendritic cells activated)和中性粒細胞(neutrophils)上調(diào);靜息記憶性CD4+T 細胞(T cells CD4 memory resting)、激活的NK 細胞(NK cells activated)、M2巨噬細胞(macrophages M2)、激活的樹突狀細胞(dendritic cells activated)下調(diào)(圖4-B)。
圖4 DECRGs 免疫浸潤相關性分析Fig.4 Correlation analysis of immune infiltration in DECRGs
對免疫細胞與NLRP3、NFE2L2、SLC31A1、FDX1、LIAS、DLD、DLAT、PDHA1、GLS、DBT和GCSH進行相關性分析,發(fā)現(xiàn)初始B 細胞(B cells naive)與LIAS,M1 巨噬細胞(macrophages M1)與DLD、GCSH,M2 巨噬細胞與GCSH,激活的肥大細胞、靜息NK 細胞與DLD,γδT 細胞(T cells gamma delta)與FDX1、GLS呈正相關;M0 巨噬細胞與DLAT、FDX1、LIAS,中性粒細胞與LIAS,激活的NK 細胞與DLD,漿細胞(plasma cells)與LIAS,靜息記憶性CD4+T 細胞與NLRP3呈負相關(P<0.01)(圖4-C)。
根據(jù)DECRGs 的表達量對活動期UC 患者進行共識聚類分型,通過綜合分析共識聚類、CDF 曲線和一致性聚類得分的結(jié)果發(fā)現(xiàn),k=2 時分類最佳(圖5-A、B、C、E)。因此,活動期UC 組的63 例患者被分為C1 和C2 2 個亞組。PCA 顯示C1 和C2樣本之間具有明顯的差異,分類效果較好(圖5-D)。圖5-F 顯示了活動期UC 組中2 種亞型中DECRGs表達水平的熱圖。在C1 和C2 之間觀察到不同的CRG 表達譜,NFE2L2、SLC31A1、FDX1、LIAS、DLD、DLAT、PDHA1、GLS、DBT和GCSH在C1中的表達高于C2,NLRP3在C2 中的表達高于C1(圖5-G)。
圖5 共識聚類分型情況Fig.5 Consensus clustering classification
22 種免疫細胞在不同亞組之間的相對百分比見圖6-A。與C1 相比,C2 中M0 巨噬細胞數(shù)量更高(圖6-B)。GSVA 用于評估不同亞組之間的生物學功能差異,高親和性免疫球蛋白E 受體(highaffinity immunoglobulin E receptor,F(xiàn)cεRI)信號通路、趨化因子信號通路、T 細胞受體信號通路等通路在C1 亞組中上調(diào)。此外,丁酸代謝、萜類骨架的生物合成、脂肪酸代謝和組氨酸代謝等途徑在C2 亞組中上調(diào)(圖6-C)。
圖6 亞型間DECRGs 相關免疫浸潤分析和GSVA 分析Fig.6 Analysis of DECRGs related immune infiltration and GSVA among subtypes
應用WGCNA 算法根據(jù)活動期UC 分型基因建立加權基因共表達網(wǎng)絡,以識別與DECRGs 聚類密切相關的關鍵基因模塊。共有9 個重要的共表達模塊,藍色模塊與C1 呈最強的正相關(相關系數(shù)r=0.85,P= 2×10?18),與C2 呈最強的負相關(r=0.85,P= 2×10?18),見圖7。以“geneSig Filter=0.5,moduleSig Filter=0.8”為條件,經(jīng)Wilcox 檢驗且P<0.05 表示有統(tǒng)計學意義,從藍色模塊篩選出234 個核心基因。
圖7 分型WGCNA 確定活動期UC 相關模塊和核心基因Fig.7 WGCNA of genotyping to determine active UC related modules and core genes
為了進一步識別具有高診斷價值的關鍵標志物,基于藍色模塊234 個核心基因,建立了4 個機器學習模型進行訓練。從殘差箱線圖可以看出GLM、XGB和SVM 的殘差在0~0.125,RF 的殘差在0.125~0.250(圖8-A)。從累積殘差分布圖得出的結(jié)論與上述結(jié)果一致(圖8-B)。ROC 曲線中XGB 模型的曲線下面積為0.911(圖8-C),大于GLM、RF 和SVM,故XGB 模型是最佳機器學習模型。中胚層特異性轉(zhuǎn)錄基因(mesoderm-specific transcript,MEST)、跨膜蛋白98(transmembrane protein 98,TMEM98)、晶狀體蛋白λ1(crystallin lambda 1,CRYL1)、染色體14開放閱讀框(chromosome 14 open reading frame 147,C14orf147)和跨膜蛋白141(transmembrane protein 141,TMEM141)是XGB 模型中重要性得分最高的前5 位基因(圖8-D)。
圖8 活動期UC 機器學習模型的構(gòu)建Fig.8 Construction of active UC machine learning model
選擇XGB 模型重要性得分最高的前5 位基因作為疾病特征基因,并構(gòu)建列線圖以預測活動期UC 的發(fā)病風險(圖9-A)。校準曲線顯示實線和虛線在圖中彼此很接近,表明模型預測能力較好(圖9-B)。決策曲線紅線表示的模型遠離全部(all)曲線,再次表明模型效果較好(圖9-C)。以3 個驗證數(shù)據(jù)集GSE87466、GSE87473 和GSE92415 從外部來驗證模型的預測能力,結(jié)果發(fā)現(xiàn)模型的準確率可以達到91.7%、95.7%和94.9%(圖9-D~F)。
圖9 活動期UC 機器學習模型的驗證Fig.9 Verification of machine learning model of active UC
相關性分析顯示,NLRP3與疾病特征基因存在著較強的負相關性,其他DECRGs 中的1個或者多個基因與5 個疾病特征基因有較強的正相關性,它們之間可能存在著相互調(diào)控作用,見圖10。
圖10 DECRGs 與5 個疾病特征基因間的相關性分析Fig.10 Correlation analysis between DECRGs and five disease characteristic genes
共篩選出338 味中藥,其中《中國藥典》2020年版收錄206 味藥,根據(jù)中醫(yī)傳承計算平臺(V3.5)對這206 味藥進行出現(xiàn)頻次統(tǒng)計、四氣五味、歸經(jīng)統(tǒng)計,根據(jù)第10 版《中藥學》進行功效類別統(tǒng)計。白術、丹參、莪術、紫草、桑葉、青風藤、桑枝均出現(xiàn)在3 個銅死亡基因中,可見其在調(diào)節(jié)銅死亡治療活動期UC 中發(fā)揮著重要的作用。四氣以溫、寒和平為主,五味以苦、甘、辛為主,主歸肝、脾經(jīng),肺經(jīng)和胃經(jīng)次之(圖11)。中藥功效以清熱類、補虛類和活血化瘀類為主,清熱類中以清熱解毒藥和清熱燥濕最多(表1)。
表1 中藥功效分類統(tǒng)計Table 1 Classified statistics of efficacy of traditional Chinese medicines
圖11 中藥的四氣、五味和歸經(jīng)統(tǒng)計Fig.11 Statistics of four qi, five flavor and meridian tropism of traditional Chinese medicines
UC 是一種炎癥性腸病,近年來UC 的發(fā)病率和患病率逐漸上升,給我國的醫(yī)療系統(tǒng)帶來了重大的負擔和挑戰(zhàn)[28-29]。然而,UC 確切的機制尚不清楚,多種因素參與了UC 的發(fā)病機制,包括免疫反應紊亂、腸屏障損傷、遺傳易感性、腸道生態(tài)失調(diào)和環(huán)境應激[30-31]。UC 不易治愈,復發(fā)率高,與結(jié)腸癌的發(fā)生密切相關,雖然有許多藥物可用于抑制結(jié)腸炎,但常規(guī)治療具有一定的局限性和嚴重的不良反應[32]。銅死亡參與多種免疫系統(tǒng)疾病的發(fā)生和進展[33-34],然而,目前尚缺乏銅死亡在活動期UC 中的研究。
本研究通過比較CRG 在活動期UC 組和對照組結(jié)腸中的表達,發(fā)現(xiàn)與正常人群相比,有11 個CRGs 在活動期UC 結(jié)腸中的表達異常,活動期UC患者的NLRP3顯著上調(diào),其他的DECRGs 均下調(diào),表明DECRGs 在活動期UC 的發(fā)展中起重要作用?;顒悠赨C 患者和小鼠模型中均檢測到NLRP3 水平升高[35-36]。Zhang 等[37]通過對56 例UC 患者和274 例對照組進行基因分型發(fā)現(xiàn)rs10754558 和rs10925019 在中國漢族人群中與UC 的易感性顯著相關,這表明NLRP3可能在UC 的發(fā)病機制中起重要作用。通過對這些基因進行了相關性分析發(fā)現(xiàn)活動期UC 中DECRGs 之間存在著顯著的相關性,NLRP3與其他DECRGs 均呈負相關,其中與DBT負相關性最顯著。活動期UC 和對照組之間的免疫細胞浸潤結(jié)果顯示,活動期UC 患者中激活的記憶性CD4+T 細胞、靜息NK 細胞、M0 巨噬細胞、激活的肥大細胞和中性粒細胞上調(diào),與以往研究結(jié)果一致[38-43]。同時,DECRGs 與免疫浸潤細胞的相關性分析顯示M1 巨噬細胞與DLD、GCSH呈正相關,M0 巨噬細胞與DLAT、FDX1、LIAS呈顯著的負相關,這些結(jié)果表明DECRGs 可能與活動期UC 進展和免疫浸潤有關。
此外,基于DECRGs 使用無監(jiān)督聚類分析將63例活動期UC 患者分為2 個亞型,以更好地了解CRG 的表達模式。在不同的亞型中DECRGs 的表達存在差異,其中在C2 亞型中NLRP3的表達高于C1 亞型,其他DECRGs 的表達均低于C1 亞型。NLRP3 是核苷酸結(jié)合域樣受體家族的一員,被激活后與凋亡相關斑點樣蛋白(apoptosis-associated speck-like protein containing a CARD,ASC)和效應分子半胱氨酸蛋白酶-1 前體(pro-caspase-1)組成NLRP3 炎性小體[44]。NLRP3 炎癥小體是炎癥反應系統(tǒng)的重要組成部分和腸道內(nèi)穩(wěn)態(tài)的重要調(diào)節(jié)因子,其異常激活后通過釋放炎性細胞因子、損傷腸上皮細胞、破壞腸黏膜屏障,誘導參與UC 的發(fā)生發(fā)展的炎癥級聯(lián)反應[45-46]。NFE2L2 是一種重要的傳感器蛋白,可能通過調(diào)節(jié)促炎細胞因子和誘導II期解毒酶在預防UC 方面發(fā)揮潛在的重要作用[47]。FDX1 是銅離子載體誘導細胞死亡的關鍵調(diào)節(jié)因子,也是細胞蛋白脂?;纳嫌握{(diào)節(jié)因子,通過結(jié)合LIAS 促進其與脂酰載體蛋白GCSH 的功能性結(jié)合來直接調(diào)節(jié)蛋白質(zhì)脂?;痆48]。FDX1 表達與腫瘤細胞靜止和炎癥呈正相關,與腫瘤侵襲呈負相關,F(xiàn)DX1 的高表達在抑制結(jié)腸腫瘤中起著至關重要的作用[49]。PDHA1 是葡萄糖代謝過程中必不可少的成分,其失活被認為與腫瘤中的代謝重編程和乳酸過量產(chǎn)生有關[50]。NLRP3 炎癥小體的激活需要乳酸發(fā)酵[51]。不同亞型的免疫學分析顯示C2 亞型中M0巨噬細胞數(shù)量更高。在不同誘導因子的作用下,巨噬細胞可分為M1 和M2 極化型,在UC 患者中巨噬細胞極化表型以M1 型為主,誘導局部炎癥反應,加重腸道炎癥和黏膜屏障損傷[52]??梢姡珻2 亞型可能比C1 亞型的預后更差。GSVA 分析表明,C1 亞型在FcεRI 信號通路、趨化因子信號通路、T 細胞受體信號通路等通路中富集。C2 亞型在丁酸代謝、萜類骨架的生物合成、脂肪酸代謝和組氨酸代謝等途徑中顯著富集。
近年來,WGCNA 算法和機器學習模型越來越多地用于UC 相關基因的篩選和疾病患病率的預測[53-56],但均未涉及到活動期UC。本研究運用WGCNA 篩選出234 個與DECRGs 聚類密切相關的核心基因,通過4 種機器學習發(fā)現(xiàn),XGB 模型是最佳機器學習模型,MEST、TMEM98、CRYL1、C14orf147和TMEM141是活動期UC 的特征基因。然后,構(gòu)建了列線圖模型,使用MEST、TMEM98、CRYL1、C14orf147和TMEM141診斷活動期UC,GSE87466、GSE87473 和GSE92415 數(shù)據(jù)集用于評價5 個基因的預測效能,ROC 結(jié)果表明該模型具有良好的預測性能和一定的臨床應用價值,可作為活動期UC 的診斷生物標志物。
通過預測疾病特征基因和DECRGs 的中藥,總結(jié)發(fā)現(xiàn)調(diào)控DECRGs 治療活動期UC 的中藥功效以清熱類、補虛類、活血化瘀類為主,清熱類中以清熱解毒藥和清熱燥濕藥最多,體現(xiàn)了活動期UC 以脾胃虛弱為本,濕熱毒瘀蘊結(jié)為標,與活動期UC常見的大腸濕熱、熱毒熾盛等證型相符[57-59]。四氣以溫、寒和平為主,五味以苦、甘、辛為主,甘溫健脾能補益脾胃,苦寒燥濕能清脾胃、大腸濕熱,辛能散能行,可調(diào)氣行血以通腸腑。歸經(jīng)方面主歸肝、脾、肺、胃經(jīng),與疾病的歸經(jīng)基本相同[60],體現(xiàn)了微觀銅死亡基因調(diào)節(jié)活動期UC 層面與宏觀整體調(diào)節(jié)層面的方向相符。頻次統(tǒng)計顯示白術、丹參、莪術、紫草、桑葉、青風藤、桑枝在銅死亡基因預測中出現(xiàn)的頻次最高,可見它們在其中發(fā)揮著重要的作用。白術多糖和揮發(fā)油可以通過調(diào)節(jié)腸道菌群的組成和宿主代謝來治療UC[61-63]。丹參提取物能夠通過抑制Toll 樣受體4(toll-like receptor 4,TLR4)/磷脂酰肌醇-3-羥激酶(phosphatidylinositol-3-hydroxykinase,PI3K)/蛋白激酶B(protein kinase B,Akt)/哺乳動物雷帕霉素靶蛋白(mammalian target of rapamycin,mTOR)信號通路改善UC 的炎癥[64]。莪術提取物中的姜黃素可以通過抑制炎癥介質(zhì)和細胞因子、清除氧自由基等過程發(fā)揮免疫調(diào)節(jié)和抗炎作用治療UC[65]。紫草素及其衍生物通過抑制NLRP3 炎癥小體和NF-κB 信號通路的激活,減輕結(jié)腸上皮緊密連接的破壞,從而改善UC 的炎癥和黏膜屏障損傷[66]。
綜上所述,本研究通過生物信息學揭示了銅死亡相關基因在活動期UC 中的表達模式。通過機器學習,確定了MEST、TMEM98、CRYL1、C14orf147和TMEM141是參與活動期UC 發(fā)病機制的核心基因,可作為活動期UC 的診斷生物標志物。本研究還建立了1 個預測模型,可以準確評估活動期UC的患病風險。本研究系統(tǒng)地評估了活動期UC 與銅死亡之間的關系,并預測了能夠調(diào)節(jié)銅死亡治療活動期UC 的中藥,這不僅有助于提高對活動期UC銅死亡的認識,也有利于活動期UC 的診斷和治療。
利益沖突所有作者均聲明不存在利益沖突