李樹(shù)棟 梁學(xué)振 李剛
山東中醫(yī)藥大學(xué)第一臨床醫(yī)學(xué)院,山東 濟(jì)南 250014
絕經(jīng)后骨質(zhì)疏松癥(postmenopausal osteoporosis, PMOP)是世界范圍內(nèi)最常見(jiàn)的疾病之一,其特征是雌激素缺乏以及隨著年齡的增長(zhǎng)而持續(xù)的鈣流失,PMOP能夠?qū)е鹿谴嘈栽黾訌亩黾庸钦郯l(fā)生風(fēng)險(xiǎn)[1]。研究表明目前全球有近30 %的絕經(jīng)后婦女患有PMOP[2]。由PMOP引起的腕部及髖部骨折正逐年增加[3]。目前診斷PMOP最常見(jiàn)的方式是雙能X線檢查,但其診斷與應(yīng)用存在局限性[4],近年來(lái)學(xué)者也嘗試從炎癥指數(shù)、基因易感性等方面尋找新的診斷手段[5-7]。研究表明,雌激素能夠在促進(jìn)成骨分化和成骨細(xì)胞成熟、抑制破骨細(xì)胞形成的同時(shí)誘導(dǎo)破骨細(xì)胞凋亡,使得骨的形成和吸收處于相對(duì)穩(wěn)定狀態(tài),絕經(jīng)后由于雌激素水平下降使得這種平衡狀態(tài)被打破,從而導(dǎo)致PMOP發(fā)生[8]。免疫學(xué)研究表明當(dāng)雌激素水平下降時(shí)可誘發(fā)淋巴T細(xì)胞活化從而作用于骨髓間充質(zhì)細(xì)胞及成骨細(xì)胞,以起到調(diào)節(jié)骨代謝平衡的作用,這被認(rèn)為在骨質(zhì)疏松癥發(fā)病機(jī)制中具有關(guān)鍵作用[9]。研究表明,免疫細(xì)胞分泌的細(xì)胞因子如IL-6、IL-17、IL-1和 TNF等都可以直接或間接作用于破骨細(xì)胞,促使破骨細(xì)胞分化發(fā)育,加速骨吸收,直接導(dǎo)致骨質(zhì)疏松[10-12]。由于免疫細(xì)胞可以在不同的水平上與骨細(xì)胞相互作用,免疫細(xì)胞的改變被證明也是PMOP的發(fā)病機(jī)制之一。本研究旨在通過(guò)生物信息學(xué)和機(jī)器學(xué)習(xí),尋找PMOP新的潛在生物標(biāo)志物,為臨床診斷和防治PMOP提供新的思路。
從美國(guó)國(guó)家生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)的基因表達(dá)數(shù)據(jù)庫(kù)(Gene Expression Omnibus, GEO)數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)中檢索與PMOP相關(guān)的數(shù)據(jù)集,篩選標(biāo)準(zhǔn)為PMOP患者和健康人群的樣本,排除動(dòng)物系模型。最終下載符合要求的數(shù)據(jù)集GSE56815(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE56815)和數(shù)據(jù)集GSE7429(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE7429),數(shù)據(jù)集基于GPL96平臺(tái)([HG-U133A] Affymetrix Human Genome U133A Array),GSE56815數(shù)據(jù)集包含40個(gè)樣本,其中20例PMOP患者的樣本,20例絕經(jīng)后的健康人群樣本。GSE7429數(shù)據(jù)集包含20個(gè)樣本,其中10例PMOP患者樣本,10例健康人群樣本。
1.2.1數(shù)據(jù)差異表達(dá)分析:使用R軟件(https://www.r-project.org/)中的Limma包(https://bioconductor.org/packages/release/bioc/html/limma.html)對(duì)樣本數(shù)據(jù)集GSE5681和數(shù)據(jù)集GSE7429進(jìn)行差異表達(dá),篩選標(biāo)準(zhǔn)設(shè)定為 adj.P<0.05,∣log2 fold change (FC)∣> 1.2差異表達(dá)數(shù)據(jù)用火山圖及聚類(lèi)圖進(jìn)行可視化展示。
1.2.2GO分析:使用R軟件ClusterProfiler包(https://bioconductor.org/packages/release/bioc/html/clusterProfiler.html)對(duì)得出的差異基因進(jìn)行基因本體分析。其中GO 分析主要包括生物學(xué)過(guò)程 (biological process, BP)、細(xì)胞組分 (cellular component, CC) 和分子功能 (molecular function, MF)三大部分。
1.2.3蛋白互作網(wǎng)絡(luò)構(gòu)建:為進(jìn)一步識(shí)別明顯差異表達(dá)基因,利用 STRING(search tool for the retrieval of interacting genes) 數(shù)據(jù)庫(kù)對(duì)獲得的差異基因進(jìn)行相互作用分析 (protein-protein interaction,PPI),參考值設(shè)置confidence評(píng)分為>0.4,通過(guò) Cytoscape軟件使PPI 網(wǎng)絡(luò)可視化。通過(guò)設(shè)置Degree數(shù)值對(duì) PPI 網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)進(jìn)行相關(guān)性評(píng)估,篩選出意義最大的前10個(gè)基因。
1.2.4篩選生物標(biāo)志物:采用兩種機(jī)器學(xué)習(xí)的方式,通過(guò)R中的glmnet包(https://cran.r-project.org/web/packages/glmnet/index.html)構(gòu)建LASSO模型,以確定與PMOP和健康標(biāo)本顯著相關(guān)的基因。在此基礎(chǔ)上,通過(guò)支持向量機(jī)遞歸特征消除從元數(shù)據(jù)隊(duì)列中篩選出最佳基因,建立SVM-REF分類(lèi)模型,進(jìn)一步確定生物標(biāo)志物在PMOP中的診斷價(jià)值?;贚ASSO回歸分析,SVM-REF分析和PPI蛋白互作網(wǎng)絡(luò)篩選出候選生物標(biāo)志物。
1.2.5CIBERSORT分析:通過(guò) CIBERSORT進(jìn)行反卷積分析,評(píng)估22個(gè)免疫細(xì)胞的免疫浸潤(rùn)情況,并評(píng)估這些免疫細(xì)胞在正常樣本與PMOP樣本中和關(guān)鍵基因表達(dá)之間的關(guān)聯(lián)。
對(duì)數(shù)據(jù)集GSE56815和數(shù)據(jù)集GSE7429進(jìn)行數(shù)據(jù)差異表達(dá)分析,共找出30個(gè)差異基因,其中9個(gè)為表達(dá)上調(diào)基因(OSTF1、RAB8B、SERPINF1、FUCA1、EIF5A、TCL1A、IGLL3P、HIST1H2AC、EIF2S3),21個(gè)為表達(dá)下調(diào)基因(C1D、KCNJ2、PMAIP1、HIRA、ADRB2、ZEB2、ELANE、CEACAM8、LCN2、LTF、CAMP、GBP1、S100A12、EGR2、SCD5、CRISP3、HP、MMP8、DEFA4、S100P、ARG1)。
通過(guò) R 軟件 ClusterProfiler 包進(jìn)行 GO 功能分析共得到84個(gè)富集條目,得到 BP條目62個(gè)、CC條目15個(gè)、MF條目7個(gè),BP主要富集在殺死其他組織細(xì)胞、對(duì)真菌的反應(yīng)、對(duì)真菌的防御反應(yīng)、細(xì)胞殺傷等方面。CC條目主要富集在分泌顆粒腔、細(xì)胞質(zhì)囊腔、囊泡腔。MF主要富集在絲氨酸型內(nèi)肽酶活性、絲氨酸水解酶活性、脂多糖、鐵離子結(jié)合。
通過(guò) STRING數(shù)據(jù)庫(kù)預(yù)測(cè)并構(gòu)建30個(gè)差異基因的PPI網(wǎng)絡(luò),取Degree值最大的前十個(gè)基因即ELANE、CAMP、LTF、S100A12、LCN2、ARG1、MMP8、DEFA4、CEACAM8、HP。網(wǎng)絡(luò)由 10個(gè)節(jié)點(diǎn)和 34條邊組成(圖1)。
圖1 構(gòu)建PP網(wǎng)絡(luò)后取Degree前10個(gè)節(jié)點(diǎn)
通過(guò)LASSO分析共確定12個(gè)可能成為PMOP診斷標(biāo)志物的候選基因,通過(guò)SVM-REF分析共確定29個(gè)候選基因?;贚ASSO分析、SVM-ERF分析、PPI蛋白互作網(wǎng)絡(luò)得到三者有且僅有一個(gè)共同基因S100A12,該基因可能是診斷PMOP的關(guān)鍵基因。
研究發(fā)現(xiàn)與健康樣本相比較,S100A12在PMOP樣本中的表達(dá)顯著下調(diào)(圖2A)。對(duì)S100A12進(jìn)行進(jìn)一步ROC分析得到其AUG=0.658(圖2B)。
注:A :S100A12在PMOP樣本中的表達(dá)明顯下調(diào);B:S100A12的ROC分析。
通過(guò)研究PMOP患者標(biāo)本和健康人群標(biāo)本中的S100A12表達(dá)水平以及免疫細(xì)胞浸潤(rùn)狀態(tài),以確定兩者之間的關(guān)系。通過(guò)CiberSort算法檢測(cè)在PMOP樣本中免疫細(xì)胞浸潤(rùn)情況。此外在健康樣本和PMOP樣本之間的Macrophages M0表達(dá)異常。免疫細(xì)胞浸潤(rùn)分析顯示S100A12與免疫細(xì)胞T cells CD8、T cells CD4 memory resting、T cells CD4 memory activated、Plasma cells、Monocytes、Mast cells resting、Macrophages M0、Macrophages M1 、Macrophages M2、Eosinophils、Dendritic cells resting等相關(guān)。提示S100A12可能通過(guò)調(diào)節(jié)多個(gè)免疫細(xì)胞參與了PMOP的進(jìn)展,表明S100A12可能成為診斷PMOP的生物標(biāo)志物。
絕經(jīng)后骨質(zhì)疏松癥常出現(xiàn)在女性絕經(jīng)期后,其主要危險(xiǎn)因素是雌激素缺乏、吸煙、鈣的缺失[13]。PMOP會(huì)增加脊柱、髖部、前臂遠(yuǎn)端及肱骨近端等部位的骨折發(fā)病風(fēng)險(xiǎn),研究表明,絕經(jīng)期女性在這些部位發(fā)生骨折的風(fēng)險(xiǎn)高達(dá)40 %以上[14]。
絕經(jīng)后骨質(zhì)疏松癥具體的發(fā)病機(jī)制尚未明確,研究表明作為多系統(tǒng)共同參與的代謝性疾病,PMOP的發(fā)病機(jī)制已經(jīng)不再是孤立的“雌激素-骨代謝紊亂-骨質(zhì)流失”,其與雌激素缺乏誘導(dǎo)的氧化應(yīng)激、腸道菌群、鐵過(guò)載等多因素參與有關(guān)[15],采用多靶點(diǎn)、多系統(tǒng)聯(lián)合用藥也將是PMOP新的治療思路。
及早發(fā)現(xiàn)PMOP的高危患者有助于預(yù)防骨丟失,及時(shí)診斷PMOP對(duì)于其治療顯得尤為重要,但臨床實(shí)踐中仍然缺乏早期診斷手段。隨著轉(zhuǎn)錄組學(xué)的進(jìn)步、生物信息學(xué)的發(fā)展及高通量數(shù)據(jù)庫(kù)的建立,為研究諸如此類(lèi)疾病的潛在生物標(biāo)志物提供了有效的數(shù)據(jù)支撐,高通量數(shù)據(jù)庫(kù)及相關(guān)研究表明能夠通過(guò)調(diào)控相關(guān)基因的差異表達(dá)從而影響相關(guān)疾病的發(fā)生和發(fā)展[16-22]。而近些年對(duì)PMOP發(fā)病機(jī)制的研究得出其與免疫細(xì)胞息息相關(guān)[9,11,15]。因此本研究旨在通過(guò)挖掘GEO數(shù)據(jù)庫(kù)中的數(shù)據(jù)信息分析差異表達(dá)基因,并通過(guò)機(jī)器學(xué)習(xí)證實(shí)其通過(guò)調(diào)節(jié)免疫細(xì)胞參與PMOP的發(fā)生,以期為絕經(jīng)后骨質(zhì)疏松癥的防治提供理論基礎(chǔ)和數(shù)據(jù)支撐。
研究中通過(guò)對(duì)GEO數(shù)據(jù)庫(kù)進(jìn)行分析,得出PMOP標(biāo)本與健康標(biāo)本共存在30個(gè)差異基因,GO分析顯示,這30個(gè)差異基因主要參與殺死其他組織細(xì)胞、對(duì)真菌的反應(yīng)、對(duì)真菌的防御反應(yīng)、細(xì)胞殺傷、細(xì)胞質(zhì)囊腔、囊泡腔、絲氨酸型內(nèi)肽酶活性、絲氨酸水解酶活性、鐵離子結(jié)合等。這些結(jié)果表明,這些差異基因可能對(duì)于PMOP的發(fā)展起著重要作用。
為了篩選出PMOP的潛在生物標(biāo)志物,本研究對(duì)30個(gè)差異基因構(gòu)建PPI蛋白互作網(wǎng)絡(luò)取出Degree前10位的基因,同時(shí)對(duì)30個(gè)差異基因進(jìn)行LASSO模型分析和SVM-REF,篩選出PMOP患者中潛在的關(guān)鍵基因,最終識(shí)別出S100A12。S100A12是S100家族成員,是一種位于粒細(xì)胞胞質(zhì)中的低分子量的鈣結(jié)合蛋白。其表達(dá)過(guò)程多由中性粒細(xì)胞和巨噬細(xì)胞完成[23]。研究表明S100A12增強(qiáng)了成熟破骨細(xì)胞相關(guān)分子NFATc1、ACP5、CALCR和ITGβ3的表達(dá),通過(guò)RAGE和TLR4通路直接促進(jìn)破骨細(xì)胞形成和骨吸收。同時(shí)S100A12給藥顯著增強(qiáng)了破骨細(xì)胞的骨吸收能力[24]。然而,S100A12在PMOP中的作用機(jī)制仍不明確。本研究首次發(fā)現(xiàn)在PMOP樣本與健康樣本中S100A12的表達(dá)水平異常。ROC分析進(jìn)一步證實(shí)可以通過(guò)S100A12對(duì)PMOP樣本和健康樣本進(jìn)行鑒別篩選。研究表明S100A12的表達(dá)水平在PMOP樣本中明顯下調(diào),因而S100A12可能成為診斷PMOP的潛在生物標(biāo)志物。
近年來(lái),越來(lái)越多的研究表明,免疫細(xì)胞浸潤(rùn)在PMOP的發(fā)生和發(fā)展過(guò)程中起著至關(guān)重要的作用。從免疫系統(tǒng)的角度,評(píng)估免疫細(xì)胞浸潤(rùn),識(shí)別浸潤(rùn)免疫細(xì)胞成分的多樣性,對(duì)于揭示PMOP的分子水平因果關(guān)系和尋找新的免疫治療靶點(diǎn)至關(guān)重要[25-26]。本研究發(fā)現(xiàn),S100A12與免疫細(xì)胞T cells CD8、T cells CD4 memory resting、T cells CD4 memory activated、Plasma cells、Monocytes、Mast cells resting、Macrophages M0、Macrophages M1 、Macrophages M2、Eosinophils、Dendritic cells resting等相關(guān),因而筆者推測(cè)S100A12通過(guò)調(diào)節(jié)多種免疫細(xì)胞參與PMOP的發(fā)生發(fā)展。
S100A12在骨代謝疾病中的研究相對(duì)較少,其研究主要集中在心腦血管疾病和肺部疾病[27-31],本研究表明S100A12參與免疫細(xì)胞浸潤(rùn),其可能是骨免疫環(huán)境中的關(guān)鍵分子,進(jìn)一步實(shí)驗(yàn)可能為研究S100A12找到新的方向。盡管研究認(rèn)為S100A12可能成為診斷POMP的潛在生物學(xué)標(biāo)志物,但該類(lèi)研究仍存在部分限制。首先,數(shù)據(jù)集及包含樣本的數(shù)量較少,缺乏大樣本研究和動(dòng)物實(shí)驗(yàn)從外部驗(yàn)證生物信息學(xué)分析;其次,研究?jī)H能支持與S100A12免疫細(xì)胞間的相關(guān)性分析,并不能揭示其因果關(guān)系,其作用機(jī)制有待研究,仍需要更多研究來(lái)揭示基因和免疫細(xì)胞之間復(fù)雜的相互作用關(guān)系。
綜上所述,基于GEO高通量數(shù)據(jù)庫(kù),借助生物信息學(xué)和機(jī)器學(xué)習(xí),通過(guò)對(duì)PMOP樣本與健康樣本比較篩選得到S100A12是PMOP發(fā)生發(fā)展過(guò)程中的關(guān)鍵基因。本研究結(jié)果為揭示PMOP的潛在分子水平因果關(guān)系提供了思路,并為進(jìn)一步探討和治療PMOP提供了潛在靶點(diǎn)和參考方向。