林適 袁嘉堯 林賢燦 楊彬彬 林燕平 黃佳純 連曉航 萬(wàn)雷 黃宏興*
1.廣州中醫(yī)藥大學(xué)第三臨床醫(yī)學(xué)院,廣東 廣州 510000 2.廣州中醫(yī)藥大學(xué)第三附屬醫(yī)院,廣東 廣州 510240
骨質(zhì)疏松癥(osteoporosis,OP)是一種與年齡相關(guān),以骨強(qiáng)度下降為特征的全身性骨骼疾病[1]。OP發(fā)病機(jī)制主要是成骨和破骨進(jìn)程間的平衡被打破,骨吸收增加而骨形成減少,從而導(dǎo)致骨量降低、骨組織微結(jié)構(gòu)惡化,骨脆性增加,以致骨折發(fā)生率升高[1-2]。OP是老年人骨折最常見(jiàn)的原因,OP相關(guān)性骨折好發(fā)于脊柱、髖部及腕部,構(gòu)成巨大的醫(yī)療、公共衛(wèi)生和經(jīng)濟(jì)負(fù)擔(dān)[2-3]。由于人口老齡化的加劇和過(guò)去二三十年來(lái)我國(guó)生活方式的巨大變化,OP患者數(shù)量預(yù)計(jì)在不久的將來(lái)會(huì)激烈增長(zhǎng),我國(guó)公共衛(wèi)生將面臨嚴(yán)峻挑戰(zhàn)[4]。高通量技術(shù)的最新進(jìn)展使許多生物化學(xué)骨生物標(biāo)志物的識(shí)別成為可能,有助于OP患者的診斷和管理[5]。目前,確定更多有用的生物標(biāo)志物或靶標(biāo),以改善OP的診斷和管理仍是當(dāng)務(wù)之急[6]。
峰值骨量(peak bone mass,PBM)是人體整個(gè)生長(zhǎng)發(fā)育期最大的骨積累量,是個(gè)體未來(lái)骨質(zhì)疏松癥和骨折風(fēng)險(xiǎn)的重要預(yù)測(cè)指標(biāo)[7]。一般來(lái)說(shuō),男性和女性的骨量在前20年顯著增加,并在青春期晚期或青年期達(dá)到穩(wěn)定[8]。成人的骨量等于成年早期的峰值骨量減去成年后的骨質(zhì)流失量,提高PBM對(duì)于預(yù)防或者延緩OP發(fā)病的重要性不言而喻。流行病學(xué)研究結(jié)果顯示,PBM值每增加10%,可使50歲后骨折風(fēng)險(xiǎn)降低50%[9]。低PBM值與更高的OP發(fā)病率和骨折風(fēng)險(xiǎn)相關(guān),而因?yàn)楦逷BM值能夠?yàn)槌赡耆撕屠夏耆颂峁└罅康墓琴|(zhì)儲(chǔ)備及更高的骨強(qiáng)度,能明顯減少或延遲OP的發(fā)生[8]。因此,如何在兒童及青少年時(shí)期實(shí)現(xiàn)PBM值的提高,為中老年時(shí)期提供更高的骨量?jī)?chǔ)備,實(shí)現(xiàn)高骨密度和骨強(qiáng)度積累更有利于OP及OP相關(guān)骨折的預(yù)防是目前的一個(gè)熱門(mén)研究話(huà)題。
目前大多數(shù)研究都著眼于骨質(zhì)疏松人群和健康人群生物標(biāo)志物的差異,鮮有研究分析高低峰值骨量人群生物標(biāo)志物差異。鑒于峰值骨量在骨質(zhì)疏松發(fā)病及防治中的重要地位,本研究基于生物信息手段分析高低峰值骨量人群間生物標(biāo)志物的差異,并研究其在骨質(zhì)疏松診斷治療中的價(jià)值。
通過(guò)基因組學(xué)存儲(chǔ)數(shù)據(jù)庫(kù)GEO(Gene Expression Omnibus,https://www.ncbi.nlm.gov/gds)檢索“osteoporosis”“peak bone mass”等關(guān)鍵詞,設(shè)置樣本來(lái)源為人,得到符合條件的數(shù)據(jù)集GSE7158,平臺(tái)文件為:GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array。該數(shù)據(jù)集招募了878名20~45歲的健康中國(guó)女性,平均27.3歲,使達(dá)到并維持峰值骨量,根據(jù)PBM表型分布進(jìn)行受試者篩選,最后分別選中12名極低和14名極高PBM受試者進(jìn)行測(cè)序分析。
通過(guò)Perl腳本(www.perl.org/)處理下載得到的數(shù)據(jù)集數(shù)據(jù),并獲得基因表達(dá)矩陣文件。利用R軟件中的limma工具包進(jìn)行差異表達(dá)基因(DEGs)篩選。DEGs篩選標(biāo)準(zhǔn)為:∣logFC∣>2并且P<0.01。
為了明確篩選得到的差異基因的生物學(xué)作用,利用R語(yǔ)言中的clusterProfiler工具包進(jìn)行差異基因GO(gene ontology)功能富集分析。GO是基因功能?chē)?guó)際標(biāo)準(zhǔn)分類(lèi)體系,它旨在建立適用于各種物種的,對(duì)基因和蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語(yǔ)言詞匯標(biāo)準(zhǔn)[10]。GO分為分子功能(molecular function,MF)、生物過(guò)程(biological process,BP)和細(xì)胞組成(cellular component,CC)3個(gè)部分[10]。采用KOBAS 3.0在線(xiàn)工具(http://kobas.cbi.pku.edu.cn/)進(jìn)行KEGG通路富集分析[11]。
通過(guò)String數(shù)據(jù)庫(kù)(https://www.string-db.org/)進(jìn)行差異基因PPI網(wǎng)絡(luò)分析[12],設(shè)置去除無(wú)連接的節(jié)點(diǎn),得到PPI網(wǎng)絡(luò)可視化圖譜及PPI網(wǎng)絡(luò)注釋文件。將注釋文件導(dǎo)入Cytoscape(版本3.7.1)軟件中,并利用cytoHubba插件10種算法計(jì)算網(wǎng)絡(luò)種節(jié)點(diǎn)得分[13]。利用R語(yǔ)言中的UpSetR工具包對(duì)每個(gè)算法分值最高的前25個(gè)基因進(jìn)行交叉驗(yàn)證,最終得到各個(gè)算法均定義為關(guān)鍵基因的列表。然后再進(jìn)行關(guān)鍵基因PPI網(wǎng)絡(luò)可視化展示。
為進(jìn)一步明確篩選得到的關(guān)鍵基因是否能夠代表高低峰值骨量人群基因表達(dá)的差異,本研究進(jìn)行了關(guān)鍵基因在高低峰值骨量?jī)山M人群間的表達(dá)主成分分析(principal component analysis,PCA)。PCA是多元統(tǒng)計(jì)中的一種統(tǒng)計(jì)方法,是最常用的線(xiàn)性降維方法,具有降低數(shù)據(jù)維度同時(shí)保留較多的原始數(shù)據(jù)點(diǎn)的特性[14]。本研究中PCA的運(yùn)用,可以有效降低基因表達(dá)特征集維數(shù)的同時(shí),也可以很好地解釋各個(gè)基因表達(dá)特征集與不同樣本的相關(guān)性。
為驗(yàn)證關(guān)鍵基因和骨質(zhì)疏松之間的相關(guān)性,從GEO數(shù)據(jù)庫(kù)中以“osteoporosis”為關(guān)鍵詞,設(shè)置樣本來(lái)源為人,檢索并下載得到基因表達(dá)數(shù)據(jù)集GSE35959,平臺(tái)文件和高低骨量數(shù)據(jù)集為同一平臺(tái)(GPL570),通過(guò)該數(shù)據(jù)集驗(yàn)證關(guān)鍵基因在骨質(zhì)疏松患者和健康者之間的表達(dá)差異。
通過(guò)R語(yǔ)言中的limma工具包進(jìn)行差異表達(dá)基因篩選,設(shè)置篩選條件為:∣logFC∣>2并且P<0.01。通過(guò)分析,一共得到182個(gè)差異基因,其中73個(gè)下調(diào)差異基因,109個(gè)上調(diào)差異基因,差異表達(dá)熱圖見(jiàn)圖1A及火山圖見(jiàn)圖1B。
為發(fā)掘差異基因的生物學(xué)作用,采用R語(yǔ)言中的clusterProfiler工具包進(jìn)行了GO功能注釋?zhuān)瑢?duì)各GO功能顯著性靠前的5條功能注釋進(jìn)行展示(圖2),KOBAS3.0在線(xiàn)工具進(jìn)行了KEGG通路富集分析,并進(jìn)行相似通路聚類(lèi)分析(圖3)。差異基因GO功能注釋結(jié)果顯示,生物過(guò)程主要涉及DNA的復(fù)制、氨基酸的生物合成、脫氧核糖核酸酶活性的調(diào)控和蛋白質(zhì)泛素化的負(fù)調(diào)控等;細(xì)胞組分主要定位在基底外側(cè)質(zhì)膜、神經(jīng)元細(xì)胞體膜、細(xì)胞體膜、核復(fù)制叉和MCM復(fù)合體等;分子功能主要涉及蛋白磷酸酶結(jié)合、病毒受體活性、外源性蛋白結(jié)合、錯(cuò)配修復(fù)復(fù)合物結(jié)合和磷酸酶結(jié)合等。KEGG富集分析結(jié)果顯示富集通路分成8個(gè)聚類(lèi),值得注意的是,C1聚類(lèi)中的破骨細(xì)胞分化通路(osteoclast differentiation)、C3聚類(lèi)中的PI3K-AKT信號(hào)通路(PI3K-Akt signaling pathway)、C7聚類(lèi)中的糖尿病并發(fā)癥中的AGE-RAGE信號(hào)通路(AGE-RAGE signaling pathway in diabetic complications)和其他聚類(lèi)中的鐵死亡信號(hào)通路(Ferroptosis)。
圖3 KEGG通路富集分析Fig.3 KEGG pathways enrichment of DEGs
將所有差異基因名稱(chēng)導(dǎo)入STRING在線(xiàn)數(shù)據(jù)庫(kù)中,按照默認(rèn)設(shè)置并選擇去除無(wú)連接節(jié)點(diǎn),構(gòu)建差異基因PPI網(wǎng)絡(luò)(圖4)。將PPI注釋文件導(dǎo)入Cytoscape軟件中,利用cytoHubba插件計(jì)算PPI網(wǎng)絡(luò)中10種算法下各節(jié)點(diǎn)分值,利用R語(yǔ)言中的UpSetR工具包進(jìn)行交叉驗(yàn)證得到11個(gè)關(guān)鍵基因(圖5A),然后提取11個(gè)關(guān)鍵基因相互作用網(wǎng)絡(luò)(圖5B):節(jié)點(diǎn)顏色越深代表其在網(wǎng)絡(luò)中的degree值越高。其中CDK16為下調(diào)差異基因,其他為上調(diào)差異基因。
圖4 差異基因PPI網(wǎng)絡(luò)分析Fig.4 PPI network analysis of DEGs
圖5 關(guān)鍵基因篩選Fig.5 Identification of key genes
為進(jìn)一步明確篩選得到的關(guān)鍵基因是否能夠代表高低峰值骨量人群基因表達(dá)的差異,本研究進(jìn)行了關(guān)鍵基因在高低峰值骨量人群間表達(dá)水平的PCA分析。PCA分析顯示組間差異顯著,說(shuō)明關(guān)鍵基因可以將高低峰值骨量人群區(qū)分開(kāi)(圖6)。
圖6 關(guān)鍵基因在高低峰值骨量人群間表達(dá)水平的PCA分析Fig.6 Results of principal component analysis
為驗(yàn)證關(guān)鍵基因和骨質(zhì)疏松癥的相關(guān)性,通過(guò)下載和高低峰值骨量人群基因表達(dá)芯片為同一平臺(tái)文件(GPL570)的數(shù)據(jù)集GSE35959,進(jìn)行關(guān)鍵基因表達(dá)水平驗(yàn)證,探究關(guān)鍵基因在骨質(zhì)疏松患者和健康者之間的表達(dá)差異。GSE35959包含了5例骨質(zhì)疏松患者和14名健康者的基因表達(dá)數(shù)據(jù)。通過(guò)驗(yàn)證發(fā)現(xiàn)CCR5、CDK16、RBBP7和SRSF7在骨質(zhì)疏松患者和健康者中表達(dá)水平差異顯著(圖7)。另外,主成分分析也顯示這4個(gè)基因在骨質(zhì)疏松患者和健康者組間差異顯著,組內(nèi)差異較小,能顯著區(qū)分OP人群和健康人群(圖8),具有潛在的診療價(jià)值。
圖7 驗(yàn)證關(guān)鍵基因與OP患者中的表達(dá)水平Fig.7 Validation of expression level of key genes in OP patients
圖8 4個(gè)驗(yàn)證基因主成分分析Fig.8 Principal component analysis of 4 validated genes
隨著高通量測(cè)序技術(shù)及生物信息學(xué)的發(fā)展,基因芯片分析已經(jīng)成為識(shí)別疾病和健康狀態(tài)間差異表達(dá)基因的有效方法,是識(shí)別疾病相關(guān)生物標(biāo)志物、作用途徑以及藥物靶標(biāo)的強(qiáng)大技術(shù)手段[15-16]。多項(xiàng)研究利用基因芯片分析確定了骨質(zhì)疏松發(fā)病機(jī)制中的關(guān)鍵基因,有助于更準(zhǔn)確地識(shí)別骨質(zhì)疏松發(fā)病中基因生物標(biāo)志物。Xia等[17]通過(guò)基因芯片分析發(fā)現(xiàn)VPS35、PHF20、NFKB2和HIRA在骨形成和骨代謝調(diào)控中發(fā)揮重要作用,可以作為潛在的診斷及治療靶點(diǎn)。Qian等[18]通過(guò)WGCNA等生物信息學(xué)方法對(duì)基因芯片進(jìn)行分析,確定PPWD1可以作為絕經(jīng)后骨質(zhì)疏松潛在診斷生物標(biāo)志物。Zhang等[19]研究通過(guò)mRNA和lncRNA芯片分析,揭示了JUN和ACSL5可能是骨質(zhì)疏松潛在生物標(biāo)志物和臨床治療靶點(diǎn),并構(gòu)建了骨質(zhì)疏松ceRNA調(diào)控網(wǎng)絡(luò)。
骨質(zhì)疏松癥的發(fā)病往往呈隱匿性,早期階段并不出現(xiàn)相關(guān)癥狀,以致不容易被發(fā)現(xiàn)及早期治療。對(duì)于高低峰值骨量人群生物標(biāo)志物的差異分析,并發(fā)掘其在骨質(zhì)疏松癥中的潛在診療價(jià)值具有重要意義。本研究充分發(fā)揮生物信息學(xué)優(yōu)勢(shì),對(duì)GEO數(shù)據(jù)庫(kù)中高低峰值骨量人群的基因表達(dá)芯片進(jìn)行了分析,最終篩選得到182個(gè)差異基因,其中73個(gè)下調(diào)差異基因,109個(gè)上調(diào)差異基因。GO和KEGG富集分析顯示,這些差異基因可以通過(guò)多個(gè)生物進(jìn)程及信號(hào)通路發(fā)揮作用。值得注意的是,KEGG通路分析結(jié)果中C1聚類(lèi)的破骨細(xì)胞分化通路、C3聚類(lèi)的PI3K-AKT信號(hào)通路、C7聚類(lèi)的糖尿病并發(fā)癥中的AGE-RAGE信號(hào)通路和其他聚類(lèi)的鐵死亡信號(hào)通路和骨質(zhì)疏松癥發(fā)病機(jī)制密切相關(guān)。林院等[20]研究表明丹酚酸B能夠通過(guò)激活PI3/AKT信號(hào)通路,上調(diào)MC3T3細(xì)胞ALP、OPN、COLⅠ和OCN表達(dá),刺激MC3T3細(xì)胞骨形成。Li等[21]證實(shí)miR-363-3p可以通過(guò)激活PI3K/AKT信號(hào)通路,促進(jìn)破骨細(xì)胞分化,抑制成骨細(xì)胞分化,促進(jìn)骨質(zhì)疏松癥的發(fā)病。AGE-RAGE間相互作用可以影響細(xì)胞功能、運(yùn)動(dòng)和新陳代謝,與骨重塑過(guò)程密切相關(guān)[22]。Yi等[23]研究發(fā)現(xiàn)莫諾苷可以通過(guò)抑制AGE-RAGE信號(hào)通路減輕高糖介導(dǎo)的骨髓間充質(zhì)干細(xì)胞功能障礙,并可能成為糖尿病骨質(zhì)疏松癥的潛在治療手段。鐵死亡是最近的研究熱點(diǎn)[24],越來(lái)越多的研究關(guān)注鐵死亡途徑在骨質(zhì)疏松癥防治中的作用機(jī)制。Yang等[25]的研究中通過(guò)體內(nèi)和體外實(shí)驗(yàn)證實(shí),內(nèi)皮細(xì)胞分泌的外泌體可以通過(guò)抑制鐵蛋白吞噬依賴(lài)性的鐵死亡,逆轉(zhuǎn)糖皮質(zhì)激素引起的骨質(zhì)疏松癥。Ni等[26]全面研究了破骨細(xì)胞鐵死亡的體內(nèi)外作用,發(fā)現(xiàn)靶向調(diào)控HIF-1α和鐵蛋白,誘導(dǎo)破骨細(xì)胞鐵死亡可能是治療骨質(zhì)疏松癥的一種替代療法。
本研究通過(guò)對(duì)差異基因進(jìn)行PPI網(wǎng)絡(luò)分析,確定了11個(gè)在高低峰值骨量人群中差異表達(dá)的關(guān)鍵基因,PCA分析顯示關(guān)鍵基因在高低峰值骨量?jī)山M組間差異顯著,能顯著區(qū)分高低峰值骨量人群。另外,通過(guò)進(jìn)一步驗(yàn)證發(fā)現(xiàn)CCR5、CDK16、RBBP7和SRSF7在骨質(zhì)疏松患者和健康者中表達(dá)水平差異顯著;同時(shí),PCA也顯示這4個(gè)基因在骨質(zhì)疏松患者和健康者組間表達(dá)差異顯著,組內(nèi)差異較小,具有潛在診療價(jià)值。CCR5可以通過(guò)調(diào)節(jié)破骨細(xì)胞功能,抑制骨吸收。Lee等[27]通過(guò)體外實(shí)驗(yàn)證實(shí)敲除CCR5表達(dá),可抑制破骨細(xì)胞活性及骨吸收過(guò)程,抵抗RANKL誘導(dǎo)的骨質(zhì)疏松癥。CDK16是細(xì)胞周期依賴(lài)激酶家族中的一員,參與轉(zhuǎn)錄及細(xì)胞周期的調(diào)節(jié)[28]。RBBP7是組蛋白修飾和染色質(zhì)重塑復(fù)合體成員之一,具有調(diào)節(jié)細(xì)胞周期和細(xì)胞增殖分化功能[29]。SRSF7是富含絲氨酸/精氨酸(SR)蛋白家族中的一員,調(diào)節(jié)各種mRNA前體的組成剪接和選擇性剪接,在細(xì)胞凋亡中發(fā)揮重要作用[30]。目前為止,未有直接證據(jù)表明CDK16、RBBP7和SRSF7參與調(diào)控骨質(zhì)疏松癥的發(fā)病過(guò)程,是未來(lái)的潛在研究方向。
綜上所述,本研究利用生物信息學(xué)方法鑒定了高低峰值骨量人群生物標(biāo)志物的差異,并通過(guò)進(jìn)一步驗(yàn)證發(fā)現(xiàn)差異標(biāo)志物中CCR5、CDK16、RBBP7和SRSF7可能與骨質(zhì)疏松癥的發(fā)病密切相關(guān)。這4個(gè)差異表達(dá)基因有可能成為早期篩選骨質(zhì)疏松癥高風(fēng)險(xiǎn)人群的生物標(biāo)志物,對(duì)骨質(zhì)疏松癥的防治發(fā)揮重要作用。與此同時(shí),本研究存在一些局限性,例如:GEO芯片樣本量不足,缺乏實(shí)驗(yàn)證據(jù)支持。但是,本研究利用生物信息學(xué)的優(yōu)勢(shì),發(fā)掘了潛在的生物標(biāo)志物,為后續(xù)進(jìn)一步實(shí)驗(yàn)研究及臨床治療提供了有效依據(jù)。