曹媛媛 蔡昕添 汪思敏 洪 靜 努爾古麗·買買提 李南方
阻塞性睡眠呼吸暫停(obstructive sleep apnea, OSA)是一種以夜間睡眠打鼾、呼吸暫停和日間嗜睡為特征的睡眠呼吸紊亂疾病,可導(dǎo)致間歇性低氧血癥、高碳酸血癥和睡眠結(jié)構(gòu)紊亂[1]。與OSA相關(guān)的主要臨床風(fēng)險(xiǎn)是多器官系統(tǒng)損害,如心腦血管疾病、代謝綜合征和認(rèn)知功能障礙等[1~3]。OSA在普通人群中的發(fā)生率呈逐年上升趨勢(shì),據(jù)估計(jì),中度至重度OSA在男性中高達(dá)49.7%,在女性中高達(dá)23.4%[4]。然而,絕大多數(shù)OSA患者(70%~90%)沒有得到及時(shí)診治,造成了沉重的健康和社會(huì)經(jīng)濟(jì)負(fù)擔(dān)[5]。因此,研究OSA的病因和發(fā)病機(jī)制,尋找早期診斷指標(biāo)和治療靶點(diǎn)至關(guān)重要。
據(jù)報(bào)道,OSA有較強(qiáng)的遺傳影響,患者一級(jí)親屬的風(fēng)險(xiǎn)增加了1.5倍以上[6]。衡量OSA嚴(yán)重程度的呼吸暫停低通氣指數(shù)(AHI)中約35%~40%的變異可以用遺傳因素來解釋[7]。目前,基于高通量測(cè)序的全基因組DNA微陣列已經(jīng)成為研究復(fù)雜疾病遺傳學(xué)的一種有效且相對(duì)經(jīng)濟(jì)的工具[8]。雖然已經(jīng)發(fā)現(xiàn)了一些OSA分子標(biāo)志物,但由于OSA的異質(zhì)性及其復(fù)雜的病理生理狀況,單個(gè)基因并不能準(zhǔn)確地代表OSA的特征[7,9]。與側(cè)重于單個(gè)基因的差異表達(dá)分析不同,共表達(dá)網(wǎng)絡(luò)分析通過以無監(jiān)督的方式識(shí)別協(xié)同表達(dá)的基因模塊,為理解疾病的發(fā)病機(jī)制和治療干預(yù)機(jī)會(huì)提供了新的見解[10,11]。它已被成功地應(yīng)用于嚴(yán)重哮喘、慢性阻塞性肺疾病(COPD)及癌癥等多種生物學(xué)過程的研究,在識(shí)別候選生物學(xué)標(biāo)志物和治療靶點(diǎn)方面被證明是相當(dāng)有效的[11,12]。
本研究應(yīng)用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA),識(shí)別與OSA相關(guān)的共表達(dá)模塊,對(duì)其生物學(xué)功能和通路進(jìn)行注釋;鑒定關(guān)鍵模塊中的樞紐基因并深入分析,為尋找與OSA發(fā)病相關(guān)的潛在靶基因提供理論依據(jù)。
1.數(shù)據(jù)的獲?。簭腘CBI的GEO數(shù)據(jù)庫(http:∥www.ncbi.nlm.nih.gov/geo/)中下載OSA的全基因組表達(dá)數(shù)據(jù)集GSE135917進(jìn)行初步分析,該數(shù)據(jù)集基于GPL6244平臺(tái),來源于10例OSA患者和8例正常對(duì)照者的皮下脂肪組織樣本,其中包含了每例樣本對(duì)應(yīng)的年齡、性別、體重指數(shù)(BMI)及疾病狀況的臨床信息[13]。另一基于GPL6244平臺(tái)的獨(dú)立數(shù)據(jù)集GSE38792,包含10例OSA患者和8例正常對(duì)照者的內(nèi)臟脂肪組織樣本,用于后續(xù)驗(yàn)證[14]。
2.數(shù)據(jù)的處理與篩選:應(yīng)用R語言及其程序包對(duì)含有原始數(shù)據(jù)(.CEL文件)進(jìn)行預(yù)處理、歸一化和質(zhì)量控制,采用RMA法進(jìn)行背景校正、分位數(shù)歸一化和中值拋光。根據(jù)注釋平臺(tái),將探針I(yè)D轉(zhuǎn)換為基因符號(hào)。利用Limma包,以經(jīng)典貝葉斯t檢驗(yàn)進(jìn)行OSA與正常組之間的差異表達(dá)分析,以Benjamini-Hochberg法校正P值為錯(cuò)誤發(fā)現(xiàn)率(FDR)。本研究以|log2Fold Change|≥0.585且FDR<0.05為標(biāo)準(zhǔn)篩選出差異表達(dá)基因(DEGs)用于共表達(dá)網(wǎng)絡(luò)的構(gòu)建。
3.加權(quán)基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建:通過R語言中的WGCNA包構(gòu)建DEGs的共表達(dá)網(wǎng)絡(luò)[11]。利用hclust函數(shù)進(jìn)行聚類分析,剔除數(shù)據(jù)集中的離群樣本,利用pickSoftThreshold函數(shù)確定合適的軟閾值(β),得到擬合指數(shù)R2>0.8的近似無尺度網(wǎng)絡(luò)分布。利用blockwiseModules函數(shù)進(jìn)行一步法網(wǎng)絡(luò)構(gòu)建和模塊檢測(cè),生成最小模塊大小為30,合并切割高度為0.25的共表達(dá)基因模塊與拓?fù)渲丿B矩陣(TOM)。對(duì)每個(gè)模塊進(jìn)行主成分分析,以第一主成分計(jì)算基因模塊的特征值(module eigengenes, MEs)。引入上述臨床表型,計(jì)算MEs與各臨床表型之間的相關(guān)系數(shù),識(shí)別與OSA顯著相關(guān)的基因模塊。模塊內(nèi)分析基因表達(dá)與表型的相關(guān)性(gene significance, GS)、與模塊的相關(guān)性(module membership, MM),以篩選關(guān)鍵樞紐基因。
4.關(guān)鍵模塊的功能富集分析:選取與OSA顯著相關(guān)的基因模塊,利用Cytoscape 3.7.2軟件中ClueGo插件進(jìn)行基因本體論(GO)注釋、京都基因與基因組百科全書(KEGG)通路分析(kappa score=0.4,P≤0.01)。利用STRING 11.0數(shù)據(jù)庫進(jìn)行模塊內(nèi)基因的蛋白-蛋白相互作用(PPI)分析(combined score≥0.7),利用Cytoscape軟件中cytoHubba插件的Degree法可視化排名前30位的基因(Top30)。
5.關(guān)鍵基因的識(shí)別與驗(yàn)證:從關(guān)鍵模塊Top30基因構(gòu)建的PPI網(wǎng)絡(luò)中,依據(jù)節(jié)點(diǎn)度值選取排名前3位的基因?yàn)殛P(guān)鍵基因。整合GSE135917和GSE38792數(shù)據(jù)集,利用ggpubr、ggplot2包對(duì)關(guān)鍵基因在OSA和正常組織的表達(dá)再次驗(yàn)證,利用pROC包繪制ROC曲線評(píng)估關(guān)鍵基因的診斷價(jià)值和預(yù)測(cè)OSA的最佳截?cái)嘀怠?/p>
1.芯片數(shù)據(jù)的基本信息:經(jīng)過數(shù)據(jù)預(yù)處理,從18個(gè)組織樣本中共獲得23281個(gè)基因表達(dá)值。以|log2Fold Change|≥0.585且FDR<0.05為標(biāo)準(zhǔn),OSA與正常組相比,共篩選到3425個(gè)DEGs,其中上調(diào)基因497個(gè),下調(diào)基因2928個(gè)。火山圖顯示了DEGs的分布,熱圖顯示了DEGs與樣本的雙向分層聚類結(jié)果。為降低噪音及計(jì)算機(jī)的運(yùn)行負(fù)荷,將3425個(gè)DEGs用于下一步共表達(dá)網(wǎng)絡(luò)的構(gòu)建(圖1)。
圖1 GSE135917差異基因的篩選 A. 火山圖(紅點(diǎn)表示上調(diào)的差異基因;藍(lán)點(diǎn)表示下調(diào)的差異基因;灰點(diǎn)表示無差異的基因)B. 熱圖(紅色表示差異基因的高表 達(dá);藍(lán)色表示差異基因的低表達(dá))
2.加權(quán)基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建:通過WGCNA算法,依據(jù)無尺度網(wǎng)絡(luò)分布擬合,選取 β=18作為本數(shù)據(jù)集的軟閾值,并計(jì)算基因間的鄰接矩陣與拓?fù)渲丿BTOM,基于TOM構(gòu)建基因間的分層聚類樹,動(dòng)態(tài)剪切樹法合并MEs相似度較高的模塊,最終把基因聚類成3個(gè)模塊,即Turquoise模塊(2345個(gè)基因)、Blue模塊(220個(gè)基因)、Grey模塊(3個(gè)基因)(圖2A),其中將不能聚類到任何模塊的基因歸于Grey模塊,在后續(xù)分析中將其移除。進(jìn)一步的共表達(dá)模塊與臨床表型的相關(guān)性熱圖分析(圖2B)顯示,Turquoise模塊與OSA相關(guān)性最強(qiáng)(r=-0.98,P=0.000),以其作為關(guān)鍵模塊進(jìn)行GS與MM分析,Turquoise模塊內(nèi)基因與臨床表型相關(guān)性良好,呈明顯線性相關(guān)(圖2C),分布在右上角的基因既與其他基因關(guān)聯(lián)性高又與OSA的發(fā)病有密切聯(lián)系,有助于疾病關(guān)鍵基因的識(shí)別。因此,筆者用STRING數(shù)據(jù)庫對(duì)Turquoise模塊構(gòu)建蛋白相互作用網(wǎng)絡(luò),并用Cytoscape軟件可視化節(jié)點(diǎn)度最高的前30個(gè)基因,結(jié)果發(fā)現(xiàn),該模塊存在多個(gè)樞紐基因,如SLC2A2、PRL、SST等(圖2D)。
3.關(guān)鍵模塊的功能富集分析:利用Cytoscape中的ClueGo插件對(duì)Turquoise模塊內(nèi)基因進(jìn)行GO和KEGG富集分析,結(jié)果以P≤0.01為入選標(biāo)準(zhǔn)。該模塊的基因功能主要注釋于GO:0004984嗅覺受體活性,GO:0043227膜結(jié)合細(xì)胞器,GO:0005654核質(zhì),GO:0045184蛋白質(zhì)定位。另外,KEGG通路分析顯示該模塊基因主要富集于嗅覺轉(zhuǎn)導(dǎo)通路(hsa04740)和神經(jīng)活性配體-受體相互作用通路(hsa04080)(圖3)。
4.關(guān)鍵基因的識(shí)別與驗(yàn)證:從Top30基因構(gòu)建的PPI網(wǎng)絡(luò)中,依據(jù)節(jié)點(diǎn)度值選取排名前3位的基因SLC2A2、PRL、SST作為后續(xù)分析與驗(yàn)證的關(guān)鍵基因。筆者整合GSE135917和GSE38792數(shù)據(jù)集的樣本(包括20例OSA組織和16例正常組織),通過分析各關(guān)鍵基因的表達(dá)水平發(fā)現(xiàn),與正常組織比較,SLC2A2、PRL、SST在OSA組織中的表達(dá)明顯降低(P均<0.01),與芯片分析結(jié)果一致(圖4A)。隨后,進(jìn)行ROC分析以確定3個(gè)關(guān)鍵基因的診斷價(jià)值及在基因表達(dá)水平預(yù)測(cè)OSA的最佳截?cái)嘀?圖4B,表1),結(jié)果提示這3個(gè)關(guān)鍵基因很可能與OSA的發(fā)生、發(fā)展有重要聯(lián)系。
圖2 加權(quán)基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建 A.分層聚類樹與共表達(dá)模塊;B.模塊與臨床表型的相關(guān)性熱圖;C.Turquoise模塊內(nèi)基因與臨床表型數(shù)據(jù)關(guān)聯(lián)性; D.Turquoise模塊內(nèi)節(jié)點(diǎn)度最高的30個(gè)基因構(gòu)建的蛋白相互作用網(wǎng)絡(luò)圖
圖3 Turquoise模塊的功能富集分析 A.GO富集分析;B.KEGG信號(hào)通路分析
圖4 關(guān)鍵基因的驗(yàn)證 A.GSE135917與GSE38792中關(guān)鍵基因的表達(dá)水平;B.關(guān)鍵基因的ROC曲線
表1 關(guān)鍵基因的ROC曲線分析
OSA發(fā)病機(jī)制復(fù)雜,涉及多個(gè)器官系統(tǒng)的病理生理變化[2]。既往研究多數(shù)從單個(gè)基因出發(fā),僅能對(duì)生物學(xué)過程做出局部解釋,WGCNA通過構(gòu)建基因間的鄰接矩陣、拓?fù)渲丿BTOM,識(shí)別高度協(xié)同變化的基因模塊,并能結(jié)合臨床信息,分析模塊與臨床表型的相關(guān)性,充分利用基因組大數(shù)據(jù)信息,對(duì)其進(jìn)行整體全面探索[11]。本研究利用WGCNA法篩選與OSA顯著相關(guān)的基因模塊,并對(duì)模塊內(nèi)基因進(jìn)行功能富集分析,這些基因主要與嗅覺轉(zhuǎn)導(dǎo)、神經(jīng)活性配體-受體相互作用等密切相關(guān)。隨后對(duì)關(guān)鍵模塊構(gòu)建蛋白相互作用網(wǎng)絡(luò),將樞紐基因可視化后識(shí)別出3個(gè)關(guān)鍵基因,通過在另一張芯片上再次驗(yàn)證,發(fā)現(xiàn)SLC2A2、PRL、SST在OSA組織中表達(dá)均下調(diào),進(jìn)一步的ROC曲線分析顯示這3個(gè)關(guān)鍵基因可能是OSA潛在的生物學(xué)標(biāo)志物。目前3個(gè)基因在OSA中尚未有相關(guān)報(bào)道,但仍有證據(jù)提示它們與OSA存在潛在關(guān)聯(lián)。
SLC2A2是溶質(zhì)載體家族2成員,編碼葡萄糖轉(zhuǎn)運(yùn)子樣蛋白GLUT2,分布于肝、腎、腸、胰島β細(xì)胞和中樞神經(jīng)系統(tǒng),促進(jìn)葡萄糖在質(zhì)膜上的被動(dòng)轉(zhuǎn)運(yùn),在控制機(jī)體葡萄糖穩(wěn)態(tài)中起重要作用[15]。在芬蘭糖尿病預(yù)防研究中,SLC2A2的單核苷酸多態(tài)性(SNPs)與糖耐量受損向2型糖尿病的轉(zhuǎn)化相關(guān),而且這種關(guān)聯(lián)與體重變化無關(guān)[16]。Borglykke等[17]在評(píng)估46個(gè)2型糖尿病相關(guān)基因變異的單獨(dú)效應(yīng)和累積效應(yīng)時(shí)發(fā)現(xiàn),只有SCL2A2的小等位基因與心血管事件發(fā)生風(fēng)險(xiǎn)增加顯著相關(guān),而且這種關(guān)聯(lián)與基線糖尿病狀態(tài)無關(guān)。本研究結(jié)果表明,SLC2A2在OSA患者中的表達(dá)水平降低,且具有良好的識(shí)別能力(AUC=0.9594)。目前OSA對(duì)心血管疾病、代謝綜合征和神經(jīng)精神障礙的不利影響日益受到關(guān)注,一些基因變異參與OSA發(fā)病機(jī)制,且可能與OSA相關(guān)疾病的發(fā)生也存在因果關(guān)系[7]。因此,研究SLC2A2變異是否同時(shí)與OSA和共病疾病(如糖尿病、心血管疾病)相關(guān),即SLC2A2變異可能通過不同的機(jī)制同時(shí)影響這兩種表型,可能具有重要意義。
催乳素(PRL)是一種由腦垂體分泌的蛋白質(zhì)激素,參與泌乳、生殖、血管生成、免疫反應(yīng)和滲透調(diào)節(jié)等多種生物學(xué)過程[18]。PRL還可影響睡眠結(jié)構(gòu),PRL基因缺陷小鼠的快速眼動(dòng)睡眠比野生型小鼠減少[19]。此外,在高催乳素血癥患者中觀察到代謝改變、體重易增加,這些患者在其催乳素正常化后體重可減輕[20]。PRL可通過調(diào)節(jié)LPL活性和脂肪生成,減少脂聯(lián)素在人體脂肪組織中的釋放來調(diào)節(jié)能量代謝[21]。在一項(xiàng)針對(duì)早發(fā)和病態(tài)肥胖的全基因組關(guān)聯(lián)研究(GWAS)中發(fā)現(xiàn),PRL基因附近的變異與常見肥胖和BMI變異相關(guān)[22]。Nilsson等[21]在芬蘭西部的一項(xiàng)大規(guī)模人群研究中成功復(fù)制了這種關(guān)聯(lián),發(fā)現(xiàn)PRL基因附近的變異與男性肥胖的增加有關(guān)。本研究中,與正常組織比較,OSA患者PRL基因的表達(dá)顯著降低。眾所周知,肥胖使OSA的發(fā)病風(fēng)險(xiǎn)增加10~14倍,有望解釋高達(dá)40%的AHI變異,鑒定決定“中間表型”的基因可能有助于識(shí)別OSA的易感基因[7]。因此,有必要進(jìn)一步研究PRL變異是否通過睡眠結(jié)構(gòu)改變或中間表型(如肥胖)導(dǎo)致OSA。
生長(zhǎng)抑素(SST)是一種環(huán)肽激素,影響生長(zhǎng)激素的釋放和胃腸功能。SST可通過調(diào)節(jié)胃腸運(yùn)動(dòng)、腸道養(yǎng)分吸收和能量平衡來影響機(jī)體生長(zhǎng)和體重[23]。此外,作為中樞神經(jīng)系統(tǒng)中廣泛存在的神經(jīng)遞質(zhì)或調(diào)質(zhì),SST在突觸可塑性和神經(jīng)元活性的微調(diào)中發(fā)揮作用[24]。研究表明,SST+/nNOS+神經(jīng)元功能障礙可能導(dǎo)致與慢波活動(dòng)產(chǎn)生障礙和認(rèn)知受損相關(guān)的病理生理變化,包括阿爾茨海默病(AD)、癲癇、精神分裂癥和創(chuàng)傷性腦損傷等[25]。衰老早期大腦中SST表達(dá)下調(diào)導(dǎo)致腦啡肽酶活性逐漸下降,導(dǎo)致AD患者Aβ-淀粉樣蛋白的沉積,因此,SST基因變異可能改變生長(zhǎng)抑素的表達(dá)或功能,從而參與AD的發(fā)病過程[26]。本研究中SST在OSA樣本中的表達(dá)降低,如上所述,OSA與心腦血管病、神經(jīng)精神障礙等密切相關(guān),一些基因變異與OSA和相關(guān)疾病的發(fā)生可能均存在因果關(guān)系,故SST變異是否會(huì)通過不同的機(jī)制效應(yīng)同時(shí)導(dǎo)致OSA和認(rèn)知功能障礙,有必要進(jìn)一步驗(yàn)證。
綜上所述,本研究通過WGCNA方法在OSA患者皮下脂肪組織中發(fā)現(xiàn)了2個(gè)共表達(dá)模塊和3個(gè)關(guān)鍵基因,有助于為OSA和相關(guān)疾病的研究及其診斷治療、靶點(diǎn)選擇提供新的線索。但關(guān)鍵基因在OSA發(fā)生中的具體作用,仍需要開展進(jìn)一步的體內(nèi)、體外實(shí)驗(yàn)予以深入探討。