李 明,段世博,侯秀真,張榮菊,黨萬里,鄭新英,金 燕
妊娠期糖尿病(gestational diabetes mellitus,GDM)是指妊娠期發(fā)生或首次發(fā)現(xiàn)的不同程度的糖代謝異常。 相關流行病學報道,其發(fā)病率存在較大差異(1%~14%),較為一致的結果是其發(fā)病率近年來出現(xiàn)了明顯的上升趨勢[1-2]。 我國尚缺乏系統(tǒng)的全國范圍內(nèi)的GDM 發(fā)病率數(shù)據(jù),但區(qū)域相關流行病學研究認為,GDM 發(fā)病率約為5%,而約1/4 ~3/4 GDM 患者會出現(xiàn)各種母嬰并發(fā)癥[3]。 同時,首次妊娠發(fā)生GDM,則二次妊娠GDM 發(fā)生率高達35.6%~69.0%,其后代成年后患2 型糖尿病的危險明顯增高[2]。 GDM 發(fā)病具體機制至今尚無定論,相關研究結論也不一致。 大多數(shù)研究認為GDM 的發(fā)生與胰島素抵抗和胰島B 細胞分泌降低有關,其中遺傳基因易感性、胰島素信號系統(tǒng)障礙可能是發(fā)病基礎[4]。 因此,篩選GDM 相關基因,預測其功能有望成為預防和治療GDM 的關鍵靶點。
1.1 數(shù)據(jù)庫選擇 分別選取基因表達譜數(shù)據(jù)庫(Gene Expression Omnibus,GEO)[5],用于對篩選出的差異基因進行生物功能富集分析;蛋白-蛋白相互作用數(shù)據(jù)庫STRING[7]用于構建篩選差異表達基因的互相作用;Cytohubb 軟件[8],用于對STRING 構建網(wǎng)絡中篩選關鍵基因。
1.2 方法
1.2.1 數(shù)據(jù)篩選 首先對選入的數(shù)據(jù)集進行數(shù)據(jù)下載,采用R 軟件Lima 包對差異表達基因進行篩選,篩選條件為基因差異表達大于2 倍(Log2FC >1),容錯率為5%(P<0.05)。
1.2.2 功能富集分析 基因本體論(Gene Ontology,GO)[9]和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEEG)分析[10],預測其可能功能及信號通路。
1.2.3 蛋白網(wǎng)絡構建及hub 基因篩選 采用STRING 分析篩查出的差異表達基因編碼蛋白間的相互作用關系。 篩選條件為:相互作用來源Textmining,Co-expression,Neighborhood,Gene Fusion 和Cooccurrence;相互作用數(shù)值<50;置信度0.4。
1.2.4 免疫組化 驗證選取30 例GDM 患者和30名正常分娩孕婦為研究對象,采用免疫組化方法對關鍵基因編碼蛋白在GDM 患者胎盤組織及正常妊娠產(chǎn)婦胎盤組織中的表達水平進行檢測。 染色強度:細胞著色強度則以多數(shù)陽性細胞呈現(xiàn)的染色(棕黃色)計分。 未著色或與背景一致淺棕色為0 分;強著色:著色強度和己知陽性切片相同計3 分;淺著色:著色淺、但與陰性對照切片有明顯區(qū)別計1 分;染色強度在淺著色和強著色之間者為中等著色計2分。 陽性細胞百分數(shù):高倍鏡(×400)下隨機選取10個視野,每個視野計數(shù)10 個細胞,取平均值作為陽性細胞百分數(shù)。 小于5%的細胞呈陽性或細胞顯色與背景一致計0 分;弱陽性:5%~25%的細胞呈陽性計1 分;陽性:26%~50%的細胞呈陽性計2 分;強陽性:大于51%的細胞呈陽性計3 分。 根據(jù)這兩項指標的積分和分為4 級,即陰性(-)為0 分,弱陽性(+)為1~2 分,陽性(++)為3~4 分,強陽性(+++)為5~6 分。
1.3 統(tǒng)計學處理 應用STATA 10.0 軟件進行統(tǒng)計分析,計量資料均數(shù)±標準差(±s)表示,兩組間比較使用t 檢驗,多組間比較使用單因素方差分析;計數(shù)資料用率表示,行χ2檢驗;P<0.05 為差異有統(tǒng)計學意義。
2.1 差異表達基因篩選 共2 個數(shù)據(jù)集GSE51546(https:/ /www.ncbi.nlm.nih.gov/geo/query/acc.aglacc=GSE5154t)[11]和GSE87295 (https:/ /www. ncbi.nlm.nih.gov/geo/query/acc.cgi)納入本次分析,2 個數(shù)據(jù)集中共差異表達基因4 個[TACSTD2,磷脂酰肌醇3-激酶(phosphatidylinositide 3-kinase,PI3K),COLEC12 和IGFBP6],圖1。
圖1 差異表達基因篩選
2.2 層次聚類分析 GDM組與對照組呈現(xiàn)出明顯的相關基因聚類表達。 4 個基因中GDM 患者和對照組中均呈現(xiàn)明顯的聚類趨勢,圖2。
圖2 篩選出的4 個差異表達基因的聚類熱圖
2.3 差異表達基因的功能富集 上述差異表達基因產(chǎn)物主要位于細胞質和細胞接合器,主要分子功能為磷酸轉移酶活性,醇基作為受體和蛋白激酶,主要參與體內(nèi)相關蛋白信號轉導。 KEGG 通路分析顯示,差異基因主要參與了PI3K-AKT 信號通路、糖代謝途徑相關通路和胰島素信號通路,表1。
表1 基因功能富集分析
圖3 差異表達基因蛋白-蛋白相關作用互作網(wǎng)絡圖
2.4 差異表達基因蛋白-蛋白互作網(wǎng)絡 篩選出的4 個差異表達基因編碼蛋白-蛋白相互作用網(wǎng)絡(圖3)顯示,整個網(wǎng)絡中54 個蛋白節(jié)點,共574 個相互作用鏈接,平均連接度為21.3,聚集度為0.74。2.5 GDM 蛋白-蛋白互作網(wǎng)絡關鍵基因篩選 根據(jù)蛋白-蛋白互作網(wǎng)絡篩選出PI3K、TAL1 和LYL1為GDM 差異表達蛋白-蛋白網(wǎng)絡中的關鍵基因,其中PI3K 在3 個關鍵基因中作用最為重要,圖4。
圖4 GDM 蛋白-蛋白互作網(wǎng)絡關鍵基因篩選
2.6 免疫組化驗證結果 PI3K 陽性表達細胞為合體滋養(yǎng)細胞胞質中出現(xiàn)均勻一致棕黃色顆粒,細胞核不著色。 GDM組中,PI3K 陽性表達21 例,其中(+)12 例,(++)6 例,(+++)3 例,陽性表達率為70.0%(21/30);正常妊娠組陽性表達率為100%(30/30)。 GDM組中PI3K 的陽性表達低于正常妊娠組,差異有統(tǒng)計學意義(χ2=22.47,P<0.01,表2)。
表2 PI3K 在GDM組與正常妊娠組中的表達
GDM 是臨床中最為常見的一類妊娠合并癥,其發(fā)病率在不同地區(qū)不同年齡妊娠人群中存在較大差異。 同時,其確切發(fā)病機制仍不完全清楚。 目前研究認為其發(fā)病主要是隨著孕周的增加,到妊娠中、晚期,孕婦體內(nèi)抗胰島素樣物質增加,如胎盤生乳素、雌激素、孕酮、皮質醇和胎盤胰島素酶等使孕婦對胰島素的敏感性隨孕周增加而下降,從而出現(xiàn)血糖升高。
生物信息大數(shù)據(jù)挖掘能夠對已有的相關基因芯片和測序數(shù)據(jù)進行篩選和二次分析。 根據(jù)不同的需要設置篩選條件,從而得出相應的結論,為臨床相關疾病的診斷、治療和基礎研究提供思路和方向[12-13]。生物信息學分析是進行臨床及基礎研究不可或缺的重要信息學手段。 近年來隨著基因表達譜芯片及二代測序技術的不斷進展,產(chǎn)生了海量基因表達數(shù)據(jù),為生物信息學技術深入分析提供了基礎。 本研究中,入選了2 個關于GDM 的數(shù)據(jù)集并進行篩選,同時對差異表達的基因進行重疊分析,對2 個數(shù)據(jù)集中差異表達基因進行研究。 2 個數(shù)據(jù)集中差異表達基因4 個(TACSTD2,PI3K,COLEC12 和IGFBP6)。這些差異基因表達蛋白主要定位于細胞質和細胞接合器,主要分子功能為磷酸轉移酶活性,醇基作為受體和蛋白激酶參與了PI3K-AKT 信號通路、糖代謝途徑相關通路和胰島素信號通路。 其中PI3K 在GDM網(wǎng)絡中作為最關鍵的基因發(fā)揮重要的作用。 同時免疫組化也證實PI3K 蛋白在GDM 患者和正常妊娠產(chǎn)婦胎盤中存在明顯的差異表達。
在胰島素信號轉導通路中,胰島素受體底物蛋白激活PI3K 主要與胰島素的代謝效應有關。 在胰島素抵抗狀態(tài)下,胰島素刺激引起的PI3K 信號傳導途徑作用下降,而MAPK 介導的信號傳導作用則正常[14-15]。 胰島素的代謝功能和血糖調節(jié)主要受胰島素受體/胰島素受體底物-1/PI3K/磷脂酰肌醇依賴蛋白激酶/蛋白激酶B(AKT)/葡萄糖轉移因子4(GLUT4)信號路徑的影響,即PI3K-AKT 信號通路。 所以當信號路徑中任意一個信號分子或環(huán)節(jié)發(fā)生異常時均可導致糖尿病。
因此,PI3K 在GDM 患者中存在明顯的差異表達,并可能在GDM 發(fā)生發(fā)展中發(fā)揮重要作用。PI3K 可能成為治療和預防GDM 的關鍵靶點。