楊樹法,劉妍,王天鐸,秦朗,閆有圣,陰赪宏
首都醫(yī)科大學(xué)附屬北京婦產(chǎn)醫(yī)院北京婦幼保健院產(chǎn)前診斷中心,北京100026
先天性腎臟疾病嚴重影響患兒生活質(zhì)量,預(yù)防先天性腎病能夠有效降低社會和家庭的負擔?,F(xiàn)代分子生物學(xué)技術(shù)的臨床應(yīng)用使得更多類型的染色體微缺失/重復(fù)、點突變等基因組變異被檢出,提高了先天性腎病發(fā)育相關(guān)基因突變的檢出率。與成人遺傳咨詢相比,產(chǎn)前階段胎兒臨床資料相對缺失,使得正確闡釋這些基因組變異的臨床意義面臨挑戰(zhàn)。研究表明,與胎兒發(fā)育相關(guān)的基因信息存在于羊水游離RNA(AfcfRNA)中[1-3],分析AfcfRNA 中基因變化有助于解讀基因突變的致病性。但是,AfcfRNA 中基因來源組織的多樣性和泌尿系統(tǒng)發(fā)育的復(fù)雜性,增加了從AfcfRNA 中獲取泌尿系統(tǒng)發(fā)育信息的難度。因此,2020 年1 月—2021 年1 月,本研究分析了孕中期正常胎兒AfcfRNA 轉(zhuǎn)錄組,試圖從AfcfRNA轉(zhuǎn)錄組中篩選泌尿系統(tǒng)發(fā)育相關(guān)的關(guān)鍵基因,為AfcfRNA 在產(chǎn)前胎兒泌尿系統(tǒng)發(fā)育評估中的應(yīng)用奠定基礎(chǔ)。
1.1 芯片數(shù)據(jù)來源 從GEO 數(shù)據(jù)庫中按照入選和排除標準下載胎兒AfcfRNA 的芯片檢測數(shù)據(jù)。共獲取56 例 胎 兒AfcfRNA 的 檢 測 結(jié) 果(GSE101141,GSE16176, GSE25634, GSE33168, GSE47394,GSE48521,GSE49893,GSE58435),芯 片 類 型 為Affymetrix Human Genome U133 Plus2.0芯片。56例標本均為孕中期(孕13~27 周)羊水,孕婦無妊娠并發(fā)癥,單胎妊娠,胎兒發(fā)育正常,染色體核型正常。排除胎兒B超檢查結(jié)果異常者。
1.2 基因共表達網(wǎng)絡(luò)分析 采用Olgio軟件對芯片檢測結(jié)果進行讀取、背景校正以及歸一化。在獲取基因表達量后,利用SVA 軟件包去除批次效應(yīng),使不同芯片檢測結(jié)果具有相似的均值和標準差。在不同樣品的檢測結(jié)果具有可比性的基礎(chǔ)上,利用WGCNA 軟件的動態(tài)樹形剪切算法建立基因共表達模塊,進行基因共表達網(wǎng)絡(luò)分析,軟閾值設(shè)為12,最小類的大小設(shè)置為30。篩選得到的基因共表達模塊以不同顏色名稱表示。通過分析AfcfRNA 轉(zhuǎn)錄組中基因平均表達量和變異系數(shù)(CV%),顯示不同模塊基因表達量情況。CV 值為基因在所有研究樣品的表達量的標準差除均值再乘100得出。
1.3 泌尿組織特異基因篩選 從Human Protein Atlas 數(shù)據(jù)庫[4]下載正常組織的基因表達量數(shù)據(jù)(https://www.proteinatlas.org/download/rna_tissue_consensus.tsv.zip)。編寫R 語言腳本,統(tǒng)計分析數(shù)據(jù)所涉及組織和基因類別。將在泌尿組織中的表達量高于所有組織中平均表達量10 倍以上的基因判定為泌尿組織特異基因。
1.4 泌尿組織特異基因共表達模塊的功能富集分析 編寫R 腳本,從共表達模塊中選取泌尿組織特異基因,建立泌尿組織特異基因共表達模塊。利用Cluster Profiler 軟件包對每個泌尿組織特異基因共表達模塊中的基因進行GO 功能富集分析[5]。用Benjamini-Hochberg 法進行P值調(diào)整,校正P<0.05為差異有統(tǒng)計學(xué)意義。
1.5 共表達基因的蛋白—蛋白相互作用(PPI)網(wǎng)絡(luò)分析及關(guān)鍵基因篩選 從STRING數(shù)據(jù)庫下載PPI數(shù)據(jù)(https://stringdb-static.org/download/protein.links.v11.0/9606.protein.links.v11.0.txt.gz)[6],Igraph軟件包進行PPI網(wǎng)絡(luò)制圖,編寫R語言腳本,統(tǒng)計泌尿組織特異基因共表達模塊中基因編碼蛋白的相互作用關(guān)系,將combine_score 設(shè)為150,統(tǒng)計每個基因的degree,選擇degree>20的基因作為關(guān)鍵基因。
2.1 正常AfcfRNA 中基因共表達模塊 利用WGCNA 軟件共建立20 個共表達模塊,以不同的顏色表示模塊名稱(black,blue,brown,cyan,green,greenyellow,grey60,lightcyan,lightgreen,lightyellow,magenta,midnightblue,pink,purple,red,royalblue,salmon,tan,turquoise 及yellow)。具有共表達關(guān)系的基因具有更高的表達量。
2.2 泌尿組織特異基因共表達模塊的功能富集分析結(jié)果 Human Protein Atlas 數(shù)據(jù)庫中泌尿組織包括腎臟和膀胱。篩選出270 個基因為泌尿組織特異基因。分別將這270 個泌尿組織特異基因與共表達模塊中的基因取交集,建立泌尿組織特異基因的共表達模塊。在brown,green 及turquoise 模塊中富集到泌尿系統(tǒng)功能相關(guān)的GO 分析項目(表1)。這些功能涉及中腎發(fā)生和發(fā)育、腎單位發(fā)生、腎小球、腎小管生成及腎上皮發(fā)育等腎臟發(fā)育相關(guān)功能。
表1 泌尿組織特異基因共表達模塊的功能富集分析結(jié)果
2.3 泌尿組織特異基因共表達模塊中關(guān)鍵基因篩選結(jié)果 將brown、green 及turquoise 模塊內(nèi)的泌尿組織特異基因進行PPI 網(wǎng)絡(luò)分析,確定各個模塊的關(guān)鍵基因。在combine_score 為150、degree 為20 時,共篩選到18 個關(guān)鍵基因,分別為CLCNKB、MIOX、NAT8、SLC13A3、SLC3A1、SLC6A18、UGT1A6、REN、AQP2、BSND、CYP24A1、CYP4A11、FOXI1、FXYD2、SLC17A1、SLC34A1、SLC7A9 及TRPV5。計算各基因在所有樣品中的平均表達量,得到P25為3.09,利用該閾值將孕中期AfcfRNA 中表達量偏低的關(guān)鍵基因刪除,得到孕中期高表達的13個關(guān)鍵基因,其中5個基因來自brown 模塊(CLCNKB、SLC6A18、NAT8、MIOX 及SLC3A1)、8 個 基 因 來 自turquoise 模 塊(AQP2、CYP4A11、SLC7A9、SLC13A3、FXYD2、TRPV5、SLC17A1 及BSND)。各關(guān)鍵基因的來源模塊、degree、平均表達量及CV%見表2。
表2 18個泌尿系統(tǒng)發(fā)育關(guān)鍵基因分析結(jié)果
泌尿系統(tǒng)主要由腎臟、膀胱和尿道組成。B 超是篩查腎臟先天畸形的主要手段,但對于腎小球、腎小管等微小結(jié)構(gòu)病變及腎泌尿和排泄功能的異常,產(chǎn)前B超篩查難以檢出。獲取與腎臟發(fā)育密切相關(guān)的分子標志物具有重要臨床意義。
AfcfRNA 來源于孕婦羊水,是可安全獲取的胎兒組分。本研究利用WGCNA 分析將AfcfRNA 中的基因歸為20 個共表達模塊。在共表達關(guān)系建立過程中,部分低表達量基因被過濾。AfcfRNA 來源于胎兒多個組織,針對此特點,研究中利用基因表達數(shù)據(jù)庫,篩選了泌尿組織特異基因,將其與共表達模塊相結(jié)合,建立了泌尿組織特異基因共表達模塊。通過GO 分析發(fā)現(xiàn),泌尿組織特異模塊中的基因與中腎發(fā)生和發(fā)育、腎單位發(fā)生、腎小球生成、腎小管生成及腎上皮發(fā)育等腎臟發(fā)育相關(guān)功能密切相關(guān),從功能上驗證了研究中建立的模塊與腎臟發(fā)育有關(guān)。
基于STRING 數(shù)據(jù)庫[6],本研究篩選了共表達模塊中的關(guān)鍵基因,以此來集中體現(xiàn)共表達模塊的生物學(xué)功能。在brown、green 及turquoise 共表達模塊中共篩選到18個關(guān)鍵基因。這18個關(guān)鍵基因中,共有13個基因在正常AfcfRNA 中表達量高于P25,具有高表達特點。關(guān)鍵基因中,5 個來自brown 模塊(CLCNKB、SLC6A18、NAT8、MIOX 及SLC3A1),8 個來 自turquoise 模 塊(AQP2、CYP4A11、SLC7A9、SLC13A3、FXYD2、TRPV5、SLC17A1及BSND)。
CLCNKB 編碼管基底氯通道ClC-Kb,其突變可以導(dǎo)致Ⅲ型Bartter綜合征,表現(xiàn)為低血鉀性堿中毒、腎素和醛固酮增高、腎小球旁器增生和肥大[7]。SLC6A18 是高表達在腎臟和小腸的氨基酸轉(zhuǎn)運蛋白[8],有研究表明其與中性氨基酸的吸收有關(guān)[9]。NAT8 編碼腎臟和肝臟特異的乙酰轉(zhuǎn)移酶,在腎小球功能調(diào)節(jié)中發(fā)揮重要作用[10],其突變與腎功能衰竭的發(fā)生發(fā)展密切相關(guān)[11]。MIOX 編碼肌醇加氧酶,其升高可以增強細胞內(nèi)氧化還原反應(yīng),造成腎小管損傷[12]。SLC3A1編碼胱氨酸攝取轉(zhuǎn)運體,在腎臟表達量最高,期次是小腸和肝臟[13],其突變可以導(dǎo)致胱氨酸尿和胱氨酸結(jié)石[14]。AQP2 是一種水通道蛋白,負責腎臟收集管水的重吸收,其突變可以導(dǎo)致嚴重的腎源性尿崩癥[15-16]。CYP4A11 在腎遠端小管高表 達[17],其 基 因 多 態(tài) 性 與 高 血 壓 密 切 相 關(guān)[18]。SLC7A9編碼異二聚體氨基酸轉(zhuǎn)運體蛋白,在腎臟遠端小管胱氨酸重吸收中發(fā)揮重要作用,其突變與尿石癥密切相關(guān)[19]。FXYD2 是Na+-K+-ATP 酶的γ 亞單位,與鎂離子在腎臟的重吸收功能密切相關(guān),其突變會導(dǎo)致高鎂尿癥和低鎂血癥[20]。TRPV5 編碼腎臟瞬時受體電位香草酸5 亞型受體,是高選擇性鈣離子通道,參與腎臟鈣離子的重吸收并維持鈣離子穩(wěn)態(tài),其突變體是尿石癥的遺傳學(xué)基礎(chǔ)[21]。SLC17A1 是腎臟尿酸轉(zhuǎn)運蛋白,其無義突變會增加尿酸鹽的排泄[22]。BSND 突變會導(dǎo)致Ⅳ型Bartter 綜合征,表現(xiàn)為低鉀血癥、代謝性堿中毒、血清腎素活性升高及醛固酮增多癥等[23]。
綜上所述,本研究利用共表達網(wǎng)絡(luò)分析和組織特異基因篩選的方法,分析孕中期正常胎兒AfcfRNA轉(zhuǎn)錄組,建立了泌尿系統(tǒng)發(fā)育相關(guān)的共表達網(wǎng)絡(luò);關(guān)鍵基因功能涉及中腎發(fā)生和發(fā)育、腎泡的發(fā)育、腎單位發(fā)生、腎小管生成、腎臟發(fā)育及泌尿生殖系統(tǒng)發(fā)生等。這些關(guān)鍵基因有望成為產(chǎn)前診斷中評估泌尿系統(tǒng)發(fā)育的標志物。