楊思潔,李保紅,周 竹
(昆明醫(yī)科大學(xué)第一附屬 腎臟內(nèi)科 云南省慢性腎病臨床醫(yī)學(xué)研究中心,云南 昆明 650032)
腎母細(xì)胞瘤(Wilms tumor,WT)是兒童最常見的腎癌,占兒童癌癥的6~7%[1]。WT在西方國(guó)家的患病率約為7~10/100萬,而中國(guó)的患病率僅為3.3/100萬,近95%的病例診斷年齡在10歲以下,平均診斷年齡為43~48個(gè)月,WT在西方國(guó)家的生存率已達(dá)90%以上,而復(fù)發(fā)患者的生存率則低得多,但是幸存者可能患有慢性嚴(yán)重健康問題,越來越多的證據(jù)支持遺傳變異對(duì)WT發(fā)病的貢獻(xiàn),定位于染色體11p13的WT1基因于1990年首次被發(fā)現(xiàn)為WT的抑癌基因,隨后在WT中發(fā)現(xiàn)WTX、CTNNB1、TP53的突變以及11p15甲基化的異常,除此之外,許多其他的新基因突變也被發(fā)現(xiàn)與WT發(fā)生有關(guān)[2]。而目前基于基因水平研究WT的文章少之又少,因此本研究認(rèn)為從基因水平出發(fā)研究此疾病將會(huì)是一種途徑。生物信息學(xué),分子生物學(xué)和信息技術(shù)的結(jié)合,已成為理解癌癥的分子機(jī)制和信號(hào)通路的重要工具。生物信息學(xué)技術(shù)的發(fā)展和生物標(biāo)記物的鑒定使得在癌癥的診斷和治療方面取得了巨大的進(jìn)步,基因表達(dá)譜技術(shù),包括RNA測(cè)序和微陣列技術(shù),已經(jīng)被用來揭示癌癥相對(duì)于癌旁非癌組織的分子差異[3]。微陣列技術(shù)提供了從硬件到軟件的一體化系統(tǒng)生物學(xué)解決方案。它可以同時(shí)掃描芯片中數(shù)萬個(gè)基因探針的雜交信號(hào),并對(duì)樣本的轉(zhuǎn)錄組譜進(jìn)行定量分析[4]。GEO(Gene Expression Omnibus)是生物信息學(xué)領(lǐng)域中最具代表性的數(shù)據(jù)庫,從GEO數(shù)據(jù)庫中進(jìn)行分子水平的數(shù)據(jù)挖掘可以幫助發(fā)現(xiàn)腫瘤標(biāo)志物,用于臨床診斷或治療。
GEO數(shù)據(jù)庫是一個(gè)儲(chǔ)存芯片、二代測(cè)序以及其他高通量測(cè)序數(shù)據(jù)的一個(gè)數(shù)據(jù)庫,從GEO數(shù)據(jù)庫中下載基因表達(dá)數(shù)據(jù)集GSE167054,該數(shù)據(jù)集包括6個(gè)非癌組織樣本和10個(gè)WT組織樣本,由“Zhuo Liu”于2021年2月18日提交。
GEO2R是GEO數(shù)據(jù)庫自帶的在線分析工具。GEO2R提供了一個(gè)簡(jiǎn)單的界面,允許用戶執(zhí)行復(fù)雜的基于r的GEO數(shù)據(jù)分析,以幫助識(shí)別和可視化差異基因表達(dá)[5]。利用geo2r對(duì)WT組織樣本和非癌組織樣本中的表達(dá)基因進(jìn)行差異分析并制作火山圖。下載geo2r分析后的數(shù)據(jù),設(shè)置adj.p.Val<0.05, logFC>2為截取值篩選出差異基因。
DAVID(The Database for Annotation,Visualization and Integrated Discovery)是一個(gè)可通過網(wǎng)絡(luò)訪問的程序,它將功能基因組注釋與直觀的圖形摘要集成在一起[6]。GO從3個(gè)方面描述生物學(xué)領(lǐng)域:分子功能(Molecular function,MF)、細(xì)胞組分(cellular components,CC)、生物過程(biological process,BP)。將差異基因放入DAVID進(jìn)行GO分析和Pathway分析。即可得到差異基因富集的分子功能、細(xì)胞組分、生物過程和通路。
PPI網(wǎng)絡(luò)數(shù)據(jù)庫是一個(gè)在線數(shù)據(jù)庫資源,它提供預(yù)測(cè)的和實(shí)驗(yàn)的蛋白質(zhì)之間相互作用信息,并具有置信度評(píng)分[7]。該數(shù)據(jù)庫可應(yīng)用于2031個(gè)物種,包含960萬種蛋白和1380萬種蛋白質(zhì)之間的研究蛋白之間的相互作用網(wǎng)絡(luò)。將差異基因放入PPI分析數(shù)據(jù)庫,設(shè)置為實(shí)驗(yàn)數(shù)據(jù),要求的最低互動(dòng)分?jǐn)?shù)為0.4,建立蛋白質(zhì)交互網(wǎng)絡(luò),線條連接的2個(gè)蛋白質(zhì)代表兩者之間有相互作用,線條厚度表示數(shù)據(jù)支持的強(qiáng)度,整個(gè)網(wǎng)絡(luò)中連線最多的基因即為關(guān)鍵基因。
共篩選出了1057個(gè)差異基因,其中有291個(gè)差異基因在WT組織樣本中表達(dá)上調(diào),在非癌組織樣本中表達(dá)下調(diào);766個(gè)差異基因在WT組織樣本中表達(dá)下調(diào),在非癌組織樣本中表達(dá)上調(diào)?;鹕綀D見圖1。
圖1 火山圖注:一個(gè)點(diǎn)代表一個(gè)基因,黑色的點(diǎn)代表無差異基因,紅色代表上調(diào)基因,綠色代表下調(diào)基因。
GO分析得到差異基因最富集的3個(gè)MF:蛋白質(zhì)同源二聚化活性、受體結(jié)合、催化活性,見表1,得到差異基因最富集的3個(gè)CC:膜的整體組件、細(xì)胞外外泌體、等離子膜,見表2,得到差異基因最富集的3個(gè)BP:氧化還原、代謝過程、運(yùn)輸,見表3;pathway分析得到差異基因最富集的3個(gè)通路:代謝途徑、癌癥通路、抗生素的生物合成,見表4。
PPI網(wǎng)絡(luò)(圖2)中EGFR、ALDH6、LAMTOR5、PEPD連線最多,說明在此PPI網(wǎng)絡(luò)中它們是具有更多的相互作用的蛋白質(zhì)。EGFR、ALDH6、LAMTOR5、PEPD即與WT的發(fā)生可能密切相關(guān)的關(guān)鍵基因。
表1 MF分析
表2 CC分析
表3 BP分析
表4 pathway分析
圖2 PPI網(wǎng)絡(luò)注:圓圈代表蛋白質(zhì),線條連接的2個(gè)蛋白質(zhì)代表兩者之間有相互作用,線條厚度表示數(shù)據(jù)支持的強(qiáng)度
WT的病因是復(fù)雜的,在過去的幾十年中發(fā)現(xiàn)了許多基因突變。第一個(gè)確定的WT抑制基因是WT1基因,于1990年被克隆。隨后,WTX、CTNNB1、TP53的突變以及11p15甲基化的異常,被確定為導(dǎo)致WT致癌的因素,除此之外,病例對(duì)照研究中的基因相關(guān)性分析也繪制了更多的WT風(fēng)險(xiǎn)基因位點(diǎn)[8]。本研究利用目前成熟的生物信息學(xué)和表達(dá)譜技術(shù),從GEO數(shù)據(jù)庫中下載基因表達(dá)數(shù)據(jù)集GSE167054,利用GEO2R對(duì)WT組織樣本和非癌組織樣本中的表達(dá)基因進(jìn)行差異分析并制作火山圖。下載GEO2R分析后的數(shù)據(jù),設(shè)置P<0.05, logFC>2為限制條件,共篩選出了1057個(gè)差異基因,其中有291個(gè)差異基因在WT組織樣本中表達(dá)上調(diào),在非癌組織樣本中表達(dá)下調(diào);766個(gè)差異基因在WT組織樣本中表達(dá)下調(diào),在非癌組織樣本中表達(dá)上調(diào)。將差異基因放入DAVID進(jìn)行GO分析和pathway分析后得到差異基因最富集的3個(gè)MF:蛋白質(zhì)同源二聚化活性、受體結(jié)合、催化活性;得到差異基因最富集的3個(gè)CC:膜的整體組件、細(xì)胞外外泌體、等離子膜;得到差異基因最富集的3個(gè)BP:氧化還原、代謝過程、運(yùn)輸。pathway分析得到差異基因最富集的3個(gè)通路:代謝途徑、癌癥通路、抗生素的生物合成。將差異基因放入蛋白互作(PPI)網(wǎng)絡(luò)數(shù)據(jù)庫建立蛋白質(zhì)交互網(wǎng)絡(luò),EGFR、ALDH6、LAMTOR5、PEPD連線最多,說明在此PPI網(wǎng)絡(luò)中它們是具有更多的相互作用的蛋白質(zhì)。
EGFR是一種跨膜糖蛋白,是酪氨酸激酶超家族受體的一員,EGFR基因改變?cè)谏窠?jīng)膠質(zhì)瘤可作為一種有針對(duì)性的治療和預(yù)后的手段[9]。Northern 印跡分析表明,aldh6基因在許多組織中低水平表達(dá),在唾液腺、胃和腎臟中高水平表達(dá)[10]。強(qiáng)有力的證據(jù)表明LAMTOR5的高表達(dá)促進(jìn)了癌細(xì)胞的增殖并有助于癌癥的進(jìn)展[11]。數(shù)據(jù)表明,PEPD 誘導(dǎo)的 EGFR 信號(hào)傳導(dǎo)可作為治療傷口愈合的新嘗試[12]。大數(shù)據(jù)是一種內(nèi)容龐大而又多樣化的信息資產(chǎn),對(duì)大數(shù)據(jù)的處理需要敏銳的洞察能力、強(qiáng)大的處理能力以及有效的使用方式[13]。EGFR、ALDH6、LAMTOR5、PEPD即與WT的發(fā)生可能密切相關(guān)的關(guān)鍵基因,它們可能為臨床提供新的臨床診斷或治療靶點(diǎn)。但尚需要臨床試驗(yàn)進(jìn)一步驗(yàn)證。