周立宇 張嬌 石瓊婭 呂長(zhǎng)亮
【中圖分類號(hào)】R730.4???????????? 【文獻(xiàn)標(biāo)識(shí)碼】A???????????? 【文章編號(hào)】2107-2306(2021)15--01
關(guān)鍵詞:多組學(xué)數(shù)據(jù);癌癥;大數(shù)據(jù)
癌癥是造成死亡人口最高的疾病,在中國(guó),癌癥已經(jīng)成為人類頭號(hào)死因。其特點(diǎn)是細(xì)胞的相對(duì)不受限制的增殖可以侵入其他正常組織、轉(zhuǎn)移到遠(yuǎn)處的器官?;蛲蛔兪前┌Y發(fā)生的關(guān)鍵之一,當(dāng)人體內(nèi)某個(gè)細(xì)胞獲足夠有利于自身的突變時(shí),它將獲得自主增殖、侵入組織和轉(zhuǎn)移的能力,即癌癥的發(fā)生。這種增殖、入侵、轉(zhuǎn)移的能力也造成了癌癥難以治愈的特性。發(fā)現(xiàn)并研究驅(qū)動(dòng)正常細(xì)胞突變?yōu)榘┌Y的基因一直是人類在研究癌癥領(lǐng)域中的難題,因?yàn)榇笠?guī)模的測(cè)序研究受到測(cè)序相對(duì)較低的效率和較高的成本的限制。隨著生物信息學(xué)迅速的發(fā)展,測(cè)序技術(shù)、測(cè)序數(shù)據(jù)的處理、生物信息學(xué)軟件都有了很大的進(jìn)步。人類也發(fā)現(xiàn)了許多與癌癥發(fā)生、發(fā)展相關(guān)的基因。例如:彌漫性膠質(zhì)瘤有幾個(gè)基因的異常是常見的,但是在胃癌中,癌癥的相關(guān)基因突變的研究卻很少見。人類在這一研究領(lǐng)域中是很有發(fā)展空間的。這使得人類治療癌癥的手段也不斷得到發(fā)展。例如:乳腺癌的治療包括手術(shù)切除、放療、化療、內(nèi)分泌治療、分子靶向治療、免疫治療。這使得乳腺癌患者的存活率直線上升。
癌癥基因組圖譜(TCGA)項(xiàng)目代表了癌癥基因組學(xué)的一項(xiàng)重大進(jìn)展,旨在通過基因組分析技術(shù)的應(yīng)用來促進(jìn)對(duì)癌癥分子基礎(chǔ)的理解,并最終提高診斷、治療和預(yù)防癌癥的能力。TCGA項(xiàng)目已經(jīng)生成、分析并提供了代表30多種不同類型癌癥的11000多個(gè)個(gè)體的基因組序列、表達(dá)、甲基化和拷貝數(shù)變異數(shù)據(jù)。TCGA等項(xiàng)目的引入,以及下一代測(cè)序技術(shù)的廣泛使用,無(wú)疑將提高我們對(duì)癌癥相關(guān)基因及其臨床相關(guān)性的認(rèn)識(shí)和理解。并且隨著測(cè)序成本的較低,使用組學(xué)數(shù)據(jù)指在導(dǎo)臨床實(shí)踐中的地位大大提升。這為我們提供了全面和綜合分析的機(jī)會(huì),拓寬了我們對(duì)癌癥的理解。分析儲(chǔ)存在TCGA中的大量癌癥特異性數(shù)據(jù)需要特殊的生物信息學(xué)方法和技術(shù),以便能夠提取有生物學(xué)意義的信息。目前已經(jīng)開發(fā)了各種數(shù)據(jù)分析和可視化平臺(tái),以幫助快速分析TCGA數(shù)據(jù)。
腫瘤標(biāo)志物的獲取需要在多個(gè)水平上的分子改變,包括基因組學(xué)、表觀基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)。組學(xué)技術(shù)現(xiàn)在被用來理解復(fù)雜的生物系統(tǒng),并揭示復(fù)雜細(xì)胞表型背后的分子特征。隨著生物醫(yī)學(xué)技術(shù)的進(jìn)步,以及人類對(duì)科研技術(shù)的提高,我們已經(jīng)獲得了大規(guī)模的多組學(xué)數(shù)據(jù)集。組學(xué)技術(shù)的發(fā)展使我們對(duì)癌癥等多種疾病有了更深層次的了解。
基因組學(xué)是對(duì)生物體全基因組(WGS)的研究。自從DNA被人類發(fā)現(xiàn)并解釋清楚后,使當(dāng)時(shí)人們研究的重點(diǎn)從單個(gè)基因轉(zhuǎn)移到整個(gè)群體的基因組。在每一次細(xì)胞分裂中,基因組中的每個(gè)堿基都可能突變,這種概率很小,但不是零。這意味著在成千上萬(wàn)個(gè)細(xì)胞不停分裂的過程中會(huì)不斷的出現(xiàn)基因突變的現(xiàn)象。這些基因的突變解釋了癌癥的發(fā)生。因此癌癥的研究必不可少的要對(duì)基因進(jìn)行研究。經(jīng)研究發(fā)現(xiàn),癌癥表觀基因組與正常的表觀基因組相比有許多變化,例如癌基因Rras、S100P和黑色素瘤抗原家族A1(MAGEA1)啟動(dòng)子區(qū)域的低甲基化分別激活了它們?cè)谖赴?、胰腺癌和肝?xì)胞癌中的基因表達(dá)。
轉(zhuǎn)錄組學(xué)是細(xì)胞中核糖核酸(RNA)轉(zhuǎn)錄本的總體,由編碼RNA和非編碼RNA組成?,F(xiàn)在以RNA-seq為代表的測(cè)序技術(shù)幾乎可以獲得所有的轉(zhuǎn)錄組,RNA-Seq是目前研究基因表達(dá)和鑒定新RNA物種的首選方法,RNA-Seq直接揭示了序列同源性,這對(duì)于分析未知基因和新的轉(zhuǎn)錄物異構(gòu)體至關(guān)重要。近年來獲得的大量RNA-seq數(shù)據(jù)揭示了癌癥組織與正常對(duì)應(yīng)組織之間的差異基因表達(dá)模式,為揭示癌癥復(fù)雜的分子機(jī)制提供了強(qiáng)大的動(dòng)力。
蛋白質(zhì)組學(xué)是特定細(xì)胞、組織或生物樣本中處于精確發(fā)育或細(xì)胞階段的一整套蛋白質(zhì)。由于大多數(shù)生物過程是由蛋白質(zhì)控制的,因此精準(zhǔn)地測(cè)量細(xì)胞異常狀態(tài)中的蛋白質(zhì)組變化對(duì)于了解細(xì)胞工作方式是很有意義的,比如癌癥。正是因?yàn)榈鞍踪|(zhì)直接介導(dǎo)細(xì)胞功能,因此了解它們?cè)诩?xì)胞間的異質(zhì)性是至關(guān)重要的。蛋白質(zhì)組學(xué)是通過蛋白質(zhì)組學(xué)、結(jié)構(gòu)蛋白質(zhì)組學(xué)和蛋白質(zhì)-蛋白質(zhì)相互作用分析等方法來研究的。捕獲有關(guān)組蛋白修飾的信息將有助于研究細(xì)胞的表觀遺傳程序和預(yù)測(cè)可能的轉(zhuǎn)錄狀態(tài)。當(dāng)然,由于蛋白質(zhì)組的高度復(fù)雜性和動(dòng)態(tài)范圍,大規(guī)模的蛋白質(zhì)鑒定和定量是具有挑戰(zhàn)性的,導(dǎo)致癌癥的蛋白質(zhì)組學(xué)數(shù)據(jù)相對(duì)較少。
代謝組學(xué)是對(duì)細(xì)胞代謝產(chǎn)物的進(jìn)行定量分析,并尋找代謝物與生理病理變化的相對(duì)關(guān)系的研究方式。將代謝組學(xué)融入其他組學(xué)數(shù)據(jù)的研究能讓我們對(duì)癌癥的病理生理學(xué)提供更多的見解。不僅可以用來促進(jìn)我們對(duì)癌癥進(jìn)展的分子機(jī)制的理解,還可以用來預(yù)測(cè)癌癥患者的存活率。例如:Ren的研究中利用轉(zhuǎn)錄組學(xué)和代謝組學(xué)的分析方法來確定前列腺癌的潛在診斷和預(yù)后生物標(biāo)記物,發(fā)現(xiàn)某些代謝物,如S-腺苷高絲氨酸(SAH)、5-甲硫腺苷(MTA)和S-腺苷蛋氨酸(SAM)在前列腺癌中明顯增加。
在以往的研究中,往往使用單一組學(xué)的數(shù)據(jù)集來進(jìn)行臨床結(jié)果的預(yù)測(cè)。但是單一組學(xué)的研究往往具有局限性。比如使用單一組學(xué)的數(shù)據(jù)進(jìn)行疾病的研究時(shí),并不能分析出一些復(fù)雜疾病的病理機(jī)制。例如:一個(gè)細(xì)胞的轉(zhuǎn)錄組與另一個(gè)細(xì)胞的基因組序列的比較,可能會(huì)被細(xì)胞之間的體細(xì)胞遺傳變異以及細(xì)胞狀態(tài)和外部環(huán)境的變異所混淆。要知道,即使是在有絲分裂過程中剛剛分裂為二的子細(xì)胞都可能在基因組、轉(zhuǎn)錄組和蛋白質(zhì)組上表現(xiàn)出差異。而運(yùn)用多組學(xué)分析可以揭示不同生物因素之間的聯(lián)系,與單一組學(xué)分析相比,具有顯著的優(yōu)勢(shì),讓我們進(jìn)一步了解復(fù)雜疾病的病因和作用機(jī)制。目前單細(xì)胞的多組學(xué)技術(shù)已經(jīng)足夠成熟,這項(xiàng)技術(shù)能在同一細(xì)胞中獲取多組層信息,這些技術(shù)包括基因組學(xué)加轉(zhuǎn)錄組學(xué)、表觀基因組學(xué)加轉(zhuǎn)錄組學(xué)和轉(zhuǎn)錄組學(xué)結(jié)合靶向蛋白質(zhì)組學(xué)的技術(shù)。通過分析多個(gè)基因組層,可以獲得每個(gè)細(xì)胞更加完整的信息,這比研究任意單一組學(xué)甚至更完整的信息都要有意義,這更好地反映了負(fù)責(zé)細(xì)胞功能之間的相互作用。
當(dāng)然,多組學(xué)數(shù)據(jù)分析也是存在缺點(diǎn)的。比如:統(tǒng)計(jì)大量數(shù)據(jù)的時(shí)候,面對(duì)的數(shù)據(jù)集并不是統(tǒng)一整理好的,其中存在異構(gòu)數(shù)據(jù)類型、組學(xué)內(nèi)部和跨組學(xué)的丟失數(shù)據(jù)以及與可伸縮性相關(guān)的問題等。在多組學(xué)的研究中,由于在獲得數(shù)據(jù)時(shí)出現(xiàn)預(yù)算不足、樣本量不夠大等問題的出現(xiàn),數(shù)據(jù)的缺失是不可避免的。對(duì)于這個(gè)問題,已經(jīng)有許多研究人員提出了解決方案。多組學(xué)數(shù)據(jù)的整合已經(jīng)揭示了癌細(xì)胞系統(tǒng)的一些分子機(jī)制,但仍有許多問題仍未得到解答,我們需要結(jié)合更多的數(shù)據(jù),充分從多組學(xué)角度考慮問題,才能推動(dòng)對(duì)于疾病的研究,推動(dòng)醫(yī)學(xué)的發(fā)展。
總而言之,繼續(xù)研究癌癥的過程中,想要發(fā)現(xiàn)新的腫瘤標(biāo)記物乃至于治療措施,都需要多組學(xué)研究。多組學(xué)研究的方法可以在癌癥基因型和表型之間架起一座橋梁。最終,我們能通過多組學(xué)數(shù)據(jù)的分析,克服腫瘤對(duì)藥物免疫表型而提高腫瘤藥物的療效,使其容易受到靶向治療的影響。并改善患者的生活質(zhì)量。
參考文獻(xiàn):
[1] Bray F, Ferlay J, Soerjomataram I, et al. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2018,68(6):394-424.
[2] Mo H, Xu B. Progress in systemic therapy for triple-negative breast cancer[J]. Front Med, 2021,15(1):1-10.
[3] Greenhaw B N, Covington K R, Kurley S J, et al. Molecular risk prediction in cutaneous melanoma: A meta-analysis of the 31-gene expression profile prognostic test in 1,479 patients[J]. J Am Acad Dermatol, 2020,83(3):745-753.
[4] Altenbuchinger M, Weihs A, Quackenbush J, et al. Gaussian and Mixed Graphical Models as (multi-)omics data analysis tools[J]. Biochim Biophys Acta Gene Regul Mech, 2020,1863(6):194418.
[5] WATSON J D, CRICK F H. Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid[J]. Nature, 1953,171(4356):737-738.
[6] Wilson A S, Power B E, Molloy P L. DNA hypomethylation and human diseases[J]. Biochim Biophys Acta, 2007,1775(1):138-162.
[7] Li M, Sun Q, Wang X. Transcriptional landscape of human cancers[J]. Oncotarget, 2017,8(21):34534-34551.
[8] Chakraborty S, Hosen M I, Ahmed M, et al. Onco-Multi-OMICS Approach: A New Frontier in Cancer Research[J]. Biomed Res Int, 2018,2018:9836256.
[9] Ren S, Shao Y, Zhao X, et al. Integration of Metabolomics and Transcriptomics Reveals Major Metabolic Pathways? and Potential Biomarker Involved in Prostate Cancer[J]. Mol Cell Proteomics, 2016,15(1):154-163.
[10]??????? Yang T L, Shen H, Liu A, et al. A road map for understanding molecular and genetic determinants of osteoporosis[J]. Nat Rev Endocrinol, 2020,16(2):91-103.
作者簡(jiǎn)介:周立宇(1991-),男,漢族,湖南株洲,醫(yī)在讀碩士,住院醫(yī)師,神經(jīng)外科學(xué),腦腫瘤、高血壓腦出血、腦外傷,吉首大學(xué)醫(yī)學(xué)院。