陳罡 何融泉 馬劼 馮振博
【中圖分類號】R259 【文獻(xiàn)標(biāo)識碼】A 【文章編號】2095-3089(2018)11-0233-02
近年來,在精準(zhǔn)醫(yī)學(xué)推動下,深度測序技術(shù)不斷普及,測序成本不斷降低,海量的數(shù)據(jù)不斷涌入臨床醫(yī)學(xué)領(lǐng)域[1]。醫(yī)療大數(shù)據(jù)不斷沖擊傳統(tǒng)醫(yī)學(xué),也不斷更新和呼吁新的醫(yī)學(xué)教學(xué)、科研教學(xué)和臨床醫(yī)學(xué)行為模式,作為生物學(xué)分支的——計(jì)算生物學(xué)由此得以迅速發(fā)展,大數(shù)據(jù)挖掘分析已成為基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)發(fā)現(xiàn)問題的重要途徑,分子病理學(xué)是臨床醫(yī)學(xué)中采用高通量技術(shù)最頻繁的主力,因此,緊跟前沿技術(shù),培養(yǎng)能夠正確處理、充分解讀、全面應(yīng)用醫(yī)學(xué)大數(shù)據(jù)的臨床人才,將對我國新世紀(jì)醫(yī)療人才培養(yǎng)產(chǎn)生積極推動作用。本課題組前期通過結(jié)合臨床大數(shù)據(jù),初步嘗試探索分子病理科研教學(xué)新體系,旨在推動符合時代需求的新型教學(xué)模式。
1.從大數(shù)據(jù)本體論到分子病理科研教學(xué)的任務(wù)
古希臘哲學(xué)家畢達(dá)哥提出“數(shù)是萬物的始基”。早在1988年《科學(xué)》首先提出大數(shù)據(jù)概念, 2008年《自然》設(shè)立了??榻B大數(shù)據(jù),大數(shù)據(jù)正逐步發(fā)展和受到重視。人體本身就是一個數(shù)字化的整體,臨床診療的行為最大的特點(diǎn)是以人為對象,在精準(zhǔn)醫(yī)學(xué)的背景下,得益于深度測序技術(shù)的普及,臨床行為正日益產(chǎn)生大量數(shù)據(jù)。一方面,大數(shù)據(jù)產(chǎn)生不斷挑戰(zhàn)著傳統(tǒng)的臨床醫(yī)學(xué)模式,另一方面,大數(shù)據(jù)也正引導(dǎo)臨床研究邁向更加高層次的整體觀照。大數(shù)據(jù)使得人類活動進(jìn)入了一個新階段,在大數(shù)據(jù)基礎(chǔ)上,世界的一切關(guān)系均可用數(shù)據(jù)表征。具體到臨床醫(yī)學(xué),大數(shù)據(jù)本體論需要我們回答臨床數(shù)據(jù)本質(zhì)是什么?數(shù)據(jù)與疾病之間有何因果關(guān)系?大數(shù)據(jù)如何解釋疾病等問題?
傳統(tǒng)分子病理學(xué)作為臨床醫(yī)學(xué)診斷的前沿學(xué)科,也是臨床科研問題發(fā)現(xiàn)的最基本的途徑。在過去由于技術(shù)和檢測手段的限制,對疾病描述的數(shù)據(jù)結(jié)構(gòu)以疏松和零散為主要特點(diǎn)。大數(shù)據(jù)時代下,分子病理對疾病本身的描述進(jìn)入密集型高分辨率型的時代。這些由分子病理產(chǎn)生的臨床大數(shù)據(jù)正賦予分子病理科研更多的可能性,而如何解讀密集型數(shù)據(jù)的本質(zhì)?如何將大數(shù)據(jù)有機(jī)結(jié)合到疾病本身的科學(xué)問題上來?如何解釋疾病數(shù)據(jù)的差異?這便是大數(shù)據(jù)對分子病理科研教學(xué)提出的時代新要求。
2.從大數(shù)據(jù)思維模式到分子病理科研教學(xué)的模式
傳統(tǒng)分子病理技術(shù),如顯色原位雜交、熒光原位雜交、聚合酶鏈反應(yīng)等,在精度上給予分子病理科研極大的便利。隨著基因芯片、基因測序等技術(shù)普及,使得數(shù)據(jù)在精度和廣度上都有了新的突破。大數(shù)據(jù)不僅是對一種臨床科學(xué)問題研究和認(rèn)識的存在形式,也是臨床科學(xué)研究的一種方法和途徑,這種新的認(rèn)識論范式與傳統(tǒng)分子病理科研推斷邏輯式表現(xiàn)形式不同,它是一種數(shù)據(jù)模型的思維模式,這種思維模式基本的目標(biāo)有兩個——描述和預(yù)測:通過描述刻畫大數(shù)據(jù)的潛在模式,通過利用這些數(shù)據(jù)潛在模式,進(jìn)行科研問題的預(yù)測,從而發(fā)現(xiàn)數(shù)據(jù)中有具有臨床價值的模型和規(guī)律。
具體說來,從方法論層面看,大數(shù)據(jù)思維模式對傳統(tǒng)的機(jī)械還原論進(jìn)行了深入批判,提出了多樣與整體、關(guān)聯(lián)與動態(tài)分析的大數(shù)據(jù)思維,這些新思維具有復(fù)雜性思維特征。分子病理的大數(shù)據(jù)實(shí)現(xiàn)了還原論與整體論的融貫,首先承認(rèn)疾病和科學(xué)問題本質(zhì)是復(fù)雜的多樣性,強(qiáng)調(diào)了疾病表征和基因型的關(guān)聯(lián)性,認(rèn)為存在比因果關(guān)系更加重要。通過對疾病和具體科學(xué)問題的數(shù)據(jù)化,實(shí)現(xiàn)了定性定量的綜合集成;因此如何實(shí)現(xiàn)描述和預(yù)測的功能,成為分子病理科研教學(xué)的大挑戰(zhàn)。
2.1大數(shù)據(jù)重新認(rèn)識疾病的復(fù)雜性
分子病理產(chǎn)生的臨床大數(shù)據(jù)是指導(dǎo)臨床精準(zhǔn)醫(yī)療和開展前沿醫(yī)學(xué)研究的前提,指導(dǎo)學(xué)生正確認(rèn)識大數(shù)據(jù)便是首要的問題。本課題組緊跟大數(shù)據(jù)趨勢,在2013年起在傳統(tǒng)分子病理教學(xué)中引入大數(shù)據(jù)教學(xué)模式,幫助學(xué)生理解疾病和尋找科研問題。
大數(shù)據(jù)之大,在于深度和廣度。以肺癌為例,肺癌驅(qū)動基因的研究一直是攻克肺癌的關(guān)鍵所在,目前越來越熱的表觀遺傳學(xué)的研究揭示了非小細(xì)胞肺癌發(fā)生發(fā)展更多的可能性。在肺癌分子病理科研教學(xué)上,我們首先以傳統(tǒng)分子病理科研教學(xué)為切入點(diǎn),帶領(lǐng)學(xué)生了解具體有特色的肺癌特點(diǎn),比如臨床上對非小細(xì)胞肺癌常規(guī)檢測的EGFR、ALK等基因的情況。眾所周知,腫瘤是異質(zhì)性極大的疾病,為了讓學(xué)生更加深入的了解腫瘤的復(fù)雜性,我們引入大數(shù)據(jù),我們從傳統(tǒng)教學(xué)幾十例的患者,過渡到TCGA公共數(shù)據(jù)庫及GEO,CaArray, ArrayExpress數(shù)據(jù)庫等上千例非小細(xì)胞肺癌患者中來[2],從廣度上讓學(xué)生對非小細(xì)胞肺癌的特點(diǎn)有了全面的了解。從傳統(tǒng)教學(xué)的有限的研究成熟的基因數(shù),到大宗病例分析產(chǎn)生的海量差異表達(dá)的基因數(shù)及其它分子事件,使得分子病理教學(xué)從已知向未知過渡,從傳統(tǒng)認(rèn)知型教學(xué)向科研型教學(xué)過渡。
分子病理科研教學(xué)中,善于利用大數(shù)據(jù)可以更加高分辨率的展示疾病與臨床表型之間的聯(lián)系。以非小細(xì)胞肺癌為例,個人史、吸煙史對非小細(xì)胞肺癌的發(fā)生和發(fā)展至關(guān)重要,EGFR不同突變型的患者臨床治療策略和生存預(yù)后也都不一樣。我們整合分析了患者基本臨床參數(shù),包括性別、年齡、吸煙史、治療史、病理類型等,我們還分析了非小細(xì)胞肺癌中可能存在的轉(zhuǎn)錄調(diào)控和表觀遺傳學(xué)機(jī)制,包括甲基化信息、miRNA表達(dá)譜,lncRNA表達(dá)譜,CNV,可變剪切等。區(qū)別于傳統(tǒng)分子病理科研教學(xué),通過上述嘗試,我們將分子病理科研教學(xué)引導(dǎo)至一個信息更加全面,事件更加精確,機(jī)制更加復(fù)雜的高分辨率科研教學(xué)模式中,這樣的模式使得對疾病的了解更加全面,賦予研究對象更多的可能性,碰撞出更多的火花。
2.2循證法評價大數(shù)據(jù)的可靠性
大數(shù)據(jù)帶來分子病理科研教學(xué)的思維模式的變革,其優(yōu)勢是改變了傳統(tǒng)分子病理尋找科學(xué)問題的模式。在以往,現(xiàn)象知識驅(qū)動徑路下,尋找具體科學(xué)問題需要看到具體現(xiàn)象,有已知知識支撐作為前提。而如今,大數(shù)據(jù)驅(qū)動徑路下,科學(xué)假說都可以先從公共數(shù)據(jù)進(jìn)行驗(yàn)證。大數(shù)據(jù)在深度給了我們?nèi)娴男畔?,我們能夠通過加大疾病樣本來力求接近事實(shí)真相。盡管如此,由于高通量測序本身技術(shù)的限制,隨機(jī)抽樣誤差是客觀存在的,導(dǎo)致很有可能假陽性的信息被我們選取。因此,本課題組在分子病理科研教學(xué)過程中將循證醫(yī)學(xué)的理念整合到大數(shù)據(jù)應(yīng)用中,審慎的評價用于臨床研究和基礎(chǔ)研究中大數(shù)據(jù)的可靠性。
高通量提供給我們海量的數(shù)據(jù)是受人為因素的影響,離不開敏感度和特異度問題。在分子病理科研教學(xué)中,我們從多渠道獲取數(shù)據(jù)來評價大數(shù)據(jù)的可靠性:以原發(fā)性肝細(xì)胞癌為例,我們對TCGA的數(shù)據(jù)進(jìn)行整合分析獲得原發(fā)性肝細(xì)胞癌差異表達(dá)微小RNA后,我們從GEO,CaArray, ArrayExpress等多個芯片及測序數(shù)據(jù)庫獲取數(shù)據(jù),對TCGA的數(shù)據(jù)進(jìn)行初步驗(yàn)證;同時,我們也進(jìn)行相應(yīng)的臨床檢測,體內(nèi)體外實(shí)驗(yàn)來驗(yàn)證TCGA數(shù)據(jù)的可靠性,從而獲取全面的信息,同時保證信息的高敏感度高和準(zhǔn)確性、特異性[3]。
2.3 學(xué)科交叉,更高分辨率解讀大數(shù)據(jù)
疾病臨床表征和基因型的聯(lián)系,是數(shù)據(jù)科研價值的體現(xiàn)。而具體的科研問題能夠解決臨床問題,則需要余多學(xué)科互補(bǔ)交叉。從大方向上來看是基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)的優(yōu)勢互補(bǔ),在方法學(xué)上,大數(shù)據(jù)的分析更加依賴于多學(xué)科。例如,在我們非小細(xì)胞肺癌的病理科研教學(xué)中,我們有機(jī)融合了生物信息學(xué)、分子生物學(xué)、臨床腫瘤學(xué)的內(nèi)容。生物信息學(xué)將大數(shù)據(jù)可視化展示,使得具體描述和預(yù)測更加直觀;通過分子生物學(xué)理論分析和實(shí)驗(yàn)驗(yàn)證,使得大數(shù)據(jù)預(yù)測更為精準(zhǔn);而通過結(jié)合臨床腫瘤學(xué),使得分析所得的數(shù)據(jù)更加富有臨床應(yīng)用價值。使得學(xué)生在了解疾病普遍的規(guī)律和現(xiàn)象的同時,看到了每個案例的獨(dú)特之處,進(jìn)而發(fā)現(xiàn)和理解科研問題和臨床治療問題,理解分子病理學(xué)數(shù)據(jù)的潛在價值。
綜上,高通量技術(shù)正改變?nèi)藗冊谡J(rèn)識自身和疾病的方式,大數(shù)據(jù)使得人們能夠更加的深入和精確理解自身,科學(xué)有效的利用大數(shù)據(jù)來解碼臨床具體問題,指導(dǎo)科學(xué)研究更好的更精確的服務(wù)臨床問題,也設(shè)計(jì)新興的生物信息學(xué)、計(jì)算生物學(xué)的內(nèi)容,這些將是分子病理科研教學(xué)面臨的新任務(wù)和挑戰(zhàn)。
參考文獻(xiàn):
[1]Chin-Yee B, Upshur R. Clinical judgement in the era of big data and predictive analytics. J Eval Clin Pract. 2017. [Epub ahead of print].
[2]Cohen AL, Piccolo SR, Cheng L, et al. Genomic pathway analysis reveals that EZH2 and HDAC4 represent mutually exclusive epigenetic pathways across human cancers. BMC Med Genomics. 2013,6:35.
[3]Liang HW, Yang X, Wen DY, et al. Utility of miR?鄄133a?鄄3p as a diagnostic indicator for hepatocellular carcinoma: An investigation combined with GEO, TCGA, meta?鄄analysis and bioinformatics. Mol Med Rep. 2018,17(1):1469-1484.