喬若靜/編譯
大數(shù)據(jù)與癌癥研究
喬若靜/編譯
抗癌之戰(zhàn)中的大數(shù)據(jù)開發(fā)利用還處于初始階段,但這一前沿陣地正在不斷向前推進(jìn)。
北卡羅萊納大學(xué)的諾曼·沙普利斯(Norman Sharpless)正在利用沃森計(jì)算機(jī)系統(tǒng)分析DNA數(shù)據(jù)
癌細(xì)胞突變分類基因組圖譜目錄包含有大約250萬字節(jié)數(shù)據(jù),這一由美國國立衛(wèi)生研究院(NIH)開展的一個(gè)龐大的研究項(xiàng)目,極大地提高了我們對(duì)各種形式癌癥的理解。但對(duì)于提供樣本患者的臨床治療經(jīng)驗(yàn),我們了解的還相對(duì)太少。
在癌癥治療鏈的另一端,電子健康檔案中包含有豐富的個(gè)案信息,如充分加以利用,可極大地提高癌癥治療的水平。但實(shí)際情況是,這類病史記錄往往都被封存在各個(gè)醫(yī)院和醫(yī)療診所內(nèi)。結(jié)果就是,“研究人員與大多數(shù)病史都失之交臂。”紀(jì)念斯隆-凱特琳癌癥中心專攻乳腺癌的腫瘤學(xué)家克利福德·胡迪斯(Clifford Hudis)說道。
為提高癌癥治療水平,胡迪斯和其他許多研究人員合作,正在努力開發(fā)如何來利用醫(yī)療科研、病人護(hù)理和臨床試驗(yàn)中產(chǎn)生的大量數(shù)據(jù)的方法。大數(shù)據(jù)催生的許多機(jī)會(huì),已擴(kuò)展到醫(yī)學(xué)界的大多數(shù)領(lǐng)域中,而“癌癥研究更是走在了最前列。”美國馬里蘭州一家醫(yī)療保健咨詢機(jī)構(gòu)的醫(yī)療顧問林恩·伊瑟雷吉(Lynn Etheredge)說道。但是,多樣化的致命癌癥意味著,雖然研究取得了很大進(jìn)展,但障礙依然多多。
伊瑟雷吉在2007年寫的一篇很有影響力的文章中提出了大數(shù)據(jù)處理的“快速學(xué)習(xí)系統(tǒng)”,他認(rèn)為,我們已進(jìn)入了一個(gè)新的癌癥研究和治療的歷史時(shí)期。“我們知道,癌癥是一種與基因相關(guān)的疾病,而我們擁有對(duì)癌癥進(jìn)行分析的數(shù)據(jù)基礎(chǔ)和計(jì)算能力?!彼f。
懷著對(duì)盡早成功開發(fā)個(gè)性化癌癥藥物的希望,腫瘤學(xué)家和計(jì)算機(jī)專家正在共同努力,充分利用數(shù)字化信息,并將其運(yùn)用到臨床診療實(shí)踐中。然而,面對(duì)這樣的一項(xiàng)新興事業(yè),他們需要克服隱私、數(shù)據(jù)所有權(quán)以及可持續(xù)商業(yè)模式等方面的困難和障礙。“大數(shù)據(jù)既是一種研究工具,也是一種專營商品?!币辽准f道,“這一領(lǐng)域仍處于早期發(fā)展中,我們需要解決的問題還有很多?!?/p>
在美國,許多機(jī)構(gòu)組織通過將大數(shù)據(jù)運(yùn)用到癌癥臨床實(shí)踐中,使其在癌癥治療的一些方面走在了世界前列。這其中有四個(gè)決定性的因素:快速成長(zhǎng)的新興公司;專業(yè)的項(xiàng)目計(jì)劃;強(qiáng)大的計(jì)算機(jī)能力;以及一個(gè)以癌癥研究為中心的學(xué)術(shù)網(wǎng)絡(luò)。
2009年,馬薩諸塞州劍橋博德研究所的科學(xué)家們創(chuàng)辦了一家基礎(chǔ)醫(yī)學(xué)公司,專門從事對(duì)腫瘤學(xué)家提交的病人組織樣本進(jìn)行基因測(cè)序和分析,然后與公司龐大的數(shù)據(jù)庫以及其他公共數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行對(duì)照,從中篩選辨認(rèn)致癌基因?;A(chǔ)醫(yī)學(xué)公司數(shù)據(jù)庫中的數(shù)據(jù)來自50 000以上癌癥患者的資料。
“公共數(shù)據(jù)庫與谷歌不同,腫瘤學(xué)家沒法通過簡(jiǎn)單的途徑搜索與自己病人所患腫瘤相關(guān)的致癌基因?!被A(chǔ)醫(yī)學(xué)公司首席執(zhí)行官邁克爾·帕利尼(Michael Pellini)說道,“我們對(duì)組織樣本進(jìn)行分析,然后將分析結(jié)果反饋回治療實(shí)踐,或以美國食品藥品管理局(FDA)批準(zhǔn)藥物的形式反饋,或是以臨床實(shí)驗(yàn)的形式反饋?!?/p>
對(duì)于一些疑難病癥,腫瘤學(xué)家也可以在基礎(chǔ)醫(yī)學(xué)公司的客戶網(wǎng)絡(luò)端咨詢,以期獲得可能的建議。帕利尼說道,網(wǎng)站會(huì)在72小時(shí)內(nèi)作出回應(yīng),將一些數(shù)據(jù)綜合匯總發(fā)送給醫(yī)生,咨詢者可以從中權(quán)衡,哪一種特定藥物或治療方法有可能會(huì)是有效的。公司的宗旨是盡可能地將客戶數(shù)據(jù)運(yùn)用于更廣泛的臨床實(shí)踐和醫(yī)學(xué)決策中。
2015年1月,瑞士制藥業(yè)巨頭羅氏公司以10億美元的價(jià)格,收購了基礎(chǔ)醫(yī)學(xué)56%的股權(quán),以推動(dòng)個(gè)性化癌癥診療和相關(guān)藥物開發(fā)。
2015年底,美國臨床腫瘤學(xué)會(huì)(ASCO)預(yù)計(jì)將推出CancerLinQ平臺(tái),這個(gè)平臺(tái)旨在通過對(duì)成千上萬腫瘤治療案例中獲得的電子健康檔案進(jìn)行分析綜合,為醫(yī)生們提供更多臨床實(shí)踐經(jīng)驗(yàn)——腫瘤學(xué)家通過訪問CancerLinQ平臺(tái),從中可以了解特殊案例的治療效果,然后對(duì)照己有的治療方法,為進(jìn)一步開發(fā)新的治療方案開拓思路。
“我們所知道的癌癥治療案例來自于登記注冊(cè)的臨床試驗(yàn),而這些案例只占癌癥確診患者的3%。”在CancerLinQ平臺(tái)理事會(huì)任職的胡迪斯說道,“有了CancerLinQ平臺(tái),我們可以從97%以上未直接參與研究項(xiàng)目的腫瘤學(xué)家那里獲得更多的經(jīng)驗(yàn)?!?/p>
迄今,已有15個(gè)規(guī)模不等的小組開始了這方面的實(shí)踐,預(yù)計(jì)到2016年ASCO將擁有50萬份癌癥患者的醫(yī)療檔案。研究者和臨床醫(yī)生能夠通過查詢這些病史記錄將其與患者的治療效果進(jìn)行比較。如此龐大數(shù)量的數(shù)據(jù),可有助于明確某種特定藥物或治療方案的有效程度。
“CancerLinQ所做的最重要的事情是報(bào)告治療結(jié)果,例如,接受了某種特定治療方案的患者生存期更長(zhǎng),或病情發(fā)展得到緩解等?!盇SCO質(zhì)量研究所醫(yī)療主任、腫瘤學(xué)家羅伯特·米勒(Robert Miller)說道。
2013年,在一項(xiàng)針對(duì)17萬乳腺癌患者進(jìn)行的研究中,通過了CancerLinQ平臺(tái)的一個(gè)原型測(cè)試。據(jù)米勒稱,未發(fā)表的一些數(shù)據(jù)表明,該系統(tǒng)可以突顯不同醫(yī)療實(shí)踐提交數(shù)據(jù)的特點(diǎn)和效果。例如,他們是如何通過刺激產(chǎn)生更多紅細(xì)胞來治療化療后貧血的。
CancerLinQ平臺(tái)從電子健康記錄中提取病人數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行匿名化處理,然后將它們與其他類型的數(shù)據(jù)信息,包括醫(yī)生的筆記和生物標(biāo)記等整合在一起。其目的是當(dāng)醫(yī)生在對(duì)病人進(jìn)行診斷和治療過程中有疑問而難以決斷時(shí),這些數(shù)據(jù)將能夠支持他們及時(shí)做出決策。
CancerLinQ平臺(tái)的運(yùn)行目前還是依靠捐贈(zèng),但米勒說道,隨著時(shí)間的推移,這個(gè)平臺(tái)將通過出售有效性報(bào)告和數(shù)據(jù)研究工具而獲得更獨(dú)立的生存能力?!拔覀冋诳紤]與CancerLinQ平臺(tái)合作開發(fā)相關(guān)的一系列產(chǎn)品和服務(wù),以幫助降低系統(tǒng)的運(yùn)營成本?!泵桌照f道。
大數(shù)據(jù)需要龐大的計(jì)算能力,2013年IBM成立了一個(gè)獨(dú)立的業(yè)務(wù)單元:“沃森健康部門”(Watson Health unit),為結(jié)合了自然語言和學(xué)習(xí)能力的沃森認(rèn)知計(jì)算機(jī)系統(tǒng)提供更多的商業(yè)機(jī)會(huì)。沃森儲(chǔ)存的生物醫(yī)學(xué)知識(shí)包括:公共醫(yī)學(xué)(PubMed)數(shù)據(jù)庫中的所有摘要、美國國家癌癥研究所(NDI)的藥典(批準(zhǔn)藥物和臨床試驗(yàn)數(shù)據(jù))、癌癥體細(xì)胞突變的完整目錄數(shù)據(jù)庫以及其他多種來源的數(shù)據(jù)。
沃森認(rèn)知計(jì)算機(jī)系統(tǒng)于2011年在美國電視智力競(jìng)賽節(jié)目Jeopardy中以擊敗人類冠軍而出名。IBM沃森健康部門與十多個(gè)醫(yī)療機(jī)構(gòu)、癌癥中心和研究機(jī)構(gòu)都建立了合作關(guān)系,IBM研究在紐約的計(jì)算生物學(xué)中心主任艾杰·羅伊魯(Ajay Royyuru)說道。
例如,紐約基因組中心需要借助沃森計(jì)算機(jī)系統(tǒng)對(duì)膠質(zhì)母細(xì)胞瘤患者的DNA突變進(jìn)行篩選。膠質(zhì)母細(xì)胞癌是一種會(huì)致命的腦癌。
紀(jì)念斯隆-凱特琳中心和得克薩斯州休斯頓MD安德森癌癥中心的醫(yī)生們,正在升級(jí)沃森系統(tǒng)成為一種臨床支持工具,一種能夠在電腦上展示匿名假設(shè)病例的程序。例如,一位患者的腫瘤細(xì)胞測(cè)試中,發(fā)現(xiàn)其STK11的基因缺陷呈陽性,可用糖尿病藥物二甲雙胍醫(yī)治,羅伊魯解釋道。但沃森可能不會(huì)推薦二甲雙胍,因?yàn)檫@是一個(gè)標(biāo)示外的藥物?!巴ㄟ^這個(gè)實(shí)例我們知道,需要教會(huì)沃森更多的東西,將網(wǎng)撒得更大?!绷_伊魯說道。
安德魯·塞德曼(Andrew Seidman)是紀(jì)念斯隆-凱特琳中心的乳腺癌專家,他補(bǔ)充book=42,ebook=43