■文/王偉業(yè)
王偉業(yè),上海交通大學(xué)醫(yī)學(xué)院附屬新華醫(yī)院生物樣本庫主任,教授和博士生導(dǎo)師,上海市和教育部環(huán)境與兒童健康重點(diǎn)實(shí)驗(yàn)室執(zhí)行主任,生物樣本庫建設(shè)信息化管理與應(yīng)用專家。
精準(zhǔn)醫(yī)學(xué)依賴精準(zhǔn)的數(shù)據(jù)。精準(zhǔn)醫(yī)學(xué)概念源于美國前總統(tǒng)奧巴馬2015年國情咨文中的精準(zhǔn)醫(yī)學(xué)計(jì)劃(Precision Medicine Initiative)。該計(jì)劃核心是通過分析個(gè)體的基因信息,加快從基因組層面對疾病的認(rèn)識。個(gè)性化的健康信息結(jié)合技術(shù)、知識和治療方法,能夠促進(jìn)臨床上準(zhǔn)確地了解病因,實(shí)現(xiàn)精準(zhǔn)的個(gè)性化用藥??傮w而言,精準(zhǔn)醫(yī)學(xué)包括對疾病風(fēng)險(xiǎn)的評估和預(yù)測、預(yù)防或干預(yù),改善臨床診療和分析預(yù)后,基于疾病相關(guān)信息,以個(gè)性化方式解決人類面臨的醫(yī)療健康問題。
疾病相關(guān)信息來源于臨床信息,以及采用多種研究方法和技術(shù)手段從相應(yīng)的生物樣本中獲得的信息。因此,臨床信息、生物樣本庫和研究結(jié)果構(gòu)成了精準(zhǔn)醫(yī)學(xué)發(fā)展所需要的三大信息資源。針對疾病提出的科學(xué)問題決定了如何設(shè)計(jì)、運(yùn)行與管理生物樣本庫;基于科學(xué)問題獲取臨床信息并以后者為篩選和過濾方式,將大量生物樣本歸類并決定其適用性和應(yīng)用價(jià)值。生物樣本庫的終極目標(biāo)是將生物樣本資源轉(zhuǎn)變?yōu)閿?shù)據(jù)信息資源,這個(gè)轉(zhuǎn)變過程就是運(yùn)用多種臨床研究方法,結(jié)合各種生物醫(yī)學(xué)技術(shù)手段發(fā)現(xiàn)能夠標(biāo)記疾病發(fā)生、發(fā)展與轉(zhuǎn)歸過程的生物標(biāo)志物(Biomarker),從而達(dá)到精準(zhǔn)診斷與治療疾病的目的。
總之,精準(zhǔn)醫(yī)學(xué)的精髓是精準(zhǔn)預(yù)防、干預(yù)、診斷和治療,其關(guān)鍵是發(fā)現(xiàn)疾病在不同個(gè)體間的微小差別,而這些差別只能依賴于參考和分析大量有效信息。精準(zhǔn)醫(yī)學(xué)的基本要素包括:正確獲取大量生物樣本和相關(guān)信息,認(rèn)識和了解生物樣本特性,以及將這些資源轉(zhuǎn)變?yōu)檫m用于臨床醫(yī)療的信息資源。因此,生物樣本庫是臨床研究資源,而臨床研究結(jié)果是精準(zhǔn)醫(yī)學(xué)能源。
建設(shè)和發(fā)展生物樣本庫面臨很多問題,但這些問題歸根到底是科學(xué)問題而非技術(shù)問題,主要體現(xiàn)于以下6個(gè)方面:
●我們對生物樣本缺乏了解和認(rèn)識,尤其缺乏先期設(shè)計(jì),信息質(zhì)量差和不完善,與生物樣本銜接程度低,阻礙了生物樣本的應(yīng)用;
●生物樣本庫資源之間協(xié)同性低,尤其在信息的定義、收集內(nèi)容、收集方式和表達(dá)方式方面存在很大差異,導(dǎo)致信息異質(zhì)性高;
●信息異質(zhì)性問題導(dǎo)致多源信息資源不相容,無法整合應(yīng)用;
●資源整合困難導(dǎo)致信息量的問題突出,降低了生物樣本的應(yīng)用價(jià)值;
●由于資源無法有效整合,缺乏足夠的生物樣本量,導(dǎo)致共享性受限;
●以上因素導(dǎo)致數(shù)據(jù)標(biāo)準(zhǔn)化(Data Standard)面臨困難,所以生物樣本庫的信息量和信息質(zhì)量決定了生物樣本在精準(zhǔn)醫(yī)學(xué)發(fā)展中舉足輕重的作用。
臨床研究面臨的問題是缺乏足夠大的生物樣本量,不足以真正了解基因組學(xué)與疾病相關(guān)性。自2009年興起建設(shè)的生物樣本庫,其初衷是整合與共享資源,從而為多元化合作研究提供資源,旨在以整體觀方式了解疾病起源、發(fā)生、發(fā)展與轉(zhuǎn)歸。整合生物樣本資源首先要整合其相關(guān)信息,后者有賴于信息資源之間是否相容。解決信息相容性的前提是統(tǒng)一信息定義、信息內(nèi)容、收集方法和表達(dá)方式。因此,生物樣本庫不僅僅是解決量的問題,更重要的是獲得能夠回答臨床科學(xué)問題的“足夠大的量”,決定性因素包括建立能幫助我們充分了解和認(rèn)識生物樣本特性的方法,和將適用性高的生物樣本整合應(yīng)用的方式。
認(rèn)識與了解生物樣本取決于4個(gè)方面:(1)用正確方式構(gòu)建和運(yùn)作生物樣本庫;(2)保障臨床信息完整性;(3)保障臨床信息可靠性;(4)以正確方式將相關(guān)信息標(biāo)注于生物樣本以表達(dá)其特性。總之,關(guān)鍵在于設(shè)計(jì)和規(guī)劃生物樣本庫時(shí)要明確生物樣本應(yīng)用的科學(xué)性,即能夠有針對性地回答相應(yīng)的科學(xué)問題;選擇實(shí)際運(yùn)作的可行性,能夠與其他資源相整合,做到綜合性設(shè)計(jì)才能持續(xù)發(fā)展生物樣本庫。
導(dǎo)致生物樣本應(yīng)用性低的原因之一是我們對生物樣本認(rèn)識不足。首先,我們?nèi)狈ψ銐虻呐R床信息來充分表達(dá)生物樣本特性,即使有了基因信息,不結(jié)合臨床信息同樣導(dǎo)致生物樣本適用性低。其次,我們?nèi)狈?biāo)注臨床信息的有效方法,這方面工作在我國生物樣本庫建設(shè)中尤其欠缺。但是,僅從標(biāo)注方法考慮也不能夠解決上述問題,我們還需要系統(tǒng)性的整體規(guī)劃:生物樣本庫建設(shè)應(yīng)以設(shè)計(jì)為先,聚焦研究應(yīng)用方向,確定資源應(yīng)用范圍。既要滿足資源應(yīng)用的科學(xué)性,也要保證運(yùn)作的可行性,合理平衡二者關(guān)系才能保障資源的持續(xù)性積累并達(dá)到足夠大的量。
生物樣本的生物特性是指其臨床表型。2016年發(fā)布的國家“精準(zhǔn)醫(yī)學(xué)研究”重點(diǎn)專項(xiàng)指南指出:除專門的數(shù)據(jù)、樣本管理場地和專職工作人員隊(duì)伍之外,還應(yīng)具備專業(yè)的臨床表型研究隊(duì)伍。臨床醫(yī)療流程中獲取的臨床信息無法滿足臨床研究需要,所以臨床診療數(shù)據(jù)庫不等同于臨床研究需要的數(shù)據(jù)庫。問卷和隨訪方式收集的相關(guān)信息是補(bǔ)充建立臨床研究數(shù)據(jù)最有效的方法,完善高質(zhì)量的臨床信息是構(gòu)建臨床資源促進(jìn)精準(zhǔn)醫(yī)學(xué)的根本保障。我們已經(jīng)非常重視生物樣本質(zhì)量,但對信息質(zhì)量的重視程度還不夠。沒有信息質(zhì)量,生物樣本質(zhì)量也就失去意義。信息質(zhì)量是生物樣本庫質(zhì)量的重要組成部分,我們可以這樣認(rèn)為:信息質(zhì)量好了,其他的就不重要了;如果信息質(zhì)量不好,其他也不重要了。信息質(zhì)量對資源價(jià)值和應(yīng)用的重要性可見一斑。
生物樣本庫需要適應(yīng)新的發(fā)展要求。智能化生物樣本庫(Intelligent Biobank) 是近年來生物樣本庫國際發(fā)展趨勢之一,也是生物樣本庫建設(shè)的終極目標(biāo)。智能化發(fā)展主要體現(xiàn)在以下幾方面:
●由以生物樣本為中心發(fā)展為以人(健康者或患者)為中心,也就是生物樣本庫核心內(nèi)容是圍繞著與個(gè)人相關(guān)的資源;
●由以生物樣本資源為中心發(fā)展為以數(shù)據(jù)信息為中心,也就是重點(diǎn)由生物資源轉(zhuǎn)化為信息資源;
●了解生物個(gè)體變得更加重要,已經(jīng)從單方面走向全方位地認(rèn)識生物個(gè)體(健康者或患者);
●信息資源從單個(gè)數(shù)據(jù)庫走向通過網(wǎng)絡(luò)整合多來源數(shù)據(jù),并從整體觀分析和應(yīng)用信息。
總之,這些趨勢轉(zhuǎn)變都是為了獲取系統(tǒng)性和精準(zhǔn)的信息。
智能化生物樣本庫是利用智能化操作和管理,在保障生物樣本質(zhì)量和信息質(zhì)量的前提下,將生物樣本的生物特性,通過研究手段發(fā)現(xiàn)的生物標(biāo)志物和相關(guān)臨床信息進(jìn)行有機(jī)的結(jié)合與分析,加強(qiáng)整合分析能力,促進(jìn)醫(yī)學(xué)和臨床研究的決策力。樣本庫智能化發(fā)展能夠?yàn)榫珳?zhǔn)醫(yī)學(xué)發(fā)展提供精準(zhǔn)數(shù)據(jù),包括數(shù)據(jù)采集、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)可分析性的智能化,研究和發(fā)現(xiàn)信息規(guī)律性、建立信息應(yīng)用方式和利用信息整合與指導(dǎo)研究決策的智能化。
總之,生物樣本庫智能化發(fā)展就是充分利用生物樣本庫積累的多方面信息,將不同來源但密切相關(guān)的信息進(jìn)行有機(jī)整合與利用,挖掘其規(guī)律性特征,改善生物樣本庫的運(yùn)作與管理,發(fā)揮其最大應(yīng)用價(jià)值并最終影響科研決策力。生物樣本庫智能化發(fā)展方向可概括為幾個(gè)關(guān)鍵發(fā)展步驟:管理智能化、相關(guān)信息整合、虛擬化、可視化,以及資源應(yīng)用價(jià)值化。
生物樣本的合理應(yīng)用可以促進(jìn)臨床信息的有效應(yīng)用,從而改變臨床研究決策力;而生物標(biāo)志物研究與應(yīng)用將改變臨床診療決策力,包括患者處理、治療指南和醫(yī)療政策。重構(gòu)生物樣本建設(shè)方式與方法和重構(gòu)生物樣本庫相關(guān)臨床信息在精準(zhǔn)醫(yī)學(xué)中發(fā)揮關(guān)鍵性作用。