孔偉名,呂文文,姜嘉媛,馮鐵男,俞章盛,
1上海交通大學(xué)轉(zhuǎn)化醫(yī)學(xué)研究院,上海 200240 2上海交通大學(xué)醫(yī)學(xué)院臨床研究中心,上海 200025
隨著居民生活水平的不斷提高和飲食習(xí)慣的日益西方化,近年來(lái)我國(guó)結(jié)直腸癌的發(fā)病率明顯升高,已躍居惡性腫瘤第5位[1],大城市的增幅更快,目前結(jié)直腸癌是上海市發(fā)病和死亡數(shù)量均居第2位的惡性腫瘤[2]。雖然研究人員已在結(jié)直腸癌復(fù)發(fā)、轉(zhuǎn)移機(jī)制方面進(jìn)行了大量探索,但仍缺乏單細(xì)胞水平和不同時(shí)空橫斷面的多尺度、多層次認(rèn)識(shí),因此有必要全面系統(tǒng)地揭示結(jié)直腸癌轉(zhuǎn)移、耐藥、復(fù)發(fā)等演變過(guò)程中基因、表觀、轉(zhuǎn)錄、蛋白、代謝等時(shí)空變化規(guī)律的全部信息(腫瘤命運(yùn)全息圖譜),精準(zhǔn)闡明腫瘤命運(yùn)的決定基礎(chǔ)[3-4]。
結(jié)直腸腫瘤命運(yùn)全息圖譜的繪制依賴于標(biāo)準(zhǔn)化收集、處理、貯存,應(yīng)用健康與疾病生物體的生物大分子、細(xì)胞和組織等生物樣本,以及對(duì)生物樣本建立標(biāo)準(zhǔn)化操作規(guī)范、信息管理和應(yīng)用系統(tǒng)的生物樣本庫(kù)。而多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)可將第一線的臨床信息與生物樣本時(shí)空狀態(tài)信息、分子信息等資料相結(jié)合,為提高生物醫(yī)學(xué)研究質(zhì)量、探索更安全有效的醫(yī)療方法提供寶貴的全方位生物醫(yī)學(xué)信息[5]。
目前,國(guó)際上運(yùn)行良好的生物樣本庫(kù),根據(jù)其運(yùn)營(yíng)主體性質(zhì)可分為三類(lèi):(1)以政府機(jī)構(gòu)牽頭組織和運(yùn)營(yíng)為主導(dǎo)的樣本庫(kù),包括英國(guó)生物樣本庫(kù)、韓國(guó)國(guó)家研究資源中心、新加坡組織網(wǎng)絡(luò)和泛歐洲生物樣本庫(kù)與生物樣本資源研究平臺(tái)等;(2)以醫(yī)療機(jī)構(gòu)或研究機(jī)構(gòu)牽頭組織和運(yùn)營(yíng)為主導(dǎo)的樣本庫(kù),包括國(guó)際生物和環(huán)境樣本庫(kù)協(xié)會(huì)、法國(guó)國(guó)家健康和醫(yī)學(xué)研究院樣本庫(kù)、丹麥國(guó)家生物樣本庫(kù)等;(3)以第三方企業(yè)或公司牽頭組織和運(yùn)營(yíng)為主導(dǎo)的樣本庫(kù),如加拿大Genizon生物科學(xué)公司的生物樣本庫(kù)對(duì)25種疾病的遺傳基礎(chǔ)進(jìn)行研究,已完成了10種疾病的全基因組掃描。國(guó)際生物樣本庫(kù)的發(fā)展已從注重生物樣本數(shù)量的1.0時(shí)代、注重生物樣本質(zhì)量的2.0時(shí)代進(jìn)步至為個(gè)體化精準(zhǔn)醫(yī)療提供全面循證證據(jù)的生物樣本庫(kù)3.0時(shí)代[6-7]。
我國(guó)生物樣本庫(kù)的建設(shè)始于20世紀(jì)90年代,1994年中國(guó)科學(xué)院建立了中華民族永生細(xì)胞庫(kù),此后北京臍帶血造血干細(xì)胞庫(kù)、天津腫瘤醫(yī)院生物樣本庫(kù)、復(fù)旦腫瘤醫(yī)院生物樣本庫(kù)、上海交通大學(xué)生物樣本庫(kù)、南京市多中心生物樣本庫(kù)、首都醫(yī)科大學(xué)牽頭建立的北京生物樣本庫(kù)等相繼建立,國(guó)內(nèi)生物樣本庫(kù)憑借國(guó)家重點(diǎn)支持和人口資源等優(yōu)勢(shì)積累了豐富的生物樣本[8-9]。2021年3月13日,十三屆全國(guó)人大四次會(huì)議通過(guò)的《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》明確指出,“基因與生物技術(shù)”作為七大科技前沿攻關(guān)領(lǐng)域之一,“生物技術(shù)”作為九大戰(zhàn)略性新興產(chǎn)業(yè)之一,“基因技術(shù)”作為未來(lái)產(chǎn)業(yè),推動(dòng)生物技術(shù)和信息技術(shù)融合創(chuàng)新,構(gòu)建國(guó)家生物數(shù)據(jù)中心體系[10]?,F(xiàn)階段,在國(guó)家政策的支持和指導(dǎo)下,各地區(qū)高校、醫(yī)院和企業(yè)積極推進(jìn)生物技術(shù)與信息技術(shù)融合創(chuàng)新的生物樣本庫(kù)建設(shè)升級(jí)工作,促進(jìn)生物信息整合,推動(dòng)精準(zhǔn)醫(yī)療發(fā)展。
目前,臨床生物樣本庫(kù)的發(fā)展遇到2個(gè)瓶頸。首先,為繼續(xù)深入探究疾病發(fā)生發(fā)展的內(nèi)在原因,研究者需要更加全面的生物信息(包括基因、表觀、轉(zhuǎn)錄、蛋白、代謝等時(shí)空變化規(guī)律的全部信息),需要多個(gè)檢測(cè)平臺(tái)和醫(yī)療機(jī)構(gòu)進(jìn)行協(xié)作與共享;其次,以第三代測(cè)序技術(shù)為代表的新型技術(shù)不斷迭代,將產(chǎn)生大量的分子信息數(shù)據(jù),對(duì)生物樣本庫(kù)的數(shù)字化存儲(chǔ)、交互和分析挖掘也提出了更高要求。臨床生物樣本庫(kù)需從以貯存和管理生物樣本為中心的傳統(tǒng)生物樣本庫(kù)轉(zhuǎn)變?yōu)橐耘R床信息、樣本信息和組學(xué)信息為中心的數(shù)據(jù)型生物樣本庫(kù)[11-12]。
上海交通大學(xué)醫(yī)學(xué)院在上海市科學(xué)技術(shù)委員會(huì)的支持下,于2020年啟動(dòng)“結(jié)直腸癌轉(zhuǎn)移命運(yùn)機(jī)制及過(guò)程調(diào)控研究”項(xiàng)目。該項(xiàng)目以探究腫瘤命運(yùn)全息圖譜(全面系統(tǒng)地揭示結(jié)直腸癌轉(zhuǎn)移、耐藥、復(fù)發(fā)等命運(yùn)演變過(guò)程中基因、表觀、轉(zhuǎn)錄、蛋白、代謝等時(shí)空變化規(guī)律的全部信息)、精準(zhǔn)闡明腫瘤命運(yùn)決定基礎(chǔ)為目標(biāo),聯(lián)合上海交通大學(xué)醫(yī)學(xué)院等多家附屬醫(yī)院和上海交通大學(xué)醫(yī)學(xué)院臨床研究中心,開(kāi)展結(jié)直腸癌多中心前瞻性隊(duì)列研究以及多中心臨床研究生物樣本庫(kù)信息系統(tǒng)建設(shè)工作。
構(gòu)建多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng),涉及臨床數(shù)據(jù)記錄、生物樣本流轉(zhuǎn)記錄、生物樣本檢測(cè)數(shù)據(jù)、系統(tǒng)業(yè)務(wù)及用戶安全數(shù)據(jù)等關(guān)鍵信息。充分考慮信息系統(tǒng)的關(guān)聯(lián)性、易用性、安全性、拓展性和敏捷性等指標(biāo),其架構(gòu)采用微服務(wù)架構(gòu)(micro services)、瀏覽器/服務(wù)器模式(browser/server,B/S)。微服務(wù)架構(gòu)將系統(tǒng)依據(jù)的業(yè)務(wù)場(chǎng)景和數(shù)據(jù)模型拆分為獨(dú)立的服務(wù)個(gè)體,相較于整體式的面向服務(wù)架構(gòu)(service-oriented architecture,SOA),微服務(wù)架構(gòu)的實(shí)施模式為自下向上型,獨(dú)立進(jìn)行不同服務(wù)的開(kāi)發(fā)、構(gòu)建、部署和發(fā)布,服務(wù)間采用Restful通訊機(jī)制,具有敏捷迭代、靈活部署、松耦合和分布式彈性拓展等優(yōu)勢(shì)[13]。在B/S模式下,使用者可通過(guò)瀏覽器進(jìn)行便捷訪問(wèn),顯著減輕了客戶端安裝和升級(jí)系統(tǒng)的負(fù)擔(dān),用戶安全驗(yàn)證模塊、網(wǎng)絡(luò)安全防護(hù)模塊和基于HTTPS的加密網(wǎng)絡(luò)傳輸技術(shù)顯著保障了系統(tǒng)整體的數(shù)據(jù)安全。
根據(jù)項(xiàng)目臨床科室、生物樣本庫(kù)和各組學(xué)平臺(tái)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)業(yè)務(wù)情況分析,多中心結(jié)直腸癌臨床研究生物樣本信息系統(tǒng)可拆分為以下3個(gè)子系統(tǒng)/平臺(tái):(1)以患者為中心的臨床電子數(shù)據(jù)采集(electronic data capture,EDC)系統(tǒng);(2)以樣本為中心的生物樣本管理系統(tǒng);(3)以組學(xué)數(shù)據(jù)為中心的生物信息數(shù)據(jù)平臺(tái)。EDC系統(tǒng)采用表單引擎構(gòu)建電子病歷報(bào)告表,研究者可通過(guò)瀏覽器遠(yuǎn)程訪問(wèn)EDC系統(tǒng)錄入臨床數(shù)據(jù);生物樣本管理子系統(tǒng)以互聯(lián)網(wǎng)為通訊方式,通過(guò)微信小程序遠(yuǎn)程調(diào)用物聯(lián)網(wǎng)標(biāo)簽打印機(jī)打印樣本標(biāo)簽,并結(jié)合小程序的條碼識(shí)別功能,掃碼記錄標(biāo)簽打印、樣本流轉(zhuǎn)和樣本操作等流程信息,并將關(guān)鍵信息自動(dòng)同步至EDC子系統(tǒng),同時(shí)對(duì)存儲(chǔ)設(shè)備和生物樣本的狀態(tài)進(jìn)行監(jiān)控;生物信息數(shù)據(jù)平臺(tái)依托大容量的存儲(chǔ)設(shè)施和高性能的計(jì)算節(jié)點(diǎn),為生物樣本檢測(cè)數(shù)據(jù)提供存儲(chǔ)服務(wù)和統(tǒng)計(jì)分析服務(wù)。多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)平臺(tái)整體架構(gòu)詳見(jiàn)圖1。
圖1 多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)平臺(tái)架構(gòu)
多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)管理模式詳見(jiàn)圖2。EDC系統(tǒng)為受試者分配編碼,并將整個(gè)試驗(yàn)階段所需收集的臨床信息以電子化的方式記錄至系統(tǒng)中,EDC系統(tǒng)采用B/S架構(gòu)便于各中心進(jìn)行統(tǒng)一化數(shù)據(jù)錄入和集中化數(shù)據(jù)核查;在基線階段、治療階段和隨訪階段,研究人員根據(jù)臨床研究方案要求和樣本采集的標(biāo)準(zhǔn)操作規(guī)程(standard operating procedure,SOP)獲取裝有目標(biāo)生物樣本的采集管,采集管上附有定制編碼(以條形碼/二維碼或其他圖形符號(hào)標(biāo)識(shí)),此定制編碼由生物樣本管理系統(tǒng)制訂和識(shí)別,樣本在后續(xù)的接收、運(yùn)輸、采集、處理、貯存和發(fā)送等過(guò)程的識(shí)別均以采集管上的編碼信息為憑證,相應(yīng)的時(shí)間、空間信息變換將以互聯(lián)網(wǎng)為通訊方式記錄在生物樣本管理系統(tǒng)中,并將樣本編號(hào)及關(guān)鍵信息同步至EDC系統(tǒng)。同時(shí),存放生物樣本的設(shè)備溫度、濕度和狀態(tài)信息,亦可通過(guò)物聯(lián)網(wǎng)記錄在生物樣本管理系統(tǒng)中,方便研究人員對(duì)生物樣本的貯存狀態(tài)進(jìn)行管控。根據(jù)臨床研究方案要求,將生物樣本送至滿足檢測(cè)要求的機(jī)構(gòu)進(jìn)行檢測(cè),并將檢測(cè)結(jié)果上傳至生物信息平臺(tái),由平臺(tái)統(tǒng)一存儲(chǔ)生物信息數(shù)據(jù),該平臺(tái)與EDC系統(tǒng)互聯(lián)互通,可通過(guò)受試者的臨床信息檢索出其對(duì)應(yīng)的生物樣本檢測(cè)數(shù)據(jù),亦可通過(guò)生物樣本編碼查找到對(duì)應(yīng)的受試者信息,將臨床信息與生物信息數(shù)據(jù)相結(jié)合進(jìn)行統(tǒng)計(jì)分析,為精準(zhǔn)醫(yī)學(xué)的發(fā)展奠定數(shù)據(jù)基石。
圖2 多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)管理模式
為規(guī)范臨床試驗(yàn)電子數(shù)據(jù)采集技術(shù)的應(yīng)用,促進(jìn)臨床試驗(yàn)電子數(shù)據(jù)的真實(shí)性、完整性、準(zhǔn)確性和可靠性符合《藥物臨床試驗(yàn)質(zhì)量管理規(guī)范》和數(shù)據(jù)管理工作相關(guān)規(guī)定的原則要求,2016年7月,國(guó)家食品藥品監(jiān)督管理總局發(fā)布了《臨床試驗(yàn)的電子數(shù)據(jù)采集技術(shù)指導(dǎo)原則》[14]。多中心臨床研究EDC系統(tǒng)應(yīng)達(dá)到指導(dǎo)原則中規(guī)定的軟件、硬件、人員、系統(tǒng)環(huán)境及使用的基本要求;并制訂數(shù)據(jù)管理計(jì)劃,包括試驗(yàn)啟動(dòng)階段、進(jìn)行階段和結(jié)束階段相關(guān)電子數(shù)據(jù)采集系統(tǒng)的功能使用要求及說(shuō)明。范德堡大學(xué)(Vanderbilt University)開(kāi)發(fā)的電子數(shù)據(jù)采集系統(tǒng)REDCap(Research Electronic Data Capture)可供全球?qū)W術(shù)、科研及公益機(jī)構(gòu)使用,該項(xiàng)目采用REDCap作為臨床電子數(shù)據(jù)采集系統(tǒng),符合21 CFR Part 11(Title 21 Code of Federal Regulations Part 11)、FISMA(the Federal Information Security Management Act)、HIPAA(Health Insurance Portability and Accountability Act)和GDPR(General Data Protection Regulation)規(guī)范要求[15]。
多中心臨床研究使生物樣本管理系統(tǒng)面臨巨大的考驗(yàn),由以往單實(shí)驗(yàn)室的單點(diǎn)業(yè)務(wù)模式轉(zhuǎn)變?yōu)槎嗉裔t(yī)療機(jī)構(gòu)、多個(gè)貯存中心、多個(gè)檢測(cè)平臺(tái)相互關(guān)聯(lián)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)業(yè)務(wù)模式,需更加詳細(xì)和精準(zhǔn)地記錄生物樣本的時(shí)間、空間和狀態(tài)信息。得益于當(dāng)前智能手機(jī)和條形碼/二維碼識(shí)別技術(shù)的快速發(fā)展和普及,無(wú)需額外購(gòu)置專(zhuān)用的便攜式掃碼槍即可實(shí)現(xiàn)對(duì)條形碼/二維碼的識(shí)別,使得條形碼/二維碼識(shí)別工具的應(yīng)用門(mén)檻大大降低;研究人員可使用智能手機(jī)掃描采集管上的條形碼/二維碼,對(duì)采集管的編號(hào)進(jìn)行識(shí)別[16]。
目前,對(duì)于采集管上條形碼/二維碼的設(shè)置存在兩種方案,一種是采集管在出廠時(shí)即已印制條形碼/二維碼,另一種是研究者在使用時(shí)將打印好的條形碼/二維碼標(biāo)簽粘貼于采集管外部。為兼容不同平臺(tái)的貯存設(shè)備和多種型號(hào)的樣本采集管,本項(xiàng)目采用在采集管外部粘貼條形碼/二維碼標(biāo)簽的方案,該方案可在標(biāo)簽上標(biāo)注生物樣本的關(guān)鍵信息,方便進(jìn)行識(shí)別和操作,可兼容多種型號(hào)的采集管,適配性較好,但需注意選取滿足貯存環(huán)境要求的標(biāo)簽紙和打印設(shè)備(如-80 ℃低溫冰箱條件下,應(yīng)使用能夠耐受-80 ℃低溫的標(biāo)簽紙和全樹(shù)脂基碳帶的熱轉(zhuǎn)印標(biāo)簽打印機(jī))。同時(shí),為方便識(shí)別標(biāo)簽,應(yīng)規(guī)范其粘貼位置。本項(xiàng)目自主研發(fā)的生物樣本管理系統(tǒng),通過(guò)微信小程序遠(yuǎn)程調(diào)控物聯(lián)網(wǎng)標(biāo)簽打印機(jī)打印樣本標(biāo)簽,并結(jié)合微信二維碼的識(shí)別功能,掃碼記錄標(biāo)簽打印、樣本流轉(zhuǎn)、樣本操作等流程信息,將關(guān)鍵信息自動(dòng)同步至EDC子系統(tǒng),同時(shí)對(duì)貯存設(shè)備和生物樣本狀態(tài)進(jìn)行監(jiān)控。
本項(xiàng)目以探究腫瘤命運(yùn)全息圖譜、精準(zhǔn)闡明腫瘤命運(yùn)決定基礎(chǔ)為目標(biāo),其中組學(xué)數(shù)據(jù)檢測(cè)結(jié)果相關(guān)文件占用較大存儲(chǔ)空間。以單細(xì)胞測(cè)序?yàn)槔?,單個(gè)生物樣本測(cè)序結(jié)果占用的存儲(chǔ)空間一般為100 GB以上,此類(lèi)文件的存儲(chǔ)、交互及挖掘?qū)ι镄畔⑵脚_(tái)提出了較大挑戰(zhàn)。在文件存儲(chǔ)方面,生物信息平臺(tái)采用分布式文件存儲(chǔ)服務(wù)器,支持彈性擴(kuò)容、多副本、自動(dòng)糾錯(cuò)和容災(zāi)恢復(fù)等[17]。針對(duì)生物信息分析工具種類(lèi)繁多、部分工具安裝和使用較為繁雜的情況,采用支持通用工作流語(yǔ)言(common workflow language,CWL)和工作流描述語(yǔ)言(workflow description language,WDL)的生物信息數(shù)據(jù)分析平臺(tái)Galaxy[18]。該平臺(tái)提供基于WEB端的可視化操作界面,允許研究人員通過(guò)瀏覽器訪問(wèn)系統(tǒng)頁(yè)面后自定義分析流程和命令,且附帶多種常用的生物信息分析工具,可顯著減輕研究人員工作量,提高分析效率[19]。Galaxy同時(shí)支持超級(jí)計(jì)算中心的SLURM(simple linux utility for resource management)集群管理器和作業(yè)調(diào)度系統(tǒng),可將復(fù)雜任務(wù)分配于集群運(yùn)行,突破常規(guī)分析軟件單節(jié)點(diǎn)計(jì)算資源受限的瓶頸。
本項(xiàng)目涉及多個(gè)醫(yī)療中心、生物樣本庫(kù)、組學(xué)平臺(tái)的數(shù)據(jù)采集和信息傳輸,因此加強(qiáng)數(shù)據(jù)管理、制訂數(shù)據(jù)標(biāo)準(zhǔn)化管理方案至關(guān)重要。統(tǒng)一化編碼規(guī)則、結(jié)構(gòu)化臨床信息、標(biāo)準(zhǔn)化樣本流轉(zhuǎn)信息和規(guī)范化數(shù)據(jù)存儲(chǔ)等數(shù)據(jù)標(biāo)準(zhǔn)化管理方案,可保障生物樣本庫(kù)的整體數(shù)據(jù)質(zhì)量及各子系統(tǒng)間數(shù)據(jù)的高效互通互聯(lián)。
項(xiàng)目制定了統(tǒng)一化數(shù)據(jù)編碼規(guī)則,以生物樣本編號(hào)為例,統(tǒng)一化的生物樣本編號(hào)作為生物樣本的唯一識(shí)別編號(hào),由生物樣本管理系統(tǒng)根據(jù)受試者編號(hào)、樣本類(lèi)型、時(shí)間節(jié)點(diǎn)和采集序號(hào)進(jìn)行組合生成,作為各子系統(tǒng)間傳輸生物樣本信息時(shí)的唯一標(biāo)識(shí)編號(hào),可高效便捷地定位生物樣本所關(guān)聯(lián)的臨床信息、狀態(tài)信息和組學(xué)數(shù)據(jù)。
EDC系統(tǒng)的表單引擎功能可對(duì)所采集的臨床信息進(jìn)行結(jié)構(gòu)化處理,對(duì)于非結(jié)構(gòu)化和自由文本類(lèi)型的臨床信息,盡可能對(duì)其拆分和細(xì)化,使其轉(zhuǎn)化為可結(jié)構(gòu)化或可量化的變量,同時(shí)參考國(guó)際CDISC(Clinical Data Interchange Standards Consortium)標(biāo)準(zhǔn)對(duì)變量和選項(xiàng)進(jìn)行命名,使臨床信息便于收集、傳輸和統(tǒng)計(jì)分析。
研究人員可通過(guò)生物樣本管理系統(tǒng)微信小程序掃描采集管上的條形碼/二維碼,在移動(dòng)端實(shí)時(shí)錄入標(biāo)準(zhǔn)化的生物樣本流轉(zhuǎn)信息,包括樣本類(lèi)型、計(jì)量單位、預(yù)采集量、采集量、采集管質(zhì)量、操作人員、操作時(shí)間、操作狀態(tài)、存儲(chǔ)位置、存儲(chǔ)時(shí)間、存儲(chǔ)環(huán)境、送檢時(shí)間、送檢平臺(tái)和檢測(cè)結(jié)果等信息,其中操作狀態(tài)包括采集、運(yùn)送、接收、貯存、檢測(cè)和廢棄。系統(tǒng)將樣本流轉(zhuǎn)信息同步至EDC系統(tǒng),研究人員可直接在EDC系統(tǒng)查看受試者的臨床信息及其對(duì)應(yīng)的生物樣本實(shí)時(shí)流轉(zhuǎn)信息,同時(shí)系統(tǒng)可根據(jù)標(biāo)準(zhǔn)操作手冊(cè)對(duì)樣本流轉(zhuǎn)信息中的異常情況(如送樣時(shí)間超時(shí)、樣本采集量不足等)進(jìn)行實(shí)時(shí)預(yù)警。
檢測(cè)平臺(tái)將檢測(cè)后的組學(xué)數(shù)據(jù)文件與檢測(cè)信息(關(guān)聯(lián)的生物樣本、使用的設(shè)備、方法、操作人員、操作時(shí)間、文件校驗(yàn)碼等信息)一同上傳至生物信息平臺(tái),研究人員可通過(guò)生物信息平臺(tái)該組學(xué)數(shù)據(jù)文件的統(tǒng)一資源定位符(uniform resource locator,URL)獲取其數(shù)據(jù)文件。平臺(tái)將根據(jù)上傳的檢測(cè)信息,解析關(guān)聯(lián)的受試者和樣本,并將組學(xué)數(shù)據(jù)文件的URL傳至EDC系統(tǒng)中對(duì)應(yīng)的受試者記錄相關(guān)字段內(nèi),以便于研究人員檢索數(shù)據(jù)時(shí),可以快速匹配受試者相關(guān)的臨床信息和組學(xué)數(shù)據(jù)文件。
在我國(guó)全面保障和提升全民健康的過(guò)程中,生物樣本庫(kù)得以快速發(fā)展。多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)的建設(shè),突破了單點(diǎn)式生物樣本數(shù)據(jù)庫(kù)數(shù)據(jù)孤島和資源限制的瓶頸,將以貯存和管理生物樣本為中心的傳統(tǒng)生物樣本庫(kù),轉(zhuǎn)變?yōu)槿媸占?、高效管理和深度挖掘臨床研究中的臨床信息、樣本信息和組學(xué)信息等各種資源,形成一體化聚合數(shù)據(jù)庫(kù)為中心的數(shù)據(jù)型生物樣本庫(kù)。多中心結(jié)直腸癌臨床研究生物樣本庫(kù)信息系統(tǒng)的建設(shè)經(jīng)驗(yàn)和管理模式值得推廣至更多涵蓋生物樣本信息的多中心臨床研究,通過(guò)整合全方位的生物醫(yī)學(xué)信息,使之最大限度地服務(wù)于轉(zhuǎn)化醫(yī)學(xué)研究和精準(zhǔn)醫(yī)療。
作者貢獻(xiàn):孔偉名負(fù)責(zé)樣本管理程序開(kāi)發(fā)和生物信息平臺(tái)搭建及論文撰寫(xiě);呂文文負(fù)責(zé)數(shù)據(jù)標(biāo)準(zhǔn)化管理方案制訂;姜嘉媛負(fù)責(zé)EDC系統(tǒng)的構(gòu)建;馮鐵男負(fù)責(zé)項(xiàng)目調(diào)研分析和設(shè)備管理;俞章盛負(fù)責(zé)系統(tǒng)框架設(shè)計(jì)、項(xiàng)目整體管理及論文審校。
利益沖突:所有作者均聲明不存在利益沖突
志謝:感謝上海交通大學(xué)基礎(chǔ)醫(yī)學(xué)院在設(shè)備、平臺(tái)、專(zhuān)業(yè)技術(shù)人員、生物樣本管理流程和生物信息數(shù)據(jù)存儲(chǔ)/分析等方面提供的支持和幫助;感謝上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院、仁濟(jì)醫(yī)院等多家附屬醫(yī)院在研究方案設(shè)計(jì)和數(shù)據(jù)標(biāo)準(zhǔn)化管理方案中提供的支持和幫助。