吳玥,薛婧,魏強(qiáng),向志光,陳禹保,孔琪
(中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動物研究所,國家人類疾病動物模型資源庫,國家衛(wèi)生健康委員會人類疾病比較醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,新發(fā)再發(fā)傳染病動物模型研究北京市重點(diǎn)實(shí)驗(yàn)室,北京市人類重大疾病實(shí)驗(yàn)動物模型工程技術(shù)研究中心,北京 100021)
動物模型(animal model)是基于實(shí)驗(yàn)動物建立的模擬人類疾病或滿足研究的動物,是人類疾病研究的“技術(shù)瓶頸”,也是疫苗、藥物從實(shí)驗(yàn)室走向臨床應(yīng)用的“試金石”。動物模型是我國科學(xué)研究、生物醫(yī)藥和健康產(chǎn)品研發(fā)中不可缺少的科技資源,在提高我國自主創(chuàng)新能力、發(fā)展醫(yī)藥衛(wèi)生、健康產(chǎn)業(yè)等方面具有重要價(jià)值和市場前景[1-3]。
我國實(shí)驗(yàn)動物產(chǎn)業(yè)處于蓬勃發(fā)展階段,產(chǎn)生了數(shù)千種實(shí)驗(yàn)動物和動物模型資源。國際上實(shí)驗(yàn)動物、動物模型資源更是在數(shù)萬種以上。動物模型資源的選擇和共享一直是實(shí)驗(yàn)動物行業(yè)亟待解決的問題。動物模型資源的多樣化和標(biāo)準(zhǔn)化,既是國家戰(zhàn)略資源,也是生物制品、藥物研發(fā)的支撐性資源,更是生物醫(yī)藥產(chǎn)業(yè)又好又快發(fā)展的有力保障[4-6]。
為落實(shí)創(chuàng)新性國家戰(zhàn)略,提高我國科學(xué)研究能力,為我國醫(yī)藥衛(wèi)生健康產(chǎn)業(yè)發(fā)展和應(yīng)對新發(fā)突發(fā)重大傳染性疾病提供源自實(shí)驗(yàn)動物行業(yè)的強(qiáng)大科技支撐,根據(jù)科技部工作部署,我們建立了“國家動物模型資源共享信息平臺”(本文簡稱信息平臺),助力新冠肺炎疫情攻關(guān),提供數(shù)據(jù)支持,解決供需雙方對動物模型資源的需求。我們建立的國家動物模型資源共享信息平臺,可推動我國動物模型相關(guān)資源共享,滿足不同層次、不同研究目的的需求。
本平臺的資源數(shù)據(jù)主要來源于5個(gè)部分:(1)本單位自有動物模型相關(guān)資源;(2)實(shí)驗(yàn)動物資源單位匯交的動物模型相關(guān)資源;(3)文獻(xiàn)采集的動物模型相關(guān)資源;(4)國際公共實(shí)驗(yàn)動物資源庫匯集的動物模型相關(guān)資源,例如Mouse Genome Informatics(MGI)、Rat Genome Database(RGD)等;(5)研究人員個(gè)人提交的動物模型相關(guān)資源等。
1.2.1 文獻(xiàn)采集
采用爬蟲的方法對公共數(shù)據(jù)庫及文獻(xiàn)中的資源數(shù)據(jù)進(jìn)行采集。根據(jù)每個(gè)資源URL中含有的ID號,使用read_html命令讀取對應(yīng)網(wǎng)頁,使用css選擇器提取每個(gè)頁面中共有字段,例如Strain Name、Attributes、Symbol、Type、Source、Origin、Research Usage、MGI ID、RGD ID等,使用frame函數(shù)創(chuàng)建數(shù)據(jù)列表,使用for語句循環(huán)采集MGI與RGD數(shù)據(jù)庫資源頁面數(shù)據(jù)字段信息,使用writexl函數(shù)輸出為Excel格式。
1.2.2 資源鑒定
通過中國實(shí)驗(yàn)動物學(xué)會發(fā)布“國家動物模型資源共享信息平臺實(shí)驗(yàn)動物資源/動物模型征集函”在全國范圍內(nèi)征集數(shù)據(jù),重點(diǎn)與新冠動物模型研發(fā)單位進(jìn)行聯(lián)絡(luò),全面系統(tǒng)收集了新冠動物模型資源作為平臺的特色。聯(lián)合中國實(shí)驗(yàn)動物學(xué)會動物模型鑒定與評價(jià)工作委員會、中國實(shí)驗(yàn)動物學(xué)會實(shí)驗(yàn)動物資源鑒定與評價(jià)工作委員會(簡稱鑒定委員會)開展動物模型和實(shí)驗(yàn)動物資源鑒定工作,并發(fā)布經(jīng)過鑒定或采集的資源信息。
根據(jù)《中國實(shí)驗(yàn)動物學(xué)會實(shí)驗(yàn)動物模型鑒定與評價(jià)管理辦法(試行)》,由實(shí)驗(yàn)動物領(lǐng)域權(quán)威專家對申請人(單位)提交的材料進(jìn)行鑒定評價(jià),依據(jù)實(shí)驗(yàn)動物模型構(gòu)建的信度和效度(表觀效度、預(yù)測效度以及結(jié)構(gòu)效度),基于模型制作原理和方法,并結(jié)合不同品系動物的特點(diǎn),對擬開展鑒定和評價(jià)的實(shí)驗(yàn)動物模型從整體、組織、細(xì)胞和分子水平進(jìn)行鑒定和評價(jià)。在前期數(shù)據(jù)收集階段,可通過簡易申報(bào)流程,提供資源基本信息,通過審核后即可入庫。
信息平臺前端使用HTML5和jQuery1.3,后端采用Enterprise Java Beans框架,編程語言采用Python2.7,中間件使用Jboss 6.0,部署在Windows Server 2012 R2服務(wù)器。支持多種通用瀏覽器,系統(tǒng)具有開放性、易操作性、界面友好性、可靠性和安全性等特點(diǎn),為用戶提供統(tǒng)一的、友好的操作界面。采用MySQL (v 5.7)作為系統(tǒng)的數(shù)據(jù)庫平臺,采用標(biāo)準(zhǔn)SQL語句,以便擴(kuò)展。數(shù)據(jù)庫網(wǎng)址:https://.namri.cn/??擅赓M(fèi)公開訪問使用。
信息平臺包含新聞動態(tài)、實(shí)驗(yàn)動物、動物模型、儀器設(shè)備、飼料墊料、專家咨詢、供需機(jī)構(gòu)、大事記、數(shù)據(jù)提交9個(gè)欄目(圖1)。新聞動態(tài)部分按照科技部部署的科研攻關(guān)五大方向病原學(xué)和流行病學(xué)、檢測技術(shù)和產(chǎn)品、藥物和臨床救治、疫苗研發(fā)、動物模型構(gòu)建進(jìn)行分類,共11個(gè)角度,提供最新全球新冠疫情相關(guān)的動態(tài)新聞,新聞總量2825條(表1)。
圖1 平臺首頁Figure 1 Homepage of the database
表1 新聞信息統(tǒng)計(jì)Table 1 News information statistics
信息平臺收錄動物模型、實(shí)驗(yàn)動物資源總計(jì)19 364種,包括實(shí)驗(yàn)動物資源18 466個(gè)、動物模型898個(gè)。大多為科研機(jī)構(gòu)、企業(yè)提交,也有一部分為高等院校、醫(yī)院提交。動物模型樣品屬性信息見表2。
表2 動物模型信息表Table 2 Animal model information table
信息平臺提供全局檢索與高級檢索兩種檢索方式,每個(gè)頁面的右上角含有全局檢索框,可對平臺的實(shí)驗(yàn)動物、動物模型、儀器設(shè)備、飼料墊料進(jìn)行檢索。用戶選擇對應(yīng)欄目,輸入相關(guān)檢索關(guān)鍵詞后,可跳轉(zhuǎn)到相應(yīng)欄目瀏覽頁面,獲取最為可能的匹配結(jié)果。
實(shí)驗(yàn)動物與動物模型欄目提供高級檢索功能。用戶可自行選擇名稱、保種單位、應(yīng)用領(lǐng)域?qū)?shí)驗(yàn)動物資源進(jìn)行對應(yīng)檢索,選擇模型名稱、研制單位、用途對動物模型進(jìn)行對應(yīng)檢索,也可以通過導(dǎo)航欄中的資源分類進(jìn)一步限定資源范圍。
實(shí)驗(yàn)動物欄目按照常規(guī)實(shí)驗(yàn)動物類別進(jìn)行劃分,分為嚙齒類動物、兔、犬、貓、小型豬、非人靈長類、禽類、魚類、兩棲類、無脊椎動物、其他動物。其中嚙齒類動物細(xì)分為小鼠、大鼠、豚鼠、金黃倉鼠、中國地鼠、長爪沙鼠、東方田鼠、灰倉鼠。
詳情頁包含品系名稱、英文名稱、疾病名稱、相關(guān)基因、背景品系、遺傳類型、繁殖方式、繁殖代數(shù)、主要用途、簡介、圖片、主要特征描述、培育歷程與方法、遺傳信息、相關(guān)疾病表型、生物學(xué)特性、營養(yǎng)需要、飼養(yǎng)管理要點(diǎn)、飼養(yǎng)環(huán)境、培育單位、保種單位、鑒定方法、獲取的成果或參考文獻(xiàn)信息。通過右側(cè)相關(guān)資源可以查看與本資源相關(guān)的其他資源,目前資源總量達(dá)到18 466個(gè)(表3)。
表3 實(shí)驗(yàn)動物資源統(tǒng)計(jì)Table 3 Statistics of laboratory animal resources
綜合考慮廣度和深度,以及盡可能涵蓋目前所知的疾病模型類型,根據(jù)實(shí)驗(yàn)動物模型的分類原則將動物模型欄目分為傳染性疾病動物模型、神經(jīng)精神疾病動物模型、心腦血管和血液系統(tǒng)疾病動物模型、腫瘤動物模型、代謝性疾病動物模型、呼吸和消化系統(tǒng)疾病動物模型、骨骼運(yùn)動系統(tǒng)疾病動物模型、生殖系統(tǒng)疾病動物模型、免疫性疾病動物模型、五官和皮膚病動物模型、遺傳性疾病動物模型、特因環(huán)境動物模型、中醫(yī)證候動物模型、其他模型。
其中傳染性疾病動物模型細(xì)分為冠狀病毒感染動物模型、艾滋病毒感染動物模型、流感病毒感染動物模型、腸道病毒感染動物模型、結(jié)核桿菌感染動物模型、肝炎病毒感染動物模型、狂犬病毒感染動物模型、登革病毒感染動物模型、其他病毒感染動物模型。
根據(jù)新型冠狀病毒疫情防控科研攻關(guān)需要,信息平臺第一期重點(diǎn)圍繞SARS、MERS、COVID-19疾病,將冠狀病毒感染動物模型細(xì)分為SARS-CoV-2感染動物模型、SARS-CoV感染動物模型、MERSCoV感染動物模型、其他冠狀病毒感染動物模型,并加入新冠動物模型相關(guān)宣傳頁輪播圖,推送熱門資源。目前模型總量達(dá)到898個(gè)(表4)。
表4 動物模型數(shù)量統(tǒng)計(jì)Table 4 Statistics of animal models
通過信息平臺數(shù)據(jù)管理后臺可實(shí)現(xiàn)對新聞、資源、用戶、訂單進(jìn)行管理??蓪π侣?、實(shí)驗(yàn)動物、動物模型數(shù)據(jù)進(jìn)行增添、修改、刪除,查看對應(yīng)資源數(shù)量。并且可查看咨詢與訂購訂單,用戶注冊情況,查看操作日志(見圖2)。
圖2 數(shù)據(jù)管理后臺Figure 2 Back-end of database
我國實(shí)驗(yàn)動物產(chǎn)業(yè)總產(chǎn)值在200億元以上,交易量大,適用范圍廣,小到標(biāo)簽大到核磁都有涉及,市場空間廣闊。醫(yī)藥企業(yè)在新藥的研究和開發(fā)階段,均需要進(jìn)行動物實(shí)驗(yàn)。國內(nèi)外醫(yī)藥企業(yè)研發(fā)支出的增長,為實(shí)驗(yàn)動物行業(yè)的發(fā)展提供了有利的需求基礎(chǔ)[7]。
2020年中央公布的第一份關(guān)于要素市場化配置的文件《中共中央、國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》中,將數(shù)據(jù)納入新型生產(chǎn)要素,并上升到國家戰(zhàn)略層面[8]。
隨著我國科研水平的提高和生物醫(yī)藥產(chǎn)業(yè)的發(fā)展,對于實(shí)驗(yàn)動物的需求日益增加。特別是在新冠疫情爆發(fā)期間,加劇了對實(shí)驗(yàn)動物和動物模型的使用需求,甚至產(chǎn)生了供不應(yīng)求的情況[9]。所以科技部指定我單位建立了信息平臺,與各個(gè)從事實(shí)驗(yàn)動物科研行業(yè)單位進(jìn)行聯(lián)絡(luò),全方位多角度全面收集實(shí)驗(yàn)動物/動物模型信息,建成數(shù)據(jù)量龐大、信息全面、具有全國影響力的國家平臺,服務(wù)全國對實(shí)驗(yàn)動物行業(yè)有需求的用戶。
作者單位已建立了國內(nèi)最大的人類疾病動物模型資源庫,已納入科技部資源庫,但資源庫主要展示本單位自有動物模型資源信息。而信息平臺除含有本單位資源信息外,還包括鑒定委員會收集或鑒定過的動物模型資源,以及文獻(xiàn)來源、課題匯交、資源單位提交、我們收集的國內(nèi)外資源等多渠道來源的數(shù)據(jù)。除實(shí)驗(yàn)動物/動物模型信息外還含有實(shí)驗(yàn)動物相關(guān)產(chǎn)品及相關(guān)服務(wù)信息,用戶可以在線提交咨詢及訂購訂單。本單位也建立了一些數(shù)據(jù)庫性質(zhì)的平臺,例如比較醫(yī)學(xué)大數(shù)據(jù)平臺,含有實(shí)驗(yàn)動物/動物模型和比較醫(yī)學(xué)研究相關(guān)的生理生化、生物學(xué)特性及動物實(shí)驗(yàn)等數(shù)據(jù),以比較醫(yī)學(xué)科學(xué)數(shù)據(jù)為主體內(nèi)容,集成生物信息學(xué)工具及相關(guān)公共數(shù)據(jù)庫,與信息平臺在網(wǎng)站定位、功能、性質(zhì)、內(nèi)容、數(shù)據(jù)格式等方面不同。
國內(nèi)建立了國家遺傳工程小鼠資源庫、國家犬類實(shí)驗(yàn)動物資源庫、國家嚙齒類實(shí)驗(yàn)動物資源庫、國家非人靈長類實(shí)驗(yàn)動物資源庫等6個(gè)實(shí)驗(yàn)動物相關(guān)資源庫,對其資源庫包含的實(shí)驗(yàn)動物資源進(jìn)行展示和共享,含有實(shí)驗(yàn)動物資源基本信息及技術(shù)服務(wù)信息[10-11]。國內(nèi)外已經(jīng)建立了一些具有電商屬性的實(shí)驗(yàn)動物相關(guān)供需發(fā)布平臺,例如國內(nèi)的廣東省實(shí)驗(yàn)動物監(jiān)測所建立的實(shí)驗(yàn)動物商城(www.lasmark.cn)、維通利華實(shí)驗(yàn)動物商城(https://buy.vitalriver.com/)、喀斯瑪商城(www.casmart.com.cn)以及國外的Jackson Laboratory(https://www.jax.org/cn/)、Charles River(https://www.criver.com/)、Taconic(https://www.taconic.com/)、Envigo(https://www.envigo.com)等。這些平臺集本單位內(nèi)部的實(shí)驗(yàn)動物資源管理、交易、資訊為一體,實(shí)現(xiàn)實(shí)驗(yàn)動物行業(yè)資源聚合、快速查詢與在線交易[12-16]。而信息平臺數(shù)據(jù)來源廣泛,含有從文獻(xiàn)中采集的世界范圍的模型資源,有些為非實(shí)物資源,研究者可通過文獻(xiàn)中提供的技術(shù)方法進(jìn)行模型的制備。
信息平臺為免費(fèi)公開的網(wǎng)站,對我國實(shí)驗(yàn)動物、動物模型等資源及相關(guān)信息進(jìn)行系統(tǒng)整合,方便研究人員對信息進(jìn)行查詢,能夠在線咨詢及訂購,將資源擁有者與使用者聯(lián)系起來,形成供需紐帶。為資源的宣傳與推廣提供平臺,助力實(shí)驗(yàn)動物行業(yè)資源與服務(wù)的快速對接,加速資源流通。有助于推動我國實(shí)驗(yàn)動物領(lǐng)域動物模型資源信息共享,為科技創(chuàng)新和社會發(fā)展提供高質(zhì)量的科技資源共享服務(wù)。
今后將建成規(guī)模更大、集約化和高水平的信息平臺,向“產(chǎn)業(yè)化、規(guī)范化”方向發(fā)展,提供更為全面、高質(zhì)量的數(shù)據(jù),不斷提高信息平臺的影響力,充分發(fā)揮平臺的作用,服務(wù)全國,服務(wù)相關(guān)各方。我們將繼續(xù)整合國內(nèi)外的動物模型資源,不斷更新和完善動物模型的各類信息,例如模型的評價(jià)標(biāo)準(zhǔn)、模型構(gòu)建技術(shù)信息等,發(fā)揮國家級信息平臺的作用,為科技攻關(guān),生物醫(yī)藥產(chǎn)業(yè)提供有力的支撐,更好的服務(wù)科研和生物醫(yī)藥行業(yè)的需求。