方向東,朱波峰
前言
人類遺傳資源與生物大數(shù)據(jù)
方向東1,2,3,朱波峰4
1. 中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心),中國(guó)科學(xué)院基因組科學(xué)與信息重點(diǎn)實(shí)驗(yàn)室,北京 100101 2. 中國(guó)科學(xué)院大學(xué),北京 100049 3. 中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心),基因組與精準(zhǔn)醫(yī)學(xué)檢測(cè)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100101 4. 南方醫(yī)科大學(xué),法醫(yī)學(xué)院,廣州 510515
人類遺傳資源是指含有人體基因組、基因及其產(chǎn)物(RNA和蛋白質(zhì))的器官、組織、細(xì)胞、血液、制備物、DNA構(gòu)建體等人類遺傳資源材料及利用人類遺傳資源材料產(chǎn)生的數(shù)據(jù)等人類遺傳資源信息。中國(guó)人類遺傳資源是國(guó)家自然科技資源的重要組成部分,是維護(hù)公眾健康、國(guó)家安全和社會(huì)公共利益的重要戰(zhàn)略資源。2019年3月20日,《中華人民共和國(guó)人類遺傳資源管理?xiàng)l例》在國(guó)務(wù)院第41次常務(wù)會(huì)議上通過,自2019年7月1日起開始施行。中國(guó)人類遺傳資源在人類進(jìn)化、種族溯源、法醫(yī)學(xué)和生物醫(yī)學(xué)研究中發(fā)揮著不可或缺的重大作用。
隊(duì)列研究可通過對(duì)某一特定人群分組進(jìn)行隨訪或者縱向觀察監(jiān)測(cè),比較各組危險(xiǎn)因素和暴露程度與人群結(jié)果的聯(lián)系,發(fā)掘疾病產(chǎn)生原因以及揭示疾病發(fā)展進(jìn)程,為各類慢性疾病的預(yù)防和診斷提供有效的科學(xué)依據(jù)。大型人群隊(duì)列已然成為流行病學(xué)研究和重大復(fù)雜性疾病研究的主要方法之一。目前國(guó)內(nèi)外均有很多典型的大型隊(duì)列研究,例如歐洲10國(guó)的European Prospective Investigation into Cancer and Nutrition (EPIC,52.1 萬個(gè)體)、美國(guó)的NIH-AARP Diet and Health Study (NIH-AARP,56.6 萬個(gè)體)、中國(guó)慢性病前瞻性研究項(xiàng)目(51.3 萬個(gè)體)、中國(guó)泰州人群健康跟蹤調(diào)查(20 萬個(gè)體)以及近年來采集組學(xué)信息的精準(zhǔn)醫(yī)學(xué)研究隊(duì)列(如英國(guó)十萬基因組計(jì)劃、美國(guó)精準(zhǔn)醫(yī)療、中國(guó)十萬人基因組計(jì)劃)等。來自北京大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系的王文秀等[1]在《基于“中國(guó)慢性病前瞻性研究”的遺傳資源建設(shè)與應(yīng)用》一文中對(duì)中國(guó)醫(yī)學(xué)科學(xué)院、北京大學(xué)和英國(guó)牛津大學(xué)聯(lián)合開展的“中國(guó)慢性病前瞻性研究”項(xiàng)目(China Kadoorie Biobank, CKB)進(jìn)行了針對(duì)性介紹,重點(diǎn)展示了該項(xiàng)目資源的采集與管理以及近年來獲得的遺傳學(xué)研究成果。來自復(fù)旦大學(xué)人類表型組研究院的陳興棟等[2]在《大型人群隊(duì)列遺傳資源建設(shè)與利用》一文中以“泰州隊(duì)列”為例展示了大型人群隊(duì)列遺傳資源在建設(shè)過程中各環(huán)節(jié)的原則、方法、標(biāo)準(zhǔn)體系和具體實(shí)踐經(jīng)驗(yàn)等,為今后我國(guó)大型人群隊(duì)列遺傳資源建設(shè)工作提供科學(xué)參考?!度祟愡z傳資源管理?xiàng)l例》中指出人類遺傳資源不僅包括人類遺傳資源材料,還包括人類遺傳資源信息,明確了人類遺傳資源數(shù)據(jù)的重要性,這些數(shù)據(jù)不僅關(guān)乎個(gè)人的健康,還與國(guó)家安全相關(guān),需要統(tǒng)一的平臺(tái)保存管理。來自中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心)國(guó)家基因組科學(xué)數(shù)據(jù)中心的張思思等[3]在《GSA-Human:人類遺傳資源數(shù)據(jù)管理的公共系統(tǒng)》一文中詳細(xì)介紹了人類遺傳資源數(shù)據(jù)庫系統(tǒng)GSA- Human的數(shù)據(jù)庫性能、運(yùn)作模式、國(guó)內(nèi)外影響力,并深入思考了其面臨的挑戰(zhàn)以及未來的發(fā)展方向,共同為豐富國(guó)家人類遺傳資源庫數(shù)據(jù)盡一份力,推進(jìn)遺傳資源成為國(guó)家重要戰(zhàn)略資源。
法醫(yī)學(xué)是人類遺傳資源利用的重要領(lǐng)域之一,典型的人類遺傳標(biāo)記如單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)、短串聯(lián)重復(fù)序列(short tandem repeat, STR)和微單倍型(microhaplotype, MH)等被應(yīng)用于族群、系譜、體貌等特征刻畫,親子鑒定以及群體遺傳結(jié)構(gòu)等相關(guān)法醫(yī)學(xué)研究。來自四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院的王浩宇等[4]在《基于全基因組數(shù)據(jù)AI-SNPs篩選及大陸次級(jí)區(qū)域內(nèi)群體遺傳結(jié)構(gòu)差異研究》一文中使用千人基因組計(jì)劃中東亞的五個(gè)群體,建立了基于F的祖源信息單核苷酸多態(tài)性遺傳標(biāo)記(ancestry-informative sin-gle nucleotide polymorphism, AI-SNP)篩選法,對(duì)于減小大陸次級(jí)區(qū)域內(nèi)群體遺傳結(jié)構(gòu)差異對(duì)群體相關(guān)醫(yī)學(xué)研究的影響具有實(shí)際應(yīng)用價(jià)值。來自中山大學(xué)中山醫(yī)學(xué)院法醫(yī)學(xué)系的劉志勇和北京警察學(xué)院的任賀等[5]在《基于有限突變模型和大規(guī)模數(shù)據(jù)的19個(gè)常染色體STR的實(shí)際突變率研究》一文中使用Slooten與Ricciardi提出的有限突變模型和大規(guī)模數(shù)據(jù),對(duì)28,313例中國(guó)北京漢族已確認(rèn)親生關(guān)系的親子鑒定案的19個(gè)常染色體STR基因座突變現(xiàn)象進(jìn)行了深入研究。其團(tuán)隊(duì)重視隱形突變和一些少見的突變,得到了更為接近真實(shí)情況的新突變率結(jié)果。為科學(xué)解釋STR親子鑒定結(jié)果,優(yōu)化法醫(yī)學(xué)親子鑒定和個(gè)體識(shí)別方法提供了重要依據(jù)和理論支撐。來自四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院李茜等[6]在《微單倍型遺傳標(biāo)記的法醫(yī)基因組學(xué)研究》一文中基于千人基因組計(jì)劃中105個(gè)中國(guó)南方漢族個(gè)體的全基因組測(cè)序數(shù)據(jù),構(gòu)建了迄今為止最全面的MH 數(shù)據(jù)集,并且提出了構(gòu)建該MH數(shù)據(jù)庫的設(shè)計(jì)方案。在法醫(yī)實(shí)踐案件偵查中,辦案人員面對(duì)的對(duì)象主要為尸體/人體、毛發(fā)、骨、血液、精液及其斑痕等人體生物檢材,在研究過程中伴隨著一系列的社會(huì)倫理道德和生物安全問題。來自中山大學(xué)中山醫(yī)學(xué)院法醫(yī)學(xué)系的劉志勇等[7]在《法醫(yī)遺傳學(xué)研究和鑒定中的倫理問題》一文中提及了國(guó)際上相關(guān)的倫理性規(guī)范文件,并對(duì)樣本/檢材收集、法醫(yī)DNA表型分析、法醫(yī)遺傳系譜學(xué)分析、親子鑒定、數(shù)據(jù)交流共享等具體方面所涉及的倫理問題進(jìn)行了深入探討,并針對(duì)我國(guó)法醫(yī)遺傳學(xué)工作中出現(xiàn)的倫理問題提出三大建議。同樣來自西安交通大學(xué)口腔醫(yī)院的郭瑜鑫等[8]在《生物安全視野下的法醫(yī)學(xué)研究》一文中整理了法醫(yī)學(xué)研究中涉及到的生物安全內(nèi)容,同時(shí)點(diǎn)明了法醫(yī)學(xué)研究今后面臨的挑戰(zhàn)與機(jī)遇、提倡各從業(yè)人員重視生物安全問題,遵循生物安全原則,凈化法醫(yī)學(xué)研究環(huán)境。
近年來,隨著測(cè)序技術(shù)的發(fā)展和組學(xué)新技術(shù)的不斷涌現(xiàn),基因組、轉(zhuǎn)錄組、表觀組、蛋白質(zhì)組、代謝組等不同種類的組學(xué)數(shù)據(jù)指數(shù)級(jí)增長(zhǎng),而對(duì)多組學(xué)數(shù)據(jù)的整合分析,也成為科學(xué)家探索生命機(jī)制和疾病、腫瘤等發(fā)生發(fā)展規(guī)律的新方向。來自中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心)的王昕玥等[9]在《組學(xué)大數(shù)據(jù)和醫(yī)學(xué)人工智能》一文中舉例介紹了近年來多組學(xué)和人工智能在醫(yī)學(xué)領(lǐng)域各自的應(yīng)用進(jìn)展,以及兩者結(jié)合應(yīng)用相對(duì)于單組學(xué)或非人工智能的優(yōu)勢(shì),最后簡(jiǎn)單闡述多組學(xué)分析和人工智能在現(xiàn)階段面臨的挑戰(zhàn),為未來精準(zhǔn)醫(yī)學(xué)這一必然趨勢(shì)提供可行的研究思路。多組學(xué)研究技術(shù)的更新迭代以及信息時(shí)代的迅猛發(fā)展,伴隨著數(shù)據(jù)量的爆炸式增長(zhǎng),也帶領(lǐng)生物醫(yī)學(xué)開始進(jìn)入大數(shù)據(jù)時(shí)代,來自中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心的鄭廣勇等[10]在《前沿信息技術(shù)在生物醫(yī)學(xué)大數(shù)據(jù)中的應(yīng)用及展望》一文中介紹了云計(jì)算、區(qū)塊鏈、人工智能等前沿信息技術(shù)在生物醫(yī)學(xué)大數(shù)據(jù)中的應(yīng)用與展望。
未來,應(yīng)用人工智能等前沿信息技術(shù),探索生物醫(yī)學(xué)多組學(xué)大數(shù)據(jù),揭示人類遺傳資源所蘊(yùn)含的重要信息與規(guī)律將成為國(guó)家人口健康與安全領(lǐng)域的重要研究方向。我國(guó)人類遺傳資源進(jìn)入管理化、規(guī)范化道路,必將提高我國(guó)面對(duì)生物安全問題的防范能力,完善道德倫理規(guī)范,為我國(guó)人類遺傳資源的保護(hù)、開發(fā)、管理和利用建立良好的研究環(huán)境。
[1] Wang WX, Huang T, Li LM. Construction and application of human genetic resources in the China Kadoorie Biobank., 2021, 43(10): 972–979.
王文秀, 黃濤, 李立明. 基于“中國(guó)慢性病前瞻性研究”的遺傳資源建設(shè)與應(yīng)用. 遺傳, 2021, 43(10): 972–979. [DOI]
[2] Chen XD, Jiang YF, Xu P, Jin L. Construction and utilization of genetic resources in large population cohorts., 2021, 43(10): 980–987.
陳興棟, 蔣艷峰, 徐萍, 金力. 大型人群隊(duì)列遺傳資源建設(shè)與利用. 遺傳, 2021, 43(10): 980–987. [DOI]
[3] Zhang SS, Chen X, Chen TT, Zhu JW, Tang BX, Wang AK, Dong LL, Zhang ZW, Sun YL, Yu CX, Zhai S, Sun YB, Chen HX, Du ZL, Xiao JF, Zhang Z, Bao YM, Wang YQ, Zhao WM. GSA-Human: Genome Sequence Archive for Human., 2021, 43(10): 988–993.
張思思, 陳旭, 陳婷婷, 朱軍偉, 唐碧霞, 王安可, 董麗莉, 張哲文, 孫艷玲, 俞彩霞, 翟爽, 孫玉彬, 陳煥新, 杜政霖, 肖景發(fā), 章張, 鮑一明, 王彥青, 趙文明. GSA-Human: 人類遺傳資源數(shù)據(jù)管理的公共系統(tǒng). 遺傳, 2021, 43(10): 988–993. [DOI]
[4] Wang HY, Hu YH, Cao YY, Zhu Q, Huang YG, Li X, Zhang J. AI-SNPs screening based on the whole genome data and research on genetic structure differences of subcontinent populations., 2021, 43(10): 938–948.
王浩宇, 胡渝涵, 曹悅巖, 朱強(qiáng), 黃雨果, 李茜, 張霽. 基于全基因組數(shù)據(jù)的AI-SNPs篩選及大陸次級(jí)區(qū)域內(nèi)遺傳結(jié)構(gòu)差異研究. 遺傳, 2021, 43(10): 938–948. [DOI]
[5] Liu ZY, Ren H, Chen C, Zhang JJ, Zhang XM, Shi Y, Shi LY, Chen Y, Cheng F, Jia L, Chen M, Fan QW, Zhang JR, Li WT, Wang MC, Ren ZL, Liu YC, Ni M, Sun HY, Yan JW. Actual mutational research of 19 autosomal STRs based on restricted mutation model and big data., 2021, 43(10): 949–961.
劉志勇, 任賀, 陳沖, 張京晶, 張曉夢(mèng), 石妍, 石林玉, 陳瀅, 程鳳, 賈莉, 陳曼, 范慶煒, 張家榕, 李萬婷, 王萌春, 任子林, 劉雅誠(chéng), 倪銘, 孫宏鈺, 嚴(yán)江偉. 基于有限突變模型和大規(guī)模數(shù)據(jù)的19個(gè)常染色體STR的實(shí)際突變率研究. 遺傳, 2021, 43(10): 949–961. [DOI]
[6] Li X, Wang HY, Cao YY, Zhu Q, Shu PY, Hou TY, Wang YT, Zhang J. Forensic genomics research on microhaplo-types., 2021, 43(10): 962–971.
李茜, 王浩宇, 曹悅巖, 朱強(qiáng), 舒潘寅, 侯婷蕓, 王雨婷, 張霽. 微單倍型遺傳標(biāo)記的法醫(yī)基因組學(xué)研究. 遺傳, 2021, 43(10): 962–971. [DOI]
[7] Liu ZY, Wu RG, Li R, Wang QW, Sun HY. Ethical issues of the research and practice in forensic genetics., 2021, 43(10): 994–1002.
劉志勇, 烏日嘎, 李燃, 王薔薇, 孫宏鈺. 法醫(yī)遺傳學(xué)研究和鑒定中的倫理問題. 遺傳, 2021, 43(10): 994–1002. [DOI]
[8] Guo YX, Zhao XC. Research in forensic medicine under the view of biosafety., 2021, 43(10): 1003–1007.
郭瑜鑫, 趙興春. 生物安全視野下的法醫(yī)學(xué)研究·遺傳, 2021, 43(10): 1003–1007. [DOI]
[9] Wang XY, Qu HZ, Fang XD. Omics big data and medical artificial intelligence., 2021, 43(10): 930–937.
王昕玥, 渠鴻竹, 方向東. 組學(xué)大數(shù)據(jù)和醫(yī)學(xué)人工智能·遺傳, 2021, 43(10): 930–937. [DOI]
[10] Zheng GY, Zeng T, Li YX. Application and prospect of frontier information technology in biomedical big data., 2021, 43(10): 924–929.
鄭廣勇, 曾濤, 李亦學(xué). 前沿信息技術(shù)在生物醫(yī)學(xué)大數(shù)據(jù)中的應(yīng)用及展望·遺傳, 2021, 43(10): 924–929. [DOI]
2021-10-14
方向東,博士,研究員,研究方向:醫(yī)學(xué)遺傳學(xué)、精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)。E-mail: fangxd@big.ac.cn
朱波峰,博士,教授,研究方向: 法醫(yī)遺傳學(xué)。E-mail: zhubofeng7372@126.com
10.16288/j.yczz.21-355