索智楊
愛丁堡大學化學系,英國 EH89YL
全球公共衛(wèi)生問題成為危及人類健康的重大問題,如何從海量的健康數(shù)據(jù)中分析、解讀有關(guān)公共衛(wèi)生、疫情防護和人類的健康問題,成為公共衛(wèi)生和數(shù)據(jù)科學等多學科共同關(guān)注的問題。全球各國相關(guān)高校相繼增設(shè)或創(chuàng)建健康數(shù)據(jù)科學專業(yè)或方向,培養(yǎng)碩士或博士等高層次人才[1]。中國部分高校近些年也設(shè)立了“健康大數(shù)據(jù)研究院/所”,從事健康數(shù)據(jù)研究和高層次人才的培養(yǎng)。2016 年北京大學設(shè)立健康醫(yī)療大數(shù)據(jù)研究中心,2018 年改為健康醫(yī)療大數(shù)據(jù)國家研究院,并首家設(shè)立“健康數(shù)據(jù)科學”博士點,從事博士生的培養(yǎng)工作[2]。為了解國外高校健康數(shù)據(jù)科學專業(yè)的設(shè)置與人才培養(yǎng)等情況,為我國相關(guān)院校健康數(shù)據(jù)科學專業(yè)設(shè)置提供參考,本文擬通過對中、英、美部分重點高校健康數(shù)據(jù)科學專業(yè)設(shè)置情況進行調(diào)查分析,了解其專業(yè)設(shè)置構(gòu)成與特色。
萬維網(wǎng)的發(fā)展和大數(shù)據(jù)與人工智能等技術(shù)的興起,以數(shù)據(jù)為基礎(chǔ)的“第四研究范式”受到廣泛關(guān)注,越來越多的學科積極探索與數(shù)據(jù)科學的交叉和融合。
健康大數(shù)據(jù)、健康信息學、健康科學數(shù)據(jù)、健康數(shù)據(jù)科學四個概念存在不同程度的混用現(xiàn)象。
①健康科學數(shù)據(jù)與健康數(shù)據(jù)科學 健康管理和生物醫(yī)學研究數(shù)據(jù)集(data set of health management and biomedical studies)是健康數(shù)據(jù)的子集。健康科學數(shù)據(jù)的研究對象是健康領(lǐng)域的科學數(shù)據(jù)。概括地說,它是以收集“第一研究范式”為主的基礎(chǔ)研究、應(yīng)用研究和試驗開發(fā)等產(chǎn)生的生物醫(yī)學研究數(shù)據(jù)、通過監(jiān)測和檢驗等獲得的臨床數(shù)據(jù)(如患者記錄和臨床醫(yī)師文檔)、健康統(tǒng)計數(shù)據(jù)(如死亡率和利用率)和私人患者數(shù)據(jù)(如體育數(shù)據(jù)和保險數(shù)據(jù))等[3]。其研究問題主要是健康領(lǐng)域科學數(shù)據(jù)的管理與存儲等,常伴隨著醫(yī)學倫理學相關(guān)的論證。而健康數(shù)據(jù)科學是關(guān)于健康數(shù)據(jù)如何處理分析的科學。其研究對象是健康數(shù)據(jù),研究問題是健康數(shù)據(jù)的科學處理問題,即利用科學的方法對健康數(shù)據(jù)進行處理與分析,獲得對有關(guān)健康問題的認識。
②健康信息學與健康數(shù)據(jù)科學 健康信息學(health informatics,HI)是由健康科學與現(xiàn)代信息技術(shù)融合而成,是研究搜集、整理并可視化健康信息的交叉學科[4]。健康信息學的研究對象是健康信息,主要來源于各類文本中與健康有關(guān)的信息[5]。其研究重點在于理解與醫(yī)學相關(guān)的信息系統(tǒng)、數(shù)字化信息組織、信息檢索及信息計量研究[6]。信息不同于數(shù)據(jù),健康信息也不同于健康數(shù)據(jù),因而,健康信息學也不同于健康數(shù)據(jù)科學。
③健康信息學與健康大數(shù)據(jù) 健康信息學既不同于健康信息管理(health information management,HIM),也不同于健康大數(shù)據(jù)。健康信息學的產(chǎn)生不僅晚于健康信息管理,而且研究內(nèi)容也與其有較大的區(qū)別。而健康大數(shù)據(jù)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的健康數(shù)據(jù)的集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[7]。
①健康數(shù)據(jù)科學的學科性質(zhì) 健康數(shù)據(jù)科學是醫(yī)學、數(shù)據(jù)科學、數(shù)學、統(tǒng)計學與計算機科學等多學科交叉形成的新的學科,其前身是生物統(tǒng)計和醫(yī)學信息學。
②健康數(shù)據(jù)科學的內(nèi)涵 首先需要了解數(shù)據(jù)科學。數(shù)據(jù)科學是一門將“現(xiàn)實世界”映射到“數(shù)據(jù)世界”之后,在“數(shù)據(jù)層次”上研究“現(xiàn)實世界”的問題,并根據(jù)“數(shù)據(jù)世界”的分析結(jié)果,對“現(xiàn)實世界”進行預測、洞見、解釋或決策的新興科學。也是基于數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析、數(shù)據(jù)可視化等理論基礎(chǔ),混合數(shù)學、計算機科學等的交叉學科。
總之,健康數(shù)據(jù)科學是以健康醫(yī)療領(lǐng)域數(shù)據(jù)驅(qū)動,以數(shù)據(jù)科學方法為工具,通過對健康領(lǐng)域數(shù)據(jù)的分析處理,實現(xiàn)對健康領(lǐng)域問題的預測、洞見、解釋或決策的科學。
采用網(wǎng)絡(luò)調(diào)查法,通過訪問相關(guān)高校的主頁、搜索與瀏覽,并獲取其有關(guān)院系的專業(yè)設(shè)置相關(guān)信息。調(diào)查時間是2022 年5 月1~25 日。調(diào)查學校包括中國的雙一流高校(36 所A 類)和英國的倫敦大學聯(lián)盟、羅素大學集團高校及美國的常青藤高校。調(diào)研內(nèi)容:①是否設(shè)置健康數(shù)據(jù)科學及其相關(guān)專業(yè);②設(shè)置專業(yè)的名稱;③設(shè)置該專業(yè)的院系或?qū)W科;④課程設(shè)置情況(不同學科的課程構(gòu)成);⑤培養(yǎng)層次(本碩博)。檢索策略:首先是找到調(diào)研范圍所規(guī)定的高校主頁,然后是檢索相關(guān)專業(yè)設(shè)置信息。中文檢索詞:健康數(shù)據(jù)科學;英文檢索詞:health data science。
國內(nèi)36 所雙一流高校中7 所高校設(shè)置有健康數(shù)據(jù)科學相關(guān)專業(yè)。英國倫敦大學聯(lián)盟成員與羅素大學集團高校中,11 所高校設(shè)置有健康數(shù)據(jù)科學相關(guān)專業(yè)。美國常青藤高校中3 所高校設(shè)置有健康數(shù)據(jù)科學相關(guān)專業(yè)。
2.3.1 我國健康數(shù)據(jù)科學專業(yè)設(shè)置情況 從表1 可知,我國36 所雙一流高校中有7 所高校設(shè)有健康數(shù)據(jù)或信息相關(guān)專業(yè)。其中,北京大學設(shè)置健康數(shù)據(jù)科學;清華大學等3 所高校設(shè)置健康大數(shù)據(jù)專業(yè);復旦大學等3 所高校設(shè)置醫(yī)學信息學專業(yè)。從專業(yè)設(shè)置分析,主要有以下三種方式:①創(chuàng)建新的研究院。北京大學的“健康數(shù)據(jù)科學”和廈門大學的“健康醫(yī)療大數(shù)據(jù)”設(shè)立在“健康醫(yī)療大數(shù)據(jù)國家研究院”,屬于新創(chuàng)建的,均隸屬于學校的獨立的研究機構(gòu),在人員配置和目標定位上具有明確的交叉學科的特征。②在原有學科基礎(chǔ)上建立新的專業(yè)方向,如山東大學公共衛(wèi)生學院新建“健康大數(shù)據(jù)”專業(yè)。③在原有專業(yè)學科基礎(chǔ)上轉(zhuǎn)型和拓展;吉林大學的“醫(yī)學信息學”、四川大學和復旦大學的“醫(yī)學信息學”等均是在原有的醫(yī)學圖書情報學基礎(chǔ)上的創(chuàng)新和拓展。
表1 中國雙一流高校設(shè)置健康數(shù)據(jù)科學相關(guān)專業(yè)情況
2.3.2 英國高校健康數(shù)據(jù)科學專業(yè)設(shè)置情況分析從表2 可以看出,英國的11 所高校中有8 所新設(shè)置健康數(shù)據(jù)科學專業(yè),2 所高?;诮】敌畔⒒蜥t(yī)學信息學的轉(zhuǎn)型和拓展。
表2 英國倫敦大學成員和羅素集團成員高校設(shè)置健康數(shù)據(jù)科學專業(yè)情況
2.3.3 美國常青藤高校健康數(shù)據(jù)專業(yè)設(shè)置情況美國哈佛大學等3 所高校設(shè)置健康數(shù)據(jù)科學專業(yè),賓夕法尼亞大學設(shè)置有醫(yī)學信息學專業(yè)。美國的4所高校中,設(shè)置在醫(yī)學院和公共衛(wèi)生學院各2 所。
總之,從中、英、美三國的22 所高校相關(guān)專業(yè)設(shè)置看,我國4 所、英國7 所、美國3 所設(shè)置有健康數(shù)據(jù)科學專業(yè)。另有6 所高校設(shè)置有醫(yī)學(或健康)信息學專業(yè)。整體上,我國高校設(shè)置該專業(yè)的數(shù)量較少,英國最多。22 所高校中7 所高校設(shè)置在醫(yī)學院,4 所高校設(shè)置在公共衛(wèi)生學院;除外我國3 所高效是新組建的跨學科的交叉研究機構(gòu)。英國和美國高校主要是在原有一級學科下新增二級專業(yè)或方向;另外有少量高校是對原有醫(yī)學圖書情報學科的拓展。
①專業(yè)定位 健康數(shù)據(jù)科學是一門新興的多學科綜合的研究領(lǐng)域,涉及公共衛(wèi)生、數(shù)學、統(tǒng)計學、計算機科學等。其中,數(shù)學和統(tǒng)計學提供最基本的數(shù)據(jù)分析處理方法論。計算機科學提供海量數(shù)據(jù)的存儲與運算能力。公共衛(wèi)生、醫(yī)學和生命科學,既是健康數(shù)據(jù)的來源,又為數(shù)據(jù)分析結(jié)果的解讀提供理論支撐(或基礎(chǔ)),同時還是健康數(shù)據(jù)科學的價值,解決健康醫(yī)療衛(wèi)生領(lǐng)域的相關(guān)問題,為保障人類的健康服務(wù)。
②培養(yǎng)目標 健康數(shù)據(jù)科學專業(yè)人才培養(yǎng)目標是培養(yǎng)具有能夠?qū)】殿I(lǐng)域數(shù)據(jù)進行科學處理能力并對處理結(jié)果進行解釋的高級專業(yè)人才。從被調(diào)查的22 所高校看,在培養(yǎng)層次方面差異不大。多數(shù)高校是以碩士培養(yǎng)為主,12 所高校也同時培養(yǎng)博士。我國7 所高校中均招收碩士和博士,有2 所高校還培養(yǎng)本科生。英國的碩士生以教學型為主,但牛津大學和劍橋大學僅招收博士生。我國和美國的碩博生以學術(shù)型為主。
我國北京大學等4 所雙一流高校設(shè)有健康數(shù)據(jù)科學專業(yè),從其課程構(gòu)成看,包括“醫(yī)學”、“數(shù)據(jù)科學”、“數(shù)學和統(tǒng)計學”和“計算機科學”等,占18%。另外與“社會學”、“管理學”、“經(jīng)濟學”存在一定關(guān)聯(lián),占9%。在整個課程體系中,與數(shù)據(jù)相關(guān)的學科占54%??梢娊】禂?shù)據(jù)科學有兩個明顯的特征:一是非常強烈的數(shù)據(jù)時代、二是多學科交叉。
復旦大學等3 所雙一流高校設(shè)置醫(yī)學信息學專業(yè)。其中,“醫(yī)學”相關(guān)課程占30%;其次與“圖書情報”學科相關(guān)的信息組織、檢索等占20%;“計算機”、“管理學”、“統(tǒng)計學”、“信息學”和“生物統(tǒng)計學”學科均存在一定關(guān)聯(lián),分別約占10%。由此可知,此三所高校的課程體系也具有明顯的多學科交叉特征,但相對來說,原有學科專業(yè)痕跡較明顯,且學科構(gòu)成也較均衡。
有7 所英美高校將該專業(yè)設(shè)置在醫(yī)學院校下,是設(shè)置該相關(guān)專業(yè)最多的學院。在醫(yī)學院校下設(shè)置該類型專業(yè)的有帝國理工大學的健康數(shù)據(jù)分析和機器學習理學碩士、牛津大學健康數(shù)據(jù)科學博士、耶魯大學健康科學博士后(臨床方向)、愛丁堡大學醫(yī)學信息學博士、??巳卮髮W健康數(shù)據(jù)科學理學碩士、達特茅斯學院健康數(shù)據(jù)科學碩士和醫(yī)學信息學碩博。
這些學校的課程設(shè)置偏重于醫(yī)學,以計算機科學技術(shù)和數(shù)據(jù)科學為輔助課程。如牛津大學的健康數(shù)據(jù)科學設(shè)置在牛津大學醫(yī)學博士培養(yǎng)中心。牛津大學還將可穿戴設(shè)備作為專門的課程列出,這部分高校健康數(shù)據(jù)科學的課程構(gòu)成與我國新建專業(yè)較為相似,主要是醫(yī)學和數(shù)據(jù)科學兩大門類學科的交叉。
在博士階段,以愛丁堡大學為代表,愛丁堡的醫(yī)學信息學博士學位的設(shè)置更偏向于研究,所完成的項目一類是基于電子處方和記錄的處理,如電子處方優(yōu)化提高藥品管理的安全性,通過電子健康記錄提取進行元分析和數(shù)據(jù)關(guān)聯(lián)研究治療效果;另一類是建立醫(yī)學健康相關(guān)數(shù)據(jù)庫,如對哮喘、呼吸健康、帕金森語音的收集所建立的數(shù)據(jù)庫;此外該學位還涉及研究醫(yī)療健康數(shù)據(jù)的管理與組織。
綜上,通過對中、英、美22 所高校健康數(shù)據(jù)科學相關(guān)專業(yè)的調(diào)查分析發(fā)現(xiàn):①從數(shù)量上看,英國倫敦大學成員和羅素集團高校中設(shè)置健康數(shù)據(jù)科學的高校較多,美國常青藤高校中設(shè)置健康數(shù)據(jù)科學的高校比例與我國雙一流高校大體相當。②從人才培訓層次上看,三個國家均以培養(yǎng)碩士和博士高層次人才為主。③從健康數(shù)據(jù)科學專業(yè)設(shè)置看,英美較為相似,主要設(shè)在醫(yī)學和公共衛(wèi)生學院,我國以新建和新增為主。④從課程構(gòu)成看,三個國家均非常重視“多學科交叉”,主要有臨床醫(yī)學、公共衛(wèi)生學、統(tǒng)計學和計算機科學等四個學科組成,充分體現(xiàn)交叉學科的特征,但不同的建設(shè)模式,其不同學科課程的構(gòu)成比例有所不同。