崔鈺,孫彥順,于莉莉
1.濰坊醫(yī)學(xué)院 公共衛(wèi)生學(xué)院,山東 濰坊 261053;2.解放軍第九六〇醫(yī)院 醫(yī)學(xué)數(shù)據(jù)中心,山東 濟南 250031
數(shù)字孿生也被稱為數(shù)字雙胞胎,是通過對物理實體建模與仿真,建立物理實體與虛擬實體的數(shù)據(jù)交互映射,從而以虛擬實體反映物理實體的狀態(tài)[1]。美國空軍研究實驗室的Kobryn 和Tuegel 于2011 年3 月在一次演講中首次明確提到了數(shù)字孿生[2]。數(shù)字孿生近年來發(fā)展迅速,已成為世界各國學(xué)術(shù)界的熱點,其與其他技術(shù)相結(jié)合已應(yīng)用于多個領(lǐng)域,如工業(yè)生產(chǎn)中的智能工廠、智慧城市建設(shè)、航空航天領(lǐng)域的安全保障、醫(yī)療領(lǐng)域的數(shù)字模型等[3-4]。全球醫(yī)藥支出預(yù)計將以每年2%~5%的速度增長,到2024 年將超過1.1 萬億美元[5],然而中國每千人執(zhí)業(yè)醫(yī)師僅2.31 人,且存在醫(yī)療資源分配不均衡、嚴重浪費等問題,因此為醫(yī)療專業(yè)人員和患者提供更有效的解決方案已經(jīng)迫在眉睫[6]。數(shù)字孿生使用傳感器采集物理實體的相關(guān)數(shù)據(jù),再利用這些數(shù)據(jù)創(chuàng)建虛擬數(shù)字模型,并對其進行消化、分析、操作、更新和優(yōu)化[7]。當數(shù)字孿生技術(shù)應(yīng)用到人體時,可以通過個人的電子表現(xiàn),來動態(tài)反映人體的分子狀態(tài)、生理狀態(tài)和生活方式,因此對醫(yī)藥衛(wèi)生領(lǐng)域中數(shù)字孿生的研究具有重要意義。
文獻計量學(xué)是采用數(shù)學(xué)、統(tǒng)計學(xué)等定量的方法分析已發(fā)表的文獻數(shù)據(jù)[8]。目前,已有部分關(guān)于數(shù)字孿生的文獻計量研究,但缺乏數(shù)字孿生在醫(yī)療衛(wèi)生領(lǐng)域中較為系統(tǒng)、全面的文獻計量學(xué)分析研究。本研究旨在根據(jù)文獻計量學(xué)的基礎(chǔ)理論和研究方法,分析醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)文獻的發(fā)文趨勢、重要作者、合作網(wǎng)絡(luò)和研究熱點,并通過可視化圖譜的方式呈現(xiàn),以期為數(shù)字孿生在醫(yī)藥衛(wèi)生方面的應(yīng)用和相關(guān)科研人員的后續(xù)研究提供參考。
本研究在中國知網(wǎng)、萬方、維普、PubMed 和Web of Science 數(shù)據(jù)庫檢索醫(yī)藥衛(wèi)生領(lǐng)域與數(shù)字孿生有關(guān)的文獻,限制檢索時間為數(shù)據(jù)庫建庫至2022 年10 月15 日。檢索策略如下:中國知網(wǎng)使用高級檢索,具體檢索式為:“(主題=數(shù)字孿生)OR(主題=數(shù)字鏡像)OR(主題=數(shù)字化映射)OR(主題=數(shù)字雙胞胎)”,文獻分類選擇“醫(yī)藥衛(wèi)生科技”;萬方數(shù)據(jù)庫采取主題檢索,檢索詞和文獻分類同中國知網(wǎng)的檢索式;維普數(shù)據(jù)庫采取題名或關(guān)鍵詞檢索,檢索詞和文獻分類同中國知網(wǎng)的檢索式;PubMed 數(shù)據(jù)庫采取Title/Abstract 檢索,檢索詞為“digital twin”和“digital twins”;Web of Science 檢索詞同PubMed 數(shù)據(jù)庫檢索詞,文獻分類選擇與醫(yī)藥衛(wèi)生相關(guān)。
納入標準:文獻研究內(nèi)容確定與數(shù)字孿生有關(guān)且屬于醫(yī)藥衛(wèi)生領(lǐng)域。排除標準:① 重復(fù)的報道案例或文獻;② 與主題無關(guān)的文獻;③ 研究類型為通知、公告、摘要匯編等的非研究型論文。
本研究將檢索得到文獻的題錄導(dǎo)出,并利用NoteExpress(V3.0.3.6396)查重,隨后按照篩選標準選出與研究有關(guān)的文獻,以Refworks 形式導(dǎo)出。使用Excel(V16.0.15601.20148)進行文獻統(tǒng)計,使用VOSviewer(V1.6.18)進行知識圖譜分析。
1.4.1 機構(gòu)
依據(jù)作者地址字段提取機構(gòu):① 對一級單位的下級部門不做單獨統(tǒng)計,如Harvard Medical School 計入Harvard University;② 大學(xué)或科學(xué)院的附屬機構(gòu)不做單獨統(tǒng)計,如Massachusetts General Hospital 計入Harvard University;③ 若機構(gòu)掛牌/名稱≥2 個,則統(tǒng)一整理為其中一個,如University of Paris 又稱Université Paris Cité,統(tǒng)一整理為University of Paris。
1.4.2 關(guān)鍵詞
將含義相同的中英文關(guān)鍵詞合并,如將“artificial intelligence” 和“ 人工智能” 統(tǒng)一為“artificial intelligence”;將意思相同或相近的關(guān)鍵詞合并,例如將“personalized therapy”“personalised medicine”和“precision medicine”統(tǒng)一為“personalized medicine”。
本研究在中國知網(wǎng)、萬方、維普、PubMed 和Web of Science 共5 個數(shù)據(jù)庫中檢索到文獻1093 篇,經(jīng)NoteExpress 去重后剩余1005 篇。對題目、關(guān)鍵詞、摘要進行閱讀篩選,剔除非研究型論文及研究主題與醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生無關(guān)的文獻,最終確定納入研究的文獻共262 篇,包括期刊論文259 篇(中文期刊論文18 篇、外文期刊論文241 篇)、中文學(xué)位論文3 篇,受數(shù)據(jù)庫限制未納入國外學(xué)位論文。
圖1 文獻篩選流程圖
Grieves[9]最早提出“與物理產(chǎn)品等價的虛擬數(shù)字化表達”這一概念,被視為數(shù)字孿生的雛形。尹亞麗等[10]的研究發(fā)現(xiàn)2015 年以前有關(guān)數(shù)字孿生的研究成果很少,2016 年以后相關(guān)研究開始引起學(xué)術(shù)界的關(guān)注。醫(yī)療衛(wèi)生領(lǐng)域中有關(guān)數(shù)字孿生的第1 篇文獻的發(fā)表時間是2016 年,Yonova-Doing 等[11]應(yīng)用數(shù)字孿生建模研究核性白內(nèi)障;隨后文獻發(fā)表量呈現(xiàn)緩慢上升趨勢,自2021 年起,文獻數(shù)量激增,2021 年至2022 年10 月15 日共發(fā)表210 篇文獻,占相關(guān)文獻總量的80.15%,見圖2。數(shù)字孿生有賴于傳感器數(shù)據(jù),在醫(yī)療衛(wèi)生領(lǐng)域中傳感器用于監(jiān)視和預(yù)測患者的健康狀況[12-13],2020 年是“萬億傳感器世界”的首次亮相;此外,2020 年前后包括中國在內(nèi)許多國家發(fā)布了有關(guān)數(shù)字孿生的指導(dǎo)文件和標準,這可能是2020 年以后相關(guān)研究增多的主要原因。國內(nèi)的相關(guān)研究起步較晚,且研究成果較少,第1 篇中文文獻發(fā)表于2020 年,是一篇針對多模態(tài)數(shù)據(jù)融合的護理信息系統(tǒng)的研究[14]。
圖2 醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)文獻發(fā)表時間分布圖
醫(yī)療衛(wèi)生領(lǐng)域中有關(guān)數(shù)字孿生的259 篇期刊論文共計來源于175 種期刊。JournalofMedicalEthics是納入文獻量最多的期刊,共8 篇,占總文獻量的3.1%。納入文獻量最多的前10 名期刊多為基礎(chǔ)醫(yī)學(xué)類期刊,見表1。
共計1306 位作者被納入作者共現(xiàn)圖譜分析。Twin Health 公司的Mohammed 和Shamanna 是發(fā)文最多的作者,均發(fā)表論文9 篇,同時也是與其他作者開展合作最多的,均與其他86 位作者存在合作,其研究主要是應(yīng)用數(shù)字孿生技術(shù)治療和控制糖尿病。根據(jù)普賴斯定律的計算公式:M=0.749×(Nmax)1/2(Nmax指最高產(chǎn)作者的發(fā)文數(shù)量,M 為該領(lǐng)域的核心作者發(fā)文量臨界值)[15],醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)文獻發(fā)表數(shù)量最多的學(xué)者發(fā)文數(shù)量為9 篇,即Nmax=9,計算得M=2.247。因此,確定發(fā)文量大于2 篇的作者是該領(lǐng)域的核心作者,共148 位,其中17 位存在合作共線關(guān)系,共形成3 個聚類,見圖3 與表2。最大的聚類共包含9 位作者,以Thajudeen為中心、Mohammed 和Shamanna 發(fā)文量最多,其研究領(lǐng)域一致,主要是應(yīng)用數(shù)字孿生技術(shù)治療緩解糖尿病的臨床對照試驗;第二大的聚類共包含6 位作者,Ashok和Shah 是該聚類團體中發(fā)文最多的作者,均發(fā)表8 篇論文,其研究主要包括對心血管疾病和糖尿病的真實世界研究和試驗;第三大的聚類包含2 位作者,分別是Bhonsley 和Vadavi,分別發(fā)表5 篇、4 篇論文,其研究涉及人工智能、物聯(lián)網(wǎng)和全身數(shù)字雙胞胎技術(shù)。
表2 醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)研究的活躍作者
圖3 作者共現(xiàn)圖譜
共計448 家機構(gòu)被納入機構(gòu)共現(xiàn)圖譜分析,其中230 家存在合作共現(xiàn)關(guān)系,共形成20 個聚類,見圖4與表3。荷蘭的馬斯特里赫特大學(xué)是發(fā)表文獻最多的機構(gòu),有9 篇論文,同時與其他機構(gòu)合作最廣泛,其合作機構(gòu)有51 家,包括其他8 個聚類集團的核心機構(gòu),其主要研究數(shù)字孿生心臟。牛津大學(xué)所在的聚類位于整個聚類網(wǎng)絡(luò)的中心,與其他8 個聚類集團有合作,研究內(nèi)容較為多樣,涉及生命歷程數(shù)字雙胞胎、數(shù)字孿生心臟以及數(shù)字孿生的倫理研究等。最大的聚類集團有21 家機構(gòu),以米蘭理工大學(xué)為中心形成,該聚類集團的機構(gòu)大多只進行內(nèi)部合作,與其他聚類集團的合作較少,研究主要包括數(shù)字孿生在血管支架、臨床腫瘤學(xué)以及流行病學(xué)模型中的應(yīng)用等,這些機構(gòu)的研究多涉及數(shù)字孿生與人工智能的結(jié)合。第二大的聚類集團有19 家機構(gòu),主要包括Siemens 公司、慕尼黑工業(yè)大學(xué)和埃爾朗根-紐倫堡大學(xué),該聚類與格拉茨醫(yī)科大學(xué)和奧克蘭大學(xué)所在的聚類開展了較多合作,該聚類的主要研究是數(shù)字孿生數(shù)據(jù)的獲取技術(shù),如計算機斷層掃描、心電圖等。第三大的聚類集團有18 家機構(gòu),其中美國梅奧診所和佛羅里達大學(xué)發(fā)表文獻最多,研究內(nèi)容主要是重癥監(jiān)護數(shù)字孿生模型的開發(fā)和構(gòu)建,該聚類與其他聚類的合作廣泛,以法國國家信息與自動化研究所為代表,其與其他8 個聚類集團的核心機構(gòu)有合作關(guān)系。如圖4 所示,各個聚類集團比較集中,說明現(xiàn)階段大部分機構(gòu)的合作對象比較局限,合作團體之間的聯(lián)系較少,應(yīng)進一步加強校企、校校間的國際合作交流,可以使數(shù)字孿生向更深層次發(fā)展[16]。
表3 醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)研究的重要機構(gòu)
圖4 機構(gòu)共現(xiàn)圖譜
因“數(shù)字孿生”和“digital twin”為檢索文獻時使用的檢索詞,基本所有文獻的關(guān)鍵詞都包含,沒有統(tǒng)計分析的意義,故對其進行排除后,出現(xiàn)頻次≥3 的關(guān)鍵詞有94 個,共形成8 個聚類,各個聚類集合之間關(guān)聯(lián)緊密;humans(人類)、artificial intelligence(人工智能)、personalized medicine(個性化醫(yī)療)、machine-learning(機器學(xué)習(xí))是出現(xiàn)頻次最多的關(guān)鍵詞,分別為48、39、27、20 次,見表4、圖5~6。
表4 醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)研究的高頻關(guān)鍵詞
圖5 關(guān)鍵詞共現(xiàn)圖譜
圖6 關(guān)鍵詞時間圖譜
humans(人類)是出現(xiàn)最早的高頻關(guān)鍵詞,2017 年第一次出現(xiàn);其所在的聚類是最大的聚類集合,共包含15 個關(guān)鍵詞,出現(xiàn)的高頻關(guān)鍵詞還有algorithm(算法)、patient-specific modeling(個體化建模)、software(軟件)等,主要涉及數(shù)字孿生的模型、建模和計算機技術(shù)的研究。
machine-learning(機器學(xué)習(xí))是出現(xiàn)最晚的高頻關(guān)鍵詞,2021 年才第一次出現(xiàn),此后一直受到高度關(guān)注。其所在的聚類是第二大的聚類集合之一,包含14 個關(guān)鍵詞,高頻關(guān)鍵詞有personalized medicine(個性化醫(yī)療)、machine-learning(機器學(xué)習(xí))、health care(醫(yī)療保健)、digital health(數(shù)字健康)。劉曉冰等[16]研究發(fā)現(xiàn),自2018 年起數(shù)字孿生相關(guān)的研究多與機器學(xué)習(xí)、人工智能等技術(shù)方法結(jié)合,在醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生與機器學(xué)習(xí)、人工智能等技術(shù)方法結(jié)合是目前的研究熱點。2015 年歐盟PerMed 項目組發(fā)布《塑造歐洲的個性化醫(yī)療愿景》,推動了歐盟個性化醫(yī)療的實施[17],同年我國召開精準醫(yī)學(xué)專家研討會[18],提出了中國版精準醫(yī)療計劃,數(shù)字孿生技術(shù)有助于為患者打造一套建立在數(shù)據(jù)基礎(chǔ)上的最佳治療方案,推動個性化醫(yī)療的發(fā)展。
數(shù)字孿生與新一代信息技術(shù)的深度融合是數(shù)字孿生技術(shù)的研究熱點和未來發(fā)展方向[16],本研究發(fā)現(xiàn)這也是醫(yī)藥衛(wèi)生領(lǐng)域數(shù)字孿生相關(guān)研究的熱點,涉及的關(guān)鍵詞包括big data(大數(shù)據(jù))、artificial intelligence(人工智能)、machine-learning(機器學(xué)習(xí))等。
有關(guān)數(shù)學(xué)和計算機建模方法的關(guān)鍵詞包括agent based modeling(代理建模)、multi-scale modeling(多尺度建模)、finite element method(有限元法)等。目前數(shù)字孿生技術(shù)與其他新興數(shù)字研究方式相結(jié)合的方法備受學(xué)術(shù)界關(guān)注,且推動了數(shù)字醫(yī)學(xué)的整體發(fā)展。
與數(shù)字成像技術(shù)有關(guān)的關(guān)鍵詞較多,包括tomography、X-ray computed(X 射線計算機斷層掃描)、MRI(核磁共振成像)、CT(計算機斷層掃描)、imaging、three-dimensional(三維成像)、ECG(心電圖)等,可見數(shù)字孿生與數(shù)字成像技術(shù)的結(jié)合是研究熱點之一,陳珊珊等[19]認為數(shù)字孿生技術(shù)有助于推動智能醫(yī)學(xué)影像實驗室的發(fā)展。
與骨骼有關(guān)的部分關(guān)鍵詞也引起了一定關(guān)注,包括bone(骨)、spinal metastasis(脊柱轉(zhuǎn)移)、vertebral fracture(脊柱骨折)等。數(shù)字孿生在與信息物理融合系統(tǒng)[20]相關(guān)的骨骼建模和生物動力學(xué)中的應(yīng)用受到關(guān)注,2022 年前后有關(guān)數(shù)字孿生的椎體形成技術(shù)也引起了一定關(guān)注[21]。
本研究分析了醫(yī)藥衛(wèi)生領(lǐng)域中與數(shù)字孿生相關(guān)的262 篇文獻,系統(tǒng)全面地為相關(guān)科研學(xué)者闡述了目前醫(yī)藥衛(wèi)生領(lǐng)域有關(guān)數(shù)字孿生研究的現(xiàn)狀、重要作者和機構(gòu)、合作網(wǎng)絡(luò)、研究熱點等方面的發(fā)展趨勢,發(fā)現(xiàn)總體上文獻發(fā)表量呈現(xiàn)上升趨勢,且2021年起文獻數(shù)量增長迅速。Mohammed、Shamanna、Mohamed、Ashok 和Shah 等學(xué)者及其所在的團隊對數(shù)字孿生在醫(yī)藥衛(wèi)生領(lǐng)域的研究貢獻較大,Mohammed 和Shamanna 在應(yīng)用數(shù)字孿生技術(shù)治療緩解糖尿病的研究中貢獻突出;馬斯特里赫特大學(xué)、倫敦國王學(xué)院、牛津大學(xué)和巴黎大學(xué)是發(fā)表文獻最多的機構(gòu),不同機構(gòu)的研究內(nèi)容差異較大,大多數(shù)機構(gòu)的合作對象較為局限,缺乏大規(guī)模合作,已有部分校企之間存在合作,但仍需加強。數(shù)字孿生與大數(shù)據(jù)、機器學(xué)習(xí)、人工智能等新興技術(shù)以及其他數(shù)學(xué)和計算機建模方法的結(jié)合是醫(yī)藥衛(wèi)生領(lǐng)域有關(guān)數(shù)字孿生的研究熱點,基于數(shù)字孿生技術(shù)的個性化醫(yī)療、數(shù)字成像技術(shù)、骨骼建模和生物動力學(xué)研究也受到較多的關(guān)注。就目前的技術(shù)而言,建立一個充分、完整的人類數(shù)字孿生可能遠非現(xiàn)實,然而,能夠鏡像人類的一小部分,例如細胞受體甚至一些亞細胞器,仍可以將現(xiàn)代醫(yī)學(xué)推向一個全新的水平[22]。事實上,許多研究計劃通過收集健康個體和患者的分子、基因組和其他大數(shù)據(jù),為構(gòu)建數(shù)字人類孿生奠定基礎(chǔ)[23]。
總體上,目前醫(yī)藥衛(wèi)生領(lǐng)域?qū)?shù)字孿生的關(guān)注度較高,對數(shù)字孿生技術(shù)的應(yīng)用尚且有限,但其發(fā)展前景值得期待??梢灶A(yù)見的是,結(jié)合數(shù)據(jù)、知識和算法的數(shù)字孿生將徹底改變醫(yī)療衛(wèi)生科技的發(fā)展。由于數(shù)字孿生是近年來的新興技術(shù),醫(yī)藥衛(wèi)生領(lǐng)域的相關(guān)研究有限,本研究僅納入了262 篇文獻,文獻數(shù)量較少,且受限于國外學(xué)位論文的獲取途徑,本研究未納入國外學(xué)位論文,這是主要不足之處,但本研究的文獻計量分析結(jié)果可為未來醫(yī)藥衛(wèi)生領(lǐng)域有關(guān)數(shù)字孿生的理論研究與應(yīng)用探索提供參考與借鑒。