劉春鶴 張 晗 惠 文 李艷君 趙玉虹**,,4
(1.中國(guó)醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)院,沈陽110122;2.四川大學(xué)華西醫(yī)院圖書信息中心,成都610041;3.中國(guó)醫(yī)科大學(xué)附屬盛京醫(yī)院教務(wù)部,沈陽110004;4.中國(guó)醫(yī)科大學(xué)附屬盛京醫(yī)院臨床研究中心,沈陽110004)
隨著“互聯(lián)網(wǎng)+醫(yī)療”的快速發(fā)展,健康醫(yī)療行業(yè)產(chǎn)生的數(shù)據(jù)量呈爆發(fā)式增長(zhǎng),近年來全球許多國(guó)家都在極力推進(jìn)醫(yī)療信息化的發(fā)展,醫(yī)療數(shù)據(jù)的分析和應(yīng)用對(duì)提高醫(yī)療效率和醫(yī)療效果發(fā)揮著巨大的作用,因此當(dāng)務(wù)之急是有效組織和利用醫(yī)療數(shù)據(jù),使其成為行業(yè)的有力“助推器”[1]。美國(guó)McKinsey公司的一項(xiàng)報(bào)告顯示:醫(yī)療行業(yè)數(shù)據(jù)的應(yīng)用每年可為美國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)節(jié)省大約3000億美元的支出[2]。我國(guó)國(guó)務(wù)院發(fā)布的《“健康中國(guó)2030”規(guī)劃綱要》中明確提出要“推進(jìn)醫(yī)療健康大數(shù)據(jù)開放共享、深度挖掘和廣泛應(yīng)用”[3]。當(dāng)前健康醫(yī)療相關(guān)的數(shù)據(jù)體量龐大、分布分散、復(fù)雜多變;健康數(shù)據(jù)分析、決策支持、科普等方面對(duì)醫(yī)療信息可視化都有著巨大的需求[4,5]。而現(xiàn)實(shí)情況是,即使在發(fā)達(dá)國(guó)家也只有不到15%的人能夠憑借自身知識(shí)基礎(chǔ)和健康認(rèn)知力理解復(fù)雜的健康數(shù)據(jù)集所表達(dá)信息[6]。人們亟需去開發(fā)和使用有力的手段來處理當(dāng)前海量的醫(yī)療數(shù)據(jù)。
“一圖勝千言”,數(shù)據(jù)可視化是有效提高數(shù)據(jù)應(yīng)用效率的手段之一。它是利用人眼的感知能力對(duì)數(shù)據(jù)進(jìn)行交互的可視化表達(dá),以增強(qiáng)認(rèn)知的技術(shù)[7]。數(shù)據(jù)可視化作為一種媒介將晦澀的原始數(shù)據(jù)與數(shù)據(jù)用戶連接起來,對(duì)原始數(shù)據(jù)有效整合、反饋,有力地促進(jìn)了信息的傳遞與交流。
近年來,越來越多的學(xué)者將注意力聚焦到數(shù)據(jù)可視化領(lǐng)域,在CNKI數(shù)據(jù)庫(kù)中“可視化”主題的文獻(xiàn)多達(dá)近25萬篇,由這些文獻(xiàn)所屬學(xué)科分布圖(圖1)可見,可視化研究在情報(bào)學(xué)、地理學(xué)、建筑學(xué)、自動(dòng)化等諸多領(lǐng)域已有大量的文獻(xiàn),相比之下醫(yī)學(xué)相關(guān)學(xué)科,如臨床醫(yī)學(xué)、醫(yī)學(xué)教育與醫(yī)學(xué)邊緣學(xué)科、生物學(xué)、外科學(xué)等學(xué)科占比非常少,總和不到5%。從圖2可知Web of Science中可視化主題的文獻(xiàn)屬于醫(yī)學(xué)相關(guān)領(lǐng)域的有20%左右(其中放射醫(yī)學(xué)核醫(yī)學(xué)醫(yī)學(xué)影像領(lǐng)域7%、外科學(xué)4%、神經(jīng)科學(xué)4%等)。這一現(xiàn)象反映出兩個(gè)問題:一是相比其他學(xué)科的數(shù)據(jù),醫(yī)療數(shù)據(jù)作為大數(shù)據(jù)時(shí)代重要的信息組成部分,其可視化研究的程度還有極大的發(fā)展空間;二是國(guó)內(nèi)外醫(yī)療衛(wèi)生領(lǐng)域可視化研究的側(cè)重程度明顯不同。
圖1 中國(guó)知網(wǎng)可視化主題文獻(xiàn)學(xué)科分布情況Fig.1 Visualization Topic Document Distribution in CNKI
圖2 Web of Science可視化主題文獻(xiàn)分布Fig.2 Visualization Topic Document Distribution in Web of Science
為了系統(tǒng)地對(duì)國(guó)內(nèi)外相關(guān)研究主要內(nèi)容、集中趨勢(shì)和特點(diǎn)進(jìn)行挖掘和對(duì)比,本文采用知識(shí)圖譜的方法對(duì)國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究進(jìn)行分析。知識(shí)圖譜 (Knowledge Mapping/Knowledge Graph)能夠從結(jié)構(gòu)化的、半結(jié)構(gòu)化的或非結(jié)構(gòu)化的數(shù)據(jù)源中抽取實(shí)體及實(shí)體間的關(guān)系,并以圖譜的形式呈現(xiàn);它能夠同時(shí)被人和機(jī)器所理解,為使用者提供從關(guān)系分析問題的能力[8]。知識(shí)圖譜已被廣泛應(yīng)用于眾多領(lǐng)域的知識(shí)挖掘,應(yīng)用技術(shù)相對(duì)穩(wěn)定和成熟。目前國(guó)內(nèi)應(yīng)用知識(shí)圖譜分析醫(yī)療數(shù)據(jù)可視化領(lǐng)域發(fā)展情況的研究很少,尚未見同類文獻(xiàn)報(bào)道。健康醫(yī)療領(lǐng)域數(shù)據(jù)可視化研究對(duì)推進(jìn)醫(yī)學(xué)知識(shí)傳遞、成果交流、技術(shù)優(yōu)化等方面尤為重要。本文旨在揭示國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究的發(fā)展規(guī)律及特點(diǎn),希望能夠通過國(guó)內(nèi)外相關(guān)研究的對(duì)比,促進(jìn)二者之間互通有無、取長(zhǎng)補(bǔ)短,豐富醫(yī)療數(shù)據(jù)可視化研究的視角,為國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究的發(fā)展提供參考,進(jìn)而促進(jìn)數(shù)據(jù)時(shí)代醫(yī)療衛(wèi)生事業(yè)的全面發(fā)展。
外文文獻(xiàn)數(shù)據(jù):選取了文獻(xiàn)質(zhì)量高、在業(yè)界具有較高影響力、科睿唯安旗下科學(xué)信息研究所出版的Web of Science核心數(shù)據(jù)庫(kù)(WOS)。檢索時(shí)間為 2020年 4月 2日,檢索策略:以“visualization”為主題查詢Article類型的文獻(xiàn),并從中選取了醫(yī)藥衛(wèi)生、生物醫(yī)學(xué)相關(guān)學(xué)科的文獻(xiàn),時(shí)間跨度為2010—2019年。
中文文獻(xiàn)數(shù)據(jù):檢索CNKI、維普網(wǎng)、萬方數(shù)據(jù)三個(gè)中文全文型數(shù)據(jù)庫(kù)中2010—2019年的文獻(xiàn),具體策略:在CNKI的學(xué)術(shù)期刊庫(kù)中選擇“醫(yī)藥衛(wèi)生科技”分類,在“主題”字段檢索“可視化”;在萬方期刊數(shù)據(jù)庫(kù)中選取“醫(yī)藥衛(wèi)生”分類,在“主題”字段檢索“可視化”;在維普期刊服務(wù)平臺(tái)中選擇“醫(yī)藥衛(wèi)生”分類,在“題名或關(guān)鍵詞”字段檢索“可視化”。最后對(duì)三個(gè)數(shù)據(jù)庫(kù)來源的文獻(xiàn)進(jìn)行合并、去重、清洗。
經(jīng)過文獻(xiàn)檢索、清洗,共收集到相關(guān)外文文獻(xiàn)32401篇、中文文獻(xiàn)4058篇。
本文使用了美國(guó)Drexel University陳超美教授開發(fā)的Java應(yīng)用程序CiteSpace(5.6.R4版本)做文獻(xiàn)分析。CiteSpace是一種漸進(jìn)式知識(shí)領(lǐng)域可視化工具,它基于Price的“科學(xué)前沿理論”,結(jié)合共引分析和引證分析,創(chuàng)建出由“知識(shí)基礎(chǔ)”映射到“研究前沿”的理論模型[9,10]。它能夠分析科學(xué)文獻(xiàn)中的趨勢(shì)和模式[11]。
設(shè)置文獻(xiàn)處理時(shí)間窗切片為1年,主題元素來源于Title和Author Keywords(DE)兩個(gè)字段,網(wǎng)絡(luò)節(jié)點(diǎn)類型選擇Keyword。為了使中英文數(shù)據(jù)庫(kù)中提取的節(jié)點(diǎn)樣本兼顧代表性和可比性,篩選閾值選擇了g-index,k=25。在時(shí)間切片內(nèi),節(jié)點(diǎn)連接之間運(yùn)用Cosine算法計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)的關(guān)聯(lián)強(qiáng)度。最后對(duì)每個(gè)切片和合并后的網(wǎng)絡(luò)使用Pathfinder算法進(jìn)行裁剪,其作用是簡(jiǎn)化網(wǎng)絡(luò)并突出其重要的結(jié)構(gòu)特征,使結(jié)果具備更高的可讀性[6]。另外,通過人工編輯 project中的 alias文件,對(duì)數(shù)據(jù)進(jìn)行二次清洗,在項(xiàng)目運(yùn)行時(shí)對(duì)節(jié)點(diǎn)中存在大量的同義詞近義詞實(shí)施了合并處理。
圖3展示了2010—2019十年間國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化文獻(xiàn)的發(fā)表情況。從累計(jì)發(fā)文數(shù)量看,外文相關(guān)文獻(xiàn)的數(shù)量一直處于上升趨勢(shì);中文相關(guān)文獻(xiàn)發(fā)表數(shù)除了2015年有小幅降低以外,總體上也呈現(xiàn)逐年增加的態(tài)勢(shì)。年發(fā)文量是一個(gè)研究主題所受科研關(guān)注度的一個(gè)重要指標(biāo),國(guó)內(nèi)外持續(xù)上升的年發(fā)文量表明了科研人員對(duì)于醫(yī)療數(shù)據(jù)可視化研究的關(guān)注程度在逐漸提高,該主題一直是國(guó)際科學(xué)研究的焦點(diǎn)之一。而2015年之后年國(guó)內(nèi)文獻(xiàn)增長(zhǎng)幅度有明顯提高,也說明了我國(guó)有越來越多的學(xué)者將目光投向醫(yī)療數(shù)據(jù)可視化領(lǐng)域的研究和探索。
圖3 中外醫(yī)療數(shù)據(jù)可視化研究文獻(xiàn)分布情況Fig.3 Distribution of Chinese and Foreign Medical Data Visualization Research Literature
另外,觀察WOS中的文獻(xiàn)國(guó)家分布情況(圖4),來自美國(guó)的科研論文比例最高,約占35%;其次是德國(guó),約占12%;有大約11%的論文是來自中國(guó)(PEOPLESR CHINA)學(xué)者。一方面可見國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化的研究成果總數(shù)已經(jīng)在相關(guān)國(guó)際學(xué)術(shù)領(lǐng)域占據(jù)了舉足輕重的位置,另一方面,結(jié)合國(guó)家人口和科研人員的數(shù)量來考慮,我國(guó)在該領(lǐng)域的研究還有極大的發(fā)展空間。
圖4 2010—2019年WOS醫(yī)療數(shù)據(jù)可視化研究文獻(xiàn)國(guó)家分布情況(TOP20)Fig.4 2010-2019 WOS Medical Data Visualization Research Literature National Distribution(TOP20)
使用CiteSpace能夠?qū)崿F(xiàn)提取節(jié)點(diǎn)的共現(xiàn)分析,通過共現(xiàn)次數(shù)來測(cè)度節(jié)點(diǎn)之間的親疏關(guān)系,進(jìn)一步繪制聚類圖譜和時(shí)區(qū)圖譜。本文以Keyword作為節(jié)點(diǎn),選擇Log-likelihood Ratio算法對(duì)網(wǎng)絡(luò)進(jìn)行聚類,所得圖5、圖6分別是國(guó)內(nèi)、圖外醫(yī)療數(shù)據(jù)可視化研究的主題聚類圖譜,其中圖5的Q值為0.8721,圖6的 Q值為0.8394,屬于高模塊化值,證明生成的兩個(gè)主題共現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)顯著;圖5的 S值為 0.4914,圖6的 S值為0.7719,證明國(guó)內(nèi)主題共現(xiàn)網(wǎng)絡(luò)的輪廓量度表現(xiàn)一般,類間分離程度不是十分明顯但也在合理范圍之內(nèi),國(guó)外主題共現(xiàn)網(wǎng)絡(luò)的輪廓量度表現(xiàn)較好,聚類間分類程度相對(duì)明顯,生成的聚類結(jié)果較為合理。兩組圖譜中有相當(dāng)一部分主題具有極高的相似性,如#8 Spatio-temporal Data Fusion和#0時(shí)空掃描、#16 Wall Shear Stress和#12壁面剪應(yīng)力/#13生物力學(xué)、#9 Bibliometric Analysis和#11社會(huì)網(wǎng)絡(luò)分析/#19共詞分析等。這些相似的聚類結(jié)果一方面證實(shí)了本文方法的科學(xué)性,對(duì)于不同數(shù)據(jù)集的處理結(jié)果具有較好的集中趨勢(shì),另一方面也展示了國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究領(lǐng)域的一些共性熱點(diǎn)。
圖5 國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化文獻(xiàn)研究主題聚類圖Fig.5 Chinese Medical Data Visualization Literature Research Topic Cluster Map
圖6 國(guó)外醫(yī)療數(shù)據(jù)可視化文獻(xiàn)研究主題聚類圖Fig.6 Foreign Medical Data Visualization Literature Research Topic Cluster Map
從圖5可知,這十年國(guó)內(nèi)的醫(yī)療數(shù)據(jù)可視化研究的主題主要集中于如下幾個(gè)方面:時(shí)空數(shù)據(jù)分析(#0)、人體生理病理組織結(jié)構(gòu)的成像(#1、#7、#8、#18)、可視化軟件和技術(shù)開發(fā)(#4、#9、#16)、計(jì)算機(jī)可視化輔助治療(#10、#14、#20等)、生物力學(xué)(#12、#13)、文獻(xiàn)計(jì)量學(xué)研究(#11、#19)、交叉學(xué)科應(yīng)用(#5、#2、#17)、中醫(yī)學(xué)相關(guān)的可視化(#6)。國(guó)外的醫(yī)療數(shù)據(jù)可視化研究的主題比較具體(圖6),主要集中于:人體生理組織的可視化(#3、#4、#5)、時(shí)空數(shù)據(jù)可視化(#8)、生物信息學(xué)(#0、#12、#22)、計(jì)算機(jī)輔助診斷(#6、#15、#18)、計(jì)算機(jī)輔助治療(#7、#11、#17、#21)、生物力學(xué)(#16)、文獻(xiàn)計(jì)量學(xué)(#9)。相對(duì)于國(guó)內(nèi)的可視化相關(guān)研究而言,國(guó)外研究主題的粒度更加細(xì)化,專業(yè)也更加深入。除了上述二者相似的研究主題之外,國(guó)內(nèi)研究也有其獨(dú)有的關(guān)注焦點(diǎn),比如中醫(yī)學(xué)治療方法的可視化研究(#6)、可視化工具軟件的開發(fā)和探索(#4、#9、#16)。
時(shí)間線圖能夠展示研究主題在時(shí)間維度上的演變情況,圖7、圖8分別是國(guó)內(nèi)、國(guó)外醫(yī)療數(shù)據(jù)可視化研究文獻(xiàn)主題分布的時(shí)間線圖。圖中每一條橫線代表一個(gè)聚類主題,線上各節(jié)點(diǎn)分別表示聚類中的若干個(gè)重要主題,每個(gè)主題概念對(duì)應(yīng)圖頂端的年份代表該主題首次提出的時(shí)間,節(jié)點(diǎn)大小表示主題出現(xiàn)總頻次的高低,節(jié)點(diǎn)之間的弧形連線代表所連兩主題之間存在共現(xiàn)關(guān)系,即在同一項(xiàng)研究中作為相關(guān)主題出現(xiàn)。
圖7 國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化研究主題時(shí)間分布圖Fig.7 Timeline of Domestic Medical Data Visualization Research Topics
圖8 國(guó)外醫(yī)療數(shù)據(jù)可視化研究主題時(shí)間分布圖Fig.8 Timeline of Foreign Medical Data Visualization Research Topics
由圖7可見,2010年以來國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化研究的分支非常多元化。國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化研究中一些內(nèi)涵較廣泛的概念,如“三維重建”“三維可視化”“可視化技術(shù)”等主題貫穿這一時(shí)段的始終,與后續(xù)的眾多主題之間都有交集。深入剖析文獻(xiàn)發(fā)現(xiàn)有關(guān)“三維重建”和“三維可視化”的研究絕大多數(shù)是基于傳統(tǒng)影像技術(shù)如CT、磁共振的成像結(jié)果,通過某些特定的儀器或計(jì)算機(jī)算法實(shí)現(xiàn)研究對(duì)象的三維模型呈現(xiàn)。我國(guó)的“虛擬中國(guó)人計(jì)劃”起始于21世紀(jì)初,此后涌現(xiàn)出大量關(guān)于構(gòu)建人體生理病理組織三維可視化模型的研究。經(jīng)過十余年的探索,2010年之后的三維可視化研究已從之前的技術(shù)實(shí)現(xiàn)研究逐漸轉(zhuǎn)變?yōu)槌晒麘?yīng)用研究,如三維可視化模型結(jié)合傳統(tǒng)解剖學(xué)在基礎(chǔ)醫(yī)學(xué)教學(xué)中的推廣[12,13]、三維病理組織還原可視化輔助臨床診斷治療[14]、各種對(duì)具體部位的可視化輔助診斷治療研究等。具體部位疾病的可視化輔助治療研究主要集中于骨關(guān)節(jié)、心腦血管、肝、腎部位等,其他部位疾病的相關(guān)研究文獻(xiàn)并不突出。另外“生物力學(xué)”的相關(guān)研究可以說是可視化應(yīng)用在生物性能上的延伸,應(yīng)用最多的就是眼科臨床中使用可視化角膜生物力學(xué)分析儀分析活體角膜的生物力學(xué)特性[15,16]。
2010—2019 年這一時(shí)間段的初期就表現(xiàn)突出的主題還有“文獻(xiàn)計(jì)量學(xué)”,其中“共現(xiàn)分析”“聚類分析”“知識(shí)圖譜”“熱點(diǎn)研究”“社會(huì)網(wǎng)絡(luò)分析”都屬于其相關(guān)研究范疇,此類研究方法能夠基于相關(guān)文獻(xiàn)集中分析某一領(lǐng)域的研究特征和規(guī)律,分析結(jié)果往往是通過可視化圖表來展示。因其具有不受學(xué)科限制的特點(diǎn),所以被廣泛應(yīng)用于諸多領(lǐng)域,醫(yī)療衛(wèi)生領(lǐng)域也是其應(yīng)用的主要學(xué)科之一。如基于醫(yī)學(xué)某專題的文獻(xiàn),利用其主題、機(jī)構(gòu)、作者等信息建立關(guān)系網(wǎng)絡(luò),挖掘該專題的內(nèi)在聯(lián)系及隱含信息,或某一研究對(duì)象的發(fā)展演化過程。這一類主題伴隨著社會(huì)網(wǎng)絡(luò)分析軟件不斷開發(fā)和應(yīng)用,有了長(zhǎng)足的發(fā)展,如Citespace(2011年)、Pajek(2012年)、Histcite(2013年)、Vosviewer(2015年)等都有大量的應(yīng)用研究。
時(shí)空數(shù)據(jù)研究在醫(yī)療數(shù)據(jù)可視化領(lǐng)域也占據(jù)了一席之地。其中大部分是對(duì)疾病時(shí)空聚集性(2017年)及地理信息系統(tǒng)(2011年)的研究,廣泛應(yīng)用于展示流行性疾病的一般特征分布、時(shí)間聚集分布和空間聚集分布,從而推斷疾病的流行趨勢(shì)、發(fā)病誘因等。
隨著大數(shù)據(jù)時(shí)代的推進(jìn),人們獲取信息的渠道越來越多元和便捷,處理信息的粒度更加細(xì)致。近五年國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化的相關(guān)文獻(xiàn)數(shù)量更是急劇上升,主題分布也從“傳統(tǒng)主題”占據(jù)絕對(duì)優(yōu)勢(shì)的形勢(shì)演變?yōu)槎嘣黝}并存、共同發(fā)展的現(xiàn)狀,如網(wǎng)絡(luò)藥理學(xué)(2011年)、生物信息學(xué)(2017年)、組學(xué)(代謝組學(xué)2014年、基因組學(xué)2016年,影像組學(xué)2018年)等主題不斷豐富,而像3D打?。?015年)這樣的新興主題也層出不窮。
國(guó)外醫(yī)療數(shù)據(jù)可視化研究主題時(shí)間分布圖(圖8)中顯示,傳統(tǒng)醫(yī)療可視化技術(shù),包括影像學(xué)成像技術(shù)如 MRI、CT、Ultrasound、Tomography等和各種腔鏡技術(shù)如Endoscopy、Laparoscopy等在整個(gè)研究發(fā)展中充當(dāng)了重要的角色,后續(xù)許多影像學(xué)可視化研究都是在上述技術(shù)的基礎(chǔ)上進(jìn)行工具或算法的改良優(yōu)化,如4D Flow MRI(帶有時(shí)間分辨率的三維相位對(duì)比磁共振成像,2013年)、fMRI(功能磁共振成像技術(shù),2012年)、Micro-ct(微型CT,2011年)、Cryo-electron Tomography(低溫電子斷層掃描,2017年)等,都與前者之間有著密切的聯(lián)系??梢暬夹g(shù)輔助臨床治療的應(yīng)用在國(guó)外醫(yī)療數(shù)據(jù)可視化研究中非常廣泛,如Telemedicine(遠(yuǎn)程醫(yī)療,2018年)、Fluorescence-guided Surgery(熒光引導(dǎo)手術(shù),2017年)、Transoral Robotic Surgery(經(jīng)口機(jī)器人手術(shù),2017年)、Computerassisted Surgery(計(jì)算機(jī)輔助手術(shù),2016年)等都是其典型的應(yīng)用。針對(duì)具體疾病探索和應(yīng)用多集中在腫瘤(Breast Cancer,2010年;Brain Tumor,2013年;Melanoma,2013年;Ovarian Cancer,2015年;Glioblastoma,2017年)、神經(jīng)系統(tǒng)疾?。⊿pinal Cord Injury,2015年;Neurosurgery,2012年)、心腦血管疾?。∕yocardial Infarction,2011年)。
與國(guó)內(nèi)研究相比,國(guó)外相關(guān)研究最大的特點(diǎn)就是有關(guān)生物信息學(xué)的可視化研究,早在2010年Bioinformatics(生物信息學(xué))就已經(jīng)以一個(gè)獨(dú)立的主題存在,并已具備一定的研究基礎(chǔ)。生物信息學(xué)是通過綜合利用生物學(xué)、計(jì)算機(jī)科學(xué)和信息技術(shù),研究生物信息的采集、處理、存儲(chǔ)、傳播、分析等,揭示大量而復(fù)雜的生物數(shù)據(jù)所賦有的生物學(xué)奧秘的一門新學(xué)科[17]。生物信息學(xué)的研究結(jié)果往往通過可視化圖的形式展示,因此國(guó)外這十年的醫(yī)療數(shù)據(jù)可視化研究中,有大量屬于生物信息學(xué)主題的文獻(xiàn)出現(xiàn),Machine Learning(機(jī)器學(xué)習(xí),2013年)、Protein-protein Interaction Network(蛋白質(zhì)互作網(wǎng)絡(luò),2015年)、Next-generation Sequencing(下一代測(cè)序,2013年)、Gene Ontology(基因本體,2016年)、Comparative genomics(比較基因組學(xué),2017年)、Deep Learning(深度學(xué)習(xí),2018年)、Convolutional Neural Network(卷積神經(jīng)網(wǎng)絡(luò),2018年)、WGCNA(加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,2019年)等圍繞生物信息學(xué)展開的分支主題分布在本文研究的整個(gè)時(shí)間跨度中。其研究范圍廣泛、規(guī)模龐大,且生物信息學(xué)相關(guān)主題的粒度也已經(jīng)非常細(xì)化,目前處于深入研究挖掘的階段。
關(guān)于文獻(xiàn)計(jì)量學(xué)的主題在國(guó)外相關(guān)研究中也有所體現(xiàn),但總體上占比甚微。
突發(fā)監(jiān)測(cè)(Burst Detection)是康奈爾大學(xué)計(jì)算機(jī)科學(xué)系的Kleinberg[18]在2003年提出的一種算法。Kleinberg認(rèn)為“突發(fā)”是一種現(xiàn)象,而突現(xiàn)詞則是在某段時(shí)間內(nèi)相對(duì)增長(zhǎng)率(詞在某時(shí)刻的發(fā)展速度相對(duì)它自身平均的發(fā)展速度)突然增長(zhǎng)的詞[19]。如果突現(xiàn)詞為關(guān)鍵詞,則它可以反映文獻(xiàn)集中某一時(shí)段關(guān)注度突然增長(zhǎng)的研究主題和內(nèi)容。Citespace可以基于此算法測(cè)定某研究領(lǐng)域中突現(xiàn)詞,運(yùn)算結(jié)果分別可以按照Duration(突現(xiàn)年份)、Strength(突現(xiàn)強(qiáng)度)和 StartingYear(突現(xiàn)起始年)降序顯示。突現(xiàn)詞強(qiáng)度越高,說明突現(xiàn)年份中該關(guān)鍵詞的共現(xiàn)頻次驟增的程度越強(qiáng)。在 Configure the detection model中設(shè)置α1/α0=2,αi/αi-1=2,The Number of States為 2,γ[0,1]為0,Minmum Duration為2,結(jié)果國(guó)內(nèi)相關(guān)文獻(xiàn)關(guān)鍵詞中共測(cè)出64個(gè)突現(xiàn)詞,國(guó)外文獻(xiàn)中共181個(gè)突現(xiàn)詞。
表1~3為國(guó)內(nèi)外數(shù)據(jù)集得出的突現(xiàn)詞分布情況。圖中突現(xiàn)年份的每一行有10個(gè)點(diǎn),分別對(duì)應(yīng)2010—2019年之間的10個(gè)自然年,實(shí)心點(diǎn)代表該突現(xiàn)詞在對(duì)應(yīng)年份出現(xiàn)“突發(fā)”現(xiàn)象,●表示該突現(xiàn)詞雖然在2010—2019年之間出現(xiàn)過“突發(fā)”現(xiàn)象,但當(dāng)前已過了突發(fā)階段?!霰硎局钡?019年該詞仍處于突現(xiàn)“熱期”,雖然可能突現(xiàn)期截止于2019年,但很可能“熱期”繼續(xù)向后期延續(xù)。表1為突現(xiàn)強(qiáng)度前20的突現(xiàn)詞,由表1可見國(guó)內(nèi)相關(guān)文獻(xiàn)中突現(xiàn)強(qiáng)度最高的幾個(gè)關(guān)鍵詞“三維重建”“可視化人體”等均分布在2013年之前,只有“3D打印”和“生物信息學(xué)”在當(dāng)前有爆發(fā)增長(zhǎng)趨勢(shì)。外文文獻(xiàn)中“microRNA”和“3D printing”既是當(dāng)前的研究熱門也具有很高的突現(xiàn)強(qiáng)度,可以說是當(dāng)前在醫(yī)療數(shù)據(jù)可視化領(lǐng)域關(guān)注度最強(qiáng)的主題概念之一。
表1 突現(xiàn)強(qiáng)度前20的國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究突現(xiàn)詞表Tab.1 Top 20 Strongest Bursts of Medical Data Visualization Domestic and Foreign
表2 國(guó)外醫(yī)療數(shù)據(jù)可視化研究突現(xiàn)詞表1)Tab.2 Bursts of Foreign Medical Data Visualization1)
表3 國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化研究突現(xiàn)詞表1)Tab.3 Bursts of Domestic Medical Data Visualization1)
表2、表3是國(guó)外、國(guó)內(nèi)突現(xiàn)詞分布年持續(xù)至2019年的詞表,即當(dāng)前仍具備突發(fā)性的關(guān)鍵詞。經(jīng)過對(duì)比發(fā)現(xiàn),表2中突現(xiàn)詞的突現(xiàn)強(qiáng)度分布比較均勻,在3.9906~13.334之間,而全部外文突現(xiàn)詞的突現(xiàn)強(qiáng)度跨度在0.207~13.334之間,因此表2中突現(xiàn)詞強(qiáng)度總體偏向高值。表3中突現(xiàn)詞的突現(xiàn)強(qiáng)度在2.4127~5.8513之間,而全部中文突現(xiàn)詞的突現(xiàn)強(qiáng)度在2.4127~38.7439之間,可見表3中突現(xiàn)詞強(qiáng)度總體嚴(yán)重偏低。這一現(xiàn)象說明國(guó)內(nèi)相關(guān)研究立題角度新增的爆發(fā)性主題與國(guó)外相比較少,且爆發(fā)的強(qiáng)度較小,并沒有出現(xiàn)像本時(shí)段初期類似“三維重建”或“人體可視化”這樣集中趨勢(shì)明顯且增幅數(shù)量極大的熱門研究主題。另外,通過觀察具體突現(xiàn)詞內(nèi)容發(fā)現(xiàn)近年來國(guó)外的研究趨勢(shì)傾向于更細(xì)粒度的內(nèi)容如“Protein-protein interaction network”“Genome”“Pathway”“Metagenomics”,對(duì)應(yīng)國(guó)內(nèi)的研究則表達(dá)為上述主題的上一層次概念“生物信息學(xué)”。國(guó)外研究的集中性增長(zhǎng)已經(jīng)明顯體現(xiàn)在具體病癥的可視化分析上,如“Glioblastoma”“Gastric cancer”“Glaucoma”等,而這種特點(diǎn)在近期的國(guó)內(nèi)熱門主題上并沒有顯現(xiàn)。
無論是國(guó)內(nèi)還是國(guó)外的醫(yī)療數(shù)據(jù)可視化研究,年發(fā)文量增長(zhǎng)幅度都在持續(xù)走高。2010—2019年國(guó)外相關(guān)文獻(xiàn)量的年增長(zhǎng)幅度趨于平穩(wěn),而國(guó)內(nèi)相關(guān)文獻(xiàn)在2015年之后有了大幅度提升,可見國(guó)內(nèi)研究者對(duì)醫(yī)療數(shù)據(jù)可視化領(lǐng)域的科研關(guān)注程度明顯提高。隨著全球醫(yī)療數(shù)據(jù)數(shù)量的迅猛增長(zhǎng),越來越多的學(xué)者傾向于思考如何更加有效地利用醫(yī)療數(shù)據(jù)信息資源??梢暬椒ú粌H在形式上多種多樣、能夠批量表達(dá)數(shù)據(jù)信息,而且優(yōu)質(zhì)的可視化表達(dá)也可以提高用戶和研究者對(duì)醫(yī)療數(shù)據(jù)的統(tǒng)計(jì)分析效率和協(xié)助使用者深入理解數(shù)據(jù)信息,這也是相關(guān)研究文獻(xiàn)量明顯增加的原因。來自美國(guó)的研究論文數(shù)量最多,除了中國(guó)位居第三,排在前列的絕大部分都是發(fā)達(dá)國(guó)家,這與國(guó)家整體醫(yī)療行業(yè)發(fā)展水平、科學(xué)研究水平、信息資源的開發(fā)能力和重視程度都有密不可分的關(guān)系。
縱觀2010—2019年國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究的主題分布,其共同點(diǎn)主要集中于以下幾個(gè)方面:醫(yī)療數(shù)據(jù)時(shí)間空間維度的可視化研究、計(jì)算機(jī)輔助臨床診斷治療、生物力學(xué)應(yīng)用的可視化和科學(xué)計(jì)量學(xué)。
時(shí)空數(shù)據(jù)的研究角度非常多元,國(guó)內(nèi)此類研究集中于對(duì)某些流行疾?。ㄈ绮剪斒暇?、手足口病等)的時(shí)空聚集性流行分布、疾病病程發(fā)展,還有醫(yī)療相關(guān)的地理信息系統(tǒng)可視化[20,21],而國(guó)外則多體現(xiàn)在具備時(shí)間維度的醫(yī)學(xué)圖像的呈現(xiàn),以及病人臨床檢測(cè)等[22-24]。由此可見,雖然都是以“時(shí)空”數(shù)據(jù)為主題,但國(guó)內(nèi)外的研究側(cè)重卻大相徑庭,從技術(shù)水平要求上看,具備時(shí)間維度的醫(yī)學(xué)圖像的產(chǎn)生在框架構(gòu)建和算法設(shè)計(jì)上要求更高,其派生出可視化成果能夠?yàn)獒t(yī)師提供以前無法獲得的大量信息和更安全的程序[22],這個(gè)研究方向給未來醫(yī)療數(shù)據(jù)可視化研究者提供了很大的挑戰(zhàn)和契機(jī)。
醫(yī)學(xué)相關(guān)的科學(xué)計(jì)量學(xué)可視化研究則包括社會(huì)網(wǎng)絡(luò)分析、文獻(xiàn)計(jì)量學(xué)分析等,這一領(lǐng)域國(guó)內(nèi)外的研究方法和內(nèi)容比較類似,主要以某種疾病或某個(gè)醫(yī)療衛(wèi)生主題為出發(fā)點(diǎn),利用數(shù)據(jù)庫(kù)或文獻(xiàn)提供的指標(biāo)挖掘其內(nèi)在特征和內(nèi)涵[25-29]。國(guó)內(nèi)的醫(yī)療數(shù)據(jù)可視化研究在人體組織結(jié)構(gòu)和病理生理成像上有很大側(cè)重,另外對(duì)中醫(yī)藥醫(yī)療數(shù)據(jù)可視化的研究也是國(guó)內(nèi)研究的特色之一。國(guó)外研究中比較突出的重點(diǎn)主題就是“生物信息學(xué)”,這一主題不僅占據(jù)很大比例而且在研究粒度上也更加精細(xì),基因和蛋白生物特性、它們對(duì)生理病理過程的作用機(jī)制、以及它們之間的互作關(guān)系都是當(dāng)前國(guó)際醫(yī)療數(shù)據(jù)可視化研究中的熱點(diǎn)。雖然國(guó)內(nèi)近年來此類研究也有所起步,主要集中在2015年之后,但在研究深度和粒度上還需要進(jìn)一步擴(kuò)展。
2010—2019 年間國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究在傳統(tǒng)影像學(xué)技術(shù)的發(fā)展和延伸上都有體現(xiàn),但研究階段有所不同。2010年前后國(guó)內(nèi)研究尚沒有完全脫離基礎(chǔ)技術(shù)實(shí)現(xiàn)的階段,雖然單純使用成像技術(shù)探索人體生理構(gòu)造、建立模型的研究已經(jīng)很少出現(xiàn),但仍有類似“圖像配準(zhǔn)”這樣的主題在研;隨著時(shí)間的推移國(guó)內(nèi)此類研究才慢慢逐漸轉(zhuǎn)向技術(shù)優(yōu)化和升級(jí)的層面。在這一時(shí)段國(guó)外研究中關(guān)于影像學(xué)技術(shù)的多為工具和算法的優(yōu)化和改良,并將改良方法應(yīng)用于臨床實(shí)際。
關(guān)于文獻(xiàn)計(jì)量學(xué)、知識(shí)圖譜、社會(huì)網(wǎng)絡(luò)分析的研究在國(guó)內(nèi)非常盛行,貫穿了本文研究的整個(gè)時(shí)段,但國(guó)外研究中直到2018年才出現(xiàn)明確的Bibliometrics主題,期間出現(xiàn)的 Network Analysis(2014年)更多是屬于網(wǎng)絡(luò)藥理學(xué)和生物信息學(xué)方面方向的研究。相反的,在國(guó)外研究中關(guān)于生物信息學(xué)主題的內(nèi)容非常廣泛,其子主題豐富,貫穿近十年醫(yī)療數(shù)據(jù)可視化研究,但直到2017年才以獨(dú)立主題的形式出現(xiàn)在國(guó)內(nèi)的研究中。由此可見,國(guó)內(nèi)外研究中雖然存在相似的主題,但其側(cè)重點(diǎn)卻有所不同。
國(guó)內(nèi)外醫(yī)療可視化技術(shù)輔助臨床診斷治療的研究在時(shí)間上沒有明顯的差別,分布均勻,僅在治療部位和疾病病種上有所區(qū)別。
對(duì)于醫(yī)療數(shù)據(jù)可視化研究熱點(diǎn)趨勢(shì)的探索,國(guó)內(nèi)外文獻(xiàn)的分析結(jié)果有明顯差異。國(guó)外研究中最近3~4年新興主題的突現(xiàn)分布比較均勻,主題數(shù)量多,且突現(xiàn)強(qiáng)度值偏高(BurstnessMAX=13.3337),充分體現(xiàn)了其“百家爭(zhēng)鳴”“活力充沛”的良好研究發(fā)展趨勢(shì)。國(guó)外突現(xiàn)性較強(qiáng)的主題集中在“生物信息學(xué)”、具體部位疾病的診斷治療、“三維可視化”和數(shù)據(jù)挖掘幾個(gè)方面,可視化輔助診斷治療的對(duì)象明確,部位準(zhǔn)確,研究粒度較小。國(guó)內(nèi)研究的高值突現(xiàn)詞主題則分布在2010—2019年區(qū)間的前半部,如“三維重建”“可視化人體”“體繪制”等主題多偏向于傳統(tǒng)人體生理構(gòu)造的成像,其他類型的主題較少,近3年的新研究點(diǎn)突現(xiàn)值均處于較低值部分,總的來講有些“活力欠缺”。
由此可見,雖然我國(guó)在醫(yī)療數(shù)據(jù)可視化領(lǐng)域的總文獻(xiàn)數(shù)量逐年遞增,但在開發(fā)科研創(chuàng)新點(diǎn)這個(gè)層面上還需要更加深入的思考和探索。在突現(xiàn)主題內(nèi)容上可以借鑒國(guó)際研究的豐富經(jīng)驗(yàn)將主題細(xì)化,如將大主題“生物信息學(xué)”繼續(xù)向“Protein-protein Interaction Network”“mRNA”“Pathway”“microRNA”等子主題深入發(fā)展;將廣義的“數(shù)據(jù)分析”細(xì)化到具體某個(gè)層面的、某種性質(zhì)或某個(gè)維度的數(shù)據(jù)來分析,以此來豐富國(guó)內(nèi)相關(guān)研究的深度和廣度。
隨著計(jì)算機(jī)技術(shù)的蓬勃發(fā)展和大數(shù)據(jù)時(shí)代的到來,科學(xué)研究手段繼實(shí)驗(yàn)、理論和計(jì)算仿真之后迎來了它的第四種范式:“數(shù)據(jù)密集型科學(xué)”[30]。越來越多的研究者意識(shí)到想要從海量的數(shù)據(jù)中獲取知識(shí)、挖掘真知、驗(yàn)證科學(xué)假說,就必須探索更為高效的數(shù)據(jù)挖掘途徑,而數(shù)據(jù)可視化是實(shí)現(xiàn)這個(gè)目的的重要途徑,因此對(duì)各學(xué)科領(lǐng)域的數(shù)據(jù)可視化應(yīng)用研究日益增加。近十年在基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)以及其他醫(yī)學(xué)相關(guān)領(lǐng)域的數(shù)據(jù)可視化研究都有長(zhǎng)足的發(fā)展,國(guó)內(nèi)外相關(guān)研究數(shù)量均呈現(xiàn)明顯增長(zhǎng),國(guó)內(nèi)相關(guān)研究數(shù)量更有指數(shù)攀升的趨勢(shì)。
國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究的共同之處主要集中于傳統(tǒng)影像學(xué)技術(shù)應(yīng)用及改良、生物體模型的構(gòu)建、計(jì)算機(jī)可視化輔助臨床診療、文獻(xiàn)計(jì)量學(xué)領(lǐng)域、生物力學(xué)模型等主題,以及一些新興主題,如3D打印技術(shù)、深度學(xué)習(xí)等。但國(guó)內(nèi)外研究在上述主題上的側(cè)重程度卻有明顯的區(qū)別:國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化研究有很大份額集中在文獻(xiàn)計(jì)量學(xué)、社會(huì)網(wǎng)絡(luò)分析這類主題中,但國(guó)外研究在這類主題上雖有涉及,但并不多見;國(guó)外研究大比例地體現(xiàn)在生物信息學(xué)方面的挖掘研究,國(guó)內(nèi)文獻(xiàn)中生物信息學(xué)的研究占比較少且內(nèi)容尚不深入。
從研究主題“活躍性”的角度來看,近十年國(guó)外醫(yī)療數(shù)據(jù)可視化相關(guān)研究突現(xiàn)主題數(shù)量多,且突現(xiàn)強(qiáng)度普遍比國(guó)內(nèi)研究主題的突現(xiàn)強(qiáng)度高,最近3~4年新興主題豐富且分布比較均勻。國(guó)內(nèi)研究的高值突現(xiàn)詞主題主要分布于2010—2013年,內(nèi)容以傳統(tǒng)影像學(xué)成像、可視化人體模型構(gòu)建及計(jì)算機(jī)輔助治療為主;最近幾年新增的突現(xiàn)主題研究角度逐漸多元,涉及3D打印、生物信息學(xué)、手術(shù)前計(jì)算機(jī)輔助規(guī)劃評(píng)估、麻醉學(xué)、專利評(píng)估、時(shí)空聚集數(shù)據(jù)的可視化等,其突現(xiàn)值分布在2.41~5.85之間。
4.2.1 起步晚、雖數(shù)量增加但活力不足
從相關(guān)研究文獻(xiàn)的年發(fā)文量可以看出,早期國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化的研究并不多,且在相當(dāng)一段時(shí)間內(nèi)增幅緩慢,在2015年后才出現(xiàn)了爆發(fā)式的增長(zhǎng)。結(jié)合國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究突現(xiàn)詞的分布發(fā)現(xiàn)國(guó)內(nèi)研究的高強(qiáng)度突現(xiàn)概念大都出現(xiàn)在2010—2013年,近五年的研究中顯示高突現(xiàn)強(qiáng)度的概念只有“3D打印”和“生物信息學(xué)”,新研究概念普遍突現(xiàn)強(qiáng)度值較低,多數(shù)在2.4~3.5之間。可見國(guó)內(nèi)相關(guān)研究者是在近五年才對(duì)醫(yī)療數(shù)據(jù)可視化研究予以重視,整體研究步伐慢于國(guó)際研究進(jìn)程,并且這些研究更傾向于“傳統(tǒng)主題”,如“三維重建”“可視化人體”“解剖學(xué)”等。對(duì)比國(guó)外相關(guān)研究突現(xiàn)詞時(shí)間分布均勻、主題豐富、突現(xiàn)值高的特點(diǎn),國(guó)內(nèi)研究相對(duì)“創(chuàng)新不足”“后勁不足”。
國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化應(yīng)用的研究者應(yīng)該嘗試借鑒國(guó)外相關(guān)研究的立題思路、關(guān)注最新國(guó)際科研動(dòng)態(tài),并借助大數(shù)據(jù)時(shí)代醫(yī)療數(shù)據(jù)數(shù)量激增、種類多樣、更新頻率快等特點(diǎn),尋求思變。一方面在傳統(tǒng)可視化方法應(yīng)用上優(yōu)化數(shù)據(jù)的處理精度,面向非結(jié)構(gòu)化、準(zhǔn)結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化醫(yī)療大數(shù)據(jù)提出個(gè)性化的應(yīng)對(duì)方案;另一方面結(jié)合技術(shù)發(fā)展的創(chuàng)新產(chǎn)物及時(shí)挖掘新的研究主題,像可穿戴醫(yī)療健康設(shè)備、3D打印,4D流磁共振等。對(duì)于新挖掘的研究方向要做深做透做全,提高研究的延續(xù)性,而不是淺嘗輒止,這樣就能有效的避免新的研究主題即便極具研究?jī)r(jià)值卻顯示了較弱的研究活力甚至“夭折”的現(xiàn)象。
4.2.2 針對(duì)研究主題的挖掘粒度較大,細(xì)化程度不足
這一問題在“可視化人體構(gòu)建”和“生物信息學(xué)”這兩大重要研究主題上體現(xiàn)得尤為突出。三維重建技術(shù)的應(yīng)用和可視化人體構(gòu)建是貫穿國(guó)內(nèi)外醫(yī)療數(shù)據(jù)可視化研究的一條重要主線,在經(jīng)歷了早期的技術(shù)探索階段后,國(guó)外可視化人體研究的重心已經(jīng)轉(zhuǎn)移到人體模型或?qū)崟r(shí)計(jì)算機(jī)導(dǎo)航在臨床具體病變部位的輔助診斷治療應(yīng)用,應(yīng)用范圍包括器官、血管、神經(jīng)等,部位具體、實(shí)施精準(zhǔn)。國(guó)內(nèi)的可視化人體研究則主要應(yīng)用在傳統(tǒng)的解剖學(xué)展示層面,研究范圍相對(duì)寬泛?!吧镄畔W(xué)”主題在2017年作為重要突現(xiàn)主題得到了國(guó)內(nèi)研究者的廣泛關(guān)注,但在此之后這一內(nèi)涵豐富的主題并沒有得到充分的拓展研究,沒有出現(xiàn)與其相關(guān)的重要研究主題分支。而國(guó)外相關(guān)研究中圍繞“生物信息學(xué)”主題的研究已經(jīng)形成規(guī)模,占據(jù)了三個(gè)重要的聚類,許多生物信息學(xué)的熱門分支主題如蛋白質(zhì)互作網(wǎng)絡(luò)、WGCNA、基因本體等都有涉獵。
由此可見國(guó)內(nèi)的醫(yī)療數(shù)據(jù)可視化研究在主題挖掘上還有待進(jìn)一步深化、細(xì)化。應(yīng)對(duì)此類問題可以從兩方面著手:首先定位研究相對(duì)成熟、初具規(guī)模、且內(nèi)涵較為廣泛的主題概念,明確該研究主題的概念關(guān)系體系。其次,從該主題的分支中挑選當(dāng)下醫(yī)療健康領(lǐng)域切實(shí)關(guān)注的主題做為科研突破點(diǎn),選擇的核心目的是能夠解決有價(jià)值的現(xiàn)實(shí)問題。
4.2.3 研究思路相對(duì)傳統(tǒng),研究方式相對(duì)局限
大數(shù)據(jù)時(shí)代提供給我們前所未有的數(shù)據(jù)資源,醫(yī)療數(shù)據(jù)、移動(dòng)醫(yī)療健康數(shù)據(jù)、基因數(shù)據(jù)組成了醫(yī)療大數(shù)據(jù)的整體框架。目前我國(guó)醫(yī)療數(shù)據(jù)可視化應(yīng)用的數(shù)據(jù)來源集中于臨床影像資料、文獻(xiàn)數(shù)據(jù)庫(kù)和生物信息數(shù)據(jù)庫(kù),雖然研究深度在不斷提升、研究方法也在不斷精進(jìn),但在選取應(yīng)用場(chǎng)景和獲取數(shù)據(jù)資源上思路仍然比較傳統(tǒng),大部分研究多采用相似的數(shù)據(jù)挖掘方式,如相同的三維重建算法反復(fù)應(yīng)用于不同人體部位、文獻(xiàn)計(jì)量學(xué)等常規(guī)方法反復(fù)應(yīng)用于不同數(shù)據(jù)集。在短期內(nèi)雖涌現(xiàn)大量的研究文獻(xiàn)成果,但并不利于可視化研究的良性發(fā)展,從長(zhǎng)遠(yuǎn)角度來看我們更需要挖掘新類型數(shù)據(jù)、建立新算法以及研發(fā)應(yīng)用新軟件新設(shè)備,才能充分發(fā)揮科研的源動(dòng)力。另外,在醫(yī)學(xué)數(shù)據(jù)資源應(yīng)用的多元化上我們還有非常大的發(fā)展空間,在常用數(shù)據(jù)資源的基礎(chǔ)上,還可以嘗試?yán)靡苿?dòng)可穿戴醫(yī)療設(shè)備數(shù)據(jù)、多中心聯(lián)合醫(yī)療系統(tǒng)數(shù)據(jù)、醫(yī)療管理機(jī)構(gòu)數(shù)據(jù)等。
4.2.4 可視化研究成果形式有待豐富
可視化作為一類科學(xué)研究手段,在現(xiàn)有技術(shù)水平下已具備較為規(guī)范和系統(tǒng)的輸出模式:對(duì)于時(shí)空數(shù)據(jù)的可視化有空間標(biāo)量場(chǎng)可視化、大規(guī)模多變量空間數(shù)據(jù)場(chǎng)可視化和時(shí)變數(shù)據(jù)可視化等展示方式,而非時(shí)空數(shù)據(jù)的可視化包括層次和網(wǎng)絡(luò)數(shù)據(jù)可視化、文本和文檔可視化、跨媒體數(shù)據(jù)可視化和復(fù)雜高位多元數(shù)據(jù)的可視化[31]??v觀當(dāng)前國(guó)內(nèi)醫(yī)療數(shù)據(jù)可視化的研究,輸出方式主要以空間標(biāo)量場(chǎng)可視化、層次和網(wǎng)絡(luò)數(shù)據(jù)可視化以及文本和文檔可視化的形式出現(xiàn);具有時(shí)變維度的數(shù)據(jù)可視化方式也初現(xiàn)端倪,但尚未形成主流研究群體??傮w上可視化研究的方式上還有很大的提升和發(fā)展空間。醫(yī)療健康數(shù)據(jù)具備數(shù)據(jù)規(guī)模大,形式多樣,專業(yè)性強(qiáng)等特點(diǎn),具備被大規(guī)模、綜合性數(shù)據(jù)分析手段處理的條件,拓展多元維度、跨平臺(tái)、跨媒體的可視化分析方式是未來醫(yī)療數(shù)據(jù)可視化發(fā)展的大勢(shì)所趨,研究人員亟需學(xué)習(xí)如何更好的借助計(jì)算機(jī)及計(jì)算機(jī)網(wǎng)絡(luò)獲取高量級(jí)的醫(yī)療數(shù)據(jù)資源,并將其投入到大型綜合性可視化分析中的技能。
4.2.5 亟需多學(xué)科領(lǐng)域?qū)I(yè)人員的協(xié)同合作
縱觀當(dāng)前的醫(yī)療數(shù)據(jù)可視化研究的人員構(gòu)成,絕大多數(shù)研究出自臨床或其他某一專業(yè)科研人員之手。可視化不僅僅是工具,更是人類探求未知世界的媒介,是探索、呈現(xiàn)與表達(dá)數(shù)據(jù)含義的方法。醫(yī)療數(shù)據(jù)可視化的過程是一個(gè)連貫的整體過程,它不僅僅是將分散的現(xiàn)實(shí)數(shù)據(jù)聚集,并用圖像的方式陳列,優(yōu)質(zhì)的可視化成果應(yīng)該在數(shù)據(jù)分析的角度和呈現(xiàn)方式上經(jīng)過縝密的思維處理。往往這個(gè)過程需要多領(lǐng)域知識(shí)的相互助力,它是除了生物醫(yī)學(xué)外,融合了包括數(shù)學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、藝術(shù)設(shè)計(jì)等多學(xué)科智慧的結(jié)晶。美國(guó)的獨(dú)立研究者、藝術(shù)家 Justus Harris[32]就在2016年創(chuàng)立了基于藝術(shù)的糖尿病患者教育工具——MedSculp,該工具將圖表和圖形中的個(gè)人醫(yī)療數(shù)據(jù)轉(zhuǎn)換為可以直觀理解的平面設(shè)計(jì)和3D打印作品。這種直觀通俗的展示方式,對(duì)于患有糖尿病等慢性病的人去認(rèn)識(shí)和理解疾病來說至關(guān)重要。
打破傳統(tǒng)的專業(yè)知識(shí)屏障和學(xué)科禁錮,多專業(yè)領(lǐng)域的協(xié)同合作、多領(lǐng)域知識(shí)的融合將大大提高醫(yī)療數(shù)據(jù)可視化研究的輸出效率,為人類對(duì)醫(yī)學(xué)認(rèn)知提供更加客觀、全面、科學(xué)的幫助。
4.2.6 缺乏針對(duì)醫(yī)療數(shù)據(jù)特征的可視化理論體系
現(xiàn)代意義的可視化是計(jì)算機(jī)及其顯示方法與設(shè)備發(fā)展到一定階段后的新興技術(shù)[31],隨著應(yīng)用范圍的拓展和技術(shù)升級(jí),醫(yī)療數(shù)據(jù)可視化的內(nèi)涵也有了質(zhì)的飛躍。未來的醫(yī)療數(shù)據(jù)可視化的挑戰(zhàn)方向是“醫(yī)療大數(shù)據(jù)可視化”和“以人為中心的探索式可視分析”,醫(yī)療大數(shù)據(jù)具有專業(yè)性強(qiáng)、服務(wù)人群目標(biāo)明確、數(shù)據(jù)類型復(fù)雜,處理問題層級(jí)多等特點(diǎn)。在廣義可視化技術(shù)理論體系下,建立一套適應(yīng)醫(yī)療健康大數(shù)據(jù)特征的、相對(duì)完善的醫(yī)療數(shù)據(jù)可視化理論體系,無論對(duì)醫(yī)療健康數(shù)據(jù)的有效獲取、正確分析還是合理應(yīng)用都具有重要的指導(dǎo)意義。該理論體系應(yīng)緊緊圍繞“可視化對(duì)應(yīng)醫(yī)療數(shù)據(jù)和數(shù)據(jù)模型”和”開發(fā)有效的創(chuàng)建可視化的原理和技術(shù)“這兩個(gè)核心實(shí)質(zhì),解決“感知和認(rèn)知能力”“計(jì)算能力”“顯示能力”等可視化研究進(jìn)程中的思維和技術(shù)約束。
綜上,大數(shù)據(jù)時(shí)代下醫(yī)療數(shù)據(jù)可視化領(lǐng)域的研究從數(shù)據(jù)獲取、分析、挖掘、管理,到可視化成果的輸出、應(yīng)用都極具研究?jī)r(jià)值,每一個(gè)環(huán)節(jié)的都面臨著嚴(yán)峻的挑戰(zhàn)和無限可能。我國(guó)乃至全球關(guān)于醫(yī)療數(shù)據(jù)可視化的研究都存在諸多問題,本文管中窺豹,運(yùn)用科學(xué)計(jì)量和知識(shí)圖譜的方式發(fā)掘出其中一些相對(duì)突出的問題,希望能夠?yàn)橹铝τ卺t(yī)療數(shù)據(jù)可視化研究的學(xué)者們提供借鑒和參考,促進(jìn)醫(yī)療數(shù)據(jù)資源的高效利用。