管會生
(蘭州大學(xué) 信息科學(xué)與工程學(xué)院,甘肅 蘭州 730000)
因?yàn)橐咔榈木壒?,今年的國際護(hù)士節(jié)顯得十分特別,中國在此次的抗疫中也展示了中國廣大醫(yī)護(hù)人員救死扶傷的勇氣與擔(dān)當(dāng)。截至2019 年底,中國護(hù)士總數(shù)達(dá)到445 萬人;在4.26 萬名援鄂醫(yī)療隊員中,護(hù)士就有2.86 萬人,占援鄂人員總數(shù)的70%。
弗洛倫斯·南丁格爾(Florence Nightingale,1820.5.12—1910.8.13,享 年90 歲),1853 年 任倫敦慈善醫(yī)院的護(hù)士長,是護(hù)理專業(yè)的創(chuàng)始人和現(xiàn)代護(hù)理教育的奠基人。南丁格爾創(chuàng)辦的護(hù)士訓(xùn)練學(xué)校開辦了30 年,共培養(yǎng)了1 005 名學(xué)生,她們活躍在歐美各國,弘揚(yáng)著南丁格爾精神,國際上稱這個時期為“南丁格爾時代”(period of Nightingale)。1901 年,81 歲的南丁格爾因操勞過度,雙目失明,但仍繼續(xù)宣傳自己有關(guān)護(hù)理的思想和主張。1907 年,國際紅十字會設(shè)立南丁格爾獎(Nightingale Ward)。1912 年,國際護(hù)士會將南丁格爾的生日5 月12 日定為國際護(hù)士節(jié),并首次頒發(fā)南丁格爾獎。截止2019 年,南丁格爾獎已頒發(fā)47 屆(兩年一屆),世界各國共有超過1 400 名卓越護(hù)理人員獲獎。中國自1983 年首次參加第29 屆南丁格爾獎評選以來,共參加了19 屆評選,82 人獎獲;福建醫(yī)科大學(xué)護(hù)理學(xué)院院長李紅(2017 年當(dāng)選為美國護(hù)理科學(xué)院院士)就是中國的第82 位獲獎?wù)摺?/p>
通過數(shù)據(jù)研究規(guī)律、發(fā)現(xiàn)規(guī)律,貫穿了人類社會發(fā)展的始終。人類科學(xué)發(fā)展史上的不少進(jìn)步都和數(shù)據(jù)的采集分析直接相關(guān),如現(xiàn)代醫(yī)學(xué)流行病學(xué)的開端。
數(shù)據(jù)可視化是指將大型數(shù)據(jù)集或大型數(shù)據(jù)庫中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)(挖掘)其中未知信息的處理過程。最初,可視化技術(shù)被大量應(yīng)用于統(tǒng)計學(xué)領(lǐng)域,用來繪制統(tǒng)計圖表,如圓環(huán)圖、柱狀圖、餅圖、時間序列圖、等高線圖、散點(diǎn)圖等。20 世紀(jì)50 年代,隨著計算機(jī)的出現(xiàn)和計算機(jī)圖形學(xué)的發(fā)展,人們開始利用計算機(jī)技術(shù)在電腦屏幕上繪制各種圖形圖表,可視化技術(shù)開啟了全新的發(fā)展階段。進(jìn)入21 世紀(jì),數(shù)據(jù)可視化又被逐步應(yīng)用于地理信息系統(tǒng)(GIS)、數(shù)據(jù)挖掘與數(shù)據(jù)分析、商務(wù)智能工具等平臺中,有效促進(jìn)了人類對不同類型數(shù)據(jù)的分析與理解。隨著大數(shù)據(jù)時代的到來,每時每刻都有海量數(shù)據(jù)在不斷生成,需要我們對數(shù)據(jù)進(jìn)行及時、全面、快速、準(zhǔn)確的分析,以呈現(xiàn)數(shù)據(jù)背后的價值,這就更需要可視化技術(shù)協(xié)助我們更好地理解和分析數(shù)據(jù)。數(shù)據(jù)可視化已成為大數(shù)據(jù)分析最后的一環(huán)和對用戶而言最重要的一環(huán)。
數(shù)據(jù)可視化用于疫情監(jiān)控,可追溯到1854年倫敦發(fā)生的大規(guī)?;魜y。這次霍亂長時間得不到控制。后來John Snow 醫(yī)師用標(biāo)點(diǎn)地圖的方法,研究了當(dāng)?shù)厮植己突魜y患者分布之間的關(guān)系(如圖1 所示),發(fā)現(xiàn)在一口水井周圍,霍亂患病率明顯較高,借此找到了霍亂暴發(fā)的原因——被污染的水井。關(guān)閉這些水井后,霍亂發(fā)病率明顯開始下降,霍亂終于得以控制。此例成為現(xiàn)代醫(yī)學(xué)流行病學(xué)初創(chuàng)時期的首個案例,也是數(shù)據(jù)可視化這一研究方向的首個案例。
圖1 反映當(dāng)?shù)厮植己突魜y患者分布之間的關(guān)系圖
19 世紀(jì)計算機(jī)尚未出現(xiàn),因此沒有現(xiàn)在的數(shù)據(jù)可視化軟件。1857 年,為說服維多利亞女王改善英國軍隊醫(yī)院的醫(yī)療條件,南丁格爾特地設(shè)計了一張極坐標(biāo)下的圓形直方圖,也稱圓餅圖、玫瑰圖、“雞冠花圖”(Coxcomb diagram),用這張圖直觀傳達(dá)了1854 年4 月—1856 年3 月兩年間,每個月在克里米亞戰(zhàn)爭中死亡的士兵數(shù)量以及死亡原因,非常直觀簡潔地說明了在她管理的野戰(zhàn)醫(yī)院內(nèi),死亡率在不同季節(jié)的變化以及3 類死亡原因的占比,直觀明了、一目了然,如圖2[1]所示,以此揭示克里米亞戰(zhàn)地醫(yī)院真實(shí)的醫(yī)療環(huán)境與衛(wèi)生條件[2]。
這種極坐標(biāo)下的圓形直方圖,是1801 年威廉普萊費(fèi)爾發(fā)明的,在200 多年前這是一種非常新穎的數(shù)據(jù)展示形式,但由于繪制較難而沒有流行起來,直到1857 年南丁格爾繪制出這張“雞冠花圖”之后,才逐漸被人們熟知和接受。這張圖替代了原英國軍方準(zhǔn)備用幾萬文字描述的統(tǒng)計分析報告,結(jié)論就是:由于醫(yī)療衛(wèi)生條件太差,戰(zhàn)地醫(yī)院死于可預(yù)防傳染病的人數(shù)遠(yuǎn)遠(yuǎn)高于戰(zhàn)爭期間戰(zhàn)場上的直接傷亡人數(shù)。這是“雞冠花圖”在數(shù)據(jù)可視化領(lǐng)域最經(jīng)典、最實(shí)際的應(yīng)用案例,也是護(hù)理學(xué)科與數(shù)字學(xué)科相結(jié)合在發(fā)展初期的首個案例[2]。
圖2 南丁格爾繪制的“雞冠花圖”
1854 年—1856 年,英國、法國、土耳其等國與沙皇俄國爆發(fā)了克里米亞戰(zhàn)爭。當(dāng)時由于沒有護(hù)士護(hù)理傷病員,且戰(zhàn)地救護(hù)條件十分惡劣,英軍負(fù)傷士兵的死亡率竟高達(dá)42%。1854 年10月21 日,南丁格爾主動申請參加戰(zhàn)地救護(hù)工作,率領(lǐng)38 名優(yōu)秀護(hù)士奔赴克里米亞戰(zhàn)地醫(yī)院,并成為該院的護(hù)士長,由此開創(chuàng)了現(xiàn)代戰(zhàn)地護(hù)理事業(yè)。參戰(zhàn)士兵傷病員由于得到了及時認(rèn)真的醫(yī)療護(hù)理,在短短的半年時間內(nèi),傷病員的死亡率降至2.2%。南丁格爾在分析了大量傷亡資料檔案后,得出的驚人結(jié)論就是:“士兵死亡原因大多是因?yàn)楦腥炯膊∫约爸貍麊T得不到及時救護(hù)所致”[3]。這就是南丁格爾設(shè)計“雞冠花圖”的背景。
僅僅使用了一張圖,就充分展示并說明了所收集到的所有數(shù)據(jù)資料!一張圖的可視性、直觀性遠(yuǎn)遠(yuǎn)勝過了長篇大論的文字報告。后來世人稱南丁格爾為“數(shù)據(jù)可視化的先驅(qū)”,她被譽(yù)為“在統(tǒng)計的圖形顯示方法上,是一個真正的先驅(qū)”。1859 年,南丁格爾被選為英國皇家統(tǒng)計學(xué)會的第一個女成員,后來她還成為美國統(tǒng)計協(xié)會的名譽(yù)會員[3]。
2020 年疫情突發(fā)以來,央視新聞每天報道“多個省市區(qū)確診病例連續(xù)多日零新增”時(如圖3 所示),以及《人民日報》新媒體每天報道“新冠肺炎全球疫情形勢”時(如圖4 所示),數(shù)據(jù)統(tǒng)計結(jié)果的展示均采用的是我們久違了的“雞冠花圖”。
圖3 央視新聞每天報道“多個省市區(qū)確診病例連續(xù)多日零新增”數(shù)據(jù)
圖4 《人民日報》新媒體每天報道“新冠肺炎全球疫情形勢”數(shù)據(jù)
目前已有各類圖表軟件可以完成數(shù)據(jù)可視化的工作,效果很好。以2009—2019 年淘寶天貓雙十一11 年交易額對比表[1]為例,借助我們最熟悉的Excel 數(shù)字圖表功能,對同一組數(shù)據(jù)可繪制出瀑布圖、柱形圖和旭日圖3 種不同類型的數(shù)據(jù)圖表,如圖5 所示。從圖中可看到,雖然圖表類型不同,但是它們所揭示的“交易額發(fā)展趨勢”卻是相同的,直觀清晰、一目了然。圖表的繪制工作也非常簡單,從數(shù)據(jù)到圖表的展示,只需一鍵便可完成。有興趣的讀者可以試試Excel“插入”圖表的“推薦圖表”功能。
再以4 月27 日—5 月10 日兩周14 天來全球214 個國家與地區(qū)以及美國、中國疫情統(tǒng)計數(shù)據(jù)為例(見表1),采用Excel 中類型為“堆積面積圖”的數(shù)字圖表進(jìn)行數(shù)據(jù)可視化,數(shù)據(jù)分析的結(jié)果如圖6 所示。
圖5 2009—2019 年淘寶天貓雙十一交易額對比表及Excel 下的3 種數(shù)字圖表
表1 14 天全球214 個國家與地區(qū)以及美國、中國疫情數(shù)據(jù)統(tǒng)計對照表
圖6 4 月27 日—5 月10 日兩周內(nèi)全球214 個國家和地區(qū)與美國的疫情數(shù)據(jù)統(tǒng)計
從表1 可知,4 月27 日—5 月10 日兩周14天內(nèi),全球累計確診由300.28 萬升至405.14 萬,新增105 萬例;累計死亡新增73 575 例。美國累計確診由96.59 萬升至130.97 萬,新增34.38 萬例;累計死亡新增23 923 例。這14 天內(nèi),中國累計確診由84 341 例升至84 435 例,新增94 例;累計死亡新增“0”例。其實(shí),3 月10 日,武漢16 家方艙醫(yī)院就全部休艙了;3 月13 日,湖北新增疑似病例為“0”例;4 月26 日,武漢在院新冠肺炎患者清“0”。第一次感覺“關(guān)門大吉”這個詞是如此真切,第一次知道數(shù)字“0”是如此美好,歷此坎坷,記憶永存!
從圖6 中可以看出,全球214 個國家和地區(qū)的“新冠肺炎疫情形勢”與美國的疫情發(fā)展趨于一致。數(shù)據(jù)可以證明,美國作為超級大國,由于防控不當(dāng),這次確實(shí)“引領(lǐng)”了世界疫情蔓延的趨勢!
關(guān)注國際疫情的讀者一定對“據(jù)美國霍普金斯大學(xué)最新統(tǒng)計數(shù)據(jù)顯示......”這句話不陌生,因?yàn)檫@個風(fēng)靡全球的疫情數(shù)據(jù)可視化平臺——霍普金斯大學(xué)新冠病毒病例數(shù)據(jù),日訪問量平均為10 億次,最高曾達(dá)20 億次,在時效性、直觀性等方面超越了美國疾控中心(CDC),已成為全球權(quán)威信源。
霍普金斯大學(xué)的全球疫情數(shù)據(jù)可視化平臺如圖7 所示,除了各類統(tǒng)計數(shù)據(jù)的實(shí)時播報之外,還有依據(jù)214 個國家/地區(qū)的行政區(qū)劃圖,按確診病例人數(shù)標(biāo)注地圖(Map)并二維平面顯示的功能。該平臺的成功,一方面在于其數(shù)據(jù)更新及時,另一方面也因?yàn)槠鋬?yōu)秀的數(shù)據(jù)展示形式——交互式“儀表盤”(dashboard)。事實(shí)證明,這一數(shù)據(jù)可視化方式非常適合疫情監(jiān)控。不僅如此,目前該研究團(tuán)隊更重要的目標(biāo)是通過建立完善的數(shù)據(jù),進(jìn)而“模擬疫情動態(tài)、科學(xué)指導(dǎo)防疫”,讓我們看到了大數(shù)據(jù)應(yīng)用于疫情防控的真正曙光!
圖7 霍普金斯大學(xué)全球疫情數(shù)據(jù)可視化平臺
圖8 所示為新冠病毒感染人數(shù)超過30 000 例的國家排名,數(shù)據(jù)來源仍為美國約翰斯霍普金斯大學(xué)。
圖8 新冠病毒感染人數(shù)超過30 000 例國家排名
全球最具影響力的霍普金斯大學(xué)全球疫情數(shù)據(jù)可視化平臺——實(shí)時追蹤C(jī)OVID-19 的交互式網(wǎng)絡(luò)儀表盤,實(shí)質(zhì)上是第三方數(shù)據(jù)整合的項目,最初由霍普金斯大學(xué)系統(tǒng)科學(xué)與工程中心兩名中國博士生董恩盛和杜鴻儒主導(dǎo)。從1 月22 日“儀表盤”項目上線開始,平臺經(jīng)過不斷升級,兩個多月后成為今天的權(quán)威信源。“儀表盤”也可視為GIS 系統(tǒng)的典型應(yīng)用,其研發(fā)采用了ESRI 公司的ArcGIS 系列開發(fā)工具。ESRI 公司是業(yè)內(nèi)知名的地理信息系統(tǒng)(Geographical Information System,GIS)提供商。中國疾控中心就曾聯(lián)合ESRI 推出“新型冠狀病毒感染的肺炎疫情分布系統(tǒng)”,其功能與霍普金斯大學(xué)的“儀表盤”近似。眾所周知,GIS 可將地圖獨(dú)特的視覺效果和數(shù)據(jù)庫操作、地理分析功能集成在一起,已經(jīng)在城市規(guī)劃設(shè)計、地理水文、交通測繪、移動通訊、公共衛(wèi)生等很多行業(yè)得到了成功應(yīng)用,特別是結(jié)合病例統(tǒng)計數(shù)、時間和地理信息形成的疫情地圖,是GIS 系統(tǒng)非常生動的應(yīng)用。
靜態(tài)的Excel 圖表已使用近30 年了,社會現(xiàn)實(shí)中我們詮釋數(shù)據(jù)的方式和數(shù)據(jù)本身之間存在著巨大的鴻溝。想像閱讀書本一樣閱讀數(shù)據(jù)流,目前還只是IT 人追求的夢想,但使用數(shù)據(jù)可視化工具讀取識別和分析處理原始數(shù)據(jù),一定會成為未來信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展趨勢和工具模式。數(shù)據(jù)可視化領(lǐng)域未來將會融入更多更大的信息平臺,甚至完全建立在AI+VR+AR+Web3D(人工智能、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、3D 網(wǎng)頁和全息技術(shù))之上!
目前國內(nèi)外流行的大數(shù)據(jù)可視化工具和系統(tǒng)平臺很多,大多是既開源又專有的,并具有這些特征:能夠連接到其他軟件接收輸入數(shù)據(jù),能夠處理不同類型的傳入數(shù)據(jù),能夠在分析過程中與數(shù)據(jù)集進(jìn)行交互、應(yīng)用不同種類的過濾器調(diào)整結(jié)果,能夠?yàn)槠渌浖峁┹斎霐?shù)據(jù),如大數(shù)據(jù)可視化的一站式商店Jupyter、大數(shù)據(jù)和機(jī)器學(xué)習(xí)應(yīng)用可視化平臺Tableau AI 等。受篇幅所限,這里僅列舉普遍受到用戶認(rèn)可和歡迎的可視化工具軟件和系統(tǒng)平臺如下:
以上18 種可視化工具是大量在線或獨(dú)立的系統(tǒng)平臺和實(shí)用工具的一部分。使用這些工具可以幫助我們以更加優(yōu)雅的方式呈現(xiàn)數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為一系列清晰易懂的圖像圖表,甚至轉(zhuǎn)化為一段動漫演繹。原始數(shù)據(jù)本身可能看不出具有什么價值,但借助可視化所做的決策,幫助這些數(shù)據(jù)實(shí)現(xiàn)了其本身蘊(yùn)含的驅(qū)動價值!這,就是數(shù)據(jù)可視化的應(yīng)有之義。