劉郝
數(shù)據(jù),在疫情應(yīng)對(duì)中隨處可見。從疫情初期開始,最受公眾關(guān)注的信息之一就是疫情數(shù)據(jù)實(shí)時(shí)動(dòng)態(tài)。經(jīng)過(guò)可視化處理,疫情數(shù)據(jù)變成圖片,形成玫瑰花瓣圖等靜態(tài)圖片,或者以時(shí)間為軸的動(dòng)態(tài)圖片。經(jīng)由模型分析,疫情數(shù)據(jù)幫助預(yù)測(cè)疫情發(fā)展態(tài)勢(shì),成為決策的重要參考依據(jù)。
真實(shí)準(zhǔn)確的疫情數(shù)據(jù),是全球所有國(guó)家的共同追求。呈現(xiàn)基礎(chǔ)數(shù)據(jù),預(yù)測(cè)疫情趨勢(shì),形成疫情圖形,這些工作的關(guān)鍵都在于統(tǒng)計(jì)學(xué)。而實(shí)際上,現(xiàn)代統(tǒng)計(jì)學(xué)的起源之一就是對(duì)疾病的記錄與分析?!赌巷L(fēng)窗》記者專訪復(fù)旦大學(xué)管理學(xué)院統(tǒng)計(jì)學(xué)系副系主任、復(fù)旦大學(xué)復(fù)雜決策分析中心副主任肖志國(guó)教授。他認(rèn)為,統(tǒng)計(jì)學(xué)對(duì)疫情數(shù)據(jù)的收集、描述和分析,顯著提升了全球疫情防控的凝聚力和共識(shí)。
南風(fēng)窗:中國(guó)和世界范圍內(nèi)的疫情統(tǒng)計(jì)工作是何時(shí)起步的?
肖志國(guó):廣義的疫情統(tǒng)計(jì),在我國(guó)歷史很早就有。
20世紀(jì)初,我國(guó)的現(xiàn)代疫情統(tǒng)計(jì)開始發(fā)展。伍連德醫(yī)生被公認(rèn)為中國(guó)疫情統(tǒng)計(jì)事業(yè)開創(chuàng)者,他在1911年1-4月間領(lǐng)導(dǎo)撲滅了發(fā)生在東北的肺鼠疫大疫情。
世界范圍內(nèi),對(duì)疫情的系統(tǒng)統(tǒng)計(jì)和流行病學(xué)調(diào)查,大約起源于19世紀(jì)50年代,差不多是一個(gè)半世紀(jì)以前。主要發(fā)源是在克里米亞戰(zhàn)爭(zhēng)時(shí)期,南丁格爾對(duì)英國(guó)士兵傷亡原因的統(tǒng)計(jì)分析,以及斯諾醫(yī)生在同時(shí)間對(duì)倫敦霍亂的調(diào)查統(tǒng)計(jì)。南丁格爾在此后開創(chuàng)了現(xiàn)代的醫(yī)護(hù)體系,而斯諾醫(yī)生也被廣泛認(rèn)為是現(xiàn)代流行病學(xué)的創(chuàng)始人。
這次的新冠肺炎疫情統(tǒng)計(jì)工作,相比非典時(shí)期,我們又有一個(gè)質(zhì)的飛躍,這不僅是因?yàn)榧夹g(shù)本身的提高,也是因?yàn)榭陀^上此次新冠病毒的傳染性更強(qiáng),就要求我們建立一個(gè)更強(qiáng)大的疫情監(jiān)控和統(tǒng)計(jì)體系。
南風(fēng)窗:我們已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)在新冠肺炎這種突發(fā)重大新型疫情面前,可以提供哪些幫助?
肖志國(guó):統(tǒng)計(jì)學(xué)是一門以數(shù)據(jù)分析為基礎(chǔ)提出解決方案的學(xué)科。黨的十九屆四中全會(huì)提出數(shù)據(jù)是社會(huì)生產(chǎn)的基本要素之一。這一次,我們同樣要用統(tǒng)計(jì)學(xué)來(lái)開發(fā)和利用好各種疫情數(shù)據(jù)。
首先,統(tǒng)計(jì)學(xué)可以幫助社會(huì)準(zhǔn)確客觀地判斷疫情現(xiàn)狀。這里講到的現(xiàn)狀是多方面的,最基本是與疫情直接相關(guān)的統(tǒng)計(jì)數(shù)字。進(jìn)一步講,也可以利用統(tǒng)計(jì)學(xué)作出對(duì)于疾病機(jī)理的一些核心判斷,比如病毒潛伏期有多長(zhǎng),各種傳播方式的可能性等等。一定意義上說(shuō),流行病學(xué)家的工作就是在對(duì)疫情數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,找出疫情傳播的核心特征和規(guī)律。所以流行病學(xué)家可以看作是研究疾病規(guī)律的統(tǒng)計(jì)學(xué)家。我的博士論文兩位導(dǎo)師之一就是一位流行病學(xué)家。
第二點(diǎn)體現(xiàn)在對(duì)疫情未來(lái)發(fā)展趨勢(shì)的判斷上。比如,疫情什么時(shí)候出現(xiàn)拐點(diǎn),何時(shí)結(jié)束,最終會(huì)有多少感染人數(shù)和死亡人數(shù)等。這不是隨便猜出來(lái)的,而是經(jīng)過(guò)科學(xué)系統(tǒng)的統(tǒng)計(jì)學(xué)模型判斷出來(lái)的。這一點(diǎn),不僅是全球公眾的關(guān)心所在,也是各國(guó)決策機(jī)構(gòu)的重要參考依據(jù)。
最后一點(diǎn),可能一般公眾未必了解,那就是藥物和疫苗研發(fā)非常依賴統(tǒng)計(jì)學(xué)。事實(shí)上,一直以來(lái),醫(yī)藥行業(yè)是統(tǒng)計(jì)學(xué)人才的主流就業(yè)去向之一。無(wú)論是治療藥物還是疫苗,在不同個(gè)體身上的效果都可能存在較大差異,為了弄清楚藥物或者疫苗是否有效,就要考慮所有可能會(huì)影響到療效的因素。這時(shí)候,我們就要通過(guò)試驗(yàn)來(lái)作判斷。統(tǒng)計(jì)學(xué)有一門課程叫作臨床試驗(yàn),講的就是這個(gè)問(wèn)題。任何藥物和疫苗,它的顯著性最終都必須經(jīng)過(guò)統(tǒng)計(jì)學(xué)的實(shí)證分析。
南風(fēng)窗:總體來(lái)說(shuō),國(guó)內(nèi)統(tǒng)計(jì)學(xué)科研團(tuán)隊(duì)對(duì)此次疫情作了哪些方面的研究分析?國(guó)內(nèi)第三方獨(dú)立從事疫情數(shù)據(jù)收集和分析的研究機(jī)構(gòu)數(shù)量如何?
肖志國(guó):在我的印象中,疫情早期,就有一些研究機(jī)構(gòu)在預(yù)測(cè)疫情走勢(shì),影響較大的團(tuán)隊(duì)是香港大學(xué)醫(yī)學(xué)院研究團(tuán)隊(duì)。
現(xiàn)在,在疫情預(yù)測(cè)方面,北京大學(xué)多個(gè)團(tuán)隊(duì)都對(duì)病毒的潛伏期及未來(lái)走勢(shì)提出了很多新穎的判斷。復(fù)旦大學(xué)包括張文宏醫(yī)生所在的華山醫(yī)院感染科在內(nèi),也有很多團(tuán)隊(duì)在做這方面的研究。3月15日,5000余名統(tǒng)計(jì)學(xué)專家學(xué)者舉辦了“科學(xué)抗疫,統(tǒng)計(jì)擔(dān)當(dāng)”的全國(guó)線上會(huì)議,圍繞疫情監(jiān)控、疫情傳播規(guī)律挖掘、防控信息統(tǒng)計(jì)和經(jīng)濟(jì)運(yùn)行等話題展開研討。
人的行為,尤其是實(shí)施管制之后,人們對(duì)規(guī)則的遵守情況,是很難準(zhǔn)確刻畫的,這是導(dǎo)致預(yù)測(cè)出現(xiàn)問(wèn)題的一個(gè)主要因素。這也是為什么在世界范圍內(nèi),模型預(yù)測(cè)都受到實(shí)際工作者質(zhì)疑和批評(píng)的一個(gè)原因。
從歷史上來(lái)看,國(guó)內(nèi)做疫情歷史數(shù)據(jù)整理和分析的機(jī)構(gòu)是很多的。不過(guò)我的感受是,因?yàn)榻陙?lái)大規(guī)模高烈度的傳染病疫情越來(lái)越少,這方面的研究人員和研究機(jī)構(gòu)也隨之減少了。所以張文宏醫(yī)生也說(shuō)他大部分時(shí)間在坐冷板凳。
南風(fēng)窗:疫情初期,國(guó)外不少研究機(jī)構(gòu)對(duì)中國(guó)疫情發(fā)展作出預(yù)測(cè),現(xiàn)在則主要在預(yù)測(cè)全球疫情發(fā)展態(tài)勢(shì),影響這種預(yù)測(cè)準(zhǔn)確性的因素是什么?
肖志國(guó):所有的預(yù)測(cè)都是基于某種模型。簡(jiǎn)單來(lái)講,模型就是研究者所假定的疫情傳播的原理,它們的參數(shù)需要通過(guò)歷史數(shù)據(jù)來(lái)進(jìn)行估算。
影響預(yù)測(cè)準(zhǔn)確性的因素首先是模型假設(shè)的合理性。任何模型都是對(duì)現(xiàn)實(shí)的一個(gè)簡(jiǎn)化,而且很可能是過(guò)度的簡(jiǎn)化。而這當(dāng)中,人的行為,尤其是實(shí)施管制之后,人們對(duì)規(guī)則的遵守情況,是很難準(zhǔn)確刻畫的,這是導(dǎo)致預(yù)測(cè)出現(xiàn)問(wèn)題的一個(gè)主要因素。這也是為什么在世界范圍內(nèi),模型預(yù)測(cè)都受到實(shí)際工作者質(zhì)疑和批評(píng)的一個(gè)原因。包括美國(guó)政府現(xiàn)在決策所主要依賴的IHME模型,最近也受到廣泛的批評(píng),理由就是它顯著低估了疫情的嚴(yán)重程度。一個(gè)悖論在于,模型必須要簡(jiǎn)化現(xiàn)實(shí)才能夠產(chǎn)生,但它遭受批評(píng)也是因?yàn)楹?jiǎn)化現(xiàn)實(shí)。
影響預(yù)測(cè)準(zhǔn)確性的另一個(gè)因素是數(shù)據(jù)的準(zhǔn)確性。對(duì)任何一個(gè)國(guó)家而言,在有限的時(shí)間內(nèi)進(jìn)行大規(guī)模的病毒檢測(cè),同時(shí)要保證檢測(cè)結(jié)果的準(zhǔn)確性,這都是一件非常難的事情。哥倫比亞大學(xué)新冠病毒預(yù)測(cè)模型的作者沙曼教授對(duì)此作了很精煉的總結(jié):“預(yù)測(cè)的困難在于,疫情局勢(shì)變化極其迅速,而我們可用的信息又是悲催的不完整。”
更關(guān)鍵的是,疫情局勢(shì)時(shí)刻千變?nèi)f化,這就導(dǎo)致模型很難跟得上現(xiàn)實(shí)的腳步,數(shù)據(jù)和信息很難準(zhǔn)確完整。所以我認(rèn)為,模型是重要的參考依據(jù),但它的準(zhǔn)確性不是百分之百的。實(shí)際所能預(yù)測(cè)到的通常也只能是近期相對(duì)較短的一段時(shí)間,比如也就是幾天之內(nèi)的情況。推測(cè)時(shí)間越遠(yuǎn),可靠性就越要打折扣。
南風(fēng)窗:讓人感到新穎的是,此次疫情期間,國(guó)內(nèi)外相關(guān)機(jī)構(gòu)都對(duì)疫情數(shù)據(jù)做出了一系列可視化呈現(xiàn),它們的生產(chǎn)和傳播過(guò)程是怎樣的?
肖志國(guó):海量信息面前,要提升公眾對(duì)疫情的認(rèn)知,不僅需要準(zhǔn)確及時(shí)的疫情數(shù)據(jù)統(tǒng)計(jì),還應(yīng)該有新穎的數(shù)據(jù)描述方式。一個(gè)簡(jiǎn)潔明了而且結(jié)論清晰的圖形,尤其是當(dāng)它的呈現(xiàn)形式相當(dāng)特別的時(shí)候,就很容易受到廣泛傳播而形成防控共識(shí)。
比如,在國(guó)內(nèi),丁香醫(yī)生網(wǎng)站的疫情數(shù)據(jù)實(shí)時(shí)動(dòng)態(tài),迄今為止已經(jīng)有超過(guò)40億次的瀏覽量。人民日?qǐng)?bào)推出的一系列新型玫瑰花瓣圖也受到廣泛關(guān)注,這是南丁格爾圖形的現(xiàn)代版。
在全球疫情數(shù)據(jù)呈現(xiàn)方面,美國(guó)約翰·霍普金斯大學(xué)開發(fā)的數(shù)據(jù)以及疫情分布圖,現(xiàn)在平均每天點(diǎn)擊次數(shù)近10億次,它的核心圖形也是斯諾的霍亂分布地圖的現(xiàn)代版。
在這個(gè)過(guò)程中,第三方研究機(jī)構(gòu)往往不可或缺,而媒體則是一個(gè)關(guān)鍵的傳播平臺(tái)?,F(xiàn)在,公眾能夠接觸到的疫情數(shù)據(jù)平臺(tái)非常多。無(wú)論是人民日?qǐng)?bào)、丁香醫(yī)生,或者是支付寶、微信和主流新聞網(wǎng)站,這些平臺(tái)都是可信的,因?yàn)榇篌w上的數(shù)據(jù)來(lái)源都是一致的。
南風(fēng)窗:在目前的疫情發(fā)展態(tài)勢(shì)下,疫情數(shù)據(jù)的統(tǒng)計(jì)分析應(yīng)該去關(guān)注哪些方面的問(wèn)題?
肖志國(guó):當(dāng)前階段,國(guó)內(nèi)的疫情已經(jīng)得到有效控制,但國(guó)際上還在迅速蔓延,截至4月28日11時(shí),全球確診病例已經(jīng)突破306萬(wàn)。我們現(xiàn)在要對(duì)未來(lái)做好充分準(zhǔn)備。
未來(lái)疫情數(shù)據(jù)分析的重點(diǎn),是對(duì)此次疫情一些根本問(wèn)題的準(zhǔn)確判斷。比如說(shuō),這個(gè)病毒的傳播系數(shù)(R0)是多少,病毒的潛伏期服從何種分布,無(wú)癥狀感染者的比例是多少,感染者中的死亡比例是多少等等,以及這些因素是否會(huì)隨其他因素(比如說(shuō)年齡、性別、氣溫等等)變化而變化,這些都是很關(guān)鍵的問(wèn)題。我們已經(jīng)積累了幾百萬(wàn)病例的數(shù)據(jù),但可惜的是,國(guó)際社會(huì)目前對(duì)這些問(wèn)題還沒有得到一致可信的結(jié)論。希望后期的研究分析能夠?qū)@些問(wèn)題有更加科學(xué)的回答。
南風(fēng)窗:在疫情數(shù)據(jù)收集中,互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)手段等科技提供了哪些幫助?這些手段和個(gè)人隱私權(quán)是否會(huì)形成一定沖突?
肖志國(guó):舉個(gè)例子。我們打開支付寶等軟件,幾乎不需要回答任何問(wèn)題,就可以查到自己的健康碼狀態(tài)。這大大方便了公眾在疫情期間的出行。這說(shuō)明,一些技術(shù)平臺(tái)對(duì)公眾的健康狀態(tài)是非常清楚的。如果是作為疫情防控等公共利益的需要,那么我們就應(yīng)該理解,通過(guò)技術(shù)手段收集私人信息不應(yīng)該和個(gè)人隱私保護(hù)對(duì)立起來(lái)。當(dāng)然,前提是這些技術(shù)行為都是得到公眾授權(quán)的,并且雙方明確它的使用途徑和目的。實(shí)際上,我認(rèn)為通過(guò)技術(shù)手段收集任何信息,首先都必須獲得用戶的知情和授權(quán)。
我們已經(jīng)積累了幾百萬(wàn)病例的數(shù)據(jù),但可惜的是,國(guó)際社會(huì)目前對(duì)這些問(wèn)題還沒有得到一致可信的結(jié)論。希望后期的研究分析能夠?qū)@些問(wèn)題有更加科學(xué)的回答。
南風(fēng)窗:你認(rèn)為,在各類型的疫情數(shù)據(jù)統(tǒng)計(jì)工作中,公眾應(yīng)當(dāng)樹立哪些意識(shí)?可以做哪些工作?
肖志國(guó):首先,任何公眾都要積極配合疫情的統(tǒng)計(jì),包括相關(guān)流行病學(xué)的調(diào)查和檢測(cè)等工作。應(yīng)該意識(shí)到,真實(shí)準(zhǔn)確的數(shù)據(jù)信息是一個(gè)公共產(chǎn)品,對(duì)全社會(huì)都有好處。當(dāng)前,疫情在我國(guó)的傳播已經(jīng)得到了有效的控制,但無(wú)論是境外輸入還是本地傳播,在局部地區(qū)還偶有發(fā)生。因此對(duì)于已發(fā)病例的流行病學(xué)調(diào)查,以及在重點(diǎn)地區(qū)的人群中進(jìn)行一定比例的隨機(jī)抽樣調(diào)查,都很有必要。這需要每個(gè)人的積極配合。
其次,當(dāng)自身出現(xiàn)較高概率的被傳染風(fēng)險(xiǎn)時(shí),要及時(shí)就醫(yī),并將相關(guān)情況如實(shí)匯報(bào)給疫情數(shù)據(jù)統(tǒng)計(jì)部門。同時(shí),每個(gè)人都要繼續(xù)保持良好的衛(wèi)生習(xí)慣,做好防護(hù)措施,并對(duì)任何信息保持客觀理性的判斷。
南風(fēng)窗:武漢市4 月17 日訂正新冠肺炎確診病例數(shù)、確診病例死亡數(shù),在疫情數(shù)據(jù)統(tǒng)計(jì)中,我們?cè)鯓硬拍茏龅礁诱鎸?shí)準(zhǔn)確?
肖志國(guó):回過(guò)頭來(lái)看,這是一個(gè)前所未有的疫情,全世界對(duì)它的準(zhǔn)備和應(yīng)對(duì)都存在很多可以改進(jìn)的地方。典型的問(wèn)題之一是在初期低估了它的嚴(yán)重性。只有在疫情真正可防可控的早期或者晚期階段,準(zhǔn)確的數(shù)據(jù)統(tǒng)計(jì)才是有可能實(shí)現(xiàn)的。為什么這么說(shuō)呢?因?yàn)楦镜霓k法是進(jìn)行大規(guī)模人群的動(dòng)態(tài)抽樣檢測(cè)和追蹤。但整個(gè)疫情是迅速傳播開來(lái)的態(tài)勢(shì),由于傳播途徑的復(fù)雜性,癥狀表現(xiàn)形式的多樣性,以及檢測(cè)手段的不完善等問(wèn)題,這時(shí)再想進(jìn)行準(zhǔn)確的統(tǒng)計(jì),成本就極其高昂。我們獲得嚴(yán)格意義上的真實(shí)準(zhǔn)確數(shù)據(jù)幾乎是不可能的。
要想實(shí)現(xiàn)疫情數(shù)據(jù)的更加真實(shí)準(zhǔn)確,首先要防止各種原因的瞞報(bào)。其次流行病學(xué)調(diào)查要迅速,在最快時(shí)間內(nèi)找到病毒傳播路徑和密切接觸者。在這些顯性案例之外,還要注意篩查各種隱形案例,例如注意復(fù)工復(fù)學(xué)人群的檢測(cè)以及隨機(jī)的抽樣檢測(cè)等工作。
總的來(lái)說(shuō),這需要各個(gè)部門的通力合作,尤其要發(fā)揮我們網(wǎng)格化管理的力量。所有的病例都有他的物理落腳點(diǎn),包括社區(qū)、交通工具、出入境場(chǎng)所等公共場(chǎng)所以及醫(yī)院和醫(yī)學(xué)隔離觀察點(diǎn)等。做好疫情監(jiān)控和數(shù)據(jù)統(tǒng)計(jì),在理論上我們需要所有關(guān)鍵節(jié)點(diǎn)單位的通力合作,尤其是社區(qū)居委會(huì)、檢測(cè)機(jī)構(gòu)、隔離場(chǎng)所和醫(yī)院的密切合作。