李大偉
(上海立信會計金融學院統(tǒng)計與數(shù)學學院 上海 201620)
2019年12月,一場突如其來的新型冠狀病毒肺炎(COVID-19)疫情打破了我們平靜的生活,隨后迅速席卷全球。時至今天,已有數(shù)百萬人死于新冠病毒。新冠疫情的爆發(fā)嚴重影響了人們的工作、學習、生活以及健康,對全球經(jīng)濟以及世界格局更是產(chǎn)生了無法估量的影響。新冠肺炎作為一種急性呼吸道傳染病,研究它的發(fā)生、發(fā)展、診斷、預防以及治療等方面能夠幫助我們抓住疾病的薄弱環(huán)節(jié),采取有效的措施,達到更好的防控效果。本文我們將從概率論與數(shù)理統(tǒng)計的角度對新冠疫情中的一些問題進行分析與研究。
潛伏期,是一般疾病在發(fā)展過程中的一定階段,這一階段是從致病刺激物侵入機體或?qū)C體發(fā)生作用起,到機體出現(xiàn)反應或開始呈現(xiàn)癥狀時止。不同傳染病的潛伏期時間不同,同一種傳染病在不同個體之間的潛伏期也是不同的。很多疾病在潛伏期的某個節(jié)點開始都是具有傳染性的,而不是等潛伏期結束了才具有傳染性。潛伏期是傳染病的重要傳播動力學參數(shù)之一,是確定檢疫(包括醫(yī)學觀察、留驗和集體檢疫)時間的重要依據(jù),在制定傳染病防控策略與措施、評價防控措施效果及預測流行趨勢中均具有重要意義[1]。
新冠疫情暴發(fā)初期,專家們通過對部分病例進行跟蹤分析與研究。根據(jù)收集到的數(shù)據(jù)做出一條曲線,確定95%的置信區(qū)間,然后經(jīng)過反復試驗和觀察確定最長的時間間隔是14天,從而把隔離期定為14天。對于傳染病的潛伏期,常見的分布有對數(shù)正態(tài)分布(Log-normal)、伽馬分布(Gamma)和韋伯分布(Weibull)[2-4]。杜志成等[5]利用區(qū)間刪失數(shù)據(jù)估計方法,通過比較Log-normal、Gamma和Weibull分布,對新冠肺炎的潛伏期分布進行估計,得到Gamma分布具有較大的對數(shù)似然函數(shù)值,從而得出Gamma分布可能是COVID-19潛伏期的最優(yōu)分布,潛伏期M=5.064(P25~P75:3.489~7.304)天。從概率論與數(shù)理統(tǒng)計角度證明了把新冠隔離期定為14天是合理的。
雖然混合檢測法可以更高效的獲取檢測結果,但是要把多少個樣本混合在一起進行檢測也是我們需要考慮的一個重要問題。嚴加安院士在“概率破玄機,統(tǒng)計解迷離”中提到,假設已知人群的患病率為p,要對N個樣本進行混合檢測時,通過概率計算可得平均檢測總次數(shù)為N/k[qk+(k+1)(1-qk)],其中q=1-p,k代表每組混合的樣本數(shù)量,從而我們可以通過計算機確定最佳的k值。李榕[8]同樣從概率論角度對混合檢測的樣本數(shù)量進行了分析,得出當把10個樣本放在一起進行檢測時的效果最好,而實際上武漢部分區(qū)域正是一次性將10個樣本放在一起進行了混合檢測。
例1. 根據(jù)醫(yī)學數(shù)據(jù)分析,假設某次新冠肺炎核酸檢測以95%的概率將新冠患者檢查出呈陽性,但也有2%的概率誤將非新冠患者檢查出呈陽性(“假陽性”)。若某一特殊群體患新冠肺炎的概率為0.05%,求
(1)其中一個個體新冠病毒核酸檢測結果為陽性的條件下,他確實患病的概率(確診率)是多少?
(2)如果“假陽性”的概率降為0.2%,0.02%和0時,確診率如何變化?
(3)重復檢測能否提高確診率?
解:記A={核酸檢查結果為陽性},B={檢查者患新冠肺炎},
已知P(B)=0.0005
P(A|B)=0.95
根據(jù)貝葉斯公式可得
因此,一次檢測結果為陽性的條件下,實際患病的概率僅為2.32%。
也是非常高的(一般診斷價值LR>20就認為很高了),但是此處P(B|A)的值卻很小,這是為什么呢?其實主要原因就是因為新冠的患病率P(B)=0.0005遠小于檢測錯誤率。針對此處情形,通常會進行多次獨立重復的復查。
(3)在(1)中我們得到即使核酸檢測結果是陽性,實際患病率僅為2.32%。
針對此種情形,我們通常會進行多次獨立重復的復查。設Ai={第i次核酸檢查結果為陽性},i=1,2,3, ..., n。此時由貝葉斯公式可得
即兩次核酸檢測都是陽性者,患新冠的可能性為53.02%,相對于第一次檢測,準確性提高了接近23倍。如果我們繼續(xù)做第三次檢測,此時P(B|A1A2A3)≈0.9817。由此可見,若三次核酸檢測都是陽性,患新冠的可能性就非常大了。當然,因為這里題目中都是一些假設的數(shù)據(jù),與實際情況可能會存在一些差距,但是根據(jù)上述理論分析我們可知,一次核酸檢測陽性并不能說明一定患病,通常需要經(jīng)過多次獨立重復檢測,并配合一些其他項目的檢查,才能最終做出判斷。
自疫情暴發(fā)以來,為了有效的控制疫情,遏制疫情的蔓延,各國都在努力研發(fā)新冠疫苗以及治療藥物。任何一種新藥從研發(fā)到投產(chǎn),中間都要經(jīng)過許多的試驗和評估等措施,接下來我們從概率論角度對藥物療效相關問題做簡單分析。
例 2. 假設新冠患者自然痊愈率為0.3,醫(yī)院檢查員任意抽查100名注射某種疫苗的患者。根據(jù)相關部門規(guī)定,如果治愈患者數(shù)超過75人,則判定疫苗是有效的;否則,判定疫苗無效。試求
(1) 疫苗治愈率為0.8,但被判定無效的概率是多少?
(2) 疫苗無效,但被判定有效的概率是多少?
解:設X={治愈患者數(shù)},由題意知
(1)當疫苗治愈率為0.8時,根據(jù)題意分析可知,如果實際治愈患者人數(shù)不超過75人,則被判定為無效,此時概率為
(2)疫苗無效,此時的治愈率為自然痊愈率0.3,根據(jù)題意分析可知,如果實際治愈患者人數(shù)超過75人,則被判定有效,此時概率為
綜上所述,概率論與數(shù)理統(tǒng)計在醫(yī)學中具有非常廣泛的應用。本文我們主要以新冠肺炎為例,從概率論與數(shù)理統(tǒng)計的角度對其中的相關應用做了簡單介紹。期望通過這些理論分析,可以幫助我們采取更高效的措施去防控疫情。