侯雅文 陳慧林 陳 征△
【提 要】 目的 研究傳染性疾病致命性參數(shù)病死率的估計,特別是有多個風(fēng)險因素存在時,不同分組下的病死率估計以及風(fēng)險因素篩選問題。方法 基于競爭風(fēng)險理論建立病死率估計回歸模型,通過輪廓似然等技術(shù)估計模型參數(shù)。結(jié)果 將該回歸模型應(yīng)用于2013年H7N9禽流感數(shù)據(jù)分析,估計不同風(fēng)險因素下的病死率,并通過BICcr準(zhǔn)則發(fā)現(xiàn)性別間沒有差異,而高年齡(60歲為界)組是一個有意義的風(fēng)險因素。結(jié)論 本文介紹的病死率估計回歸模型除了可以直接估計病死率值外,也能進(jìn)行相關(guān)風(fēng)險因素的甄別。
近十幾年,SARS、甲型H1N1流感、人感染H7N9禽流感和埃博拉等,新型或再發(fā)嚴(yán)重傳染病對全球社會產(chǎn)生嚴(yán)重影響。在傳染病爆發(fā)的初期,公眾和管理者迫切需要知道的問題是:這種疾病是否嚴(yán)重?哪類人群被傳染后危險性更大?等等。對于像上述大范圍流行的傳染病,體現(xiàn)它們致命程度最直接的一個數(shù)量指標(biāo)就是病死率(case fatality risk)[1-2]。哪些人群是易感人群或者患病后危險性更大,通過對影響病死率的危險因素(協(xié)變量)的分析均可發(fā)現(xiàn)[3]。當(dāng)像SARS、H7N9這樣的傳染性疾病處在疫情的初期時,我們對它幾乎一無所知,但如果能根據(jù)有限的不完整數(shù)據(jù),去評估它的病死率及其危險因素,可為公共安全策略的制定、醫(yī)療救治工作的調(diào)整以及衛(wèi)生資源的分配等提供有力的科學(xué)信息和幫助,從而及時、有效地控制疫情的發(fā)展。
在疫情初期病死率的研究中,根據(jù)數(shù)據(jù)類型的不同將方法分為兩大類,一種是基于匯總數(shù)據(jù),朱亞楠[4]和Lu[2]對該類方法進(jìn)行了系統(tǒng)的綜合分析,此類方法的優(yōu)點(diǎn)之一是數(shù)據(jù)獲得快捷、簡單,結(jié)果估計也較精確,但無法發(fā)現(xiàn)其相應(yīng)的危險因素。另外一種是包含患者生存時間、一些協(xié)變量(在這里可作為疾病的危險因素處理)的個體數(shù)據(jù)(individual data),如Jewell等的研究[5-6],但它們均未將協(xié)變量直接納入到模型中。本研究根據(jù)陳征[7]和韓棟[8]的方法,基于個體型數(shù)據(jù),將協(xié)變量納入模型,給出一種帶有協(xié)變量的病死率估計回歸模型。
假設(shè)H7N9患者在某個時間點(diǎn)t有三種可能的結(jié)果:由H7N9導(dǎo)致死亡、治愈康復(fù)和繼續(xù)接受治療(持續(xù)發(fā)病中)。其中,死亡和治愈可以被考慮作為兩個競爭風(fēng)險(competing risks)型終點(diǎn)事件[10],而繼續(xù)接受治療的患者可以被當(dāng)做右刪失。令J是一個二元隨機(jī)變量:J=1表示死亡和J=2表示治愈。Tj(≥0),j=1或2,指直到j(luò)型終點(diǎn)事件發(fā)生的生存時間,C為右刪失時間,則T=min(T1,T2,C)被定義為生存時間。對于個體型數(shù)據(jù),假定每日的記錄為一個結(jié)點(diǎn),則本研究將組建一個離散的生存時間模型。令ti為離散的生存時間,t1 在時間點(diǎn)t的總生存率和第j型風(fēng)險率函數(shù)分別被定義為S(t,Z)=Pr(T≥t|Z)和 hj(t,Z)=Pr(T=t,J=j|T≥t,Z),j=1,2, (1) H(t,Z)=h2(t,Z)/h1(t,Z) (2) 根據(jù)Chen[9]、Lam[10]和Tuite[6]等的研究,假如比率H(t,Z)是一個與時間獨(dú)立的量,也就是H(t,Z)≡H(Z),然后帶有協(xié)變量的病死率計算式可寫為p1(Z)=(1+H(Z))-1。 數(shù)式(1)對應(yīng)的原因別風(fēng)險率回歸模型為: (3) 對于進(jìn)入觀察的每一名患者(如第k個患者),都有以下信息被記錄:(τk,δk,jk,Zk), 其中τk表示從進(jìn)入觀察到事件或右刪失發(fā)生的時間;jk表示事件的類型或右刪失(jk=1為死亡,2為康復(fù),0為右刪失);Zk表示協(xié)變量向量;令δ1k=I[jk=1],δ2k=I[jk=2],這里假如“[ ]”內(nèi)為真時,I[ ]值為1,否則為0。第k個患者的似然Lk是:假如jk=j≠ 0,Lk=fj(τk,Zk),假如jk= 0,Lk=S(τk,Zk),然后總的似然L為: 改變累乘的方式,由患者個體k(k= 1, 2, …,n)到離散時間i(i= 1, 2, …,s), 其中Rji={k|τk=ti,δjk=1}表示在ti時刻發(fā)生j型終點(diǎn)事件的個體集合,Ri表示在ti時刻被觀察個體(at risk)的集合,Δji表示Rji中的患者個數(shù),j=1,2,i=1,…,s。 將h10(ti)記為h10i,然后有 (4) 為了方便計算,令β0=logH0,然后 利用上述模型分析2013年春季在中國大陸爆發(fā)的人感染H7N9禽流感,本研究收集到疫情初期,經(jīng)過確診的103例患者生存數(shù)據(jù),包含年齡和性別信息(表1),截止2013年5月22日由H7N9禽流感導(dǎo)致死亡者數(shù)為23例,治愈者數(shù)為30例,其余50例繼續(xù)接受治療,即右刪失(刪失率48.54%)。首先,將年齡和性別兩個風(fēng)險因素同時納入模型得到四個分組的病死率估計值(表2);其次,通過競爭風(fēng)險下的BIC(BICcr)準(zhǔn)則[11]對兩個變量篩選后,只保留年齡分組;最后,僅對年齡作分析,得到兩個年齡組分別的病死率估計值(表3),發(fā)現(xiàn)相對年齡大于60歲是一個危險因素。 表1 H7N9患者的年齡和性別基本信息 表2 同時納入年齡和性別的協(xié)變量病死率估計值 表3 僅納入年齡的病死率估計值 無論是前面介紹的基于匯總數(shù)據(jù)還是個體性數(shù)據(jù)的病死率估計方法,均是針對一個總?cè)巳旱?。眾所周知,即使是同一個疫情,不同的人群(比如年齡)的病死率也可能不同,若只是拿總體的一個數(shù)值來衡量未必能準(zhǔn)確反映疫情狀況,另外鑒別或找出有意義的風(fēng)險因素也是重要的研究任務(wù)。針對H7N9的疫情數(shù)據(jù)分析,結(jié)合BICcr準(zhǔn)則和本文的方法發(fā)現(xiàn)性別因素對病死率的結(jié)果影響不大,而年齡因素對病死率的結(jié)果有較大的影響(小于60歲病死率大于30%,而大于等于60歲病死率高于60%)。該結(jié)果說明疫情策略制定時,不能只是根據(jù)一個整體的病死率來采取相同的措施,應(yīng)該針對不同的人群采取不同的措施,達(dá)到方案最優(yōu)化,避免造成資源的浪費(fèi)以及不必要的人員傷害。表3中不同協(xié)變量下的病死率95%可信區(qū)間(CI)范圍較大,其原因可能是由于本實(shí)例分析中樣本量較小以及在計算95%CI時假設(shè)服從正態(tài)分布進(jìn)行求解的。實(shí)例分析
討 論