陳雄飛 董曉梅 陳 希 肖新才 李鐵鋼 王玉林 王 鳴△
甲型H1N1流感主要為呼吸道傳播,其傳染途徑多數(shù)通過(guò)患者咳嗽或打噴嚏形成含病毒的空氣飛沫,以近距離的傳播為主,其發(fā)生具有明顯的聚集性〔1〕。由于其聚集性,各病例間不具有獨(dú)立性。大部分的統(tǒng)計(jì)分析方法要求病例間具有獨(dú)立性,如普通的logistic回歸分析等,而目前絕大部分文獻(xiàn)在研究甲型H1N1流感的時(shí)空間分布以及其影響因素時(shí)未能考慮聚集性,其結(jié)果的準(zhǔn)確性有待證實(shí)。本研究采用二項(xiàng)分布與β-二項(xiàng)分布模型分析新型H1N1流感在宿舍內(nèi)的聚集性以及聚集性的強(qiáng)度,為新型甲型H1N1流感的防控以及研究提供參考。
1.研究對(duì)象 來(lái)自于廣州市某中等技術(shù)學(xué)校2009年8月22日至2009年10月15日新型甲型H1N1流感暴發(fā)中的病例,該學(xué)校除了個(gè)別學(xué)生走讀外,其余全部為寄宿生。
2.現(xiàn)場(chǎng)流行病學(xué)調(diào)查與血清學(xué)調(diào)查 自行設(shè)計(jì)問(wèn)卷,暴發(fā)終了后對(duì)全部學(xué)生進(jìn)行問(wèn)卷調(diào)查。調(diào)查內(nèi)容包括學(xué)生的人口學(xué)資料、8月20日以來(lái)的健康情況、臨床癥狀以及流感發(fā)病的相關(guān)因素,由經(jīng)過(guò)統(tǒng)一培訓(xùn)后的專業(yè)調(diào)查人員采取面對(duì)面調(diào)查與查閱校醫(yī)門診記錄結(jié)合的方式收集。疫情暴發(fā)時(shí),按規(guī)范要求對(duì)自愿者及時(shí)采集咽拭子與血清進(jìn)行檢測(cè)。該校于10月18日為學(xué)生進(jìn)行年度例行體檢,市疾控中心從體檢學(xué)生的血液樣本中分離血清進(jìn)行血清學(xué)檢查。
3.新型甲型H1N1流感病例 體溫 ≥37.5℃,且咽拭子甲型H1N1核酸陽(yáng)性或甲型H1N1血凝抑制抗體陽(yáng)性,伴或不伴有咳嗽、咽痛、流涕等任何臨床癥狀。由于新型甲型H1N1流感為一種新發(fā)傳染病,在2009年9月前,廣州市的監(jiān)測(cè)結(jié)果表明人群的感染率<5%,該校在這之前未發(fā)生過(guò)流感的暴發(fā)流行。暴發(fā)調(diào)查時(shí),部分病例及對(duì)照進(jìn)行了雙份血清抗體檢查與咽拭子檢查。體檢血清抗體陽(yáng)性病例中,除個(gè)別病例外,都有抗體4倍以上升高或核酸陽(yáng)性,因而可認(rèn)為抗體陽(yáng)性者都為本次感染導(dǎo)致。
4.分析方法
(1)使用描述性統(tǒng)計(jì)分析一般情況
(2)使用二項(xiàng)分布與β-二項(xiàng)分布擬合新型甲型H1N1流感病例在宿舍間的分布情況,分析其聚集性〔2-4〕。
1)二項(xiàng)分布、β-二項(xiàng)分布及其相關(guān)分布:
二項(xiàng)分布:n個(gè)獨(dú)立的是/非試驗(yàn),其中每次試驗(yàn)的成功概率為p。X表示試驗(yàn)成功的次數(shù),其分布為二項(xiàng)分布。n=1時(shí)稱為伯努利試驗(yàn)。
超幾何分布:有N個(gè)樣本,其中m個(gè)是合格的,在N個(gè)樣本中無(wú)放回地抽出n個(gè),其中X個(gè)是合格的概率。如果為有放回則為二項(xiàng)分布。
幾何分布:在第n次伯努利試驗(yàn),才得到第一次成功的機(jī)率。即n次伯努利試驗(yàn),前n-1次皆失敗,第n次才成功的機(jī)率。X表示試驗(yàn)的次數(shù),其分布為幾何分布。
負(fù)二項(xiàng)分布:在一連串伯努利試驗(yàn)中,一件事件剛好在第r+k次試驗(yàn)出現(xiàn)第r次的概率。X表示試驗(yàn)的次數(shù),其分布負(fù)二項(xiàng)分布。r=1時(shí),負(fù)二項(xiàng)分布等于幾何分布。
負(fù)超幾何分布:也稱β-二項(xiàng)分布,有N個(gè)樣本,其中m個(gè)為合格的,N-m個(gè)為不合格的。每次隨機(jī)地取出一個(gè)樣本本,記X為取到r個(gè)合格樣本的時(shí)候所需抽取次數(shù)。X的分布就是負(fù)超幾何分布。當(dāng)n→∞時(shí),其分布趨向于負(fù)二項(xiàng)分布。
二項(xiàng)分布與超幾何分布考慮的是成功次數(shù)的概率,而負(fù)二項(xiàng)分布、幾何分布與負(fù)超幾何分布考慮的是達(dá)到固定成功次數(shù)所需試驗(yàn)次數(shù)的分布。
2)二項(xiàng)分布與β-二項(xiàng)分布特點(diǎn)
二項(xiàng)分布用于描述兩種互斥結(jié)果的離散型隨機(jī)事件,具有等概率條件,即事件發(fā)生具有相同的概率。β-二項(xiàng)分布是二項(xiàng)分布的推廣,屬于復(fù)合分布,假設(shè)二項(xiàng)分布中參數(shù)P是一隨機(jī)變量,且服從β分布,所構(gòu)成的復(fù)合分布即為β-二項(xiàng)分布,主要用于社會(huì)中小群體的發(fā)病數(shù)、小環(huán)境內(nèi)事件發(fā)生數(shù)的分布模型研究,尤其適用于傳染性、遺傳度較高的疾病等在家庭、社會(huì)中小群體中的聚集性研究〔3〕。其概率函數(shù)為:
K發(fā)生的事件數(shù),α,β為β分布的二個(gè)參數(shù)。β-二項(xiàng)分布其均數(shù)與方差分別為ˉX=nπ與S2=nπ(1-π)(1+nθ),其中 π =α/(α+β),θ=1/(α +β)。π 為P的均數(shù),θ為P的方差,由于P具有變異,β-二項(xiàng)分布的方差大于單純二項(xiàng)分布的方差,θ又被稱為聚集系數(shù)。由于β-二項(xiàng)分布的方差與二項(xiàng)分布比較相對(duì)過(guò)大,與其他方差分布過(guò)于離散的分布一樣,可以計(jì)算過(guò)度離散系數(shù) φ=1/(α+β+1)=θ/(1+θ),φ被稱為組內(nèi)相關(guān)系數(shù),其值在0~1之間,反映各組內(nèi)數(shù)據(jù)的相關(guān)程度,即病例在宿舍內(nèi)的聚集程度,同時(shí)也反映不同組之間的相異程度。參數(shù)擬合方法有矩法、頻數(shù)法、最大似然法等。
(3)全部分析采用R 2.12.2軟件進(jìn)行分析,二項(xiàng)分布擬合采用stats模塊,β-二項(xiàng)分布擬合采用bbmle模塊,參數(shù)的估計(jì)使用最大似然法。
1.一般情況
該校有1570個(gè)學(xué)生,全部為2008級(jí)與2009級(jí)兩個(gè)年級(jí)的學(xué)生,其中新型甲型H1N1流感病例349人,罹患率為22.23%(349/1570)。以宿舍為單位統(tǒng)計(jì)各宿舍的總?cè)藬?shù)與發(fā)病人數(shù),因?yàn)槿藬?shù)小于3人以及人數(shù)多于10人的宿舍數(shù)較少,在進(jìn)行分析時(shí)結(jié)果不穩(wěn)定,故分析未利用。將總?cè)藬?shù)小于3人與總?cè)藬?shù)大于10的宿舍排除后,共有190間宿舍、1313名學(xué)生納入分析,占全部人數(shù)的83.63%,其中有295例病例,占全部分析病例的84.53%,平均每間宿舍6.98人,平均每間宿舍1.54例病例。納入分析人群罹患率為22.47%(295/1313),與全部人群比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(χ2=0.023,P=0.878)。不同人口數(shù)不同發(fā)病人數(shù)的宿舍分布見(jiàn)表1。
表1 不同學(xué)生數(shù)的宿舍發(fā)病人數(shù)的宿舍分布及其二項(xiàng)分布擬合優(yōu)度檢驗(yàn)
2.二項(xiàng)分布擬合優(yōu)度檢驗(yàn)
以22.47%作為罹患率的估計(jì),進(jìn)行二項(xiàng)分布擬合優(yōu)度檢驗(yàn),發(fā)現(xiàn)本次疫情罹患率的宿舍分布不符合二項(xiàng)分布(χ2=37.45,ν=3,P <0.001)。
3.β-二項(xiàng)分布參數(shù)估計(jì)結(jié)果
按宿舍人口數(shù)的多少,分別擬合不同人口數(shù)下的β-二項(xiàng)分布,結(jié)果發(fā)現(xiàn)所有人口規(guī)模的宿舍的參數(shù)π的假設(shè)檢驗(yàn)均有統(tǒng)計(jì)學(xué)意義(P全部小于0.01),各模型所有模型的組內(nèi)相關(guān)系數(shù)φ均大于0.75,結(jié)果見(jiàn)表2,作散點(diǎn)圖發(fā)現(xiàn),從3人到10人的宿舍,其π呈U型曲線,聚集系數(shù)與組內(nèi)相關(guān)系數(shù)呈鐘形曲線,進(jìn)行相關(guān)分析時(shí)發(fā)現(xiàn),π與θ呈負(fù)相關(guān)(r=-0.7,P=0.04),觀察其圖形時(shí)發(fā)現(xiàn),負(fù)指數(shù)關(guān)系(R2=0.72)可能比線性關(guān)系(R2=0.52)更適合。
4.β-二項(xiàng)分布擬合優(yōu)度檢驗(yàn)
以極大似然估計(jì)的結(jié)果為參數(shù),進(jìn)行β-二項(xiàng)分布擬合優(yōu)度檢驗(yàn),發(fā)現(xiàn)本次疫情中,宿舍人口數(shù)為6~8人的宿舍的罹患率分布符合β-二項(xiàng)分布,結(jié)果見(jiàn)表3。其余人口數(shù)的宿舍由于人數(shù)過(guò)少,合并理論數(shù)過(guò)少的格子后,格子數(shù)少于4,導(dǎo)致其自由度小于1,擬合優(yōu)度檢驗(yàn)不能進(jìn)行。
表2 不同人口數(shù)宿舍發(fā)病人數(shù)β-二項(xiàng)分布參數(shù)極大似然估計(jì)結(jié)果
表3 6~8人的宿舍發(fā)病人數(shù)的β-二項(xiàng)分布擬合優(yōu)度檢驗(yàn)
研究者對(duì)甲型H1N1流感發(fā)生的聚集性已具有共識(shí),但目前國(guó)內(nèi)的文獻(xiàn)中均未能對(duì)其聚集性進(jìn)行定量分析,在對(duì)影響因素進(jìn)行分析時(shí),未能考慮聚集性的影響〔5〕,結(jié)果的可靠性未能得到保證。一般認(rèn)為,如果疾病在小單位內(nèi)無(wú)聚集性現(xiàn)象則符合二項(xiàng)分布,并據(jù)此判斷疾病有無(wú)聚集性。如果疾病有聚集性,則根據(jù)其性質(zhì)的不同,研究者用來(lái)研究其特點(diǎn)的分布也不同,用的較多的是負(fù)二項(xiàng)分布與β-二項(xiàng)分布。本研究中集體單位為宿舍,其發(fā)病數(shù)不能超過(guò)宿舍人數(shù),因而β-二項(xiàng)分布比負(fù)二項(xiàng)分布更恰當(dāng)。本研究采用擬合優(yōu)度檢驗(yàn)發(fā)現(xiàn)甲型H1N1流感發(fā)病的宿舍分布不符合二項(xiàng)分布,符合β-二項(xiàng)分布,表明本次暴發(fā)的甲型H1N1流感宿舍內(nèi)具有聚集性。β-二項(xiàng)分布的極大似然估計(jì)結(jié)果發(fā)現(xiàn),所有人口規(guī)模的宿舍模型組內(nèi)相關(guān)系數(shù)φ均大于0.75,表明各宿舍內(nèi)的聚集性非常高,組間變異超過(guò)了總變異的75%。
由于聚集性分析以集體單位作為樣本的個(gè)體,而不是以組成集體單位的個(gè)人作為個(gè)體,因而其有效樣本量大大降低。β-二項(xiàng)分布的參數(shù)與集體單位的總?cè)藬?shù)有關(guān),不同人口數(shù)的宿舍不能合并進(jìn)行分析。β-二項(xiàng)分布具有兩個(gè)參數(shù),在擬合優(yōu)度檢驗(yàn)時(shí),至少有個(gè)4理論數(shù)大于5的格子才能保證結(jié)果的有效性。由于以上條件的限制,本次研究中,擬合優(yōu)度檢驗(yàn)時(shí)只對(duì)人數(shù)為6~8人的宿舍數(shù)進(jìn)行了檢驗(yàn),結(jié)果全部符合β-二項(xiàng)分布。
結(jié)果顯示,(1)不同人數(shù)宿舍的聚集系數(shù)與組內(nèi)相關(guān)系數(shù)均呈鐘形,其頂點(diǎn)為7人,提示可能在人口為7人的宿舍中,其聚集性最強(qiáng);(2)不同人數(shù)宿舍的罹患率與人口數(shù)呈U型曲線,人口為7人的宿舍罹患率最低,且與3人及10人的宿舍比較,差異有統(tǒng)計(jì)學(xué)意義(95%CI不重疊)。(3)不同人數(shù)宿舍中,聚集性與罹患率呈負(fù)相關(guān)。該現(xiàn)象可能與不同人口數(shù)的宿舍的社交活動(dòng)特點(diǎn)有關(guān)。與其他人口數(shù)的宿舍相比,7人宿舍的內(nèi)部交往最頻繁,而宿舍間交往最稀少;因?yàn)樗奚衢g的活動(dòng)相對(duì)較少,不同宿舍間不容易傳染;一旦傳入,由于宿舍內(nèi)社交活動(dòng)頻繁,宿舍內(nèi)傳播速度快,而且強(qiáng)度大;由于宿舍間的不容易傳染,導(dǎo)致其罹患率低,而由于宿舍內(nèi)的快速傳播導(dǎo)致其高聚集性。以上結(jié)果的確切機(jī)理需要進(jìn)一步的專業(yè)研究以及利用數(shù)理模型進(jìn)行實(shí)證分析與模擬分析。
1.衛(wèi)生部.甲型H1N1流感診療方案(2010年版)
2.羅中云.HBsAg家庭象集性理論概率模式的研究.中國(guó)衛(wèi)生統(tǒng)計(jì),1991,8(3):50-52.
3.陳峰,楊樹勤.β-二項(xiàng)分布及其醫(yī)學(xué)應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),1996,13(2):10-13.
4.Tripathi RC,Gupta RC,John G.Estimation of parameters in the beta binomial model.Ann Inst Statist Math ,1994,46(2):317-331.
5.陳希,李鐵鋼,柳洋,等.一起寄宿制學(xué)校甲型H1N1流感暴發(fā)危險(xiǎn)因素分析.中國(guó)學(xué)校衛(wèi)生,2011,32(2):208-210.
6.Kreft.I.Are Multilevel Techniques Necessary?http://ioe.a(chǎn)c.uk/multilevel.