朱永生 梁學(xué)友 鐘 山 胡俊▲
1.云南農(nóng)業(yè)大學(xué)基礎(chǔ)與信息工程學(xué)院,云南昆明 650201;2.西南大學(xué)附中,重慶 400700
人群對甲型H1N1流感病毒普遍容易感染,2009年北美各國相繼暴發(fā)了新甲型H1N1流感病毒感染病例,在幾個月時間里蔓延全球遍布200多個國家[1]。由于甲流病毒極易傳染的特性,導(dǎo)致甲流發(fā)展迅速,嚴重危害人的身體健康。但針對甲型H1N1病毒的流行病特點和甲流疫苗的研制成功,采取隔離傳染源、保護健康人群、接種疫苗的綜合性積極預(yù)防措施,甲流疫情得到得到有效控制。2014年1月份北京市出現(xiàn)首例因感染甲型H1N1死亡的病例,說明對甲流的研究不能因為流行期的過去而終止,因此有很多專家學(xué)者對其各方面進行了研究[2-5]。
根據(jù)北京市2009年數(shù)據(jù)顯示,北京市有7259例確診為甲型H1N1流感,其中男性患者的比例為4361/7259=60%,女性患者的比例為40%。北京市總?cè)丝跀?shù)為17 550 000人,其中男性所占比例為51.1%,僅比女性所占的比例48.9%稍高一些。然而在感染甲流的人中,男性患者所占比例遠高于女性患者。本研究對北京市截至到2009年11月1日,全市報告甲型H1N1流感確診病例數(shù)據(jù)建立一個列聯(lián)表,采用x2檢驗和似然比檢驗法來檢驗北京市人口中男性與女性感染甲型H1N1流感病毒的概率是否顯著不同。
數(shù)據(jù)來自北京衛(wèi)生信息網(wǎng)疫情周報(2009年10月26日~11月1日)[6]以及2010年北京統(tǒng)計年鑒。2009年截至第43周北京市累計報告甲型H1N1流感確診病例7259例(男4361例,女2898例)。北京全市人口中,男為896.2萬人,占總?cè)丝诘?1.1%;女為858.8萬人,占總?cè)丝诘?8.9%。性別比(以女性為100,男性對女性的比例)為104.1。經(jīng)過整理后的數(shù)據(jù)如下,表1為甲型H1N1流感感染人數(shù)的四格表。
表1 甲型H1N1流感感染人數(shù)
1.2.1 x2檢驗[7]一般總體中的個體可按兩個屬性A與B分類,A有r個類A1……Ar,B有c個類A1……Ac,從總體中抽取大小為n的樣本,設(shè)其中有nij個個體既屬于Ai又屬于Bj,nij成為頻數(shù),將r×c個nij排列為一個r行c列的二維列聯(lián)表。
表2 概率四格表
表3 頻數(shù)四格表
我們用屬性A表示性別,它有兩個水平:A1表示男性和A2表示女性,屬性B表示是否感染甲流,它也有兩個水平:B1表示感染甲流和B2表示未感染甲流??紤]概率四格表(表2)和與其對應(yīng)頻數(shù)四格表(表3)當(dāng)P1=P2時,屬性A和屬性B相互獨立,其中 P1=P(B1/A1),P2=P(B1/A2)。
首先建立假設(shè)H0:甲流感染與性別無關(guān),即A與B是獨立的。
H0∶ Pij=Pi+P+j,i=1,2,j=1,2;H1:存在 i與 j,使得Pij≠Pi+P+j
表3中的n11為實際頻數(shù),表2的P11為A1∩B1的概率,因而nP11為理論頻數(shù),Pij是在r- 1成立時得到的 Pij的最大似然估計,
由Pearson的x2定理[8],有檢驗統(tǒng)計量
在原假設(shè) H0成立時,上式服從自由度為:
rc-(r+ c- 2 )-1 = (r- 1 )(c- 1 ) = ( 2- 1)′ ( 2- 1 )= 1 的 x2分布。對于給定的顯著水平 a (0 a1),檢驗的拒絕域
1.2.2 似然比檢驗[7-10]在四格表中帶參數(shù)的分類數(shù)據(jù)的似然比檢驗統(tǒng)計量為
由上所述,P11的極大似然估計為
統(tǒng)計量的漸近分布也是x2(1)分布。顯著水平為 α 的檢驗的拒絕域為
經(jīng)計算x2檢驗統(tǒng)計量的觀測值為236.004[11-12],當(dāng)顯著水平α=0.05時, ,因而在顯著水平α=0.05時應(yīng)拒絕原假設(shè)H0,接受H1,即甲流病毒感染與性別有關(guān)系。
由于此分布是一個連續(xù)分布,而四格表資料屬于離散型分布,由此計算得來的統(tǒng)計量的抽樣分布亦呈離散性質(zhì),為了改善統(tǒng)計量分布的連續(xù)性,需要對統(tǒng)計量進行連續(xù)性校正,則連續(xù)校正的x2檢在顯著水平α=0.05時應(yīng)拒絕原假設(shè)H0,接受H1,也同樣可以得出甲流病毒的感染與性別有關(guān)系。
其觀測值為237.917,在顯著水平α=0.05時應(yīng)拒絕原假設(shè)H0,接受H1,所得出結(jié)論也是甲流病毒的感染與性別有關(guān)系。
通過Pearson x2檢驗和似然比檢驗,結(jié)果均為拒絕原假設(shè),即認為男性感染H1N1流感病毒的概率不等于女性感染H1N1流感病毒的概率。從而我們可以認為感染甲型H1N1流感的機率與性別有一定的關(guān)系,由于感染人群中男性所占比例遠高于女性,我們進一步推測男性比女性更易感染甲型H1N1流感病毒。
對四格表的抽樣方式,檢驗方法沒有明顯差別。x2檢驗統(tǒng)計量由于其直觀性,使得人們更容易理解和接受。雖然似然比檢驗統(tǒng)計量 - 2 ln(L)稍微復(fù)雜于x2檢驗統(tǒng)計量而不容易被人們所理解,但是似然比檢驗統(tǒng)計量 - 2 ln(L)卻有著x2檢驗統(tǒng)計量所不具備的優(yōu)點,那就是似然比統(tǒng)計量 - 2 ln(L)可以分解,這極大增加了似然比檢驗統(tǒng)計量在假設(shè)檢驗中的優(yōu)勢。關(guān)于x2檢驗和似然比檢驗的比較以及可分解性的詳細敘述見參考文獻[9]。正因為似然比檢驗統(tǒng)計量可分解,所以對四格表的獨立性檢驗問題,人們除了使用直觀的x2檢驗外,還可使用似然比檢驗做對照。似然比檢驗除了用于分類數(shù)據(jù)的檢驗問題,還可用于其他類型數(shù)據(jù)的檢驗,它的應(yīng)用范圍較x2檢驗廣。
[1] 李威,宋艷玲,王長科.甲型H1N1流感在美國傳播期和墨西哥暴發(fā)期的氣象條件與中國初夏氣候特點和相似分析 [J].科技導(dǎo)報, 2009,27(11):19-21.
[2] Wei L,Yanglin S, Changke W. Comparability analysis between the climate characteristics of early summer in China and the meteorological conditions during the periods that the A(H1N1) flu spread in America and broke out in Mexico[J].Science & Technology Review, 2009, 30(11):19-22.
[3] Shuai ZW,Qian B,Tian W, et al. Construction and expression of eukaryotic expression vector of NS1 protein of influenza A(H1N1)[J]. J Cell Mol Immunol, 2011, 20(3): 287-289.
[4] Chan CH,Lin KL, Chan Y. Amplification of the entire genome of influenza A virus H1N1 and H3N2 subtypes by reverse-transcription polymerase chain reaction[J]. Journal of Virological Methods, 2006,35(136): 38-43.
[5] Guo L, Garten RJ, Fonat AS, et al. Rapid identification of oseltamivir-resistant influenza A(H1N1)viruses with H274Y mutation by RT-PCR/restriction fragment length polymorphism[J]. Antiviral Research, 2009, 12(1):29-33.
[6] 北京衛(wèi)生信息網(wǎng)疫情周報[EB/OL]http://www.bjhb.gov.cn/news.do?dispatch=readById&id=28342&typeid=F.2009-11.
[7] 王靜龍,梁小筠.定性數(shù)據(jù)分析[M].上海:華東師范大學(xué)出版社,2005:44-45.
[8] 王靜龍,梁小筠.定性數(shù)據(jù)統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,2008:18-19.
[9] 王靜龍,梁小筠.定性數(shù)據(jù)統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,2008:232-238.
[10] 茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計教程[M].第2版.北京:高等教育出版社,2012:395-396.
[11] James BC,James OA. Using SPSS: An Interactive Hands-On Approach[M]. CA: SAGE, 2012:12-200.
[12] Gilat A. Matlab: An Introduction with Applications[M].NJ: John Wiley & Sons, 2011:193-246.
[13] B. Ruth, B. Stephen, Schaum's Outline of Elements of Statistics II: Inferential Statistics[M]. NY: McGraw-Hill,1999:201-239.