孫建偉 王大江 許汴利 黃學(xué)勇△
衛(wèi)生相關(guān)事件數(shù)據(jù)時(shí)間聚集性的綜合分析與判定*
孫建偉1王大江2許汴利1黃學(xué)勇1△
目的 探討衛(wèi)生相關(guān)事件數(shù)據(jù)時(shí)間聚集性的綜合分析與判定。方法 應(yīng)用集中度、負(fù)二項(xiàng)分布、聚類(lèi)分析、圓分布四種方法對(duì)河南省某縣狂犬病門(mén)診就診人群月分布數(shù)據(jù)進(jìn)行分析。結(jié)果 集中度法M=0.54,說(shuō)明就診人群具有較強(qiáng)季節(jié)性;負(fù)二項(xiàng)分布P=0.3119,可認(rèn)為就診人群時(shí)間分布以天為單位具有時(shí)間聚集性;聚類(lèi)分析顯示春夏季是就診人群集中季節(jié),3-6月為就診高峰,5月就診人數(shù)最多;圓分布法計(jì)算結(jié)果顯示日就診高峰在5月8日。結(jié)論 集中度、負(fù)二項(xiàng)分布、聚類(lèi)分析、圓分布等方法可用于衛(wèi)生相關(guān)事件數(shù)據(jù)時(shí)間聚集性的綜合分析與判定。
時(shí)間聚集性 集中度 負(fù)二項(xiàng)分布 聚類(lèi)分析 圓分布
衛(wèi)生相關(guān)事件年度數(shù)據(jù),如某種疾病發(fā)病時(shí)間分布、門(mén)診就診人群時(shí)間分布、病媒數(shù)量的月分布等,其有無(wú)時(shí)間聚集性及時(shí)間聚集性綜合分析與判定是相關(guān)科學(xué)研究的重要內(nèi)容之一。通過(guò)衛(wèi)生相關(guān)事件年度數(shù)據(jù)時(shí)間聚集性分析,既可為疾病病因研究提供線索,又可為疾病暴露時(shí)間或潛伏期研究提供支持,還可以用于評(píng)價(jià)不同時(shí)期某種疾病防控效果,為制定有效防制措施和衛(wèi)生決策提供科學(xué)依據(jù)。本文以河南省某縣2015年狂犬病暴露預(yù)防處置門(mén)診就診人數(shù)月分布數(shù)據(jù)的綜合分析為例,介紹集中度、負(fù)二項(xiàng)分布、聚類(lèi)分析、圓分布四種方法在數(shù)據(jù)時(shí)間聚集性分析與判定中的應(yīng)用,并對(duì)結(jié)果進(jìn)行比較,探討適用范圍和價(jià)值。
1.資料
來(lái)自2015年河南省某縣狂犬病暴露預(yù)防處置門(mén)診監(jiān)測(cè)數(shù)據(jù)報(bào)表門(mén)診就診人群分日、分月數(shù)據(jù)。
2.方法
(1)集中度[1]表示發(fā)病時(shí)間季節(jié)性強(qiáng)弱的指標(biāo),由各月發(fā)病數(shù)與全年發(fā)病總數(shù)之比通過(guò)下式計(jì)算:
M表示集中度,R表示離散度,ri表示月發(fā)病數(shù)與全年發(fā)病總數(shù)之比。M為1時(shí)說(shuō)明病例集中在一個(gè)月內(nèi);在0.9以上說(shuō)明發(fā)病有嚴(yán)格季節(jié)性;在0.7~0.9之間,說(shuō)明發(fā)病有很強(qiáng)的季節(jié)性;在0.5~0.7之間說(shuō)明發(fā)病有較強(qiáng)季節(jié)性;在0.3~0.5之間說(shuō)明發(fā)病有一定季節(jié)性;在0.3以下說(shuō)明發(fā)病時(shí)間分布比較均勻; 為0表示病例均勻分布在12個(gè)月內(nèi)。
(1)
(2)
再根據(jù)
(3)聚類(lèi)分析[4]聚類(lèi)分析是研究事物分類(lèi)的一種統(tǒng)計(jì)方法,是在所關(guān)注對(duì)象分類(lèi)面貌尚不清楚情況下,通過(guò)彼此之間的比較而將性質(zhì)相近的歸為一類(lèi),性質(zhì)差別較大的歸為不同類(lèi)。在Q型聚類(lèi)(對(duì)樣品的聚類(lèi))中衡量對(duì)象性質(zhì)相近程度的距離指標(biāo)常用歐式距離,其計(jì)算公式如下:
式中:Xik表示第i對(duì)象的第k個(gè)指標(biāo)的觀察值,Xjk表示第j個(gè)對(duì)象的第k個(gè)指標(biāo)觀察值;m是觀察指標(biāo)的總數(shù)。dij表示第i個(gè)對(duì)象與第j個(gè)對(duì)象間的距離,dij越小,對(duì)象“性質(zhì)”越接近。在實(shí)例分析中,對(duì)象為月份,指標(biāo)是不同年份,觀察值是發(fā)病數(shù)。
(4)圓分布法[5]是將具有周期性變化的資料通過(guò)三角函數(shù)的變換使原始數(shù)據(jù)成線性資料的一種統(tǒng)計(jì)學(xué)方法。一組圓分布資料如果有集中分布的傾向,這一傾向性可用平均角表示。將1年365天轉(zhuǎn)化為360°,1天則對(duì)應(yīng)0.9863°,以每月中間一天為組中值,換算成對(duì)應(yīng)的角度,如1月16日對(duì)應(yīng)16×0.9863°=15.78°,2月14日對(duì)應(yīng)(31+14)×0.9863°=44.38°,余類(lèi)推。通過(guò)以下公式求得平均角 ,換算成對(duì)應(yīng)的月日即為發(fā)病高峰期時(shí)間。
1.門(mén)診就診人群時(shí)間分布概況 該縣狂犬病暴露預(yù)防處置門(mén)診2015年共接診9800例,就診時(shí)間多在2-8月,占全年病例的92.27%,其中5月發(fā)病數(shù)最多為1782例。
圖1 河南省某狂犬病門(mén)診就診人數(shù)月分布
2.集中度法M=0.54,表明該狂犬病門(mén)診人群就診時(shí)間有較強(qiáng)季節(jié)性。
表1 門(mén)診人群就診時(shí)間(日)分布的負(fù)二項(xiàng)分布擬合
*:χ2=2.33,P=0.3119。
4.聚類(lèi)分析 若聚為兩類(lèi),則2-8月為一類(lèi),1月、9-12月為一類(lèi);2-8月又可分為兩類(lèi),3-6月為一類(lèi),2月、7-8月為一類(lèi);3-6月又可分為5月及3、4、6月兩類(lèi)。結(jié)果見(jiàn)圖2。
圖2 河南省某狂犬病門(mén)診就診人群分月聚類(lèi)分析
表2 門(mén)診人群就診時(shí)間聚集性的圓分布法統(tǒng)計(jì)
在該狂犬病門(mén)診就診人群時(shí)間聚集性分析中,四種分析方法得出了相一致的結(jié)論,即發(fā)病具有時(shí)間聚集性,但結(jié)論側(cè)重點(diǎn)各不相同。集中度分析認(rèn)為發(fā)病具有較強(qiáng)季節(jié)性[6];負(fù)二項(xiàng)分布以某一時(shí)間或空間單位為觀察對(duì)象,得出事件數(shù)據(jù)在該時(shí)間或空間單元層面具有聚集性[7];聚類(lèi)分析側(cè)重于按某一事件數(shù)據(jù)對(duì)月份進(jìn)行不同層次的歸類(lèi)[8];圓分布法除得出具有聚集性外還推算出具體的發(fā)病高峰[9]。從方法的繁易程度看,聚類(lèi)分析可通過(guò)SPSS、SAS等快速實(shí)現(xiàn),最為簡(jiǎn)便,其次是集中度分析,而圓分布法和負(fù)二項(xiàng)分布的計(jì)算相對(duì)繁瑣。從適用的時(shí)間范圍看,集中度分析最為局限,其余三種方法適用時(shí)間范圍則廣泛、靈活[10]。負(fù)二項(xiàng)分布常用于傳染病空間與時(shí)間聚集性的分析[11],有文獻(xiàn)曾用于釘螺分布的擬合[12],這種方法關(guān)注的時(shí)間單位可以為時(shí)、日、周、年等,關(guān)注的空間單位可以是縣、鄉(xiāng)、村、街道等,可得出在所關(guān)注的時(shí)間或空間單位層面發(fā)病是否具有聚集性,若有2組以上結(jié)果,可以通過(guò)聚集參數(shù) 的大小比較聚集程度。聚類(lèi)分析更適宜于某一事件連續(xù)多年數(shù)據(jù)時(shí)間分布特征的分析,得出所關(guān)注時(shí)間單位的不同聚類(lèi)結(jié)果。圓分布法適宜的時(shí)間范圍更廣、更靈活,關(guān)鍵是所關(guān)注的單位時(shí)間與角度的互算,同時(shí)需要進(jìn)行平均角的雷氏檢驗(yàn),這種方法最大的優(yōu)點(diǎn)是能推算出發(fā)病高峰的時(shí)間點(diǎn)及不同置信度可信區(qū)間所在。
綜上所述,在衛(wèi)生相關(guān)事件時(shí)間聚集性分析和判定中,根據(jù)事件特點(diǎn)不同、關(guān)注時(shí)間范圍不同、分析研究目的不同,可以靈活采取不同方法。若是以月份為單位進(jìn)行年度分析,如對(duì)于流行性乙型腦炎、細(xì)菌性痢疾等具有顯著發(fā)病高峰季節(jié)的傳染病,用圖示法或者聚類(lèi)分析即可,對(duì)于事件或疾病無(wú)顯著高峰期的,首選集中度法判定發(fā)病季節(jié)性的強(qiáng)弱;若研究關(guān)注的是不同年代或不同地區(qū)某事件某一數(shù)據(jù)高峰期的比較及動(dòng)態(tài)變化,則首選圓分布法;若要比較前后不同時(shí)期數(shù)據(jù)聚集性強(qiáng)弱則可由負(fù)二項(xiàng)分布擬合實(shí)現(xiàn)。同時(shí),應(yīng)以動(dòng)態(tài)變化的觀點(diǎn)看待衛(wèi)生相關(guān)事件數(shù)據(jù)時(shí)間聚集性,其分析和判定的主要目的是為該事件存在、發(fā)生、流行等相關(guān)影響因素分析提供線索,為疾病潛伏期或者暴露時(shí)間等事件關(guān)鍵點(diǎn)研究提供支持,為有效控制事件發(fā)展或者疾病防制措施的制訂和完善提供科學(xué)依據(jù)。
[1]聶軼飛,王海峰,李孟磊,等.應(yīng)用集中度和圓形分布法探討河南省2010年手足口病流行規(guī)律.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(3):410-411.
[2]索瑞鑫,仇玉蘭,王彤.基于負(fù)二項(xiàng)分布的確切推斷在微核試驗(yàn)數(shù)據(jù)分析中的模擬研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(1):2-5.
[3]金丕煥.醫(yī)用統(tǒng)計(jì)方法.第2版.上海:復(fù)旦大學(xué)出版社,2008.
[4]張英杰,王超,曹凱,等.中國(guó)大陸2008-2010年手足口病流行特征聚類(lèi)分析.中國(guó)公共衛(wèi)生,2015,31(5):541-544.
[5]梁筱露,白海濤,蘇喆,等.圓形分布法分析北海市流行性感冒的季節(jié)性和長(zhǎng)期趨勢(shì).現(xiàn)代預(yù)防醫(yī)學(xué),2015,42(8):1383-1385.
[6]雷靜,李霞,楊浩,等.應(yīng)用集中度分析銀川市2004-2010年細(xì)菌性痢疾的發(fā)病季節(jié)和年齡分布特征.寧夏醫(yī)學(xué)雜志,2012,34(1):60-62.
[7]孫建偉,陳豪敏,許汴利.河南省2010年縣區(qū)層面狂犬病病例空間聚集性的Poisson分布與負(fù)二項(xiàng)分布擬合.鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版), 2012, 47(1):98-100.
[8]李亮,梁祁,祁賢.江蘇省2009年手足口病流行特征的聚類(lèi)分析.江蘇預(yù)防醫(yī)學(xué),2010,21(6):4-6.
[9]張世勇,高秋菊.圓形分布法分析石家莊市2004-2010年布魯桿菌病的高發(fā)季節(jié).中國(guó)人獸共患病學(xué)報(bào),2012,28(3):312-314.
[10]李凱杰,林文,范志誠(chéng),等.湖北省間日瘧發(fā)病與傳瘧按蚊關(guān)系的圓形分布法分析.中華疾病控制雜志,2015,19(10):983-985.
[11]韓新煥.負(fù)二項(xiàng)分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用.數(shù)理醫(yī)藥學(xué)雜志,2009,22(2):138-140.
[12]張志杰,彭文祥,Ong Senghuat,等.廣義負(fù)二項(xiàng)分布對(duì)釘螺分布的擬合.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(1):2-6.
(責(zé)任編輯:張 悅)
河南省醫(yī)學(xué)科技攻關(guān)計(jì)劃項(xiàng)目(201503193)
1.河南省疾病預(yù)防控制中心傳染病預(yù)防控制所(450016)
2.河南省桐柏縣疾病預(yù)防控制中心
△ 通信作者:黃學(xué)勇,E-mail:hxyzzu@163.com
中國(guó)衛(wèi)生統(tǒng)計(jì)2017年2期