周罡??周劍嵐
[摘要]研究GDP等社會(huì)經(jīng)濟(jì)指標(biāo)與傳染病發(fā)病率之間的相關(guān)性具有重要的意義。建立多元線性回歸模型,采集GDP、每千人衛(wèi)生技術(shù)人員數(shù)目等六類(lèi)指標(biāo),以及2008年分省區(qū)的傳染病發(fā)病人數(shù),針對(duì)以上數(shù)據(jù)進(jìn)行量性分析。采用SPSS軟件,通過(guò)后退法首先排除掉那些影響較小的變量,然后利用顯著性檢驗(yàn),建立合適的模型,結(jié)果表明,染病人數(shù)只與GDP與各省人口有關(guān)系,與GDP成反比,與各省人口成正比(即發(fā)病率與GDP成反比)。驗(yàn)證的模型是一個(gè)有效的模型,具有預(yù)測(cè)性。
[關(guān)鍵詞]傳染病發(fā)病率;社會(huì)經(jīng)濟(jì)指標(biāo);多元線性回歸;相關(guān)性分析
[中圖分類(lèi)號(hào)] R183 [文獻(xiàn)標(biāo)識(shí)碼] B [文章編號(hào)] 2095-0616(2013)08-173-03
傳染病發(fā)病率是目前研究的熱門(mén)。研究各省區(qū)發(fā)病率與社會(huì)經(jīng)濟(jì)指標(biāo),如與GDP的關(guān)系,對(duì)于疾病的預(yù)防意義重大。國(guó)內(nèi)外針對(duì)各類(lèi)傳染病發(fā)病率的研究,主要集中在導(dǎo)致疾病發(fā)生的直接因素分析。鄧泗沐等[1]研究了深圳市2000~2010年傳染病發(fā)病率時(shí)間趨勢(shì)分析,顯示傷寒副傷寒對(duì)發(fā)病率下降的貢獻(xiàn)最大。賈蕾等[2]探討北京市痢疾報(bào)告發(fā)病率長(zhǎng)期變化特點(diǎn)及其與經(jīng)濟(jì)、氣候等影響因素的關(guān)系。馮星淋等[3]研究了10個(gè)國(guó)家的GDP與中國(guó)兒童死亡狀況的比較。但是研究社會(huì)經(jīng)濟(jì)指標(biāo),如GDP與傳染病發(fā)病率關(guān)系的研究少之又少,只有Blondal K等[4]研究了結(jié)核艾滋病毒感染的發(fā)病率與包括國(guó)家GDP等的多因素相關(guān)。本文采用多元線性回歸模型分析傳染病發(fā)病率與社會(huì)經(jīng)濟(jì)指標(biāo)的相關(guān)性。多元線性回歸模型可以有效分析自變量與因變量的因果關(guān)系,應(yīng)用在各行各業(yè)。白萍[5]引入多元線性回歸分析的方法,由定性分析選取與我國(guó)財(cái)政收入有較強(qiáng)的相關(guān)性的幾個(gè)影響因素,以其作為解釋變量,建立與財(cái)政收入的線性模型。朱祥和根據(jù)某地區(qū)的相關(guān)數(shù)據(jù),運(yùn)用時(shí)間序列分析,多元線性回歸法,對(duì)影響該地區(qū)私家車(chē)保有量的幾個(gè)因素進(jìn)行數(shù)學(xué)建模。在對(duì)模型進(jìn)行適當(dāng)修正后,找出其中的相關(guān)性和函數(shù)關(guān)系,從而對(duì)該地區(qū)的私家車(chē)保有量進(jìn)行預(yù)測(cè)[6]。
1 建模
本研究的數(shù)據(jù)定義如下,因變量y為2008年各省傳染病人數(shù),自變量x1為2008年各省GDP總值,x2各省人均醫(yī)療費(fèi)用,x3各省人口總數(shù),x4各省每千人的衛(wèi)生技術(shù)人員數(shù)目,x5各省疫病預(yù)防中心人數(shù),x6各省廢氣排放的多少。由于計(jì)算量大,通過(guò)SPSS軟件進(jìn)行相關(guān)運(yùn)算。首先進(jìn)行相關(guān)性分析,結(jié)果如表1所示。
表1顯示了自變量與各個(gè)因變量的相關(guān)程度以及各個(gè)因變量之間兩兩的相關(guān)程度,這些相關(guān)程度是通過(guò)pearson相關(guān)系數(shù)來(lái)表示的,y與x1,x3,x4,x5,x6的相關(guān)系數(shù)在0.5附近或者0.5以上,說(shuō)明所選自變量與y是顯著相關(guān)的,用y與自變量做多元線性回歸是合適的。y與x2的相關(guān)系數(shù)ry2=-0.258,P=0.081,相關(guān)系數(shù)偏小,說(shuō)明各省人均醫(yī)療費(fèi)用對(duì)各省傳染病人數(shù)無(wú)顯著地影響。
然后進(jìn)行F顯著性與t顯著性檢驗(yàn),通過(guò)SPSS計(jì)算得出線性擬合度的樣本決定系數(shù)r2=0.874,它反應(yīng)出模型對(duì)樣本觀測(cè)值的擬合程度相當(dāng)高,符合要求。F顯著性檢驗(yàn)值F=5.5,通過(guò)檢驗(yàn),說(shuō)明自變量總體與因變量顯著相關(guān)。t顯著性檢驗(yàn)是檢驗(yàn)每個(gè)自變量對(duì)因變量的影響,由SPSS計(jì)算得:β0=569.435,β1=-0.184,β2=-1.147,β3=1.680,β4=37.919,β5=0.064,β6=-0.043,得到多元線性模型
y=549.435-0.184x1-1.147x2+1.680x3+37.919x4+0.064x5-0.043x6。但是計(jì)算t顯著性檢驗(yàn)得:P2=0.594,P4=0.752,P5=0.682,P6=0.259,它們都遠(yuǎn)遠(yuǎn)大于0.05,通不過(guò)t顯著性檢驗(yàn)。
在眾多自變量當(dāng)中,由于某些自變量不顯著,因此自變量不是越多越好,但由多個(gè)自變量不顯著影響因變量時(shí),由于自變量之間的相互作用,我們不能一次剔除所有的不顯著的變量,我們將先剔除其中P值最大的一個(gè)變量,在對(duì)新的回歸方程進(jìn)行回歸檢驗(yàn),又不顯著的再剔除,直到保留的自變量都對(duì)y有顯著性的影響為止。因此可以采用后退法進(jìn)行進(jìn)一步分析。首先分析不顯著變量剔除的順序,通過(guò)計(jì)算可知依次剔除的變量為:各省每千人衛(wèi)生技術(shù)人員數(shù)目,各省人均醫(yī)療費(fèi)用,各省疾病預(yù)防中心人數(shù),各省的廢氣排放,我們將依次剔除這些變量,并依次對(duì)剩下的變量建立模型分析。隨后計(jì)算剔除變量后的擬合優(yōu)度。
從表2可知剔除變量的過(guò)程當(dāng)中,樣本決定系數(shù)依次為0.874,0.873,0.872,0.871,0.863,線性擬合度依次有所降低,當(dāng)自變量只剩下GDP(億元)和各省人口(萬(wàn)人)時(shí),r=0.929,r2=0.863,依然與樣本觀測(cè)值高度擬合,依舊符合要求。
然后對(duì)剔除變量后的模型進(jìn)行F顯著性檢驗(yàn),F(xiàn)值依次為27.677,34.429,44.348,61.003,87.882,F(xiàn)值依次增加,顯著性依次增加,當(dāng)自變量只剩下GDP(億元)和各省人口(萬(wàn)人)時(shí),F(xiàn)=87.882遠(yuǎn)遠(yuǎn)大于F0.001(2,28)=9.64,通過(guò)F顯著性檢驗(yàn)。剔除變量后的t顯著性檢驗(yàn)的P最大的變量剔除掉,直到自變量只剩下GDP(億元)和各省人口(萬(wàn)人)時(shí),這是所有的自變量全通過(guò)t顯著性檢驗(yàn),所以通過(guò)t顯著性檢驗(yàn)。
2 模型結(jié)果
在多元線性回歸模型當(dāng)中,我們選取了6個(gè)自變量,它們分別是自變量x1為2008年各省GDP總值,x2各省人均醫(yī)療費(fèi)用,x3各省人口總數(shù),x4各省每千人的衛(wèi)生技術(shù)人員數(shù)目,x5各省疫病預(yù)防中心人數(shù),x6各省廢氣排放的多少。開(kāi)始建立的模型是
y=569.435-0.184x1-1.147x2+1.68x3+37.919x4+0.064x5-0.043x6
但是這個(gè)模型并不理想,所選自變量數(shù)目過(guò)多,回歸系數(shù)顯著性檢驗(yàn)不能通過(guò),自變量存在共線性。為了完善此模型,采取后退法,剔除P值較大的變量,最后得到多元線性回歸模型
y=180.299-0.206x1+1.693x3
=180.299-0.206GDP(億元)+1.693各省人口(萬(wàn)人)。
3 討論
本文首先建立了一元線性回歸模型,因變量為各省傳染病人數(shù),自變量為各省2008年的傳染病人數(shù),經(jīng)過(guò)分析,雖然此模型通過(guò)了顯著性檢驗(yàn),但是此模型的線性擬合度不夠,不能正確地控制和預(yù)測(cè),因此此模型不適合。
接著本文又建立多元線性回歸模型,剛開(kāi)始時(shí)因變量為各省傳染病人數(shù),自變量x1為2008年各省GDP總值,x2各省人均醫(yī)療費(fèi)用,x3各省人口總數(shù),x4各省每千人的衛(wèi)生技術(shù)人員數(shù)目,x5各省疫病預(yù)防中心人數(shù),x6各省廢氣排放的多少,建立模型后,此模型通不過(guò)t顯著性檢驗(yàn)。為了繼續(xù)進(jìn)行分析,本文選擇了后退法,排除掉那些影響較小的變量,排除掉x2各省 人均醫(yī)療費(fèi)用,x4各省每千人的衛(wèi)生技術(shù)人員數(shù)目,x5各省疫病預(yù)防中心人數(shù),x6各省廢氣排放的多少,所有變量通過(guò)顯著性檢驗(yàn)。
模型分析結(jié)果表明GDP是重要的社會(huì)經(jīng)濟(jì)宏觀指標(biāo)之一,代表了社會(huì)經(jīng)濟(jì)的發(fā)展,它與各省傳染病人數(shù)是成反比的,GDP每增加一億元,傳染病人數(shù)就減少0.206人,而各省人口與各省傳染病人數(shù)是成正比的,人口沒(méi)較少一萬(wàn)人,傳染病人數(shù)就減少1.63人,因此采取的措施為:(1)改革大的制度化境,培育科技創(chuàng)新的自我孕育能力,提高生產(chǎn)技術(shù)水平和人文素質(zhì)。(2)對(duì)一個(gè)國(guó)家或一個(gè)地區(qū)而言,計(jì)劃生育就是在全國(guó)或整個(gè)地區(qū)范圍內(nèi),對(duì)人口發(fā)展進(jìn)行有計(jì)劃的調(diào)節(jié),使人口的增長(zhǎng)同社會(huì)和經(jīng)濟(jì)的發(fā)展相適應(yīng)。
總之,因變量傳染病人數(shù)只與GDP與各省人口有關(guān)系,與GDP成反比,與各省人口成正比。近幾年我國(guó)經(jīng)濟(jì)呈高速發(fā)展,各地經(jīng)濟(jì)一片繁榮,經(jīng)濟(jì)得到發(fā)展,人們的生活條件得到提高,衛(wèi)生意識(shí)也隨之提高,可以支配用于醫(yī)療的費(fèi)用也提高,國(guó)家也有更多的經(jīng)費(fèi)采購(gòu)設(shè)備來(lái)治愈疾病,這些都會(huì)減少傳染病的人數(shù)。但是還有一個(gè)因素會(huì)增多傳染病人數(shù),那就是中國(guó)的人口。雖然我國(guó)目前嚴(yán)格執(zhí)行計(jì)劃生育,但是我國(guó)人口基數(shù)太大,在近幾年我國(guó)人口還是保持較快的增長(zhǎng),因此近幾年傳染病總體來(lái)說(shuō)還是會(huì)有所增長(zhǎng)。再過(guò)幾年,我國(guó)將進(jìn)入老年社會(huì),等過(guò)完這段時(shí)間,人口數(shù)量增速將減慢,那時(shí)的傳染病發(fā)病率及發(fā)病人數(shù)將開(kāi)始減少。
[參考文獻(xiàn)]
[1] 鄧泗沐,梁桂玲,葉郁輝,等.深圳市2000~2010年傳染病發(fā)病率時(shí)間趨勢(shì)分析[J].中國(guó)熱帶醫(yī)學(xué),2012,12(1):28-30.
[2] 賈蕾, 曹衛(wèi)華,賀雄,等.北京市痢疾發(fā)病率影響因素分析[J].中國(guó)公共衛(wèi)生,2007,23(8): 1004-1006.
[3] 馮星淋,羅昊,沈娟,等.中國(guó)兒童死亡狀況的國(guó)際比較[J].兒童保健,2010,3:339-342.
[4] Blondal K,Viiklepp R,Blondal P,et al.Countrywide management of pulmonary tuberculosis reverses increasing incidence[J].International Journal of Tuberculosis and Lung Disease,2011,15(7):892-898.
[5] 白萍.影響我國(guó)財(cái)政收入的多元線性回歸模型[J].統(tǒng)計(jì)與決策,2005,5:92-94.
[6] 朱祥和.基于多元線性回歸的私家車(chē)保有量預(yù)測(cè)[J].湖北工業(yè)大學(xué)學(xué)報(bào),2011,26(3):27-31.
(收稿日期:2013-03-26)