徐飛龍 葉孟良 王潤(rùn)華
(重慶醫(yī)科大學(xué)公共衛(wèi)生與管理學(xué)院衛(wèi)生統(tǒng)計(jì)與信息管理教研室,重慶 400016)
中國(guó)60歲及以上老年人口達(dá)1.78億,占總?cè)丝诘?3.3%〔1〕,比2000年上升了2.93個(gè)百分點(diǎn)。醫(yī)療費(fèi)用作為老年人群費(fèi)用的主要支出,已成為重要經(jīng)濟(jì)負(fù)擔(dān),本課題擬采用自回歸求和移動(dòng)平均模型分析老年人醫(yī)療費(fèi)用趨勢(shì)。
1.1資料來(lái)源 整理2005年1月至2010年12月重慶市某老年群體醫(yī)療費(fèi)用月度資料如表1。
1.2研究方法 求和自回歸移動(dòng)平均(ARIMA)模型〔2〕是由Box和Jenkins提出的著名時(shí)間序列預(yù)測(cè)方法,又稱為Box-Jenkins模型。該模型是用于描述非平穩(wěn)資料的一種方法,當(dāng)時(shí)間序列含有季節(jié)變動(dòng)趨勢(shì)時(shí)可以建立ARIMA季節(jié)乘積模型。
ARIMA預(yù)測(cè)模型ARIMA(p,d,q)(P,D,Q)s〔3〕,其中p和q為自回歸和移動(dòng)平均階數(shù),d為差分次數(shù),P和Q為季節(jié)性自回歸和移動(dòng)平均階數(shù),D為季節(jié)差分次數(shù),s是季節(jié)周期。ARIMA建模有4個(gè)基本步驟〔4〕:①序列的平穩(wěn)化。要求原始序列平穩(wěn),即均數(shù)與方差都不隨時(shí)間變化,自相關(guān)系數(shù)只與時(shí)間間隔有關(guān),而與所處時(shí)間無(wú)關(guān);②模型識(shí)別〔5〕。根據(jù)時(shí)序圖和自相關(guān)(ACF)圖、偏相關(guān)(PACF)圖確定;③參數(shù)統(tǒng)計(jì)和模型診斷。通過擬合優(yōu)度檢驗(yàn)得到統(tǒng)計(jì)量包括方差、對(duì)數(shù)似然函數(shù)值、赤池信息準(zhǔn)則(AIC)及貝葉斯信息準(zhǔn)則(BIC),選用各種參數(shù)有統(tǒng)計(jì)意義的模型;④模型預(yù)測(cè)〔6〕。以2005~2010年的逐月人均醫(yī)療費(fèi)用擬合模型,利用2011年的逐月人均醫(yī)療費(fèi)用回代檢驗(yàn)?zāi)P偷念A(yù)測(cè)效果,根據(jù)預(yù)測(cè)值得到95%可信區(qū)間,計(jì)算預(yù)測(cè)值與實(shí)際值的相對(duì)誤差,以此判斷模型的預(yù)測(cè)精度,并進(jìn)一步預(yù)測(cè)2012年的逐月人均醫(yī)療費(fèi)用。
1.3統(tǒng)計(jì)學(xué)方法 采用SPSS19.0建立逐月人均醫(yī)療費(fèi)用數(shù)據(jù)庫(kù),并利用Time Series分析模塊進(jìn)行數(shù)據(jù)處理與建?!?,8〕。
2.1序列的平穩(wěn)化 將表1中2005~2010的逐月人均治療費(fèi)用做時(shí)間序列圖(圖1),重慶市某老年群體逐月醫(yī)療費(fèi)用呈現(xiàn)明顯的整體上升趨勢(shì)和周期性。在每年的4,5,10,11月出現(xiàn)波峰,但在每年的12,1,6,7月出現(xiàn)波谷。對(duì)原始序列作ACF,PACF圖,發(fā)現(xiàn)它們均為緩慢拖尾衰減,可判斷為非平穩(wěn)序列,識(shí)別為ARIMA (p,d,q)模型。對(duì)原始數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)Shapiro-Wilk(t=0.973,P=0.131),不能拒絕原始數(shù)據(jù)正態(tài)分布的假設(shè),不需要對(duì)原始數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換。
表1 2005~2011逐月人均醫(yī)療費(fèi)用情況(元)
因此,只考慮對(duì)分別進(jìn)行一次一般差分和季節(jié)差分以消除整體趨勢(shì)和季節(jié)的影響,預(yù)處理后的時(shí)序圖見圖2,長(zhǎng)期趨勢(shì)和季節(jié)性基本消除,得到一個(gè)寬平穩(wěn)的隨機(jī)序列,符合ARIMA模型的平穩(wěn)性要求。
2.2模型識(shí)別 根據(jù)差分變換的次數(shù),可初步確定模型應(yīng)該是以12個(gè)月為周期的綜合了連續(xù)模型和季節(jié)模型的復(fù)合季節(jié)模型ARIMA(p,1,q)(P,1,Q)12〔6〕,其中p,q和P,Q是待定參數(shù),分別為連續(xù)模型和季節(jié)模型的自回歸階數(shù)和移動(dòng)平均階數(shù)。由ACF(圖3)及PACF圖(圖4)得到,序列經(jīng)差分后ACF由于含有季節(jié)的周期性影響,呈近似一步截尾,PACF拖尾,可以提示p=0,q=1,可進(jìn)一步確定模型為ARIMA(0,1,1)(P,1,Q)12。季節(jié)模型的P和Q判斷較難,根據(jù)文獻(xiàn),參數(shù)>2階的情況很少,可以分別取0,1,2,由低階到高階逐個(gè)實(shí)驗(yàn),根據(jù)模型的擬合優(yōu)度、殘差的白噪聲情況及系數(shù)間的相關(guān)性進(jìn)行綜合判斷。
2.3參數(shù)估計(jì)和模型診斷 分別對(duì)P、Q取0,1,2,由低階到高階逐步試驗(yàn),根據(jù)最小BIC準(zhǔn)則,并且結(jié)合參數(shù)檢驗(yàn)可知:ARIMA(0,1,1)(2,1,0)12擬合最優(yōu),其中BIC=13.663,R2=0.555,一階非季節(jié)滑動(dòng)平均參數(shù)MA1=0.894(t=9.715,P=0.000),一階自回歸參數(shù)SAR1=-0.691(t=-4.234,P=0.000),SAR2=-0.415(t=-2.109,P=0.048),模型具有統(tǒng)計(jì)學(xué)意義,本模型殘差序列Box-Ljunt統(tǒng)計(jì)結(jié)〔Q(18)=11.859,P=0.690〕顯示統(tǒng)計(jì)量差異均無(wú)統(tǒng)計(jì)學(xué)意義,可以認(rèn)為殘差為白噪聲,表明所選模型是恰當(dāng)?shù)摹?/p>
2.4模型擬合和比較
2.4.1ARIMA模型的擬合運(yùn)用模型ARIMA(0,1,1)(2,1,0)12,對(duì)2005~2010年的逐月人均醫(yī)療費(fèi)用時(shí)間序列數(shù)據(jù)擬合,并對(duì)2011年1月至12月的逐月人均醫(yī)療費(fèi)用進(jìn)行預(yù)測(cè),擬合情況如圖5,該圖顯示了模型對(duì)2005~2010年數(shù)據(jù)的擬合值以及預(yù)測(cè)值的95%的可信區(qū)間,可見模型對(duì)實(shí)際值進(jìn)行了較好的跟蹤和預(yù)測(cè),南值與預(yù)測(cè)值的動(dòng)態(tài)趨勢(shì)基本一致,表現(xiàn)出與實(shí)際值相似的升降規(guī)律。雖然各個(gè)月份的適人均醫(yī)療費(fèi)用與預(yù)測(cè)值不完全一樣,但基本落在95%CI范圍內(nèi)。用相對(duì)誤差衡量預(yù)值和實(shí)際值差距大小,可以看出2011年的合計(jì)相對(duì)誤差為4.06%。
2.4.2指數(shù)平滑法 (Winters相乘模型)的擬合 指數(shù)平滑法有助于預(yù)測(cè)存在趨勢(shì)和/或季節(jié)的序列,此處數(shù)據(jù)同時(shí)體現(xiàn)上述兩種特征所以我們考慮運(yùn)用指數(shù)平滑法與ARIMA(0,1,1)(2,1,0)12進(jìn)行比較。經(jīng)過對(duì)指數(shù)平滑法的多次嘗試,選擇了Winters相乘法預(yù)測(cè)模型,擬合情況如圖6,其中R2=0.631,BIC=13.194。
2.4.3兩種預(yù)測(cè)方法比較 一方面,從擬合的效果來(lái)看,兩者的R2、Normalized BIC相差不大,均能較好的包含樣本數(shù)據(jù)的信息;但是另一方面,從預(yù)測(cè)精度來(lái)看,前者的相對(duì)誤差普遍較小,平均相對(duì)誤差〔9,10〕小于后者,預(yù)測(cè)精度高。綜合考慮,選擇ARIMA(0,1,1)(2,1,0)12模型用于逐月人均醫(yī)療費(fèi)用的短期預(yù)測(cè)。見表2。
表2 ARIMA模型和Winters相乘模型的擬合情況比較
圖1 原始序列圖
圖3 一般差分和季節(jié)差分后的ACF圖
圖4 一般差分和季節(jié)差分后的偏PACF圖
圖5 ARIMA模型
Winters相乘模型
Winters相乘模型、ARIMA法都用于短期預(yù)測(cè),當(dāng)預(yù)測(cè)數(shù)據(jù)隨時(shí)間呈現(xiàn)一種線性趨勢(shì)和季節(jié)波動(dòng)趨勢(shì)時(shí),兩種方法均能提取很好地提取原始數(shù)據(jù)中的線性和季節(jié)信息,且能得到較好的擬合效果。但這兩種方法針對(duì)不同的時(shí)間序列效果有所不同,Winters相乘模型是假設(shè)事物過去的發(fā)展規(guī)律會(huì)延展到未來(lái),更多的利用近期的信息,因此就沒有考慮到從過去到未來(lái)期間客觀因素的影響,可能產(chǎn)生較大的預(yù)測(cè)誤差,它也能較好的修正序列數(shù)據(jù)的季節(jié)性和趨勢(shì)性,但由于近年來(lái)醫(yī)療改革的推動(dòng)、醫(yī)療體制的變化,導(dǎo)致醫(yī)療費(fèi)用發(fā)生了變化,預(yù)測(cè)精度有所下降;ARIMA模型則充分考慮了基本趨勢(shì)、周期性、季節(jié)性、殘差相關(guān)性等問題,使得預(yù)測(cè)精度提高,預(yù)測(cè)數(shù)據(jù)接近實(shí)際水平,尤其是短期預(yù)測(cè)方面,預(yù)測(cè)精度更高。而且利用SPSS、SAS等軟件計(jì)算簡(jiǎn)單,預(yù)測(cè)結(jié)果直接輸出,可選為醫(yī)療費(fèi)用短期預(yù)測(cè)的最佳方法。
以上分析可知,重慶市某老年群體逐月人均醫(yī)療費(fèi)用呈逐年增長(zhǎng)趨勢(shì),這與近年來(lái)我國(guó)醫(yī)療體制的改革、經(jīng)濟(jì)發(fā)展、生活水平提高等有關(guān)系,與慢性病疾病模式的轉(zhuǎn)變、高新醫(yī)療設(shè)備的應(yīng)用、醫(yī)療服務(wù)于成本價(jià)格的不斷提升、醫(yī)療保險(xiǎn)覆蓋面擴(kuò)大后醫(yī)療服務(wù)利用的增加,以及群眾健康期望值和醫(yī)療保健需求的提高也有關(guān)系。另外,醫(yī)療費(fèi)用還表現(xiàn)為明顯的季節(jié)趨勢(shì),在每年的3,4,10,11月出現(xiàn)高峰,這可能與該季節(jié)的氣候環(huán)境有關(guān),同時(shí)存在周期性,周期為S=12個(gè)月。
摸清醫(yī)療費(fèi)用的增長(zhǎng)趨勢(shì),建立預(yù)測(cè)模型可以為有關(guān)企業(yè)和部門制定措施提供依據(jù),如醫(yī)保部門制定財(cái)務(wù)規(guī)劃、商業(yè)醫(yī)療保險(xiǎn)制定賠付依據(jù)等。
4 參考文獻(xiàn)
1中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.2010年第六次全國(guó)人口普查主要數(shù)據(jù)公報(bào)(第1號(hào))〔R〕.2011.
2張 蔚,張彥奇,楊 旭.時(shí)間序列資料ARIMA季節(jié)模型及其應(yīng)用〔J〕.第三軍醫(yī)大學(xué)學(xué)報(bào),2002;4(8):955-7.
3陳 玲,徐慧蘭.自回歸求和移動(dòng)平均模型在湖南省食物中毒預(yù)測(cè)中的應(yīng)用〔J〕.中南大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2012;37(2):142-6.
4Brockwell PJ,Davis RA.Introduction to time series and forecasting〔M〕.New York:Springer Verlag,2002:179-219.
5Stadnytska T,Braun S,Werner J.Comparison of automated procedures for ARIMA model identification〔J〕.Behavior Res Meth,2008;40(1):250-62.
6Mehdi K,Mehdi B,Seyed RH.Combining seasonal ARIMA models with computational intelligence techniques for time series forecasting〔J〕.Soft Comput,2012;16:1091-105.
7宇傳華.SPSS與統(tǒng)計(jì)分析〔M〕.北京: 電子工業(yè)出版社,2007:577-612.
8王 燕.應(yīng)用時(shí)間序列分析〔M〕.北京: 中國(guó)人民大學(xué)出版社,2005:224-51.
9張 麗,閆世鋒.Hoter-winters方法與ARIMA模型在中國(guó)航空旅客運(yùn)輸量測(cè)量中的比較研究〔J〕.上海工程技術(shù)大學(xué)學(xué)報(bào),2006;20(3):280-3.
10杜迅惠.醫(yī)院出院人數(shù)的長(zhǎng)期趨勢(shì)及季節(jié)因素分析〔J〕.中國(guó)衛(wèi)生統(tǒng)計(jì),2009;26(2):175-6.