馬愛霞 謝 靜 唐文熙
中國藥科大學國際醫(yī)藥商學院 江蘇南京 211198
城市公立醫(yī)院醫(yī)藥價格綜合改革后,由于取消藥品加成、提高醫(yī)療服務價格,醫(yī)院藥品收入與醫(yī)療服務收入將會受到影響,其中醫(yī)療服務收入的改變更是直接反映了改革取得的效果。一般來說,隨著社會經濟的發(fā)展,醫(yī)療服務收入本身呈增長趨勢,因此在評價政策效果時,應該剔除數(shù)據(jù)本身存在的規(guī)律,即構造“反事實”——通過自身歷史數(shù)據(jù)構建其發(fā)展趨勢并用以預測“非改革”狀態(tài)下數(shù)據(jù)的表現(xiàn)情況。醫(yī)院收支數(shù)據(jù)多為時間序列,常用的預測模型有線性時間序列模型、ARIMA模型(Autoregressive Integrated Moving Average Model)、BP(Back Propagation)神經網絡模型等。[1-3]本文選用ARIMA模型、BP神經網絡模型以及ARIMA+BP組合模型,探討其預測效率,以期為政策評價中反事實的構造提供方法學參考。
1.1 ARIMA模型
ARIMA模型全稱為差分自回歸移動平均模型(Autoregressive Integrated Moving Average Model),是時間序列模型最常用的參數(shù)模型之一,由Box和Jenkins于20世紀70年代初提出。[4]模型運算過程為:先將非平穩(wěn)時間序列轉化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸。ARIMA模型由于在逼近許多平穩(wěn)過程時具有較高的適應性,因此常用于線性預測。模型完整形式為ARIMA(p,d,q),其中AR是自回歸,p為自回歸項;MA為移動平均,q為移動平均項數(shù),d為時間序列成為平穩(wěn)時所做的差分次數(shù)。平穩(wěn)化后預測公式如下所示:
(1)
針對許多時間序列數(shù)據(jù)波動具有季節(jié)規(guī)律性,可將ARIMA模型擴展為季節(jié)時間序列模型(Seasonal ARIMA Model,SARIMA),即本研究采用的模型。SARIMA模型采用季節(jié)差分的方法去掉季節(jié)性,可解決ARIMA模型無法解決的季節(jié)性問題。季節(jié)性建模處理與ARIMA模型類似。模型完整形式為SARIMA(p,d,q)(P,D,Q)s,公式表達式如下所示:
(2)
其中,P為季節(jié)自回歸階數(shù),Q為季節(jié)移動平均階數(shù),s為周期,φp(Ls)和ΘQ(Ls)分別為季節(jié)P階自回歸算子和Q階移動平均算子。Εt服從均值為0方差為σ2的正態(tài)分布。建立SARIMA模型,應首先對季節(jié)性因素進行處理,用觀察法或統(tǒng)計檢驗確定季節(jié)性后,對時間序列進行季節(jié)平穩(wěn)性檢驗,然后識別SARIMA模型,確定P,D,Q,p,d,q的取值,隨后進行參數(shù)估計與模型檢驗,得到初步模型后便可使用SARIMA模型進行時間序列的仿真與分析。
1.2 BP神經網絡模型
BP(Back Propagation)神經網絡,即誤差反向傳播模型,由信息的正向傳播和誤差的反向傳播兩個過程組成,是一種最為常見且較為復雜的神經網絡模型。[5]BP神經網絡是一個三層或以上的網絡,不僅包含輸入層和輸出層,而且還有一層或多層隱層(圖1)。X=(X1,X2,…,Xn)即為BP神經網絡的輸入向量,b=(b1,b2,…,bt)是隱含層的輸出向量,Y是輸出層的輸出向量,Wih和Whj是BP神經網絡的網絡權值。
圖1 三層BP神經網絡結構圖
此時節(jié)點的輸出模型為:
(3)
(4)
式(3)是隱含層節(jié)點的模型,其中f1為激活函數(shù),一般取輸出值在(0,1)之間的Sigmoid函數(shù)。式(4)是輸出層節(jié)點的模型,其中f2為激活函數(shù),通常為線性函數(shù)。當實際輸出與期望輸出不符時,進入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權值,向隱藏層、輸入層逐層反傳。周而復始的信息正向傳播和誤差反向傳播過程,是各層權值不斷調整的過程,也是神經網絡學習訓練的過程,此過程一直進行到網絡輸出的誤差減少到可以接受的程度,或者預先設定的學習次數(shù)為止。
BP神經網絡模型對單變量的時間序列也可進行預測。以某一時間序列X1,X2,…,Xn為例,預測時則認為預測值與前面m個值之間存在某種函數(shù)關系,構建Xt=F(Xt-1,Xt-2,…,Xt-m+1)函數(shù)關系。即將預測值Xt當為輸出變量Y,該值前面的m個值(Xt-1,Xt-2,…,Xt-m+1)作為輸入向量X,利用BP神經網絡來推導未來值。近年來隨著人工智能的不斷發(fā)展,BP神經網絡已經成為預測非線性時間序列的主流模型之一。
為解決時間序列的季節(jié)性波動問題,從一般的BP神經網絡發(fā)展出了季節(jié)性神經網絡模型。設一時間序列X=(X1,X2,…,Xn)是以s為周期的季節(jié)性時間序列,根據(jù)季節(jié)性ARIMA模型理論,認為未來的一個序列Xt值是和歷史d×s個值之間存在某種函數(shù)關系,函數(shù)關系為Xt=F(Xt-1,Xt-2,…,Xt-d×s+1),用三層神經網絡(圖1)擬合該周期函數(shù),來預測未來的Xt值。
1.3 ARIMA+BP組合模型
組合預測模型的思想最早在1969年由Bates等提出,Bates等多位研究學者均指出并驗證了單項預測模型的有效組合可以顯著地提高預測效果。[6]將ARIMA與BP預測模型進行組合,能夠結合ARIMA與BP模型的優(yōu)勢,分別提取研究數(shù)據(jù)的線性和非線性變化特征。[7]目前使用最廣泛的是線性組合預測模型,一般的線性組合預測模型在時間序列應用時表達式如下:
yt=w1yt1+w2yt2
其中yt為組合模型的預測結果,yt1,yt2分別為ARIMA和BP模型預測模型t期的預測值,w1,w2為相應的組合權重。組合模型的難點在于最優(yōu)組合權重的確定。若權重不合理,則有可能出現(xiàn)組合模型的預測效果比單項模型差的情形。目前,確定權重的方法中被大多學者認可并采用的為數(shù)學優(yōu)化方法,即通過求誤差平方和的最小值來確定最優(yōu)的權重系數(shù)。假設ARIMA、BP模型、組合模型的預測誤差分別為e1t、e2t、et,欲使組合模型誤差平方和E=∑ei2最小,則有:
et=w1e1t+w2e2t
w1+w2=1
將w2用1-w1代入可以得到:
et=w1(e1t-e2t)+e2t
組合模型誤差平方和為:
E=∑ei2=∑[w1(e1t-e2t)+e2t]2
通過計算E的最小值,即可得此時w1、w2的值(即最優(yōu)權重)。
2.1資料來源
本研究從南京市城市公立醫(yī)院醫(yī)藥價格綜合改革中選取代表性醫(yī)院A,并選取藥品收入、醫(yī)療服務收入兩個指標進行預測。A醫(yī)院為三級甲等醫(yī)院,改革前后藥占比分別為40.91%和36.09%,醫(yī)療服務收入占比分別為16.63%和20.92%,在57所參改醫(yī)院中屬于中等,且規(guī)模適當、管理規(guī)范,因此較有代表性。
2.2研究方法
鑒于南京價改于2015年10月31日零點正式開始,樣本區(qū)間設定為2011年11月—2016年10月。按月收集改革前4年及改革后1年的數(shù)據(jù),以改革前3年(2011年11月—2014年10月)的數(shù)據(jù)為訓練數(shù)據(jù),以改革前1年(2014年11月—2015年10月)為測試數(shù)據(jù),分別運用ARIMA模型、BP神經網絡及其組合模型對指標進行預測,并與未構造反事實情況下的指標表現(xiàn)水平進行比較。數(shù)據(jù)分析過程在R軟件中實現(xiàn)。
3.1藥品收入預測比較
建模前對原始數(shù)據(jù)進行預處理,擬分析的數(shù)據(jù)形態(tài)如圖2所示。可見,數(shù)據(jù)有一定的上升趨勢,同時又伴隨有周期性約為12個月的季節(jié)性波動,符合醫(yī)院藥品月收入現(xiàn)實意義。
圖2 藥品收入原始數(shù)據(jù)
SARIMA模型:在R軟件中先調用ts()函數(shù)將原始數(shù)據(jù)轉化為波動周期為12的季節(jié)性時間序列,后運用auto.arima() 函數(shù),判斷通過一次差分和季節(jié)差分后數(shù)據(jù)轉化為一個平穩(wěn)時間序列,再根據(jù)藥品月收入時間序列一階差分的自相關和偏自相關函數(shù)構建模型為ARIMA(0,1,1)×(1,1,0)12。
BP神經網絡模型:本研究釆用滯后項預測法,所構建神經網絡模型的輸入層節(jié)點數(shù)為12 ,輸入的是待預測數(shù)據(jù)前的12個時間序列數(shù)據(jù)yt-1,yt-2,…,yt-12;輸出層節(jié)點數(shù)為1,輸出的是待預測數(shù)據(jù)yt。此外,隱含層的節(jié)點數(shù)通過經驗法與試湊法確定為10,最終神經網絡模型結構為12-10-1。隱含層的激活函數(shù)為log-sigmoid函數(shù),輸出層激活函數(shù)為線性函數(shù),設定迭代次數(shù)為1 000次,學習率為0.02,誤差目標為0.00001。考慮到本文的數(shù)據(jù)預測屬于時間序列長期預測,因此采用迭代一步預測的方法。
組合模型:借助軟件計算得到ARIMA模型權重w1=0.3895,BP模型權重w2=0.6105時,此時組合預測模型的誤差平方和最小。
三種模型預測結果數(shù)值如表1所示,選用均方根誤差(RMSE)對預測效果進行評估。指標表達式如下:
從表1可看出組合模型的均方根誤差最小,預測效果最為精準;三者的預測結果趨勢如圖3所示,其中測試數(shù)據(jù)是指2014年11月—2015年10月測試數(shù)據(jù)的真實值,可以發(fā)現(xiàn)組合模型的擬合趨勢與測試數(shù)據(jù)最為接近,也進一步說明了其預測效果的精準性。
表1 三種模型對藥品收入預測結果比較(萬元)
3.2醫(yī)療服務收入預測比較
同理,對醫(yī)療服務收入進行測算。醫(yī)療服務收入=醫(yī)療收入—藥品收入—衛(wèi)材收入—檢查收入—化驗收入。組合模型的最優(yōu)系數(shù)分別為:w1=0.6658;w2=0.3342。計算結果如表2,發(fā)現(xiàn)組合模型預測的準確度最高。三個模型預測結果見圖4。
3.3與實際值比較
3.3.1 改革對藥品收入的影響
根據(jù)前文研究的結果,組合模型預測效果最優(yōu),但為了對比不同模型預測與組合模型預測的差值情況,本文分別采用組合模型、ARIMA模型以及BP模型對改革后A醫(yī)院的藥品收入進行反向事實數(shù)據(jù)預算。如圖5所示,三種模型預測趨勢較為接近,并且發(fā)現(xiàn)改革后預測藥品收入與實際藥品收入相比有明顯下降。
表2 三種模型對醫(yī)療服務收入預測結果比較(萬元)
圖3 藥品收入預測結果
圖4 醫(yī)療服務收入預測結果趨勢圖
圖5 改革后藥品收入損失情況
圖6 改革后醫(yī)療服務收入增加情況
三種模型預測的反向事實數(shù)據(jù)如表3所示,用改革后1年實際藥品收入減去改革前1年實際藥品收入,獲得傳統(tǒng)的改革藥品收入損失量為403.95萬元,由于藥品收入自身具有上升的趨勢,未剔除自身發(fā)展趨勢,將導致藥品收入損失預測降低。運用反向事實數(shù)據(jù)預測得到的改革后預測藥品收入,利用改革后實際藥品收入減去改革后預測藥品收入,得到ARIMA、BP神經網絡、組合模型三種模型預測的藥品收入凈損失量分別為14 180.53萬元、10 680.94萬元、12 044.03萬元。相比于傳統(tǒng)計算獲得的藥品收入損失,三種運用反向事實數(shù)據(jù)預測獲得的凈藥品收入損失更貼近改革實際帶來的凈效應。
3.3.2 改革對醫(yī)療服務收入的影響
同理,對醫(yī)療服務收入分別進行組合模型、ARIMA模型以及BP模型進行反向事實數(shù)據(jù)預算。如圖6所示,三種模型預測的趨勢均較為接近,并且發(fā)現(xiàn)改革后實際醫(yī)療服務收入比預測醫(yī)療服務收入有明顯上升。
表3 改革后藥品收入反向事實數(shù)據(jù)的預測(萬元)
三種模型預測的反向事實數(shù)據(jù)如表4所示,按照傳統(tǒng)計算方式:改革后醫(yī)療服務收入—改革前醫(yī)療服務收入,獲得醫(yī)療服務收入增加量為22 541.3萬元,由于醫(yī)療服務收入自身具有上升的趨勢,未剔除自身發(fā)展趨勢,將導致醫(yī)療服務收入增加量預測加大。運用反向事實數(shù)據(jù)預測得到的改革后醫(yī)療服務收入凈增加量,ARIMA、BP神經網絡、組合模型三種模型預算的結果分別為18 172.25萬元、19 250.51萬元、18 532.60萬元。相比于傳統(tǒng)計算獲得的醫(yī)療服務收入增加,三種運用反向事實數(shù)據(jù)預測獲得的凈醫(yī)療服務收入增加量更貼近改革實際帶來的凈效應。
表4 改革后醫(yī)療服務收入反向事實數(shù)據(jù)的預測(萬元)
3.3.3 醫(yī)療服務補償率
醫(yī)療服務補償率是指取消藥品加成后,醫(yī)院通過調整醫(yī)療服務價格獲得的對藥品差價補償?shù)谋壤?。傳統(tǒng)的醫(yī)療服務補償率和剔除數(shù)據(jù)自身發(fā)展趨勢以獲得改革后的醫(yī)療服務凈補償率計算公式如下:
傳統(tǒng)醫(yī)療服務補償比=傳統(tǒng)的改革醫(yī)療服務收入增加量/傳統(tǒng)的改革藥品收入損失量*100%
醫(yī)療服務收入凈補償比=改革后醫(yī)療服務收入凈增加量/改革后藥品收入凈損失量*100%
根據(jù)表3、表4分別計算出傳統(tǒng)醫(yī)療服務補償比、與運用反向事實3個模型測算的醫(yī)療服務補償比(表5)??梢园l(fā)現(xiàn),按照傳統(tǒng)計算方式得到的結果與運用反向事實預測得到的結果相差較大,這是由于藥品收入和醫(yī)療服務收入自身均具有上升的趨勢,未剔除自身發(fā)展趨勢,將導致藥品收入損失預測降低、醫(yī)療服務收入增加量預測加大, 因此計算出的醫(yī)療服務補償率與實際情況偏差較大。觀察剔除數(shù)據(jù)自身發(fā)展趨勢后獲得的醫(yī)療服務凈補償率,可以發(fā)現(xiàn)補償率已經超過100%,證明改革后該醫(yī)院增加的服務收入能夠全額彌補甚至超出藥品價格差額損失。
表5 醫(yī)療服務補償率
4.1反向事實的重要性
從前文的分析中不難看出反向事實構建對醫(yī)療政策評價的準確度具有重要意義。現(xiàn)階段,我們對醫(yī)療衛(wèi)生政策的研究多采用對比改革前后觀測指標的方法來衡量改革成效[8-9],但這種評價方法存在一定的局限性。其中最主要的問題是忽視了指標數(shù)據(jù)自身發(fā)展趨勢(即反向事實數(shù)據(jù))對效果評價的影響,在指標數(shù)據(jù)自身呈現(xiàn)正向或負向趨勢時,這種忽視就直接導致了改革后觀測指標的變化因素除了改革的影響外還包括了其自身客觀發(fā)展的影響。具體而言,當指標數(shù)據(jù)具有正向發(fā)展趨勢時,忽視反向事實數(shù)據(jù)將會導致評價機會成本下降、機會收益增加,同樣,忽視具有反向發(fā)展趨勢的反向事實數(shù)據(jù)則會導致評價機會成本上升、機會收益下降。因此,剔除數(shù)據(jù)自身發(fā)展趨勢即將反向事實數(shù)據(jù)納入評價體系對獲得改革的凈效應具有重要意義。運用反向事實評價公立醫(yī)院價格綜合改革成效將最大限度還原改革所獲得的凈效應。
4.2組合模型捕捉線性和非線性效率更高
ARIMA模型與大多數(shù)時間序列預測方法一樣,各變量之間的線性關系也是其主要預測前提之一[10],但實際研究中總是或多或少地含有非線性因素,當非線性因素影響較小,或在某一范圍內影響較小時,尚可采用線性模型來描述或逼近。但非線性影響較大或用線性逼近也得不到較好結果的時候,非線性時間序列模型的運用就顯露了其特有的優(yōu)勢。近年來神經網絡模型的興起為非線性模型預測提供了新思路。由于具備自動學習、逼近能夠反映樣本數(shù)據(jù)規(guī)律的最優(yōu)函數(shù),且當函數(shù)形式越復雜時,神經網絡預測的效果越好[11],其在預測高復雜度的非線性時間序列方面明顯優(yōu)于傳統(tǒng)的線性預測方法。
總結而言,ARIMA模型可對具有線性關系的數(shù)據(jù)進行時間序列預測,對非線性數(shù)據(jù)的處理不盡合理,且效果欠佳;BP神經網絡可挖掘出數(shù)據(jù)中隱含的非線性關系,但由于不能反映時間序列的自相關和偏相關,在處理具有線性特征的數(shù)據(jù)時,其效果往往不如ARIMA?,F(xiàn)實研究中,很多數(shù)據(jù)都是既包含線性信息,也包含非線性信息,單個的預測模型很難充分捕獲時間序列中所包含的信息,而此時組合模型可以結合不同預測模型的優(yōu)勢,盡可能多的獲取時間序列數(shù)據(jù)中的信息。
醫(yī)院財務數(shù)據(jù)是醫(yī)院醫(yī)療工作的經濟基礎、健康發(fā)展的基石,更是評價公立醫(yī)院綜合價格改革成效的重要依據(jù)。由于醫(yī)院財務數(shù)據(jù)會受到各類因素波動的影響,如人口結構、疾病譜變化、季節(jié)性流行疾病、醫(yī)生處方習慣、藥品價格、服務價格等,均會導致醫(yī)院財務數(shù)據(jù)具有復雜的線性與非線性組合特征,因此在用組合預測模型的預測效果最佳。
4.3時間序列模型的局限性及選擇建議
在實際操作時,BP神經網絡模型隱含層層數(shù)和單元數(shù)的選擇在理論上尚缺乏有力指導,一般是根據(jù)經驗或反復實驗進行確定,一定程度上增加了網絡學習的負擔。網絡的學習和記憶還具有不穩(wěn)定性,其對之前的權值和閾值缺乏記憶,在增加學習樣本的情況下,網絡需從頭訓練,故而BP及其組合模型的預測也會比較難。[12]ARIMA模型預測精度雖然沒有組合模型預測的效果好,但預測的趨勢與組合模型趨勢也較為一致,且其操作性簡單,實際應用性相對較強。
一般而言,在預測時間序列數(shù)據(jù)時,當數(shù)據(jù)長度越長,模型擬合預測效果也將越好,但本研究的時序數(shù)據(jù)僅限于十三五規(guī)劃期間的數(shù)據(jù),建議其他學者在有條件的基礎上選取更長的數(shù)據(jù)進一步研究探索。
作者聲明本文無實際或潛在的利益沖突。
[1] 李望晨, 崔慶霞, 張利平. 基于趨勢外推與ARIMA預測我國醫(yī)院診療及住院人次[J]. 中國衛(wèi)生統(tǒng)計, 2016, 33(3): 477-478.
[2] 侯福均, 吳祈宗. BP神經網絡在鐵路客運市場時間序列預測中的應用[J]. 運籌與管理, 2003, 12(4): 73-75.
[3] 翟靜, 曹俊. 基于時間序列ARIMA與BP神經網絡的組合預測模型[J]. 統(tǒng)計與決策, 2016(4): 29-32.
[4] 于爽, 郭祖超, 胡琳. ARIMA模型在醫(yī)院季節(jié)性時序資料預測中的應用[J]. 數(shù)理統(tǒng)計與管理, 1991(6): 23-29.
[5] 楊娟麗, 徐梅, 王福林, 等. 基于BP神經網絡的時間序列預測問題研究[J]. 數(shù)學的實踐與認識, 2013, 43(4): 158-164.
[6] 梁德陽. 基于SARIMA和BP神經網絡的時間序列組合預測模型研究[D]. 蘭州: 蘭州大學, 2014.
[7] 張宇青, 易中懿, 周應恒. 一種線性ARIMA基礎上的非線性BP神經網絡修正組合方法在糧食產量預測中的運用[J]. 數(shù)學的實踐與認識, 2013, 43(22): 135-142.
[8] 肖月, 趙琨, 李雪, 等. 東部某省縣級公立醫(yī)院醫(yī)藥價格改革評價[J]. 中國衛(wèi)生政策研究, 2015, 8(1): 14-20.
[9] 陜西省價格協(xié)會陜西省物價局課題組. 城市公立醫(yī)院補償機制改革研究[J]. 價格理論與實踐, 2016(10): 72-77.
[10] 葉明全. 基于神經網絡的季節(jié)性時間序列預測方法研究[D]. 合肥: 合肥工業(yè)大學, 2004.
[11] 鐘穎, 汪秉文. 基于遺傳算法的BP神經網絡時間序列預測模型[J]. 系統(tǒng)工程與電子技術, 2002, 24(4):9-11.
[12] 楊偉, 倪黔東, 吳軍基. BP神經網絡權值初始值與收斂性問題研究[J]. 電力系統(tǒng)及其自動化學報, 2002, 14(1): 20-22.