朱恩文 曹峻 朱安麒 張梅
(長沙理工大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,長沙,410114)
旅游業(yè)是第三產(chǎn)業(yè)的重要組成部分,是世界上發(fā)展最快的新興產(chǎn)業(yè)之一,被譽為“朝陽產(chǎn)業(yè)”、“無煙產(chǎn)業(yè)”[1].隨著入境旅游業(yè)的快速發(fā)展,越來越多的學(xué)者開始關(guān)注入境旅游的發(fā)展分析和預(yù)測,且分析預(yù)測的方法多種多樣[6,9?17].但是其中大多數(shù)的方法只能適用于正常發(fā)展的時間序列,對于存在突發(fā)事件,特別是影響序列發(fā)展的事件的情形,采用一般的方法進(jìn)行分析預(yù)測可能導(dǎo)致結(jié)果誤差較大、不精確,此時如果引入干預(yù)分析對序列進(jìn)行分析預(yù)測,則可使結(jié)果更精確[4,18].
2010年第41屆世界博覽會在上海舉辦,全年接待的入境旅游人數(shù)達(dá)851.12萬人次,較上一年增長了35.3%;國際旅游外匯收入達(dá)64.05億美元,同比增長了32.7%.通過觀察上海市入境旅游數(shù)據(jù)發(fā)現(xiàn),世博會的舉辦使得上海市的入境旅游業(yè)在2010年發(fā)生了重大變化,且影響的持續(xù)時間長.因此我們可以將世博會看成是一個突發(fā)的干預(yù)事件,使用干預(yù)分析的方法,來分析世博會對上海市的入境旅游的發(fā)展情況的影響[5,19,20].
本文選取上海市2004年1月到2014年8月入境游客人數(shù)月度數(shù)據(jù)進(jìn)行統(tǒng)計分析.通過繪該入境游客人數(shù)月度數(shù)據(jù)制序列的時序圖發(fā)現(xiàn),序列存在趨勢效應(yīng)和季節(jié)效應(yīng),并且從2010年3月開始,序列均值發(fā)生了變化.我們推斷,這是由于世博會舉辦產(chǎn)生的.Box-Jenkins模型是時間序列經(jīng)典模型,有很多學(xué)者利用該模型來預(yù)測入境游客人數(shù)[7].因此本文首先以Box-Jenkins模型(ARIMA)為基礎(chǔ),對序列擬合乘法季節(jié)模型,并將其作為該入境游客人數(shù)的預(yù)測模型[2.3.8]對接下來8個月的入境旅游人數(shù)進(jìn)行預(yù)測.然后考慮到世博會對上海市入境旅游產(chǎn)生的影響,采用干預(yù)分析的方再法建立干預(yù)模型,同樣對接下來8個月的入境旅游人數(shù)進(jìn)行預(yù)測.最后對計算實際值與兩個模型的預(yù)測值之間的相對誤差.通過比較發(fā)現(xiàn),干預(yù)模型的相對誤差比單一的乘積季節(jié)模型的要小,能更精準(zhǔn)地描述上海市入境旅游的發(fā)展趨勢.
1975年,由Box和Tiao引入的干預(yù)分析對于受干預(yù)事件影響的時間序列的效果評估提供了一個框架.他們假設(shè)干預(yù)之所以能對過程施加影響,是通過改變事件時間序列的均值函數(shù)或者發(fā)展趨勢而實現(xiàn)的[18],產(chǎn)生影響的干預(yù)既可以是自然產(chǎn)生的,也可以通過人為施加.本文將上海世博會作為影響上海市入境旅游正常發(fā)展的干預(yù)事件,通過建立時間序列干預(yù)模型,研究上海世博會對于上海市入境旅游發(fā)展規(guī)律的影響,可以定量地分析上海市入境旅游的結(jié)構(gòu)性趨勢變化,為上海市相關(guān)部門提供更加切實的意見和建議.
時間序列{Yt}的一般干預(yù)模型形式如下:
其中,Zt表示均值函數(shù)的變化,Nt為ARIMA過程,并且還有可能是季節(jié)過程.過程Nt表示的是沒有受到干預(yù)事件影響的基礎(chǔ)時間序列,稱為自然過程或者是無干擾過程.自然過程既有可能是平穩(wěn)的序列,也有可能是非平穩(wěn)的序列;不僅可能是非季節(jié)性的,還可能是季節(jié)性的.假設(shè)時間序列在時刻T受到干預(yù)影響,即假設(shè)在T之前,Zt與零無異.稱時間序列Yt,t 通常用階梯函數(shù)和脈沖函數(shù)來說明干預(yù)對均值函數(shù)的影響.如果干預(yù)事件最終導(dǎo)致均值函數(shù)發(fā)生的是永久性的偏移,即干預(yù)影響是長期的,則用階梯虛擬變量來表示干預(yù)變量: 而如果干預(yù)事件只在T時刻產(chǎn)生然后逐漸消失,且并不會對均值函數(shù)產(chǎn)生長期影響,即干預(yù)效應(yīng)短期存在,則可以用脈沖虛擬變量來表示干預(yù)變量: 按照干預(yù)影響的時間長短和干預(yù)對均值函數(shù)產(chǎn)生的影響,可以將干預(yù)事件分為四種類型: (1)影響突然開始并且持續(xù)時間很長,即對均值函數(shù)的影響是永久性的,則該類干預(yù)可表示為: 其中ω表示干預(yù)影響導(dǎo)致均值發(fā)生的永久變化,即表示序列均值產(chǎn)生變化的強度,且是未知的.如果干預(yù)事件是經(jīng)過了d個時間單位的延遲后作用才開始顯現(xiàn),則可表示為: (2)影響逐漸開始并且持續(xù)時間很長,例如本文研究的世博會對上海市入境旅游產(chǎn)生的影響.現(xiàn)實生活中有的干預(yù)影響并不是立刻產(chǎn)生的,有的影響可能會在干預(yù)發(fā)生較長時間后影響才產(chǎn)生,這類干預(yù)可表示為: (3)影響突然開始并且只產(chǎn)生短期影響,例如某著名旅游景點在“五一”小長假或者“十一”長假期間接待游客的人數(shù).節(jié)假日的干預(yù)導(dǎo)致影響突然開始,并且在假日結(jié)束影響隨之消失,不會對均值函數(shù)產(chǎn)生長久影響.這類干預(yù)可表示為: (4)影響突然開始隨后逐漸減弱直至消失,且只產(chǎn)生短期影響,這種干預(yù)可表示為: 此外,還可以把若干類型結(jié)合起來對更為復(fù)雜的干預(yù)效應(yīng)建模,如: 或者 在實際應(yīng)用中,需要根據(jù)干預(yù)事件本身的特性,選擇合適的模型進(jìn)行建模.建立干預(yù)模型后,常采用極大似然估計法對其參數(shù)進(jìn)行估計. 利用干預(yù)分析建模的具體步驟如下: (1)繪制收集到的時間序列數(shù)據(jù)的時序圖,觀察干預(yù)事件發(fā)生前后序列的發(fā)展規(guī)律,根據(jù)干預(yù)事件發(fā)生影響的情況以及持續(xù)的時間,初步判斷干預(yù)事件的性質(zhì); (2)將序列分為干預(yù)事件發(fā)生影響前和干預(yù)事件發(fā)生影響后兩部分,然后利用干預(yù)事件發(fā)生前的數(shù)據(jù),建立恰當(dāng)?shù)臅r間序列模型.再利用建立的模型進(jìn)行預(yù)測,將得到的預(yù)測值作為不受干預(yù)影響時序列正常發(fā)展的數(shù)值; (3)用干預(yù)事件發(fā)生影響后觀察到的實際值減去由(2)得到的不受干預(yù)影響的數(shù)值,作為干預(yù)對研究對象的序列產(chǎn)生影響所得到的具體結(jié)果; (4)根據(jù)具體影響結(jié)果和干預(yù)影響的性質(zhì)確定干預(yù)模型的類型,并利用第三步求得的結(jié)果,使用極大似然估計法估計干預(yù)模型的參數(shù); (5)用上一步建立的干預(yù)模型去擬合干預(yù)事件發(fā)生后的影響值,然后用干預(yù)事件發(fā)生影響后觀察的實際值減去干預(yù)模型擬合后得到的擬合值,作為即使干預(yù)事件發(fā)生,仍然不受影響的時間序列值.最后再加上干預(yù)事件發(fā)生前的實際值序列即預(yù)干預(yù)數(shù)據(jù),得到在研究的整個時間段內(nèi),研究對象不受干預(yù)事件影響的凈化時間序列值; 使用凈化序列值擬合適合序列的時間序列模型,最后再加上由(4)估計得到的干預(yù)影響模型,得到總的干預(yù)分析模型. 本文研究第41屆世博會的舉辦對上海市入境旅游的影響,選用的是從2004年1月開始,到世博會舉辦結(jié)束兩年后的上海市入境旅游月度數(shù)據(jù).數(shù)據(jù)主要來源于上海市文化和旅游局官網(wǎng)發(fā)布的旅游統(tǒng)計資料,還有中國國家統(tǒng)計局官網(wǎng)《中國統(tǒng)計年鑒》發(fā)布的從1978年到2018年的中國入境旅游人數(shù)和入境旅游外匯收入的數(shù)據(jù)資料. 將研究的時間序列數(shù)據(jù)記為num1,利用軟件繪制時序圖(見圖1). 圖1 num1時序圖 可以看出,上海市入境旅游人數(shù)呈現(xiàn)出較明顯的季節(jié)效應(yīng).于是,采用移動平均的方法將原始序列轉(zhuǎn)換為12月平均旅游人數(shù)序列,消除序列的季節(jié)效應(yīng).這樣能更好地觀察世博會舉辦前后旅游人數(shù)總體趨勢變化,還可以將人數(shù)波動曲線變得相對平滑. 原始數(shù)據(jù)經(jīng)過移動平均后,得到80個數(shù)據(jù),記新的數(shù)據(jù)序列為num2.num2的時序圖見圖2. 圖2 num2時序圖 由圖2可以看出,序列在自2004年12月后的第64個月,即2010年3月開始有明顯的變化. (1)平穩(wěn)性檢驗 根據(jù)上節(jié)的分析,從時間序列num1的時序圖可以看出: ①時間序列num1除了存在顯著的季節(jié)效應(yīng)以外,還存在著遞增的趨勢效應(yīng),由此可以判斷序列num1是非平穩(wěn)的; ②上海市入境游客人數(shù)在2010年達(dá)到最高峰,最高月份入境游客總數(shù)超過90萬人次. 除了時序圖,還可以通過時間序列的自相關(guān)圖對其平穩(wěn)性驗證上述結(jié)論.序列num1的自相關(guān)圖見圖3. 圖3 序列num1自相關(guān)圖 自相關(guān)圖顯示,序列num1的自相關(guān)系數(shù)具有單調(diào)趨勢,且一直位于零軸上方,由此也可以判斷序列num1是非平穩(wěn)的. (2)差分運算 因為序列num1不平穩(wěn),且存在明顯的季節(jié)效應(yīng)和趨勢效應(yīng),因此對序列num1進(jìn)行1階12步差分處理,差分后所得的序列記為num1.dif. 觀察序列num1.dif的時序圖(圖4)可以發(fā)現(xiàn),序列num1.dif的值在某個值附近波動,具有平穩(wěn)性,也就是說經(jīng)過1階12步差分后,序列是平穩(wěn)的.接著,利用R軟件對序列num1.dif進(jìn)行純隨機性檢驗,判斷該序列是否為白噪聲序列.檢驗結(jié)果如表1所示. 圖4 num1.dif時序圖 表1 白噪聲檢驗結(jié)果 由表1知,在滯后6期和滯后12期兩種情形下,LB統(tǒng)計量的P值都比較?。?0.05),所以拒絕原假設(shè),即可以以很大的把握確定2004—2012年8月上海入境游客數(shù)據(jù)差分后序列屬于非白噪聲序列. (3)模型擬合與優(yōu)化 差分后的序列num1.dif通過了純隨機性檢驗,下面將進(jìn)行模型的擬合. 首先,我們選擇模型的類型以及確定模型的階數(shù).為此,繪制序列num1.dif的自相關(guān)圖(圖5)和偏自相關(guān)圖(圖6). 圖5 序列num1.dif自相關(guān)圖 圖6 序列num1.dif偏自相關(guān)圖 由圖可知,差分后的序列num1.dif的自相關(guān)圖和偏自相關(guān)圖都呈現(xiàn)出明顯的拖尾性,故可以先嘗試用加法季節(jié)模型ARIMA(1,(1,12),1)去擬合原始序列,并對其殘差序列進(jìn)行白噪聲檢驗,檢驗結(jié)果見表2. 表2 殘差序列的白噪聲檢驗結(jié)果 由表2知,雖然在延遲6階情況下的P值是遠(yuǎn)遠(yuǎn)大于0.05的,但是在延遲12階時P值已經(jīng)遠(yuǎn)小于0.05,于是可以判定擬合的加法季節(jié)模型的殘差序列屬于非白噪聲序列,說明該模型擬合序列的效果不理想,由此可以推出加法季節(jié)模型并不適合這個序列,所以考慮更換為乘積季節(jié)模型. 先觀察序列num1.dif 12階以內(nèi)的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的特征.由圖5和圖6可知,序列num1.dif在滯后期數(shù)為12階以內(nèi)的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都不是截尾的,故可嘗試用ARMA(1,1)模型去提取序列num1.dif的短期自相關(guān)信息.接著觀察12階、24階等以周期長度為單位的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)來考察序列的季節(jié)自相關(guān)特征.由圖5可以看出,雖然延遲12階的自相關(guān)系數(shù)是顯著非零的,但是延遲24階的自相關(guān)系數(shù)落入了2倍標(biāo)準(zhǔn)差范圍之內(nèi)?而不管是延遲12階還是延遲24階的偏自相關(guān)系數(shù)都顯示出顯著非零的特性.因此,我們認(rèn)為自相關(guān)系數(shù)是截尾的,偏自相關(guān)系數(shù)是拖尾的,故可用12步周期的ARMA(0,1)12模型去提取序列num1.dif的季節(jié)自相關(guān)信息. 綜合前面的分析,我們確定利用乘積季節(jié)模型ARIMA(1,1,1)×(0,1,1)12去擬合原始序列,模型如下: 其中?表示步長為1的差分算子,?12表示步長為12的差分算子,B為延遲算子,xt為時間序列在t時刻的值,εt為白噪聲序列在t時刻的值. 用R軟件進(jìn)行計算,得到的擬合結(jié)果見表3. 表3 ARIMA(1,1,1)×(0,1,1)12模型擬合結(jié)果 模型的階數(shù)是依據(jù)自相關(guān)圖和偏自相關(guān)圖所定,具有一定的主觀性.我們可以嘗試用不同階數(shù)的模型去擬合序列.因此,我們再用ARIMA(1,1,1)×(1,1,0)12模型對序列進(jìn)行擬合,然后對擬合的兩個模型的殘差序列進(jìn)行白噪聲檢驗.檢驗結(jié)果見表4. 表4 兩個擬合模型的殘差序列白噪聲檢驗 由表4知,兩個模型的LB統(tǒng)計量的P值在各階延遲下都遠(yuǎn)遠(yuǎn)地大于0.05,說明兩個模型的殘差序列都屬于白噪聲序列,即不管是模型ARIMA(1,1,1)×(0,1,1)12還是模型ARIMA(1,1,1)×(1,1,0)12,對原始序列的擬合效果都比較好.最后,由于ARIMA(1,1,1)×(0,1,1)12模型的AIC值和BIC值比模型ARIMA(1,1,1)×(1,1,0)12的小一點,我們最終選擇用第一個模型去擬合序列. 根據(jù)模擬輸出結(jié)果,擬合的模型如下: (4)預(yù)測 根據(jù)2004年—2012年上海市月度入境旅游人數(shù)建立的乘法季節(jié)模型,對上海市接下來8個月的入境游客人數(shù)進(jìn)行預(yù)測,預(yù)測結(jié)果見表5. 表5 上海市未來8個月入境旅游人數(shù)預(yù)測 通過觀察原始序列時序圖可以發(fā)現(xiàn),在2010年,由于世博會的舉辦,上海市入境游客暴增,遠(yuǎn)高于往年同期水平.將時間序列分為世博會產(chǎn)生影響前和產(chǎn)生影響后兩個部分,通過干預(yù)分析建立干預(yù)模型,來分析世博會對上海市入境人數(shù)產(chǎn)生的影響. 3.3.1 世博會產(chǎn)生影響前的模型構(gòu)建 將時間序列num1分為世博會產(chǎn)生影響前(即預(yù)干預(yù)數(shù)據(jù)序列)和世博會產(chǎn)生影響后(從2010年3月份開始)的兩個時間序列. (1)平穩(wěn)性檢驗 將預(yù)干預(yù)數(shù)據(jù)的序列設(shè)為num3,并通過R軟件繪制num3時序圖(見圖7). 從圖7可以看出,從2004年1月開始到2010年2月世博會產(chǎn)生影響前的74個月期間,序列num3不僅存在著明顯的趨勢效應(yīng),還有顯著的季節(jié)效應(yīng),明顯是非平穩(wěn)的.這也可以通過序列的自相關(guān)圖(圖8)驗證. 圖7 序列num3時序圖 圖8 序列num3的自相關(guān)圖 (2)差分運算 為消除序列num3的季節(jié)和趨勢效應(yīng),先對其進(jìn)行12步差分處理去除季節(jié)效應(yīng),再進(jìn)行1階差分處理去除趨勢效應(yīng),然后觀察差分處理后的序列是否平穩(wěn),決定是否需要對其繼續(xù)差分.將序列num3經(jīng)過1階12步差分后的序列記為num3.dif.num3.dif的時序圖和自相關(guān)圖分別見圖9和圖10. 由圖9知,經(jīng)過差分處理后的序列nnum3.dif基本在零均值附近波動,而又由圖10知num3.dif的自相關(guān)系數(shù)都比較小,并且在滯后12期以后都在兩倍標(biāo)準(zhǔn)差之內(nèi),說明序列具有長期相關(guān)性,且序列num3在進(jìn)行1階12步差分后已經(jīng)平穩(wěn),不用繼續(xù)進(jìn)行差分. 圖9 序列num3.dif時序圖 圖10 序列num3.dif的自相關(guān)圖 接著,我們對序列num3.dif進(jìn)行白噪聲檢驗,結(jié)果如表6所示. 表6 序列num3.dif白噪聲檢驗 由表6知,P值遠(yuǎn)小于0.05,由此斷定num3.dif的序列值之間還存在著相關(guān)關(guān)系,屬于非白噪聲序列,因此可以根據(jù)過去的數(shù)據(jù)研究未來的發(fā)展. (3)模型識別與定階 序列num3.dif的偏自相關(guān)圖見圖11. 圖11 序列num3.dif偏自相關(guān)圖 首先確定短期相關(guān)模型.由圖10和圖11可以看出,序列num3經(jīng)過1階12步差分處理后,12階以內(nèi)的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)均不截尾,因此,可以用ARIMA(1,1)模型提取差分后所得序列的短期自相關(guān)信息. 再考慮季節(jié)自相關(guān)模型.根據(jù)圖10和圖11顯示的特點,滯后12期和滯后24期的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都顯著非零,并且滯后24期的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都落入2倍標(biāo)準(zhǔn)差范圍,因此,可以認(rèn)為季節(jié)自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)也是拖尾,故可嘗試以12步為周期的ARMA(1,1)12,ARMA(1,0)12和ARMA(0,1)12三個模型來提取差分后所得序列的季節(jié)自相關(guān)信息. 綜上,我們可以對num3序列建立三個乘積季節(jié)模型ARIMA(1,1,1)×(1,1,1)12,ARIMA(1,1,1)×(1,1,0)12和ARIMA(1,1,1)×(0,1,1)12,并對它們的殘差序列進(jìn)行白噪聲檢驗,結(jié)果如表7所示. 表7 殘差序列白噪聲檢驗結(jié)果 由表7可知,不管是延遲6階還是延遲12階三個模型的P值都遠(yuǎn)大于臨界值,表明三個模型都通過了殘差序列白噪聲檢驗,因此,不管用哪個模型去擬合序列num3都是顯著有效的.此外,第二個模型的AIC值和BIC值比第一個模型和第三個模型都要小,根據(jù)最小信息量準(zhǔn)則,我們選擇ARIMA(1,1,1)×(1,1,0)12模型對序列進(jìn)行擬合.用R軟件輸出的擬合結(jié)果見表8. 表8 ARIMA(1,1,1)×(1,1,0)12模型擬合結(jié)果 根據(jù)輸出的結(jié)果,擬合模型為: 3.3.2 世博會產(chǎn)生影響后的干預(yù)分析模型構(gòu)建 (1)干預(yù)模型構(gòu)建 以世博會產(chǎn)生影響后30個月內(nèi)上海市入境旅游人數(shù)為例,分析世博會對上海市入境旅游人數(shù)的影響. 首先利用上面建立的ARIMA(1,1,1)×(1,1,0)12模型進(jìn)行預(yù)測,再利用預(yù)測值進(jìn)行外推,將預(yù)測值作為沒有舉行世博會的上海市入境旅游人數(shù)的正常發(fā)展值.然后利用觀察值減去模型的預(yù)測值,得到受世博會影響的干預(yù)值序列. 對其進(jìn)行分析發(fā)現(xiàn),從2010年3月份開始,世博會開始產(chǎn)生影響,隨著世博會的舉行影響越來越大,隨后減小,但對上海市的入境旅游的長期發(fā)展產(chǎn)生了深遠(yuǎn)影響.這十分符合實際情況. 隨著世博會舉行,越來越多的外國游客來到上海,見證該盛事.因為世博會的舉辦,上海被更多人所熟知,自然就促進(jìn)了上海市入境旅游的發(fā)展. 世博會的影響屬于四種基本的干預(yù)模型形式中的一種,屬于一個階梯函數(shù)的情形,因此,由(1.6)可知,相應(yīng)的干預(yù)模型形式為: 其中, t=75對應(yīng)于2010年3月. 待建立的AR(1)自回歸模型是Zt=δZt?1+ω.利用R軟件,采用極大似然估計法對模型的參數(shù)進(jìn)行估計,并對擬合的模型進(jìn)行檢驗,得到的結(jié)果如表9. 表9 模型擬合與檢驗結(jié)果 由表9知,干預(yù)模型的參數(shù)估計值分別為:?δ=0.5481,^ω=167102.34,所以擬合的干預(yù)模型為: (2)凈化值序列構(gòu)建 先計算干預(yù)模型的擬合值,再用觀察值減去模型的擬合值,最后再加上預(yù)干預(yù)序列的實際值,就得到需要的凈化值.對凈化值序列利用ARIMA(1,1,1)×(0,1,1)12乘積季節(jié)模型進(jìn)行擬合,得到的擬合結(jié)果見表10. 表10 模型擬合結(jié)果 根據(jù)擬合結(jié)果,得到如下擬合模型: 接著對此模型進(jìn)行殘差序列白噪聲檢驗,檢驗結(jié)果見表11. 表11 模型ARIMA(1,1,1)×(0,1,1)12殘差序列白噪聲檢驗 根據(jù)檢驗結(jié)果,滯后6階和滯后12階的P值都大于臨界值,表明模型通過了檢驗,擬合效果顯著. 3.3.3 干預(yù)分析組合模型構(gòu)建 用凈化序列擬合的模型,加上估計的干預(yù)影響模型,即可得到在世博會影響下的上海市入境旅游人數(shù)序列的干預(yù)分析組合模型, 利用建立的干預(yù)分析模型對上海市2012年9月到2013年4月8個月的入境旅游人數(shù)進(jìn)行預(yù)測,結(jié)果見表12. 表12 上海市入境旅游未來8個月預(yù)測人數(shù) 本文利用上海市2004年1月到2012年8月入境旅游人數(shù)的數(shù)據(jù),建立了干預(yù)組合模型,并預(yù)測了接下來8個月的數(shù)據(jù).利用2012年9月到2013年4月8個月的實際值,可以求出實際值與模型預(yù)測值之間的相對誤差,并與一般的乘積季節(jié)模型ARIMA(1,1,1)×(0,1,1)12進(jìn)行對比,據(jù)此判斷利用哪個模型對于描述上海市入境旅游人數(shù)的發(fā)展規(guī)律更優(yōu). 2012年9月到2013年4月上海市入境人數(shù)的真值、兩個模型的預(yù)測值以及根據(jù)真值和預(yù)測值得出的相對誤差見表13. 由表13可知,雖然觀察值與兩個模型的預(yù)測值之間的相對誤差都比較小,但是相對于普通的乘積季節(jié)模型,干預(yù)分析模型的相對誤差更小,由此說明干預(yù)分析模型的預(yù)測值更接近于真實值,也就是說干預(yù)分析模型更能精準(zhǔn)地描述上海市入境旅游的發(fā)展情況. 表13 兩個模型預(yù)測結(jié)果對比 對于受重大政策和事件影響的時間序列,采用通常的時間序列分析方法有時并不能很好地對其進(jìn)行擬合和預(yù)測.此時,需要引入干預(yù)分析模型對其進(jìn)行分析預(yù)測. 第41屆上海世博會是一場全球盛事,此次世博會的舉辦對上海市入境旅游帶來了更多的發(fā)展機遇,對上海市入境旅游發(fā)展產(chǎn)生了重大影響.本文將上海市入境旅游人數(shù)作為統(tǒng)計指標(biāo),根據(jù)上海市2004年1月到2012年8月的入境人數(shù)序列建立了干預(yù)分析模型,然后根據(jù)建立的模型對接下來8個月的入境旅游人數(shù)進(jìn)行預(yù)測,得到了較好的擬合效果. 這說明有重大事件或者政策影響時,運用干預(yù)分析能更好地說明事件發(fā)展的規(guī)律,對未來作出更好的預(yù)測.3 干預(yù)模型的構(gòu)建
3.1 數(shù)據(jù)預(yù)處理
3.2 ARIMA模型乘積季節(jié)模型構(gòu)建
3.3 干預(yù)模型構(gòu)建
4 結(jié)論
4.1 模型對比
4.2 研究結(jié)論