鄭忠魁 郭萃宸 朱濤
摘 要:隨著生活水平的提高,人們對休閑娛樂的要求越來越高,大型游樂場成為了人們休閑娛樂的一個重要場所。為使游客達到最大滿意度、提高運營經(jīng)濟效益,對典型的大型游樂場游樂設(shè)施和游樂線路的布局、規(guī)劃、管理及相互協(xié)調(diào)進行了分析和擇優(yōu)。
關(guān)鍵詞:MATLAB仿真分析;大型游樂場的經(jīng)營和優(yōu)化;AR自回歸模型
一、AR譜估計的方法進行數(shù)學(xué)建模
譜估計的參數(shù)建模包括選擇一個合適的模型、估計模型的參數(shù)以及將這些估計值代入理論PSD公式三部分。這里分析的模型是時間序列模型。
自回歸模型(Autoregressive Model)是用自身做回歸變量的過程,即利用前期若干時刻的隨機變量的線性組合來描述以后某時刻隨機變量的線性回歸模型,它是時間序列中的一種常見形式。在該模型中,噪聲干擾驅(qū)動信號可以忽略不計,直接按照時間序列歷程信號進行AR自回歸模型建模,計算各階次擬合系數(shù)進行評估分析,進而預(yù)測。
時間序列模型:所謂的時間序列就是將所要研究的對象按照觀測時間的先后順序所形成的一種有序數(shù)列。時間序列分析是數(shù)學(xué)概率統(tǒng)計學(xué)科中應(yīng)用較廣泛的一個分支,在金融經(jīng)濟、地理氣象、通訊分析、醫(yī)學(xué)診斷、機械振動等眾多領(lǐng)域有著非常廣泛的應(yīng)用。時間序列預(yù)測模型主要的特點就是認為觀測值之間的依賴關(guān)系和相關(guān)性是存在的,觀測數(shù)據(jù)之間內(nèi)部和外部形成一定的規(guī)律和特征,它是一種能夠應(yīng)用于動態(tài)預(yù)測中的動態(tài)預(yù)測模型。
時間序列預(yù)測模型就是通過對觀測數(shù)據(jù)的分類和分析,根據(jù)時間序列所反映出來的數(shù)據(jù)內(nèi)部和外部之間的規(guī)律和相關(guān)性,進而通過數(shù)據(jù)關(guān)系描述出研究現(xiàn)象的發(fā)展過程和未來變化趨勢,然后再進行類推或延伸,以此來預(yù)測以后若干時間段內(nèi)可能的數(shù)據(jù)變化。其內(nèi)容包括:采集與分類所研究社會現(xiàn)象的歷史、數(shù)據(jù);然后對這些歷史數(shù)據(jù)進行分析并做檢查鑒別,按規(guī)律排序成特定數(shù)列然后對數(shù)列進行分析,從中尋找出數(shù)列的規(guī)律和數(shù)據(jù)相關(guān)性,進而得出合適的預(yù)測模型參數(shù)和階數(shù),并用此模型去預(yù)測未來趨勢。
二、數(shù)據(jù)預(yù)處理
2.1離群值的檢測和去離群值
數(shù)據(jù)中的離群值可能使數(shù)據(jù)處理結(jié)果和其他計算量嚴重失真。例如,如果我們嘗試用移動平均值方法對包含離群值的數(shù)據(jù)進行平滑處理,則可能得到誤導(dǎo)性的波峰或波谷。
那么如何檢測某個特征數(shù)據(jù)是否存在極端值呢?
1)對樣本數(shù)據(jù)進行可視化
2.2歸一化
歸一化概念:
1)把數(shù)據(jù)變成(0,1)或者(1,1)之間的小數(shù)。主要是為了數(shù)據(jù)處理方便提出來的,把數(shù)據(jù)映射到0~1范圍之內(nèi)處理,更加便捷快速
2)把有量綱表達式變成無量綱表達式,便于不同單位或量級的指標能夠進行比較和加權(quán)。歸一化是一種簡化計算的方式,即將有量綱的表達式,經(jīng)過變換,化為無量綱的表達式,成為純量
一般,我們常用的歸一化方法有兩種:min-max歸一化和z-score歸一化。
min-max歸一化:將數(shù)值范圍縮放到(0,1),但沒有改變數(shù)據(jù)分布;z-score歸一化:將數(shù)值范圍縮放到0附近, 但沒有改變數(shù)據(jù)分布;
在本題中,我們通過對數(shù)據(jù)規(guī)模的分析和處理,最終我們在MATLAB中使用normalize函數(shù)來對數(shù)據(jù)進行歸一化。
三、模型求解
對于AR譜估計通常有三種方案:Yule-Walker法,Wiener濾波法,最大熵(MEM)方法。
(1)Yule-Walker法:(尤爾-沃克方程為AR模型的系數(shù)和AR過程的歸一化相關(guān)系數(shù)建立起了唯一的對應(yīng)關(guān)系。)
對于滿足漸近平穩(wěn)的AR過程:
在式子兩邊同乘以且求期望:
故有,其中
最大熵法是對信號的功率譜密度估計的一種方法。其原理是取一組時間序列,使其自相關(guān)函數(shù)與一組已知數(shù)據(jù)的自相關(guān)函數(shù)相同,同時使已知自相關(guān)函數(shù)以外的部分的隨機性最強,以所取時間序列的譜作為已知數(shù)據(jù)的譜估值。它等效于根據(jù)使隨機過程的熵為最大的原則,利用N個已知的自相關(guān)函數(shù)值來外推其他未知的自相關(guān)函數(shù)值所得到的功率譜。最大熵法功率譜估值是一種可獲得高分辨率的非線性估計方法, 特別適用于數(shù)據(jù)長度較短的情況。
四、結(jié)果分析(或模型檢驗)
問題(1):請預(yù)測該游樂場2019年7月和8月每一天的游客的人數(shù),預(yù)測2019年下半年游客人數(shù)最多出現(xiàn)在那一天。
利用AR模型進行同比預(yù)測,利用2019年度的前半年和2018年度的前半年運營數(shù)據(jù),經(jīng)過去離群值、增量歸一化等預(yù)處理后,計算出增長百分比,預(yù)測2019年后半年人數(shù),2019年下半年游客人數(shù)最多出現(xiàn)在10月1日,對應(yīng)的峰值點對應(yīng)的日,聯(lián)系實際情況分析,由于是節(jié)假日,預(yù)測的人數(shù)最多也是合理情況。
問題(2):預(yù)測2019年8月5日A4,B5,B12,B25四個項目當(dāng)天的游玩人數(shù),以及8月5日每一個項目的平均排隊人數(shù)和平均等待時間。
預(yù)測的AR模型同(1),給出了A4,B5,B12,B25四個項目的游客人數(shù)趨勢,通過AR模型預(yù)測2019年8月5日A4,B5,B12,B25四個項目當(dāng)天的游玩人數(shù)14516、14468、689、12634,同比增長0.52、0.62、1.12、0.46。平均排隊人數(shù)和平均等待時間,取能容納的人數(shù)最大值,除以總時間,就是平均等待時間。通過模型預(yù)測分析可知,而且2019年8月5號會場場爆滿,8月5日當(dāng)天每一個項目的平均排隊人數(shù)和平均等待時間均比較長,與同期人流進行比對,8月5日是旺季,加上人流增長,不調(diào)整游玩策略一定會場場爆滿,不利于游人的玩耍。
問題(3):某游客計劃在2019年8月5日到該游樂場購買通票游玩,您認為按照怎樣順序游玩最合適?
用平均等待時間排序,從小到大,從需要排隊時間少的開始玩,能保證一直在玩項目而不是在排隊,排隊順序為如下圖8所示,
問題(4):對經(jīng)營者來說您認為通票價格定在225元是否合理?10元的門票費用是否可以取消?
利用AR模型評估每個項目游玩所需要的平均時間,如下圖9所示。用等待時間+玩耍每個項目的時間,求出每個項目共需要多少時間,然后求平均,得到平均每個項目耗費24分鐘,按照一天營業(yè)12小時算,大約能玩24或25個項目,作為消費者,一般只玩15個項目,每個項目的平均價格是20塊,共需要300塊,加上門票,一共310塊,大于225。因此消費者買通票更劃算,可以取消門票。
五、模型的不足
本題在設(shè)計模型求解過程中,使用的是自回歸(AR)模型。AR模型適用于具有尖峰但沒有深谷的譜分析,對時間歷程曲線有一定的要求,本文著重研究AR模型的建模及求解,并做了多個假設(shè),且忽略了不同時間歷程中存在的擾動,難免會有模型缺陷,值得后續(xù)繼續(xù)改善模型進行研究。
六、模型改進(或進一步討論)
AR模型適用于具有尖峰但沒有深谷的譜分,于此對應(yīng)的經(jīng)典的時間歷程預(yù)測建模與評估分析模型還用MA模型、ARMA模型,MA模型適用于具有深谷但沒有尖峰的譜,通用的ARMA模型對于兩種極端情況均適用。
參考文獻
[1]李志飛.主題公園開發(fā)[M].科學(xué)出版社,2000,08:90-100.
[2]熊瑛.大型主題公園策劃與規(guī)劃研究[D].北京工業(yè)大學(xué),2001,07:32-50.