曹 爽,張青鳳,張 雷,孫 濤
(運(yùn)城學(xué)院數(shù)學(xué)與信息技術(shù)學(xué)院,山西運(yùn)城044000)
隨著經(jīng)濟(jì)的不斷發(fā)展,我國(guó)的旅游消費(fèi)需求開始不斷增長(zhǎng).旅游業(yè)成為了經(jīng)濟(jì)發(fā)展中的支柱型產(chǎn)業(yè),它能夠帶動(dòng)經(jīng)濟(jì)消費(fèi)、解決就業(yè)問題等.對(duì)景區(qū)游客數(shù)量的精確預(yù)測(cè)[1-2],可以幫助旅游相關(guān)部門制定合理的旅游規(guī)劃,優(yōu)化配置并避免因決策失誤造成的經(jīng)濟(jì)和環(huán)境損失.傳統(tǒng)的景區(qū)游客數(shù)量預(yù)測(cè)方法[3],在面對(duì)突發(fā)狀況的預(yù)測(cè)結(jié)果和實(shí)際狀況之間的誤差很大[4],而BP神經(jīng)網(wǎng)絡(luò)有處理該問題的能力[5].本文基于BP神經(jīng)網(wǎng)絡(luò)對(duì)景區(qū)游客數(shù)量進(jìn)行預(yù)測(cè)[6],預(yù)測(cè)結(jié)果更準(zhǔn)確,更適用于游客數(shù)量現(xiàn)實(shí)狀況的預(yù)測(cè).
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[7-8]也稱前饋神經(jīng)網(wǎng)絡(luò)[9],是一種按照誤差逆向傳播[10]算法訓(xùn)練的網(wǎng)絡(luò)結(jié)構(gòu)[11].它的參數(shù)權(quán)重值[12]是由反向傳播學(xué)習(xí)算法[13]進(jìn)行調(diào)整的,拓?fù)浣Y(jié)構(gòu)[14]包括輸入層(input)、隱藏層(hide layer)和輸出層(output).利用激活函數(shù)實(shí)現(xiàn)從輸入到輸出的任意非線性映射,從而模擬各層神經(jīng)元之間的交互[15],常用的激活函數(shù)為sigmoid函數(shù).
Wij表示隱含層第i個(gè)節(jié)點(diǎn)到輸入層第j個(gè)節(jié)點(diǎn)之間的權(quán)值;
Xi表示第i個(gè)輸入變量;
θi表示隱含層第i個(gè)節(jié)點(diǎn)的閾值;
Φ(x)表示隱含層的激勵(lì)函數(shù);
ak表示輸出層第k個(gè)節(jié)點(diǎn)的閾值k=1,…,L;
Ψ(x)表示輸出層的激勵(lì)函數(shù);
輸出層第k個(gè)節(jié)點(diǎn)的輸入Nk,k=1:
輸出層第k個(gè)節(jié)點(diǎn)的輸出Ok,k=1:
主要操作步驟如下:
1)將樣本數(shù)據(jù)分成測(cè)試集和訓(xùn)練集,并對(duì)其進(jìn)行歸一化處理.
max為樣本數(shù)據(jù)最大值,min為樣本數(shù)據(jù)最小值.
2)參數(shù)初始化.設(shè)置最大迭代次數(shù)、學(xué)習(xí)率、訓(xùn)練目標(biāo).
3)訓(xùn)練網(wǎng)絡(luò).并把歸一化數(shù)據(jù)放入網(wǎng)絡(luò)輸出數(shù)據(jù),將得到的數(shù)據(jù)反歸一化得到預(yù)測(cè)結(jié)果.
使用軟件MATLAB R2016b編寫實(shí)驗(yàn)仿真代碼.
3.1.1 BP預(yù)測(cè)模型輸入輸出變量
實(shí)驗(yàn)數(shù)據(jù)為山西省永濟(jì)市鸛雀樓2015-2019年5月份的每日游客數(shù)量及其他相關(guān)數(shù)據(jù),由運(yùn)城市旅游局和氣象局提供.選出與游客當(dāng)天實(shí)際數(shù)量y關(guān)聯(lián)度最大的三個(gè)因素:運(yùn)城市的國(guó)內(nèi)生產(chǎn)總值o1(景區(qū)5月每天的收入),景區(qū)周圍酒店每日入住游客數(shù)量o2,景區(qū)網(wǎng)站每天的訂票數(shù)量o3作為BP網(wǎng)絡(luò)預(yù)測(cè)模型的三個(gè)輸入變量.
分析數(shù)據(jù)顯示,對(duì)景區(qū)鸛雀樓5月份游客數(shù)量波動(dòng)影響較大的兩大因素,分別是節(jié)假日和天氣,在節(jié)假日期間可發(fā)現(xiàn)游客數(shù)量明顯增加,雨天顯著減少.由于天氣和節(jié)假日均是非數(shù)值型變量,而神經(jīng)網(wǎng)絡(luò)只能處理數(shù)值類型的輸入變量,所以對(duì)兩大因素采取如下變換:
t0=-1(節(jié)假日),t0=1(非節(jié)假日),t1=-1(雨天),t1=1(非雨天);
其中,t0為節(jié)假日因素.t1為天氣因素.
綜上,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型共5個(gè)輸入變量,1個(gè)輸出變量.
3.1.2建立BP預(yù)測(cè)模型
BP網(wǎng)絡(luò)模型隱層節(jié)點(diǎn)數(shù)11,輸出節(jié)點(diǎn)數(shù)1,輸入節(jié)點(diǎn)數(shù)5,可得到5-11-1結(jié)構(gòu)的預(yù)測(cè)模型.共有11+1=12個(gè)閾值,11×1+11×5=66個(gè)權(quán)值,則向量空間維數(shù)D=78,模型的輸入向量為Vi=(o1,o2,o3,t1,t2),輸出向量為Y,則BP網(wǎng)絡(luò)模型的函數(shù)可表示為:Y=F(o1,o2,o3,t0,t1).
實(shí)驗(yàn)從r2(擬合系數(shù)),RE(相對(duì)誤差絕對(duì)值),MAPE(平均絕對(duì)百分誤差)這三個(gè)角度對(duì)算法進(jìn)行評(píng)估,假設(shè)測(cè)試集有Np給測(cè)試點(diǎn),預(yù)測(cè)點(diǎn)的平均值為yt,真實(shí)'值為yi,預(yù)測(cè)值為y,則
式(6)中,擬合系數(shù)r2用來評(píng)估模型的擬合能力,r2[0,1],r2越接近1,則模型的擬合能力越強(qiáng).式(7),RE為預(yù)測(cè)點(diǎn)的預(yù)測(cè)誤差.式(8),實(shí)際值與預(yù)測(cè)值的整體相對(duì)偏差,用來評(píng)估算法的準(zhǔn)確性.
山西省運(yùn)城永濟(jì)市鸛雀樓景區(qū)2019年5月份的31組數(shù)據(jù)用作測(cè)試數(shù)據(jù)集,2015-2018年5月份124組數(shù)據(jù)用作訓(xùn)練數(shù)據(jù)集,并用來對(duì)BP網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和測(cè)試.
3.3.1 BP算法參數(shù)初始化
確定初始參數(shù):設(shè)置最大迭代次數(shù)為K=200,學(xué)習(xí)率為0.01,訓(xùn)練目標(biāo)為0.00001.
3.3.2實(shí)驗(yàn)預(yù)測(cè)
因網(wǎng)絡(luò)初始化的權(quán)值、閾值是隨機(jī)的,所以每次運(yùn)算結(jié)果都不一樣,為找到理想結(jié)果,這里以3次預(yù)測(cè)為準(zhǔn).下圖為3次預(yù)測(cè)結(jié)果.
圖1為運(yùn)城2019年鸛雀樓游客數(shù)量預(yù)測(cè),圖2為真實(shí)值和預(yù)測(cè)值之間得到相對(duì)誤差變化.
從圖1中可看出真實(shí)值曲線大致上位于預(yù)測(cè)值曲線下方.從圖2中可看出真實(shí)值和預(yù)測(cè)值間的相對(duì)誤差在0到0.5之間,部分變化幅度較大.在五一勞動(dòng)節(jié)前3天、后20天這2個(gè)時(shí)段相對(duì)誤差預(yù)測(cè)準(zhǔn)確度相對(duì)較高,整體預(yù)測(cè)效果較好.
從表1中可看出,3次預(yù)測(cè)的擬合系數(shù)r2值在90%以上,擬合能力良好.平均絕對(duì)百分誤差值MAPE在10%左右,算法準(zhǔn)確度較高.BP網(wǎng)絡(luò)預(yù)測(cè)模型實(shí)驗(yàn)結(jié)果理想.
表1 三次預(yù)測(cè)結(jié)果評(píng)價(jià)指標(biāo)值.
實(shí)驗(yàn)結(jié)果表明BP模型能有效解決非線性回歸問題,在景區(qū)游客數(shù)量預(yù)測(cè)方面表現(xiàn)良好.但值得說明的是在5月5、22、23日這三天相對(duì)誤差不穩(wěn)定,BP模型對(duì)景區(qū)游客數(shù)量波動(dòng)性方面的適應(yīng)力有待提高.
對(duì)于游客數(shù)量的預(yù)測(cè)可以為旅游規(guī)劃部門和旅游管理部門提供指導(dǎo)和幫助,具有至關(guān)重要的意義和作用,本文通過分析景區(qū)游客數(shù)量的強(qiáng)非線性和動(dòng)態(tài)性,提出基于BP神經(jīng)網(wǎng)絡(luò)的游客數(shù)量預(yù)測(cè)算法.相比傳統(tǒng)算法解決了因突發(fā)情況而帶來的誤差,提高了預(yù)測(cè)的效果和精確性,使研究成果更具科學(xué)性和應(yīng)用價(jià)值.對(duì)鸛雀樓游客數(shù)量預(yù)測(cè)的實(shí)際預(yù)測(cè)顯示,基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型有較高的預(yù)測(cè)準(zhǔn)確率,用于景區(qū)游客數(shù)量預(yù)測(cè)是有效的.以后的研究重點(diǎn)是如何進(jìn)一步提高BP算法對(duì)景區(qū)游客數(shù)量的預(yù)測(cè)精度.
渤海大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年2期