周穎 陳書文(通訊作者) 張容 江蘇第二師范學(xué)院數(shù)學(xué)與信息技術(shù)學(xué)院
隨著國民經(jīng)濟(jì)快速發(fā)展、人口增多、人們外出機(jī)會(huì)的增加,我國鐵路客運(yùn)壓力越來越大。準(zhǔn)確地預(yù)測(cè)鐵路客運(yùn)量的年度增幅,對(duì)鐵路建設(shè)的規(guī)劃和運(yùn)營時(shí)的車輛調(diào)度,有著重要意義。實(shí)際生活中,鐵路客運(yùn)量的變化是多種因素共同作用的結(jié)果,不同因素的影響程度不同,相關(guān)部門也迫切希望能對(duì)這些因素的貢獻(xiàn)率進(jìn)行定量分析,其結(jié)果可作為管理決策的依據(jù)。當(dāng)前,傳統(tǒng)的預(yù)測(cè)方法主要有灰色預(yù)測(cè)、時(shí)間序列預(yù)測(cè)等,它們一般都是基于隨機(jī)過程的序列預(yù)測(cè),只適用于影響因素較少的情況。另一方面,鐵路客運(yùn)量在時(shí)間上具有不確定性和高度的非線性等特征,很難找到準(zhǔn)確的數(shù)學(xué)表達(dá)模型。人工神經(jīng)網(wǎng)絡(luò)技術(shù)因其支持多維數(shù)據(jù)的非線性映射能力,適用于復(fù)雜的非線性預(yù)測(cè)問題。但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)也有局限性,如BP神經(jīng)網(wǎng)絡(luò)存在訓(xùn)練收斂速度慢,不具有全局搜索能力,易陷入局部極值點(diǎn)。而粒子群算法具有收斂速度快、全局搜索能力強(qiáng),若用它來優(yōu)化神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和連接權(quán)值,可以較好地克服上述缺點(diǎn),增加神經(jīng)網(wǎng)絡(luò)的泛化和學(xué)習(xí)能力。
因此,本文提出粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)方法,用于鐵路客流量的準(zhǔn)確預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該模型學(xué)習(xí)速度與預(yù)測(cè)精度大幅提高,可作為鐵路客流預(yù)測(cè)工具應(yīng)用于實(shí)踐。
BP神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前向網(wǎng)絡(luò),主要包括3層:輸入層、輸出層和隱含層。各層節(jié)點(diǎn)之間相互連接,但同層節(jié)點(diǎn)之間沒有任何連接。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程包括:信號(hào)的正向傳播和誤差的反向傳播。在正向傳播過程中,信號(hào)依次經(jīng)過輸入層、隱含層、輸出層,前一層神經(jīng)元的狀態(tài)能對(duì)下一層神經(jīng)元產(chǎn)生影響;在反向過程中,誤差信號(hào)經(jīng)輸出層、隱含層、輸入層反向傳播,對(duì)各層神經(jīng)元的權(quán)值進(jìn)行調(diào)整,這樣通過反復(fù)修改連接權(quán)值和閾值來減小網(wǎng)絡(luò)輸出誤差,直至算法收斂。
粒 子 群 算 法(Particle Swarm Optimization,PSO)是 一 種基于群體智能理論的全局優(yōu)化技術(shù)。數(shù)學(xué)模型描述為:在一個(gè)連續(xù)的D維空間中,粒子群的規(guī)模為N,每個(gè)粒子的坐標(biāo)位置為D維向量粒子運(yùn)動(dòng)速度為單個(gè)粒子
位置按如下公式更新
圖1 粒子運(yùn)動(dòng)速度和位置更新示意圖
使用粒子群算法(PSO)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)權(quán)值的關(guān)鍵概括為:一是建立粒子群的維度空間與神經(jīng)網(wǎng)絡(luò)連接權(quán)值之間的映射關(guān)系,即每個(gè)粒子的維度分量對(duì)應(yīng)為神經(jīng)網(wǎng)絡(luò)中的一個(gè)連接權(quán)值(包括偏置值);二是用神經(jīng)網(wǎng)絡(luò)輸出的均方誤差作為 PSO 的適應(yīng)函數(shù),通過其強(qiáng)大的全局搜索能力使網(wǎng)絡(luò)的均方誤差最小化。例如一個(gè)3層的神經(jīng)網(wǎng)絡(luò),當(dāng)輸入層神經(jīng)元數(shù)為m,隱含層神經(jīng)元數(shù)為n,輸出層神經(jīng)元數(shù)為l時(shí),粒子的維度
D就是神經(jīng)網(wǎng)絡(luò)的所有權(quán)值與閾值數(shù)量之和,即
訓(xùn)練樣本確定后,神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出可看作以權(quán)值和域值為自變量的函數(shù),則適應(yīng)度函數(shù)可選為所有樣本網(wǎng)絡(luò)輸出的均方誤差
相關(guān)影響因素選取2003至2016年的國內(nèi)生產(chǎn)總值(億元)、全國人口數(shù)量(萬人)、城鎮(zhèn)人口數(shù)量(萬人)、國內(nèi)游客數(shù)量(百萬人次)、居民消費(fèi)水平(元)、經(jīng)濟(jì)活動(dòng)人口(萬人)、旅客運(yùn)輸總量(萬人)、人均國內(nèi)生產(chǎn)總值(元)8個(gè)指標(biāo)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練輸入,并用統(tǒng)計(jì)當(dāng)年的后一年全國鐵路客運(yùn)量(萬人)作為神經(jīng)網(wǎng)絡(luò)的輸出,所有數(shù)據(jù)均來源于國家統(tǒng)計(jì)局(http://www.stats.gov.cn/)及行業(yè)主管部門發(fā)布的信息。由于原始數(shù)據(jù)不同維數(shù)之間的取值范圍相差較大,需預(yù)先映射到[-1,1]的區(qū)間中,再送入訓(xùn)練。
設(shè)置BP網(wǎng)絡(luò)隱含層的神經(jīng)元數(shù)為10 , 粒子群總數(shù)為14,最大迭代次數(shù)為100,收斂門限為10-6。從圖1看出,PSO-BP神經(jīng)網(wǎng)絡(luò)經(jīng)過5輪訓(xùn)練可以收斂。
圖2 PSO-BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程
當(dāng)網(wǎng)絡(luò)輸入2017年的統(tǒng)計(jì)數(shù)據(jù):國內(nèi)生產(chǎn)總值GDP(827122億元)、全國人口數(shù)量(140500萬人)、城鎮(zhèn)人口數(shù)量(81347萬人)、國內(nèi)游客數(shù)量(5000百萬人次)、居民消費(fèi)水平(23300元)、經(jīng)濟(jì)活動(dòng)人口(80734萬人)、旅客運(yùn)輸總量(1851000萬人)、人均國內(nèi)生產(chǎn)總值(59660元),神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)出2018全年的鐵路客運(yùn)量為326980萬人。
由于管理和決策部門需要了解不同影響因素對(duì)鐵路客運(yùn)量的貢獻(xiàn)大小,可以對(duì)已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)通過變化要測(cè)試的影響因素,重新查看網(wǎng)絡(luò)的輸出來計(jì)算。測(cè)試中,其它因素固定不變,最終結(jié)果表明,人均國內(nèi)生產(chǎn)總值、居民消費(fèi)水平二個(gè)因素對(duì)鐵路客運(yùn)量的貢獻(xiàn)影響最大,其他因素影響較小。其中人均國內(nèi)生產(chǎn)總值每增加1‰會(huì)使鐵路全年客運(yùn)壓力增加161萬人,居民消費(fèi)水平每增加1‰,會(huì)使鐵路全年客運(yùn)壓力增加96萬人。我國經(jīng)濟(jì)連續(xù)多年的發(fā)展,使得人均居民消費(fèi)水平不斷提高。大規(guī)模的高鐵建設(shè)也使得鐵路出行越來越便捷,成為居民的首選。所以,即使在全年旅客運(yùn)輸總量有所下降的情況下,鐵路承擔(dān)的客運(yùn)量仍在逐年上升。
本文提出使用粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)鐵路客運(yùn)量,該模型學(xué)習(xí)速度與預(yù)測(cè)精度大幅提高,可作為鐵路客流預(yù)測(cè)工具應(yīng)用于實(shí)踐。相比2017年的數(shù)據(jù),2018年鐵路客運(yùn)量的預(yù)測(cè)值增加了18480萬人次,增幅達(dá)5.9%左右。此外,根據(jù)測(cè)算,當(dāng)前的人均國內(nèi)生產(chǎn)總值和居民消費(fèi)水平二個(gè)因素對(duì)鐵路客運(yùn)量的貢獻(xiàn)影響較大。