靳文舟,韓博文,郝小妮,黃瑋琪
(華南理工大學(xué) 土木與交通學(xué)院,廣東 廣州 510640)
如今基于“互聯(lián)網(wǎng)+”的新型定制化公共交通出行方式越來越多的出現(xiàn)在人們生活中。這種新型定制化出行方式以人們出行需求為導(dǎo)向,提供定制化的出行服務(wù)。例如:為解決目前普遍存在的城市大型對外交通樞紐與城市道路客運交通無法很好銜接的問題,擬規(guī)劃的廣州南站商務(wù)專線定位于運用“互聯(lián)網(wǎng)+”技術(shù)為商務(wù)人士以及追求方便、快捷、舒適出行體驗的乘客提供抵離廣州南站的定制化出行服務(wù)。該專線有以下特點:① 公共交通屬性,如定點、定時、固定線路等;② 采用商務(wù)車型使其比常規(guī)公交和地鐵更加快捷、舒適;③ 預(yù)約上下車點可有效解決“最后一公里”的問題;④ 價格定位于出租車與公交之間,因此比出租車更有價格優(yōu)勢;⑤ 在服務(wù)上較常規(guī)公交和地鐵更具吸引力。
白玉方等[1]研究表明:增強公交的快速性和便捷性能提高出行者公交出行意愿,但商務(wù)專線發(fā)展前景如何,是否能讓乘客對其產(chǎn)生較強的出行意愿,還有待于進一步研究。筆者以目標乘客出行意愿為對象的研究可歸結(jié)為交通方式選擇行為的研究[2-8]。通過對乘客相關(guān)特征分析,從而預(yù)測其交通方式選擇的意愿偏好。
目前,學(xué)界通常采用離散選擇模型[9]、神經(jīng)網(wǎng)絡(luò)[10-11]等方法進行研究。離散選擇模型中最具代表性的為Logit模型和Probit模型,兩者均是基于效用最大化原理,以微觀決策者為研究對象,對決策者選擇行為進行研究,但兩者均有著一定缺陷和不足。神經(jīng)網(wǎng)絡(luò)具備較強的模擬任意非線性關(guān)系能力和模式識別能力,筆者基于定制公交目標乘客出行意愿預(yù)測從本質(zhì)上而言是一個選擇分類的問題——即是否有意愿乘坐定制公交出行,且乘客出行意愿與其影響因素之間存在復(fù)雜的非線性關(guān)系,因此神經(jīng)網(wǎng)絡(luò)較適用于文中乘客出行意愿預(yù)測。通過目標乘客出行意愿調(diào)查(stated preference survey),筆者獲取了大量乘客出行特征,并基于小波神經(jīng)網(wǎng)絡(luò)對乘客出行意愿進行預(yù)測研究,從而為新型定制公交規(guī)劃提供依據(jù)。
目前運用神經(jīng)網(wǎng)絡(luò)對乘客出行意愿進行預(yù)測的研究較少,且現(xiàn)有研究所運用的神經(jīng)網(wǎng)絡(luò)類型大都較為落后,如概率神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)等。筆者嘗試運用較為先進的小波神經(jīng)網(wǎng)絡(luò)對基于定制公交的乘客出行意愿進行預(yù)測。筆者通過搜集大量樣本數(shù)據(jù)進行計算分析,獲得了較為全面的乘客出行意愿影響因素,不僅包括乘客自身屬性,還包括了影響乘客出行意愿的一些關(guān)鍵出行特征,讓預(yù)測更具科學(xué)性。為改善網(wǎng)絡(luò)訓(xùn)練效果,筆者采用自適應(yīng)方法對網(wǎng)絡(luò)學(xué)習(xí)速率和隱含層節(jié)點數(shù)進行確定,并采用成批訓(xùn)練方法對網(wǎng)絡(luò)進行訓(xùn)練,以減少訓(xùn)練過程中振蕩的發(fā)生。
筆者以廣州南站商務(wù)專線的目標乘客出行意愿為研究實例,對目標乘客出行意愿的影響因素進行分析。廣州南站商務(wù)專線的主要服務(wù)對象是廣州市抵離廣州南站的乘客,本次乘客出行意愿調(diào)查共回收有效問卷9 522份,通過對調(diào)研數(shù)據(jù)統(tǒng)計分析發(fā)現(xiàn):乘客自身屬性(性別、年齡、職業(yè)、年收入)以及乘客出行特征(出行目的、出行起訖點、出行是否換乘、現(xiàn)狀出行方式等)都對乘客未來是否有意愿乘坐商務(wù)專線有著顯著影響。
1.1.1 性 別
在出行方式選擇上,男性乘客與女性乘客之間的注重點有所不同,因此男女乘客的出行意愿會有所差異。調(diào)查結(jié)果顯示:男性乘客乘坐商務(wù)專線的意愿高于女性乘客。
1.1.2 年 齡
不同年齡段乘客在經(jīng)濟基礎(chǔ)、消費理念、出行習(xí)慣以及偏好上均有所差異,因此其出行意愿會有所差異。調(diào)查結(jié)果顯示:18~30歲年齡段乘客出行意愿最高,其次分別為30~40歲、40~60歲、18歲以下、60歲以上的乘客。
1.1.3 職 業(yè)
調(diào)查結(jié)果顯示:機關(guān)企事業(yè)人員對商務(wù)專線的意愿最高,學(xué)生、企業(yè)家、離退休人員及其他職業(yè)人群的意愿較低,不同職業(yè)乘客的出行意愿具有明顯差異。
1.1.4 年收入
由于商務(wù)專線運價定位于公共交通和出租車之間,提供中高端出行服務(wù),因此年收入較低的乘客對其出行意愿較低;又由于年收入很高的乘客大都擁有私家車,因此其出行意愿也較低。調(diào)查結(jié)果顯示:出行意愿較強的乘客主要為年收入在5~10萬、10~20萬之間的人群,年收入在30萬以上和5萬以下的乘客出行意愿較低。
1.2.1 出行目的
調(diào)查結(jié)果顯示:以商務(wù)出行、探親、旅游等出行目的的乘客對商務(wù)專線意愿較高,特別是商務(wù)出行的乘客;以其他出行目的的乘客(學(xué)生、日常通勤的車站工作人員等)由于其消費水平較低或出行選擇較多,對于商務(wù)專線的出行意愿稍低。
1.2.2 出行起訖點
不同地區(qū)經(jīng)濟發(fā)展不同,城市道路網(wǎng)、公共交通建設(shè)發(fā)展不同,導(dǎo)致不同地區(qū)抵離廣州南站交通條件便利程度不同。如:荔灣區(qū)、天河區(qū)、海珠區(qū)等核心區(qū)域具有完善的公共交通運輸服務(wù)體系,乘客抵離廣州南站方式較多,出行滿意度較高,對商務(wù)專線出行意愿較低;而南沙區(qū)、黃浦區(qū)、白云區(qū)、番禺區(qū)的公共交通和道路條件建設(shè)相對滯后,乘客抵離廣州南站方式較少,出行滿意度較低,導(dǎo)致乘客對商務(wù)專線出行意愿較高。
1.2.3 出行是否換乘
乘客出行便捷度一部分體現(xiàn)在是否需要換乘上,換乘導(dǎo)致的出行不便會增加乘客對直達商務(wù)專線的出行意愿。調(diào)查結(jié)果顯示:來往廣州南站需要換乘的乘客對商務(wù)專線出行意愿明顯高于不需要換乘的乘客。
1.2.4 出行方式
出行方式主要分為:出租車、地鐵、公交、長途汽車、私家車。由于這5種出行方式服務(wù)水平有所不同,且商務(wù)專線對這5種出行方式的競爭優(yōu)勢有所不同,因此現(xiàn)行的各類出行方式乘客對商務(wù)專線的出行意愿也會有所不同。調(diào)查結(jié)果顯示:各類出行方式乘客中,出租車乘客對商務(wù)專線出行意愿最高,其次為地鐵、公交、長途汽車,最低的是私家車。
因此,筆者將性別、年齡、職業(yè)、年收入、出行目的、出行起訖點、出行是否換乘和乘客出行方式作為影響乘客出行意愿的8個主要因素。
小波神經(jīng)網(wǎng)絡(luò)(wavelet neural network, WNN)是小波分析理論與神經(jīng)網(wǎng)絡(luò)理論相結(jié)合的產(chǎn)物[12]。筆者構(gòu)建的小波神經(jīng)網(wǎng)絡(luò)以3層BP(back propagation)神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)為基礎(chǔ),是一種以小波基函數(shù)代替Sigmoid函數(shù)作為隱含層節(jié)點的傳遞函數(shù)神經(jīng)網(wǎng)絡(luò)。把目標乘客出行意愿影響因素標定值作為網(wǎng)絡(luò)輸入,將目標乘客出行意愿作為網(wǎng)絡(luò)輸出,利用共軛梯度法來修正網(wǎng)絡(luò)權(quán)值和小波系數(shù)。筆者所構(gòu)建的小波神經(jīng)網(wǎng)絡(luò)可避免BP神經(jīng)網(wǎng)絡(luò)等結(jié)構(gòu)設(shè)計上的盲目性,從根本上避免了局部最優(yōu)等非線性優(yōu)化問題,具有較強的函數(shù)學(xué)習(xí)能力,能對目標乘客出行意愿與其影響因素之間存在的復(fù)雜非線性關(guān)系實現(xiàn)較高精度模擬。
小波神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層這3層結(jié)構(gòu)組成,其結(jié)構(gòu)如圖1。
輸入層輸入為:xi(i=1, 2, …,N1),隱含層輸出為:yh(h=1, 2, …,N2),輸出層輸出為:zj(j=1, 2, …,N2),網(wǎng)絡(luò)期望輸出為dj。筆者將目標乘客出行意愿的8個影響因素作為小波神經(jīng)網(wǎng)絡(luò)輸入變量,故網(wǎng)絡(luò)輸入層有8個神經(jīng)元(N1=8);由于網(wǎng)絡(luò)輸出結(jié)果僅為乘客的出行意愿(是為1;否為2),因此網(wǎng)絡(luò)輸出層為1個神經(jīng)元(N2=1)。隱含層神經(jīng)單元數(shù)N2則是根據(jù)訓(xùn)練誤差要求自適應(yīng)確定,從而克服了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)不足。
圖1 小波神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)Fig. 1 Wavelet neural network topology
小波神經(jīng)網(wǎng)絡(luò)前饋計算描述如下:
對于隱含層,有式(1):
(1)
對于輸出層,有式(2):
(2)
式中:neth為隱含層第h個神經(jīng)元的輸入值;netj為輸出層第j個神經(jīng)元的輸入值;wih為輸入層第i個神經(jīng)元與隱含層第h個神經(jīng)元之間的連接權(quán)值;whj為隱含層第h個神經(jīng)元與輸出層第j個神經(jīng)元之間的連接權(quán)值;f(net)為隱含層傳遞函數(shù),文中使用Morlet小波函數(shù)作為隱含層傳遞函數(shù);g(net)為輸出層傳遞函數(shù),文中使用Sigmoid函數(shù)作為輸出層傳遞函數(shù),以便于對預(yù)測結(jié)果進行分類處理,同時減少訓(xùn)練過程中發(fā)散的可能性。
f(net)和g(net)的計算如式(3):
(3)
式中:b為小波基函數(shù)的平移因子;a為小波基函數(shù)的伸縮因子;β為常數(shù)。
小波神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)實質(zhì)是輸入輸出樣本集對網(wǎng)絡(luò)進行訓(xùn)練,根據(jù)實際輸出與期望輸出誤差E不斷調(diào)整網(wǎng)絡(luò)各層之間的連接權(quán)值和小波基函數(shù)參數(shù),直到誤差小于預(yù)先設(shè)定的某個精度值ε(ε>0)或訓(xùn)練次數(shù)n達到最大訓(xùn)練次數(shù)N時停止網(wǎng)絡(luò)學(xué)習(xí),其具體學(xué)習(xí)過程如圖2。訓(xùn)練過程中,筆者采用有動量的梯度下降法對網(wǎng)絡(luò)權(quán)值和小波基函數(shù)參數(shù)進行修正,該方法利用前一步得到的修正值來平滑學(xué)習(xí)路徑,從而避免了網(wǎng)絡(luò)陷入局部極小值缺陷,加快學(xué)習(xí)速度。由于在對單個樣本進行逐一訓(xùn)練時,會引起權(quán)值和參數(shù)的修正振蕩,因此筆者采用成批訓(xùn)練方法,如每次訓(xùn)練P個樣本則對網(wǎng)絡(luò)參數(shù)修正一次,從而避免了振蕩發(fā)生。
圖2 小波神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)過程Fig. 2 Algorithm learning process of wavelet neural network
網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)按如下方法自適應(yīng)確定:取小波神經(jīng)網(wǎng)絡(luò)的隱含層單元數(shù)h=1,若此時網(wǎng)絡(luò)能在最大學(xué)習(xí)次數(shù)內(nèi)滿足所設(shè)定的誤差條件,則停止迭帶,若達到最大學(xué)習(xí)次數(shù)后,仍不滿足誤差條件,則隱含層單元數(shù)增加1,重復(fù)上述過程,直到滿足誤差條件為止。
給定一批p(p=1,2,…,P)個輸入輸出樣本,學(xué)習(xí)率為η(η>0),動量因子為λ(0<λ<1),則目標函數(shù)誤差如式(4):
(4)
小波神經(jīng)網(wǎng)絡(luò)隱含層與輸出層之間權(quán)值修正計算如式(5):
(5)
輸入層與隱含層之間權(quán)值修正如式(6):
(6)
小波基函數(shù)伸縮因子修正公式如式(7):
(7)
小波基函數(shù)平移因子修正公式如式(8):
(8)
學(xué)習(xí)速率η自適應(yīng)修正公式如式(9):
(9)
模型輸入變量標定原則為:考慮神經(jīng)網(wǎng)絡(luò)自身固有的模式識別問題,即以樣本相似性度量來提取樣本特征進行模式分類。筆者在進行模型輸入變量標定時,遵循出行意愿相似變量用相連數(shù)字代碼表示的原則。調(diào)研顯示:探親和旅游乘客其乘坐商務(wù)專線的意愿比較相近,那么在對出行目的進行變量標定時,探親和旅游需用相連數(shù)字來標定。其具體標定如下:
x1為性別:男(x1=1)、女(x1=2);
x2為年齡:18歲以下(x2=1)、60歲以上(x2=2)、40~60歲(x2=3)、30~40歲(x2=4)、18~30歲(x2=5);
x2為職業(yè):離退休人員(x2=1)、其他(x2=2)、學(xué)生(x2=3)、企業(yè)家(x2=4)、機關(guān)企事業(yè)(x2=5);
x4為x4年收入:30萬以上(x4=1)、5萬以下(x4=2)、20~30萬(x4=3)、10~20萬(x4=4)、5~10萬(x4=5);
x5為出行目的:其他(x5=1)、探親(x5=2)、旅游(x5=3)、商務(wù)出行(x5=4);
x6為出行起訖點:荔灣區(qū)(x6=1)、天河區(qū)(x6=2)、白云區(qū)(x6=3)、越秀區(qū)(x6=4)、黃浦區(qū)(x6=5)、番禺區(qū)(x6=6)、海珠區(qū)(x6=7)、花都區(qū)(x6=8)、南沙區(qū)(x6=9);
x7為出行方式:私家車(x7=1)、公交車(x7=2)、長途汽車(x7=3)、其他(x7=4)、地鐵(x7=5)、出租車(x7=6);
x8為出行是否換乘:是(x8=1)、否(x8=2);
z1為出行意愿:是(z1=1)、否(z1=2)。
乘客觀測值由兩部分組成:①自身屬性和出行特征(性別、年齡、職業(yè)、年收入、出行目的、出行起訖點、出行是否換乘、出行方式);②乘坐意愿(是、否)。若一個乘客的觀測值為(1、3、5、4、4、1、1、2、2),則表示該乘客性別為男,40~60歲,在機關(guān)企事業(yè)單位工作,年收入為10~20萬,他因工作從荔灣區(qū)開私家車到南站坐火車去出差,中途無換乘,不愿意乘坐商務(wù)專線。
為提高神經(jīng)網(wǎng)絡(luò)預(yù)測的精確性和穩(wěn)定性,筆者以與現(xiàn)實乘客類型結(jié)構(gòu)相近且充分覆蓋各類樣本為原則,從調(diào)研獲得乘客數(shù)據(jù)中選取2 000個有效訓(xùn)練樣本,并對模型進行訓(xùn)練,以確保模型對各類不同屬性乘客進行意愿預(yù)測時都能具有較高精確性和穩(wěn)定性。樣本屬性結(jié)構(gòu)如表1。
表1 樣本屬性結(jié)構(gòu)Table 1 Attribute structure of samples %
由于文中所標定樣本數(shù)據(jù)不在同一個數(shù)量級,為提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度,需對其進行歸一化處理。筆者利用MATLAB中的函數(shù)工具[pn, minp, maxp]=premnmx(p)將選取樣本數(shù)據(jù)映射到[-1,1],其具體算法如式(10):
(10)
式中:p為所收集的一組數(shù)據(jù);minp、maxp分別為數(shù)據(jù)的最小值和最大值;pn為歸一化后的數(shù)據(jù)。
為檢驗文中所構(gòu)建的小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)相比是否具有先進性,在實驗中分別用小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)對樣本進行訓(xùn)練,均設(shè)置網(wǎng)絡(luò)最大學(xué)習(xí)次數(shù)為10 000,目標誤差為10-6,兩種方法訓(xùn)練過程中網(wǎng)絡(luò)MSE(均方差)變化曲線如圖3。
由圖3可看出:基于小波神經(jīng)網(wǎng)絡(luò)模型有著更快的訓(xùn)練速度,僅經(jīng)過101次便達到了目標誤差;而傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)經(jīng)346次訓(xùn)練達到了最優(yōu)誤差值9.142 5E-04后停止訓(xùn)練,并未達到目標誤差。
圖3 網(wǎng)絡(luò)訓(xùn)練速度對比Fig. 3 Comparison of network training speed
網(wǎng)絡(luò)在對預(yù)測結(jié)果進行輸出時,經(jīng)Sigmoid函數(shù)轉(zhuǎn)化之后網(wǎng)絡(luò)預(yù)測值將會分布到[-1,1]之間,筆者對乘客出行意愿預(yù)測結(jié)果進行分類的判斷條件為:若預(yù)測值位于(0,1]上,則判斷乘客出行意愿為“否”;否則乘客出行意愿為“是”。在對500個預(yù)測樣本預(yù)測結(jié)果進行分類判斷之后,筆者構(gòu)建的小波神經(jīng)網(wǎng)絡(luò)對500個樣本預(yù)測精度最高可達到86%,而BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度最高可達到78%。
前50個樣本的一次預(yù)測情況如圖4。小波神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)預(yù)測結(jié)果中有47個與實際一致,精度為94%;傳統(tǒng)BP網(wǎng)絡(luò)預(yù)測結(jié)果中有41個與實際一致,預(yù)測精度為82%。由此可看出:小波神經(jīng)網(wǎng)絡(luò)對于乘客出行意愿預(yù)測具有較好預(yù)測效果,且與BP神經(jīng)網(wǎng)絡(luò)相比,對樣本預(yù)測值更加接近樣本實際值,其預(yù)測精度也就更高。
圖4 網(wǎng)絡(luò)預(yù)測值與實際值的分布Fig. 4 Distribution of network predictive value and actual value
筆者以廣州南站商務(wù)專線目標乘客出行意愿預(yù)測為研究實例,從目標乘客出行意愿角度預(yù)測了新型定制化公交所具有的市場前景。通過對乘客屬性對乘客意愿的影響分析,發(fā)現(xiàn)乘客屬性與其意愿之間存在復(fù)雜的非線性關(guān)系。
筆者建立了乘客出行意愿預(yù)測小波神經(jīng)網(wǎng)絡(luò)模型,并運用MATLAB軟件對模型預(yù)測進行了分析。為改善網(wǎng)絡(luò)訓(xùn)練效果,筆者采用自適應(yīng)方法對網(wǎng)絡(luò)學(xué)習(xí)速率和隱含層節(jié)點數(shù)進行確定。結(jié)果表明:小波神經(jīng)網(wǎng)絡(luò)對于預(yù)測定制公交目標乘客出行意愿具有較好地適用性,且比傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)有更好的預(yù)測效果。
影響乘客出行意愿的因素非常多,除了筆者分析的8個因素之外,乘客個人偏好、城市文化及其他不確定因素都會對出行意愿有著影響,忽略這些因素影響將導(dǎo)致網(wǎng)絡(luò)預(yù)測存在失準風(fēng)險。除此之外,筆者在對乘客職業(yè)、出行目的及出行方式進行分類時,分類程度不夠充分明確,將非主要類別都歸到了“其他”一類,導(dǎo)致這些類別乘客出行意愿的不確定性。網(wǎng)絡(luò)模型對此類樣本學(xué)習(xí)效果不佳,在預(yù)測時容易出錯,從而降低了網(wǎng)絡(luò)預(yù)測精度。因此在后續(xù)地研究中應(yīng)通過加入更多相關(guān)影響因素和對影響因素進行詳細分類來進一步提高網(wǎng)絡(luò)預(yù)測的準確性。