高御堯,石明全,秦 渝,陳建平,周 喜,張 鵬
(1.中國科學(xué)院重慶綠色智能技術(shù)研究院,重慶 400700;2.中國科學(xué)院大學(xué) 重慶學(xué)院,重慶 400700;3.重慶市公共交通控股集團(tuán) 鳳筑科技有限公司,重慶 401120)
科學(xué)合理的線網(wǎng)規(guī)劃(Transit Network Planning,TNP)是公共交通管理中的一個相當(dāng)寬泛且復(fù)雜的問題。為了便于研究,文獻(xiàn)[1]將該問題劃分為線路設(shè)計(jì)、頻率設(shè)計(jì)、車輛調(diào)度、司機(jī)調(diào)度等若干子問題。子問題之間又相互關(guān)聯(lián),往往某一項(xiàng)子問題的解又可以作為另一項(xiàng)子問題的輸入,形成網(wǎng)狀關(guān)系,并相互依賴。在大多數(shù)子問題研究中,客流量起終點(diǎn)(Origin-Destination,OD)數(shù)據(jù)是必需的基礎(chǔ)數(shù)據(jù),由此出現(xiàn)了大量關(guān)于OD 預(yù)測的研究[2-3]。宏觀上,所有站點(diǎn)的客流量都可以用OD 數(shù)據(jù)來反映,因此,研究站點(diǎn)客流量變化對OD 數(shù)據(jù)分析具有重要參考價值。
人類出行具有一定規(guī)律性,主要由個體需求決定[4],而OD 是乘客需求的直接反映。乘客選擇上下車站點(diǎn)的背后邏輯是站點(diǎn)所處地的性質(zhì)、站點(diǎn)周邊是否有一定數(shù)量的興趣點(diǎn)(Point of Interest,POI)聚集地,如若干寫字樓、醫(yī)院、學(xué)校等,其中包含乘客的目標(biāo)POI。某地區(qū)的POI性質(zhì)是各個時間段內(nèi)乘客需求不同的根本原因,通過乘客在該地站點(diǎn)的OD數(shù)據(jù)體現(xiàn)。
在目前關(guān)于地面公交站點(diǎn)客流量與POI 的關(guān)系研究中:文獻(xiàn)[5]分析了客流數(shù)據(jù)和POI 數(shù)據(jù),實(shí)現(xiàn)了對軌道站點(diǎn)的聚類分析;文獻(xiàn)[6]研究與之類似;文獻(xiàn)[7]根據(jù)AFC 數(shù)據(jù)和POI 數(shù)據(jù),分析影響軌道車站客流量的因素;文獻(xiàn)[8]將軌道站點(diǎn)周邊土地性質(zhì)劃分為5 類,根據(jù)每類土地所占比例,利用長短時記憶網(wǎng)絡(luò)預(yù)測客流,但是所提方案需要針對具體線路才能實(shí)現(xiàn);文獻(xiàn)[9]通過分析站點(diǎn)周邊POI 的類型和數(shù)量,實(shí)現(xiàn)了對車輛客流OD 矩陣的估計(jì)。上述研究多數(shù)是針對軌道交通站點(diǎn)展開的,并且需要以特定線路為研究對象,具有一定的局限性。地面公交相較地鐵而言,寬泛性和靈活性均有所提升。當(dāng)前,運(yùn)營商普遍對POI 與客流量的關(guān)系有一定的經(jīng)驗(yàn)積累,主要用于調(diào)度安排以及線路規(guī)劃等[10-11],而客流量模型多數(shù)停留在一種定性的狀態(tài)。因此,構(gòu)建一種普適通用的公交站點(diǎn)客流量預(yù)測模型具有較高的實(shí)用價值。
POI 類型和數(shù)量越多的地方影響乘客選擇公交站點(diǎn)的可能性越大,POI 點(diǎn)與公交站點(diǎn)的距離越近,影響效應(yīng)越強(qiáng)[12],因此,針對性地構(gòu)建一個模型用于訓(xùn)練公交站點(diǎn)周邊POI 點(diǎn)的分布與站點(diǎn)客流量的關(guān)系,模擬并定量預(yù)測站點(diǎn)每天的客流量變化,對于線路規(guī)劃、車輛調(diào)度以及新城區(qū)的站點(diǎn)線路規(guī)劃具有重要意義。傳統(tǒng)全連接神經(jīng)網(wǎng)絡(luò)在高維輸入數(shù)據(jù)下存在擬合效果差、訓(xùn)練速度慢、易陷入局部最優(yōu)解、可解釋性差等一系列問題,需要從結(jié)構(gòu)上對網(wǎng)絡(luò)進(jìn)行改進(jìn)。本文以研究POI 與公交站點(diǎn)客流的關(guān)系為主進(jìn)行以下工作:通過非全連接的方式簡化網(wǎng)絡(luò)結(jié)構(gòu)并通過構(gòu)造連接矩陣實(shí)現(xiàn),使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以快速收斂至全局最優(yōu)解;賦予部分隱藏層節(jié)點(diǎn)實(shí)際意義,以改善神經(jīng)網(wǎng)絡(luò)的可解釋性;通過增加約束條件調(diào)整誤差傳遞方式,使網(wǎng)絡(luò)的輸出結(jié)果更接近實(shí)際狀況。
以公交站點(diǎn)為研究對象,根據(jù)站點(diǎn)所處位置周邊一定半徑內(nèi)的POI 類型等要素的分布特征,研究POI 與站點(diǎn)各個時間段客流量的關(guān)系,以此準(zhǔn)確預(yù)測站點(diǎn)每天各個時段上車或下車的客流量。表1 定義了此問題中的主要參數(shù)。
表1 主要參數(shù)定義 Table 1 Definition of main parameters
為把握問題的主要因素,提出如下基本假設(shè):
1)站點(diǎn)客流量僅與時間段Ti、POI 的屬性及其與站點(diǎn)距離相關(guān);
2)與站點(diǎn)距離大于rmax的POI 無法影響客流量;
3)POI 類型的影響值xn越高,對客流的吸引效果越強(qiáng);
4)各個POI 對客流量的影響作用相互獨(dú)立,因?yàn)槿藗儍A向于在同一個POI 內(nèi)度過大部分時間,POI對人們的吸引力相對獨(dú)立,各POI 之間的依賴性較為輕微[13]。
選取重慶市公交站點(diǎn)為例,根據(jù)已有的通用行業(yè)分類標(biāo)準(zhǔn)(如百度地圖分類標(biāo)準(zhǔn))及歷史經(jīng)驗(yàn),選擇可能對站點(diǎn)客流量影響較大的若干POI 類型作為研究對象:P={P1,P2,…,Pn}。如圖1 所示,對于任意一個POI 類型Pn,研究半徑rmax內(nèi)可能包含若干個同類的POI 點(diǎn)Pn,k。對每類POI 的各個點(diǎn)進(jìn)行加權(quán),表示該類POI 對站點(diǎn)的影響力。加權(quán)方式可能有多種[14-15],為了把握主要因素,選擇POI 到公交站點(diǎn)的物理距離rn,k、POI 的綜合影響因子(規(guī)模、口碑等因素)An,k作為研究參數(shù),共同決定Pn對站點(diǎn)客流量的影響力。由于同一站點(diǎn)在不同時間段的客流量有很大的差異性,因此設(shè)置時間參數(shù)Ti,表示不同類型的POI 在不同時間段內(nèi)對客流量的影響力不同。
圖1 站點(diǎn)及POI 空間分布Fig.1 Spatial distribution of stations and POIs
本文研究的問題可以定義為一個多分類問題或回歸問題。在多分類問題中,預(yù)先將客流量按人數(shù)劃分為若干區(qū)間,通過預(yù)測輸出客流量屬于各個區(qū)間的概率以確定客流量屬于哪一類,解決方案可以考慮SVM、決策樹、RBF 神經(jīng)網(wǎng)絡(luò)等[16-18];而在回歸問題中,直接預(yù)測輸出客流量,解決方案可以考慮多項(xiàng)式回歸、回歸樹、BP 神經(jīng)網(wǎng)絡(luò)等[19-21]。在多數(shù)情況下,兩類問題的解決方案可以互相通用。由于客流量屬于不確定因素,存在波動性,原始數(shù)據(jù)可能存在一定偏差,因此采用回歸方案更佳。而神經(jīng)網(wǎng)絡(luò)由于具有較強(qiáng)的自學(xué)習(xí)能力和非線性映射能力,因此被廣泛應(yīng)用于回歸問題的求解。
本文采用BP 神經(jīng)網(wǎng)絡(luò)的基本架構(gòu)。根據(jù)圖1所示的各項(xiàng)要素,設(shè)時間段m內(nèi)某站點(diǎn)的上(下)車人數(shù)為ym,滿足下式:
其中:時間參數(shù)Ti設(shè)為超參數(shù),i=1,2,…,18;rmid為中間距離,表示POI 對客流量影響力的變化率由高到低的臨界距離,rn,i
式(2)反映了POI 的距離與對客流量的影響呈負(fù)相關(guān)關(guān)系,指數(shù)的主要意義為:越近的POI 對于客流量越具有決定性的影響作用,當(dāng)距離超過某一臨界值時,影響作用就會趨于平緩。該式計(jì)算xn的目的在于量化站點(diǎn)周邊的POI 指標(biāo)和確定每類POI 對該站點(diǎn)的重要性。xn的值越大,代表站點(diǎn)周邊Pn的分布越廣、對該站點(diǎn)的重要性越高。關(guān)于xn對客流的影響效果,則通過神經(jīng)網(wǎng)絡(luò)的自適應(yīng)學(xué)習(xí)過程不斷更新。
根據(jù)實(shí)際情況,選取10 類POI 類型:P={P1,P2,…,P10},類型說明如表2 所示。
表2 POI 類型說明 Table 2 Description of POIs’ type
根據(jù)站點(diǎn)的GPS 定位,確定每個站點(diǎn)在研究半徑區(qū)間內(nèi)所有屬于Pi的POI,并通過式(2)計(jì)算出該站點(diǎn)的各類型POI 的加權(quán)影響值xn。
通過對重慶市全市區(qū)的站點(diǎn)GPS 定位信息、每條公交線路的客流信息(主要為每個乘客的上下車站點(diǎn)及時間信息)的相關(guān)數(shù)據(jù)分析得出,在不考慮節(jié)日的前提下,客流趨勢在工作日(周一至周五)和雙休日(周六、周天)呈現(xiàn)出不同狀態(tài),如表3 所示,并且在每種狀態(tài)下基本保持穩(wěn)定。
表3 研究類別 Table 3 Study category
對任意一個站點(diǎn)Si,統(tǒng)計(jì)每個時間段Ti內(nèi)所有工作日(或雙休日)在Si上車(或下車)人數(shù)的平均值。所有站點(diǎn)客流量經(jīng)歸一化處理后即為期望輸出q的各項(xiàng)參數(shù)。
采用全連接策略的傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)由于輸入?yún)?shù)的維度過高,會使結(jié)構(gòu)十分臃腫[22],如圖2(a)所示,在數(shù)據(jù)量不足的情況下很難訓(xùn)練出各個參數(shù)之間的關(guān)系,并且很容易陷入局部最優(yōu)解,需要采用降維等方式對數(shù)據(jù)預(yù)處理[23],這增加了工作量。因此,本文對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,以非全連接的方式提升網(wǎng)絡(luò)運(yùn)行效率及準(zhǔn)確度,如圖2(b)所示。
圖2 全連接及非全連接BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structures of fully and non-fully connected BP neural networks
根據(jù)第1.1 節(jié)中的假設(shè)4)可知,xn對結(jié)果的影響相互獨(dú)立,那么隱藏層的任一節(jié)點(diǎn)僅能受到其中一個xn的輸入影響,即任意2 個xn的值無法傳遞到相同的神經(jīng)節(jié)點(diǎn)中,由此可以保證xn對隱藏層節(jié)點(diǎn)的影響相互獨(dú)立。因此,刪除圖2(a)中大部分影響xn相互獨(dú)立性的連接,構(gòu)造新的非全連接神經(jīng)網(wǎng)絡(luò),如圖2(b)所示。非全連接神經(jīng)網(wǎng)絡(luò)可以重新定義為在時間段Ti內(nèi),將各類型POI 分別對客流量的影響值求和,即為站點(diǎn)的總客流量,如下所示:
在非全連接神經(jīng)網(wǎng)絡(luò)中,pn為單個類型的POI對客流量的影響值,僅與xn、Ti有關(guān),定義為輸出1,意義為:在Ti時刻,有pn個乘客在該站點(diǎn)上車(或下車)的目標(biāo)為第n類POI,即僅受xn的影響。綜合所有的輸出1,即為站點(diǎn)的實(shí)際客流量,定義為輸出2。從xn和Ti到pn可看作雙輸入、單輸出的子神經(jīng)網(wǎng)絡(luò),n個子神經(jīng)網(wǎng)絡(luò)的組合構(gòu)成完整結(jié)構(gòu)。因此,子神經(jīng)網(wǎng)絡(luò)之間除了相同的Ti外,并無任何關(guān)聯(lián),是一種非全連接形式。特別注意,由于子神經(jīng)網(wǎng)絡(luò)的輸出pn具有實(shí)際意義,POI 對客流量的影響值不可能為負(fù)數(shù),因此需要在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中對該限制條件加以考慮。
子神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)數(shù)量依據(jù)需求而定。每類POI 在不同時間段內(nèi)對客流量的影響效果可能并不相同,為了擬合出復(fù)雜的時域變化曲線,理論上隱藏層節(jié)點(diǎn)數(shù)量越多越好,但訓(xùn)練效率也會越來越低。綜合考慮,本文將隱藏層節(jié)點(diǎn)數(shù)量設(shè)置為8。
非全連接神經(jīng)網(wǎng)絡(luò)簡化了輸入層和隱藏層之間的關(guān)系,理論上更容易收斂到全局最小值。
值得注意的是,圖2(b)所示的子神經(jīng)網(wǎng)絡(luò)相結(jié)合的結(jié)構(gòu)與特征子空間的集成學(xué)習(xí)模型(集成法)比較類似,即任意一類POI 特征與時間特征可視為原始特征集的子集之一,生成n個相互獨(dú)立的特征子空間分別構(gòu)建不同的學(xué)習(xí)器,并在最后一步集成輸出結(jié)果。針對這兩類模型的區(qū)別說明如下:
1)集成法通常需要學(xué)習(xí)每一類特征子空間到理想輸出結(jié)果的映射關(guān)系(如x1、Ti與y的關(guān)系),并將各學(xué)習(xí)器的輸出結(jié)果加權(quán)(權(quán)重需要學(xué)習(xí)),得到最終輸出;本文方法中子神經(jīng)網(wǎng)絡(luò)的輸出可視為分別受各類POI 影響客流量的真實(shí)數(shù)值,因此,只需要將所有真實(shí)數(shù)值簡單相加即為實(shí)際客流量。
2)集成法的加權(quán)過程需要確定各學(xué)習(xí)器的權(quán)重。但在實(shí)際中,針對不同的輸入,各學(xué)習(xí)器的權(quán)重應(yīng)是不同的。當(dāng)然,這種需要動態(tài)調(diào)整的權(quán)重可以通過另建一個學(xué)習(xí)器解決,該學(xué)習(xí)器用于訓(xùn)練輸入和權(quán)重的關(guān)系,或者采用堆疊、混合的方式融合各學(xué)習(xí)器,這些方法均無疑增加了工作量。
3)本文模型是一個結(jié)構(gòu)緊湊的整體,各子神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是同步且統(tǒng)一的,單個子神經(jīng)網(wǎng)絡(luò)的訓(xùn)練完成意味著模型整體的訓(xùn)練完成,同時,集成法的學(xué)習(xí)器訓(xùn)練是相對獨(dú)立的,各學(xué)習(xí)器的訓(xùn)練時間及效果難以統(tǒng)一。
根據(jù)圖2(b)可知,神經(jīng)網(wǎng)絡(luò)的輸入為x=(Ti,x1,x2,…,xn)T,期望輸出為q,實(shí)際輸出為y,參數(shù)均經(jīng)歸一化處理,其中輸出向量的每個參數(shù)表示固定的時間段內(nèi)站點(diǎn)的上(下)車人數(shù)。神經(jīng)網(wǎng)絡(luò)僅在第1 個隱藏層采用Sigmoid 激活函數(shù)。
2.3.1 正向傳遞
在圖2(b)所示的神經(jīng)網(wǎng)絡(luò)中,第1 個隱藏層的輸入用矩陣表示如式(5)所示。為了方便神經(jīng)網(wǎng)絡(luò)的隨機(jī)權(quán)重生成以及權(quán)重迭代,將權(quán)重矩陣ω1表示成Hadamard 乘積模式(用符號“?”表示,下同),如式(6)所示。
定義L1為輸入層到第1 個隱藏層的連接矩陣,表示神經(jīng)網(wǎng)絡(luò)的連接方式(全連接方式的連接矩陣元素全部為1)。
第1 個隱藏層的輸出經(jīng)過Sigmoid 變換,增加了非線性因素:
第2 個隱藏層的輸出并未采用激活函數(shù),輸入即輸出:p=O2=I2。利用式(4)對隱藏層的輸出相加后便得到實(shí)際輸出。
2.3.2 誤差反饋
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,誤差修正的方式與傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)類似。根據(jù)網(wǎng)絡(luò)的期望輸出和實(shí)際輸出,輸出層誤差函數(shù)為:
由于子神經(jīng)網(wǎng)絡(luò)的輸出被限定為非負(fù)數(shù),因此需要設(shè)定第2 個隱藏層的誤差函數(shù)。做以下假設(shè):第2 個隱藏層輸出pn若為正數(shù),則不存在誤差;若為負(fù)數(shù),則該層虛擬輸出為0,那么誤差值為-pn。因此,第2 個隱藏層輸出的誤差函數(shù)為:
根據(jù)鏈?zhǔn)椒▌t,由最終輸出誤差導(dǎo)致的誤差向量分別為:
其中:δo,3~δo,1分別表示由Eo導(dǎo)致的輸出層、第2 個隱藏層和第1 個隱藏層的誤差向量。同理,由第2 個隱藏層的輸出誤差導(dǎo)致的誤差向量分別為:
其中:δho,2~δho,1分別表示由Eho導(dǎo)致的第2 個隱藏層和第1 個隱藏層的誤差向量,輸出層不受該誤差影響。在此基礎(chǔ)上,可以求得各個參數(shù)梯度變化:
其中:A1和A2分別表示滿足等式的單位列向量。
通過上述過程,將每個參數(shù)梯度乘以適當(dāng)?shù)膶W(xué)習(xí)率η即可獲得每一步需要更新的參數(shù)大小。為了加速網(wǎng)絡(luò)學(xué)習(xí)過程,η可采用動態(tài)學(xué)習(xí)率[24]。在訓(xùn)練過程中,第1 個隱藏層的節(jié)點(diǎn)數(shù)較多,是計(jì)算資源消耗的主要因素??s減該層節(jié)點(diǎn)數(shù)量可以明顯加快訓(xùn)練速度,但同時會損失一定的擬合精度。
實(shí)驗(yàn)主要針對模型做擬合(或預(yù)測)準(zhǔn)確度測試,檢測任意站點(diǎn)每個時間段的期望值與實(shí)際值的差距。對重慶市近3 300 個公交站點(diǎn)的數(shù)據(jù)隨機(jī)劃分為訓(xùn)練集和測試集2 個部分,其中,訓(xùn)練集為2 500 個站點(diǎn),其余的為測試集。各站點(diǎn)周邊的POI數(shù)據(jù)經(jīng)過式(2)及第2.1 節(jié)的方法量化處理后作為該站點(diǎn)POI 輸入數(shù)據(jù)。由于單個站點(diǎn)的日客流量被劃分為18 個時間段分別統(tǒng)計(jì),訓(xùn)練集輸出數(shù)據(jù)有2 500×18=45 000 組,測試集類同。對神經(jīng)網(wǎng)絡(luò)的各項(xiàng)參數(shù)隨機(jī)在[-1,1]的范圍內(nèi)賦值初始化,經(jīng)過100 萬次迭代訓(xùn)練(或均方差小于設(shè)定閾值)后停止迭代。
根據(jù)表3 的研究類別,用4 個相同結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)分別訓(xùn)練每一類樣本,因此,共包含4 組結(jié)果,各組之間的訓(xùn)練集、測試集分別獨(dú)立。
現(xiàn)實(shí)中,客流量始終處于一個浮動狀態(tài),期望輸出q也僅代表平均客流水平,并非準(zhǔn)確值。就車輛調(diào)度和線路優(yōu)化工作而言,站點(diǎn)單向客流量浮動數(shù)為10 人/h,不會對公交的調(diào)度工作產(chǎn)生較大影響,實(shí)際意義基本相同。因此,采用實(shí)際輸出與期望輸出間的殘差人數(shù)作為模型檢驗(yàn)標(biāo)準(zhǔn):
其中:為 第i個樣本 的殘差 值;qi為期望輸出;yi為實(shí)際輸出。
以工作日的上車客流量為例,將所有的樣本殘差降序排列,如圖3 所示,可以看出,僅有極小部分殘差值偏離較大??傮w概率分布如圖4 所示,可以看出,訓(xùn)練集和測試集的δ*近似高斯分布,均值處于零值附近,略小于零值,測試集的預(yù)測方差略大于訓(xùn)練集。
圖4 總體概率分布Fig.4 Overall probability distribution
將樣本按照時間段劃分,統(tǒng)計(jì)各時間段樣本殘差的概率密度,如圖5 所示。結(jié)果顯示:在一天時間段內(nèi),早班車與末班車的客流預(yù)測偏差較為集中,多集中在零值附近,說明該時間段內(nèi)的乘客預(yù)測基本不存在誤差;早晚高峰期的預(yù)測偏差較為分散,這2 個時間段也是預(yù)測可能出現(xiàn)較大誤差的時間段。誤差的主要來源為乘客數(shù)量的波動性提升,原始數(shù)據(jù)表明,部分客流量較大的站點(diǎn)每一天同時間段內(nèi)的客流量有較大區(qū)別,單位時間段內(nèi)的客流量波動范圍可達(dá)到100 人次以上,這種不確定性也為模型預(yù)測帶來了較大難度。其余時間段內(nèi)預(yù)測偏差分布較為均衡,均小于高峰期預(yù)測偏差。
圖5 殘差時域概率密度分布Fig.5 Residual time domain probability density distribution
同時采用其他典型常用的回歸模型,分別做相關(guān)實(shí)驗(yàn)進(jìn)行對比測試,包括該模型對應(yīng)的全連接神經(jīng)網(wǎng)絡(luò)模型[見 圖2(a)]、決策樹、SVM回歸、AdaBoost 以及多項(xiàng)式回歸模型。輸入及輸出參數(shù)均與該模型相同,取工作日的上車客流量做分析,經(jīng)多次測試后,取每種模型的最優(yōu)解,對比實(shí)驗(yàn)結(jié)果如表5 所示。
表5 各類模型測試結(jié)果對比 Table 5 Comparison of each model testing results
取其中部分典型模型,對日均客流量的變化趨勢進(jìn)行擬合測試。隨機(jī)抽取若干測試集的站點(diǎn),將一天內(nèi)每小時的實(shí)際客流量與不同模型的預(yù)測客流量進(jìn)行對比。這里以工作日數(shù)據(jù)為例,隨機(jī)抽取3 組站點(diǎn)的對比結(jié)果如圖6 所示,樣本包含了客流量從稀疏到密集的情況。
圖6 站點(diǎn)日客流量變化預(yù)測值對比Fig.6 Comparison of predicted values of daily station’s ridership
從實(shí)際客流量與預(yù)測客流量的變化趨勢對比中可以看出各預(yù)測模型的擬合效果。結(jié)果表明:
1)全連接神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集和測試集預(yù)測誤差均比較大,在長時間訓(xùn)練后依舊無法擬合實(shí)際結(jié)果,尤其是無法擬合客流隨時間的變化趨勢。主要原因在于引入了大量的非必須的連接,并且輸入的高維變量中,僅有一維是時間變量,其余為POI 變量,因此在誤差反饋中,各個節(jié)點(diǎn)的誤差傳遞相互交錯,在數(shù)據(jù)集不夠充分的情況下,難以準(zhǔn)確訓(xùn)練出其中關(guān)于時間的有效信息。
2)決策樹回歸可以快速收斂至(局部)最優(yōu)解,但是由于過擬合現(xiàn)象嚴(yán)重,導(dǎo)致測試集的預(yù)測誤差較大,并且同樣難以擬合客流隨時間的變化趨勢。
3)SVM 回歸的訓(xùn)練集擬合精度略高于非全連接神經(jīng)網(wǎng)絡(luò),但是過擬合現(xiàn)象在所有模型中最嚴(yán)重,因此測試集擬合精度大幅下降。
4)AdaBoost 回歸的預(yù)測精度與非全連接神經(jīng)網(wǎng)絡(luò)較為接近,其日客流量變化的預(yù)測趨勢也與實(shí)際客流量較為符合。但是該模型獲得最優(yōu)解需要經(jīng)過多次嘗試,主要原因在于弱分類器的選擇以及數(shù)量會較大影響預(yù)測精確度。因此,該模型訓(xùn)練時間過長是主要弊端,其中弱分類器的訓(xùn)練是時間消耗的主要因素。
5)多項(xiàng)式回歸方案經(jīng)測試并不適用于該研究,因?yàn)楦黝怭OI 變量與時間變量之間具有高度相關(guān)性,并且數(shù)據(jù)較為復(fù)雜、維度較高、非線性特征明顯,因此難以構(gòu)建合適的多項(xiàng)式并獲得有效解。
由上述實(shí)驗(yàn)結(jié)果,進(jìn)行以下分析與討論:
1)綜合比較下,非全連接神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)簡潔、訓(xùn)練方便的優(yōu)點(diǎn),隨機(jī)設(shè)定初始值后,多數(shù)情況下均可以快速收斂至相同的最優(yōu)解,并且模型基本擬合出了站點(diǎn)每天客流量的變化趨勢,同時體現(xiàn)了每天客流量平、高峰期的狀態(tài)。
2)根據(jù)表4、圖3 與圖4 的結(jié)果可以看出,有個別站點(diǎn)的預(yù)測誤差過大。經(jīng)過對原始數(shù)據(jù)的分析,這類站點(diǎn)多為中心城區(qū)的樞紐站點(diǎn)。在這些站點(diǎn)中,除了POI 分布,其他人為或歷史等因素[25]對客流量影響較其他站點(diǎn)更為突出。
3)圖6 的趨勢變化曲線反映了站點(diǎn)每日的上下車規(guī)律基本是對稱的,即早高峰上車客流量的趨勢與晚高峰下車客流量趨勢基本相同,且峰值一定。由于城市規(guī)劃中人口活動較大的區(qū)域主要為住宅用地以及商業(yè)用地,上車客流量的高峰值出現(xiàn)在早高峰的站點(diǎn)附近的POI 類型以住宅區(qū)為主,并且該類站點(diǎn)在晚高峰期間會出現(xiàn)下車高峰值,寫字樓附近的站點(diǎn)則與之相反。
4)對比實(shí)驗(yàn)說明非全連接神經(jīng)網(wǎng)絡(luò)針對類似的問題是非常有效的,它是基于所研究問題的特殊性,對全連接神經(jīng)網(wǎng)絡(luò)的一種精簡,使訓(xùn)練時間及準(zhǔn)確性均可以獲得一個較優(yōu)解。但是這種神經(jīng)網(wǎng)絡(luò)的構(gòu)建模式具有一定的局限性,即主要針對高維的數(shù)據(jù)輸入,并且輸入數(shù)據(jù)之間存在相互獨(dú)立或近似相互獨(dú)立的情況(在本文研究中,POI 對客流量的影響相互獨(dú)立)。若輸入數(shù)據(jù)的關(guān)聯(lián)性較高,則這種非全連接神經(jīng)網(wǎng)絡(luò)可能無法訓(xùn)練出最優(yōu)解,甚至得到錯誤解。因此,針對不同的回歸問題,需要具體分析該模型的適用性。
5)關(guān)于圖2 中子神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)數(shù)量選擇:在本文研究中,若采用m個隱藏層節(jié)點(diǎn),其本質(zhì)為用m個不同參數(shù)的Sigmoid 曲線疊加構(gòu)成新的函數(shù)曲線,數(shù)量越多,可以構(gòu)成的曲線種類越多,復(fù)雜度越高。由于子神經(jīng)網(wǎng)絡(luò)需要擬合xn、Ti和pn的函數(shù)關(guān)系,pn關(guān)于xn和Ti的關(guān)系越復(fù)雜,所需要的隱藏層節(jié)點(diǎn)數(shù)量將越多。實(shí)際情況表明:當(dāng)Ti一定時,pn關(guān)于xn的關(guān)系基本呈現(xiàn)單調(diào)上升(或下降)的,只需較少的節(jié)點(diǎn)即可大致擬合;當(dāng)xn一定時,pn關(guān)于Ti有明顯的“M”曲線關(guān)系(即早晚高峰人數(shù)多、平峰人數(shù)少),若需要擬合該函數(shù)關(guān)系,則需要較多的隱藏層節(jié)點(diǎn)。因此,決定隱藏層節(jié)點(diǎn)數(shù)量的參數(shù)主要在于pn與Ti的關(guān)系。本文選擇的隱藏層節(jié)點(diǎn)數(shù)量8 為綜合性能、擬合效果等各因素經(jīng)多次測試后確定。
本文改進(jìn)傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)全連接思想,根據(jù)各項(xiàng)研究參數(shù)的相關(guān)性,設(shè)計(jì)一種非全連接的神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,該神經(jīng)網(wǎng)絡(luò)可降低訓(xùn)練難度,減少訓(xùn)練過程的計(jì)算量,提升訓(xùn)練速度,并易收斂至全局最優(yōu)解,降低獲得局部最優(yōu)解的概率。同時,提出一種連接矩陣,輔助實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的非全連接形式,便于誤差傳遞過程的優(yōu)化設(shè)計(jì)。在此基礎(chǔ)上,通過賦予神經(jīng)網(wǎng)絡(luò)部分隱藏層實(shí)際意義,并根據(jù)實(shí)際狀況對其進(jìn)行約束限制,豐富誤差傳遞模式,增加神經(jīng)網(wǎng)絡(luò)的可解釋性,使得結(jié)果更加符合現(xiàn)實(shí)規(guī)律,從而實(shí)現(xiàn)在任意POI 分布下預(yù)測站點(diǎn)各時間段的上車(或下車)客流量,以利于對于新公交站點(diǎn)的位置選擇。本文模型對高維非關(guān)聯(lián)性數(shù)據(jù)有優(yōu)良的效果,但對關(guān)聯(lián)性強(qiáng)的數(shù)據(jù)效果可能不佳。由于影響客流量的不只有POI 因素,因此將在逐步添加其他次要因素(如天氣因素等),增強(qiáng)模型仿真效果,并且將通過與其他模型的結(jié)合(如作為弱分類器融合進(jìn)AdaBoost 中),獲得更好的預(yù)測效果。