錢名軍,李引珍,何瑞春,曾海軍
(1.蘭州交通大學 交通運輸學院,甘肅 蘭州 730070;2.寧波軌道交通集團運營分公司,浙江 寧波 315101)
作為國民經(jīng)濟大動脈、關鍵基礎設施的鐵路交通系統(tǒng),是我國現(xiàn)代化綜合交通運輸體系的重要骨干和實現(xiàn)“交通強國”戰(zhàn)略的主要力量,其建設規(guī)模和發(fā)展質(zhì)量將對國家的經(jīng)濟社會乃至資源生態(tài)環(huán)境等產(chǎn)生重要影響。因此,為更好地發(fā)揮鐵路對經(jīng)濟、社會持續(xù)健康發(fā)展的促進和先導作用,切實提高鐵路網(wǎng)規(guī)劃建設的科學性和前瞻性,需要我們從廣闊的視角和長遠的戰(zhàn)略來探究鐵路網(wǎng)發(fā)展規(guī)律,研究鐵路網(wǎng)建設規(guī)模問題,進而為鐵路交通部門制定科學合理的鐵路網(wǎng)中長期發(fā)展規(guī)劃和年度鐵路建設計劃提供科學決策依據(jù),以實現(xiàn)鐵路建設資金的有效投入、鐵路網(wǎng)絡系統(tǒng)的健康發(fā)展。
一個國家的鐵路網(wǎng)發(fā)展規(guī)模和建設進程除了有其自身內(nèi)在的形成及演化機理和運行機制外,在很大程度上還受到人口和資源數(shù)量及分布、經(jīng)濟社會發(fā)展、交通運輸政策等外部因素的影響。這些因素與鐵路系統(tǒng)相互作用、彼此影響,形成了一個復雜巨系統(tǒng)。這使得鐵路網(wǎng)規(guī)模測算成了一個系統(tǒng)而復雜的難題,難以建立準確的解析數(shù)學模型。
目前,交通網(wǎng)里程規(guī)模的測算方法主要有統(tǒng)計模型法[1]、運輸需求分析法[2-4]、類比研究法[5]、網(wǎng)絡分析法[6-8]、BP神經(jīng)網(wǎng)絡模型[9]等。文獻[1]構建了鐵路網(wǎng)密度與人口密度、人均GDP之間的宏觀規(guī)模需求統(tǒng)計模型,并針對地理環(huán)境、產(chǎn)業(yè)結構、政策偏好等影響因素設計了依賴-偏好指數(shù)對模型進行修正。文獻[2]針對城市軌道交通線網(wǎng)規(guī)模需求的梯度效應、彈性效應等,結合城市經(jīng)濟承受力、環(huán)境資源容量等外部約束,給出了相應的軌道交通規(guī)??锼隳J健N墨I[5]從路網(wǎng)密度、運輸負荷、網(wǎng)距和路網(wǎng)強度4個方面將我國鐵路網(wǎng)與典型國家鐵路網(wǎng)進行類比研究,以此來推斷我國鐵路網(wǎng)的適宜規(guī)模。文獻[6]根據(jù)中國鐵路網(wǎng)的層級結構特點,綜合采用連通度法和GIS技術來測算鐵路網(wǎng)總規(guī)模。文獻[9]通過對公路網(wǎng)規(guī)模影響因素的分析,建立了基于BP神經(jīng)網(wǎng)絡的公路網(wǎng)規(guī)模預測模型。這些測算方法的適應性、實用性和測算精度不一而足,選取的研究指標差異較大,大多僅憑經(jīng)驗或定性分析即決定影響變量的取舍,未作科學的論證篩選,且主要側(cè)重于終極穩(wěn)態(tài)下的路網(wǎng)總里程規(guī)模測算,而對社會經(jīng)濟系統(tǒng)與鐵路網(wǎng)規(guī)模的協(xié)同匹配關系與時序演進規(guī)律考慮較少,無法根據(jù)某一具體年度或相應時期的經(jīng)濟社會發(fā)展指標對鐵路網(wǎng)建設的合理規(guī)模進行準確測算。
實際上,由圖1可知,近20多年來,隨著經(jīng)濟的持續(xù)發(fā)展和社會的穩(wěn)定繁榮,我國的鐵路網(wǎng)里程規(guī)模與人口密度、人均GDP、社會消費品零售總額、居民消費水平、全社會客貨運量、鐵路運輸業(yè)固定資產(chǎn)投資等指標變量的時序變化趨勢,盡管短期變化方向、波動幅度不盡一致,但長期趨勢密切相關。
圖1 1993—2019年鐵路網(wǎng)里程與相關變量的時序變化趨勢
基于此,本文在綜合分析鐵路網(wǎng)規(guī)模內(nèi)外部影響因素的基礎上,首先,運用互信息(Mutual Information,MI)理論和Granger因果關系檢驗對12項初選指標變量進行篩選,得到對鐵路網(wǎng)里程規(guī)模影響力度最大、解釋能力最強的7個變量。然后,引入具有動態(tài)反饋調(diào)節(jié)和延遲單元、帶外部輸入的非線性自回歸神經(jīng)網(wǎng)絡(Nonlinear Auto-Regressive Models with Exogenous Inputs Neural Network,NARX)建立鐵路網(wǎng)規(guī)模測算模型,以篩選所得7個指標變量作為NARX網(wǎng)絡的自變量輸入,鐵路網(wǎng)里程序列作為自回歸因變量輸入,來測算鐵路網(wǎng)里程規(guī)模。最后,通過算例驗證了本方法的有效性和測算精度。
(1)互信息理論
作為多變量相關性分析方法,互信息法從信息論角度出發(fā),運用“熵”的概念來量化測度變量間共有信息的多少,以反映變量間相互依賴的強弱程度[10]。與典型相關性分析方法要求變量數(shù)據(jù)均服從正態(tài)分布且只能測度線性相關關系相比,互信息為無參數(shù)估計法,對變量數(shù)據(jù)的分布類型沒有特殊要求,既能準確刻畫線性相關關系,又能有效捕捉非線性相關關系。因此,適用于鐵路網(wǎng)非線性系統(tǒng)的特征變量篩選。
定義1:設離散型隨機變量X,概率分布為p(x),則度量其信息含量(信息結構、不確定性等)的信息熵為
(1)
定義2:若離散型隨機變量X、Y的邊緣概率分布和聯(lián)合概率分布分別為p(x)、p(y)和p(x,y),則已知X條件下Y的條件熵為
(2)
已知Y條件下X的條件熵為
(3)
(X,Y)的二維聯(lián)合熵為
(4)
定義3:聯(lián)合概率分布p(x,y)與邊緣概率分布p(x)、p(y)的相對熵即為互信息I(X,Y)
(5)
當兩變量相關性越大、相互依賴程度越高,所包含的共同信息也越多,互信息值I(X,Y)越大。反之,當變量X和Y完全無關或相互獨立時,意味著兩變量間不存在共同信息,互信息的結果最小為0。
(2)Granger動態(tài)因果關系檢驗
Granger因果關系檢驗用于經(jīng)濟變量間動態(tài)相關關系的量化分析[11]。它假設每個相關變量的預測信息都包含在其時間序列中,常用于檢驗一個變量是否對另一個變量具有解釋、預測能力。
對于同階單整的平穩(wěn)時間序列Xt、Yt,Granger因果檢驗要求估計以下廣義回歸模型:
無約束回歸模型:
(6)
有約束回歸模型:
(7)
式中:Yt、Yt-j分別為被解釋變量的當期值和j期滯后值;Xt-i為解釋變量的滯后i期值;ai、βj、λj為回歸系數(shù);m、n、p為對應變量的最大滯后期;μ1 t、μ2 t為誤差項。
通過構造上述方程的F統(tǒng)計量即可實現(xiàn)Granger檢驗[12]。利用式(6)、式(7)分別進行包含與不包含外生變量X滯后項的最小二乘回歸,得相應殘差平方和記為URSS、RRSS,則對應的F統(tǒng)計量為
(8)
式中:n為X的滯后項個數(shù);N為樣本容量。
如果F值大于給定顯著水平下響應臨界值Fα(n,N-2n-1),則拒絕原假設,即認為“變量X是變量Y的Granger原因”,也說明變量X的過去值有能力解釋、預測變量Y的值。反之,則接受“變量X不是變量Y的Granger原因”的原假設,即變量X對變量Y的變化沒有解釋、預測能力。
帶外部輸入的NARX是一種動態(tài)遞歸神經(jīng)網(wǎng)絡。相較于靜態(tài)、無反饋的前饋神經(jīng)網(wǎng)絡如BP網(wǎng)絡,NARX網(wǎng)絡具有反饋結構和延遲單元,不僅考慮了外部輸入對輸出產(chǎn)生的影響,而且通過延遲單元將輸出反饋也引入到靜態(tài)多層感知器,使輸出層能實時地將包含歷史信息的輸出數(shù)據(jù)反饋到輸入層,參與下一次的迭代訓練,從而使網(wǎng)絡具有動態(tài)記憶性且系統(tǒng)信息保留更加完整,提高了模型的學習能力和預測精度[13-14]。同時,其收斂速度和學習效率也優(yōu)于BP網(wǎng)絡和全回歸網(wǎng)絡[15]。
(1)NARX的神經(jīng)網(wǎng)絡結構
本文采用的NARX網(wǎng)絡為多輸入單輸出結構,主要由輸入層、隱含層、輸出層和輸入、輸出延遲單元構成,模型結構見圖2。
圖2 NARX動態(tài)神經(jīng)網(wǎng)絡結構圖
模型方程為
(9)
式中:fh、fo分別為訓練得到的隱含層、輸出層非線性映射函數(shù);bh、bo分別為隱含層、輸出層閾值;dx、dy分別為輸入、輸出延遲階數(shù);M為網(wǎng)絡隱含層神經(jīng)元數(shù);Wh,i、Wh,j、Wh,o分別為輸入層與隱含層、反饋連接與隱含層、隱含層與輸出層之間的權重系數(shù);y(t)為t時刻神經(jīng)網(wǎng)絡的預測輸出值,y(t-j),(j=1,2,…,dy)為t-j時刻系統(tǒng)的輸出值;xk(t-i),(k=1,2,…,p;i=1,2,…,dx)為神經(jīng)網(wǎng)絡第k個外部輸入變量序列在t-i時刻的輸入值,p為外部輸入變量序列維數(shù)。
(2)NARX神經(jīng)網(wǎng)絡參數(shù)確定
運用NARX模型進行測算時,確定其隱含層的神經(jīng)元個數(shù)和模型的輸入、輸出延遲階數(shù)是關鍵。
①隱含層神經(jīng)元數(shù)M
隱含層神經(jīng)元個數(shù)決定了所建模型的復雜程度。隱含層神經(jīng)元個數(shù)為
(10)
式中:M為隱含層神經(jīng)元個數(shù);I為輸入層神經(jīng)元個數(shù);O為輸出層神經(jīng)元個數(shù);a為0到10之間的常數(shù)。
②輸入、輸出延遲階數(shù)d
延遲階數(shù)表示當前輸出值會受到前幾期輸入值的影響。采用AIC(Akaike’s Information Criterion)準則確定,表達式為
AIC(d)=lnA+2d/N
(11)
綜上,NARX網(wǎng)絡兼具時間序列回歸模型和非線性動態(tài)神經(jīng)網(wǎng)絡的優(yōu)點,非常適合結構復雜的非線性、時變系統(tǒng)的時間序列預測建模,日益成為非線性動態(tài)系統(tǒng)中應用廣泛的一種神經(jīng)網(wǎng)絡。
研究表明,影響鐵路網(wǎng)規(guī)模的因素眾多,可歸納為外部因素和內(nèi)部因素兩大類。外部因素涉及自然地理、經(jīng)濟社會和交通政策等方面,內(nèi)部因素涉及鐵路系統(tǒng)自身的運營技術和組織效率等方面。
(1)自然地理因素
自然地理包括國土面積、人口與資源數(shù)量及分布。國土面積越大、人口與資源數(shù)量越多、分布越廣,則一定程度上需要規(guī)劃更大規(guī)模的鐵路網(wǎng)才能滿足需求,以實現(xiàn)交通路網(wǎng)合理布局。
(2)經(jīng)濟社會因素
經(jīng)濟、社會的發(fā)展規(guī)模和質(zhì)量直接影響鐵路客貨運輸需求,進而決定鐵路網(wǎng)的建設規(guī)模。伴隨經(jīng)濟的繁榮、社會的發(fā)展,GDP、社會消費品零售總額、居民年均消費水平等指標逐步增長,帶動越來越多的人員、物資等生產(chǎn)要素的流動、聚合形成更大的客貨運量,進而推動鐵路網(wǎng)規(guī)模有序擴張,以改善交通運輸環(huán)境、提高運輸服務質(zhì)量。
所以,當鐵路網(wǎng)規(guī)模與經(jīng)濟、社會發(fā)展階段匹配適度時,不僅能滿足當前國民經(jīng)濟發(fā)展的現(xiàn)實需求,還能激發(fā)或吸引潛在的客貨運輸需求,對經(jīng)濟、社會發(fā)展具有明顯的推動和先導性作用。當鐵路網(wǎng)規(guī)模與經(jīng)濟、社會發(fā)展匹配失度時,建設過于超前易造成路網(wǎng)設備設施利用率低下、浪費國家投資,建設過于滯后則易導致路網(wǎng)通行能力無法滿足現(xiàn)實需求、制約經(jīng)濟持續(xù)健康發(fā)展。可見,鐵路網(wǎng)規(guī)模與經(jīng)濟、社會發(fā)展之間存在相互促進、彼此制約的相互關系。
(3)交通政策因素
交通政策主要表現(xiàn)為對相應交通運輸方式的固定資產(chǎn)投資額。對鐵路運輸業(yè)的固定資產(chǎn)投資額度直接影響鐵路網(wǎng)基礎設施的建設規(guī)模、發(fā)展質(zhì)量,并最終影響到客貨運量結構、運輸市場份額等。
(4)運輸技術和組織管理因素
運輸技術和組織管理包括鐵路運輸密度、貨車周轉(zhuǎn)時間、貨車平均靜載重等指標。運輸密度是一定時期客貨運周轉(zhuǎn)量與其路網(wǎng)里程的比值,是衡量運能與運量匹配適應程度的指標。為確保運輸密度在合理范圍,鐵路網(wǎng)里程規(guī)模需求與運量匹配適度。貨車周轉(zhuǎn)時間指貨車每完成一次周轉(zhuǎn)所平均消耗的時間,是反映日常運營組織效率的指標。貨車周轉(zhuǎn)時間越小,則機車車輛周轉(zhuǎn)速度越快,運輸組織效率越高,完成相同的運輸量需要的鐵路網(wǎng)規(guī)模就越小。貨車平均靜載重是反映貨車在裝車或重車狀態(tài)下標記載重量利用率的重要指標。它不僅受車種型號、車輛構造及所運貨物的性質(zhì)尺寸、包裝狀況等影響,還與鐵路部門的貨物裝載技術方法密切相關,是評價貨運組織質(zhì)量優(yōu)劣的重要指標之一。該值越大,則完成相同運量需要的貨車數(shù)量越少,即單位里程的運輸能力和效率越大,需要的鐵路網(wǎng)里程就越少。
因此,本文綜合現(xiàn)有研究成果[4-6,8]并考慮指標數(shù)據(jù)的可得性、代表性和完備性,初步選取人口密度、人均GDP、社會消費品零售總額、居民年均消費水平、全社會貨運量、全社會客運量、貨物周轉(zhuǎn)量、旅客周轉(zhuǎn)量、鐵路運輸業(yè)固定資產(chǎn)投資、鐵路運輸密度、貨車周轉(zhuǎn)時間、貨車平均靜載重共12項指標作為影響鐵路網(wǎng)里程規(guī)模的內(nèi)外部因素的表征指標集,見表1。
表1 影響鐵路網(wǎng)規(guī)模的內(nèi)、外部因素
在不同的經(jīng)濟、社會發(fā)展階段,上述因素共同作用決定了當時及未來一段時期的鐵路網(wǎng)適宜規(guī)模。
為檢驗上述基于定性分析所選取的12項影響因素與鐵路網(wǎng)里程規(guī)模的相關性強弱,以1993—2019年的相關數(shù)據(jù)序列為研究樣本,利用式(5)求出各影響因素與鐵路網(wǎng)總里程和普速鐵路里程的互信息值,見表2。其中“普速鐵路里程=鐵路網(wǎng)總里程-高速鐵路里程”(我國自2008年起才有真正意義上的高速鐵路里程統(tǒng)計數(shù)據(jù),在此之前按0公里計算)。
表2 各變量互信息值
由表2可知,人口密度、人均GDP、社會消費品零售總額、居民年均消費水平、全社會貨運量、貨物周轉(zhuǎn)量、旅客周轉(zhuǎn)量、鐵路運輸業(yè)固定資產(chǎn)投資、貨車平均靜載重這9項指標變量與鐵路網(wǎng)總里程及普速鐵路里程的互信息值均高于0.8,從統(tǒng)計學意義上認為其對鐵路網(wǎng)規(guī)模的影響力度極大、相關性極強。而全社會客運量、鐵路運輸密度和貨車周轉(zhuǎn)時間這3項指標與鐵路網(wǎng)里程的互信息值均低于0.6,從統(tǒng)計學意義上認為其對鐵路網(wǎng)規(guī)模的影響力較弱、關聯(lián)性較低,可直接從初始指標集中予以剔除。同時,全社會貨運量與貨物周轉(zhuǎn)量均為全社會貨運規(guī)模的表征指標,彼此間的相關性達0.989 9,為避免輸入變量的高自相關性出現(xiàn)過擬合而影響模型測算精度,本文保留與鐵路網(wǎng)規(guī)模相關性更高的全社會貨運量指標,而剔除相關性略低的貨物周轉(zhuǎn)量指標。
至此,影響因素變量由原來的12個約簡為8個:X1為人口密度;X2為人均GDP;X3為社會消費品零售總額;X4為居民年均消費水平;X5為全社會貨運量;X6為旅客周轉(zhuǎn)量;X7為鐵路運輸業(yè)固定資產(chǎn)投資;X8為貨車平均靜載重。這在一定程度上去除了輸入變量中的冗余信息、降低了變量維度,可避免出現(xiàn)過擬合現(xiàn)象。
為確?;诨バ畔⒎ㄋY選變量對鐵路網(wǎng)規(guī)模的解釋、預測力度,提高測算模型的穩(wěn)定性、收斂效果和泛化能力,需對8個變量再進行Granger因果關系檢驗。
(1)變量序列平穩(wěn)性檢驗
為消除不同序列量綱單位和異方差的影響,又不改變數(shù)據(jù)間的協(xié)整關系,需對各變量序列進行自然對數(shù)標準化處理。
為防止偽回歸現(xiàn)象,進行Granger檢驗前,先用ADF單位根檢驗法對各變量序列進行平穩(wěn)性檢驗。ADF檢驗表明,因變量鐵路網(wǎng)總里程的對數(shù)序列LYz、普速鐵路里程的對數(shù)序列LYp和8個解釋變量的對數(shù)序列LXi(i=1,2,…,8)均不同程度具有趨勢項或截距項,接受存在單位根的原假設,即原變量對數(shù)序列都是非平穩(wěn)序列。而各變量所對應的一階差分序列ΔLYz、ΔLYp、ΔLXi(i=1,2,…,8)經(jīng)ADF檢驗,均拒絕存在單位根的原假設,呈現(xiàn)出較好的平穩(wěn)性,其一階差分序列的ADF檢驗結果見表3。
表3 各變量一階差分序列的ADF檢驗結果
由表3可知,因變量Yj(j=z,p)和解釋變量Xi(i=1,2,…,8)的一階差分序列對應的ADF檢驗統(tǒng)計量均至少小于5%的顯著性水平臨界值,其接受存在單位根的相伴概率均低于5%,也就是說至少在95%的置信度水平下各一階差分序列均拒絕存在單位根的原假設,表明各差分序列的平穩(wěn)性良好,滿足協(xié)整檢驗條件。
(2)Johansen協(xié)整檢驗
協(xié)整檢驗是用于判斷鐵路網(wǎng)規(guī)模變量Yj(j=z,p)與其解釋變量Xi(i=1,2,…,8)是否存在長期穩(wěn)定的均衡關系[16]。因涉及3個及以上變量的協(xié)整分析,故采用Johansen協(xié)整檢驗法,且該方法包含了跡檢驗和最大特征值檢驗兩種方法,可使結論更穩(wěn)健。依據(jù)最小AIC準則,選取最佳滯后階數(shù)為2。協(xié)整檢驗結果見表4、表5。
從表4、表5可見,Johansen協(xié)整檢驗的兩個對應結果均顯示,各原假設的檢驗統(tǒng)計量都明顯大于其5%顯著水平下的臨界值,且接受原假設的概率都小于0.05,這表明協(xié)整方程的個數(shù)不止7個而至少有8個。因此,驗證了鐵路網(wǎng)規(guī)模變量Yj(j=z,p)與人口密度X1、人均GDPX2等8個解釋變量均存在長期穩(wěn)定的協(xié)整關系,具備進行Granger因果關系檢驗的條件。
(3)Granger因果關系檢驗
為避免Granger因果關系檢驗受變量平穩(wěn)程度或樣本容量長度的影響,本文針對鐵路網(wǎng)規(guī)模變量Yj(j=z,p)與解釋變量Xi(i=1,2,…,8)的相互關系進行了1~6階滯后期的Granger檢驗,以排除滯后期敏感性對檢驗結果的影響。限于篇幅分別只列出了滯后1~3期的檢驗結果,見表6、表7。
表4 總里程與解釋變量的Johansen協(xié)整檢驗結果
表5 普速鐵路里程與解釋變量的Johansen協(xié)整檢驗結果
表6 總里程與解釋變量間的Granger因果關系檢驗
從表6、表7可見,在90%的置信度水平下,除了人口密度X1連續(xù)6期的檢驗結果均不同程度接受了“不是鐵路網(wǎng)總里程LYz和普速鐵路里程LYp的Granger原因”的原假設外,其余7個變量均顯著拒絕了“不是鐵路網(wǎng)總里程LYz和普速鐵路里程LYp的Granger原因”的原假設。這表明人口密度X1很大程度上并不是推動鐵路網(wǎng)里程規(guī)模Yj(j=z,p)增長的Granger原因,而人均GDP、社會消費品零售總額、居民年均消費水平、全社會貨運量、旅客周轉(zhuǎn)量、鐵路運輸業(yè)固定資產(chǎn)投資和貨車平均靜載重等7個變量的增長才是推動鐵路網(wǎng)里程增長的Granger原因。
通過進一步的Granger因果關系檢驗,篩選出了對鐵路網(wǎng)里程規(guī)模最具解釋力的7個變量,有力支撐了模型輸入變量選取的科學合理性。
表7 普速鐵路里程與解釋變量間的Granger因果關系檢驗
文中鐵路網(wǎng)里程、年度總?cè)丝凇DP、社會消費品零售總額、居民年均消費水平、全社會貨物運輸量、全社會旅客運輸量、貨物周轉(zhuǎn)量、旅客周轉(zhuǎn)量、鐵路運輸業(yè)固定資產(chǎn)投資、全國鐵路客貨運總換算周轉(zhuǎn)量、貨車周轉(zhuǎn)時間、貨車平均靜載重等統(tǒng)計指標數(shù)據(jù),分別是從國家統(tǒng)計局官網(wǎng)、《鐵道統(tǒng)計公報》(2000—2019年)和《鐵路運輸生產(chǎn)建設統(tǒng)計公報》(1993—1999年)中提取整理得到。
根據(jù)研究需要,將各序列按照85%、15%的比例劃分為訓練集和測試集,并按模型對輸入數(shù)據(jù)的格式要求進行元胞化轉(zhuǎn)換。
將經(jīng)過Granger動態(tài)因果檢驗的7個解釋變量序列Xi(i=2,3,…,8)作為外部輸入項,將鐵路網(wǎng)規(guī)模變量Yj(j=z,p)分別作為自回歸輸入項,運用MatlabR2017b構建NARX網(wǎng)絡模型。根據(jù)式(10)、式(11)計算得出神經(jīng)元個數(shù)和延遲階數(shù),并結合程序運行效果,綜合確定隱含層神經(jīng)元個數(shù)為12,輸入、輸出延遲階數(shù)為2。為提高模型測算精度、泛化性能,先用開環(huán)(Open-loop)結構,采用以網(wǎng)絡權值平方和與誤差平方和加權值作為性能評價函數(shù)的貝葉斯正則化算法(Bayesian Regularization,BR)來訓練網(wǎng)絡,訓練精度設置為10-3,最大迭代次數(shù)為1 000次。
圖3為鐵路網(wǎng)總里程Yz的NARX測算模型迭代訓練效果圖,共循環(huán)迭代163步后訓練停止,迭代至第63步時即達到穩(wěn)定效果,此時整個數(shù)據(jù)集的均方誤差為0.007 5。
圖3 NARX網(wǎng)絡訓練效果圖
圖4為3個對應數(shù)據(jù)集的線性回歸系數(shù)擬合優(yōu)度??梢姅M合優(yōu)度值R都非常接近1,表明預測值與目標值高度吻合,模型具有良好的泛化能力和預測性能。
圖4 模型回歸系數(shù)擬合優(yōu)度
圖5 預測效果誤差圖
圖5為NARX網(wǎng)絡預測效果誤差圖,其中豎直方向的黃色線段表示預測值與實際值的誤差,該線段越少、越短即表示網(wǎng)絡預測效果越好。由圖5可見,預測值與實際值誤差很小,最大誤差不超過0.2,表明此NARX動態(tài)神經(jīng)網(wǎng)絡的預測精度較高,適用于鐵路網(wǎng)里程規(guī)模的準確測算。
圖6為NARX網(wǎng)絡預測誤差自相關圖,其值在滯后階數(shù)為0時應該最大,其他情況以不超過95%的置信區(qū)間為最佳。由圖6可見,誤差自相關系數(shù)除0階以外,其他階數(shù)的值都在置信區(qū)間以內(nèi)且近乎為0。說明該模型各延遲階數(shù)的預測誤差是彼此獨立、非線性、不相關的,證明模型的預測性能良好。
表8 4種神經(jīng)網(wǎng)絡模型的測算性能對比
圖6 模型誤差自相關圖
綜上,可以判斷所構建的NARX神經(jīng)網(wǎng)絡模型達到了預期效果,可用于鐵路網(wǎng)里程規(guī)模的測算。
(1)平均絕對百分誤差δMAPE
(12)
(13)
將訓練好的MI-Granger-NARX融合模型調(diào)成閉環(huán)結構(Close-loop)對2017—2019年的鐵路網(wǎng)總里程進行測算,并與其他3種神經(jīng)網(wǎng)絡測算結果和相應年度的鐵路網(wǎng)總里程實際數(shù)據(jù)進行對比,見表8。
同時,根據(jù)本模型可以測算出2020年底我國鐵路網(wǎng)總里程規(guī)模將達到14.63萬km,其中普速鐵路里程為10.73萬km、高速鐵路里程為3.90萬km。也就是說,我國鐵路網(wǎng)建設進程若不因當前宏觀發(fā)展趨勢的波動而出現(xiàn)重大調(diào)整,則2020年度我國將新增約0.65萬km鐵路線路,其中高鐵新增約0.40萬km。這與2016年版《中長期鐵路網(wǎng)規(guī)劃》中“到2020 年,鐵路網(wǎng)規(guī)模達到15萬km”的規(guī)劃目標非常接近。從國民經(jīng)濟發(fā)展狀態(tài)及趨勢來看,目前我國普速鐵路發(fā)展基本協(xié)調(diào),高速鐵路發(fā)展較為迅速。未來我國普速鐵路、高速鐵路均還有一定的發(fā)展空間,但都應確保與國民經(jīng)濟發(fā)展需求相適應、相匹配。
(1)影響我國鐵路網(wǎng)里程規(guī)模的因素眾多,但起決定作用的因素主要是人均GDP、社會消費品零售總額、居民年均消費水平、全社會貨運量、旅客周轉(zhuǎn)量、鐵路運輸業(yè)固定資產(chǎn)投資和貨車平均靜載重等7項指標。
(2)互信息法和Granger因果關系檢驗作為統(tǒng)計意義上的相關性量化檢驗方法,其結果對鐵路網(wǎng)規(guī)模測算變量的篩選有重要作用,可使模型輸入變量解釋能力更強、測算方法更具穩(wěn)健性和科學性。
(3)將帶外部輸入的非線性自回歸神經(jīng)網(wǎng)絡NARX用于鐵路網(wǎng)規(guī)模測算是可行的,模型較傳統(tǒng)神經(jīng)網(wǎng)絡泛化能力更好、測算結果精度更高。
基于MI-Granger-NARX融合模型的鐵路網(wǎng)規(guī)模測算方法,綜合吸納了人均GDP、居民消費水平、全社會貨運量等對鐵路網(wǎng)規(guī)模影響力度最大、解釋能力最強的經(jīng)濟、社會發(fā)展和運輸需求諸多指標作為輸入變量,同時考慮了復雜系統(tǒng)的延遲效應。不僅能根據(jù)當前的經(jīng)濟、社會和行業(yè)發(fā)展數(shù)量、質(zhì)量指標測算出下一年的鐵路網(wǎng)規(guī)模,為年度鐵路網(wǎng)建設計劃確定合理可行的執(zhí)行方案;還能根據(jù)中遠期經(jīng)濟、社會和行業(yè)發(fā)展的預期數(shù)據(jù),測算出相應時期的鐵路網(wǎng)適宜規(guī)模,為中長期鐵路網(wǎng)規(guī)劃提供科學有效的決策參考。