王 玲 王艷麗 戚新洲 馬萬經(jīng)
(同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室 上海 201804)
在當(dāng)前積極推進(jìn)公交優(yōu)先發(fā)展的背景下,如何提升城市公交服務(wù)品質(zhì)提高公交吸引力是當(dāng)前公交發(fā)展的主要任務(wù).而品質(zhì)和吸引力的提高則需要公交服務(wù)可靠性的保障.常規(guī)公交仍然是我國大多城市公交系統(tǒng)的主體,相較于蓬勃發(fā)展的軌道交通,除了運(yùn)營速度較慢,關(guān)鍵在于其行程時(shí)間的可靠性相對(duì)較差.特別是在交通網(wǎng)絡(luò)較為復(fù)雜的大城市,交通擁擠等問題日益嚴(yán)峻,增加了公交車的在途時(shí)間,從而影響了公交線路的行程時(shí)間可靠性.所以對(duì)于常規(guī)公交線路的行程時(shí)間可靠性進(jìn)行分析以提高服務(wù)可靠性對(duì)于提升公交服務(wù)品質(zhì)與吸引力極為重要.
目前,對(duì)于常規(guī)公交可靠性已經(jīng)有較多研究,包括路網(wǎng)連通可靠性、服務(wù)可靠性以及運(yùn)行可靠性[1].其中,對(duì)于公交運(yùn)行可靠性的研究,主要集中于可靠性的評(píng)價(jià)包括評(píng)價(jià)指標(biāo)和評(píng)價(jià)方法、可靠性的影響因素分析以及可靠性的預(yù)測(cè)模型三個(gè)方面.在評(píng)價(jià)方面,提出了不同的評(píng)價(jià)指標(biāo),如準(zhǔn)點(diǎn)率[2]、到達(dá)可靠性[3]、行程時(shí)間可靠性[4-5]、行車間隔可靠性[6]、候車時(shí)間可靠性[7]等,其中,行程時(shí)間可靠性是目前公交系統(tǒng)可靠性評(píng)價(jià)中應(yīng)用最多,可以綜合體現(xiàn)準(zhǔn)時(shí)、穩(wěn)定、延誤等.對(duì)于行程時(shí)間可靠性的影響因素,結(jié)合不同的案例進(jìn)行了影響因素分析[8-9],發(fā)現(xiàn)線路長(zhǎng)度[10]、道路交通狀態(tài)[11]、站點(diǎn)數(shù)量[12]、站點(diǎn)區(qū)間長(zhǎng)度[13]等是顯著影響因素,而行程時(shí)間與影響因素的分析仍以兩者的相關(guān)分析為主,或者是進(jìn)行多元線性回歸分析.對(duì)于行程時(shí)間的預(yù)測(cè)方法上,目前多是針對(duì)具體線路構(gòu)建模型如多元回歸模型[14]、神經(jīng)網(wǎng)絡(luò)[15]、向量機(jī)模型、貝葉斯網(wǎng)絡(luò)預(yù)測(cè)、指數(shù)平滑技術(shù)與基于卡爾曼濾波(KF)的遞歸方法結(jié)合的混合模型等對(duì)公交到站時(shí)間進(jìn)行預(yù)測(cè).目前綜合分析因素對(duì)行程時(shí)間可靠性的影響較少.總的來說,對(duì)于行程時(shí)間可靠性的評(píng)價(jià)指標(biāo)和計(jì)算,大多是針對(duì)某一條或者幾條線路的評(píng)價(jià),影響因素的分析也多是選定一條或幾條公交線路,分析的結(jié)果也許并不能反映整體狀況,有必要研究城市范圍內(nèi)的常規(guī)公交線路,給出一般性結(jié)論.同時(shí),以往研究多將行程時(shí)間可靠性作為連續(xù)變量處理,但出行者對(duì)公交可靠性的感知,多為分類變量,如可靠與不可靠,故有必要對(duì)可靠性進(jìn)行分類處理,從而得到影響因素與公交線路是否可靠之間的關(guān)系.
文中從城市公交線網(wǎng)整體出發(fā),提出評(píng)價(jià)公交線路行程時(shí)間可靠性的指標(biāo),并以上海市為例,基于所有的公交線路運(yùn)行GPS數(shù)據(jù),分析影響公交線路行程時(shí)間可靠性的顯著因素,以及影響規(guī)律,并構(gòu)建邏輯回歸模型定量分析影響因素與公交線路可靠性間的關(guān)聯(lián).
對(duì)于乘客而言,其認(rèn)知的基準(zhǔn)時(shí)間通常是白天平峰的公交的行程時(shí)間.因?yàn)榘滋炱椒鍟r(shí)的交通狀況是1 d中相對(duì)最為順暢的時(shí)段,其行程時(shí)間的差異較少(見圖1),而且白天出行(06:00—18:00)的人數(shù),約占總出行人次的79.9%,故大多出行者對(duì)公交行程時(shí)間的基準(zhǔn)值應(yīng)多是白天平峰時(shí)公交平均行程時(shí)間.
圖1 工作日與非工作日各時(shí)段行程時(shí)間差異系數(shù)
為了評(píng)定公交線路與白天平峰時(shí)的相近性,提出行程時(shí)間可靠指數(shù)的概念,即一條線路在某個(gè)時(shí)間段內(nèi)從首站到末站(即運(yùn)行一趟)所耗費(fèi)時(shí)間相對(duì)于白天平峰時(shí)的相近程度,即
(1)
(2)
(3)
由于出行者對(duì)行程時(shí)間可靠指數(shù)S的具體數(shù)值感知并不精確,其對(duì)行程時(shí)間可靠性的判斷通常為可靠或不可靠,所以引入二分變量可靠度R來評(píng)定.在用S來表征出行者對(duì)某條線路的行程時(shí)間與基準(zhǔn)值相近性的基礎(chǔ)上,將S轉(zhuǎn)換成為二分變量,當(dāng)S大于等于某個(gè)值時(shí),線路運(yùn)行可靠(R=1);當(dāng)S小于某個(gè)值時(shí),線路運(yùn)行不可靠(R=0).
分界閾值的確定取決于城市整體公交線路運(yùn)行狀況,圖2為公交行程時(shí)間可靠指數(shù)分布圖.根據(jù)上海市的公交運(yùn)行情況,可靠指數(shù)處于70~80范圍內(nèi)時(shí),頻次最高;同時(shí),累計(jì)頻率曲線在70~80區(qū)間范圍內(nèi)曲線的切線斜率最大,也就是說,在這個(gè)范圍內(nèi)可靠指數(shù)變化最顯著,因此建議取80作為分界點(diǎn).
圖2 公交行程時(shí)間可靠指數(shù)分布圖
選取全上海市的常規(guī)公交作為研究對(duì)象,獲取每輛公交在2017年4月1—10日的全部GPS數(shù)據(jù).GPS數(shù)據(jù)的采樣間隔為10 s,記錄了公交在某時(shí)刻(精確到s)的經(jīng)緯度,同時(shí)也記錄了車輛的行駛速度,公交在首末公交站點(diǎn)的時(shí)間也從GPS數(shù)據(jù)中獲得.共有1 388條線路、826 279條數(shù)據(jù)樣本量.
從線路設(shè)置自身初步考慮的變量包括,公交線路的長(zhǎng)度、公交線路的站點(diǎn)數(shù)量、公交站點(diǎn)的平均間距、公交線路跨越的區(qū)域數(shù)量、以及公交線路跨越的主要區(qū)域類型.其中區(qū)域的分類,參照《上海公交線網(wǎng)優(yōu)化導(dǎo)則》,分為一類區(qū)域、二類區(qū)域、三類區(qū)域.當(dāng)公交線路跨越幾類區(qū)域時(shí),頻率最高的區(qū)域類型作為該線路的主要區(qū)域類型;當(dāng)幾種區(qū)域類型頻率相同時(shí),選擇等級(jí)更高的區(qū)域類型(等級(jí):一類區(qū)域>二類區(qū)域>三類區(qū)域)作為跨越的主要區(qū)域類型.
從線路的運(yùn)行,影響行程時(shí)間可靠性造成行程時(shí)間波動(dòng)的因素,主要是受交通狀態(tài)的影響.交通狀態(tài)的直接反映指標(biāo)是速度,所以選取線路平均行程速度作為自變量.
鑒于路網(wǎng)交通流有明顯的潮汐性,公交在運(yùn)行過程中與其他車輛相互影響,所以公交行程時(shí)間可靠性也應(yīng)該分時(shí)段分析公交線路行程時(shí)間可靠性.根據(jù)上海市第五次交通大調(diào)查,將一天分為5個(gè)研究時(shí)段:凌晨0:00—6:00,早高峰6:00—10:00,平峰10:00—15:00,晚高峰15:00—20:00和晚上20:00—24:00.
同時(shí),除了1 d內(nèi)的交通潮汐情況,工作日與非工作日的交通特性也不盡相同,所以工作日與非工作日也納入影響因素分析.
對(duì)影響因素?cái)?shù)據(jù)作為變量進(jìn)行統(tǒng)計(jì),結(jié)果見表1.
表1 變量描述性分析
若影響因素為分類變量則采用卡方檢驗(yàn),否則用T檢驗(yàn),檢驗(yàn)結(jié)果見表2.
表2 影響因素與公交可靠度R的顯著性檢驗(yàn)
由表2可知:所有的影響因素變量都與可靠度變量R顯著相關(guān).研究進(jìn)一步分析了影響因素變量間的顯著性關(guān)系,來排除自變量高度相關(guān),模型變量共線性的問題.結(jié)果表明:自變量間的相關(guān)性不強(qiáng).
部分影響因素與可靠度R間存在非單調(diào)性關(guān)系,比如當(dāng)公交運(yùn)行的行程時(shí)間很短時(shí),公交運(yùn)行可靠度高,因?yàn)楸黄渌囕v或者紅綠燈影響公交運(yùn)行的機(jī)會(huì)少;當(dāng)車輛運(yùn)行的行程時(shí)間很長(zhǎng)時(shí),公交運(yùn)行可靠度高,因?yàn)樾谐虝r(shí)間長(zhǎng)的公交線路極有可能經(jīng)過很多長(zhǎng)路段,在這些長(zhǎng)路段上,公交車可以提高運(yùn)行速度來彌補(bǔ)在擁堵或交叉口產(chǎn)生的延誤.除了公交行程時(shí)間,公交站點(diǎn)數(shù)量或許也存在類似情況.
為了定量分析這種非單調(diào)性關(guān)系,以公交行程時(shí)間為例,將所有線路的公交行程時(shí)間按照數(shù)值從小到大依次排列,選取九個(gè)等分點(diǎn),將行程時(shí)間數(shù)值劃分為10個(gè)區(qū)間,得到在每一個(gè)區(qū)間的線路可靠度概率(p=可靠度為1的線路數(shù)/總線路數(shù)),并計(jì)算其發(fā)生比的自然對(duì)數(shù)值,也就是Logit(p),結(jié)果見圖3.
圖3 不同行程時(shí)間組的Logit(p)
圖3表明當(dāng)公交的行程時(shí)間的區(qū)間為第6區(qū)間時(shí),Logit(p)最低,也就是說行程可靠度最低;而當(dāng)行程時(shí)間離第6區(qū)間越遠(yuǎn),Logit(p)越高,證明行程時(shí)間可靠度越好,第六組的平均值為3 886 s.
公交站點(diǎn)數(shù)量也存在和行程時(shí)間類似的情況:當(dāng)公交站點(diǎn)數(shù)量處于中間狀態(tài)(21站)時(shí),行程時(shí)間可靠度最好,當(dāng)公交站點(diǎn)數(shù)量與中間狀態(tài)差距越大,公交的可靠度越差.
若將這兩個(gè)變量直接放入模型中,這些重要的信息難以得到體現(xiàn),故需對(duì)這兩個(gè)變量做轉(zhuǎn)換:分別取行程時(shí)間與其平均值(3 886 s)和站點(diǎn)數(shù)量與其中間狀態(tài)(21站)差額的絕對(duì)值.
構(gòu)建貝葉斯邏輯回歸模型來定量分析顯著影響因素與公交行程時(shí)間可靠度R之間的關(guān)系.傳統(tǒng)的邏輯回歸模型認(rèn)為模型中自變量的系數(shù)是一個(gè)確定值,但是貝葉斯模型認(rèn)為自變量的系數(shù)服從一個(gè)預(yù)定的分布,并且貝葉斯模型能以上一次模型的結(jié)果作為參考,更新模型,用多次穩(wěn)定的回歸結(jié)果來得到自變量系數(shù)的分布情況.
行程時(shí)間可靠度,可靠與不可靠,發(fā)生的比例分別為p(R=1)和1-p(R=0).貝葉斯邏輯回歸模型為
(4)
式中:β0距;xj為第j個(gè)自變量;βj為第j個(gè)自變量的系數(shù).因?yàn)闆]有類似研究能為βj參考,所以采用無信息先驗(yàn)分布,認(rèn)為β0服從以下分布:
β0~N(0,106)
βj~N(0,106)
行程時(shí)間可靠度的貝葉斯邏輯回歸模型通過R語言調(diào)用Winbugs得到.一共有10 000次模型迭代,其中前5 000次模型迭代沒有用于模型結(jié)果中,因?yàn)槌跏嫉慕Y(jié)果存在很大的波動(dòng)性且受初始值影響大,故不能反映真實(shí)的自變量系數(shù)情況.本研究將后5 000次模型迭代的結(jié)果用于得到變量的系數(shù),同時(shí)也檢查了這5 000次迭代的系數(shù)值,結(jié)果顯示自變量系數(shù)的數(shù)值穩(wěn)定,故采用后5 000此迭代的結(jié)果是合理的.
研究隨機(jī)抽取70%的樣本作為模型標(biāo)定的樣本,剩余30%作為模型檢驗(yàn)的樣本.對(duì)于標(biāo)定樣本,最先將表2中除了站點(diǎn)數(shù)目以及行程時(shí)間外的所有變量,以及轉(zhuǎn)換過后的站點(diǎn)數(shù)目與行程時(shí)間放入貝葉斯邏輯回歸模型中,然后將那些在95%貝葉斯區(qū)間不顯著的變量一一剔除,最終的模型結(jié)果見表3.
表3 模型結(jié)果
當(dāng)行程時(shí)間與3 886 s相差越大,公交的行程可靠性增加,差距每增加1 000 s,行程時(shí)間可靠的發(fā)生比增加117%.行程時(shí)間很短時(shí),因?yàn)楸黄渌囕v或者紅綠燈影響公交運(yùn)行的時(shí)間長(zhǎng)度短,所以公交運(yùn)行可靠度高;當(dāng)車輛運(yùn)行的行程時(shí)間很長(zhǎng)時(shí),公交可以在此長(zhǎng)時(shí)間段,調(diào)整速度,以彌補(bǔ)因擁堵或其他突發(fā)事件而產(chǎn)生的延誤.
相對(duì)于平峰而言,凌晨、晚上、早晚高峰的行程時(shí)間可靠度較差.工作日相對(duì)于非工作日而言,行程時(shí)間可靠度較差,這是因?yàn)楣ぷ魅张c非工作日相比,出行車輛更多,公交受其他車輛的影響更大.
相對(duì)于第三類區(qū)域而言,第一類與第二類區(qū)域的行程時(shí)間可靠度較差.第一類區(qū)域?yàn)閮?nèi)環(huán)內(nèi),第二類區(qū)域?yàn)閮?nèi)外環(huán)之間或郊區(qū)新城及重點(diǎn)開發(fā),第三類區(qū)域?yàn)橥猸h(huán)外的其他地區(qū),故相對(duì)于第三類區(qū)域而言,第一類與第二類區(qū)域的交通更為擁堵,所以行程可靠度更低.
文中提出了可靠度指數(shù)和運(yùn)行可靠度作為整條線路的行程時(shí)間可靠性的評(píng)價(jià)指標(biāo),運(yùn)用上海市公交線路的運(yùn)行數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)線路平均行程速度、公交線路跨越的區(qū)域數(shù)量、公交線路的長(zhǎng)度、公交線路的站點(diǎn)數(shù)量、公交站點(diǎn)的平均間距、公交線路跨越的主要區(qū)域類型、以及運(yùn)行時(shí)段、工作日與非工作日都會(huì)影響其可靠性,并建立了貝葉斯邏輯回歸模型來反映其定量關(guān)系.但研究由于數(shù)據(jù)限制,只分析了的線路的起點(diǎn)到終點(diǎn)的行程時(shí)間可靠性,后續(xù)可以細(xì)化研究站點(diǎn)到站點(diǎn)間的行程時(shí)間可靠度.同時(shí),鑒于天氣對(duì)公交運(yùn)行也有影響,后需將融合交通氣象數(shù)據(jù),將天氣納入對(duì)公交行程時(shí)間可靠度的影響分析中.