謝國(guó)微,錢林波,湯文蘊(yùn) XIE Guowei,QIAN Linbo,TANG Wenyun
(南京林業(yè)大學(xué) 汽車與交通工程學(xué)院,江蘇 南京 210037)
共享單車的出現(xiàn),增加了居民通勤方式的選擇,其與公共交通的銜接,成為一種新的出行模式。不僅滿足了人們的出行需求,也對(duì)緩解城市交通擁堵起到了一定的作用。但共享單車出行極易受到交通環(huán)境的干擾,其中天氣是一種重要的干擾因素。
以往關(guān)于共享單車的騎行研究大多通過調(diào)查問卷,這樣的數(shù)據(jù)來源樣本小,研究結(jié)果易產(chǎn)生偏差。而對(duì)大數(shù)據(jù)的挖掘與分析突破了傳統(tǒng)的數(shù)據(jù)收集方法的限制,可以得到更為可靠的研究結(jié)論,為自行車運(yùn)營(yíng)商和政府調(diào)整自行車管理策略提供更加堅(jiān)實(shí)的參考依據(jù)。因而本文通過共享單車訂單數(shù)據(jù)探究天氣因素對(duì)共享單車出行需求的影響,以及各影響因素之間的相互關(guān)系。
Gebhark研究發(fā)現(xiàn),道路上出現(xiàn)的霧等天氣狀況會(huì)降低水平能見度進(jìn)而導(dǎo)致公共自行車出行率降低。Campbell等研究結(jié)果發(fā)現(xiàn)溫度、降雨以及空氣質(zhì)量等條件對(duì)選擇自行車出行影響程度較強(qiáng)。Wang等認(rèn)為少量的雨和霧可能對(duì)用戶出行的選擇影響不大。Sun等得出結(jié)論,下雨天氣的影響因用戶群體而異。
閔家楠分別研究了雨天和空氣質(zhì)量較差時(shí)公共自行車的出行強(qiáng)度,發(fā)現(xiàn)兩種天氣情況下公共自行車的使用具有一定的規(guī)律。龔迪嘉等采用氣溫、降水量和地形特征作為評(píng)價(jià)因素,發(fā)現(xiàn)北京等城市適宜發(fā)展公共自行車,而有些山地眾多的城市則不適宜發(fā)展公共自行車。黎鵬的研究表明,不同地點(diǎn)或不同時(shí)段受天氣因素影響的特征差距很大。魏志強(qiáng)等認(rèn)為降雨和溫度都對(duì)共享單車騎行距離意愿產(chǎn)生顯著影響。朱妍和干宏程認(rèn)為天氣是影響出行者短距離出行是否選擇自行車的首要因素。
目前,對(duì)于自行車的研究主要集中在自行車的出行特征、出行需求預(yù)測(cè)、公共自行車站點(diǎn)布局等方面,對(duì)于天氣的影響探究還不足。利用共享單車出行大數(shù)據(jù),探索天氣因素對(duì)共享單車出行需求的影響,不僅有助于評(píng)估天氣對(duì)城市居民社會(huì)經(jīng)濟(jì)活動(dòng)的影響程度,也能為更準(zhǔn)確地研究城市用戶使用共享單車的影響機(jī)制提供支撐。
自行車數(shù)據(jù)來源于上海市2016年8月的摩拜單車訂單及軌跡數(shù)據(jù),原始數(shù)據(jù)涵蓋了2016年8月1日到8月31日,共102 361條記錄,每條記錄包含訂單編號(hào)、車輛編號(hào)、用戶編號(hào)、起終點(diǎn)位置、起止時(shí)間、軌跡等信息。氣象數(shù)據(jù)由環(huán)??偩謱?shí)時(shí)監(jiān)測(cè)數(shù)據(jù)和網(wǎng)站rp5.ru數(shù)據(jù)整合而成,其中包含以小時(shí)為單位的天氣情況、空氣質(zhì)量指標(biāo)等信息。
本研究利用Python(Anaconda中的Spyder平臺(tái))進(jìn)行數(shù)據(jù)清洗與挖掘。在原始數(shù)據(jù)中新增“時(shí)長(zhǎng)”列,計(jì)算騎行起止時(shí)間的差值得到騎行時(shí)長(zhǎng),并將時(shí)長(zhǎng)單位換算成分鐘;新增“路徑”列,通過不斷讀入騎行軌跡列表,每一次按順序取出兩個(gè)列表元素,得到前軌跡點(diǎn)經(jīng)緯度和后軌跡點(diǎn)經(jīng)緯度,計(jì)算出兩點(diǎn)的位移,再把每小段的位移累加起來得到騎行的路徑;通過騎行路徑除以騎行時(shí)長(zhǎng),新增“速度”列,并將單位換算為km/h。
參考相關(guān)文獻(xiàn),選取騎行速度12~20km/h、騎行時(shí)長(zhǎng)1~120分鐘的訂單數(shù)據(jù),最終提取出35 909條記錄。在提取出的數(shù)據(jù)中,根據(jù)訂單開始時(shí)間,新增日、星期、小時(shí)字段,并按照日、星期、小時(shí)整合數(shù)據(jù)集,統(tǒng)計(jì)每小時(shí)訂單數(shù),作為后續(xù)研究中的因變量。將整合后的摩拜單車數(shù)據(jù)集與天氣數(shù)據(jù)集進(jìn)行合并,為后續(xù)分析做好準(zhǔn)備。
根據(jù)研究?jī)?nèi)容,本文的因變量定義為共享單車出行需求,用共享單車的小時(shí)出行量表示。
本文涉及的天氣因素包括天氣情況、空氣質(zhì)量指標(biāo)、溫度、大氣壓、相對(duì)濕度、風(fēng)速、總云量、水平能見度。其中,空氣質(zhì)量指標(biāo)包括AQI、PM2.5、PM10、SO、NO、CO、O等濃度。
天氣情況變量屬于分類型變量,不能直接進(jìn)行回歸分析,應(yīng)設(shè)置虛擬變量。如果所有虛擬變量都參與回歸分析,則會(huì)導(dǎo)致完全共線性問題。當(dāng)分類型解釋變量有個(gè)類別值,則只需引入-1個(gè)虛擬變量到回歸模型中。本研究調(diào)查得到的天氣情況有晴、多云、陰、中雨、陣雨、雷陣雨6種變量,因此只設(shè)置5個(gè)虛擬變量。表中=0代表工作日數(shù)據(jù),=1代表休息日數(shù)據(jù)。虛擬變量定義及編碼如表1所示。
表1 虛擬變量定義及編碼
表2 數(shù)值型變量定義與編碼
統(tǒng)計(jì)工作日和休息日的日均騎行時(shí)間分布特征(如圖1所示)。工作日有明顯的早高峰和晚高峰。早高峰出現(xiàn)在7點(diǎn)至9點(diǎn),晚高峰出現(xiàn)在17點(diǎn)至19點(diǎn),而9點(diǎn)至17點(diǎn)、19點(diǎn)至22點(diǎn)則為平峰時(shí)段;休息日數(shù)據(jù)在7點(diǎn)至22點(diǎn)無明顯的波動(dòng)。0點(diǎn)至6點(diǎn)的共享單車出行需求顯著低于其他時(shí)段。因而后續(xù)分析中將以7點(diǎn)至22點(diǎn)作為研究時(shí)段。
圖1 工作日和非工作日24h訂單數(shù)分布
參考《上海市城市總體規(guī)劃(2017-2035)》,本文將上海中心城區(qū)作為研究范圍。上海中心城區(qū)包括靜安區(qū)、徐匯區(qū)、虹口區(qū)、普陀區(qū)、黃浦區(qū)、長(zhǎng)寧區(qū)、楊浦區(qū)以及浦東新區(qū)等外環(huán)線以內(nèi)的區(qū)域。
將摩拜單車的騎行起點(diǎn)經(jīng)緯度位置導(dǎo)入ArcGIS,運(yùn)用核密度分析工具對(duì)騎行起點(diǎn)的空間分布進(jìn)行可視化(如圖2所示)。
圖2 上海中心城區(qū)共享單車騎行起點(diǎn)密度分布
圖2中黑色線框內(nèi)為上海中心城區(qū)范圍??梢钥闯?,上海騎行活動(dòng)多集中發(fā)生在城市公共活動(dòng)中心、醫(yī)院、高校等場(chǎng)所。如楊浦區(qū)所建高校較其他行政區(qū)域密集,自行車騎行起點(diǎn)的密度也是最高的。這證明了共享單車在高校學(xué)生中的流行度,也說明了騎行活動(dòng)受建成環(huán)境的影響較大。
在Spyder中利用Seaborn庫(kù)繪制所有備選自變量的相關(guān)性系數(shù)圖(如圖3所示),可以發(fā)現(xiàn)各自變量之間是否存在線性相關(guān)關(guān)系,為后文使用多元線性回歸分析提供參考。
圖3 自變量相關(guān)關(guān)系分析
如圖3所示,橙色單元格表示所對(duì)應(yīng)的兩個(gè)變量呈正相關(guān),且顏色越淺,相關(guān)性越大;紫色單元格表示所對(duì)應(yīng)的兩個(gè)變量呈負(fù)相關(guān),且顏色越深,相關(guān)性越大。單元格中的數(shù)字表示兩個(gè)特定變量的相關(guān)系數(shù)。
從圖中可以看出,天氣狀況與相對(duì)濕度存在中度相關(guān),這也與實(shí)際生活規(guī)律相符。溫度和NO濃度、大氣壓,相對(duì)濕度與O濃度存在一定程度的負(fù)相關(guān)。其中,AQI與PM2.5、PM10、SO、NO、CO、O濃度的相關(guān)性均較強(qiáng),這可能是由于他們之間的定義存在部分重疊。尤其,AQI與PM2.5和PM10高度相關(guān),需要結(jié)合三者之間的散點(diǎn)圖進(jìn)一步分析。
如圖4所示,AQI與PM2.5、PM10之間存在正相關(guān)關(guān)系,這反映出AQI與PM2.5、PM10可能存在多重共線性問題。因而在多元線性回歸分析時(shí)可以考慮剔除一些變量。
圖4 PM2.5、PM10和AQI構(gòu)成的散點(diǎn)圖
(1)共享單車出行需求與AQI
由于AQI與PM2.5、PM10、SO、NO、CO、O的定義存在部分重疊,且皆具有不同程度的正相關(guān)性。所以僅描繪共享單車出行需求隨著AQI的變化圖,如圖5所示。
圖5 共享單車出行需求與AQI
整體上看,工作日共享單車小時(shí)出行量高于休息日。隨著AQI值的不斷增大,休息日共享單車出行量發(fā)生變化的幅度較小,但是工作日的下降趨勢(shì)比較明顯。顯然,空氣質(zhì)量因素會(huì)在一定程度上影響用戶的共享單車出行需求。相關(guān)研究也表明,騎行過程中人的肺活量增大,吸進(jìn)體內(nèi)的有害物質(zhì)會(huì)增多,對(duì)身體的潛在危害更大。
(2)共享單車出行需求與溫度
根據(jù)圖6可知,隨著氣溫的上升,工作日和休息日的共享單車出行量均有小幅的降低,變化程度較為接近。這可能是因?yàn)楸狙芯績(jī)H涵蓋8月份范圍的訂單數(shù)據(jù),因此氣溫的變化程度不明顯。
圖6 共享單車出行需求與溫度
(3)共享單車出行需求與大氣壓
從圖7可以發(fā)現(xiàn)共享單車的出行量與氣壓的變化均存在一定的正相關(guān)。氣壓的高低對(duì)人體生理的影響主要是影響人體內(nèi)氧氣的供應(yīng)。氣壓下降,機(jī)體會(huì)加快呼吸及血循環(huán),出現(xiàn)呼吸、心率加快的現(xiàn)象。且在低壓環(huán)流形式下,大多為陰雨天氣,風(fēng)的變化比較明顯;在高壓環(huán)流形式下,多為晴天,天氣比較穩(wěn)定。同時(shí),氣壓的變化還會(huì)影響人的心理變化,使人產(chǎn)生壓抑、郁悶的情緒。例如,夏季雷雨前的高濕天氣,此時(shí)氣壓較低,人常有抑郁不適之感。上述因素,皆會(huì)影響用戶騎行的決策。
圖7 共享單車出行需求與大氣壓
(4)共享單車出行需求與相對(duì)濕度
如圖8所示,隨著相對(duì)濕度的增加,共享單車出行量有較小的增長(zhǎng)趨勢(shì)。環(huán)境相對(duì)濕度過低時(shí)會(huì)降低人體呼吸系統(tǒng)的抵抗力,誘發(fā)和加重呼吸系統(tǒng)疾病,進(jìn)而影響用戶出行方式的選擇。同時(shí),濕度的變化通常也伴隨著氣溫與氣壓的變化,因而相對(duì)濕度對(duì)用戶出行決策的影響值得關(guān)注。
圖8 共享單車出行需求與相對(duì)濕度
(5)共享單車出行需求與風(fēng)速
風(fēng)速的大小常用風(fēng)級(jí)來表示。在氣象上,一般按風(fēng)速大小將風(fēng)劃分為十七個(gè)等級(jí)。通過圖9可以發(fā)現(xiàn),隨著風(fēng)速的提高,共享單車出行需求有一定程度的上升,說明用戶更愿意在有風(fēng)環(huán)境下騎行。可見風(fēng)速在1m/s到8m/s,即5級(jí)以內(nèi)的風(fēng)力(清風(fēng))對(duì)于共享單車出行的影響是正向的。受調(diào)查數(shù)據(jù)的限制,當(dāng)風(fēng)速繼續(xù)增大時(shí),會(huì)對(duì)共享單車出行需求呈現(xiàn)怎樣的影響還有待進(jìn)一步的研究。
圖9 共享單車出行需求與風(fēng)速
(6)共享單車出行需求與總云量
從圖10可以發(fā)現(xiàn),總云量無規(guī)則波動(dòng)幅度相對(duì)較大,云量的增加在一定程度上會(huì)引起共享單車出行需求的增加。這可能是因?yàn)樵屏康亩嗌偾『檬乔?、陰、多云等天氣的反映,而用戶更喜歡在溫度相對(duì)較低,即多云或陰天等云量較多的氣象條件下選擇自行車出行。
圖10 共享單車出行需求與總云量
(7)共享單車出行需求與天氣情況
如圖11所示為共享單車在不同天氣情況下平均每小時(shí)的出行量。工作日在晴天時(shí)的共享單車小時(shí)出行量最高,而休息日在雷陣雨下的共享單車小時(shí)出行量最高,這可能與工作日和休息日用戶的不同出行目的有關(guān)。整體上,晴天、多云條件下的共享單車出行需求要多于陰雨天氣。這與現(xiàn)實(shí)中的規(guī)律較為符合。但在雨天下仍有不少共享單車用戶出行,這可能是因?yàn)橛脩袅?xí)慣性地采取了某種避雨措施,也反映出在短距離出行方面,共享單車作為一種通勤、接駁工具,對(duì)用戶而言是一種剛性需求。
圖11 共享單車出行需求與天氣情況
由于上海城區(qū)8月份無霧、霾等惡劣天氣,水平能見度大部分處于10km,因此本小節(jié)暫不分析水平能見度與共享單車出行需求的關(guān)系。
為了更好地分析天氣變化與共享單車出行需求的關(guān)系,使用SPSS軟件建立多元線性回歸模型,分別研究工作日和休息日的數(shù)據(jù)。
采用向后選擇法輸入自變量建立回歸方程。其中,工作日和休息日數(shù)據(jù)分別經(jīng)過10步構(gòu)建回歸模型。
表3顯示調(diào)整后平方分別為42.3%和57.2%,模型的結(jié)果較為可靠。
表3 模型摘要
表4中,工作日和休息日的顯著性水平近似于0,說明因變量與自變量的線性關(guān)系顯著,下面進(jìn)行多元線性回歸模型分析。
表4 變異數(shù)分析
如表5所示,工作日數(shù)據(jù)最終模型中各解釋變量的顯著性水平都小于0.05,說明表中變量對(duì)共享單車出行需求的解釋是有顯著性貢獻(xiàn)的。已經(jīng)篩除的自變量有多云、陣雨、PM2.5、PM10、SO、NO、O、相對(duì)濕度、總云量。將各最終解釋變量帶入方程,工作日回歸方程如式(1)所示:
表5 工作日系數(shù)
結(jié)合回歸系數(shù)可知,陰、中雨、雷陣雨天氣對(duì)共享單車出行需求的影響,皆呈負(fù)相關(guān),雷陣雨比中雨帶來的影響更顯著。AQI、CO的系數(shù)為負(fù),說明與共享單車出行需求負(fù)相關(guān),其中AQI的影響程度最大。溫度對(duì)共享單車出行需求的影響是負(fù)的,隨著溫度每升高一個(gè)單位,共享單車出行量平均降低5.046輛/h。大氣壓、風(fēng)速、水平能見度都與共享單車出行需求正相關(guān)。
如表6所示,休息日數(shù)據(jù)中篩除的自變量有多云、中雨、陣雨、PM2.5、SO、NO、CO、大氣壓、總云量、水平能見度,這些變量對(duì)共享單車出行需求的線性解釋沒有顯著性貢獻(xiàn)。將表中各自變量帶入方程,休息日回歸方程如式(2)所示:
表6 休息日系數(shù)
結(jié)合回歸系數(shù)可知,雷陣雨、AQI、PM10、溫度都對(duì)共享單車出行需求有著負(fù)向影響,而AQI的影響程度較之其他因素最大。風(fēng)速的相關(guān)系數(shù)為正,隨著風(fēng)速每提高1個(gè)單位,共享單車出行量平均增加2.844輛/h。這些結(jié)論與工作日數(shù)據(jù)模型較為一致。
與工作日不同的是,休息日數(shù)據(jù)中,陰天的影響系數(shù)為正。這可能是與工作日、休息日下用戶的出行目的不同有關(guān)。工作日多以通勤、接駁為目的,休息日多以?shī)蕵?、休閑出行為主。陰天時(shí),以?shī)蕵沸蓍e為目的出行的共享單車用戶會(huì)覺得更涼爽,騎行體驗(yàn)更好。另外,休息日中少了中雨、大氣壓、水平能見度三個(gè)因素,增加了PM10、相對(duì)濕度兩個(gè)因素,其中PM10的回歸系數(shù)為負(fù),相對(duì)濕度的回歸系數(shù)為正。這也可能與不同出行目的的用戶對(duì)環(huán)境里不同因素的關(guān)注程度不同有關(guān)。
本文選取上海市中心城區(qū),研究了天氣因素對(duì)共享單車出行需求的影響。從研究中得到如下結(jié)論:
(1)工作日中,大氣壓和水平能見度對(duì)共享單車出行需求的影響是顯著正相關(guān)的,但對(duì)休息日出行用戶無影響。休息日時(shí),PM10呈現(xiàn)負(fù)向影響,相對(duì)濕度呈現(xiàn)正向影響,但對(duì)工作日出行用戶無影響。
(2)AQI與PM2.5、PM10等空氣質(zhì)量指標(biāo)存在一定的正相關(guān)關(guān)系。隨著AQI指數(shù)的增加,即污染程度增高時(shí),會(huì)使共享單車出行需求降低。
(3)晴天、多云天氣時(shí),共享單車的出行需求要顯著多于陰、雨天氣。陰、中雨、陣雨、雷陣雨天氣在工作日與休息日,對(duì)共享單車的出行需求影響程度有所不同。雷陣雨在工作日中的影響程度要大于其他因素,而休息日出行的用戶更喜歡選擇陰天騎行。
(4)隨著溫度的升高,共享單車的出行需求會(huì)有所降低。相反,隨著風(fēng)速的提高,在一定范圍內(nèi),共享單車的出行需求會(huì)增加。
根據(jù)上述結(jié)論,建議共享單車管理者在雨天、污染等惡劣天氣與高溫時(shí)段下減少單車的投放量,節(jié)約道路空間,合理分配自行車資源。由于休息日的共享單車出行需求要低于工作日,可在休息日期間對(duì)共享單車分時(shí)段、分區(qū)域進(jìn)行維護(hù),提高用戶的使用體驗(yàn)。