杜瑜琦 李新月 李晶晶
摘 要 研究城市乘車人的出行支付特征,就需要從他們的出行數(shù)據(jù)進(jìn)行分析。首先,運用K-means聚類算法對數(shù)據(jù)進(jìn)行處理,再使用MATLAB等軟件進(jìn)行時間序列分析,并對支付方式和出行方式進(jìn)行相關(guān)性分析,從不同角度、不同側(cè)重點總結(jié)乘車人的出行支付特征。
關(guān)鍵詞 K-means 聚類算法 時間序列分析 相關(guān)性分析
一、引言
隨著移動支付的普及,現(xiàn)金在我們?nèi)粘I钪械某霈F(xiàn)頻率大幅降低。在公共交通領(lǐng)域,移動支付卻并沒有完全走進(jìn)人們的生活。本文意在通過調(diào)查與數(shù)據(jù)分析了解大眾對公交移動支付的態(tài)度以及出行支付方式的變化趨勢,了解大眾的移動支付特征。
二、問題分析
要對城市乘車人的出行支付特征進(jìn)行分析,首先可以運用K-means聚類算法剔除數(shù)據(jù)中的缺失與錯誤值,而后使用EXCEL等軟件進(jìn)行時間序列分析,再運用SPSS對支付方式和出行方式進(jìn)行相關(guān)性分析,得出基于不同角度和不同側(cè)重點的城市人群出行支付特征。
三、問題的建模與求解
針對乘車人的出行支付特征的問題,可以利用乘車人的支付信息和數(shù)據(jù),從時間與支付方式以及出行方式與支付方式兩個方向進(jìn)行統(tǒng)計分析。首先通過時間序列分析得到支付方式的比例隨時間的變化趨勢,判斷其是否具有周期特征;再利用相關(guān)性分析,判斷乘車人的出行方式是否影響支付手段。
(一)支付方式的時間序列分析
隨機(jī)選取某一天的數(shù)據(jù)進(jìn)行處理,以00:00為起點,以2小時為單位,將一天劃分為12個等距區(qū)間,統(tǒng)計每個區(qū)間內(nèi)選擇移動支付的客流量總數(shù)。結(jié)果如圖1所示。
由圖1可見,乘車人的出行時間密度圖呈左偏態(tài)分布。15:00~
17:59是出行數(shù)量最高的時間段,凌晨0:00~5:59階段公交地鐵出行量數(shù)據(jù)對于整體數(shù)據(jù)來說幾乎等于不存在。
由于原始數(shù)據(jù)量龐大而處理過后數(shù)據(jù)較少,因此使用高斯噪聲將原始圖像加噪,結(jié)果如圖2所示。
同時隨機(jī)選取一年中2、5、8、11月中的每月7天的數(shù)據(jù),統(tǒng)計共28天支付方式占總體的比例,運用MATLAB進(jìn)行曲線擬合和自相關(guān)分析,結(jié)果如圖3所示。
通過擬合曲線函數(shù)圖可看出在總體調(diào)查的一年時間內(nèi)呈遞減趨勢,數(shù)據(jù)點也隨著時間的變化愈發(fā)的貼近擬合曲線;通過自相關(guān)圖可以看出數(shù)據(jù)在1~7天,存在自相關(guān)系數(shù)大于0.02為非平穩(wěn)序列;從第8天起為平穩(wěn)序列。所以,乘車人對移動支付的偏好降低。造成這種現(xiàn)象的原因是:機(jī)器未及時進(jìn)行檢修,導(dǎo)致乘車人刷卡故障。
(二)相關(guān)性分析模型
運用SPSS針對出行方式(公交、地鐵)與支付方式進(jìn)行相關(guān)性分析,結(jié)果如下表1所示。
由表1看出,支付方式與出行方式相關(guān),但非線性相關(guān),即二者存在其他的非線性關(guān)系。通過比較兩種出行方式與支付方式的顯著性,發(fā)現(xiàn)地鐵出行與支付方式存在更強(qiáng)烈的相關(guān)關(guān)系。
四、結(jié)語
一是乘車人的出行密度是根據(jù)乘車人們?nèi)粘W飨r間進(jìn)行合理性波動的。乘車人的出行支付特征具有顯著的周期性,以七天為周期波動;峰值往往出現(xiàn)于一個周期的后半期;二是出行方式與支付方式并無線性相關(guān)關(guān)系,但存在相關(guān)性。當(dāng)乘車人選擇地鐵出行時,他的支付方式受出行方式影響程度更為強(qiáng)烈。
(杜瑜琦、李新月單位為華北理工大學(xué)經(jīng)濟(jì)學(xué)院;李晶晶單位為華北理工大學(xué)管理學(xué)院)
參考文獻(xiàn)
[1] 崔喬.基于MATLAB的圖像灰度分析及高斯白噪聲的研究[J].科技創(chuàng)新與應(yīng)用,2018(27):60-61.