洪鈴,滕磊,潘婷婷,朱家明*
基于因子分析法“互聯(lián)網(wǎng)+”時(shí)代出租車資源配置的研究
洪鈴a,滕磊a,潘婷婷b,朱家明a*
(安徽財(cái)經(jīng)大學(xué)a.統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院;b.金融學(xué)院,安徽蚌埠233031)
應(yīng)用因子分析、描述分析、算法遍歷等方法,分別構(gòu)建因子分析模型、算法流程圖等,討論并研究了影響出租車供求匹配程度的主要因素、不同時(shí)空下出租車資源的供求匹配程度分布規(guī)律、各公司補(bǔ)貼方案是否能緩解打車難等相關(guān)問題。使用SPSS、EXCEL軟件求解,綜合運(yùn)用定性與定量分析法分析問題。
出租車資源配置;因子分析;算法遍歷;SPSS
出租車是城市交通中最為活躍的客運(yùn)方式,“打車難”是人們關(guān)注的一個(gè)社會(huì)熱點(diǎn)問題。隨著智能移動(dòng)“互聯(lián)網(wǎng)+”進(jìn)入一個(gè)全新時(shí)代,多家打車公司依托移動(dòng)互聯(lián)網(wǎng)建立了各種打車軟件服務(wù)平臺(tái),然而運(yùn)營成本高、油價(jià)上漲等因素使得我國很多城市出現(xiàn)供求不匹配現(xiàn)象,同時(shí)也引發(fā)了“打的難”、“服務(wù)態(tài)度差”、“拒載”等問題。因此研究出租車供求匹配程度的主要影響因素及時(shí)空分布規(guī)律是解決打車難問題的前提,之后才能結(jié)合拒載函數(shù)分析各公司的補(bǔ)貼方案是否能緩解打車難,最后設(shè)計(jì)算法流程圖并遍歷算法以提供合理的補(bǔ)貼方案(詳見2015年全國大學(xué)生數(shù)學(xué)建模競(jìng)賽B題[1])。
1.1 研究思路
查閱相關(guān)文獻(xiàn),確定出租車需求的指標(biāo)為年末常住人口、地區(qū)生產(chǎn)總值、出租車價(jià)格、公交車數(shù)量,供給的指標(biāo)為人均可支配收入、建成區(qū)面積、出租車數(shù)量、油價(jià)[2],采取控制變量法,針對(duì)同一地點(diǎn)不同時(shí)間、同一時(shí)間不同地點(diǎn)兩種情況,選取代表城市蘇州市2008—2013年各年及2013年蘇州市區(qū)、吳江區(qū)、常熟區(qū)、張家港、昆山、太倉各區(qū)的出租車供給和需求進(jìn)行分析,根據(jù)從蘇州市統(tǒng)計(jì)年鑒[3]獲取的供求指標(biāo)的數(shù)據(jù),分別對(duì)供給和需求進(jìn)行因子分析得出供給與需求的回歸函數(shù)模型,進(jìn)而定義出租車資源的供求匹配程度函數(shù)表達(dá)式。
1.2 數(shù)據(jù)處理
為了消除指標(biāo)之間的差別,保持指標(biāo)統(tǒng)計(jì)口徑的一致性,需要對(duì)各評(píng)價(jià)指標(biāo)值進(jìn)行無量綱化[4]處理,因?yàn)樗x指標(biāo)均為效益性指標(biāo),可建模型:,其中aij為原指標(biāo)值,zij為無量綱后的指標(biāo)值。限于篇幅,在此僅列出2008—2013年蘇州市的出租車需求指標(biāo)值無量綱化后的結(jié)果,如表1所示。
表12008 -2013年蘇州市的出租車需求指標(biāo)無量綱化后數(shù)值
1.3 研究方法
因子分析法[5]根據(jù)指標(biāo)數(shù)據(jù)之間相關(guān)性的大小把變量分組,使得組內(nèi)變量指標(biāo)之間相關(guān)性強(qiáng),組間變量指標(biāo)相關(guān)性弱,每組變量均代表一個(gè)公共因子,用少量的綜合指標(biāo)即公因子代替多個(gè)原始指標(biāo),以此用來簡(jiǎn)化模型。采用上面無量綱化后的數(shù)據(jù),利用EXCEL對(duì)各指標(biāo)進(jìn)行相關(guān)性分析,得到相關(guān)系數(shù)矩陣R如表2所示。
表2 各指標(biāo)相關(guān)性分析表
由表2可知,各指標(biāo)之間的相關(guān)系數(shù)普遍高于50%,呈現(xiàn)較強(qiáng)的線性相關(guān),且Sig值均小于0.05,通過顯著性檢驗(yàn),故能從中提取出公共因子,適合做因子分析。
表3 因子的特征根和貢獻(xiàn)率
由主成分方差累計(jì)貢獻(xiàn)率不小于85%或主成分特征根不小于1的原則確定主因子個(gè)數(shù),由表3可知,第一個(gè)因子的貢獻(xiàn)率之和達(dá)到了92.84%,因此可將其作為公因子進(jìn)行分析。為了賦予主因子合理的經(jīng)濟(jì)含義,需要通過旋轉(zhuǎn)坐標(biāo)軸使負(fù)載盡可能向±1,0的方向靠近,從而降低因子的綜合性,在此采用方差最大化法對(duì)初始因子進(jìn)行正交旋轉(zhuǎn),使旋轉(zhuǎn)后公共因子的貢獻(xiàn)越分散越好,且原始指標(biāo)僅在一個(gè)公共因子上有較大的載荷,如表4所示。
表4 旋轉(zhuǎn)后因子得分系數(shù)矩陣
從所提取的公共因子的得分系數(shù)矩陣出發(fā),采用回歸法估計(jì)因子得分系數(shù),以公共因子的旋轉(zhuǎn)方差貢獻(xiàn)率為權(quán)重建立因子分析綜合模型:
由于主成分因子只選擇了年末常住人口,故不存在計(jì)算因子權(quán)重的問題,根據(jù)表4可寫出出租車需求函數(shù):D1=0.1396X1+0.1385X2+0.1245X3+0.1354X4。同樣的方法,計(jì)算出蘇州市2008—2013年出租車供給函數(shù):S1=0.1273X5+0.1295X6+0.1319X7+0.1323X8。對(duì)于供需匹配程度,比較需求量與供給量的比值與1的接近程度,比值越接近于1,則供需匹配情況越好,公式為:
數(shù)據(jù)代入表達(dá)式即可得到結(jié)果,對(duì)于同一時(shí)間不同地點(diǎn)的情況,采取同樣的方法可得出2013年蘇州市區(qū)、吳江區(qū)、常熟區(qū)、張家港、昆山、太倉各區(qū)的出租車供求匹配程度,結(jié)果如表5。
表5 供需匹配程度
1.4 結(jié)果分析
由表5可知,蘇州市各年的供求匹配程度存在很大的差異性,2008年和2009年的供求匹配程度均小于1,表明不存在明顯的打車難問題;2010年供求匹配值卻遠(yuǎn)遠(yuǎn)大于1,存在明顯的供小于求,打車難問題嚴(yán)重,蘇州地鐵公交等交通工具改善和修建之后,出租車的供不應(yīng)求現(xiàn)狀得到較大改善。蘇州市區(qū)、常熟、太倉三地區(qū)存在一定程度的打車難問題,太倉地區(qū)的打車難問題尤為嚴(yán)重,可能是由于太倉地區(qū)的經(jīng)濟(jì)不夠發(fā)達(dá),地鐵等公共交通設(shè)施不夠完善,導(dǎo)致乘客對(duì)出租車的需求較為旺盛;蘇州市區(qū)由于人口多,即使公共交通設(shè)施很完善,也存在打車難現(xiàn)象;而吳江區(qū)、張家港、昆山這些地區(qū)的地鐵公交等交通方式比較便利,所以出租車的需求并不旺盛,打車難問題不明顯。
2.1 研究思路
選取南京市這個(gè)二線城市作為研究對(duì)象,利用滴滴快的智能出行平臺(tái)進(jìn)行數(shù)據(jù)抓取[6],根據(jù)導(dǎo)出的9月4—10日7 d內(nèi)每天24時(shí)段及不同經(jīng)緯度地點(diǎn)對(duì)應(yīng)的呼叫回應(yīng)時(shí)長(zhǎng)指標(biāo)來衡量出租車供給數(shù)量是否符合需求量。
2.2 研究方法
根據(jù)導(dǎo)出的數(shù)據(jù),用EXCEL作出4~10號(hào)內(nèi)每日0:00—24:00各時(shí)段的呼叫回應(yīng)時(shí)長(zhǎng)的平滑曲線,如圖1所示。
將南京市按照行政區(qū)域劃分為11個(gè)區(qū),分別為玄武區(qū)、六合區(qū)、秦淮區(qū)、雨花臺(tái)區(qū)、鼓樓區(qū)、浦口區(qū)、江寧區(qū)、建鄴區(qū)、棲霞區(qū)、溧水區(qū)、高淳區(qū)。對(duì)導(dǎo)出的不同經(jīng)緯度對(duì)應(yīng)的地點(diǎn)定位,并歸屬到不同的區(qū),取各區(qū)呼叫回應(yīng)時(shí)長(zhǎng)的平均值,根據(jù)平均值的大小將不同區(qū)域填以深淺不同的顏色,顏色越深,呼叫回應(yīng)時(shí)長(zhǎng)越長(zhǎng),表示“供求匹配”程度越不好,結(jié)果如圖2所示。
圖1 供求匹配程度的時(shí)間分布
圖2 “供求匹配”程度的空間分布
2.3 結(jié)果分析
圖1中,4~10號(hào)的呼叫回應(yīng)時(shí)間的變化趨勢(shì)大致相同。呼叫回應(yīng)時(shí)間在全日時(shí)間分布上呈較為明顯的“雙峰”狀分布,早、晚峰明顯。在上午8:00—9:00時(shí)段內(nèi)達(dá)到第一次高峰,因?yàn)檫@時(shí)段是上班高峰期,交通比較擁擠,打車人數(shù)多,自然而然呼叫回應(yīng)時(shí)間長(zhǎng),出租車供不應(yīng)求,匹配程度較差,第二個(gè)高峰期是下午17:00—18:00。午高峰依然存在,但不是很明顯。從總體來看,一個(gè)星期內(nèi)數(shù)據(jù)變化較明顯,4、5、6號(hào)三天是節(jié)假日,4號(hào)居民外出量很少,相對(duì)而言供求匹配程度較好,5、6兩天數(shù)據(jù)明顯增加,且出行時(shí)間高峰期不明顯,分布不同于工作日。6號(hào)之后,居民正常上班,又呈明顯的“雙峰”狀分布。
圖2中,“供求匹配”程度按優(yōu)到劣的排序?yàn)樾鋮^(qū)、六合區(qū)、秦淮區(qū)、雨花臺(tái)區(qū)、鼓樓區(qū)、浦口區(qū)、江寧區(qū)、建鄴區(qū)、棲霞區(qū)、溧水區(qū)、高淳區(qū)。
3.1 研究思路
分析各個(gè)公司出租車的補(bǔ)貼方案對(duì)“打車難”的緩解程度,首先將拒載率作為指標(biāo)來衡量打車難易度,拒載率越高意味著打車越困難,建立拒載函數(shù),研究補(bǔ)貼與拒載率因素之間的關(guān)系,對(duì)比實(shí)施補(bǔ)貼前和補(bǔ)貼后拒載率的數(shù)值,進(jìn)而評(píng)價(jià)補(bǔ)貼是否對(duì)“打車難”問題的緩解有幫助。
3.2 研究方法
出租車每運(yùn)次總費(fèi)用P的表達(dá)式[7]為:P=pm+ plL+Pttj,其中,pm為起步價(jià),pl為里程費(fèi)率,Pt為候時(shí)費(fèi),L為平均每運(yùn)次距離,tj為車速低于u0的時(shí)長(zhǎng),u0為候時(shí)費(fèi)計(jì)費(fèi)上限時(shí)速,速度低于u0時(shí)開始計(jì)候時(shí)費(fèi)。tj由下式?jīng)Q定其中,σ為擁堵里程比例,uj為車輛在擁堵時(shí)的平均時(shí)速。采用神經(jīng)元特性Sigmoid函數(shù)形式來描述出租車的拒載行為,定義拒載函數(shù):
其中,r(P)是以P為變量的出租車拒載函數(shù)。a (P)為出租車的載客函數(shù),C為平均每小時(shí)運(yùn)行成本,T為平均每運(yùn)次耗時(shí),S為描述出租車司機(jī)平均期望利潤(rùn)的參數(shù),μ為大于0的待定參數(shù)。將補(bǔ)貼分為候時(shí)費(fèi)與出租車司機(jī)期望利潤(rùn)兩部分,分析拒載率與這兩因素的關(guān)系。
令原始利潤(rùn)P-CT等于S,可計(jì)算出拒載率是0.5,此時(shí)出租車司機(jī)的期望收入是大于實(shí)際收入的,出租車司機(jī)仍會(huì)選擇拒載。為研究拒載率r和平均期望利潤(rùn)S的關(guān)系,對(duì)拒載函數(shù)求r關(guān)于S的偏導(dǎo):
為研究拒載率r和候時(shí)費(fèi)Pt的關(guān)系,對(duì)拒載函數(shù)求r關(guān)于候車率Pt的偏導(dǎo):
補(bǔ)貼政策中給予出租車司機(jī)的獎(jiǎng)勵(lì)實(shí)際上降低了出租車司機(jī)的期望利潤(rùn),因?yàn)橐徊糠掷麧?rùn)來源于獎(jiǎng)勵(lì),同時(shí)也增加了候時(shí)費(fèi),上下班高峰期出租車司機(jī)不再寧愿空跑也不愿載客,獎(jiǎng)勵(lì)代替一部分候時(shí)費(fèi)作為對(duì)出租車司機(jī)因?yàn)槎萝嚩鴰淼膿p失的補(bǔ)償。
將補(bǔ)貼按照平均候時(shí)費(fèi)和平均出租車司機(jī)期望利潤(rùn)的比例分配,代入拒載函數(shù)計(jì)算拒載率,對(duì)比補(bǔ)貼前的拒載率和補(bǔ)貼后的拒載率,若拒載率下降,說明補(bǔ)貼政策有利于緩解打車難問題,反之則無幫助。
4.1 研究思路
考慮到現(xiàn)有補(bǔ)貼方案的不合理性,針對(duì)出租車司機(jī)和乘客分別設(shè)定補(bǔ)貼方案,考慮多方面因素,設(shè)計(jì)算法流程圖并遍歷算法計(jì)算出租車司機(jī)和乘客的補(bǔ)貼金額,并對(duì)除基本補(bǔ)貼外的一些特殊情況實(shí)施特定補(bǔ)貼方案。
4.2 研究方法
對(duì)于出租車司機(jī),選取候時(shí)費(fèi)、高溫費(fèi)與行駛距離三個(gè)因素作為設(shè)定補(bǔ)貼方案的依據(jù)。查閱相關(guān)資料可知,一般情況下,候時(shí)費(fèi)在時(shí)速低于12 km/ h且持續(xù)5 min以上時(shí)收取,溫度超過35℃時(shí)算作高溫,距離在3 km以內(nèi)按起步價(jià)計(jì)算,設(shè)計(jì)算法流程如圖3所示。
圖3 出租車司機(jī)補(bǔ)貼政策
圖3中,終端數(shù)據(jù)表示軟件在每一運(yùn)次結(jié)束之后自動(dòng)統(tǒng)計(jì)的數(shù)據(jù),t表示出租車行駛時(shí)間,v表示出租車行駛速度,X1是考慮候時(shí)費(fèi)條件下給予出租車司機(jī)的補(bǔ)貼,T為溫度,X2是由于溫度高開空調(diào)導(dǎo)致發(fā)動(dòng)機(jī)負(fù)擔(dān)過大導(dǎo)致出租車損耗而給予的補(bǔ)貼,D表示行駛距離,X3(或者X4)是由于出租車司機(jī)期望利潤(rùn)過高不愿意跑短途而給予的補(bǔ)貼。遍歷算法,可得到出租車司機(jī)的基本總補(bǔ)貼計(jì)算公式如下:
另外,對(duì)于額外補(bǔ)貼,在中午和傍晚的高峰時(shí)間段,若司機(jī)成功接單,則提供5~15元金額不等的紅包;司機(jī)滿足使用軟件成功接單30次的條件,則可以抽取一個(gè)10~20元金額不等的紅包;若出租車司機(jī)接單不接人的頻數(shù)大于10次,則取消其使用權(quán)利,以免損害乘客的利益。
對(duì)于乘客,選取等車時(shí)間和是否愿意拼車兩個(gè)因素作為設(shè)定補(bǔ)貼方案的依據(jù),設(shè)計(jì)算法流程如圖4所示。
圖4乘客補(bǔ)貼政策
圖4 中,t0是司機(jī)接單之后乘客的等待時(shí)間,其最大值為10,若被接單之后乘客等待時(shí)間超過10 min,軟件自動(dòng)取消訂單,乘客可以得到一個(gè)隨機(jī)金額的紅包補(bǔ)償,而接單的出租車司機(jī)下一次載客不享受補(bǔ)貼政策,t1是乘客下單之后乘客的等待時(shí)間。X5是考慮司機(jī)接單之后乘客的等待時(shí)間及溫度條件給予的補(bǔ)貼,X6是考慮乘客是否愿意拼車條件給予的補(bǔ)貼。同樣遍歷算法,可得到乘客的基本總補(bǔ)貼計(jì)算公式如下:
對(duì)于額外補(bǔ)貼,當(dāng)乘客連續(xù)使用軟件打車20次則可以抽取一個(gè)10~20元金額不等的紅包。若乘客在司機(jī)接單后毀單,則下一次出行不享受政策。若毀單頻數(shù)大于10,則取消其使用權(quán)利,以免損害出租車司機(jī)的利益。
本文在分析不同時(shí)空出租車資源的“供求匹配”程度時(shí),定量分析與描述分析相結(jié)合,從時(shí)間和空間兩個(gè)角度更全面地分析了出租車資源的“供求匹配”程度?!盎ヂ?lián)網(wǎng)+”時(shí)代多家公司推出的出租車補(bǔ)貼方案雖然對(duì)“打車難”問題有一定程度的緩解,但卻不盡如人意,因此公司應(yīng)結(jié)合出租車資源的供求匹配程度針對(duì)不同時(shí)間、不同地點(diǎn)及司機(jī)和乘客分別制定合理的補(bǔ)貼方案,實(shí)現(xiàn)資源的優(yōu)化配置,促進(jìn)城市交通發(fā)展。而文中最后設(shè)計(jì)的補(bǔ)貼方案對(duì)公司打車軟件服務(wù)平臺(tái)的創(chuàng)新具有一定的實(shí)際意義。
[1]2015年全國大學(xué)生數(shù)學(xué)建模競(jìng)賽B題[EB/OL].http://www.shumo.com/2015cumcm.html.
[2]車嵐.城市出租車發(fā)展現(xiàn)狀及需求預(yù)測(cè)[J].山西科技,2006(6):89-91.
[3]蘇州市統(tǒng)計(jì)年鑒[EB/OL].http://www.sztjj.gov.cn.
[4]張衛(wèi)華,趙銘軍.指標(biāo)無量綱化方法對(duì)綜合評(píng)價(jià)結(jié)果可靠性的影響及其實(shí)證分析[J].統(tǒng)計(jì)與信息論壇,2005,20(3):33-36.
[5]侯衛(wèi)星,高建中.基于因子分析法的城市低碳經(jīng)濟(jì)實(shí)證評(píng)價(jià)[J].企業(yè)經(jīng)濟(jì),2012(6).
[6]滴滴快的智能出行平臺(tái)[EB/OL].[2015-09-11].http://v.kuaidadi.com/.
[7]袁長(zhǎng)偉,吳群琪,偉達(dá)利.考慮拒載的出租車市場(chǎng)平衡機(jī)制與優(yōu)化模型[J].中國公路學(xué)報(bào),2014,27(6):91-97.
Research on theAllocation of Taxi Resources in the Internet Era Based on FactorAnalysis
HONG Linga,TENG Leia,PAN Ting-tingb,ZHU Jia-minga
(a.Institute of Statistics and Applied Mathematics,b.School of Finance,AnHui University of Financt and Econornics Bengbu,AnHui 233031,China)
In this article,we used methods of factor analysis,description analysis,algorithm traverses and built model of factor analysis,algorithms flowcharts.We discussed and studied a mumber of issues,such as the main factors affecting taxi supply-demand match,spatio-temporal distribution regularities for taxi matching degree of supply and demand,the subsidized programmes can ease the difficulty of taking a taxi or not.We used SPSS,EXCEL software and a combination of qualitative and quantitative method to analyze the problems.
taxi resources configuration;factor analysis;algorithm traverse;SPSS.
F570.7;F224
A
1673-1891(2016)01-0008-05
10.16104/j.issn.1673-1891.2016.01.003
2015-11-15
國家自然科學(xué)基金項(xiàng)目“隨機(jī)動(dòng)力系統(tǒng)的非一致指數(shù)二分法及其數(shù)值模擬”(11301001);安徽財(cái)經(jīng)大學(xué)教研項(xiàng)目“數(shù)學(xué)建模競(jìng)賽引領(lǐng)大學(xué)生科研創(chuàng)新的研究”(acjyzd201429);安徽省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目“BTS商業(yè)信息集成與推廣”(AH201410378555)。
洪鈴(1996—),女,安徽安慶人,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)。*為通信作者。
西昌學(xué)院學(xué)報(bào)(自然科學(xué)版)2016年1期