• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于網(wǎng)約車(chē)GPS數(shù)據(jù)的用戶(hù)出行挖掘與推薦研究

      2018-12-24 08:02:54賈步忠
      微型電腦應(yīng)用 2018年12期
      關(guān)鍵詞:網(wǎng)約車(chē)網(wǎng)約路段

      賈步忠

      (陜西財(cái)經(jīng)職業(yè)技術(shù)學(xué)院 會(huì)計(jì)二系, 咸陽(yáng) 712000)

      0 引言

      在智能化和信息化背景下,智能交通城市當(dāng)前我國(guó)城市發(fā)展的一個(gè)亮點(diǎn),也是未來(lái)城市發(fā)展的趨勢(shì)。作為智能交通發(fā)展代表的滴滴、神州等網(wǎng)約車(chē)軟件,在運(yùn)行的過(guò)程中積累了大量的車(chē)輛運(yùn)行軌跡數(shù)據(jù)[1]。在這些軌跡數(shù)據(jù)中,記錄了大量的城市交通和人群移動(dòng)的信息,為我國(guó)城市交通的進(jìn)一步優(yōu)化提供了大量的信息。由此,如何加強(qiáng)對(duì)這些數(shù)據(jù)對(duì)挖掘應(yīng)用,特別是結(jié)合部分專(zhuān)職滴滴、神州司機(jī)的GPS數(shù)據(jù),對(duì)居民出行特征進(jìn)行挖掘,對(duì)政府和部分網(wǎng)約車(chē)企業(yè)進(jìn)一步投放網(wǎng)約車(chē)廣告,提升網(wǎng)約車(chē)服務(wù)等,具有非常重要的作用和價(jià)值。同時(shí)在利用GPS數(shù)據(jù)對(duì)用戶(hù)出行進(jìn)行分析的研究中,很多學(xué)者都進(jìn)行了研究,并取得豐碩的成果。如景維鵬(2016)則結(jié)合出租車(chē)的GPS運(yùn)行軌跡,提出一種基于地圖匹配算法模型,以GPS采集的坐標(biāo)作為基礎(chǔ),在一定區(qū)域內(nèi)采用空載概率推薦的方法完成對(duì)居民用戶(hù)出行的出租車(chē)推薦[2];王瑤(2018)為進(jìn)一步挖掘居民出行的軌跡,提出一種基于高斯定律的出行軌跡挖掘方法,該研究的最大特點(diǎn)在于對(duì)GPS數(shù)據(jù)區(qū)域進(jìn)行劃分,然后以每個(gè)單元作為統(tǒng)計(jì)點(diǎn),對(duì)載客的終點(diǎn)和起點(diǎn)進(jìn)行統(tǒng)計(jì),最后根據(jù)公式計(jì)算在一定時(shí)間內(nèi)的乘客凈流入量。但是這種方法通常計(jì)算量大;林基艷則提出將聚類(lèi)分析算法引入到對(duì)用戶(hù)出行特征軌跡分析中,從而提取市民出行的時(shí)空特征[3,4]; Jing Yuan(2013)、Yu Zheng(2011)等則利用GPS軌跡對(duì)用戶(hù)的出行進(jìn)行挖掘,從而得到出租車(chē)主要運(yùn)行特征。本文則在以往研究的基礎(chǔ)上,結(jié)合居民出行具有典型的時(shí)空特性的特點(diǎn),以陜西某城市的網(wǎng)約車(chē)GPS數(shù)據(jù)作為基礎(chǔ)來(lái)源,提出一種基于密度聚類(lèi)的城市用戶(hù)出行分析方法,并在該基礎(chǔ)上,提出一種基于BP網(wǎng)絡(luò)的乘客推薦模型[5]。

      1 數(shù)據(jù)來(lái)源

      本文使用的網(wǎng)約車(chē)數(shù)據(jù),主要以西安市某網(wǎng)約車(chē)公司平臺(tái)下注冊(cè)的1.1萬(wàn)輛車(chē)輛在1個(gè)月內(nèi)的運(yùn)營(yíng)數(shù)據(jù)作為基礎(chǔ),在對(duì)以上的GPS數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,保留車(chē)牌號(hào)、當(dāng)前位置、營(yíng)運(yùn)狀態(tài)、行駛速度、行駛方向和運(yùn)營(yíng)時(shí)刻等基本屬性[6]。部分網(wǎng)約車(chē)屬性如表1所示。

      表1 部分網(wǎng)約車(chē)基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)表

      在上述的數(shù)據(jù)中,網(wǎng)約車(chē)的營(yíng)運(yùn)狀態(tài)用0~3來(lái)表示,其中1表示車(chē)輛為空載狀態(tài)、1表示車(chē)輛為載客狀態(tài)、2表示車(chē)輛為駐車(chē)狀態(tài),3表示網(wǎng)約車(chē)司機(jī)下線(xiàn)停運(yùn)。GPS方向取值為0~360°。

      2 數(shù)據(jù)處理

      2.1 數(shù)據(jù)預(yù)處理

      在對(duì)網(wǎng)約車(chē)的GPS數(shù)據(jù)挖掘中,可能存在兩個(gè)比較突出的問(wèn)題,一是軌跡點(diǎn)存在異常;二是軌跡點(diǎn)的經(jīng)緯度越界[7]。為解決以上的問(wèn)題,在對(duì)經(jīng)緯度越界問(wèn)題的處理中,首先劃分重點(diǎn)研究區(qū)域,清楚研究范圍以外的區(qū)域,以減少可能出現(xiàn)的越界問(wèn)題。在本研究中,則以西安市三環(huán)以?xún)?nèi)作為研究區(qū)域,清除掉三環(huán)以外的所有坐標(biāo)。其次,針對(duì)軌跡點(diǎn)可能出現(xiàn)的異常,如某網(wǎng)約車(chē)原本在西安的A處,5分鐘出現(xiàn)在西安B處,且距離相差10 km,這對(duì)于城市交通來(lái)講,這種數(shù)據(jù)明顯存在異常的問(wèn)題[8-9]。因此,在對(duì)數(shù)據(jù)的篩選中,剔除這類(lèi)GPS坐標(biāo)異常的數(shù)據(jù)。在具體的執(zhí)行過(guò)程中,則采用Douglas - Peucker算法對(duì)曲線(xiàn)中密度節(jié)點(diǎn)較高的進(jìn)行剔除。

      3 基于時(shí)間序列的居民出行時(shí)空特征挖掘模型構(gòu)建

      3.1 相似度衡量方法

      在對(duì)數(shù)據(jù)進(jìn)行挖掘之前,必須要對(duì)選擇的路段進(jìn)行區(qū)域劃分,以提高聚類(lèi)挖掘的準(zhǔn)確率。但是,在實(shí)際的聚類(lèi)挖掘中,大部分的GPS數(shù)據(jù)為靜態(tài)數(shù)據(jù),而就業(yè)時(shí)間序列的數(shù)據(jù)為動(dòng)態(tài)數(shù)據(jù)。對(duì)此,本文首先結(jié)合程靜的研究成果,采用時(shí)間序列距離度量和相關(guān)性結(jié)合的方式將數(shù)據(jù)進(jìn)行轉(zhuǎn)換[10]。由此,分別定義相關(guān)性函數(shù)和距離度量計(jì)算式(1),(2)。

      (1)

      (2)

      由此通過(guò)以上的分類(lèi),我們可以把西安的某區(qū)域劃分的區(qū)域,如圖1所示。

      圖1 區(qū)域劃分

      3.2 K均值聚類(lèi)算法

      為進(jìn)一步挖掘陜西西安居民在不同時(shí)間段、不同地點(diǎn)等方面的上車(chē)信息,從而更好的為網(wǎng)約車(chē)的分配等提供借鑒,在本文中,則采用K均值聚類(lèi)的方法對(duì)居民出行進(jìn)行挖掘[11]。K均值聚類(lèi)的原理是隨機(jī)一個(gè)簇作為中心,然后通過(guò)距離公式公式對(duì)類(lèi)進(jìn)行劃分,如圖2所示。

      圖2 K均值聚類(lèi)

      在圖2中可以看出,K均值聚類(lèi)最為關(guān)鍵的是兩個(gè)部分:一是對(duì)K值的確定,即對(duì)初始聚類(lèi)的劃分;二是對(duì)距離的計(jì)算[12]。在本文的研究中,則以周末周日和上車(chē)量、下車(chē)量作為基本的分類(lèi),設(shè)定K=4。

      4 乘客模型構(gòu)建

      結(jié)合上述的居民出行時(shí)空特征,為更好的為市民提供網(wǎng)約車(chē)服務(wù),在本文中,則提出一種基于空車(chē)概率推薦算法,以滿(mǎn)足在早高峰或者是晚高峰用戶(hù)出行的需求。而在進(jìn)行推薦前,引入地圖匹配算法完成對(duì)推薦的基礎(chǔ)構(gòu)建。

      4.1 地圖匹配模型

      結(jié)合網(wǎng)約車(chē)實(shí)際的GPS位置來(lái)講,其定位的精度往往會(huì)受到手機(jī)GPS信號(hào)的影響,導(dǎo)致部分西安網(wǎng)約車(chē)主的GPS數(shù)據(jù)存在誤差[13]。由此,我們就需要對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行進(jìn)一步的處理,以減少誤差帶來(lái)的干擾。而在實(shí)際的對(duì)這部分?jǐn)?shù)據(jù)的處理中,通常采用地圖匹配的方法進(jìn)行。但是在傳統(tǒng)的地圖匹配算法中,通常會(huì)在預(yù)約數(shù)量較多的地方為用戶(hù)增加候選路段,目的是讓出行的用戶(hù)能在目標(biāo)路段選擇網(wǎng)約車(chē),如圖3所示。

      圖3 地圖匹配示意圖

      假設(shè)用戶(hù)的目標(biāo)路段為GJ,可通過(guò)候選域PQRS中的候選路段對(duì)其進(jìn)行定義。若是采用固定候選域ABCD對(duì)目標(biāo)路段GJ進(jìn)行定義,則還需對(duì)其他候選路段進(jìn)行驗(yàn)證,比如EN路段、IK路段等,如此一來(lái),將會(huì)花費(fèi)大量的時(shí)間在驗(yàn)證工作中,造成一種不必要的資源浪費(fèi)。如果在數(shù)據(jù)稀疏區(qū)中,固定候選域內(nèi)并不存在路段,那么該算法匹配不成功。

      基于上述的問(wèn)題,為了提高該算法的匹配成功率,對(duì)以上匹配方法進(jìn)行改進(jìn)[14]。利用用車(chē)輛運(yùn)行速度方向以及候選路段的夾角對(duì)該結(jié)果進(jìn)行重新驗(yàn)證,也就是說(shuō),當(dāng)車(chē)與候選路段的夾角a>ω時(shí),則說(shuō)明當(dāng)前候選路段失去利用價(jià)值。

      在匹配過(guò)程中,將人在地圖上的位置看作一個(gè)靜態(tài)點(diǎn);將車(chē)的位置看作動(dòng)態(tài)點(diǎn)。其中,靜態(tài)點(diǎn)可存在于地圖中的任何位置,包括地圖路段之外;動(dòng)態(tài)點(diǎn)智能出現(xiàn)于地圖中的路段之上。因此,若是出現(xiàn)人與預(yù)選路段的夾角為鈍角時(shí),此時(shí),可將人與該路段之間的直線(xiàn)距離當(dāng)作判斷依據(jù);若是出現(xiàn)車(chē)與預(yù)選路段夾角為鈍角的情況時(shí),則放棄該預(yù)選路段[15]。具體匹配過(guò)程,如圖4所示。

      在圖4中,AB代表預(yù)選路段;M代表目標(biāo)點(diǎn);a代表待匹配點(diǎn);β代表預(yù)選路段夾角;d代表a至AB的最短直線(xiàn)距離;b代表M至AB的歐式距離。

      4.2 乘客推薦模型構(gòu)建

      在乘客的推薦中,乘客等待主要根據(jù)等待的時(shí)間,或者是網(wǎng)約車(chē)的距離。在本文中,當(dāng)前網(wǎng)約車(chē)車(chē)主在開(kāi)啟網(wǎng)約車(chē)APP后,在空載的情況下,以乘客等待的時(shí)間作為推薦的根本依據(jù)。具體則是每3分鐘統(tǒng)計(jì)一次在某個(gè)區(qū)域內(nèi)的空車(chē)數(shù)量,然后采用最小二乘法對(duì)時(shí)間和在該區(qū)域內(nèi)的空車(chē)數(shù)進(jìn)行擬合,進(jìn)而得到關(guān)系曲線(xiàn)f(t),最后計(jì)算乘客到達(dá)目標(biāo)路段的時(shí)刻開(kāi)始,至到達(dá)率函數(shù)的積分大于等于 1 的時(shí)間差即為預(yù)測(cè)到達(dá)第一輛空車(chē)的時(shí)間[16]。而預(yù)測(cè)的到達(dá)的時(shí)間一般是小于等于5min,可以為網(wǎng)約車(chē)的用戶(hù)所接受,為式(3)。

      f(t)=a0+a1t+a2t2+a3t3+a4t4,0

      (3)

      5 試驗(yàn)驗(yàn)證

      為驗(yàn)證上述方案的可行性,以西安市的路網(wǎng)數(shù)據(jù)作為基礎(chǔ),整個(gè)路段超過(guò)10萬(wàn)條,路網(wǎng)節(jié)點(diǎn)有100多萬(wàn)。軌跡數(shù)據(jù)由某網(wǎng)約車(chē)下注冊(cè)的網(wǎng)約車(chē)司機(jī)在180天內(nèi),由1.1萬(wàn)輛網(wǎng)約車(chē)產(chǎn)生的2億條信息記錄,轉(zhuǎn)換為數(shù)據(jù)的話(huà),大概在30G左右。同時(shí)本文輸入挖掘的歷史GPS軌跡參數(shù),輸入聚類(lèi)分析的K值,以及區(qū)域分析的半徑,從而可以得到的聚類(lèi)分析結(jié)果,如圖4、圖5所示。

      圖5 工作日聚類(lèi)結(jié)果

      通過(guò)上述的結(jié)果可得到一個(gè)非常明顯的特征,那就是在工作日和非工作日中,陜西西安部分居民的出行特點(diǎn):在工作日下,熱點(diǎn)區(qū)域出行預(yù)約網(wǎng)約車(chē)的用戶(hù)較多,并且出行密度高[17];而非工作日出行用戶(hù)少,且相對(duì)分散。

      同時(shí)選擇西安某地的GPS坐標(biāo),運(yùn)用上述的模型呼叫網(wǎng)約車(chē),在經(jīng)過(guò)多次和多時(shí)刻抽樣測(cè)試后,可得到的用戶(hù)等待結(jié)果,如圖6所示。

      圖7 用戶(hù)等待時(shí)間

      通過(guò)圖6的結(jié)果對(duì)比看出,預(yù)測(cè)時(shí)間和用戶(hù)實(shí)際的等待時(shí)間相差不大,說(shuō)明本文構(gòu)建的網(wǎng)約車(chē)乘客推薦模型預(yù)測(cè)的推薦時(shí)間與實(shí)際的時(shí)間比較接近,在乘客推薦方面具有很大的可行性。

      6 總結(jié)

      通過(guò)以上的分析可以看出,本文通過(guò)分析,挖掘出居民在不同時(shí)刻的出行特征,在工作日的網(wǎng)約車(chē)出行要求明顯高于非工作日,同時(shí)通過(guò)本文構(gòu)建的用戶(hù)推薦模型,客戶(hù)等待的時(shí)間與預(yù)測(cè)的時(shí)間非常接近。進(jìn)而驗(yàn)證了本模型構(gòu)建的可行性。

      猜你喜歡
      網(wǎng)約車(chē)網(wǎng)約路段
      基于多模深度森林和迭代Kuhn-Munkres的動(dòng)態(tài)上車(chē)點(diǎn)推薦算法
      網(wǎng)約車(chē)平臺(tái)責(zé)任條款的識(shí)別方法——基于解釋進(jìn)路的正當(dāng)規(guī)制
      法律方法(2022年2期)2022-10-20 06:45:02
      冬奧車(chē)道都有哪些相關(guān)路段如何正確通行
      部、省、路段監(jiān)測(cè)運(yùn)維聯(lián)動(dòng)協(xié)同探討
      共享經(jīng)濟(jì)稅收征管挑戰(zhàn)及對(duì)策——以網(wǎng)約車(chē)為例
      A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
      網(wǎng)約車(chē)侵權(quán)責(zé)任在司法實(shí)踐中的認(rèn)定
      山西青年(2020年3期)2020-12-08 04:58:57
      對(duì)網(wǎng)約車(chē)地方立法若干法律問(wèn)題的幾點(diǎn)探討
      網(wǎng)約車(chē)問(wèn)題研究及對(duì)策
      活力(2019年19期)2020-01-06 07:36:02
      網(wǎng)約車(chē)安全性提高研究
      活力(2019年17期)2019-11-26 00:42:18
      黄陵县| 太保市| 榆树市| 高阳县| 博湖县| 毕节市| 博野县| 德化县| 奈曼旗| 商丘市| 区。| 西吉县| 宽城| 牡丹江市| 海淀区| 巨鹿县| 凌源市| 集贤县| 肇州县| 南通市| 西盟| 广安市| 清远市| 大田县| 榆树市| 桑植县| 梁山县| 宁国市| 沙田区| 云安县| 丰镇市| 阿瓦提县| 长海县| 合作市| 章丘市| 奎屯市| 开封市| 永清县| 宜宾市| 平乡县| 甘德县|