摘要 為應(yīng)對(duì)ETC行業(yè)從發(fā)展階段向運(yùn)營階段轉(zhuǎn)變的需求,精準(zhǔn)挖掘潛在客戶的價(jià)值,文章采用關(guān)聯(lián)分析和聚類分析等數(shù)據(jù)分析方法,基于ETC用戶基礎(chǔ)數(shù)據(jù),對(duì)用戶群體進(jìn)行了多方面的特征及閾值分析,并構(gòu)建了轎車通勤群體和轎車旅游群體的劃分方法流程體系。研究結(jié)果表明,所采用的分析方法能夠準(zhǔn)確挖掘轎車通勤和旅游群體的潛力和價(jià)值,為ETC企業(yè)的業(yè)務(wù)拓展提供理論支持,同時(shí)也為其他行業(yè)的精細(xì)化運(yùn)營提供了參考。文章對(duì)轎車通勤群體和轎車旅游群體進(jìn)行了詳細(xì)分析,驗(yàn)證了劃分方法的有效性,為提高ETC企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力和客戶滿意度提供了理論依據(jù),有助于該行業(yè)的可持續(xù)發(fā)展。
關(guān)鍵詞 ETC數(shù)據(jù);轎車通勤群體;轎車旅游群體;群體劃分方法
中圖分類號(hào) U293 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-8949(2024)17-0028-05
0 引言
隨著數(shù)字和信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)技術(shù)在眾多領(lǐng)域中成為研究熱點(diǎn),其中包括智慧交通[1]。ETC是全球最大的電子收費(fèi)系統(tǒng)之一,擁有豐富的車輛行駛信息。在國外,ETC技術(shù)已非常成熟,如美國的E-Zpass、葡萄牙的ViaVarde和意大利的Telepass等。在亞洲,日本政府從2000年開始推廣ETC系統(tǒng),在名古屋和大阪等地建立了首批收費(fèi)站[2]。自二十世紀(jì)進(jìn)入我國以來,ETC系統(tǒng)逐步融入我國高速交通系統(tǒng),近年來得到了廣泛應(yīng)用,提高了高速公路收費(fèi)效率,降低了收費(fèi)難度。我國ETC聯(lián)網(wǎng)系統(tǒng)已成為全球里程最長(zhǎng)、站點(diǎn)最多、客戶規(guī)模和交易增長(zhǎng)最快的高速公路智能化收費(fèi)系統(tǒng)。目前,ETC已進(jìn)入后期階段,全國各地均在積極推廣應(yīng)用。截至2018年年底,全國聯(lián)網(wǎng)收費(fèi)站達(dá)9 322個(gè),覆蓋率達(dá)98.9%等[3]。截至2021年,ETC已發(fā)行用戶1.23億,總數(shù)達(dá)2.04億。交通運(yùn)輸部也在2021年2月發(fā)布通知,重慶等27個(gè)城市將作為ETC智慧停車城市建設(shè)試點(diǎn)城市。重慶將率先進(jìn)行“ETC+車生活服務(wù)”主題試點(diǎn)。截至2022年年底,全市民用車輛擁有量890.52萬輛,民用轎車擁有量289.70萬輛,民用轎車占民用車輛的32.53%,由此可見轎車出行在人們出行方式中的占比非常高。而轎車通勤和旅游群體是現(xiàn)代社會(huì)兩個(gè)重要的交通出行類別,它們的行駛特征和消費(fèi)行為不同,對(duì)出行方式的依賴程度也有所差異。而隨著ETC系統(tǒng)的不斷發(fā)展和普及,更多的ETC用戶信息被積累并儲(chǔ)存,為轎車通勤和旅游群體的劃分提供了新的研究途徑和空間。制定合理、準(zhǔn)確的劃分方法,對(duì)ETC業(yè)務(wù)的拓展和市場(chǎng)份額的提升具有重要意義。
國內(nèi)外許多學(xué)者基于大量的ETC數(shù)據(jù)開展了一系列的研究。Klodzinski J等[4]通過建立模型對(duì)高速公路的通行效率進(jìn)行了評(píng)價(jià);王旭[5]用模糊綜合評(píng)價(jià)分析ETC全國聯(lián)網(wǎng)數(shù)據(jù)對(duì)高速公路運(yùn)營產(chǎn)生的影響;馬春平[6]針對(duì)ETC運(yùn)營數(shù)據(jù)與大數(shù)據(jù)相結(jié)合的商業(yè)模式進(jìn)行了調(diào)研與分析,通過大量研究表明了基于ETC數(shù)據(jù)開展高速公路ETC業(yè)務(wù)的可行性,同時(shí)對(duì)比于其他數(shù)據(jù),ETC的數(shù)據(jù)覆蓋面更加廣泛,能夠全面地反映全國高速轎車的運(yùn)營水平。在用戶出行特征方面,針對(duì)軌跡數(shù)據(jù)的分割技術(shù)和車輛行為分析,Sini Guo等[7]提出了一種高效的數(shù)據(jù)值算法;Zun Wang等[8]使用GPS數(shù)據(jù)中瞬時(shí)速度分布的變化系數(shù)衡量行程時(shí)間的可靠性,并提出了旅行時(shí)間可靠性與道路密度的模型;國內(nèi)學(xué)者董宏輝等[9]則利用GPS數(shù)據(jù)開發(fā)了兩種轉(zhuǎn)換點(diǎn)的識(shí)別方法,并將其應(yīng)用于四種識(shí)別算法中,結(jié)果表明采用SVM能夠取得最好的結(jié)果;徐海玲等[10]提出了用戶自然屬性、用戶行為特征和用戶需求偏好的用戶標(biāo)簽體系;楊雙亮[11]提出了原始數(shù)據(jù)層、事實(shí)數(shù)據(jù)層、特征偏好層以及模型預(yù)測(cè)層的用戶畫像模型。
該文旨在基于ETC用戶基礎(chǔ)數(shù)據(jù),通過大數(shù)據(jù)技術(shù)和數(shù)據(jù)分析方法,探究轎車通勤和旅游群體的劃分方法,并深入揭示不同群體的特征和需求,為ETC業(yè)務(wù)拓展和智慧出行建設(shè)提供理論支持。通過關(guān)聯(lián)分析和聚類分析等數(shù)據(jù)分析方法,該文將精確地揭示ETC潛在客戶的市場(chǎng)空間,為推進(jìn)ETC業(yè)務(wù)的管理和實(shí)踐提供重要的實(shí)用價(jià)值。
1 轎車群體劃分方法
通過對(duì)重慶高速ETC系統(tǒng)數(shù)據(jù)庫中多源異構(gòu)的數(shù)據(jù)類型、格式和質(zhì)量的梳理,包括對(duì)收費(fèi)站過車數(shù)據(jù)、用戶數(shù)據(jù)、車輛信息、交易數(shù)據(jù)、門架數(shù)據(jù)、用戶操作日志、會(huì)員數(shù)據(jù)等進(jìn)行了詳細(xì)說明。接著進(jìn)行數(shù)據(jù)清洗處理,主要用于檢查數(shù)據(jù)的一致性,處理無效值和缺失值,替換、修改或刪除不合格數(shù)據(jù),方便后續(xù)數(shù)據(jù)關(guān)聯(lián)和整個(gè)數(shù)據(jù)的挖掘過程,將對(duì)后續(xù)關(guān)鍵特征分析產(chǎn)生重要影響。該文采用關(guān)聯(lián)規(guī)則,結(jié)合業(yè)務(wù)實(shí)戰(zhàn)需要對(duì)現(xiàn)階段接入的多源異構(gòu)數(shù)據(jù)表進(jìn)行定制化數(shù)據(jù)的關(guān)聯(lián)融合處理,構(gòu)建轎車通勤群體的數(shù)據(jù)關(guān)聯(lián)表。
ETC數(shù)據(jù)關(guān)聯(lián)處理是決定ETC企業(yè)是否成功的重要因素之一。通過關(guān)聯(lián)規(guī)則對(duì)不同信息的數(shù)據(jù)表進(jìn)行關(guān)聯(lián),可以發(fā)現(xiàn)不同數(shù)據(jù)表之間的關(guān)系。數(shù)據(jù)關(guān)聯(lián)主要是通過這種方法實(shí)現(xiàn)。ETC企業(yè)所接入的各種數(shù)據(jù),包括ETC通行數(shù)據(jù)、結(jié)算中心數(shù)據(jù)、移動(dòng)支付數(shù)據(jù)、用戶信息和車架數(shù)據(jù)、站名編碼映射表等多源異構(gòu)數(shù)據(jù)表,需要通過定制化數(shù)據(jù)的關(guān)聯(lián)融合處理進(jìn)行數(shù)據(jù)關(guān)聯(lián)。這些數(shù)據(jù)不僅可以幫助企業(yè)挖掘出不同用戶群體的特征和需求,還為ETC企業(yè)推送定制化服務(wù)信息,以提升用戶服務(wù)水平,為提高市場(chǎng)競(jìng)爭(zhēng)力和客戶滿意度打好基礎(chǔ)。
定制化數(shù)據(jù)關(guān)聯(lián)表主要包括轎車群體數(shù)據(jù)關(guān)聯(lián)表、客車群體數(shù)據(jù)關(guān)聯(lián)表、貨車群體數(shù)據(jù)關(guān)聯(lián)表和消費(fèi)數(shù)據(jù)關(guān)聯(lián)表。這些數(shù)據(jù)關(guān)聯(lián)表包含了ETC企業(yè)業(yè)務(wù)所需的關(guān)鍵特征,可以幫助企業(yè)深入了解用戶的需求和偏好。ETC企業(yè)可以利用這些數(shù)據(jù)關(guān)聯(lián)表將ETC用戶與其對(duì)應(yīng)的車輛關(guān)聯(lián)在一起,為每個(gè)用戶提供有針對(duì)性的產(chǎn)品和服務(wù)。
1.1 轎車通勤群體劃分方法
1.1.1 群體刻畫指標(biāo)
經(jīng)過數(shù)據(jù)清洗、關(guān)聯(lián),在數(shù)據(jù)關(guān)聯(lián)匯總表的基礎(chǔ)上,提取轎車通勤群體識(shí)別指標(biāo),針對(duì)各指標(biāo)制定分類標(biāo)準(zhǔn),并以3個(gè)月的數(shù)據(jù)作為識(shí)別模型樣本容量開展群體的識(shí)別與分類工作。
考慮通勤行為的特點(diǎn),梳理出轎車通勤群體的刻畫指標(biāo),主要包括:車輛類型識(shí)別號(hào)、用戶類型識(shí)別號(hào)、月出行頻次、通行時(shí)間、入口/出口站名(OD分布)。
(1)車輛類型識(shí)別號(hào)
車輛類型識(shí)別號(hào)對(duì)應(yīng)關(guān)聯(lián)匯總表中的“veh_cust_class”字段,該字段僅包含數(shù)字1與數(shù)字2。數(shù)字1表示該車為客車,而數(shù)字2表示該車為非客車。
(2)用戶類型識(shí)別號(hào)
用戶類型識(shí)別號(hào)對(duì)應(yīng)關(guān)聯(lián)匯總表中的“usertype”字段,該字段僅包含數(shù)字1與數(shù)字2。數(shù)字1表示為個(gè)人用戶,而數(shù)字2表示為單位用戶。
(3)月出行頻次
月出行頻次是指車輛單月內(nèi)在高速路網(wǎng)上的通行天數(shù)。該次研究統(tǒng)計(jì)所有車輛的月出行頻次,即先利用“platenum”和“entime”獲取車輛每天出現(xiàn)的次數(shù),然后通過“entime”對(duì)“platenum”計(jì)次,最終得到車輛的月出現(xiàn)頻次。其中“platenum”表示車輛車牌,“entime”表示車輛進(jìn)入高速路網(wǎng)的時(shí)刻,并基于車輛的月出行頻次對(duì)通勤群體進(jìn)行初步篩選。
(4)通行時(shí)間
該次研究將篩選通行時(shí)間在工作日的早晚高峰(早上6:30~9:00,晚上17:00~19:30)時(shí)段的車輛,且車輛在非工作日無此規(guī)律。
(5)入口/出口站名(OD分布)
通勤群體在工作日車輛入口/出口站名相對(duì)固定。該次研究將對(duì)車輛入口/出口站名進(jìn)行重復(fù)性統(tǒng)計(jì)。
統(tǒng)計(jì)結(jié)果顯示,符合條件的車輛月出行天數(shù)主要集中在12~25次之間,轎車在通勤日的出行頻次占比如圖1所示:
通常情況下,一個(gè)月有30 d,其中工作日約為22 d,因此通勤者一個(gè)月內(nèi)至少會(huì)出行22 d。但不能排除一些特殊情況的存在,因此需要確定通勤行為中出行天數(shù)的閾值,并通過樣本驗(yàn)證和檢測(cè)進(jìn)行確定。
從1個(gè)月的早晚高峰均出現(xiàn)車輛月出行次數(shù)統(tǒng)計(jì)圖中可以發(fā)現(xiàn),出行天數(shù)大多集中在12~25次之間,對(duì)每一天數(shù)選取20輛車作為實(shí)驗(yàn)樣本,通過對(duì)比起點(diǎn)、終點(diǎn)的重復(fù)情況,判斷其中具體通勤行為車輛的占比,最后得到如圖2所示的車輛出行占比統(tǒng)計(jì)圖,圖中天數(shù)為16 d時(shí)有一個(gè)顯著的斷層現(xiàn)象(分界點(diǎn)),從而可以以此作為判斷通勤車輛出行的特征條件之一,即月早晚高峰均出現(xiàn)天數(shù)應(yīng)大于等于16 d。
1.1.2 群體指標(biāo)標(biāo)準(zhǔn)構(gòu)建
經(jīng)過數(shù)據(jù)清洗和關(guān)聯(lián),并結(jié)合前期基礎(chǔ)信息采集得到的通勤標(biāo)簽性質(zhì)的收費(fèi)站點(diǎn),在數(shù)據(jù)關(guān)聯(lián)匯總表的基礎(chǔ)上,依據(jù)轎車通勤群體分類指標(biāo),對(duì)大量ETC過車數(shù)據(jù)進(jìn)行了分類篩選,并為所需指標(biāo)制定了分類標(biāo)準(zhǔn),具體內(nèi)容見表1所示。
基于前面梳理的轎車通勤群體分類指標(biāo),分別對(duì)車輛類型識(shí)別號(hào)、用戶類型識(shí)別號(hào)、月出行頻次、通行時(shí)間、OD分布等5個(gè)指標(biāo)制定標(biāo)準(zhǔn),轎車通勤群體分類標(biāo)準(zhǔn)如表1所示:
1.1.3 群體辨識(shí)結(jié)果
根據(jù)重慶市9月份的數(shù)據(jù),依照轎車通勤群體用戶的分類指標(biāo)及劃分方法,共識(shí)別出9月份高速ETC轎車通勤車輛的個(gè)體數(shù)為2 020輛,通行數(shù)據(jù)共計(jì)70 455條。
1.2 轎車旅游群體劃分方法
1.2.1 群體刻畫指標(biāo)
基于轎車車輛的特征(刻畫指標(biāo))對(duì)轎車群體進(jìn)一步細(xì)化,同時(shí)考慮旅游行為的特點(diǎn),梳理出轎車旅游群體刻畫指標(biāo),主要包括以下內(nèi)容:(1)車輛品牌:非客車品牌、非貨運(yùn)品牌;(2)用戶類型:個(gè)人;(3)車輛類型:客車;(4)通行時(shí)間:主要在周末或節(jié)假日時(shí)段;(5)入口/出口站名(OD分布):主要為帶有旅游景點(diǎn)標(biāo)簽的站名;(6)通行頻次:歷史上通過單個(gè)旅游標(biāo)簽站點(diǎn)的頻次低;(7)歷史上在周末、節(jié)假日期間通過多個(gè)旅游標(biāo)簽站點(diǎn)、帶有旅游標(biāo)簽的收費(fèi)站。劃分流程如圖3所示,統(tǒng)計(jì)到重慶市內(nèi)收費(fèi)站共331個(gè),其中劃分為帶有旅游標(biāo)簽的收費(fèi)站共計(jì)63個(gè)。
1.2.2 群體指標(biāo)標(biāo)準(zhǔn)構(gòu)建
對(duì)經(jīng)過數(shù)據(jù)清洗和關(guān)聯(lián)的收費(fèi)站點(diǎn)進(jìn)行了進(jìn)一步分析,結(jié)合前期基礎(chǔ)信息采集得出了旅游標(biāo)簽性質(zhì)。在此基礎(chǔ)上,提取了轎車旅游群體的識(shí)別指標(biāo),并為每個(gè)指標(biāo)制定了分類標(biāo)準(zhǔn)。最終,運(yùn)用這些指標(biāo)對(duì)大量ETC過車數(shù)據(jù)進(jìn)行分類篩選,具體分類標(biāo)準(zhǔn)如表2所示:
(1)群體分類標(biāo)準(zhǔn)
面對(duì)梳理的轎車旅游群體分類指標(biāo),分別對(duì)車輛類型識(shí)別號(hào)、用戶類型識(shí)別號(hào)、是否通過旅游標(biāo)簽站點(diǎn)、通行時(shí)間、通行頻次等5個(gè)指標(biāo)制定標(biāo)準(zhǔn),通過對(duì)以上5個(gè)指標(biāo)進(jìn)行轎車旅游群體識(shí)別,得出旅游群體,具體識(shí)別步驟如圖4所示:
1.2.3 群體劃分結(jié)果
以重慶市10月份的數(shù)據(jù)作為識(shí)別模型的樣本容量,開展群體識(shí)別與分類工作,按照轎車旅游群體劃分指標(biāo)及標(biāo)準(zhǔn)進(jìn)行篩選,依照分類指標(biāo)及其對(duì)應(yīng)標(biāo)準(zhǔn),識(shí)別出10月份高速ETC轎車旅游車輛的個(gè)體數(shù)為224 833輛。
2 轎車群體驗(yàn)證
2.1 轎車通勤群體驗(yàn)證
基于前期所做的大量數(shù)據(jù)分析處理工作,對(duì)轎車ETC用戶進(jìn)行了群體劃分,并對(duì)群體相應(yīng)特征進(jìn)行了分析。為保障群體劃分的準(zhǔn)確性以及特征分析的有效性,需對(duì)劃分的用戶群體進(jìn)行驗(yàn)證。
隨機(jī)挑選該群體車輛,分析其通行規(guī)律,判斷是否屬于轎車通勤群體。以渝C7E**2為例,對(duì)其通行頻次以及OD分布進(jìn)行統(tǒng)計(jì),如表3所示:
通過對(duì)其通行特征規(guī)律的觀察分析以及對(duì)其OD分布的探究,所選車輛符合轎車通勤群體分類依據(jù),其通行特征充分體現(xiàn)了轎車通勤群體的運(yùn)行規(guī)律?;诖?,斷定所選車輛歸屬轎車通勤群體,渝C7E**2的OD分布如圖5所示。
2.2 轎車旅途群體驗(yàn)證
基于前期所做的大量數(shù)據(jù)分析處理工作,對(duì)轎車ETC用戶進(jìn)行了群體劃分,并對(duì)群體相應(yīng)特征進(jìn)行了分析。為保障群體劃分的準(zhǔn)確性以及特征分析的有效性,需對(duì)劃分的用戶群體進(jìn)行驗(yàn)證。隨機(jī)挑選該群體車輛,分析其通行規(guī)律,判斷是否屬于轎車旅游群體。以渝GDG**7為例,對(duì)其通行頻次以及OD分布進(jìn)行統(tǒng)計(jì),如表4所示:
通過對(duì)其通行特征規(guī)律的觀察分析以及對(duì)其OD分布的探究,所選車輛符合轎車旅游群體分類依據(jù),其通行特征充分體現(xiàn)轎車旅游群體的運(yùn)行規(guī)律。基于此,斷定所選車輛歸屬轎車旅游群體,渝GDG**7的 OD分布如圖6所示。
3 總結(jié)
基于ETC用戶基礎(chǔ)數(shù)據(jù),通過關(guān)聯(lián)分析、聚類分析等數(shù)據(jù)分析方法,針對(duì)ETC用戶群體出行方式、消費(fèi)行為等多特征及閾值進(jìn)行轎車通勤用戶畫像的指標(biāo)體系構(gòu)建,該方法已經(jīng)群體驗(yàn)證,證實(shí)了該方法的準(zhǔn)確性和有效性?;贓TC數(shù)據(jù)的轎車通勤群體和轎車旅游群體的劃分方法,有助于ETC運(yùn)營業(yè)務(wù)的延伸和拓展,為其提供理論支撐。
參考文獻(xiàn)
[1]曹景揚(yáng).ETC用戶精準(zhǔn)畫像系統(tǒng)的研究與設(shè)計(jì)[D].長(zhǎng)春:長(zhǎng)春工業(yè)大學(xué),2019.
[2]嚴(yán)鈺.高速公路收費(fèi)站車輛尾氣排放預(yù)測(cè)模型研究[D].南京:東南大學(xué),2018.
[3]夏陸然,高薪.ETC聯(lián)網(wǎng)運(yùn)營與典型區(qū)域社會(huì)經(jīng)濟(jì)關(guān)系初探——以“一帶一路”重點(diǎn)區(qū)域京津冀和長(zhǎng)三角為例[J].中國交通信息化,2019(12):42-44.
[4] Klodzinski J, AI-Deek H M.New Methodology for Ddfining Level of Service at Toll Plazes[J]. Journal of Transportation Engineering, 2002(2): 173-181.
[5]王旭.高速公路電子不停車收費(fèi)系統(tǒng)效益評(píng)價(jià)及營銷推廣[D].廣州:華南理工大學(xué),2016.
[6]馬春平.基于全國聯(lián)網(wǎng)ETC運(yùn)營數(shù)據(jù)的應(yīng)用研究[D].北京:北京郵電大學(xué),2018:10-45.
[7]Sini Guo, Xiang Li, Wai-Ki Ching, etal.GPS trajectory data segmentation based on probabilistic logic[J]. International Journal of Approximate Reasoning, 2018(12): 227-247.
[8]Zun Wang, Anne Goodchild, Edward McCormack. A methodology for forecasting freeway travel time reliability using GPS data[J]. Transportation Research Procedia, 2017: 842-852.
[9]董宏輝,孫曉亮,賈利民,等.多模態(tài)的交通流量預(yù)測(cè)模型[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2011(3):645-649.
[10]徐海玲,張海濤,魏明珠,等.社交媒體用戶畫像的構(gòu)建及資源聚合模型研究[J].圖書情報(bào)工作,2019(9):109-115.
[11]楊雙亮.用戶畫像在內(nèi)容推送的研究與應(yīng)用[D].北京:北京工業(yè)大學(xué),2017:8-9.