吳 濤,汪 璐,秦 建 新*,向 隆 剛,曾 芷 萱
(1.湖南師范大學(xué)地理科學(xué)學(xué)院/地理空間大數(shù)據(jù)挖掘與應(yīng)用湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410081;2.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079)
“社會(huì)感知”作為一種研究人類時(shí)空行為特征、揭示社會(huì)經(jīng)濟(jì)現(xiàn)象的理論和方法,已廣泛運(yùn)用于城市功能區(qū)識(shí)別[1]、用戶時(shí)空行為研究[2-5]、城市規(guī)劃[6]、旅游活動(dòng)類型判別[7-10]等方面。近年來,地理空間智能(GeoAI)作為地理空間科學(xué)和人工智能深度融合的交叉學(xué)科,有力提升了對(duì)地理現(xiàn)象過程的動(dòng)態(tài)感知、智能推理和知識(shí)發(fā)現(xiàn)的能力。大數(shù)據(jù)時(shí)代基于社會(huì)感知的地理空間智能研究和應(yīng)用主要有個(gè)性化路徑[11,12]、災(zāi)害預(yù)測(cè)[13]、測(cè)繪[14-16]、智慧交通[17-19]、智慧醫(yī)療[20,21]、智慧養(yǎng)老[22,23]、智慧政務(wù)[24,25]等。在智能出行方面,Hung等[26]采用加權(quán)方法最小化出行規(guī)劃的距離成本;Sun[27]提出以最小鏈路出行時(shí)間和出行距離為優(yōu)化目標(biāo)的多目標(biāo)動(dòng)態(tài)路線選擇模型,保證乘客在最短出行時(shí)間和距離上選擇可靠出行路線;Zhou等[28]提出一種基于樸素貝葉斯興趣數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的智能旅游路線規(guī)劃算法。上述研究在出行規(guī)劃中鮮有考慮個(gè)體意愿,導(dǎo)致推薦的出行路線個(gè)性化不足;部分研究雖然分析了個(gè)性化的出行方案,但并未與時(shí)空環(huán)境信息進(jìn)行充分的動(dòng)態(tài)連接,如李迎[29]在地理興趣區(qū)域推薦模型中僅考慮地理因素,未引入時(shí)間因素進(jìn)行更全面的用戶偏好信息挖掘。
綜上,為彌補(bǔ)出行方案?jìng)€(gè)性化的不足,本文基于出行方案推薦與時(shí)空環(huán)境信息動(dòng)態(tài)連接的現(xiàn)狀,提出基于眾源時(shí)空信息的個(gè)性化路線服務(wù)框架,利用眾源時(shí)空大數(shù)據(jù)感知公眾的出行偏好,將大眾對(duì)不同地點(diǎn)的偏好、時(shí)間與成本預(yù)算等信息映射到實(shí)際路網(wǎng)空間中,融合個(gè)人意向進(jìn)行動(dòng)態(tài)建模分析,以期為用戶提供合適且個(gè)性化的出行方案。
本文根據(jù)社會(huì)感知的研究框架[30],提出基于眾源時(shí)空信息的個(gè)性化路線服務(wù)框架(圖1a),包括眾源感知、智能推薦、路線規(guī)劃、行程共享4個(gè)模塊。1)在眾源感知模塊中,對(duì)OSM、大數(shù)據(jù)展示等平臺(tái)提供的眾源時(shí)空大數(shù)據(jù)進(jìn)行預(yù)處理,驗(yàn)證其信息可靠性,然后由智能推薦、路線規(guī)劃、行程共享3個(gè)模塊進(jìn)行引導(dǎo),設(shè)計(jì)出符合眾源感知的出行路線;2)在智能推薦模塊中,將從百度地圖、OpenStreetMap、Flickr、社交網(wǎng)站(如 Facebook、新浪微博等)獲取的眾源數(shù)據(jù)[31]融合并根據(jù)用戶偏好信息,通過客戶端進(jìn)行搜索,結(jié)合改進(jìn)的隱馬爾可夫模型(Hidden Markov Model,HMM)與動(dòng)態(tài)路線優(yōu)化算法,即可針對(duì)實(shí)時(shí)興趣點(diǎn)的人流量、道路擁堵情況、用戶偏好等信息對(duì)用戶進(jìn)行智能推薦,同時(shí)還可使用拓?fù)湔Z義匹配查詢歷史軌跡,減少互聯(lián)網(wǎng)的信息超載,推薦與用戶偏好類似的區(qū)域,提供更好的定位服務(wù)與出行體驗(yàn);3)在路線規(guī)劃模塊中,客戶端將用戶數(shù)據(jù)傳入系統(tǒng),系統(tǒng)將用戶的特定需求與實(shí)時(shí)路網(wǎng)數(shù)據(jù)、POI及其熱度數(shù)據(jù)[32,33]結(jié)合,篩選出符合用戶需求的景點(diǎn)類型,而后將結(jié)果可視化,以供用戶選擇出行路線。4)在行程共享模塊中,用戶通過移動(dòng)設(shè)備在網(wǎng)絡(luò)平臺(tái)上發(fā)布包含圖片(像)、文本語義的感知信息,在社交媒體共享其行程[34],平臺(tái)將組織與存儲(chǔ)用戶行程規(guī)劃和實(shí)時(shí)旅游信息(如景點(diǎn)交通情況、附近推薦等),并將歷史用戶的多樣化出行路線進(jìn)行可視化制圖,同時(shí),后端服務(wù)器將共享的旅游信息等融入智能推薦模塊,方便其他用戶檢索與查詢。圖1b為基于眾源時(shí)空信息感知的個(gè)性化路線服務(wù)場(chǎng)景。
圖1 基于眾源地理數(shù)據(jù)的個(gè)性化路線服務(wù)框架及場(chǎng)景Fig.1 Personalized routing service framework and scenario map based on crowdsourcing geographic data
在個(gè)性化路線服務(wù)框架的路線規(guī)劃模塊中,本文利用眾源時(shí)空大數(shù)據(jù)改進(jìn)的HMM模型[11],根據(jù)個(gè)人意愿、POI熱度和路線約束進(jìn)行動(dòng)態(tài)路線規(guī)劃。改進(jìn)的HMM模型表達(dá)式為HMM=(O,S,P,G),其輸入?yún)?shù)為觀測(cè)狀態(tài)集O、觀測(cè)序列S、POI數(shù)據(jù)集P、路網(wǎng)G和POI-PP(投影點(diǎn)),其實(shí)現(xiàn)流程(算法1)為:1)使用POI的推薦信息計(jì)算每個(gè)POI的大眾推薦度,并構(gòu)建第一層隱藏狀態(tài),檢查與觀測(cè)序列相對(duì)應(yīng)的所有觀測(cè)狀態(tài),并檢查每個(gè)觀測(cè)狀態(tài)下的所有POIs,得到每個(gè)POI在相應(yīng)狀態(tài)下的大眾推薦度,通過分析POI的大眾推薦度即可得到用戶在不同時(shí)期對(duì)POI的偏好;2)構(gòu)建第二層隱藏狀態(tài),該層考慮了路段與POI之間的距離,設(shè)置一個(gè)距離閾值,計(jì)算POI在該閾值內(nèi)相鄰路段的所有投影點(diǎn),即可得到POI在第二層隱藏狀態(tài)路段上的投影,這些POIs的投影可表示為每個(gè)隱藏狀態(tài)的候選點(diǎn);3)利用路網(wǎng)G計(jì)算兩個(gè)POI點(diǎn)之間的大圓距離GD、不同觀測(cè)狀態(tài)下投影點(diǎn)之間的路線距離RD以及POI到投影點(diǎn)之間的大圓距離PD,并利用POI的熱度值計(jì)算觀測(cè)概率,即某狀態(tài)在不同時(shí)間內(nèi)所有POIs的熱度值及其對(duì)路段的投影,將二者相乘得到每個(gè)POI投影點(diǎn)的觀測(cè)概率EP,并計(jì)算每個(gè)POI投影點(diǎn)從狀態(tài)Si到Si+1的轉(zhuǎn)移概率TP;4)將上述步驟計(jì)算得到的數(shù)據(jù)與參數(shù)導(dǎo)入HMM,利用Viterbi算法即可生成最優(yōu)路線的POI訪問序列,即根據(jù)用戶個(gè)人興趣滿足用戶需求的最佳出行路線[35]。
算法1 基于兩層映射的HMM路線規(guī)劃方法
Input:States of observation O;A sequence of observation S;POIs Dataset P;Road network G;The recommendation of POIs PP
Output:Optimal personalized route R
1:PopIndex=calPopularityIndexInfo(P,PP);// 計(jì)算每個(gè)POI的大眾推薦度
2:Spoi=Sequence(O,S,P,PopIndex);// 每個(gè)觀測(cè)狀態(tài)下的所有POI
3:Sproj=Project(Spoi,G);// 得到POI在路段上的投影
4:foreach hidden state in sido
5: RD=getRouteDistance(Sproj,G);// RD代表兩個(gè)投影點(diǎn)之間的路線距離
6: GD=getGreatCircleDistance(Spoi,G);//GD代表兩個(gè)POI之間的大圓距離
7: PD=getPOIToProjectionDistance(P,Sproj);// PD代表POI到投影點(diǎn)之間的大圓距離
8: EP=getEmissionProbability(Sproj,PD);// EP 代表POI投影點(diǎn)的觀測(cè)概率
9:foreach projection of the POIdo
10: TP= getTransitionProbability(Sproj,RD,GD);// TP代表從Si到Si+1的轉(zhuǎn)移概率
11:endfor
12:endfor
13:R=createIndividualRoutesModel(EP,TP,G);
14:returnR;
基于眾源時(shí)空信息的個(gè)性化路線服務(wù)平臺(tái)(圖2)運(yùn)用眾源時(shí)空數(shù)據(jù)接入機(jī)制與智能路線規(guī)劃、語義軌跡數(shù)據(jù)的組織查詢機(jī)制、前后端與線下平臺(tái)的協(xié)作機(jī)制等核心技術(shù),為用戶動(dòng)態(tài)規(guī)劃智能出行方案,其系統(tǒng)架構(gòu)包括前端、后端服務(wù)器、數(shù)據(jù)庫、網(wǎng)絡(luò)四方面。前端即搭載的微信小程序,接收數(shù)據(jù)平臺(tái)發(fā)布的數(shù)據(jù)并驗(yàn)證其可靠性,提供個(gè)性化旅游路線設(shè)計(jì)、歷史軌跡搜索、景點(diǎn)介紹、用戶留言板、出行圖片發(fā)布等功能,可及時(shí)、準(zhǔn)確、完整地根據(jù)用戶偏好和實(shí)際路網(wǎng)信息為用戶提供個(gè)性化路線服務(wù);用戶通過微信小程序搜索引擎和軌跡語義查詢,獲取不同主題的景點(diǎn)推薦度、周邊服務(wù)等信息。后端服務(wù)器由基礎(chǔ)GIS服務(wù)構(gòu)成,包括騰訊在線地圖開放平臺(tái)和云端服務(wù)器。騰訊在線地圖開放平臺(tái)可以提供實(shí)時(shí)路網(wǎng)數(shù)據(jù)、興趣點(diǎn)數(shù)據(jù),通過調(diào)用騰訊地圖服務(wù)提供的API接口完成相關(guān)算法。后臺(tái)的核心數(shù)據(jù)管理部分是基于騰訊云端服務(wù)器(AMD EPYCTMRome 2核、八通道DDR4 4 G內(nèi)存、5 Mbps帶寬)部署的SSM框架,即通過Spring的IOC特性和AOP特性實(shí)現(xiàn)對(duì)象間的依賴關(guān)系并支撐便捷解耦,通過SpringMVC與Spring的無縫鏈接實(shí)現(xiàn)靈活的數(shù)據(jù)驗(yàn)證、格式化和數(shù)據(jù)綁定機(jī)制,通過MyBatis實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)對(duì)后臺(tái)MySQL數(shù)據(jù)庫的管理和維護(hù)。面對(duì)業(yè)務(wù)突增帶來的資源不足問題,騰訊云服務(wù)器可隨時(shí)在線增加服務(wù)器的CPU、內(nèi)存、硬盤及帶寬等配置[36],或增加服務(wù)器數(shù)量以解決問題。
圖2 個(gè)性化路線服務(wù)平臺(tái)——TinspirationFig.2 Personalized routing service platform——Tinspiration
長(zhǎng)沙市是我國(guó)中部崛起和長(zhǎng)江中游城市群的重要戰(zhàn)略支點(diǎn),2019年開始從傳統(tǒng)意義上的智慧城市向新型智慧城市演進(jìn),2021年入選“智慧城市+智能網(wǎng)聯(lián)汽車”首批國(guó)家試點(diǎn)。岳麓區(qū)是長(zhǎng)沙市獨(dú)立的行政建置,常住人口數(shù)量位居長(zhǎng)沙市各縣市區(qū)之首,擁有岳麓山等生態(tài)景觀、岳麓書院等89處文物保護(hù)單位、中南大學(xué)等16所高校,因此,本文重點(diǎn)選取長(zhǎng)沙主城區(qū)的岳麓區(qū)為研究區(qū)域,研究基于眾源地理數(shù)據(jù)的個(gè)性化路線服務(wù)體系。研究數(shù)據(jù)包括從OSM平臺(tái)獲取的實(shí)驗(yàn)區(qū)2019年實(shí)際路網(wǎng)數(shù)據(jù),并根據(jù)不同主題的大眾推薦度從百度地圖開放平臺(tái)獲取76個(gè)POI作為實(shí)驗(yàn)點(diǎn),將其分為大學(xué)、主題樂園、古跡、劇院等12個(gè)主題。
本研究進(jìn)行兩組實(shí)驗(yàn),實(shí)驗(yàn)1選取大學(xué)、公園、主題樂園、古跡、博物館、劇院6個(gè)主題為實(shí)驗(yàn)對(duì)象,實(shí)驗(yàn)2選取名山、商場(chǎng)、公園、劇院、大學(xué)、車站6個(gè)主題為實(shí)驗(yàn)對(duì)象。為驗(yàn)證不同時(shí)段POI熱度值對(duì)路線規(guī)劃的影響,本文獲取不同月份的POI熱度數(shù)據(jù)分別進(jìn)行實(shí)驗(yàn)。將POI熱度劃分為0~0.2、0.2~0.4、0.4~0.6、0.6~0.8、0.8~1.0共5個(gè)等級(jí),通過改進(jìn)的HMM模型得到不同月份的最優(yōu)路線(圖3、圖4)。由圖3、圖4可知,隨著月份改變,路線也發(fā)生相應(yīng)變化,緣于人們?cè)诓煌路輰?duì)POI的關(guān)注度不同。例如,實(shí)驗(yàn)1中,5-6月世界之窗的大眾推薦度高于海底世界,而在7-9月大眾更偏向后者,主要是因?yàn)?-9月天氣酷熱,不適宜室外主題樂園游玩。隨著POI關(guān)注度提升,規(guī)劃路線對(duì)其選擇率也增大,但由于距離因素,關(guān)注度最高的POI并不意味著最佳選擇。本文同時(shí)考慮POI間的路線距離等因素計(jì)算出最優(yōu)路線,且在大多數(shù)路線中,候選點(diǎn)一般是該主題中大眾推薦度最高的POI。例如,實(shí)驗(yàn)2中,5-12月的最優(yōu)路線保持一致,說明選取名山、商場(chǎng)、公園、劇院、大學(xué)、車站6個(gè)主題規(guī)劃路線所展示的POI推薦度最高,進(jìn)而說明在改進(jìn)的HMM模型中,熱度數(shù)據(jù)作為一個(gè)影響因素與POI的選擇關(guān)系密切。
圖3 實(shí)驗(yàn)1 中6個(gè)主題不同月份的最優(yōu)路線Fig.3 Optimal routes of six subjects in each month in experiment 1
圖4 實(shí)驗(yàn)2中6個(gè)主題不同月份的最優(yōu)路線Fig.4 Optimal routes of six subjects in each month in experiment 2
實(shí)驗(yàn)1和實(shí)驗(yàn)2分別基于1月份和9月份數(shù)據(jù),對(duì)本文改進(jìn)的HMM模型與傳統(tǒng)HMM模型和最短路徑分析方法進(jìn)行對(duì)比(圖5、圖6)。傳統(tǒng)HMM模型僅依據(jù)已有的POI規(guī)劃路線,不考慮POI的大眾推薦度,其提供的規(guī)劃路線與本文方法在博物館、主題樂園、大學(xué)3個(gè)主題中選取的POI熱度等級(jí)區(qū)別很大,選取的皆是熱度等級(jí)最低的POI(圖5),獲取的路線并未融合大眾偏好。最短路徑分析方法僅考慮了距離因素,忽略了其他影響個(gè)性化路線規(guī)劃的因素,其提供的規(guī)劃路線僅選取了途經(jīng)名山、商場(chǎng)、公園、劇院、大學(xué)、車站6個(gè)主題中路線最短的POI,規(guī)劃路線在商場(chǎng)主題中僅考慮距離因素,選取POI熱度較低的萬達(dá)廣場(chǎng)(本文方法選取熱度值明顯高于萬達(dá)廣場(chǎng)的五一廣場(chǎng))(圖6)。因此,傳統(tǒng)HMM模型與最短路徑分析方法得到的路線規(guī)劃結(jié)果可能只是由大眾推薦度較低的POI組成的一條相對(duì)不受歡迎的路線,無法滿足出行者的個(gè)人意愿,對(duì)大眾吸引力較低。本文改進(jìn)的HMM模型根據(jù)狀態(tài)序列隨時(shí)間變化而建模,將時(shí)空特征與靜態(tài)數(shù)據(jù)相結(jié)合,不僅考慮了不同時(shí)期POI與環(huán)境間的相互作用對(duì)人們出行的影響,還考慮了不同月份POI的熱度值,得到的路線與POI熱度符合率較高(圖5、圖6),可在短時(shí)間內(nèi)提供滿足用戶需求的最優(yōu)路線。
圖5 實(shí)驗(yàn)1基于1月份數(shù)據(jù)3種方法獲得的最優(yōu)路線Fig.5 Optimal routes obtained by three methods based on the data in January in experiment 1
圖6 實(shí)驗(yàn)2基于9月份數(shù)據(jù)3種方法獲得的最優(yōu)路線Fig.6 Optimal routes obtained by three methods based on the data in September in experiment 2
本文提出基于眾源地理數(shù)據(jù)的個(gè)性化路線服務(wù)框架:基于全局路網(wǎng)與眾源數(shù)據(jù)的聯(lián)系,將眾源時(shí)空信息與出行者的個(gè)人意愿映射到實(shí)際路網(wǎng)空間,借助改進(jìn)的HMM模型進(jìn)行動(dòng)態(tài)建模,最后選取長(zhǎng)沙市岳麓區(qū)不同月份的POI熱度數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。結(jié)果表明,基于眾源地理數(shù)據(jù)的個(gè)性化路線服務(wù)框架可根據(jù)大眾的偏好與意向,在短時(shí)間內(nèi)靈活規(guī)劃不同時(shí)空背景下的出行路線,能夠響應(yīng)用戶的多樣化需求,設(shè)計(jì)出一條貼合用戶特質(zhì)和偏好的出行路線,極大提升用戶的體驗(yàn)感受,以此助力智慧城市的建設(shè),打造文旅融合新生態(tài)。本研究在以下方面有待進(jìn)一步探討:1)保護(hù)用戶隱私,借鑒其他方法完善基于眾源時(shí)空信息的個(gè)性化路線服務(wù)平臺(tái);2)完善服務(wù)器應(yīng)急機(jī)制,以應(yīng)對(duì)突發(fā)情況下的數(shù)據(jù)穩(wěn)定獲取問題。