盧 揚,樊 超,2,韓筱璞,榮智海
?
簽到行為的可預(yù)測性及影響因素分析
盧 揚1,樊 超1,2,韓筱璞3,榮智海1
(1. 電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心CompleX實驗室 成都 611731; 2. 山西農(nóng)業(yè)大學(xué)文理學(xué)院 山西太谷 030801; 3. 杭州師范大學(xué)信息經(jīng)濟研究所和阿里巴巴商學(xué)院 杭州 310036)
人類日常的出行行為受到多種因素的制約和影響。本文通過兩組手機用戶上報的位置信息分析人類簽到行為的空間規(guī)律特征,著重分析了訪問地點數(shù)、平均跳轉(zhuǎn)距離、回轉(zhuǎn)半徑和最常訪問地點等因素對簽到行為的可預(yù)測性的影響。研究表明簽到行為具有一定的記憶性,用戶訪問的地點數(shù)、對最常訪問地點的訪問規(guī)律是影響可預(yù)測性和規(guī)律性的主要因素,用戶的活動范圍和平均跳轉(zhuǎn)距離對可預(yù)測性的影響則微弱得多。
簽到行為; 熵; 人類動力學(xué); 可預(yù)測性; 空間運動規(guī)律
對人類行為規(guī)律的探索長久以來一直是自然、經(jīng)濟、社會等各個學(xué)科領(lǐng)域的學(xué)者關(guān)注的研究方向。近年來,隨著越來越多的人類行為的數(shù)據(jù)資料被精確記錄,學(xué)者得以從定量角度分析人類行為的時空規(guī)律及其動力學(xué)機制,并由此改變了很多對人類行為的傳統(tǒng)認識。如在時間規(guī)律上,過去人們假設(shè)人類行為的產(chǎn)生是具有均勻特性的泊松過程,而近年來大量實證結(jié)果顯示人類行為在很多方面具有明顯的陣發(fā)和重尾特征[1-5],即表現(xiàn)為長時間靜默和短時間爆發(fā)交織,且時間間隔服從重尾分布。
研究人類行為的空間規(guī)律在疾病傳播[6-8]、交通流控制[9-11]、異常行為監(jiān)測[12]、人口遷移[13]等方面具有重大的理論和應(yīng)用價值。過去,人們假設(shè)人類的出行行為可以用隨機游走或者列維飛行刻畫,但近年來的一系列研究卻證實人類出行的時間間隔分布和位移距離分布都服從重尾分布,表現(xiàn)為陣發(fā)性、有界性、周期性和規(guī)律性綜合的特征[14-20]。為此,學(xué)者相繼從不同角度提出了統(tǒng)計模型來解釋上述特征產(chǎn)生的原因[14,16-17]。在實證和建模的基礎(chǔ)上,更具有理論和商業(yè)價值的位置預(yù)測[21-29]也是人類出行行為研究的重點之一。文獻[21]用熵的方法得到人類出行的理論可預(yù)測性最高可達93%,該結(jié)果受到了廣泛關(guān)注。
過去對人類出行規(guī)律的研究所采用的數(shù)據(jù)多來源于鈔票或者手機通信,這些數(shù)據(jù)都可視為被動簽到行為的結(jié)果,并非用戶主動上傳。隨著GPS設(shè)備的微型化,更能反映用戶的主觀愿望的即時通訊(instant messaging, IM)和基于位置的服務(wù)(location based services, LBS)工具變得更加普及,從而為研究人們的出行行為提供了更好的媒介。
本文通過兩組由手機收集的地點簽到數(shù)據(jù)(包括基于IM的QQ和基于LBS的Gowalla)研究人們在日常生活中的簽到行為,總結(jié)了簽到行為的基本特征,利用熵和Fano不等式計算了用戶的平均最大可預(yù)測性,重點分析了影響可預(yù)測性的因素,包括訪問地點數(shù)、平均跳轉(zhuǎn)距離、回轉(zhuǎn)半徑和最常訪問地點。發(fā)現(xiàn)人們的簽到行為具有明顯的非均勻特征和一定的記憶效應(yīng),可預(yù)測性和規(guī)律性受用戶訪問的地點數(shù)的影響明顯,而與用戶的活動范圍和平均跳轉(zhuǎn)距離關(guān)系不大,更進一步,可預(yù)測性會隨著用戶最常訪問地點的刪除而呈現(xiàn)先減小后增大的趨勢。同時還發(fā)現(xiàn),與被動簽到行為相比,主動簽到行為具有更大的熵值,因而也更難預(yù)測。相比于地點分享行為,日常出行行為的記憶性、規(guī)律性和可預(yù)測性都更強一些。
本文研究所采用的數(shù)據(jù)集來源于兩組由手機收集到的經(jīng)過匿名化處理的地點簽到信息:數(shù)據(jù)集1來自LBS社交網(wǎng)站Gowalla,全球范圍內(nèi)的用戶可通過移動端的應(yīng)用程序或者瀏覽器進行主動簽到,從而與好友分享新的地點、活動和旅行線路;數(shù)據(jù)集2來自國內(nèi)某沿海城市的手機QQ用戶使用涉及地圖服務(wù)的應(yīng)用時被動記錄下的地點信息。因此,兩組數(shù)據(jù)都是用戶發(fā)生空間移動行為時記錄的位置信息,包括了用戶ID、地點經(jīng)緯度、時間等屬性,且相比于2,1由于是用戶主動上傳分享的,故其主動性更強一些。為了保證用戶軌跡信息量具有統(tǒng)計意義,本文在計算可預(yù)測性時去掉了地點簽到量不足100條的用戶,在去掉不活躍的用戶之后,1、2的用戶數(shù)量分別為全部用戶的8.35%和28.92%,但軌跡量卻能分別達到65.59%和79.33%,地點數(shù)目分別達到全量數(shù)據(jù)的76.56%和81.00%。兩組數(shù)據(jù)的概述如表1所示。
表1 數(shù)據(jù)集簡介
這兩組數(shù)據(jù)都源于手機用戶上網(wǎng)、簽到或查詢地圖等行為,文中將用戶在某個地點產(chǎn)生一條軌跡信息記錄的行為統(tǒng)稱為“簽到”,若相鄰兩次簽到的地點發(fā)生變化,則稱為一次“跳轉(zhuǎn)”,若地點沒有發(fā)生變化,則稱之為“停留”。由于數(shù)據(jù)集中存在短時間內(nèi)產(chǎn)生多條簽到記錄的現(xiàn)象,使得數(shù)據(jù)在時間上會顯得非常頻繁,但在空間地點信息上又顯得不夠豐富。為了更好地分析用戶的空間移動行為特征,將極短時間內(nèi)在同一地點的多條簽到記錄合并為一條,最后保留的數(shù)據(jù)集中仍然存在一定時間間隔下的有意義的地點停留。從而獲得每個用戶的簽到軌跡集合,其中代表用戶訪問的第個地點。同時定義用戶的跳轉(zhuǎn)距離集合為,其中代表用戶在簽到地點和之間的跳轉(zhuǎn)距離,可以根據(jù)簽到地點的經(jīng)緯度信息計算獲得。
2.1 用戶和地點的活躍度分布
統(tǒng)計結(jié)果顯示,本文所研究的簽到行為的時間間隔分布和跳轉(zhuǎn)距離分布都表現(xiàn)出冪律特征,與文獻[13-15]的結(jié)果類似。那么,在人們的日常生活中,每個人會訪問多少個不同的地點?每個地點又會有多少不同的人來訪問呢?為了回答這兩個問題,定義用戶的活躍度為用戶去過的地點集的大小,定義地點的活躍度為去過該地點的用戶集的大小。統(tǒng)計兩個數(shù)據(jù)集中全部用戶和地點的活躍度分布,結(jié)果如圖1所示。
而由圖1b知地點的活躍度分布則為冪律分布。這說明在特定地點簽到的人數(shù)具有較強的異質(zhì)性,即日常生活中大部分地點的訪問人數(shù)較少,同時存在少數(shù)熱門地點具有大量的訪問人數(shù)。這樣的現(xiàn)象與購物、點評等典型二部圖網(wǎng)絡(luò)的度分布研究結(jié)果類似[32],說明在真實系統(tǒng)中,行為的主動發(fā)出者所覆蓋的受眾是有限而較為均勻的,而行為的被動接收者卻可以接受大量而異質(zhì)的訪問。由于Gowalla數(shù)據(jù)的地點精確度非常高,故大部分地點的訪問量非常少,因而其曲線的衰減速度比QQ的曲線要快得多,后者的異質(zhì)性更強。
a. 用戶的活躍度分布
b. 地點的活躍度分布
圖1 用戶和地點的活躍度分布
2.2 簽到行為的統(tǒng)計特征
為了考察用戶日?;顒臃秶拇笮?,定義回轉(zhuǎn)半徑[15]為:
a. 平均跳轉(zhuǎn)距離分布
b. 回轉(zhuǎn)半徑分布
2.3 跳轉(zhuǎn)距離相關(guān)性
用戶相鄰的兩次跳轉(zhuǎn)之間是否存在內(nèi)在聯(lián)系,是否一次長距離的跳轉(zhuǎn)也預(yù)示著下一步也是長距離的跳轉(zhuǎn)?為了研究這個問題,本文采用文獻[33]中定義的記憶性指標,研究所有個體用戶跳轉(zhuǎn)距離的相關(guān)性。
3.1 簽到行為的可預(yù)測性度量
本文采用文獻[21]中的方法定義簽到行為的熵和可預(yù)測性,包括三種熵的度量指標。
根據(jù)Fano不等式可得到每個用戶的可預(yù)測性:
同時定義用戶地點訪問的規(guī)律性。將一周的時間分成24小時*7天=168個時段,用表示在真實情況下每個時段的最常訪問地點找到該用戶的概率,其中用戶在某時段的最常訪問地點為用戶的歷史簽到軌跡中在該時段簽到次數(shù)最多的地點。同時用表示用戶隨機訪問任意地點的規(guī)律性,則。規(guī)律性刻畫的是可預(yù)測性的一個不嚴格下限。
表2 簽到行為的可預(yù)測性度量指標計算結(jié)果
如圖3a所示,對于數(shù)據(jù)集1,從用戶的隨機熵、香農(nóng)熵以及真實熵的分布情況可以發(fā)現(xiàn),當(dāng)同時考慮用戶地點簽到的時空特性時,熵值將大幅度降低。用戶的和都分布較廣,均值,說明用戶平均每次都從個曾經(jīng)去過的地點中選擇一個地點進行跳轉(zhuǎn),而均值,即用戶在每一次跳轉(zhuǎn)時有種選擇。當(dāng)同時考慮地點的簽到頻率以及簽到的順序時,其均值,說明用戶跳轉(zhuǎn)的不確定性為約個地點。
圖3c揭示了用戶的地點訪問的規(guī)律性分布,在用戶的簽到行為中,約28.9%的時間里都是位于該時段最常簽到的地點。故對于某個特定時段,只要猜測用戶位于在其最常訪問的地點,就至少能夠獲得28.9%左右的準確度。
對于數(shù)據(jù)集2,熵、可預(yù)測性和規(guī)律性等指標表現(xiàn)為與1類似的情況。二者的差別表現(xiàn)在:2的3種類別的熵值都比1低,可預(yù)測性則要高。這是由于2數(shù)據(jù)中地點的經(jīng)緯度精度要低于1,且2的數(shù)據(jù)中地點的范圍相對較小(1中的簽到地點遍布全世界,而2大部分局限在該城市及周邊),使得2中的地點重合度高達97.6%,而1中只有80.5%。對于數(shù)據(jù)集1,在每個用戶的簽到序列中新地點的比例更大,總地點個數(shù)更多,每個地點訪問的概率更小,因此熵值也必然更大。
a. 熵的分布
b. 可預(yù)測性的分布
c. 規(guī)律性的分布
3.2 影響可預(yù)測性和規(guī)律性的因素分析
從前文的統(tǒng)計結(jié)果可以看出,人類的日常簽到行為具有復(fù)雜性和規(guī)律性交織的特征。那么,規(guī)律性越強的用戶是否更容易預(yù)測?訪問過更多地點的用戶、活動半徑更大的用戶是否更難預(yù)測?計算每個用戶的可預(yù)測性和規(guī)律性之間的Pearson系數(shù),結(jié)果顯示該值在1和2中分別為0.057和0.027,即規(guī)律性與可預(yù)測性之間并無明顯的相關(guān)關(guān)系,并不是行為越規(guī)律的用戶越容易預(yù)測。此外,計算可預(yù)測性和跳轉(zhuǎn)距離記憶性之間的Pearson系數(shù),結(jié)果在1和2中分別為0.111和0.096,說明可預(yù)測與跳轉(zhuǎn)距離也沒有顯著關(guān)聯(lián)。下面本文分析影響用戶簽到行為可預(yù)測性和規(guī)律性的因素。
3.2.1 可預(yù)測性的影響因素分析
統(tǒng)計用戶去過的地點數(shù)和去過該地點數(shù)的全部用戶的平均可預(yù)測性值,考察二者之間的關(guān)系,結(jié)果如圖4a所示。訪問地點數(shù)與可預(yù)測性的關(guān)系在兩個數(shù)據(jù)集中表現(xiàn)出了相同的規(guī)律,即先在一段小范圍內(nèi)減小,然后迅速變得平緩,在波動中緩慢下降。由于Gowalla數(shù)據(jù)的觀測期更長,故其用戶訪問的地點數(shù)也更多。這說明在一定范圍內(nèi),確實存在用戶訪問過的地點數(shù)越多,其行為就更難預(yù)測的現(xiàn)象。但是隨著地點數(shù)持續(xù)增多其真實可預(yù)測性開始趨于平緩,即地點數(shù)的影響作用變小??傮w上看,用戶去過的地點數(shù)與用戶的可預(yù)測性存在一定的負相關(guān)性。
根據(jù)2.2節(jié)得到的每個用戶的平均跳轉(zhuǎn)距離和回轉(zhuǎn)半徑分析二者和可預(yù)測性的關(guān)系,如圖4b和4c所示,不論是回轉(zhuǎn)半徑還是平均跳轉(zhuǎn)距離對于可預(yù)測性的影響都表現(xiàn)出了相似的規(guī)律,即隨著用戶活動范圍和出行距離的增大,和會在一定的范圍內(nèi)迅速降低,隨后保持比較平穩(wěn)的波動過程,而由于其計算方式導(dǎo)致其損失了過多的信息故數(shù)值接近于零,因此沒有明顯變化。相對于回轉(zhuǎn)半徑,平均跳轉(zhuǎn)距離對可預(yù)測性的影響作用更小。
a. 訪問地點數(shù)對可預(yù)測性的影響
b. 平均跳轉(zhuǎn)距離對可預(yù)測性的影響
c. 回轉(zhuǎn)半徑對可預(yù)測性的影響
3.2.2 規(guī)律性的影響因素分析
規(guī)律性反映了用戶在特定時段出現(xiàn)在最常訪問地點的概率,那么上述三個統(tǒng)計量對用戶簽到行為的規(guī)律性是否有影響呢?計算結(jié)果顯示,隨著用戶訪問地點數(shù)的增大,快速衰減并趨近于零,而在很大范圍內(nèi)保持緩慢的下降,說明僅僅是地點數(shù)的增大并不會對用戶簽到的規(guī)律性產(chǎn)生太大影響。而回轉(zhuǎn)半徑和平均跳轉(zhuǎn)距離對規(guī)律性幾乎沒有影響。
a. 訪問地點數(shù)對規(guī)律性的影響
b. 平均跳轉(zhuǎn)距離對規(guī)律性的影響
c. 回轉(zhuǎn)半徑對規(guī)律性的影響
3.2.3 最常訪問地點的影響
在人們的日常生活中,不論是個體還是群體用戶對某個特定地點的訪問量都具有顯著的異質(zhì)性,少數(shù)地點具有極高的訪問量,而大多數(shù)地點極少被光顧。那么這些訪問量大的地點是否對可預(yù)測性產(chǎn)生影響呢?為了回答這個問題,逐步刪除用戶移動軌跡中訪問量最大的個地點,查看用戶最大真實熵和可預(yù)測性的變化情況。在實驗前首先挑選訪問過的唯一地點數(shù)大于最大刪除量(在數(shù)據(jù)集D1和D2中分別是50和20)的用戶,以保證在刪除訪問量大的地點時用戶仍然訪問過多于1個不同的地點。
a. Gowalla數(shù)據(jù)
b. QQ數(shù)據(jù)
圖6 刪除最常訪問地點對熵和可預(yù)測性的影響
可以從以下方面理解這種非平凡現(xiàn)象:一般情況下,對地點訪問信息豐富的用戶來說,隨著最常訪問地點的刪除,用戶的地點簽到序列會慢慢變得隨機化,此時熵值將慢慢增大,最大可預(yù)測性也隨之降低。但當(dāng)軌跡點被刪除到一定程度時,用戶訪問序列中的軌跡點都逐漸趨近于被訪問極少的次數(shù),幾乎成為一個完全隨機的地點訪問序列,可預(yù)測性下降趨勢逐漸變緩。當(dāng)全部的軌跡點的訪問次數(shù)都為1的時候,熵值達到最大,此時可預(yù)測性曲線也慢慢趨向最小值。當(dāng)繼續(xù)刪除軌跡點時,熵值隨著的增大而逐漸變小,此時最大可預(yù)測性則因為隨機序列中地點數(shù)的減少而緩慢增長。由此說明,用戶經(jīng)常訪問的地點是帶來簽到行為高可預(yù)測性的一個重要因素。而可預(yù)測性曲線的最值點比熵曲線滯后則是Fano不等式中二者的非線性關(guān)系造成的。
本文通過兩組手機用戶的簽到數(shù)據(jù)研究人類日常的出行行為,總結(jié)了簽到行為的一般規(guī)律,用熵的方法分析了簽到行為的可預(yù)測性,并重點分析了影響可預(yù)測性的幾個因素。發(fā)現(xiàn)人們的簽到行為具有一定的記憶效應(yīng),對地點的訪問具有明顯的異質(zhì)性??傮w來看,用戶訪問的地點數(shù)和對最常訪問地點的訪問規(guī)律對可預(yù)測性和規(guī)律性有明顯影響。具體而言,用戶訪問過的地點的數(shù)量與可預(yù)測性和規(guī)律性都具有一定的反相關(guān)關(guān)系,而回轉(zhuǎn)半徑和平均跳轉(zhuǎn)距離對二者的影響則微弱的多。用戶經(jīng)常訪問的地點對可預(yù)測性具有顯著影響,隨著這些地點被逐個刪除,可預(yù)測性表現(xiàn)為先下降再略微上升的形態(tài)。進一步研究還發(fā)現(xiàn),可預(yù)測性和規(guī)律性是人們?nèi)粘I畹钠毡橐?guī)律,與性別、年齡等屬性無關(guān)[21],因而該性質(zhì)是人類空間運動的普遍規(guī)律,在人口統(tǒng)計學(xué)屬性上無個體差異。
研究表明,當(dāng)用戶訪問的地點數(shù)逐步增大時,以及當(dāng)用戶最常訪問的地點被逐步刪除時,其可預(yù)測性都會下降,說明用戶對地點的訪問次數(shù)和訪問模式對可預(yù)測性有重要影響。一方面,當(dāng)用戶訪問的地點逐漸增多時,其訪問序列會變得混亂,因而熵值增大,可預(yù)測性下降;另一方面,當(dāng)用戶經(jīng)常訪問的地點被刪掉時,可預(yù)測性曲線的非線性的下降速率說明不同地點對可預(yù)測性的影響程度是不同的,訪問量大的地點的影響程度也更大。這些結(jié)果都說明用戶對不同地點的訪問量是非均勻的。因此,用戶對地點訪問的異質(zhì)性是影響其可預(yù)測性的重要因素。
從研究結(jié)果可以看到,數(shù)據(jù)集D2得到的可預(yù)測性數(shù)值要高于D1,這樣的差別反應(yīng)了兩組數(shù)據(jù)集的不同。如前文介紹所說,Gowalla是一個鼓勵用戶主動上報地理位置的LBS網(wǎng)站,其行為更多源自旅游、美食、娛樂等活動的分享;而QQ數(shù)據(jù)是在用戶日常生活中使用地圖服務(wù)時記錄的位置信息,日常生活中出行的記憶性和規(guī)律性更強,地點重合度也更高,因而其可整體可預(yù)測性也更高。
人類行為動力學(xué)研究的是人類行為的宏觀統(tǒng)計規(guī)律,而熵的方法分析可預(yù)測性得到的則是預(yù)測準確度的理論上限,并不是真正意義上的預(yù)測算法。由于人類行為的高度復(fù)雜性,對于個體出行行為的精確預(yù)測并不是一件容易的事情,預(yù)測的準確度也受到多種客觀條件和數(shù)據(jù)本身的質(zhì)量等因素制約。社會學(xué)、物理學(xué)、計算機科學(xué)等領(lǐng)域的學(xué)者都在從多方面關(guān)注影響人們出行的因素并探索提高預(yù)測算法的準確度的方式。本文有助于理解人類的出行規(guī)律,為尋找制約預(yù)測準確度的因素、改進利用熵和Fano不等式計算可預(yù)測性的方法提供一定的參考和借鑒。
本文的研究工作得到了山西農(nóng)業(yè)大學(xué)科技創(chuàng)新基金(201208)的資助,在此表示感謝!
[1] BARABáSI A L. The origin of bursts and heavy tails in human dynamics[J]. Nature, 435(2005): 207-211.
[2] ZHOU T, KIET H A T, KIM B J, et al. Role of activity in human dynamics[J]. Europhys Lett, 2008, 82(2): 28002.
[3] 周濤, 韓筱璞, 閆小勇, 等. 人類行為時空特性的統(tǒng)計力學(xué)[J]. 電子科技大學(xué)學(xué)報, 2013, 42(4): 481-540.
ZHOU Tao, HAN Xiao-pu, YAN Xiao-yong, et al. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540.
[4] 樊超, 郭進利, 韓筱璞, 等. 人類行為動力學(xué)研究綜述[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2011, 8(2): 1-17.
FAN Chao, GUO Jin-li, HAN Xiao-pu, et al. A review of research on human dynamics[J]. Complex Systems and Complexity Science, 2011, 8(2): 1-17.
[5] ZHAO Z D, CAI S M, HUANG J, et al. Scaling behavior of online human activity[J]. Europhys Lett, 2012, 100(4): 48004.
[6] HUFNAGEL L, BROCKMANN D, GEISEL T. Forecast and control of epidemics in a globalized world[J]. Proc Natl Acad Sci, 2004(101): 15124-15129.
[7] EUBANK S, GUCLU H, KUMAR V S A, et al. Modelling disease outbreaks in realistic urban social networks[J]. Nature, 2004, 429(6988): 180-184.
[8] HAN X P, WANG B H, ZHOU C S, et al. Scaling in the global spreading patterns of pandemic Influenza A (H1N1) and the role of control: empirical statistics and modeling [EB/OL]. [2014-09-23]. http://arxiv.org/pdf/ 0912.1390.
[9] MEYER M D, MILLER E J. Urban transportation planning: a decision-oriented approach[M]. New York: McGraw-Hill, 2001.
[10] MOKHTARIAN P L, SALOMON I. In perpetual motion: Travel behavior research opportunities and application challenges[M]. Amsterdam: Elsevier Science Press, 2002.
[11] CHON Y, LANE N D, KIM Y, et al. Understanding the coverage and scalability of place-centric crowdsensing[C]// Proceedings of the 2013 ACM international joint conference on Pervasive and ubiquitous computing. [S.l]: ACM, 2013: 3-12.
[12] BARABASI A L. Bursts: the hidden patterns behind Everything we do, from your E-mail to bloody crusades[M]. New York: Plume Books, 2010.
[13] YANG Z, YUAN N J, XIE X, et al. Indigenization of Urban Mobility[EB/OL]. [2014-10-12]. http://arxiv.org/ pdf/1405.7769.
[14] BROCKMANN D, HUFNAGEL L, GEISEL T. The scaling laws of human travel[J]. Nature, 2006(439): 462-465.
[15] GONZáLEZ M C, HIDALGO C A, BARABáSI A L. Understanding individual human mobility patterns[J]. Nature, 2008, 453(7196): 779-782.
[16] SONG C, KOREN T, WANG P, et al. Modelling the scaling properties of human mobility[J]. Nat Phys, 2010(6): 818-823.
[17] CHO E, MYERS S A, LESKOVEC J. Friendship and mobility: user movement in location-based social networks [C]//Proceedings of the 17th ACM SIGKDD international conference on knowledge discovery and data mining. [S.l]: ACM, 2011: 1082-1090.
[18] HAN Xiao-pu, HAO Qiang, WANG Bing-hong, et al. Origin of the scaling law in human mobility: Hierarchy of traffic systems[J]. Phys Rev E, 2011, 83(3): 036117.
[19] YAN X Y, HAN X P, WANG B H, et al. Diversity of individual mobility patterns and emergence of aggregated scaling laws[J]. Scientific Reports, 2013, 3: 2678.
[20] SCHNEIDER C M, BELIK V, COURONNE T, et al. Unravelling daily human mobility motifs[J]. Journal of The Royal Society Interface, 2013, 10(84): 20130246.
[21] SONG C, QU Z, BLUMM N, et al. Limits of predictability in human mobility[J]. Science, 2010, 327(5968): 1018- 1021.
[22] MONREALE A, PINELLI F, TRASARTI R, et al. WhereNext: a location predictor on trajectory pattern mining[C]//Proceedings of the 15th ACM SIGKDD international conference on knowledge discovery and data mining. [S.l]: ACM, 2009: 637-646.
[23] 朱寅, 楊強. 諾基亞移動數(shù)據(jù)挖掘競賽[J]. 中國計算機學(xué)會通訊, 2012, 8(8): 67-70.
ZHU Yin, YANG Qiang. Nokia mobile data challenge[J]. Communications of the Chinese Computer Federation, 2012, 8(8): 67-70.
[24] GAMBS S, KILLIJIAN M O, DEL PRADO CORTEZ M N. Next place prediction using mobility markov chains[C] //Proceedings of the First Workshop on Measurement, Privacy, and Mobility. [S.l]: ACM, 2012: 3.
[25] NOULAS A, SCELLATO S, LATHIA N, et al. Mining user mobility features for next place prediction in location-based services[C]//ICDM. [S.l.]: [s.n.], 2012, 12: 1038-1043.
[26] LU Xin, BENGTSSON L, HOLME P. Predictability of population displacement after the 2010 Haiti earthquake[J]. Proc Natl Acad Sci, 2012, 109(29): 11576-11581.
[27] GALLOTTI R, BAZZANI A, ESPOSTI M D, et al. Entropic measures of individual mobility patterns[J]. Journal of Statistical Mechanics: Theory and Experiment, 2013(10): P10022.
[28] BAUMANN P, KLEIMINGER W, SANTINI S. The influence of temporal and spatial features on the performance of next-place prediction algorithms[C] //Proceedings of the 2013 ACM International Joint Conference on Pervasive and Ubiquitous Computing. [S.l]: ACM, 2013: 449-458.
[29] LU Xin, WETTER E, BHARTI N, et al. Approaching the limit of predictability in human mobility[J]. Scientific Report, 2013(3): 2923.
[30] LAHERRERE L, SORNETTE D. Stretched exponential distributions in nature and economy: “fat tails” with characteristic scales[J]. Euro Phys J B, 1998, 2: 525.
[31] ZHOU T, WANG B H, JIN Y D, et al. Modelling collaboration networks based on nonlinear preferential attachment[J]. Int J Mod Phys C, 2007, 18: 297-314.
[32] SHANG Ming-sheng, Lü Lin-yuan, ZHANG Yi-cheng, et al. Empirical analysis of web-based user-object bipartite networks[J]. Europhys Lett, 2010(90): 48006.
[33] GOH K I, BARABASI A L. Burstiness and memory in complex systems[J]. Europhys Lett, 2008(81): 48002.
[34] YAN Xiao-yong, HAN Xiao-pu, ZHOU Tao, et al. Exact solution of the gyration radius of an individual’s trajectory for a simplified human regular mobility model[J]. Chin Phys Lett, 2011, 28(12): 120506.
編 輯 蔣 曉
Predictability and Influential Factors on Check-in Behaviors
LU Yang1, FAN Chao1,2, HAN Xiao-pu3, and RONG Zhi-hai1
(1. CompleX Lab, Web Sciences Center, University of Electronic Science and Technology of China Chengdu 611731; 2. College of Arts and Sciences, Shanxi Agricultural University Taigu Shanxi 030801; 3. Institute of Information Economy and Alibaba Business College, Hangzhou Normal University Hangzhou 310036)
The human mobility pattern in ordinary life is influenced by various factors. Two datasets of location information reported by mobile phones are utilized to analyze the spatial mobility pattern of check-in behavior. Our research focuses on the impacts of the numbers of visited locations, average jump distances, radiuses of gyration and most frequent visited locations on the predictability of check-in behavior. It is found that the check-in behavior shows certain memory effect. The numbers of visited locations and the visiting patterns to the most frequent visited locations have more significant influence on the predictability and regularity of check-in behavior, meanwhile the impacts of radiuses of gyration and the average jump distances are obviously unremarkable.
check-in behavior; entropy; human dynamics; predictability; spatial mobility pattern
N94
A
10.3969/j.issn.1001-0548.2015.02.001
2014-08-21;
2015-01-26
國家自然科學(xué)基金(61473060,11205040);CCF-騰訊犀牛鳥科研基金.
盧揚(1991-),女,碩士生,主要從事人類動力學(xué)方面的研究.