劉彩紅, 魏戰(zhàn)爭(zhēng)
(1.漯河職業(yè)技術(shù)學(xué)院, 河南 漯河 462002; 2.駐馬店財(cái)經(jīng)學(xué)校, 河南 駐馬店 463000)
幾種網(wǎng)絡(luò)用戶行為模型的對(duì)比研究
劉彩紅1, 魏戰(zhàn)爭(zhēng)2
(1.漯河職業(yè)技術(shù)學(xué)院, 河南 漯河 462002; 2.駐馬店財(cái)經(jīng)學(xué)校, 河南 駐馬店 463000)
無(wú)論是個(gè)體還是群體,驅(qū)動(dòng)用戶行為的動(dòng)力學(xué)原理是構(gòu)成網(wǎng)絡(luò)用戶行為動(dòng)力模型的基礎(chǔ)。由于行為的復(fù)雜性,在網(wǎng)絡(luò)社區(qū)行為模型構(gòu)建中,常用的研究方法有兩種,即基于事件間隔時(shí)間特性和基于事件空間特性。從研究模型來(lái)看,網(wǎng)絡(luò)行為分析依據(jù)不同的網(wǎng)絡(luò)結(jié)構(gòu)和統(tǒng)計(jì)方法,在模型量化及用戶行為特征量的表征上通過(guò)對(duì)正常行為的建模來(lái)發(fā)現(xiàn)網(wǎng)絡(luò)存在的安全漏洞,并提出積極主動(dòng)的防御對(duì)策。
復(fù)雜網(wǎng)絡(luò);網(wǎng)絡(luò)行為;模型構(gòu)建;對(duì)比研究
人的行為規(guī)律具有社會(huì)學(xué)、醫(yī)學(xué)、心理學(xué)、經(jīng)濟(jì)學(xué)等多重領(lǐng)域的綜合特征,在復(fù)雜的網(wǎng)絡(luò)社會(huì)中,基于用戶行為模型的構(gòu)建主要集中在時(shí)間、空間維度的對(duì)比分析上。對(duì)于時(shí)間特性的研究,主要側(cè)重于在某一時(shí)間間隔內(nèi)兩個(gè)具有連續(xù)特征的行為事件發(fā)生率,如發(fā)送兩條微博的時(shí)間間隔、連續(xù)兩次訪問同一網(wǎng)站的時(shí)間間隔等;而對(duì)于空間特性的研究,主要從用戶位置的變化探討網(wǎng)絡(luò)用戶的行為特點(diǎn),如以手機(jī)網(wǎng)絡(luò)來(lái)精確定義用戶的空間運(yùn)動(dòng)軌跡和特征等。總體來(lái)看,對(duì)于網(wǎng)絡(luò)用戶行為特性的研究主要集中在冪率特性、區(qū)域特性、重復(fù)特性三個(gè)方面。
對(duì)于網(wǎng)絡(luò)用戶行為的特征研究,主要從時(shí)間、空間兩個(gè)維度來(lái)展開。在時(shí)間維度上,傳統(tǒng)的實(shí)證研究發(fā)現(xiàn),用戶行為具有隨機(jī)性,服從泊松分布特征;但近年來(lái),隨著復(fù)雜網(wǎng)絡(luò)理論研究成果的推出,基于時(shí)間間隔及事件等待間隔的行為特征服從冪率分布,即p(τ)-τ-α,也就是說(shuō),對(duì)于行為特征既有長(zhǎng)時(shí)間的靜默,也有短時(shí)間的陣發(fā)。與傳統(tǒng)泊松分布相比,冪率分布在衰減速度上較慢,且出現(xiàn)較大概率值的可能性要高于泊松分布;Oliveira等人以電子郵件發(fā)送為例,指出收發(fā)郵件的時(shí)間間隔服從冪率分布;國(guó)內(nèi)學(xué)者在對(duì)錢學(xué)森、傅雷、魯迅等人的郵件記錄進(jìn)行分析時(shí)發(fā)現(xiàn)其也服從冪率分布特征。網(wǎng)絡(luò)互聯(lián)帶來(lái)的移動(dòng)通信服務(wù),讓更多的人能夠隨時(shí)隨地登陸網(wǎng)絡(luò)并使用網(wǎng)絡(luò)。周濤等人通過(guò)Netflix網(wǎng)絡(luò)對(duì)448235名用戶觀看同一電影的時(shí)間間隔分布進(jìn)行分析,得出用戶點(diǎn)擊電影的時(shí)間間隔服從冪率分布,并提出活躍度概念,用以表征用戶在某段時(shí)間內(nèi)的點(diǎn)擊行為總數(shù);Vazquez等人通過(guò)對(duì)圣母大學(xué)圖書館借閱行為進(jìn)行研究,從書籍的簽出到期刊歸還記錄,其時(shí)間差也服從冪率指數(shù)。在空間特性研究中,用戶行為的位置信息與時(shí)間信息相比更具隱秘性。有學(xué)者利用現(xiàn)代科技來(lái)對(duì)微生物、海洋生物等運(yùn)動(dòng)行為進(jìn)行實(shí)證記錄,發(fā)現(xiàn)這些生物在空間上也服從冪率分布;Brockmann等人通過(guò)電子支票來(lái)分析人的空間行為,也有學(xué)者利用手機(jī)的精確定位同樣發(fā)現(xiàn)人類空間運(yùn)動(dòng)服從冪率分布。另外,在人類行為軌跡統(tǒng)計(jì)中,對(duì)于某一特定行為具有重復(fù)性,而不是隨機(jī)性;Barabasi在其著作《Burst》中提出,93%的人類活動(dòng)具有可預(yù)測(cè)性。
2.1 優(yōu)先排隊(duì)量化模型
Barabasi是最早提出優(yōu)先排隊(duì)模型的,并利用具體任務(wù)的優(yōu)先級(jí)來(lái)進(jìn)行不同場(chǎng)景、不同視角的分析。在優(yōu)先級(jí)排隊(duì)模型中,對(duì)于網(wǎng)絡(luò)用戶行為的復(fù)雜性,主要從假設(shè)中加以簡(jiǎn)化。如利用時(shí)間離散化,將連續(xù)的行為按照時(shí)間間隔來(lái)分解;利用單位化處理時(shí)間作為某一離散任務(wù)的處理過(guò)程;對(duì)于任務(wù)隊(duì)列保持永不停止的狀態(tài);對(duì)于生產(chǎn)者、消費(fèi)者都處于不停執(zhí)行任務(wù)的狀態(tài);對(duì)于任務(wù)選擇基于三種方式,即隨機(jī)法、先來(lái)先服務(wù)、最高優(yōu)先級(jí)服務(wù)。通過(guò)對(duì)優(yōu)先級(jí)模型的假設(shè),在模型建立過(guò)程中,首先每一個(gè)用戶被賦予某一任務(wù),并根據(jù)任務(wù)隊(duì)列被賦予優(yōu)先級(jí)xi(xi∈[0,1]),在任一時(shí)步下,生產(chǎn)者產(chǎn)生新的任務(wù)交給任務(wù)隊(duì)列,消費(fèi)者以概率P來(lái)進(jìn)行優(yōu)先級(jí)任務(wù)選擇,而對(duì)于(1-P)則以隨機(jī)任務(wù)方式進(jìn)行消費(fèi),記錄下本任務(wù)的消費(fèi)時(shí)步;對(duì)于任務(wù)的等待時(shí)間則可以記作“τw=消費(fèi)時(shí)步-生產(chǎn)時(shí)步”;當(dāng)p→1時(shí)表示用戶按照優(yōu)先級(jí)來(lái)選擇任務(wù),通過(guò)模型得出τw的概率分布符合冪率特征;當(dāng)p→0時(shí),表示按照隨機(jī)法進(jìn)行任務(wù)選擇,模型得出τw的概率符合泊松特征。然而,對(duì)于優(yōu)先級(jí)排隊(duì)模型,由于涉及太多假設(shè),削弱了模型的適用性;Vazquez等人利用生產(chǎn)任務(wù)速率θ和消費(fèi)任務(wù)速率λ來(lái)探討任務(wù)隊(duì)列的長(zhǎng)度L,得出當(dāng)L=2時(shí),等待時(shí)間精確為
(1)當(dāng)p→0時(shí),則有
說(shuō)明理論推理與仿真結(jié)果具有一致性,服從指數(shù)衰減下的泊松分布。
(2)當(dāng)p→1時(shí),則有
這時(shí),每個(gè)任務(wù)的等待時(shí)間為1,沒有被消費(fèi)的任務(wù)等待時(shí)間也服從冪率分布。
(3)當(dāng)p<1且為定值時(shí),τw→∞,則可以得到:
2.2 自適應(yīng)興趣驅(qū)動(dòng)模型
對(duì)于網(wǎng)絡(luò)用戶來(lái)說(shuō),很多情況下在參與網(wǎng)絡(luò)行為中是基于事件的興趣驅(qū)動(dòng)。例如,以網(wǎng)絡(luò)娛樂為主的用戶,其上網(wǎng)、收發(fā)郵件、參與社區(qū)討論等行為,并非是建立在任務(wù)優(yōu)先級(jí)上,而是更多地基于人類自身動(dòng)力學(xué)驅(qū)動(dòng)下完成。當(dāng)參與某些行為過(guò)于頻繁時(shí),興趣會(huì)降低;相反,當(dāng)參與行為頻率下降時(shí),興趣會(huì)回升。其模型規(guī)則為:當(dāng)時(shí)間為離散化條件下,在時(shí)步t內(nèi)參與某項(xiàng)事件的概率為r(t),則在t+1時(shí)步下,r(t+1)=α(t)r(t),其中α(t)的表達(dá)式為
有學(xué)者提出基于興趣驅(qū)動(dòng)的非線性遞減函數(shù)行為動(dòng)力模型,表示為
對(duì)于本式中的t-1=Δt,當(dāng)Δt小于閾值時(shí),則重新回到1,其特點(diǎn)在于利用指數(shù)來(lái)調(diào)整冪率分布。
2.3 非齊次泊松模型
在網(wǎng)絡(luò)用戶行為分析中,Malmgren等人提出行為的周期性。如對(duì)于微博娛樂,從時(shí)間上與人的行為具有一定的周期性,如晚上睡前參與網(wǎng)絡(luò)行為,也是符合一些人的行為習(xí)慣的。為此,利用冪率分布,從時(shí)間間隔上引入周期性概念,得出級(jí)聯(lián)式非齊次泊松模型。
我們用pd(t)和pw(t)分布表示兩個(gè)嵌套的周期函數(shù),pd(t)表示一天的概率,pw(t)表示一周的概率。則事件發(fā)生概率ρ(t)表示為
ρ(t)=Nwpd(t)pw(t)
對(duì)于嵌套的泊松過(guò)程,表示某網(wǎng)絡(luò)用戶參與某一事件的概率依賴于另一周期函數(shù),本模型實(shí)質(zhì)上是對(duì)網(wǎng)絡(luò)用戶周期性行為的表述,即每一周的某一固定時(shí)間參與某事件,每一天也是這樣。我們從仿真結(jié)果中發(fā)現(xiàn),對(duì)于網(wǎng)絡(luò)用戶中的周期性行為,其時(shí)間間隔具有長(zhǎng)尾冪率現(xiàn)象,說(shuō)明該模型解釋了某一連續(xù)時(shí)間段上的網(wǎng)絡(luò)行為具有周期性特征。
2.4 其他模型
從用戶行為動(dòng)力學(xué)入手來(lái)探討網(wǎng)絡(luò)用戶行為模型,很多學(xué)者從時(shí)間特性上來(lái)構(gòu)建模型,除了上述幾種模型之外,還有Gotz利用隨機(jī)游走理論來(lái)構(gòu)建人類行為模型,并從實(shí)證中來(lái)挖掘用戶的行為表征,進(jìn)一步細(xì)化模型參數(shù);閆強(qiáng)等人在興趣模型基礎(chǔ)上發(fā)現(xiàn),用戶獲得的關(guān)注是驅(qū)動(dòng)用戶網(wǎng)絡(luò)行為的重要因素;在不同場(chǎng)景下的網(wǎng)絡(luò)用戶行為動(dòng)力學(xué)模型中,Blanchard等人提出截止時(shí)間下用戶動(dòng)力學(xué)模型,并從多個(gè)行為關(guān)系比較中得出,交互行為是驅(qū)動(dòng)行為頻率的重要因素;另外,在基于空間特性的用戶行為模型研究中,Barabasi等人從用戶位置信息變化中提出,不同地域下的人類運(yùn)動(dòng)模型具有層次性,如國(guó)家、省會(huì)城市、中心城市、縣域城市等具有一定的行為層次性。
用戶行為在基于在線網(wǎng)絡(luò)模型構(gòu)建中,除了用戶行為動(dòng)力學(xué)實(shí)證模型之外,以社交網(wǎng)絡(luò)、論壇為代表的在線網(wǎng)絡(luò),其用戶行為建模設(shè)計(jì)需要關(guān)注以下幾個(gè)問題。
一是對(duì)個(gè)體用戶行為內(nèi)在、外在特征量的表征。隨著在線網(wǎng)絡(luò)用戶行為數(shù)據(jù)的劇增,基于多維度視角來(lái)研究用戶行為特征量,需要借助于數(shù)學(xué)理論推導(dǎo)和用戶行為仿真明確表征量問題,如社會(huì)關(guān)注度特征下的用戶興趣、交互式行為研究中不同個(gè)體間的行為研究,不同用戶群體特別是不同分組群體的規(guī)律性行為,群體間如何協(xié)作及制約用戶行為與社交網(wǎng)絡(luò)之間的內(nèi)因、外因關(guān)系等。
二是利用在線網(wǎng)絡(luò)中的不同用戶角色,從用戶整個(gè)生命周期探討不同節(jié)點(diǎn)角色的相互關(guān)系。有學(xué)者提出,社交網(wǎng)絡(luò)中的節(jié)點(diǎn)角色發(fā)現(xiàn)是進(jìn)行用戶行為分析的核心,角色發(fā)現(xiàn)與社團(tuán)發(fā)現(xiàn)之間存在關(guān)聯(lián),社團(tuán)發(fā)現(xiàn)是基于社會(huì)行為的抱團(tuán)行為,旨在表征社團(tuán)中緊密關(guān)聯(lián)的群體人的角色特征;同樣,在不同社團(tuán)群體內(nèi)部,也常常存在相同角色的個(gè)體,如擁有兩個(gè)員工的老板與擁有兩個(gè)客戶的推銷員,在節(jié)點(diǎn)角色扮演上具有相似的網(wǎng)絡(luò)行為。
三是話題發(fā)現(xiàn)與演化。從在線網(wǎng)絡(luò)用戶行為分析上,對(duì)于用戶以往行為的梳理與歸結(jié),相對(duì)于新的網(wǎng)絡(luò)應(yīng)用及服務(wù),能夠?qū)τ脩粜袨檫M(jìn)行預(yù)測(cè)和評(píng)斷。如在某社交網(wǎng)絡(luò)中,以信息傳播為載體的人際溝通,以發(fā)表個(gè)人觀點(diǎn)、融入社會(huì)大眾的參與互動(dòng)為主要方式,而由于人的行為與思想具有復(fù)雜性,在社交網(wǎng)絡(luò)中的行為趨向受到更多輿論信息的影響。因此,還需要從傳播動(dòng)力學(xué)、演化跟蹤等統(tǒng)計(jì)方法中引入特征的概率分布,來(lái)構(gòu)建不同話題模型的動(dòng)態(tài)特征權(quán)重,進(jìn)而實(shí)現(xiàn)話題的演化與漂移。常用的演化方法有兩個(gè):一是自然語(yǔ)言方法,憑借信息抽取技術(shù),以文字間的話題關(guān)聯(lián)為表達(dá)、傳播、擴(kuò)散特征;二是機(jī)器學(xué)習(xí)技術(shù),通過(guò)關(guān)聯(lián)度分析、文本聚類、分類預(yù)測(cè)等算法實(shí)現(xiàn)話題的形成和演化。
在網(wǎng)絡(luò)用戶行為模型的探討中,隨著在線社交網(wǎng)絡(luò)的發(fā)展,基于用戶行為的數(shù)據(jù)挖掘及關(guān)系算法是催生建模理論的重要驅(qū)動(dòng)力,而在網(wǎng)絡(luò)用戶行為模型各個(gè)特征量的表征上,隨著網(wǎng)絡(luò)用戶數(shù)據(jù)規(guī)模的擴(kuò)大,還需要從多維度、細(xì)粒度、動(dòng)態(tài)分析上進(jìn)行理論推導(dǎo)和實(shí)證仿真研究,尤其是對(duì)于個(gè)體、群體間的行為特征量的細(xì)化,從用戶思想、習(xí)慣及社會(huì)角色扮演中梳理更為精確的用戶特性,為后續(xù)研究提供參考。
[1] 張仕斌,肖姍,昌燕,閆麗麗.基于云模型理論的網(wǎng)絡(luò)用戶行為評(píng)判模型研究[J].小型微型計(jì)算機(jī)系統(tǒng), 2013(10).
[2]BarabásiAlbert-László.Theoriginofburstsandheavytailsinhumandynamics[J].Nature,2005,435(7039):207-211.
[3] 王小軍,顏嘉元,周涌杰,吳玉杰.網(wǎng)絡(luò)行為分析監(jiān)控系統(tǒng)研究與設(shè)計(jì)[J]. 杭州電子科技大學(xué)學(xué)報(bào), 2012(1).
[責(zé)任編輯 吳??黓
Comparative Study on Several Network User Behavior Models
LIU Cai-hong1, WEI Zhan-zheng2
(1.Luohe Vocational Technology College, Luohe 462000, China;2. Zhumadian Finance & Economics School, Zhumadian 463000, China)
Whether it is an individual or group, the dynamics principle of driving user behavior is the foundation of network user behavior dynamic model. Because of the complexity of the behavior, there are always two research methods in network community behavior model building: one is based on the time between events and the space of events. From the research model, the analysis of network behavior according to the different network structure and the statistical method, on the quantification of models and the characteristic quantities of user behavior, and by modeling the normal behavior to discover the network security vulnerabilities. It will have a very important practical significance to put forward proactive defense countermeasure.
complex network; network behavior; model building; contrastive research
2016-12-19
劉彩紅(1976-),女,河南臨潁人,碩士研究生,講師,研究方向:計(jì)算機(jī)應(yīng)用。
10.3969/j.issn.1671-7864.2017.02.007
TP393.06
A
1671-7864(2017)02-0024-03
漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào)2017年2期