羅偉平+楊建梅
摘要:對于大眾生產(chǎn)的人類行為動力學的研究還不多。本文基于Barabasi的任務優(yōu)先權排隊模型,研究Android開源社區(qū)的大眾生產(chǎn)與溝通行為,發(fā)現(xiàn)加入后位優(yōu)先權增加的機制或者中斷機制的Barabasi優(yōu)先權排隊模型,更能解釋該社區(qū)人類行為模式的生成機制。
關鍵詞:開源社區(qū);生產(chǎn)行為;溝通行為;人類行為動力學;任務優(yōu)先權排隊模型
中圖分類號:文獻標志碼:A文章編號:1009-055X(2016)06-0047-05
doi:10.19366/j.cnki.1009-055X.2016.06.008
一、引言
人類行為是復雜的。對人類行為研究涵蓋了心理學、社會學、人類學及統(tǒng)計學等諸多學科。[1]以往認為人的相鄰兩個行為的間隔時間服從指數(shù)分布。[3]因特網(wǎng)協(xié)議、路由器規(guī)則等都是以泊松過程為基礎設計的。[4]然而近期的人類行為的數(shù)據(jù)顯示,人的相鄰兩個行為的間隔時間并不服從泊松分布,而是服從長尾的冪律分布。2005年Barabasi提出了人類行為的冪律分布以及生成機制的任務優(yōu)先權排隊模型[5]開創(chuàng)了人類行為動力學研究的先河。隨后Vazquez[6]等提出人類行為冪指數(shù)有1和1.5兩個普適類。名人通信[7-8]、在線游戲[9]、電影點播[10]、打電話與發(fā)短信等人類行為的間隔時間的分布均顯示出冪率現(xiàn)象。當然人類行為的時間間隔特性也存在其他分布的情況。[11-15]
學術界還進一步研究了人類行為冪率分布的生成機制。除了Barabasi的優(yōu)先權排隊模型外,還有自適應調(diào)節(jié)模型[16]、習慣模型[17]、記憶模型[20]、興趣衰減模型[19-20]、截止時間模型[21,22]以及互動[23]模型等。
目前人類行為動力學的研究還較少涉及大眾生產(chǎn)領域。[24]本文基于Barabasi的任務優(yōu)先權排隊模型,分析Android開源社區(qū)的大眾生產(chǎn)與溝通行為,發(fā)現(xiàn)加入后位優(yōu)先權增加或中斷機制后的Barabasi模型更能解釋該社區(qū)生產(chǎn)與溝通行為的生成機制。
二、Android社區(qū)大眾生產(chǎn)與溝通行為的分析
(一)數(shù)據(jù)來源及處理
利用火車頭(LocoyPlatform)數(shù)據(jù)采集平臺,在googlecodehost的Android開源社區(qū)采集了16萬多條生產(chǎn)行為的時間數(shù)據(jù)和28萬多條溝通行為的時間數(shù)據(jù)。這里的生產(chǎn)行為定義為代碼的修改和提交行為,溝通行為定義為發(fā)帖或評論帖子行為。
(二)生產(chǎn)行為的間隔時間分布
按照生產(chǎn)次數(shù)的多少篩選出排名前十位的生產(chǎn)者,分別對其生產(chǎn)的間隔時間分析如表1和圖2所示。發(fā)現(xiàn)這些生產(chǎn)者的生產(chǎn)間隔時間服從冪律分布,冪指數(shù)在1.21與1.73之間,接近于Vazquez等提出的普適類指數(shù)1.5。
(三)溝通行為的間隔時間分布
同樣取溝通次數(shù)最多的前十名溝通者進行溝通的間隔時間分析,如表2和圖2所示,發(fā)現(xiàn)溝通的間隔時間同樣服從冪律分布,冪指數(shù)在1.33與1.57之間,更接近Vazquez等提出的普適指數(shù)1.5。
綜上,Android開源社區(qū)的生產(chǎn)和溝通行為的間隔時間均服從冪律分布,冪指數(shù)接近Vazquez等提出的普適類指數(shù)1.5。
三、生成機制研究
Barabasi的任務優(yōu)先權排隊模型假設優(yōu)先權始終不變,而現(xiàn)實中有些后位任務的優(yōu)先權會隨著時間的推移而增加(這里稱之為后位優(yōu)先權增加機制)。此外,現(xiàn)實中往往也會出現(xiàn)緊急的任務打斷優(yōu)先權最高任務的處理(這里稱為中斷機制)。
下面在Barabasi優(yōu)先權排隊模型的基礎上,分別加入后位優(yōu)先權增加機制和中斷機制來探討Android開源社區(qū)的生產(chǎn)和溝通行為。
(一)加入后位優(yōu)先權增加機制的仿真模型
加入后位優(yōu)先權增加機制模型的具體做法是,在保持任務隊列優(yōu)先權基本模型各個參數(shù)不變的前提下,在每一個更新時點,給任務隊列中比例為m(0 在m=1%、b為0.001,0.002,0.005,0.01的四種情形下,仿真出的生產(chǎn)與溝通行為的間隔時間均服從冪律分布,擬合優(yōu)度均在0.92以上;四種情況對應的冪指數(shù)分別為1.7,1.5,1.4和1.2,與上文的實際間隔時間分布非常接近。值得注意的是,隨著b的增加,冪指數(shù)不斷減??;且b增加到一定程度后,時間間隔就不符合冪律分布了。如圖3所示。 (二)加入中斷機制的仿真模型 隊列優(yōu)先權基本模型中,在每一步任務執(zhí)行方式中,Barabasi討論了三種任務執(zhí)行選擇機制:先進先出,隨機選擇和優(yōu)先權選擇,他認為按照優(yōu)先權選擇最重要,因此在模型設定時,增加了參數(shù)p來描述每一步任務執(zhí)行時按照優(yōu)先權選擇的概率,當p→1時,即表示完全按照優(yōu)先權最高的方式來執(zhí)行,當p→0時,即表示按照隨機選擇的方式來執(zhí)行任務??紤]任務的執(zhí)行方式選擇中,基本模型或者按照一定概率的優(yōu)先權來執(zhí)行,或者按照隨機的方式執(zhí)行,圍繞的原則僅有優(yōu)先權和隨機兩種選擇方式,最終的基本模型是以p→1時,即完全按照優(yōu)先權最高的方式來執(zhí)行,模型中并未考慮任務生成的時間先后順序這一情形。 按照時間管理的概念,人的活動任務均會按照“輕重緩急”的程度分為四類,一般的做法是按照最重要的事情先處理,然后處理次重要的事情。但與現(xiàn)實中的情形更為接近的是,經(jīng)常會出現(xiàn)一些突發(fā)的緊急事件,需要我們拋開當前認為最重要的事情,轉而去處理該類緊急事情,也即最新發(fā)生的事情。從另一方面來說,生活中,并不是每個人都能很好地執(zhí)行輕重緩急的時間管理概念。更多的情形是,人們會被當前剛發(fā)生的事情所打斷,轉而去處理最新發(fā)生的需要處理的事情,這一特點,更符合現(xiàn)實中的普通大眾行為。因此為了讓模型更加貼近現(xiàn)實情況,本文在基本模型的基礎上,加入中斷機制,以描述在優(yōu)先權的任務執(zhí)行方式中,偶爾會被最新出現(xiàn)的事情所打斷,轉而處理最新生成的任務。
仿真步驟如下:①設定優(yōu)先任務被中斷的概率Q。②按照均勻分布生成隨機數(shù)作為概率q,當q>Q時,執(zhí)行任務隊列中的優(yōu)先任務,當q 在Q=20%的情形下,仿真結果顯示,加入中斷機制的間隔時間符合冪指數(shù)為1.5的冪律分布,擬合優(yōu)度達到0.97。如圖4所示。同樣也與上節(jié)的實證結果較一致。 四、結束語 本文分析了Android社區(qū)中的人類行為動力學模式,發(fā)現(xiàn)生產(chǎn)和溝通行為的間隔時間服從冪律分布,其冪指數(shù)接近于Vazquez等提出的普適類。同時也探討了該社區(qū)人類行為的動力學機制,發(fā)現(xiàn)加入后位優(yōu)先權增加機制或中斷機制能較好地解釋這些行為的生成機制。 參考文獻: [1]樊超,郭進利,韓筱璞,等.人類行為動力學研究綜述[J].復雜系統(tǒng)與復雜性科學,2011(2):1-2. [2]FELLERW.Anintroductiontoprobabilitytheoryanditsapplications[M].2rd,ed.NewYork:Wiley,1971. [3]HAIGHTAK.Handbookofthepoissondistribution[M].NewYork:Wiley,1967. [4]ANDERSONHR.Fixedbroadbandwirelesssystemdesign[M].NewYork:Wiley,2003. [5]BARABASIAL.Theoriginofburstandheavytailsinhumandynamics[J].Nature,2005,435:207-211. [6]VAZQUEZA,OLIVEIRAJG,DEZSOZ,etal.Modelingburstsandheavytailsinheavytailsinhumandynamics[J].PhysicalReviewE,2006,73(3):036127. [7]OLIVEIRAJG,BARABASIAL.Humandynamics:darwinandeinsteincorrespondencepatterns[J].Nature,2005,437:1251-1253. [8]LINannan,ZHOUTao.Empiricalanalysisontemporalstatisticsofhumancorrespondencepatterns[J].PhysicaA,2008,387:6391-6394. [9]HENDERSONT,NHATTIS.Modelinguserbehaviorinnetworkedgames[C].Proc9thACMInternationalConferenceonMultimedia.NewYork:ACMPress,2001:212. [10]ZHOUTao,KIETHAT,KIMB.J,etal.Roleofactivityinhumandynamics[J].Europhysicsletters,2008,82(2):28002. [11]胡海波,王林.冪律分布研究簡史[J].物理,2005(12):889-896. [12]RABERTOM,SCALASE,MAINARDIF.Waiting-timesandreturnsinhighfrequencyfinancialdata:anempiricalstudy[J].PhysicaA,2002,314:749-755. [13]QINW,JIN-LiG.Humandynamicsscalingcharacteristicsforaerialinboundlogisticsoperation[J].PhysicaA,2010,389:2127-2133. [14]YEW,CHANGSZ,Jing-HuaXiao,etal.Evidenceforabimodaldistributioninhumancommunication[J].PNSA,2010,107(44):18803-18808. [15]MAINARDIF,RABERTOM,GORENFLOR,etal.FractionalcalculusandcontinuoustimefinanceⅡ:thewaitingtimedistribution[J].PhysicaA,2000,287:4680481. [16]韓筱璞,周濤,汪秉宏.基于自適應調(diào)節(jié)的人類動力學模型[J].復雜系統(tǒng)與復雜性科學,2007(4):1-5 [17]焦玉,劉衍珩,王健,等.基于習慣的人類動力學建模[J].科學通報,2010,(11):1070-1076 [18]VAZQUEZ.A.Impactofmemoryonhumandynamics[J].PhysicaA,2007,373:747-752. [19]JINLG,CHAOF.Weblogpatternsandhumandynamicswithdecreasinginterest[J].TheEuropeanPhysicalJournalB,2010,1008:0042v3. [20]郭進利.博客評論的人類行為動力學實證研究和建模[J].計算機應用研究,2011(4):1422-1433. [21]鄧竹君,張寧,李季明.截止時間對人類動力學模型的影響[M]∥郭進利,周濤,張寧,等.人類行為動力學模型.香港:上海系統(tǒng)科學出版社,2008:29-34. [22]ALFIV,GABRIELLIA,PietroneroL.Howpeoplereacttoadeadlinetimedistributionofconferenceregistrationsandfeepayments[J].CentralEuropeanJournalofPhysics,2009,7(3):483-489. [23]OLIVEIRAJG,VAZQUEZA.Impactofinteractionsonhumandynamics[J].PhysicaA,2009,(388):187-192. [24]謝偉聰,楊建梅.維基百科貢獻者中的人類動力學模式[J].科學學研究,2010,28(10):1054-1058. Abstract:Toourbestofknowledge,therearefewresearchesfocusedonhumandynamicsofpeerproduction.BasedontheBarabasipriorityqueuemodel,thisessaydiscussesproductionandcommunicationbehaviorsinAndroidopensourcecommunity,findingthattheBarabasipriorityqueuemodelexpandedwithtailacceleratingorqueueinterruptionbetterexplainsthegenerativemechanismofhumanbehaviorsinthiscommunity. Keywords:opensourcecommunity;productionbehaviors;communicationbehaviors;humandynamics;priorityqueuemodel (責任編輯:潘江曼鄧澤輝)