張文杰,穆海冰,張長(zhǎng)倫
(1.北京交通大學(xué) 通信與信息系統(tǒng)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100044;2.北京建筑工程學(xué)院 理學(xué)院,北京 100044)
微博作為一種新興的開(kāi)放互聯(lián)網(wǎng)社交服務(wù)工具,具有獨(dú)特的傳播特征和強(qiáng)大的傳播能量。它以發(fā)布便捷、時(shí)效性、交互性強(qiáng)等特點(diǎn)吸引了強(qiáng)大的用戶群體。微博信息的轉(zhuǎn)發(fā)是很復(fù)雜的演化過(guò)程,綜合考慮微博網(wǎng)絡(luò)中的信息傳播規(guī)則和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)2個(gè)角度,構(gòu)建基于微博網(wǎng)絡(luò)的信息傳播模型,準(zhǔn)確模擬信息在實(shí)際微博拓?fù)渥泳W(wǎng)中的信息流向,研究微博網(wǎng)絡(luò)中信息的傳播性質(zhì)和規(guī)律,對(duì)網(wǎng)絡(luò)輿論的預(yù)測(cè)、引導(dǎo)具有非常重要的理論價(jià)值和現(xiàn)實(shí)意義。
微博網(wǎng)絡(luò)中用戶的個(gè)性對(duì)微博的轉(zhuǎn)發(fā)具有不可忽視的影響作用,本文將用戶個(gè)性作為影響因素納入到傳播模型中,研究不同比例混合群體構(gòu)成的網(wǎng)絡(luò)中信息的傳播性質(zhì)并對(duì)仿真結(jié)果進(jìn)行分析。
信息傳播的過(guò)程是在以個(gè)體為節(jié)點(diǎn)、以連接為邊的復(fù)雜網(wǎng)絡(luò)中信息的復(fù)制、轉(zhuǎn)移、變化和擴(kuò)散的過(guò)程。實(shí)證的研究表明基于用戶個(gè)體交互規(guī)則的概率影響模型很適合描述實(shí)際的傳播過(guò)程,其基本假設(shè)是:用戶個(gè)體可能在人際關(guān)系網(wǎng)絡(luò)中其它鄰居用戶的影響下加入信息的傳播,并且這種影響關(guān)系是概率方式,即每一個(gè)加入傳播的個(gè)體都以一定的概率影響其鄰居加入傳播。實(shí)際建模過(guò)程中一般會(huì)根據(jù)需要在影響模型中考慮具體的影響因素,并設(shè)定一定的人際網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),對(duì)傳播的范圍、時(shí)間、持續(xù)性等特征進(jìn)行研究。
在傳染病動(dòng)力學(xué)研究中,通過(guò)構(gòu)建個(gè)體交互概率影響模型來(lái)描述傳染病的擴(kuò)散過(guò)程。現(xiàn)有的研究中,很多是借鑒傳染病模型,結(jié)合具體網(wǎng)絡(luò)的特性對(duì)模型改進(jìn),研究用戶節(jié)點(diǎn)狀態(tài)隨時(shí)間的演化關(guān)系。劉俊[1]在基于不同網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的E-mail病毒傳播模型研究的基礎(chǔ)上,針對(duì)網(wǎng)絡(luò)拓?fù)涞木鶆蛐院腿鄙倮碚撘罁?jù)兩方面的不足,提出了無(wú)標(biāo)度網(wǎng)絡(luò)環(huán)境下E-mail病毒的傳播模型,通過(guò)對(duì)模型的求解,得到E-mail用戶感染密度隨傳播率、恢復(fù)率和網(wǎng)絡(luò)平均度變化的計(jì)算表達(dá)式,并通過(guò)實(shí)驗(yàn)證明了傳播率與網(wǎng)絡(luò)平均度是影響E-mail病毒蔓延的關(guān)鍵性因素。張彥超[2]構(gòu)造基于在線社交網(wǎng)絡(luò)的信息傳播模型,模型考慮節(jié)點(diǎn)度和傳播機(jī)理的影響,結(jié)合復(fù)雜網(wǎng)絡(luò)和傳染病動(dòng)力學(xué)理論,建立動(dòng)力學(xué)演化方程組,刻畫(huà)不同類(lèi)型節(jié)點(diǎn)隨著時(shí)間的演化關(guān)系,分析其在網(wǎng)絡(luò)的行為規(guī)律。許曉東[3]根據(jù)微博社區(qū)網(wǎng)絡(luò)呈現(xiàn)短平均路徑、度分布指數(shù)為常值、信息傳播有向的特性,結(jié)合文獻(xiàn)[1]中病毒傳播的相關(guān)算法,將網(wǎng)絡(luò)中的節(jié)點(diǎn)按照其度值進(jìn)行分類(lèi),建立微博社區(qū)謠言傳播模型研究謠言在網(wǎng)絡(luò)中的傳播機(jī)理,研究表明謠言傳播受有效傳染率和網(wǎng)絡(luò)度分布熵影響。楊春霞[4]借鑒SIR模型,針對(duì)微博病毒傳播的有向性在有向無(wú)標(biāo)度網(wǎng)絡(luò)上建立微博病毒的仿真模型,將傳播過(guò)程分為自由傳播階段和警告抑制階段,研究用戶點(diǎn)擊率、轉(zhuǎn)發(fā)率以及對(duì)信息的反應(yīng)速度等因素對(duì)病毒傳播的影響。
在基于用戶個(gè)體交互規(guī)則的概率影響模型中,個(gè)體間的作用規(guī)則和影響因素的定義至關(guān)重要,但現(xiàn)有的研究對(duì)于如何定義作用規(guī)則和影響因素還沒(méi)有達(dá)成一定的共識(shí)。丁飛[5]對(duì)輿論事件中參與個(gè)體的交互過(guò)程進(jìn)行建模,采用Multi-Agent方法對(duì)提出的模型進(jìn)行仿真,研究輿論事件之間的競(jìng)爭(zhēng)和影響關(guān)系。孫慶川[6]對(duì)傳播規(guī)則和傳播網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行限定,建立人際網(wǎng)絡(luò)傳播模型的五元組,并在計(jì)算機(jī)上模擬,發(fā)現(xiàn)存在信息傳播臨界值, 當(dāng)信息吸引力大于臨界值時(shí)信息才能傳播開(kāi),否則幾乎不能傳播。劉豐[7]參照文獻(xiàn)[6]提出的信息傳播模型五元組,在微博環(huán)境下,分別根據(jù)用戶關(guān)系、用戶關(guān)系的度量、用戶的轉(zhuǎn)發(fā)行為、用戶及微博項(xiàng)的特征相應(yīng)的生成網(wǎng)絡(luò)底圖、節(jié)點(diǎn)間信息親和力、節(jié)點(diǎn)的信息接受能力、節(jié)點(diǎn)的信息傳播能力,構(gòu)建信息傳播模型五元組,模擬信息在微博中的傳播過(guò)程。鄭蕾[8]通過(guò)對(duì)參數(shù)設(shè)置決定選擇轉(zhuǎn)發(fā)信息的節(jié)點(diǎn)方式,構(gòu)建一種新的基于微博網(wǎng)絡(luò)的信息傳播模型,并在新浪微博拓?fù)渥泳W(wǎng)中模擬信息流向,得出明星用戶在信息擴(kuò)散中的意見(jiàn)領(lǐng)袖作用隨著信息敏感度的增加逐漸弱化的結(jié)論。
這些實(shí)證研究表明,通過(guò)基于用戶個(gè)體交互規(guī)則的概率影響模型來(lái)描述復(fù)雜網(wǎng)絡(luò)特別是互聯(lián)網(wǎng)的傳播過(guò)程是可行的。到目前為止,研究者們對(duì)這種建模方法達(dá)成了一定的共識(shí),但對(duì)互聯(lián)網(wǎng)中各種復(fù)雜的傳播現(xiàn)象,以及一些重要影響因素對(duì)傳播過(guò)程的影響缺乏足夠的認(rèn)識(shí)。上述部分研究側(cè)重于構(gòu)造傳播背景和環(huán)境,將用戶抽象成無(wú)主觀意識(shí)的節(jié)點(diǎn),忽略了用戶個(gè)性等主觀意識(shí)對(duì)信息傳播造成的影響,本文將用戶個(gè)性作為影響因素納入到模型當(dāng)中,定量分析結(jié)果,來(lái)仿真研究實(shí)際的傳播過(guò)程。
參照文獻(xiàn)[6]提出的傳播模型,針對(duì)微博時(shí)效性強(qiáng)、傳播具有有向性等特點(diǎn),考慮影響傳播過(guò)程具體影響因素,對(duì)模型進(jìn)行一定的改進(jìn)。本文將微博中的用戶抽象成網(wǎng)絡(luò)節(jié)點(diǎn)V,用戶之間的粉絲關(guān)系抽象成邊E,基于一定人際網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的微博拓?fù)渥泳W(wǎng)抽象成信息傳播的空間G=(V,E),采用基于用戶個(gè)體交互規(guī)則的概率影響模型來(lái)模擬微博中信息的傳播過(guò)程。
初始時(shí)刻T=0,隨機(jī)選擇一個(gè)用戶節(jié)點(diǎn),作為發(fā)布微博信息的源節(jié)點(diǎn),T=t時(shí)刻轉(zhuǎn)發(fā)微博信息者的集合為A(t),T=t+1時(shí)刻,一個(gè)不屬于A(t)的個(gè)體會(huì)根據(jù)t時(shí)刻信息的吸引力Φe、受鄰居用戶的影響程度Neiv(t)以及個(gè)體的接受信息臨界值A(chǔ)cpv
(t)來(lái)決定自己在t+1時(shí)刻是否轉(zhuǎn)發(fā)該信息,若滿足轉(zhuǎn)發(fā)條件,則轉(zhuǎn)發(fā)信息,進(jìn)入A(t+1)集合,反之,不轉(zhuǎn)發(fā)信息。
(1)模型中只考慮用戶之間的粉絲關(guān)系存在,忽略這種聯(lián)系的強(qiáng)度。
(2)模型中不區(qū)分用戶節(jié)點(diǎn)的影響力的大小。
(3)模型中假設(shè)信息吸引力只取決于傳播的話題,而無(wú)個(gè)體間差異。
模型是一個(gè)五元組(G, Φe, Acpv(t), w, A(t))。其中,G表示信息傳播空間,Φe表示信息的吸引力,Acpv(t)表示個(gè)體的接受信息臨界值,w表示信息吸引力在影響因素中所占的權(quán)重,A(t)表示轉(zhuǎn)發(fā)微博信息者的集合。
假設(shè)用戶轉(zhuǎn)發(fā)信息受兩種因素影響:
(1)信息的吸引力Φe,Φe∈ [0,1]。由于微博的時(shí)效性、交互性強(qiáng)等特點(diǎn),在不受外界因素影響下,信息吸引力會(huì)逐漸衰減,假設(shè)呈指數(shù)衰減,衰減系數(shù)設(shè)為Decay。
(2)受鄰居用戶的影響程度Neiv(t),具體量化為用戶關(guān)注的人群中轉(zhuǎn)發(fā)信息的人群數(shù)量在關(guān)注人群當(dāng)中所占的比重,即:
其中,Mv(t)={v’|(v’,v)∈ E,v’∈ A(t-1)},douv表示該用戶關(guān)注的人群數(shù)量。
網(wǎng)絡(luò)群體中存在著不同個(gè)性的用戶個(gè)體,為了研究用戶個(gè)性對(duì)信息轉(zhuǎn)發(fā)的影響,將群體中個(gè)體類(lèi)型劃分為:自主型、無(wú)主見(jiàn)型和中立型3類(lèi),將這3類(lèi)個(gè)性納入到傳播模型中,體現(xiàn)為信息吸引力在影響因素中所占的權(quán)重w的不同,分別取值為0.9、0.1和0.5。
新浪微博屬于在線社交網(wǎng)絡(luò)。國(guó)外關(guān)于在線社交網(wǎng)絡(luò)拓?fù)涞膶?shí)證研究表明它具有有向無(wú)標(biāo)度特性,例如4個(gè)受歡迎的在線社交網(wǎng)絡(luò)Orkut,YouTube, Flickr和LiveJournal已被證實(shí)具有有向無(wú)標(biāo)度特性,其用戶的入度與出度都具有冪律特性[9]。國(guó)內(nèi)同樣證實(shí)新浪微博與人人網(wǎng)也具有相同的特性[10]。筆者利用網(wǎng)絡(luò)爬蟲(chóng)到新浪微博爬取數(shù)據(jù),獲得了一個(gè)真實(shí)的關(guān)注微博網(wǎng)絡(luò)邊關(guān)系,得到了具有一定拓?fù)浣Y(jié)構(gòu)的微博拓?fù)渥泳W(wǎng),網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)N=5 906,平均度dout_average=4.5,最大度dout_max=732,度分布指數(shù)為2.36,參數(shù)Decay設(shè)為0.5。網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示,網(wǎng)絡(luò)度分布如圖2所示。度分布函數(shù)P(k)是指任意一個(gè)節(jié)點(diǎn)度為k的概率,其值等于網(wǎng)絡(luò)中度為k的節(jié)點(diǎn)個(gè)數(shù)與網(wǎng)絡(luò)總節(jié)點(diǎn)個(gè)數(shù)的比值。從圖2中可以看出,P(k)服從冪律分布,即P(k)~ k-γ,γ代表度分布指數(shù)。微博拓?fù)渥泳W(wǎng)的度分布指數(shù)符合無(wú)標(biāo)度網(wǎng)絡(luò)度分布指數(shù)介于2和3這一特性。
圖1 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
依據(jù)網(wǎng)絡(luò)中3種類(lèi)型的個(gè)體數(shù)量的不同比例混合,得到4個(gè)不同的網(wǎng)絡(luò),分別為3種類(lèi)型個(gè)體數(shù)量均勻、自主型個(gè)體數(shù)量居多、無(wú)主見(jiàn)型個(gè)體數(shù)量居多、中立型個(gè)體數(shù)量居多。根據(jù)統(tǒng)計(jì)學(xué)中的“二八法則”,任何一組東西中,多數(shù)所占比例為80%,少數(shù)占20%?;诖?,本文將數(shù)量居多的個(gè)體在網(wǎng)絡(luò)中所占比例設(shè)置為80%,其余2種個(gè)體數(shù)量各占10%,具體網(wǎng)絡(luò)中3種類(lèi)型個(gè)體所占比例如表1所示。
圖2 網(wǎng)絡(luò)度分布
表1 3種類(lèi)型個(gè)體在不同網(wǎng)絡(luò)中的比例構(gòu)成
當(dāng)信息吸引力Φe取不同值時(shí),信息在4個(gè)網(wǎng)絡(luò)中傳播結(jié)束時(shí)的擴(kuò)散密度ρ(|A(t)|與傳播空間節(jié)點(diǎn)集合的模的比值)和擴(kuò)散平均度AvgDegree(A(t)中節(jié)點(diǎn)度的平均值)與信息吸引力Φe的關(guān)系分別如圖3、圖4所示。
圖3 4個(gè)網(wǎng)絡(luò)中信息擴(kuò)散密度與信息吸引力的關(guān)系
從4個(gè)網(wǎng)絡(luò)信息擴(kuò)散密度與信息吸引力的關(guān)系比較中,可以看到存在信息吸引力臨界值(擴(kuò)散密度≥0.6的吸引力最小值),當(dāng)信息吸引力大于臨界值時(shí),信息可以在網(wǎng)絡(luò)中大規(guī)模擴(kuò)散,并且由于用戶個(gè)性影響因素的存在,臨界值在不同類(lèi)型個(gè)體居多的網(wǎng)絡(luò)中會(huì)發(fā)生變化;信息在自主型個(gè)體居多的網(wǎng)絡(luò)中擴(kuò)散程度最高,很難在無(wú)主見(jiàn)型個(gè)體居多的網(wǎng)絡(luò)中得到擴(kuò)散,在中立型個(gè)體居多的網(wǎng)絡(luò)和3種類(lèi)型個(gè)體均勻分布的網(wǎng)絡(luò)擴(kuò)散程度相差不大。
從4個(gè)網(wǎng)絡(luò)信息擴(kuò)散平均度與信息吸引力的關(guān)系比較中,擴(kuò)散平均度隨著信息吸引力的增加逐漸趨于穩(wěn)定并接近于整個(gè)網(wǎng)絡(luò)的平均度。自主型個(gè)體居多的網(wǎng)絡(luò)較之于其他3個(gè)網(wǎng)絡(luò),其擴(kuò)散平均度隨著信息吸引力的不同變化較為明顯,對(duì)信息的吸引力較為敏感。
圖4 4個(gè)網(wǎng)絡(luò)中信息擴(kuò)散平均度與信息吸引力的關(guān)系
本文采用基于概率方式的傳播影響模型來(lái)模擬微博信息的轉(zhuǎn)發(fā)過(guò)程,通過(guò)在構(gòu)建的傳播模型中納入用戶個(gè)性這個(gè)影響因素,研究信息在不同比例混合群體構(gòu)成的網(wǎng)絡(luò)中的傳播,得出結(jié)論:將用戶個(gè)性作為影響因素納入到傳播模型中來(lái)模擬信息的傳播過(guò)程是合理的,并且不同個(gè)性用戶對(duì)信息擴(kuò)散的影響作用不同,自主型個(gè)體對(duì)信息擴(kuò)散具有很強(qiáng)的推動(dòng)力,中立型個(gè)體次之,無(wú)主見(jiàn)型個(gè)體最差。由于實(shí)際當(dāng)中微博信息的轉(zhuǎn)發(fā)是一個(gè)很復(fù)雜的演化過(guò)程,其會(huì)受到各種不確定因素的影響,如何結(jié)合實(shí)際將更多的影響因素納入到模型中,使模型更加合理和完善,更準(zhǔn)確地描述信息的傳播過(guò)程,還需要進(jìn)一步研究。相信隨著更多的實(shí)證研究支持,可以為網(wǎng)絡(luò)輿論的預(yù)測(cè)和引導(dǎo)提供更好的支撐。
[1]劉 俊,金 聰,鄧清華.無(wú)標(biāo)度網(wǎng)絡(luò)環(huán)境下E-mail病毒的傳播模型[J].計(jì)算機(jī)工程,2009,35(21):131-133,137.
[2]張彥超,劉 云,張海峰,程 輝,熊 菲.基于在線社交網(wǎng)絡(luò)的信息傳播模型[J].物理學(xué)報(bào),2011,60(5):1-7.
[3]許曉東,肖銀濤,朱士瑞.微博社區(qū)的謠言傳播仿真研究[J].計(jì)算機(jī)工程,2011,37(10):272-274.
[4]楊春霞,胡丹婷,胡 森.微博病毒傳播模型研究[J].計(jì)算機(jī)工程,2012,38(15):100-103.
[5]丁 飛,劉 云,司夏萌,張彥超.輿論話題的傳播與競(jìng)爭(zhēng)[J].系統(tǒng)仿真學(xué)報(bào),2009,21(23):7660-7664.
[6]孫慶川.人際信息傳播模型及其模擬[D].上海:上海大學(xué),2009.
[7]劉 豐.基于微博的突發(fā)事件檢測(cè)和信息傳播建模[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011.
[8]鄭 蕾,李生紅.基于微博網(wǎng)絡(luò)的信息傳播模型[J].通信技術(shù),2012,45(2):39-41.
[9]Mislove A, Marcon M, Gummadi K P, et al. Measure-ment and Analysis of Online Social Networks[C]. Proceedings of the 7th ACM SIGCOMM Conference on Internet Measurement.[S. l.]:ACM Press, 2007.
[10]Fu Feng, Liu Lianghuan, Wang Long. Empirical Analysis of Online Social Networks in the Age of Web 2.0[J]. Physical A, 2008,387(2):675-684.