摘要:[目的/意義]構(gòu)建數(shù)學(xué)模型研究網(wǎng)絡(luò)話題傳播規(guī)律建模和預(yù)測(cè)問(wèn)題,為深入研究網(wǎng)絡(luò)話題傳播規(guī)律提供理論參考。[方法/過(guò)程]定性分析網(wǎng)絡(luò)話題傳播的大數(shù)據(jù)特征、可量化性、可度量周期性、可預(yù)測(cè)性等特征,通過(guò)分析網(wǎng)絡(luò)話題傳播機(jī)理,構(gòu)建網(wǎng)絡(luò)話題傳播規(guī)律的常態(tài)模型和衍生模型,提出劃分網(wǎng)絡(luò)話題傳播階段的一般方法,并據(jù)此研究網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)方法。[結(jié)論/結(jié)果]通過(guò)“霧霾”微博話題數(shù)據(jù)開(kāi)展實(shí)證分析,能夠較好地劃分傳播階段并預(yù)測(cè)傳播趨勢(shì),由此,根據(jù)本文構(gòu)建的數(shù)學(xué)模型研究網(wǎng)絡(luò)話題傳播規(guī)律是可行的。
關(guān)鍵詞:網(wǎng)絡(luò)話題;網(wǎng)絡(luò)輿情;傳播規(guī)律;趨勢(shì)預(yù)測(cè)
DOI:10.3969/j.issn.1008-0821.2019.04.001
〔中圖分類(lèi)號(hào)〕G206〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2019)04-0003-10
Research on Modeling and Prediction of Network Topic Dissemination Law
Xia Yixue
(China Peoples Police University,Langfang 065000,China)
Abstract:[Purpose/Significance]The mathematical model was constructed to study the modeling and prediction of network topic dissemination law,in order to provide theoretical references for further research on the dissemination law of network topic.[Method/Process]This paper qualitatively analyzed the characteristics of big data,quantifiability,measurable periodicity,predictability and other characteristics of network topic dissemination.Through the analysis of network topic dissemination mechanism,the normal model and derivative model of network topic dissemination law were constructed.The general method of dividing the stages of network topic dissemination was put forward and the trend prediction of network topic dissemination was studied.[Result/Conclusion]Through empirical analysis of microblog topic data of“haze”,the dissemination stages could be well divided and the dissemination trend could be predicted.Therefore,it was feasible to study the network topic dissemination law based on the mathematical model established in this paper.
Key words:network topic;network public opinion;dissemination law;trend prediction
自互聯(lián)網(wǎng)逐漸普及以來(lái),網(wǎng)絡(luò)傳播成為與網(wǎng)下傳播相并行的信息傳播形式,并且隨著移動(dòng)社交網(wǎng)絡(luò)的發(fā)展,部分網(wǎng)下傳播遷移網(wǎng)上,網(wǎng)絡(luò)傳播正成為最主要的信息傳播形式。網(wǎng)絡(luò)話題作為網(wǎng)絡(luò)傳播的重要內(nèi)容,是網(wǎng)民針對(duì)某一事件通過(guò)微博、微信、網(wǎng)絡(luò)新聞、網(wǎng)絡(luò)論壇等網(wǎng)絡(luò)傳播平臺(tái)進(jìn)行討論的主題、內(nèi)容以及網(wǎng)民的觀點(diǎn)、態(tài)度等信息的集合。網(wǎng)絡(luò)話題的內(nèi)容涉及國(guó)內(nèi)外政治、軍事、文化、經(jīng)濟(jì)、外交等眾多領(lǐng)域,是網(wǎng)絡(luò)傳播時(shí)代網(wǎng)民社會(huì)參與的重要方式,映現(xiàn)著社會(huì)觀點(diǎn)的形成和變遷。當(dāng)前,網(wǎng)絡(luò)話題形成、傳播的速度、爆發(fā)性、蔓延趨勢(shì),正與日俱增,面對(duì)層出不窮的熱門(mén)話題以及背后的話題營(yíng)銷(xiāo),提出了剖析網(wǎng)絡(luò)話題的傳播規(guī)律,預(yù)測(cè)傳播趨勢(shì)和影響,及時(shí)準(zhǔn)確把握傳播態(tài)勢(shì)的研究問(wèn)題。特別是大數(shù)據(jù)技術(shù)的發(fā)展,為我們提供了大量網(wǎng)絡(luò)話題傳播的數(shù)據(jù),如何分析數(shù)據(jù)中蘊(yùn)含的網(wǎng)絡(luò)話題傳播規(guī)律,是一個(gè)在理論和實(shí)踐層面都值得關(guān)注的重要問(wèn)題。
1研究現(xiàn)狀
我國(guó)學(xué)術(shù)界針對(duì)網(wǎng)絡(luò)話題的研究,主要分為兩個(gè)研究方向:一是傳播學(xué)視域下網(wǎng)絡(luò)話題理論研究,針對(duì)網(wǎng)絡(luò)話題的形成機(jī)制、傳播特征、傳播模式、傳播規(guī)律、熱度效應(yīng)等進(jìn)行傳播學(xué)解讀,以定性研究為主[1-2];二是網(wǎng)絡(luò)話題量化分析,包括1)話題內(nèi)容分析:如話題摘要、內(nèi)容搜索等;2)話題檢測(cè)和發(fā)現(xiàn):主要采用K-Means等聚類(lèi)算法、循環(huán)神經(jīng)網(wǎng)絡(luò)、主題模型、共詞網(wǎng)絡(luò)等多種方法;3)話題演化:如演化時(shí)空規(guī)律、競(jìng)爭(zhēng)傳播、傳播結(jié)構(gòu)可視化等,主要采用空間自相關(guān)[3]、共詞網(wǎng)絡(luò)[4]以及各類(lèi)主題模型[5]等方法,在話題傳播模型方面,主要基于演化博弈[6]、脈沖時(shí)序行為動(dòng)力模型[7]、自激點(diǎn)過(guò)程[8]、傳染病模型[9]等;4)話題趨勢(shì)預(yù)測(cè):主要采用BP神經(jīng)網(wǎng)絡(luò)[10]、小波神經(jīng)網(wǎng)絡(luò)[11]、支持向量機(jī)[12]、回聲狀態(tài)網(wǎng)絡(luò)[13]、復(fù)雜網(wǎng)絡(luò)[14]、Hurst指數(shù)[15]等多種方法,進(jìn)行話題熱度、流行度預(yù)測(cè)等。通過(guò)Citespace對(duì)中國(guó)知網(wǎng)的網(wǎng)絡(luò)話題研究文獻(xiàn)進(jìn)行可視化分析,得到網(wǎng)絡(luò)話題研究關(guān)鍵詞的聚類(lèi)結(jié)果,以及每類(lèi)主題的關(guān)鍵詞遷移,可見(jiàn)在研究方法上深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等是近年來(lái)的研究熱點(diǎn),而在研究?jī)?nèi)容上新媒體環(huán)境、突發(fā)事件情景等是近年來(lái)的研究熱點(diǎn)(見(jiàn)圖1)。
圖1網(wǎng)絡(luò)話題研究關(guān)鍵詞聚類(lèi)時(shí)間線圖
整體而言,我國(guó)學(xué)術(shù)界對(duì)網(wǎng)絡(luò)話題的研究集中在傳播學(xué)、信息科學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域,分為定性分析和定量描述兩個(gè)研究方向。兩個(gè)方向的研究各有特長(zhǎng),但是定性研究仍需加強(qiáng)網(wǎng)絡(luò)話題傳播規(guī)律分析的精確性,定量研究仍需更緊密結(jié)合網(wǎng)絡(luò)話題傳播現(xiàn)象和場(chǎng)景,加強(qiáng)量化描述的適用性和針對(duì)性。其中在網(wǎng)絡(luò)話題傳播規(guī)律和預(yù)測(cè)研究領(lǐng)域,已有諸多研究成果,但是仍然存在將傳播規(guī)律分析和傳播趨勢(shì)預(yù)測(cè)相割裂的問(wèn)題,分別針對(duì)演化規(guī)律或者趨勢(shì)預(yù)測(cè)進(jìn)行研究,在理論應(yīng)用中將會(huì)存在分析、預(yù)測(cè)之間的銜接誤差。由此,定性定量相融合、“分析——預(yù)測(cè)”一體化等將是未來(lái)網(wǎng)絡(luò)話題領(lǐng)域的研究目標(biāo)。
2網(wǎng)絡(luò)話題傳播特征
隨著信息、網(wǎng)絡(luò)技術(shù)的進(jìn)步,網(wǎng)絡(luò)話題傳播相對(duì)于傳統(tǒng)的線下話題傳播,呈現(xiàn)出大數(shù)據(jù)特征、可量化性、可度量周期性、可預(yù)測(cè)性等諸多特征。
21網(wǎng)絡(luò)話題傳播的大數(shù)據(jù)特征
互聯(lián)網(wǎng)高普及率背景下的網(wǎng)絡(luò)話題傳播已經(jīng)具備明顯的大數(shù)據(jù)特征:1)多量性(Volume):主要體現(xiàn)在網(wǎng)絡(luò)話題傳播信息量巨大、傳播源頭數(shù)量多、傳播平臺(tái)數(shù)量多、傳播主體數(shù)量多等方面;2)多樣性(Variety):主要體現(xiàn)在網(wǎng)絡(luò)話題信息結(jié)構(gòu)多樣、網(wǎng)絡(luò)話題反映的網(wǎng)民情感種類(lèi)多、網(wǎng)絡(luò)話題傳播主體類(lèi)型多等方面;3)高速性(Velocity):主要體現(xiàn)在網(wǎng)絡(luò)話題產(chǎn)生速度快、傳播速度快、情感極化速度快等方面;4)價(jià)值性(Value):網(wǎng)絡(luò)話題價(jià)值密度小但其中蘊(yùn)含意義重大,網(wǎng)絡(luò)話題是網(wǎng)絡(luò)社會(huì)背景下感知民情民意、把握社會(huì)心態(tài)的重要路徑;5)在線性(Online):網(wǎng)絡(luò)話題數(shù)據(jù)永遠(yuǎn)在線,能夠隨時(shí)調(diào)用和計(jì)算,這是區(qū)別線下話題的重要方面。
22網(wǎng)絡(luò)話題傳播的可量化性
網(wǎng)絡(luò)話題傳播是抽象的、虛擬的,其傳播過(guò)程是傳播主體生產(chǎn)、傳遞信息的過(guò)程,這些信息具有明顯的數(shù)據(jù)在線特征,所以,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)等信息技術(shù)可以比較便捷、完整地獲取網(wǎng)絡(luò)話題傳播的數(shù)據(jù)。通過(guò)對(duì)這些網(wǎng)絡(luò)話題傳播數(shù)據(jù)進(jìn)行建模分析,可以推斷和感知網(wǎng)絡(luò)話題傳播程度、傳播主體數(shù)量變化程度和情感演化程度等,更進(jìn)一步,通過(guò)量化建模,還可以實(shí)現(xiàn)網(wǎng)絡(luò)話題傳播可視化,進(jìn)而量化整個(gè)網(wǎng)絡(luò)話題傳播過(guò)程,這些量化研究是深層次探索網(wǎng)絡(luò)話題傳播機(jī)理、定量描述網(wǎng)絡(luò)話題傳播規(guī)律的基礎(chǔ)。
23網(wǎng)絡(luò)話題傳播的可度量周期性
網(wǎng)絡(luò)話題信息作為網(wǎng)絡(luò)信息的一種,滿足網(wǎng)絡(luò)信息生命周期理論,因此網(wǎng)絡(luò)話題傳播具有周期性。按照信息生命周期理論,網(wǎng)絡(luò)信息生命周期可以定性分為多個(gè)階段,例如可劃分為產(chǎn)生、采集、組織、開(kāi)發(fā)、利用、處置等6個(gè)階段[16]或者引入期、發(fā)展期、穩(wěn)定期、衰退期、失效期等5個(gè)階段[17]等,但如何定量劃分信息生命周期,仍少見(jiàn)創(chuàng)新性研究[18]。由于網(wǎng)絡(luò)話題傳播具有周期性,以及網(wǎng)絡(luò)話題傳播的可量化性、數(shù)據(jù)在線性等特征,使得通過(guò)數(shù)據(jù)建模,可以構(gòu)建網(wǎng)絡(luò)話題傳播規(guī)律模型,進(jìn)而定量地劃分網(wǎng)絡(luò)話題傳播階段。網(wǎng)絡(luò)話題傳播的可度量周期性是網(wǎng)絡(luò)話題傳播機(jī)理的核心問(wèn)題,可為信息生命周期理論中劃分階段研究提供新的視角和方法。
24網(wǎng)絡(luò)話題傳播的可預(yù)測(cè)性
大數(shù)據(jù)的核心是預(yù)測(cè),實(shí)現(xiàn)網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)是大數(shù)據(jù)應(yīng)用的必然趨勢(shì)。通過(guò)信息技術(shù)獲取網(wǎng)絡(luò)話題數(shù)據(jù)后,可以發(fā)現(xiàn)網(wǎng)絡(luò)話題數(shù)據(jù)實(shí)質(zhì)是多維度、復(fù)雜的時(shí)間序列,所有網(wǎng)絡(luò)話題中的變量都會(huì)根據(jù)時(shí)間的變化而變化?;诖?,可以選擇時(shí)間序列預(yù)測(cè)方法進(jìn)行多維度的數(shù)據(jù)預(yù)測(cè),進(jìn)而預(yù)測(cè)網(wǎng)絡(luò)話題傳播程度,也可以先根據(jù)網(wǎng)絡(luò)話題數(shù)據(jù),構(gòu)建網(wǎng)絡(luò)話題傳播模型,然后根據(jù)數(shù)理模型開(kāi)展預(yù)測(cè),亦或綜合以上多種方法開(kāi)展組合預(yù)測(cè)。通過(guò)預(yù)測(cè)網(wǎng)絡(luò)話題傳播過(guò)程,可以推斷網(wǎng)民參與程度、情感演化趨勢(shì)等,為政府感知網(wǎng)絡(luò)民意提供技術(shù)路徑,同時(shí)可以敏銳感知由網(wǎng)絡(luò)謠言、虛假信息、網(wǎng)絡(luò)水軍等引發(fā)的網(wǎng)絡(luò)話題傳播的異?,F(xiàn)象,為網(wǎng)絡(luò)社會(huì)治理提供參考依據(jù)。
3網(wǎng)絡(luò)話題傳播規(guī)律模型研究
31建模核心變量選擇問(wèn)題
根據(jù)網(wǎng)絡(luò)話題傳播的大數(shù)據(jù)特征和可量化性,在網(wǎng)絡(luò)話題傳播過(guò)程中,傳播主體生產(chǎn)、傳遞信息的形式多樣,包括原創(chuàng)、轉(zhuǎn)發(fā)、評(píng)論、點(diǎn)贊、收藏等,這些生產(chǎn)和傳遞形式均對(duì)網(wǎng)絡(luò)話題傳播產(chǎn)生影響。所以,如何全面考慮網(wǎng)絡(luò)話題傳播影響要素、選擇核心變量,是網(wǎng)絡(luò)話題傳播規(guī)律建模的關(guān)鍵問(wèn)題。首先,原創(chuàng)、轉(zhuǎn)發(fā)等信息直接影響網(wǎng)絡(luò)話題傳播程度,是確定網(wǎng)絡(luò)話題傳播核心變量的主要數(shù)據(jù);其次,評(píng)論、點(diǎn)贊、收藏等信息不能脫離原創(chuàng)或轉(zhuǎn)發(fā)而存在,但卻影響網(wǎng)絡(luò)話題傳播,是確定網(wǎng)絡(luò)話題傳播核心變量的次要數(shù)據(jù)?;诖耍C合考慮主要數(shù)據(jù)和次要數(shù)據(jù),定義網(wǎng)絡(luò)話題傳播量為:
F=∑Mi(ai,bi,ci)Xi+∑Ni(ai,bi,ci)Yi(1)
其中Xi和Yi分別代表原創(chuàng)和轉(zhuǎn)發(fā)信息,Mi(ai,bi,ci)和Ni(ai,bi,ci)分別代表原創(chuàng)和轉(zhuǎn)發(fā)信息權(quán)重,其數(shù)值由該條原創(chuàng)或轉(zhuǎn)發(fā)信息中評(píng)論、點(diǎn)贊、收藏?cái)?shù)量確定。
32網(wǎng)絡(luò)話題傳播規(guī)律建模
321網(wǎng)絡(luò)話題傳播常態(tài)模型
根據(jù)前文對(duì)網(wǎng)絡(luò)話題傳播量的定義,假設(shè)網(wǎng)絡(luò)話題傳播量是關(guān)于時(shí)間的連續(xù)可微函數(shù),即F=F(t),網(wǎng)絡(luò)話題傳播量初值(t=0時(shí))為F0,則F(t)是單調(diào)遞增函數(shù)。由于網(wǎng)絡(luò)話題傳播的周期性,所以網(wǎng)絡(luò)話題傳播量存在上限,假設(shè)上限為K。
在某個(gè)時(shí)間段Δt內(nèi),傳播量增長(zhǎng)量為ΔF,所以網(wǎng)絡(luò)話題傳播量增長(zhǎng)率為ΔFFΔt,但由于受網(wǎng)絡(luò)話題傳播量上限的影響,網(wǎng)絡(luò)話題增長(zhǎng)率與網(wǎng)絡(luò)話題信息飽和率FK有關(guān),即飽和率大小影響增長(zhǎng)率的變化程度。當(dāng)時(shí)間段Δt→0時(shí),網(wǎng)絡(luò)話題增長(zhǎng)率與飽和率之間存在函數(shù)關(guān)系f,進(jìn)而得到網(wǎng)絡(luò)話題傳播的常態(tài)模型dFFdt=fFK或dFdt=FfFK。更進(jìn)一步,飽和率越小,網(wǎng)絡(luò)話題增長(zhǎng)空間越大,故增長(zhǎng)率越大;反之,飽和率越大,網(wǎng)絡(luò)話題增長(zhǎng)空間越小,故增長(zhǎng)率越小,所以,一般情況下,函數(shù)f為減函數(shù)結(jié)構(gòu)。為得出模型具體表達(dá)式,可以構(gòu)造減函數(shù)f,例如r1-FK,-rlnFK,r1-FKθ,re1-F/K,r1-FK1+aFK等,其中參數(shù)r代表傳播量固有增長(zhǎng)率,θ、d、a等皆為不同類(lèi)型的傳播參數(shù),據(jù)此便得到若干個(gè)描述網(wǎng)絡(luò)話題傳播規(guī)律的常態(tài)模型。
322常態(tài)模型對(duì)應(yīng)的衍生模型
實(shí)際研究過(guò)程中,根據(jù)不同的研究角度、深度以及應(yīng)用場(chǎng)景,需要對(duì)基本模型進(jìn)行改進(jìn),進(jìn)而得出常態(tài)模型對(duì)應(yīng)的衍生模型。
1)當(dāng)研究數(shù)據(jù)擬合確定模型具體參數(shù)時(shí),需要考慮離散結(jié)構(gòu)模型;
2)當(dāng)研究網(wǎng)絡(luò)話題增長(zhǎng)率的變化情況時(shí),需要考慮變?cè)鲩L(zhǎng)率模型;
3)當(dāng)網(wǎng)絡(luò)話題出現(xiàn)衍生時(shí),需要考慮變上限模型;
4)當(dāng)考慮網(wǎng)絡(luò)話題的時(shí)空影響時(shí),需要考慮偏微分方程模型;
5)當(dāng)考慮網(wǎng)絡(luò)話題傳播量飽和率的延遲影響時(shí),需要考慮時(shí)滯結(jié)構(gòu)模型;
6)當(dāng)考慮網(wǎng)絡(luò)推手或者網(wǎng)絡(luò)水軍對(duì)話題的影響時(shí),需要考慮加入控制項(xiàng)的情況;
7)當(dāng)考慮多個(gè)網(wǎng)絡(luò)話題相互影響時(shí),需要考慮方程組結(jié)構(gòu)模型。
以dFdt=-rFlnFK模型為常態(tài)模型構(gòu)造對(duì)應(yīng)衍生模型(見(jiàn)圖2)。
實(shí)際研究過(guò)程中,需要根據(jù)具體的網(wǎng)絡(luò)話題數(shù)據(jù)確定傳播量,然后根據(jù)數(shù)據(jù)形態(tài)和變化程度確定常態(tài)模型,然后通過(guò)數(shù)據(jù)驗(yàn)證推斷外部影響的程度,進(jìn)而判斷是否應(yīng)用衍生模型,最后,在此基礎(chǔ)上研究網(wǎng)絡(luò)話題傳播階段以及傳播趨勢(shì)預(yù)測(cè)等機(jī)理問(wèn)題(見(jiàn)圖3)。
33模型分析
在確定網(wǎng)絡(luò)話題傳播規(guī)律模型后,可以通過(guò)模型分析劃分傳播階段,為深入研究網(wǎng)絡(luò)話題傳播機(jī)理提供參考依據(jù)。由于網(wǎng)絡(luò)話題傳播規(guī)律模型dFdt=FfFK是連續(xù)性模型,網(wǎng)絡(luò)話題傳播階段劃分問(wèn)題轉(zhuǎn)化為網(wǎng)絡(luò)話題傳播規(guī)律模型曲線的分區(qū)問(wèn)題,即通過(guò)微積分計(jì)算,確定曲線的若干個(gè)關(guān)鍵節(jié)點(diǎn),然后據(jù)此劃分傳播階段(見(jiàn)圖4)。
以dFdt=-rFlnFK模型為例確定網(wǎng)絡(luò)話題傳播階段,分別令:
F″(t)=0,F(xiàn)(t)=0,F(xiàn)(4)(t)=0,F(xiàn)(5)(t)=0
計(jì)算各方程對(duì)應(yīng)的根,得到劃分階段關(guān)鍵時(shí)間節(jié)點(diǎn)(見(jiàn)表1)。
在深入研究網(wǎng)絡(luò)話題傳播階段以及不同傳播階段網(wǎng)絡(luò)話題傳播機(jī)理等問(wèn)題時(shí),可以根據(jù)研究需要選擇劃分階段的數(shù)量。以劃分3個(gè)階段為例,通過(guò)微積分確定曲線的兩個(gè)關(guān)鍵點(diǎn)P1、P2,其對(duì)應(yīng)兩個(gè)關(guān)鍵時(shí)間節(jié)點(diǎn)t1、t2,進(jìn)而整個(gè)網(wǎng)絡(luò)傳播過(guò)程分為3個(gè)階段:[0,t1]、[t1,t2]和[t2,+∞],據(jù)此可以定義網(wǎng)絡(luò)話題傳播的3個(gè)階段為潛伏期、擴(kuò)散期和消退期(見(jiàn)圖5)。
播案例的統(tǒng)計(jì)數(shù)據(jù)往往呈現(xiàn)單調(diào)遞減或者短時(shí)間增長(zhǎng)后再遞減的形態(tài)。
2)網(wǎng)絡(luò)話題傳播擴(kuò)散期。計(jì)算擴(kuò)散期持續(xù)時(shí)長(zhǎng),得:
t2-t1=1rln3+53-5(3)
擴(kuò)散期持續(xù)時(shí)長(zhǎng)僅與增長(zhǎng)率r呈反比,而與信息量上限K和初值F0無(wú)關(guān)。當(dāng)增長(zhǎng)率r大于192時(shí),擴(kuò)散期時(shí)長(zhǎng)小于1天,而擴(kuò)散期網(wǎng)絡(luò)話題信息量增量占總量的609%,所以就會(huì)出現(xiàn)在1天之內(nèi)網(wǎng)絡(luò)話題統(tǒng)計(jì)數(shù)據(jù)急劇增加的現(xiàn)象。
3)網(wǎng)絡(luò)話題傳播消退期。自t2開(kāi)始,網(wǎng)絡(luò)話題熱度逐漸減低,傳播趨勢(shì)趨于消退,但由于消退期持續(xù)時(shí)間較長(zhǎng),也為這個(gè)階段增加了更多不確定性。首先,由于網(wǎng)民關(guān)注話題的長(zhǎng)期性和延遲性,導(dǎo)致消退期仍會(huì)有網(wǎng)民持續(xù)關(guān)注并發(fā)表自身觀點(diǎn),導(dǎo)致網(wǎng)絡(luò)話題統(tǒng)計(jì)數(shù)據(jù)會(huì)出現(xiàn)長(zhǎng)尾效應(yīng);其次,由于話題反轉(zhuǎn)或者話題關(guān)聯(lián)等因素,促使話題熱度回升,導(dǎo)致網(wǎng)絡(luò)話題統(tǒng)計(jì)數(shù)據(jù)出現(xiàn)波動(dòng)現(xiàn)象。
4網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)研究
41預(yù)測(cè)思路和方法
網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)是感知網(wǎng)絡(luò)話題未來(lái)狀態(tài)、解讀各種網(wǎng)絡(luò)話題傳播現(xiàn)象的重要內(nèi)容,也是準(zhǔn)確識(shí)別話題傳播高潮或者傳播衍生現(xiàn)象的關(guān)鍵。預(yù)測(cè)是一項(xiàng)復(fù)雜、系統(tǒng)的工作,包括預(yù)測(cè)類(lèi)型、預(yù)測(cè)效果、預(yù)測(cè)方法等,而對(duì)網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)來(lái)說(shuō),還需注重以下幾個(gè)問(wèn)題。
1)動(dòng)態(tài)預(yù)測(cè)問(wèn)題。考慮到大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)話題數(shù)據(jù)產(chǎn)生快、傳播周期較短等情況,所以在網(wǎng)絡(luò)話題傳播過(guò)程中,需要及時(shí)預(yù)知網(wǎng)絡(luò)話題未來(lái)趨勢(shì)?;诖?,在動(dòng)態(tài)抓取網(wǎng)絡(luò)話題數(shù)據(jù)后,需要?jiǎng)討B(tài)進(jìn)行數(shù)據(jù)建模并開(kāi)展預(yù)測(cè),進(jìn)而實(shí)現(xiàn)網(wǎng)絡(luò)話題動(dòng)態(tài)預(yù)測(cè)。
2)“分析——預(yù)測(cè)”一體化問(wèn)題。分析和預(yù)測(cè)是研究網(wǎng)絡(luò)話題傳播規(guī)律的兩個(gè)重要環(huán)節(jié),分析模型和預(yù)測(cè)模型的銜接誤差直接影響網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)精度?;诖?,以網(wǎng)絡(luò)話題傳播規(guī)律模型為基礎(chǔ)模型開(kāi)展分析和預(yù)測(cè),在預(yù)測(cè)網(wǎng)絡(luò)話題傳播趨勢(shì)的同時(shí)開(kāi)展劃分傳播階段等機(jī)理分析,可以解決“分析——預(yù)測(cè)”一體化問(wèn)題。更進(jìn)一步,為提升預(yù)測(cè)精度,可以考慮以傳播規(guī)律模型為主模型,以灰色預(yù)測(cè)方法,以及移動(dòng)平均、指數(shù)平滑、自回歸滑動(dòng)平均等時(shí)間序列分析方法為輔模型開(kāi)展組合預(yù)測(cè)。
3)預(yù)測(cè)起點(diǎn)問(wèn)題。網(wǎng)絡(luò)話題類(lèi)型眾多,在開(kāi)展趨勢(shì)預(yù)測(cè)時(shí)需要嚴(yán)格選擇預(yù)測(cè)起點(diǎn),降低初值選擇對(duì)預(yù)測(cè)精度的影響?;诖耍瑢?duì)于突發(fā)事件等突發(fā)性網(wǎng)絡(luò)話題,預(yù)測(cè)起點(diǎn)選在事件產(chǎn)生的時(shí)間點(diǎn);而對(duì)于網(wǎng)民經(jīng)常性、持續(xù)性討論的非突發(fā)性網(wǎng)絡(luò)話題,則遵循數(shù)據(jù)由少至多的原則,選擇數(shù)值較低的時(shí)間點(diǎn)作為預(yù)測(cè)起點(diǎn)。
綜合以上幾點(diǎn),構(gòu)建網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)基本思路和方法如圖6。
首先,針對(duì)歷史網(wǎng)絡(luò)話題,獲取其傳播周期內(nèi)的數(shù)據(jù),然后應(yīng)用最小二乘法、三段和值法、上限估值法等確定模型參數(shù),然后按照話題屬性將歷史網(wǎng)絡(luò)話題進(jìn)行聚類(lèi),得出每類(lèi)的核心屬性和傳播規(guī)律模型參數(shù)。
其次,針對(duì)正在發(fā)生的某個(gè)網(wǎng)絡(luò)話題,在話題
發(fā)生時(shí),通過(guò)歸類(lèi)分析開(kāi)展經(jīng)驗(yàn)預(yù)測(cè),定性預(yù)測(cè)該話題的未來(lái)趨勢(shì);隨著話題數(shù)據(jù)的增多,需要根據(jù)數(shù)據(jù)確定預(yù)測(cè)模型,然后根據(jù)模型開(kāi)展趨勢(shì)預(yù)測(cè),進(jìn)而劃分話題傳播階段,并且隨著新數(shù)據(jù)的融入開(kāi)展動(dòng)態(tài)預(yù)測(cè)。具體方法是:將微分形式的模型dFdt=FfFK變?yōu)椴罘中问降姆匠蹋?/p>
ΔFk=Fk+1-Fk=FkfFkK(4)
其中k=0,1,2,…。差分形式中,ΔFk代表網(wǎng)絡(luò)話題統(tǒng)計(jì)數(shù)據(jù),F(xiàn)k則代表網(wǎng)絡(luò)話題傳播量,通過(guò)多元回歸分析便可以確定模型中的待定參數(shù),具體預(yù)測(cè)思路見(jiàn)圖6。以網(wǎng)絡(luò)話題傳播規(guī)律模型dFdt=-rFlnFK為例,其對(duì)應(yīng)的差分方程為:
ΔFk=Fk+1-Fk=-rFklnFkK=rFklnK-rFklnFk(5)
其中k=0,1,2,…,n-1。通過(guò)差分形式能夠得出,ΔFk與Fk、FklnFk呈現(xiàn)二元線性結(jié)構(gòu),應(yīng)用EXCEL或者M(jìn)ATLAB軟件進(jìn)行二元線性回歸分析,即可得出回歸方程的系數(shù)r和rlnK,從而求解方程得到模型的參數(shù)K和r。
42網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)的應(yīng)用
根據(jù)網(wǎng)絡(luò)話題可預(yù)測(cè)性特征,在確定網(wǎng)絡(luò)話題傳播規(guī)律模型之后,綜合運(yùn)用預(yù)測(cè)方法進(jìn)行網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)。首先,在確定預(yù)測(cè)方法后,通過(guò)部分?jǐn)?shù)據(jù)可以預(yù)測(cè)網(wǎng)絡(luò)話題傳播的未來(lái)趨勢(shì),進(jìn)而提前確定傳播階段,并且隨著新數(shù)據(jù)的加入,通過(guò)動(dòng)態(tài)預(yù)測(cè)可以動(dòng)態(tài)修正預(yù)測(cè)結(jié)果和劃分階段的結(jié)果。其次,對(duì)于突發(fā)事件等突發(fā)性網(wǎng)絡(luò)話題,通過(guò)動(dòng)態(tài)預(yù)測(cè)網(wǎng)絡(luò)話題未來(lái)趨勢(shì),可以提前感知反轉(zhuǎn)、衍生等現(xiàn)象;對(duì)于網(wǎng)民經(jīng)常性、持續(xù)性討論的話題等非突發(fā)性網(wǎng)絡(luò)話題,通過(guò)動(dòng)態(tài)預(yù)測(cè)網(wǎng)絡(luò)話題傳播趨勢(shì)可以識(shí)別多個(gè)話題周期。網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)應(yīng)用的具體思路(圖7)如下:
1)常態(tài)模型預(yù)測(cè):隨著話題數(shù)據(jù)增多至Pk點(diǎn),通過(guò)動(dòng)態(tài)預(yù)測(cè)可以得出話題未來(lái)趨勢(shì)(圖中虛線),并可據(jù)此劃分網(wǎng)絡(luò)話題傳播階段。
2)異常數(shù)據(jù)感知:如果網(wǎng)絡(luò)話題出現(xiàn)衍生、反轉(zhuǎn)或者產(chǎn)生新的傳播周期等,則網(wǎng)絡(luò)話題數(shù)據(jù)會(huì)呈現(xiàn)圖中實(shí)線趨勢(shì),當(dāng)進(jìn)行數(shù)據(jù)預(yù)測(cè)時(shí),隨著Pk點(diǎn)之后Pa、Pb、Pc、Pd等數(shù)據(jù)的加入,預(yù)測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)差距不斷擴(kuò)大,會(huì)導(dǎo)致增長(zhǎng)率和上限發(fā)生明顯波動(dòng),據(jù)此可以感知網(wǎng)絡(luò)話題傳播趨勢(shì)異常,為進(jìn)一步判斷話題衍生、反轉(zhuǎn)或新周期等現(xiàn)象提供依據(jù)[19]。
5實(shí)證研究
51案例來(lái)源
“霧霾”網(wǎng)絡(luò)話題屬于非突發(fā)性網(wǎng)絡(luò)話題,自2013年開(kāi)始成為網(wǎng)民持續(xù)討論的熱門(mén)話題,通過(guò)百度指數(shù)數(shù)據(jù)發(fā)現(xiàn)(圖8),“霧霾”網(wǎng)絡(luò)話題呈現(xiàn)一定周期性。為驗(yàn)證模型合理性和可行性,本文選擇“霧霾”話題的最新微博數(shù)據(jù)進(jìn)行實(shí)證研究,數(shù)據(jù)選擇時(shí)間為:2018年11月9日至12月9日,網(wǎng)絡(luò)話題傳播量暫不考慮評(píng)論、點(diǎn)贊、收藏等信息,僅考慮原創(chuàng)和轉(zhuǎn)發(fā)微博數(shù)量,實(shí)證數(shù)據(jù)取為原創(chuàng)微博和轉(zhuǎn)發(fā)微博數(shù)量之和,共5 631 750條微博數(shù)據(jù)。
52數(shù)據(jù)建模
首先,選擇3類(lèi)模型作為備選的常態(tài)模型;其次,選取2018年11月9日至11月18日數(shù)據(jù)作為建模數(shù)據(jù)。通過(guò)計(jì)算數(shù)據(jù)差分并應(yīng)用回歸分析得到模型參數(shù)(見(jiàn)表2),模型I數(shù)據(jù)擬合效果較好,所以采用模型Ⅰ劃分網(wǎng)絡(luò)話題傳播階段并開(kāi)展數(shù)據(jù)預(yù)測(cè)。
521劃分網(wǎng)絡(luò)話題傳播階段
根據(jù)模型Ⅰ的解和參數(shù),計(jì)算劃分網(wǎng)絡(luò)話題傳播階段的關(guān)鍵時(shí)間節(jié)點(diǎn)(表3),分別得出劃分兩階段、三階段、四階段、五階段的數(shù)值標(biāo)準(zhǔn)。以劃分三階段為例:潛伏期為[0,39006],擴(kuò)散期為[39006,58944],消退期為[58944,+∞],其中網(wǎng)絡(luò)話題傳播最快的擴(kuò)散期時(shí)長(zhǎng)為19938天,期間新增微博量約1 211 421條,平均每天607 594條,而潛伏期(39006天)僅約443 361條,平均每天113 665條,說(shuō)明在擴(kuò)散期網(wǎng)絡(luò)話題迅速傳播。在深入解讀網(wǎng)絡(luò)話題傳播機(jī)理時(shí),可以根據(jù)需要選擇劃分階段的方法,也可以選擇多個(gè)方法并進(jìn)行比較研究。
522網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)以及異常識(shí)別
根據(jù)模型Ⅰ的參數(shù),應(yīng)用2018年11月19日之后的數(shù)據(jù)開(kāi)展動(dòng)態(tài)預(yù)測(cè),確定模型增長(zhǎng)率和對(duì)應(yīng)的可決系數(shù),并且隨著新數(shù)據(jù)的加入,動(dòng)態(tài)修正模型參數(shù)(表4),與此同時(shí),繪制增長(zhǎng)率變化趨勢(shì)圖(圖9)。
線擬合效果較好。但加入第15個(gè)數(shù)據(jù)以后,可決系數(shù)持續(xù)降低,尤其是加入第18個(gè)數(shù)據(jù)之后,可決系數(shù)降至03519,擬合效果極不理想,這說(shuō)明真實(shí)數(shù)據(jù)已經(jīng)偏離理論模型,由此可以推斷話題傳播出現(xiàn)數(shù)據(jù)波動(dòng)現(xiàn)象,這一點(diǎn)可以通過(guò)原始數(shù)據(jù)(圖8中11月26日數(shù)據(jù))獲得驗(yàn)證;更進(jìn)一步發(fā)現(xiàn):這一數(shù)據(jù)波動(dòng)異?,F(xiàn)象并非瞬間產(chǎn)生,在可決系數(shù)持續(xù)降低時(shí)已有先兆。所以在網(wǎng)絡(luò)話題傳播趨勢(shì)動(dòng)態(tài)預(yù)測(cè)過(guò)程中,當(dāng)可決系數(shù)持續(xù)降低時(shí),可以推斷數(shù)據(jù)波動(dòng)將要來(lái)臨,進(jìn)而及時(shí)感知數(shù)據(jù)異常,而導(dǎo)致數(shù)據(jù)異常的原因則需要深入解讀網(wǎng)絡(luò)話題信息而得出。
6總結(jié)與展望
本文基于微分方程構(gòu)建了網(wǎng)絡(luò)話題傳播規(guī)律模型,提出劃分網(wǎng)絡(luò)話題傳播階段的一般方法,并據(jù)此研究網(wǎng)絡(luò)話題傳播趨勢(shì)預(yù)測(cè)問(wèn)題,在以下4個(gè)方面具有一定創(chuàng)新性:1)在提出常態(tài)模型的基礎(chǔ)上,針對(duì)不同的應(yīng)用場(chǎng)景提出了相應(yīng)的衍生模型,提升了網(wǎng)絡(luò)話題傳播規(guī)律模型的系統(tǒng)性、適用性;2)提出了不同傳播階段的預(yù)測(cè)方法,特別是大數(shù)據(jù)環(huán)境下,提出應(yīng)用差分回歸法進(jìn)行及時(shí)快速的動(dòng)態(tài)預(yù)測(cè)并動(dòng)態(tài)調(diào)整預(yù)測(cè)結(jié)果,為提前感知傳播趨勢(shì)以及衍生、反轉(zhuǎn)、新周期等傳播現(xiàn)象提供新方法;3)基于網(wǎng)絡(luò)話題傳播規(guī)律模型進(jìn)行分析和預(yù)測(cè),解決了網(wǎng)絡(luò)話題傳播“分析——預(yù)測(cè)”一體化的問(wèn)題;4)網(wǎng)絡(luò)話題傳播的實(shí)質(zhì)是信息的傳播,本文通過(guò)定量建模的方式進(jìn)行網(wǎng)絡(luò)話題傳播階段的劃分和測(cè)度,為解決信息生命周期理論中周期內(nèi)階段如何劃分、怎樣測(cè)度以及如何預(yù)知新周期等問(wèn)題,提供了新視角和可行路徑。此外,本文僅僅研究了網(wǎng)絡(luò)話題傳播規(guī)律的常態(tài)模型,針對(duì)文中與之對(duì)應(yīng)的衍生模型需要進(jìn)一步研究,例如不同場(chǎng)景下網(wǎng)絡(luò)話題傳播規(guī)律建模、如何加入控制項(xiàng)描述網(wǎng)絡(luò)推手或者網(wǎng)絡(luò)水軍對(duì)網(wǎng)絡(luò)話題的影響、如何構(gòu)建方程組描述多個(gè)網(wǎng)絡(luò)話題相互影響等問(wèn)題。
參考文獻(xiàn)
[1]王晰巍,趙丹,魏駿巍,等.移動(dòng)環(huán)境下網(wǎng)絡(luò)輿情信息傳播模式及實(shí)證研究——以埃博拉話題為例[J].情報(bào)學(xué)報(bào),2015,34(7):683-692.
[2]金兼斌,陳安繁.網(wǎng)絡(luò)事件和話題的熱度:基于傳播效果的操作化測(cè)量設(shè)計(jì)[J].中國(guó)傳媒大學(xué)學(xué)報(bào),2017,39(5):71-75.
[3]王璟琦,李銳,吳華意.基于空間自相關(guān)的網(wǎng)絡(luò)輿情話題演化時(shí)空規(guī)律分析[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2018,2(2):64-73.
[4]陳卓群.基于共詞網(wǎng)絡(luò)的社交媒體話題演化分析[J].情報(bào)科學(xué),2015,33(1):120-125.
[5]廖君華,孫克迎,鐘麗霞.一種基于時(shí)序主題模型的網(wǎng)絡(luò)熱點(diǎn)話題演化分析系統(tǒng)[J].圖書(shū)情報(bào)工作,2013,57(9):96-102.
[6]陳福集,黃江玲.基于演化博弈的網(wǎng)絡(luò)輿情熱點(diǎn)話題傳播模型研究[J].情報(bào)科學(xué),2015,33(11):74-78.
[7]郭瑞強(qiáng),郭阿為,韓忠明,等.網(wǎng)絡(luò)熱點(diǎn)話題傳播的脈沖時(shí)序行為動(dòng)力模型[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(16):121-129.
[8]韓忠明,張夢(mèng),譚旭升,等.基于自激點(diǎn)過(guò)程的網(wǎng)絡(luò)熱點(diǎn)話題傳播模型[J].計(jì)算機(jī)學(xué)報(bào),2016,39(4):704-716.
[9]譚娟.基于傳染病模型的社交網(wǎng)絡(luò)輿情話題傳播[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(12):118-122.
[10]馬曉寧,王惠.基于PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的話題趨勢(shì)預(yù)測(cè)[J].計(jì)算機(jī)工程與設(shè)計(jì),2018,39(9):2907-2911.
[11]譚鵬,羅順蓮,孫小淞,等.基于小波神經(jīng)網(wǎng)絡(luò)的話題熱度預(yù)測(cè)模型研究[J].現(xiàn)代信息科技,2018,2(5):74-78.
[12]劇雷鳴,楊俊成.基于支持向量機(jī)的網(wǎng)絡(luò)熱點(diǎn)話題預(yù)測(cè)[J].微型電腦應(yīng)用,2017,33(7):30-32,36.
[13]劉英華.基于魯棒回聲狀態(tài)網(wǎng)絡(luò)的網(wǎng)絡(luò)微博熱門(mén)話題建模與預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(1):295-299.
[14]張睿,李樹(shù)剛.基于復(fù)雜網(wǎng)絡(luò)的微吧話題流行度預(yù)測(cè)研究[J].科學(xué)技術(shù)與工程,2015,15(17):72-78.
[15]程葳.利用Hurst指數(shù)預(yù)測(cè)網(wǎng)絡(luò)話題熱度[J].現(xiàn)代計(jì)算機(jī):專(zhuān)業(yè)版,2012,(23):3-7.
[16]羅賢春.網(wǎng)絡(luò)信息生命周期[J].圖書(shū)館學(xué)研究,2004,(2):51-53.
[17]馬費(fèi)成,蘇小敏.網(wǎng)絡(luò)信息生命階段的模糊識(shí)別研究[J].情報(bào)科學(xué),2012,30(9):1277-1283.
[18]索傳軍.試論信息生命周期的概念及研究?jī)?nèi)容[J].圖書(shū)情報(bào)工作,2010,54(13):5-9.
[19]夏一雪,袁野,張文才,等.面向大數(shù)據(jù)的網(wǎng)絡(luò)輿情異常數(shù)據(jù)監(jiān)測(cè)與應(yīng)用研究[J].現(xiàn)代情報(bào),2018,38(6):80-85.
(責(zé)任編輯:孫國(guó)雷)