摘 要:網(wǎng)絡(luò)輿情是網(wǎng)民對(duì)社會(huì)問(wèn)題不同看法的輿論,網(wǎng)絡(luò)輿情事件如果處理不當(dāng),極有可能誘發(fā)民眾的不良情緒,進(jìn)而對(duì)社會(huì)穩(wěn)定構(gòu)成威脅。擬構(gòu)造動(dòng)態(tài)的網(wǎng)絡(luò)輿情演化模型:每經(jīng)過(guò)一個(gè)時(shí)間尺度,重新分析一次網(wǎng)絡(luò)輿情序列的統(tǒng)計(jì)特征;根據(jù)其統(tǒng)計(jì)特征,選擇合適的預(yù)測(cè)模型來(lái)建立模型,以準(zhǔn)確掌握網(wǎng)絡(luò)輿情的演化規(guī)律。
關(guān)鍵詞:網(wǎng)絡(luò)輿情 時(shí)間序列 人口模型 灰色預(yù)測(cè)
一、引言
根據(jù)CNNIC發(fā)布的《第39次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2016年12月,互聯(lián)網(wǎng)普及率達(dá)53.2%,標(biāo)志著我國(guó)已成為一個(gè)互聯(lián)網(wǎng)大國(guó)。實(shí)踐證明,一些重大的網(wǎng)絡(luò)輿情事件使人們開(kāi)始認(rèn)識(shí)到網(wǎng)絡(luò)對(duì)社會(huì)監(jiān)督起到的作用。同時(shí),網(wǎng)絡(luò)輿情突發(fā)事件如果處理不當(dāng),極有可能引發(fā)群眾的違規(guī)和過(guò)激行為,進(jìn)而對(duì)社會(huì)穩(wěn)定構(gòu)成威脅。因此,探究網(wǎng)絡(luò)輿情的演化規(guī)律對(duì)于危機(jī)應(yīng)對(duì)、輿情引導(dǎo)有著重要的研究?jī)r(jià)值和現(xiàn)實(shí)迫切性。中國(guó)股市在時(shí)隔8年后的2015年又迎來(lái)了新一輪的牛市及下半年的股災(zāi),上半年股市的瘋漲在互聯(lián)網(wǎng)輿情的傳播下幾乎呈現(xiàn)“人人炒股”的趨勢(shì),結(jié)果導(dǎo)致了在下半年股災(zāi)發(fā)生后股民的猝不及防,最終引起了民眾恐慌和社會(huì)動(dòng)蕩。據(jù)百度指數(shù)統(tǒng)計(jì)數(shù)據(jù)顯示,隨著時(shí)間的推移,股市指數(shù)的漲跌和政策輿情事件相互影響,形成多個(gè)關(guān)鍵節(jié)點(diǎn)。因此能從股市輿情的變化中探尋出一定的股市規(guī)律性,對(duì)于社會(huì)事件的發(fā)展有一定的先導(dǎo)作用。
二、文獻(xiàn)綜述
網(wǎng)絡(luò)輿情是近年來(lái)的研究熱點(diǎn),各專家學(xué)者都期望通過(guò)網(wǎng)絡(luò)輿情演變方式的規(guī)律研究來(lái)對(duì)社會(huì)產(chǎn)生一個(gè)良好的熱點(diǎn)導(dǎo)向,為政府提供支持性依據(jù)。分別使用回歸模型和ARIMA模型來(lái)研究網(wǎng)絡(luò)輿情,并得到了相應(yīng)的規(guī)律性結(jié)論。通過(guò)仿真方法重點(diǎn)研究了傳播內(nèi)容以及網(wǎng)民個(gè)體屬性對(duì)輿情演化傳播的影響。此外,在國(guó)外也有許多這方面的研究,分別使用元胞自動(dòng)機(jī)模型與Gompertz曲線模型研究輿論擴(kuò)散規(guī)律。針對(duì)個(gè)人在輿論傳播中的特性,建立了基于復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情演化模型。國(guó)內(nèi)外對(duì)網(wǎng)絡(luò)輿情演變的研究遠(yuǎn)不止上述的文獻(xiàn),但大多數(shù)研究都使用單一模型對(duì)網(wǎng)絡(luò)輿情的演化規(guī)律進(jìn)行研究。這往往使不同模型研究之間的兼容性變差,甚至結(jié)論相悖。結(jié)合上述研究,本文擬構(gòu)造動(dòng)態(tài)的網(wǎng)絡(luò)輿情演化模型:每經(jīng)過(guò)一個(gè)時(shí)間尺度,重新分析一次網(wǎng)絡(luò)輿情序列的統(tǒng)計(jì)特征;根據(jù)其統(tǒng)計(jì)特征,選擇合適的預(yù)測(cè)模型來(lái)建立模型,以準(zhǔn)確掌握網(wǎng)絡(luò)輿情的演化規(guī)律。
三、動(dòng)態(tài)模型
1.動(dòng)態(tài)模型簡(jiǎn)介。事件輿論量的產(chǎn)生存在一定的規(guī)律性,其中的規(guī)律是通過(guò)前期的輿論情況而定的,而根據(jù)已有的研究可知序列模型短期預(yù)測(cè)更為精確。因此在預(yù)測(cè)的過(guò)程逐步更新數(shù)據(jù)進(jìn)行短期預(yù)測(cè),使得結(jié)果更為精確。此外,假設(shè)有一個(gè)模型庫(kù),可以視作是一個(gè)存儲(chǔ)數(shù)學(xué)模型的“大倉(cāng)庫(kù)”,通過(guò)構(gòu)建模型庫(kù)并實(shí)現(xiàn)自動(dòng)化選取較好模型的目的,即模型更加準(zhǔn)確。作為統(tǒng)一度量模型好壞的偏差率,是構(gòu)建最優(yōu)動(dòng)態(tài)模型的關(guān)鍵。采用數(shù)學(xué)定義得到偏差率,公式如下:
2.單一模型簡(jiǎn)介。通過(guò)查閱相關(guān)資料發(fā)現(xiàn),預(yù)測(cè)分析模型共有9種。而根據(jù)預(yù)測(cè)范圍、預(yù)測(cè)準(zhǔn)確度以及預(yù)測(cè)所需數(shù)據(jù)量大小剔除了幾種模型,最終選擇以下4類模型。
2.1 馬爾薩斯模型:在孤立的生物群體中,生物總數(shù)的變化率與生物總數(shù)成正比,但這個(gè)模型存在一定的缺陷:忽略了群體個(gè)體之間的差異。
2.2 Logistic模型:又稱阻滯增長(zhǎng)模型,其原理是考慮到自然資源、環(huán)境條件等因素對(duì)人口增長(zhǎng)的阻滯作用,對(duì)指數(shù)增長(zhǎng)模型的基本假設(shè)進(jìn)行修改后得到的。
2.3 時(shí)間序列模型:是根據(jù)客觀事物發(fā)展的連續(xù)規(guī)律性,運(yùn)用過(guò)去的歷史數(shù)據(jù),進(jìn)一步推測(cè)未來(lái)的發(fā)展趨勢(shì)。但時(shí)間序列分析法對(duì)于短、近期預(yù)測(cè)比較顯著。
2.4 灰色預(yù)測(cè)模型:是一種對(duì)含有不確定因素的系統(tǒng)進(jìn)行預(yù)測(cè)的方法。用觀察到的反映預(yù)測(cè)對(duì)象特征的時(shí)間序列來(lái)構(gòu)造灰色預(yù)測(cè)模型,預(yù)測(cè)未來(lái)的特征量。
四、應(yīng)用及實(shí)例
1.數(shù)據(jù)來(lái)源及數(shù)據(jù)處理。選取了自2015年5月26日至2015年9月3日“滬深300”的百度指數(shù)搜索量(即用戶關(guān)注度)作為研究樣本,數(shù)據(jù)來(lái)源于百度指數(shù)官網(wǎng)。該樣本包括了網(wǎng)絡(luò)輿情傳播的形成期、高潮期和消退期三個(gè)階段。建立搜索量是關(guān)于時(shí)間函數(shù),需要對(duì)其進(jìn)行累加得到所需的變量數(shù)據(jù)。累加數(shù)據(jù)如圖4-1。為了建模的方便,之后會(huì)使用時(shí)間變量t=1,2,3…來(lái)替換具體日期。
2.單一模型分析。從前9期搜索量開(kāi)始建模(除ARIMA模型),分別應(yīng)用到馬爾薩斯模型、Logistic模型、ARIMA模型以及灰色預(yù)測(cè)這四種模型,得到各個(gè)模型的預(yù)測(cè)值、初始值和增長(zhǎng)率等各項(xiàng)統(tǒng)計(jì)指標(biāo),并預(yù)測(cè)出下一期的搜索量,直到迭代輸出92期所有的預(yù)測(cè)結(jié)果。其中馬爾薩斯模型將t值代入模型得到的預(yù)測(cè)值與真實(shí)值比較??梢燥@著看出隨著時(shí)間的增長(zhǎng),預(yù)測(cè)值與真實(shí)值的偏離程度不斷擴(kuò)大。說(shuō)明其擬合效果隨著期數(shù)的增加逐漸變差。由于ARIMA模型不適用于少量數(shù)據(jù)的預(yù)測(cè),因此通過(guò)計(jì)算篩查,從第14期開(kāi)始進(jìn)行輿情預(yù)測(cè)。雖然預(yù)測(cè)值走勢(shì)總體上是和實(shí)際相符合的,但也存在偏差較大的預(yù)測(cè)區(qū)間?;疑A(yù)測(cè)模型的預(yù)測(cè)結(jié)果雖然最小偏差率僅0.21極其接近實(shí)際值,但其最大偏差率為27.06,同樣體現(xiàn)了預(yù)測(cè)整體并不完美,這也恰恰說(shuō)明,使用單一擬合預(yù)測(cè)模型是很難達(dá)到最優(yōu)效果的。
3.最優(yōu)動(dòng)態(tài)模型。選取了符合股災(zāi)輿情數(shù)據(jù)的四個(gè)模型組合成一個(gè)模型庫(kù),并建立統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。模型庫(kù)根據(jù)不同時(shí)間段的輿情數(shù)據(jù)自動(dòng)化建模,直到得到評(píng)價(jià)指數(shù)最高的一個(gè)模型,得到的模型為下一期輿情演化預(yù)測(cè)。以“滬深300”事件為例,將其產(chǎn)生的搜索量數(shù)據(jù)應(yīng)用到建立完整的模型庫(kù)。通過(guò)偏差率進(jìn)行每一期最優(yōu)模型的選擇,將最小偏差率的模型作為下一期的預(yù)測(cè)模型。整個(gè)動(dòng)態(tài)模型的偏差率保持在6%左右,最大偏差率出現(xiàn)在第37期,達(dá)到了12%,最小的偏差接近于0。由最優(yōu)動(dòng)態(tài)模型預(yù)測(cè)出的預(yù)測(cè)值,如圖4-2。其是由3種不同預(yù)測(cè)模型組合而成的,如第14、15期預(yù)測(cè)模型為L(zhǎng)ogistic模型,而第16期則是ARIMA模型,到了第36期灰色預(yù)測(cè)成為了預(yù)測(cè)模型。因此最優(yōu)動(dòng)態(tài)模型由41期Logistic模型、44期時(shí)間序列模型以及7期灰色預(yù)測(cè)模型。
五、結(jié)語(yǔ)
2015年股市如此的“異常”,一方面大大挫傷了股民的積極性,另一方面也反映了中國(guó)股市監(jiān)管制度不健全的弊端。雖然政府已經(jīng)采取了一系列的舉措進(jìn)行干預(yù)。但由于政策干預(yù)不及時(shí)、成效過(guò)慢等原因,導(dǎo)致了社會(huì)動(dòng)蕩。作為網(wǎng)絡(luò)公民的我們,在突發(fā)事件到來(lái)之際,不應(yīng)該在網(wǎng)上傳播一些不正確的事實(shí)和謠言等。政策的制定離不開(kāi)技術(shù)的支持,技術(shù)上越快的反應(yīng)速度以及越準(zhǔn)確的預(yù)測(cè)精度,才可以將網(wǎng)絡(luò)輿情的訛傳危害性降到最低。本文建立動(dòng)態(tài)模型得到的預(yù)測(cè)結(jié)果,可以顯著發(fā)現(xiàn)其在預(yù)測(cè)網(wǎng)絡(luò)輿情演化時(shí)速度和精度方面的優(yōu)勢(shì)。因此,為網(wǎng)絡(luò)輿情的發(fā)展及預(yù)測(cè)做出了一定的貢獻(xiàn),為網(wǎng)絡(luò)輿情實(shí)時(shí)監(jiān)測(cè)技術(shù)提出保障。此外,動(dòng)態(tài)模型的實(shí)時(shí)性也能為政府定位事件的重要節(jié)點(diǎn)提供依據(jù),保證國(guó)家相關(guān)部門政策的時(shí)效性。
參考文獻(xiàn):
[1] 楊暢,蘇國(guó)強(qiáng),蘭月新,何永紅. 基于統(tǒng)計(jì)回歸模型的突發(fā)事件網(wǎng)絡(luò)輿情研究[J]. 武警學(xué)院學(xué)報(bào),2014,(07):80-83.
[2] 滕文杰. 時(shí)間序列分析法在突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情分析中的應(yīng)用研究[J]. 中國(guó)衛(wèi)生統(tǒng)計(jì),2014,06:1071-1073.
[3] 朱毅華,張超群. 基于影響模型的網(wǎng)絡(luò)輿情演化與傳播仿真研究[J]. 情報(bào)雜志,2015,(02):28-36.
[4] Yao C Y. The Application Study of Simulation Model Based on Cellular Automata in the Evolution of Internet Public Opinion[J]. Applied Mechanics Materials, 2012, 198-199:828-832.
[5] Cao W, Fu W, Lan Y, et al. The Research about Diffusion Law and Countermeasures of Internet News Public Opinion Based on Gompertz Curve Model[J]. Journal of Modern Information, 2015.
[6] Sun S, Zhang Y, Zhang J, et al. Study on Evolution Model of Internet Public Opinion Based on Complex Network[C]// International Conference on Electronics, Network and Computer Engineering. 2016.
[7] 百度.百度搜索指數(shù).滬深300搜索量,http://index.baidu.com/?tpl=trendword=%CE%BA%D4%F2%CE%F7.
[8] 中國(guó)互聯(lián)網(wǎng)信息中心.第39次中國(guó)互聯(lián)網(wǎng)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告,http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/t20150722_52624.htm.