任昌鴻,童春燕
(重慶師范大學涉外商貿(mào)學院,重慶 401520)
隨著我國網(wǎng)絡技術(shù)的不斷發(fā)展,網(wǎng)絡已經(jīng)成為人們?nèi)粘I钪斜夭豢缮俚脑?。網(wǎng)絡使用率的增加,導致網(wǎng)絡輿情風險出現(xiàn)。網(wǎng)絡輿情指的是互聯(lián)網(wǎng)上流行的對社會問題不同看法的網(wǎng)絡輿論,實質(zhì)上是社會輿論的一種表現(xiàn)形式,主要是通過互聯(lián)網(wǎng)對熱點與焦點問題中影響力較強的觀點與言論進行傳播。現(xiàn)今比較被大眾所接受的網(wǎng)絡輿情定義為:網(wǎng)絡輿情主要是以網(wǎng)絡為載體,以事件為核心,對廣大網(wǎng)民態(tài)度、情感、觀點、意見等進行傳播、互動、表達與后續(xù)的影響[1]。網(wǎng)絡輿情信息比較多元、表達較為快捷,具有開放與虛擬的特性,導致其具有直接性、隨意性、多元化、突發(fā)性、隱蔽性、偏差性等特點。但是,隨著網(wǎng)絡社會的崛起,網(wǎng)絡輿情逐漸的成為現(xiàn)實社會的“晴雨表”,也是一種不可忽視的頻發(fā)性社會現(xiàn)象[2]。網(wǎng)絡輿情主要是通過對民意進行聚合,對社會產(chǎn)生深刻的影響。但是其也存在著較大的風險,近幾年,由于負面的網(wǎng)絡輿情導致當事人抑郁、自殺的事件頻發(fā),網(wǎng)絡輿情風險也逐漸的受到人們的重視。
為了對網(wǎng)絡輿情風險進行詳細的分析,國內(nèi)外對網(wǎng)絡輿情風險演化模型進行了研究,并取得了一定的成果。目前使用較為廣泛的模型為基于多數(shù)原則的網(wǎng)絡輿情風險演化模型、基于有限信任的網(wǎng)絡輿情風險演化模型以及基于Sznajd的網(wǎng)絡輿情風險演化模型。其中,基于多數(shù)原則的網(wǎng)絡輿情風險演化模型主要的思想為觀點聚合,在該模型中,個體觀點呈現(xiàn)為二元離散狀態(tài),更加簡單,并簡化了分析的過程;基于有限信任的網(wǎng)絡輿情風險演化模型認為觀點交互行為主要出現(xiàn)在觀點差值小于給定的信任閾值時,以此為基礎(chǔ),對觀點模型進行建立,分析網(wǎng)絡輿情風險演化過程;基于Sznajd的網(wǎng)絡輿情風險演化模型是粒子交互模型中的典型代表,主要的思想為:更多的個體會更加讓人信服,因此,該模型主要是將觀點進行聚合,以此為基礎(chǔ),對網(wǎng)絡輿情風險演化模型進行構(gòu)建[3]。但是上述三種方法均存在著網(wǎng)絡輿情風險預測準確性低、控制效果差的缺陷,無法滿足現(xiàn)今互聯(lián)網(wǎng)的需求,為了解決上述問題,基于大數(shù)據(jù)平臺對網(wǎng)絡輿情風險演化模型進行構(gòu)建,并設(shè)計仿真對比實驗對構(gòu)建的網(wǎng)絡輿情風險演化模型性能進行測試與分析。
要想對網(wǎng)絡輿情風險演化模型進行構(gòu)建,首要的任務就要對網(wǎng)絡輿情信息進行獲取。通過研究發(fā)現(xiàn),協(xié)程網(wǎng)絡爬蟲算法更加適用于網(wǎng)絡輿情信息的獲取[4]。具體的信息獲取過程如下所示。
通過協(xié)程網(wǎng)絡爬蟲算法得到網(wǎng)絡輿情信息為
X={x1,x2,…,xn}
(1)
為了對網(wǎng)絡輿情信息中的觀點進行提取,首先采用加權(quán)技術(shù)對信息中的關(guān)鍵詞進行提取。采用權(quán)重對詞的關(guān)鍵程度進行表示,詞權(quán)重計算公式為
(2)
其中,idfxi表示的是第i個詞的權(quán)重值;log表示的是底為10的對數(shù)公式;|D|表示的是網(wǎng)絡輿情信息集合D中信息的總數(shù);{d′∈D|t∈d′}表示的是包含詞t的信息數(shù)量。
在網(wǎng)絡輿情信息中,若是關(guān)鍵詞k出現(xiàn)了n次,而網(wǎng)絡輿情信息總詞數(shù)為N,則詞頻為n/N。
由于網(wǎng)絡輿情信息中含有大量的相似關(guān)鍵詞,為了簡化網(wǎng)絡輿情信息,將相似的關(guān)鍵詞進行集合,對相似關(guān)鍵詞權(quán)重進行計算,得到
(3)
其中,Wxi,d′表示的是相似關(guān)鍵詞權(quán)重值;α表示的是計算參數(shù)。
通過式(3)得到各個相似關(guān)鍵詞的權(quán)重值,以此為基礎(chǔ),對網(wǎng)絡輿情關(guān)鍵詞分布圖進行構(gòu)建。
通過統(tǒng)計分析方法得到詞頻的二維與三維圖,如圖1所示。
圖1 網(wǎng)絡輿情詞頻二維、三維圖
根據(jù)上述得到的網(wǎng)絡輿情詞頻圖,通過聚類算法獲取網(wǎng)絡輿情觀點信息,得到
(4)
通過上述過程完成了網(wǎng)絡輿情信息的獲取,并得到了網(wǎng)絡輿情觀點信息集合,為下述網(wǎng)絡輿情觀點的聚合提供數(shù)據(jù)支撐。
以上述得到的網(wǎng)絡輿情觀點集合為基礎(chǔ),采用Weisbuch-Deffuant模型對網(wǎng)絡輿情觀點聚合規(guī)則進行設(shè)定,以此為基礎(chǔ),對網(wǎng)絡輿情觀點進行聚合[5]。具體的過程如下所示。
忽略網(wǎng)絡輿情觀點聚合空間中流失的情況,設(shè)定網(wǎng)絡規(guī)模為M,將其中各個個體構(gòu)成的社會網(wǎng)絡記為G(M,E),其中,E表示的是網(wǎng)絡中邊的數(shù)量。
(5)
在網(wǎng)絡輿情觀點聚合中,個體交互程度具有非充分性與異質(zhì)性的特性,個體對他人觀點的接受程度也是不同的。在網(wǎng)絡輿情觀點聚合過程中,收斂系數(shù)主要是對個體對他人觀點接收程度進行描述的變量,其取值的不同直接影響著觀點聚合的效果。因此,收斂系數(shù)設(shè)置為一個固定值并不合理[8]。本節(jié)采用收斂系數(shù)的分布f(μ)對收斂系數(shù)進行代替。另外,將信任閾值與觀點距離引入,其滿足下述公式
(6)
根據(jù)上述公式得到網(wǎng)絡輿情觀點聚合一般規(guī)則為
(7)
其中,ε為值域[0,1]上的一個固定值。
方式一:隨機加邊[9]。主要是依據(jù)概率在網(wǎng)絡個體中進行隨機選擇,使新加入個體與其聯(lián)系進行建立;
方式二:依據(jù)度值權(quán)重進行非等概率加邊[10]。主要是依據(jù)網(wǎng)絡連接的“馬太效應”對新加入個體與已存在的個體進行連接,其概率為
(8)
同時,網(wǎng)絡中具有名人效應,以方式二進行加邊更加符合實際的情況。因此,得到大數(shù)據(jù)平臺下網(wǎng)絡輿情觀點聚合流程如圖2所示。
圖2 大數(shù)據(jù)平臺下網(wǎng)絡輿情觀點聚合流程圖
通過上述過程完成了網(wǎng)絡輿情觀點聚合規(guī)則的設(shè)定,并對觀點進行了聚合,為網(wǎng)絡輿情風險系數(shù)的計算做準備。
以上述得到的網(wǎng)絡輿情觀點聚合結(jié)果為基礎(chǔ),采用倉室模型對網(wǎng)絡輿情信息擴散模式進行搭建,具體的模式搭建過程如下所示[11]。
倉室模型是現(xiàn)今使用較為廣泛的模型類型,倉室模型示意圖如圖3所示。
圖3 倉室模型示意圖
如圖3所示,S表示的是個體非知情狀態(tài),表示個體沒有受到網(wǎng)絡輿情信息擴散的影響,對輿情信息認知較少;E表示的是個體知情狀態(tài),個體對網(wǎng)絡輿情信息具有一定的了解,并受到其擴散的影響;I表示的是傳播狀態(tài),這些個體是網(wǎng)絡輿情信息擴散的主要推動者;R表示的是移出狀態(tài),該狀態(tài)的個體不會受到網(wǎng)絡輿情信息擴散的影響,處于免疫狀態(tài)。
網(wǎng)絡輿情信息擴散中個體狀態(tài)轉(zhuǎn)移流程如圖4所示。
圖4 個體狀態(tài)轉(zhuǎn)移流程圖
以圖4為基礎(chǔ),對網(wǎng)絡輿情信息擴散模式進行搭建,用公式表示為
(9)
其中,λ,1-λ,ω,?,γ分別表示的是S→I,S→E,E→I,E→R,I→R之間的轉(zhuǎn)移概率;Θ(t)表示的是t時刻傳播節(jié)點的概率。
通過上述過程完成了網(wǎng)絡輿情信息擴散模式的搭建,對其擴散模型進行了詳細的分析,為下述網(wǎng)絡輿情風險系數(shù)的計算提供支撐。
以上述搭建的網(wǎng)絡輿情信息擴散模式為基礎(chǔ),通過敏感性分析對網(wǎng)絡輿情風險系數(shù)進行計算[12]。具體計算過程如下所示。
傳播概率對網(wǎng)絡輿情信息擴散效果有著直接的影響,隨著傳播概率的變化,網(wǎng)絡輿情信息擴散的效果也存在著較大的不同。將上述過程簡化為數(shù)值模型為
(10)
其中,ψ(t)表示的是網(wǎng)絡輿情信息擴散效果。
根據(jù)上述公式結(jié)果,通過敏感性分析公式計算網(wǎng)絡輿情風險系數(shù),得到
(11)
其中,Ξ表示的是網(wǎng)絡輿情風險系數(shù),通常情況下,認為網(wǎng)絡輿情風險系數(shù)越大,則網(wǎng)絡輿情風險越大。
通過上述過程實現(xiàn)了大數(shù)據(jù)平臺下網(wǎng)絡輿情風險演化模型的構(gòu)建,為網(wǎng)絡輿情風險的預測與控制提供了強而有力的支撐。
上述過程實現(xiàn)了大數(shù)據(jù)平臺下網(wǎng)絡輿情風險演化模型的構(gòu)建,但是對其是否能夠解決現(xiàn)有模型存在的問題還無法確定,為此設(shè)計仿真對比實驗對構(gòu)建模型的性能進行測試與分析。
首先對實驗平臺進行構(gòu)建,如圖5所示。
圖5 實驗平臺示意圖
在仿真對比實驗過程中,采用構(gòu)建模型與現(xiàn)有的基于多數(shù)原則的網(wǎng)絡輿情風險演化模型、基于有限信任的網(wǎng)絡輿情風險演化模型以及基于Sznajd的網(wǎng)絡輿情風險演化模型進行對比實驗。為了保障實驗結(jié)果的準確性,將實驗外部環(huán)境參數(shù)設(shè)置為一致,通過網(wǎng)絡輿情風險預測準確性與控制效果對模型的性能進行體現(xiàn)。具體的實驗結(jié)果分析過程如下所示。
為了保障實驗結(jié)果的準確性,在網(wǎng)絡輿情信息量15MBit與50MBit情況下,對網(wǎng)絡輿情風險預測準確性進行實驗,通過實驗得到網(wǎng)絡輿情風險預測準確性對比情況如表1、表2所示。
表1 信息量15MBit下網(wǎng)絡輿情風險預測準確性對比情況表
表2 信息量50MBit下網(wǎng)絡輿情風險預測準確性對比情況表
如表1、表2所示,構(gòu)建模型的網(wǎng)絡輿情風險預測準確性遠遠的高于現(xiàn)有三種方法,信息量15MBit情況下最大值為94%;信息量50MBit情況下最大值為89%。
網(wǎng)絡輿情風險演化模型可以通過模型系數(shù)的設(shè)置對網(wǎng)絡輿情風險進行控制,其控制效果直接影響著模型的性能。
通過實驗得到網(wǎng)絡輿情風險控制效果對比情況如圖6所示。
圖6 網(wǎng)絡輿情風險控制效果對比情況圖
如圖6所示,構(gòu)建模型的網(wǎng)絡輿情風險控制效果參數(shù)遠遠的高于現(xiàn)有三種方法,說明構(gòu)建模型控制效果更好。
通過實驗結(jié)果顯示,構(gòu)建的網(wǎng)絡輿情風險演化模型極大的提升了網(wǎng)絡輿情風險預測準確性與控制效果,充分說明構(gòu)建的網(wǎng)絡輿情風險演化模型具備更好的性能。
構(gòu)建的網(wǎng)絡輿情風險演化模型極大的提升了網(wǎng)絡輿情風險預測準確性與控制效果,為網(wǎng)絡輿情風險的預測與控制提供了強而有力的支撐。但是模型的網(wǎng)絡輿情風險預測準確性與控制效果依然具有很大的上升空間,需要對模型進行進一步的優(yōu)化。