劉穎 方愛麗 魏新江
摘要: 考慮到在微博信息傳播過程中,每一位網(wǎng)絡(luò)用戶的觀點都受到其前一位網(wǎng)絡(luò)用戶觀點的影響,提出建立基于微博數(shù)據(jù)挖掘的貝葉斯觀點演化模型。以“動態(tài)清零政策是我國抗疫總方針”為關(guān)鍵話題詞,利用Python爬取微博評論數(shù)據(jù),經(jīng)過數(shù)據(jù)預(yù)處理和分詞,對貝葉斯觀點演化模型進(jìn)行實證分析,結(jié)果發(fā)現(xiàn)官方媒體對輿情的及時引導(dǎo)對情感演化傾向起到重要作用。
關(guān)鍵詞: 微博;情感分析;觀點演化;貝葉斯更新
中圖分類號: O29文獻(xiàn)標(biāo)識碼: A
Bayesian Opinion Evolution Model Based on Weibo Data Mining
LIU Ying, FANG Aili, WEI Xinjiang
Abstract:Considering that in the process of microblog information dissemination, the opinion of each network user is influenced by the opinions of the previous network user. Therefore, we propose a Bayesian opinion evolution model based on weibo data mining. With “dynamic zero policy is the general policy of China′s fight against the epidemic” as the key word, Python is used to crawl the Weibo comment data. After data preprocessing and word segmentation, the Bayesian opinion evolution model is empirically analyzed. Empirical analysis shows that the timely guidance of public opinion by official media plays an important role in sentiment evolution tendency.
Key words: weibo; sentiment analysis; opinions evolution; Bayesian updating
0 引言
隨著信息化時代的到來,人們更傾向于瀏覽新媒體上傳播的新聞。截至2021年12月,中國網(wǎng)民規(guī)模達(dá)到10.32億,互聯(lián)網(wǎng)普及率高達(dá)73%[1]。國家借助社交網(wǎng)絡(luò)發(fā)布政策,網(wǎng)民在社交網(wǎng)絡(luò)上發(fā)表個人觀點,由此各大網(wǎng)絡(luò)平臺成為熱點輿論聚集地,尤其微博已逐步成為輿情發(fā)酵和演化的主要平臺,并且逐漸影響著大眾輿情的走勢[2-4]。由于微博具有網(wǎng)民互動及時性、便捷性,各種政策新聞也會通過官方媒體發(fā)布在微博上,借助于微博進(jìn)行信息傳播。部分網(wǎng)絡(luò)用戶瀏覽到新聞時會在微博上進(jìn)行情感表達(dá),并且表達(dá)的情感內(nèi)容也會迅速感染瀏覽其微博內(nèi)容的其他網(wǎng)絡(luò)用戶的情緒,進(jìn)而導(dǎo)致輿論爆發(fā)[5-6]。本文從微博情感演化的角度出發(fā),通過網(wǎng)絡(luò)爬蟲抓取新浪微博評論數(shù)據(jù)進(jìn)行觀點演化趨勢分析,以探尋國家發(fā)布政策后,官方媒體等報道對最終輿情演化的影響,這對于建立健全輿情控制機(jī)制具有重要的應(yīng)用價值與現(xiàn)實意義。
目前微博情感分析是當(dāng)下研究輿情演化的熱點,而我們的觀點也蘊含在情感表達(dá)中,所以可以借助情感分析手段進(jìn)行觀點演化研究。采用citespace工具,以微博、情感分析和觀點演化為關(guān)鍵詞在知網(wǎng)上檢索文獻(xiàn),對相關(guān)程度最高的前500篇文獻(xiàn)進(jìn)行關(guān)鍵詞共現(xiàn)分析,得到共現(xiàn)網(wǎng)絡(luò)如圖1所示。從圖1可以得出中心度最強(qiáng)的是“情感分析”,可見情感分析確實是微博上觀點演化的重要分析工具。進(jìn)一步分析文獻(xiàn)可以發(fā)現(xiàn),目前對于情感分析的研究方法大致分為3類:情感詞典、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)。情感詞典相關(guān)內(nèi)容主要包括微博輿情、主題提取、特征選擇和表情詞典等;深度學(xué)習(xí)相關(guān)內(nèi)容主要包括社交網(wǎng)絡(luò)、微博評論、情感計算和謠言檢測等;機(jī)器學(xué)習(xí)相關(guān)內(nèi)容主要包括社交媒體、特征選擇、情感分類和深度學(xué)習(xí)等?;谏鲜龇椒ǎ瑢W(xué)者們已經(jīng)取得了很多成果,如楊爽等[7]提出基于SVM的情感分類方法,得到了82.4%的準(zhǔn)確率;徐軍等[8]將機(jī)器學(xué)習(xí)的方法用于情感分析,最高準(zhǔn)確率達(dá)到90%。Wajdi Aljedaani等[9]提出了一種基于詞典的方法與深度學(xué)習(xí)模型相結(jié)合的混合情緒分析(LSTM-GRU)方法,以提高情感分類的準(zhǔn)確性,精度最高達(dá)到0.97。
相對于這些精心設(shè)計的更復(fù)雜的機(jī)器學(xué)習(xí)算法,樸素貝葉斯算法是學(xué)習(xí)效率和分類效果較好的分類器之一。貝葉斯方法是以貝葉斯原理為基礎(chǔ),結(jié)合先驗概率和后驗概率,既避免了只使用先驗概率的主觀偏見,也避免了單獨使用樣本信息的過擬合現(xiàn)象,因此貝葉斯算法的誤判率很低,能夠在數(shù)據(jù)集較大的情況下表現(xiàn)出較高的準(zhǔn)確率,同時算法本身也比較簡單,在實際數(shù)據(jù)分析中得到了廣泛的應(yīng)用,其中,學(xué)者Veny Amilia Fitri等[10]通過在RapidMiner工具中使用樸素貝葉斯算法,對Twitter上印度尼西亞的反LGBT運動的情感觀點進(jìn)行研究,準(zhǔn)確性為86.43%,高于其他算法;Gonzalo A. Ruz等[11]用貝葉斯網(wǎng)絡(luò)分類器對西班牙語的兩個數(shù)據(jù)集“2010年智利地震”和“2017年加泰羅尼亞獨立公投”進(jìn)行情感分析,結(jié)果表明,在給定足夠數(shù)量的訓(xùn)練樣本的情況下,使用貝葉斯因子度量的有效性及其預(yù)測結(jié)果比支持向量機(jī)和隨機(jī)森林更好;Muhammad Bilal等[12]對博客觀點通過WEKA使用了3種分類模型進(jìn)行文本分類,結(jié)果表明,樸素貝葉斯在準(zhǔn)確性、精確度、召回率和F測度方面優(yōu)于決策樹和KNN;Duc Anh Nguyen等[13]提出一個框架,可以提高貝葉斯模型的性能,尤其對于短文本來說,有很大的優(yōu)勢。目前,微博作為廣泛使用的社交媒體,其短文本特征使得觀點信息得以快速傳播,而且利用貝葉斯方法能夠很好地整合個人觀點與觀察信息,貝葉斯社會學(xué)習(xí)模型可以用來研究微博用戶觀點的演化趨勢。
貝葉斯社會學(xué)習(xí)模型常用于研究如何將對社會的觀察整合到理性貝葉斯推理過程中,例如Krafft P M等[14]認(rèn)為與人們憑借自身先驗信念做出決策相比,通過結(jié)合社會信息進(jìn)行決策可以產(chǎn)生更好的決策;Ali Jadbabaie等[15]提出一種非貝葉斯動態(tài)演化模型,將個人的貝葉斯后驗觀點與鄰居觀點的線性組合作為個人最終觀點更新法則;AiliFang[16]提出將社區(qū)內(nèi)個人的觀點更新為他自己的貝葉斯后驗觀點和鄰居觀點的加權(quán)線性組合,而社區(qū)外的不知情個人沒有私人信號,只將鄰居的加權(quán)平均觀點作為自己的觀點。在社會網(wǎng)絡(luò)中,社區(qū)的連通性和信號來源都會影響到最終觀點的演化;Navarro等[17]認(rèn)為當(dāng)進(jìn)行社會學(xué)習(xí)的群體不同時,具有更強(qiáng)偏見的人將不同程度地導(dǎo)致信息傳遞遭到扭曲破壞;Bill Thompson等[18]提出了簡單形式的累積文化進(jìn)化的貝葉斯分析,發(fā)現(xiàn)人們歸納信息存在的偏差限制了文化進(jìn)化的進(jìn)程。在實際中,通過數(shù)據(jù)挖掘,采用貝葉斯方法分析觀點演化也是切實可行的,例如Chin-Chia Hsu等[19]研究了Twitter社交網(wǎng)絡(luò)上的新聞傳播,發(fā)現(xiàn)了虛假新聞比真實新聞在社交網(wǎng)絡(luò)上傳播更廣泛,為真實新聞的傳播提供了理論微觀基礎(chǔ);Stefanos Zervoudakis等[20]利用Twitter旅游業(yè)方面的數(shù)據(jù)設(shè)計了一個基于貝葉斯的觀點挖掘模型,預(yù)測用戶訪問某個地方的意圖,模型同樣也適用于其他主題的觀點挖掘。
綜上所述,用貝葉斯方法研究觀點演化不論在理論還是實際中都是切實有效的,在當(dāng)前全民抗擊新冠疫情的背景下,為了了解大眾對中國抗疫政策的觀點態(tài)度,本文對“動態(tài)清零是我國抗疫總方針”政策在微博上的情感演化趨勢進(jìn)行了數(shù)據(jù)挖掘,建立貝葉斯觀點模型進(jìn)行實證分析,進(jìn)而研究官方媒體的正向報道對大眾觀點演化的影響以及輿情演化的趨勢。
1 貝葉斯觀點演化模型
1.1 觀點
關(guān)于微博上某話題,人們都會持有自己的觀點。微博用戶一般會通過發(fā)表微博表達(dá)觀點。假設(shè)用戶發(fā)表的微博評論可分為積極和消極兩種觀點,分別用zP和zN表示,則P(zP)和P(zN)分別表示積極觀點和消極觀點用戶的概率,滿足P(zP)+P(zN)=1。特別地,若P(zP)=1(或者P(zP)=1),則意味著所有的微博用戶對該話題都持有積極(消極)觀點,此時群體觀點達(dá)到一致。
1.2 微博轉(zhuǎn)發(fā)網(wǎng)絡(luò)
微博轉(zhuǎn)發(fā)是微博上信息傳播的主要途徑。設(shè)t用戶發(fā)表了關(guān)于某主題的微博,后面的用戶看到該微博并轉(zhuǎn)發(fā),同時發(fā)表了自己的評論。以此類推,后續(xù)的每位用戶看到前面某用戶的微博,進(jìn)行了轉(zhuǎn)發(fā)和評論,從而信息在轉(zhuǎn)發(fā)網(wǎng)絡(luò)中得到傳播。轉(zhuǎn)發(fā)路徑上的每一位用戶發(fā)表的觀點都會受到前一位用戶觀點的影響,但是后面用戶發(fā)表的微博信息不會對前面用戶的觀點產(chǎn)生影響。在圖2所示的信息傳播過程中,用戶t+1、t+2和t+4轉(zhuǎn)發(fā)并評論了用戶t的微博,用戶t+3轉(zhuǎn)發(fā)并評論了用戶t+1的微博,用戶t+5轉(zhuǎn)發(fā)并評論了用戶t+4的微博。經(jīng)過一段時間的轉(zhuǎn)發(fā)和評論以后,這種信息傳播關(guān)系就會形成了一個龐大的微博轉(zhuǎn)發(fā)評論網(wǎng)絡(luò)。
1.3 微博詞語
微博用戶關(guān)于某話題的觀點可以通過其發(fā)表的微博詞語顯性或者隱性地表現(xiàn)出來。在某個時間段內(nèi),關(guān)于該話題的所有微博關(guān)鍵詞wi構(gòu)成集合W=w1,w2,w3,w4,…wi,…,wM,M為不同關(guān)鍵詞的個數(shù)。用戶t發(fā)表評論中的關(guān)鍵詞wi,t構(gòu)成集合wt={wi,t|wi,t∈W},易知wtW。
1.4 貝葉斯更新法則
本文中假設(shè)微博用戶的觀點更新是局部的,每名用戶的觀點只由他的近鄰網(wǎng)絡(luò)用戶產(chǎn)生影響,即用戶t+1位看到用戶t發(fā)表的微博信息wt后,利用貝葉斯法則調(diào)整自身觀點得到Pt+1(zN|wt)和Pt+1(zP|wt),將后驗觀點作為自己的觀點,并在微博上表達(dá)帶有自已觀點的評論。
其中,拉普拉斯系數(shù)0≤λ≤1,K為觀點總數(shù),本文為2。
2 微博數(shù)據(jù)挖掘與實證分析
2.1 數(shù)據(jù)獲取
網(wǎng)絡(luò)爬蟲可以對網(wǎng)頁上的數(shù)據(jù)集進(jìn)行按需下載,目前爬蟲技術(shù)已得到廣泛應(yīng)用[21-22]。采用Python編寫爬蟲代碼進(jìn)行數(shù)據(jù)挖掘,選取從2022年4月11日到2022年5月31日,在微博搜索帶有關(guān)鍵詞“動態(tài)清零政策是我國抗疫總方針”的微博評論。數(shù)據(jù)包含新華社官方微博、北京晚報官方微博和重慶日報等官方微博、網(wǎng)絡(luò)明星、大V的微博評論及普通用戶的微博發(fā)帖評論,共爬取微博評論1 250條,爬取的數(shù)據(jù)用csv格式存儲。
2.2 數(shù)據(jù)清洗
微博爬取的數(shù)據(jù)不一定全部符合要求,可能存在重復(fù)、缺失等無效數(shù)據(jù),在excel中進(jìn)行數(shù)據(jù)去重和刪除缺失數(shù)據(jù)及無效數(shù)據(jù),清洗后的數(shù)據(jù)用csv格式存儲。對清洗后的數(shù)據(jù)進(jìn)行分詞,得到所有評論中關(guān)鍵詞有6 277個,畫出詞云圖如圖3所示。從圖3中可以看出微博評論除了與“動態(tài)清零是我國抗疫總方針”相關(guān)的話題詞之外,還有我國、最佳、健康、防疫、方案等詞語,這些詞語情感底色偏向積極情緒。
通過對爬取的微博評論數(shù)據(jù)的前三百條評論人工情感標(biāo)注并訓(xùn)練,統(tǒng)計出帶有積極色彩的詞語占比為60%,帶有消極色彩的詞語占比為40%。將這兩類詞語的詞性占比作為“動態(tài)清零政策是我國抗疫總方針”話題下轉(zhuǎn)發(fā)網(wǎng)絡(luò)中最開始發(fā)表評論的用戶持有的情感先驗概率,也就是公式(1)和(2)中t=0時用戶的情感先驗概率,分別表示為P0(zP)=0.6,P0(zN)=0.4。
2.3 微博轉(zhuǎn)發(fā)網(wǎng)絡(luò)
由爬取的數(shù)據(jù)可知,每一位網(wǎng)絡(luò)用戶轉(zhuǎn)發(fā)微博時都會發(fā)表自己的觀點,因此將爬取的數(shù)據(jù)中存在轉(zhuǎn)發(fā)鏈接的用戶構(gòu)造轉(zhuǎn)發(fā)網(wǎng)絡(luò)圖,選取網(wǎng)絡(luò)用戶作為節(jié)點,以轉(zhuǎn)發(fā)為鏈接,轉(zhuǎn)發(fā)量為權(quán)重,依照信息流通方向構(gòu)造有向加權(quán)網(wǎng)絡(luò)圖,如圖4所示。
從圖4中可以看出網(wǎng)絡(luò)中有多個聚類中心,意味著聚類中心的網(wǎng)絡(luò)用戶發(fā)表的微博,被多位網(wǎng)絡(luò)用戶轉(zhuǎn)發(fā),并發(fā)表其觀點。圖4的模塊度達(dá)到0.825,說明該社會網(wǎng)絡(luò)各網(wǎng)絡(luò)用戶之間構(gòu)成的轉(zhuǎn)發(fā)關(guān)系幾乎不存在交互,平均轉(zhuǎn)發(fā)路徑長度為2.477,最長轉(zhuǎn)發(fā)路徑長度為8,即大多信息流通經(jīng)過了大約3位用戶,最多經(jīng)過了8位用戶且每一位用戶都發(fā)表了自己的觀點,那么該條轉(zhuǎn)發(fā)路徑每一位網(wǎng)絡(luò)用戶發(fā)表的微博評論的情感傾向都可以由式(1)和式(2)進(jìn)行計算。
根據(jù)數(shù)據(jù)可知該轉(zhuǎn)發(fā)網(wǎng)絡(luò)圖中點的中心度排名前5名的微博如表1所示。中心度高的節(jié)點將網(wǎng)絡(luò)中其他大部分節(jié)點連接,對信息流轉(zhuǎn)起到重要作用。從表1可以得出中心度最高的是“新華社”,其次是“何光偉”,前者是官方媒體,后者是普通網(wǎng)絡(luò)用戶,因此本文將分別對二者的信息流轉(zhuǎn)進(jìn)行分析,探究二者在觀點演化中的作用。
2.3.1 訓(xùn)練評論數(shù)據(jù)
以轉(zhuǎn)發(fā)為鏈接的微博觀點演化,可以通過對按照時間先后順序爬取的該話題的微博評論數(shù)據(jù)訓(xùn)練后進(jìn)行推測。對評論數(shù)據(jù)的訓(xùn)練關(guān)鍵是為了求出似然函數(shù),因此對爬取的前300條數(shù)據(jù)假設(shè)已知是積極或消極的觀點下,人工標(biāo)注評論中的關(guān)鍵詞,如果關(guān)鍵詞在消極的觀點中出現(xiàn)概率大,就定義為消極,反之為積極。在這個過程中拉普拉斯平滑系數(shù)分別選擇0.3,0.5和1。通過與300條訓(xùn)練數(shù)據(jù)對比,λ分別為0.3與0.5的準(zhǔn)確率都為75%,λ為1的準(zhǔn)確率達(dá)到78%,積極情緒的標(biāo)簽設(shè)置為0,召回率高達(dá)96%,消極情緒的標(biāo)簽設(shè)置為1,召回率為46%,可以看出模型對積極情緒的預(yù)測更為準(zhǔn)確,如表2所示,因此選取λ為1進(jìn)行計算。
消極情緒召回率不足50%,積極情緒的召回率卻高達(dá)96%,從圖5可以發(fā)現(xiàn)在訓(xùn)練的300條評論數(shù)據(jù)中,整體評論包含的詞匯數(shù)大多小于100個,對于積極評論與消極評論中小于100個的詞匯的數(shù)量沒有太大差別,但是100~125,125~150和大于150個詞匯的評論條數(shù)相差很大,尤其在125~150這個區(qū)間的評論數(shù)相差高達(dá)50倍,這可能導(dǎo)致消極詞匯在模型的訓(xùn)練中效果并不是很好。
2.3.2 以“新華社”為中心的觀點演化
對于以“新華社”發(fā)表的微博為中心的轉(zhuǎn)發(fā)網(wǎng)絡(luò)來說,“新華社”是該網(wǎng)絡(luò)中第一位發(fā)表微博的,因此其觀點的先驗概率設(shè)為P0(zN)=0.4,條件概率通過式(3)和式(4)計算得Pw新華社|zN=0.309,根據(jù)式(1)和(2)計算得到“新華社”發(fā)表的評論是消極觀點的概率Pt(zN)=0.304 525,是積極觀點的概率Pt(zP)=0.695 475。將得到“新華社”消極觀點和積極觀點的后驗概率作為轉(zhuǎn)發(fā)“新華社”微博用戶所持觀點是消極還是積極的先驗概率,其觀點的條件概率仍由式(3)和式(4)計算,由此便可以根據(jù)式(1)和(2)計算得到其所持觀點的后驗概率。通過計算,可以得到以“新華社”微博為中心的網(wǎng)絡(luò)用戶發(fā)表評論的情感傾向可以定性為積極的,實際轉(zhuǎn)發(fā)網(wǎng)絡(luò)如圖6所示。
從圖6可以看出在以“新華社”為中心的信息傳播中,轉(zhuǎn)發(fā)了“新華社”微博的網(wǎng)絡(luò)用戶,其觀點受到“新華社”微博的影響后,所持觀點都是積極的。在該信息流通中,最長路徑是經(jīng)過了3個用戶節(jié)點,經(jīng)觀察發(fā)現(xiàn)該路徑中,中間節(jié)點用戶是官方媒體,末端節(jié)點用戶是普通的網(wǎng)絡(luò)用戶,在經(jīng)過中間媒體加強(qiáng)引導(dǎo)后,普通網(wǎng)絡(luò)用戶受其影響所持觀點是積極的。按照轉(zhuǎn)發(fā)時間的先后,繪出兩種觀點概率的演化趨勢,如圖7所示。
從圖7可以看出帶話題轉(zhuǎn)發(fā)“新華社”微博的網(wǎng)絡(luò)用戶大多是官方媒體,官方媒體所持的觀點是積極的概率遠(yuǎn)大于消極的概率,對于普通用戶來說他們所持的兩種觀點的概率雖然都有所下降,但是積極觀點的概率還是大于消極觀點的概率,可以得出在信息傳播的過程中,官方媒體需要持續(xù)不斷強(qiáng)化網(wǎng)絡(luò)輿論的引導(dǎo)。
2.3.3 以“何光偉”為中心的觀點演化
對于以何光偉發(fā)表的微博為中心的轉(zhuǎn)發(fā)網(wǎng)絡(luò)來說,“何光偉”這個用戶節(jié)點并不是該網(wǎng)絡(luò)的起始節(jié)點,在這之前信息流通經(jīng)過了4個用戶節(jié)點,第1位用戶節(jié)點的id是“舊相識”,他首先發(fā)布微博,因此其先驗概率P0(zP)=0.6,條件概率通過式(3)和式(4)計算得到Pw舊相識|zN=0.057 915,因此根據(jù)式(1)和(2)經(jīng)過計算得到“舊相識”發(fā)表的評論是消極的后驗概率為Pt(zN)=0.619 013。同時此結(jié)果作為轉(zhuǎn)發(fā)其微博的“麥田蓑笠翁”的觀點為消極的先驗概率,其條件概率仍由式(3)和式(4)計算,得到Pw麥田蓑笠翁|zN=0.001 544,由此根據(jù)式(1)和(2)得到該用戶所持觀點為消極的后驗概率僅為Pt(zN)=0.121 764。通過貝葉斯更新法則,計算發(fā)現(xiàn)從“舊相識”到“何光偉”的轉(zhuǎn)發(fā)鏈,“舊相識”作為該轉(zhuǎn)發(fā)鏈的第1位用戶持有消極的觀點,第2、3位用戶持有積極的觀點,第4位用戶持有消極的觀點,最后“何光偉”持有積極的觀點,如圖8所示。
“何光偉”的觀點在受到第4位用戶消極影響之下持有觀點是積極的,轉(zhuǎn)發(fā)其微博的用戶的觀點除了“一片云的精彩20863”通過公式計算是消極的其他用戶都是積極的,如圖9所示。從圖9可以看出有兩條轉(zhuǎn)發(fā)鏈經(jīng)過了8位用戶,這兩條轉(zhuǎn)發(fā)路徑中,只有“舊相識”與“金陵郭建”持消極的觀點,其他用戶都持有積極的觀點。通過分析可以發(fā)現(xiàn)大多數(shù)網(wǎng)絡(luò)用戶在轉(zhuǎn)發(fā)鄰居用戶微博時,鄰居用戶觀點對網(wǎng)絡(luò)用戶觀點的影響多為同向影響,即鄰居用戶持積極觀點,轉(zhuǎn)發(fā)其微博的網(wǎng)絡(luò)用戶也持積極的觀點。普通網(wǎng)絡(luò)用戶發(fā)表的觀點對網(wǎng)絡(luò)中其他用戶的影響并不是全面的,部分用戶出于對該用戶所持觀點并不信任的原因,所持有的觀點會與該用戶相反。
3 結(jié)論
本文利用Python編寫爬蟲代碼獲取帶有“動態(tài)清零政策是我國抗疫總方針”話題的微博評論,在對爬取的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理的基礎(chǔ)上,下載停用詞并結(jié)合分詞技術(shù)對評論內(nèi)容進(jìn)行處理。從微博情感演化趨勢的角度出發(fā),結(jié)合貝葉斯更新法則,計算得出不同轉(zhuǎn)發(fā)鏈上各用戶所持的情感觀點,并利用Gephi平臺,分別畫出以官方媒體和普通公眾為中心的整個輿情信息的情感傳播網(wǎng)絡(luò)圖,找到輿情信息傳播特點及用戶之間的情感影響,得出結(jié)論:1)對于“動態(tài)清零政策是我國抗疫總方針”該政策的發(fā)布,官方媒體可以加強(qiáng)輿論引導(dǎo)。從上文可以得到部分普通公眾對該政策是持有消極觀念點的,但從以“新華社”為中心的輿情演化可以看出,轉(zhuǎn)發(fā)官方媒體微博的普通網(wǎng)絡(luò)用戶,受官方媒體的影響,所持有的觀點與官方媒體持是一致的,與此相反的是以“何光偉”為中心的輿情演化,可以看出轉(zhuǎn)發(fā)普通公眾微博的網(wǎng)絡(luò)用戶,部分網(wǎng)絡(luò)用戶的觀點甚至與該公眾截然相反。造成該結(jié)果的可能原因是官方媒體有著意見領(lǐng)袖的圈層影響力,并能憑借自身公信力讓普通公眾信服其觀點,相反普通公眾就不存在公信力,普通用戶對其所持有的觀點會保有懷疑的態(tài)度,因此官方媒體可以以通過本身龐大的粉絲量級以及意見領(lǐng)袖的圈層影響力,增大微博內(nèi)容曝光率,強(qiáng)化主流正向輿論對用戶的影響。2)輿情的傳播網(wǎng)絡(luò)圖中展示了有利于正確引導(dǎo)公眾情緒的關(guān)鍵用戶。從表1可以得到中心度排名前五的用戶,這些中心活躍用戶對其他用戶的影響作用非常大。尤其是“新華社”和“何光偉”,不僅影響輿情信息的傳播,還影響公眾的情緒,而且通過分析發(fā)現(xiàn),這種影響多為同向的影響,即持有積極觀點的博文,轉(zhuǎn)發(fā)該博文的用戶所持觀點通過計算發(fā)現(xiàn)也多為積極的,持有消極觀點的博文,轉(zhuǎn)發(fā)該博文的用戶所持觀點通過計算發(fā)現(xiàn)也多為消極的。因此,中心度強(qiáng)的用戶所持有觀點的積極性對控制輿情會起到良好效果。
本文通過將情感觀點的演化與網(wǎng)絡(luò)分析結(jié)合,利用貝葉斯更新法則,對該話題下以官方媒體和普通公眾為中心的輿情觀點演化進(jìn)行了分析。但是在建立的關(guān)于“動態(tài)清零政策是我國抗疫總方針”的微博情感演化基礎(chǔ)上,還可以進(jìn)一步將用戶微博評論情感傾向假設(shè)為用戶自已的觀點與對近鄰用戶的信任程度的加權(quán)共同影響;同時還可以探究用戶的情感傾向與地域、性別、年齡、教育經(jīng)歷、粉絲數(shù)目等的相關(guān)關(guān)系,結(jié)合SVM、邏輯回歸等機(jī)器學(xué)習(xí)模型,做出微博用戶輿情畫像,及時預(yù)測用戶觀點演化趨勢并做出引導(dǎo)。
參考文獻(xiàn):
[1]中國互聯(lián)網(wǎng)絡(luò)中心.第49次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[R].北京:中國互聯(lián)網(wǎng)絡(luò)中心,2022.
China Internet Network Information Center. The 49th China statistical report on internet development [R].Beijing: CNNI,2022.
[2]李慧, 王麗婷.基于詞項熱度的微博熱點話題發(fā)現(xiàn)研究[J]. 情報科學(xué),2018,36(4):45-50.
LI H, WANG L T.Research on microblog hot topic discovery based on word item popularity[J]. Information Science, 2018,36(4): 45-50.
[3]陳娟,劉燕平,鄧勝利.政務(wù)微博辟謠信息傳播效果的影響因素研究[J].情報科學(xué),2018,36(1):91-95.
CHEN J, LIU Y P, DENG S L. Research on the influencing factors of information dissemination effect of government microblog dispelling rumors[J].? Information Science, 2018, 36(1): 91-95.
[4]陳春陽,黃秀玲. 微博輿情的生成機(jī)制和傳播規(guī)律研究[J]. 情報科學(xué),2018, 36(4):32-37.
CHEN C Y, HUANG X L. Research on generation mechanism and propagation law of microblog public opinion [J].Information Science, 2018, 36(4): 32-37.
[5]紀(jì)雪梅. 特定事件情境下中文微博用戶情感挖掘與傳播研究[D]. 天津:南開大學(xué),2014.
JI X M. Research on sentiment mining and communication of Chinese microblog users in specific event context[D]. Tianjin: Nankai University, 2014.
[6]張鵬,蘭月新,李昊青,等. 基于HAYASHI數(shù)量化理論的網(wǎng)絡(luò)謠言分類應(yīng)對策略分析[J]. 情報雜志,2016,35(1):110-115.
ZHANG P, LAN Y X, LI H Q, et al. Analysis of internet rumor classification based on HAYASHI quantification theory [J]. Journal of Information, 2016, 35(1): 110-115.
[7]楊爽,陳芬. 基于SVM多特征融合的微博情感多級分類研究[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2017, 1(2):73-79.
YANG S, CHEN F. Research on micro-blog sentiment multi-level classification based on SVM multi-feature fusion [J]. Data Analysis and Knowledge Discovery, 2017, 1(2): 73-79.
[8]徐軍,丁宇新,王曉龍. 使用機(jī)器學(xué)習(xí)方法進(jìn)行新聞的情感自動分類[J]. 中文信息學(xué)報,2007(6):95-100.
XU J, DING Y X, WANG X L. Automatic sentiment classification of news based on machine learning[J].? Journal of Information Science, 2007(6): 95-100.
[9]WAJDI A, FURQAN R, MOHAMED W M, et al. Sentiment analysis on twitter data integrating textBlob and deep learning models: The case of US airline industry[J]. Knowledge-Based Systems, 2022, 255: 109780.
[10] FITRI? V? A, ANDRESWARI? R, HASIBUAN M? A. Sentiment analysis of social media twitter with case of anti-LGBT campaign in Indonesia using nave bayes, decision tree, and random forest algorithm[J]. Procedia Computer Science, 2019, 161: 765-772.
[11] RUZ G A, HENRIQUZE P A, MASCARENO A. Sentiment analysis of Twitter data during critical events through Bayesian networks classifiers[J]. Future Generation Computer Systems, 2020, 106: 92-104.
[12] BILAL M, ISRAR H, SHAHID M, et al. Sentiment classification of Roman-Urdu opinions using nave bayesian, decision tree and KNN classification techniques[J]. Journal of King Saud University-Computer and Information Sciences, 2016, 28(3): 330-344.
[13] NGUYEN D A, NGO V L, NGUYEN K A, et al. Boosting prior knowledge in streaming variational Bayes[J]. Neurocomputing, 2021, 424: 143-159.
[14] KRAFFT P M, SHMUELI E, GRIFFITHS T L, et al. Bayesian collective learning emerges from heuristic social learning[J]. Cognition, 2021, 212: 104469.
[15] JADBABAIE A, MOLAVI P, SANDRONI A, et al. Non-Bayesian social learning[J]. Games and Economic Behavior, 2012, 76(1): 210-225.
[16] FANG A L. The influence of communication structure on opinion dynamics in social networks with multiple true states[J]. Applied Mathematics and Computation, 2021, 406: 126262.
[17] NAVARRO D J, PERFORS A, KARY A, et al. When extremists win: cultural transmission via iterated learning when populations are heterogeneous[J]. Cognitive Science, 2018, 42(7): 2108-2149.
[18] THOMPSON B, GRIFFITHS T. Inductive biases constrain cumulative cultural evolution[C]//Colleen M. Proceedings of the 41th Annual Meeting of the Cognitive Science Society. Canada: CogSci, 2019: 1111-1117.
[19] HSU C C, AJORLOU A, JADBABAIE A. A theory of misinformation spread on social networks[J]. SSRN Electronic Journal, 2019:3391585.
[20] ZERVOUDAKIS S, MARAKAKIS E, KONDYLAKIS H, et al. Opinion mine: a Bayesian-based framework for opinion mining using twitter data[J]. Machine Learning with Applications, 2021, 3: 100018.
[21] PINKERTON B, Finding what people want: experiences with the WebCrawler[C]// Proceedings of the 2nd International World Wide Web. Medford, NJ, USA: Learned Information, 1994.
[22] AHMADI-ABKENARI F, SELAMAT A. An architecture for a focused trend parallel Web crawler with the application of clickstream analysis[J]. Information Sciences, 2012, 184(1): 266-281.
(責(zé)任編輯 耿金花)
收稿日期: 2022-10-31;修回日期:2022-11-18
基金項目: 國家自然科學(xué)基金(62273172);山東省自然科學(xué)基金(ZR2020MF078)
第一作者: 劉穎(1998-),女,山東蓬萊人,碩士研究生,主要研究方向為數(shù)據(jù)挖掘與分析。
通信作者: 方愛麗(1971-),女,山東蓬萊人,博士,副教授,主要研究方向為復(fù)雜網(wǎng)絡(luò)理論與應(yīng)用。