俞定國 孫學(xué)敏 朱 琳 劉良模
情感是預(yù)測網(wǎng)絡(luò)輿情的風向標,也是觸發(fā)輿情事件的重要因素。情感社會學(xué)家帕累托認為公共事件中情感對行動產(chǎn)生的作用及影響更大。[1]突發(fā)公共衛(wèi)生事件與人的生命安全息息相關(guān),具有前兆性缺失、持續(xù)性誘發(fā)、不確定性、快速傳播等特點,容易造成公眾恐慌和焦慮,情感共鳴現(xiàn)象愈發(fā)強烈[2],產(chǎn)生的影響不會只局限于個別群體或單獨區(qū)域,且話題中一旦含有虛假信息,極易引起輿情危機。情感傾向作為一種社會屬性對研究突發(fā)事件輿情傳播具有重要作用[3]。目前,輿情信息處理方法主要是利用深度學(xué)習(xí)從海量文本中挖掘情感信息,試圖建立適用于多類型事件的標準化模型,很少從情感社會學(xué)角度結(jié)合定量方法對情感本體作出深度解讀。本文將從三個方面進行探討:一是基于情感社會學(xué)理論,構(gòu)建突發(fā)公共衛(wèi)生事件的輿情分析模型,為突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情治理提供新思路;二是基于Word2Vec-BiLSTM神經(jīng)網(wǎng)絡(luò),以提高情感傾向的預(yù)測效果;三是在已構(gòu)建模型與理論基礎(chǔ)上,從情感喚醒、認知歸因、情感移情三個維度展開分析。具體以吉林省新冠疫情為例,依據(jù)時間序列對事件中輿情主客體進行綜合分析,探究公眾情感變化特征,深度解讀情感本體與輿情事件之間的關(guān)系。
社會學(xué)對情感的研究主要著眼于情感和社會的互動關(guān)系。情感社會學(xué)作為社會學(xué)的分支已應(yīng)用于網(wǎng)絡(luò)輿情研究,如彭廣林[4]認為網(wǎng)絡(luò)輿情研究應(yīng)實現(xiàn)顯輿論轉(zhuǎn)向潛輿論、輿情本體轉(zhuǎn)向輿情主體、危機管理轉(zhuǎn)向綜合治理;余紅[5]等人基于情感社會學(xué)分析敏感熱點輿情的發(fā)生演化動力機制。本文基于情感社會學(xué)理論,從情感喚醒、歸因與移情構(gòu)建面向突發(fā)公共衛(wèi)生事件的輿情分析模型。情感喚醒、歸因與移情是情感產(chǎn)生的要素,情感喚醒是經(jīng)過外界刺激、主觀認知經(jīng)驗,產(chǎn)生反應(yīng)的心理狀態(tài);歸因源于格式塔心理學(xué),是一種認知基模不斷變化的過程,其結(jié)果會影響情感,是情感喚醒機制的前提;情感移情是一種情感聚集與情感擴散機制,因他人境遇映射產(chǎn)生的情感反應(yīng)。
情感分析方法主要有情感詞典、機器學(xué)習(xí)及深度學(xué)習(xí)?;谇楦性~典的分析方法通過構(gòu)建情感詞典[6]實現(xiàn)情感極性劃分,但一些網(wǎng)絡(luò)用語和集外詞給情感詞典構(gòu)建帶來不便,需要不斷更新擴展,耗費大量時間和精力。機器學(xué)習(xí)方法包括支持向量機[7]、樸素貝葉斯、隨機森林和深度森林,但該方法也存在一定缺陷,未能充分利用語義信息。因此,深度學(xué)習(xí)算法開始被廣泛應(yīng)用于這一領(lǐng)域,該方法利用人工智能神經(jīng)網(wǎng)絡(luò)深度挖掘語言知識,逐漸成為情感分析的主流方法。針對情感分析的研究不斷深入,一方面體現(xiàn)在算法的創(chuàng)新。目前,國內(nèi)外學(xué)者創(chuàng)新混合的模型算法,可以有效彌補單一模型存在的不足,成為主流的情感分析模型。另一方面是其應(yīng)用領(lǐng)域的延伸,如商品評論,股票預(yù)測及網(wǎng)絡(luò)社交媒體。
針對突發(fā)公共衛(wèi)生事件,構(gòu)建Word2Vec-BiLSTM模型,從情感社會學(xué)理論視角分析突發(fā)公共衛(wèi)生事件輿情,為突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情治理提供新思路。
該模型由數(shù)據(jù)處理層、情感分析層與輿情分析層三部分組成?;跀?shù)據(jù)處理層得到規(guī)則化的文本數(shù)據(jù);基于情感分類層預(yù)測情感傾向;基于時間序列結(jié)合生命周期理論、情感社會學(xué)理論進行輿情分析。模型結(jié)構(gòu)見圖1。
圖1 突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情分析模型
在對網(wǎng)絡(luò)輿情分析前需要對獲取數(shù)據(jù)進行規(guī)則化處理。數(shù)據(jù)處理層是輿情分析的基礎(chǔ)環(huán)節(jié),主要對文本進行清洗,包括去除無效文本、垃圾廣告、特殊符號、空格和表情符號;對文本進行分詞、停用詞過濾等。
1.詞向量
將文本中對應(yīng)的詞語以向量的形式表示。使用Word2 Vec詞向量訓(xùn)練模型,基于SGNS(Skip-Gram with Negative Sampling)訓(xùn)練的中文維基百科文本語料集合而成的詞向量,抽取生成本文語料的詞向量。
2.BiLSTM算法
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)通過增加長期狀態(tài)Ct實現(xiàn)長期狀態(tài)信息的保存。LSTM由遺忘門ft、輸入門it及輸出門Ot組成,計算公式如①-⑥所示:
其中Wf、Wc、Wi與Wo代表權(quán)重,bf、bc、bi和bo代表偏置值。
基于情感分類層預(yù)測情感傾向是輿情分析的關(guān)鍵。學(xué)者在研究過程中一般引入生命周期理論,實現(xiàn)輿情傳播階段劃分。如任凱[8]等將輿情劃分為潛伏期、擴散期、爆發(fā)期、波動期和衰退期;宴敬東[9]等將輿情劃分為潛伏期、預(yù)熱期、熱議期和衰退期;劉國威[10]等將輿情演變劃分為醞釀期、爆發(fā)期與衰退期。也有學(xué)者將發(fā)文量、轉(zhuǎn)發(fā)量與評論量、情感分析值及百度指數(shù)與周期理論結(jié)合作為輿情周期劃分的指標,但并沒有統(tǒng)一的劃分標準。本文引入權(quán)威百度指數(shù)與周期理論共同作為輿情周期的劃分依據(jù)。
以“吉林疫情”為關(guān)鍵詞,按時間順序爬取2022年2月28日—2022年5月5日的微博數(shù)據(jù),共62445條。考慮到官方主流媒體發(fā)布的信息對網(wǎng)民有預(yù)“情感設(shè)置”功能,剔除官方賬號發(fā)布內(nèi)容,最終得到42229條數(shù)據(jù)。
本文實驗環(huán)境基于PyTorch實現(xiàn),設(shè)置模型參數(shù)。
將人工標注數(shù)據(jù)分為訓(xùn)練集、測試集和驗證集,采用準確率及綜合度量指標F1值評估模型。模型預(yù)測性最終達77%,可用于“吉林疫情”中輿情主體情緒分析。
本文以百度指數(shù)與生命周期理論作為輿情劃分依據(jù),將此事件劃為醞釀期(2022年2月28日—2022年3月8日)、爆發(fā)期(2022年3月9日—2022年3月22日)、波動期(2022年3月23日—2022年4月8日)與消退期(2022年4月9日—2022年5月5日),見圖2。
圖2 吉林省新冠疫情百度指數(shù)
根據(jù)圖2輿情階段劃分,統(tǒng)計情感分類結(jié)果,見表1。消極情緒在波動期占比最高,達到46.4%。但總體上積極與理智情感占比較高,也從側(cè)面說明輿情主體的消極表現(xiàn)與疫情的嚴重程度簡單共振,存在更大理性空間。
表1 輿情各階段情感分類統(tǒng)計
為剖析吉林省疫情傳播周期內(nèi)拐點出現(xiàn)的原因,用戶的情感特征及變化的原因,利用TF-IDF算法提取不同輿情階段文本的關(guān)鍵詞繪制詞云圖,見圖3。
圖3 不同階段關(guān)鍵詞云分析
1.醞釀期:認知歸因未觸及非理性情感機制
認知歸因是情感喚醒的前提,當事件中包含的信息刺激公眾認知時,情感會在短時間被喚醒。2月28日,吉林省琿春市最先發(fā)現(xiàn)陽性病例,經(jīng)專家研判此次病毒傳播呈現(xiàn)出傳播性強、隱匿性強等特點。圖3(a)顯示“疫情”“確診”“病例”等主題詞出現(xiàn)頻次最高,說明公眾對吉林疫情的關(guān)注表現(xiàn)為通過新聞發(fā)布會、新聞報道等權(quán)威信息了解疫情動態(tài)。在輿情醞釀階段,吉林市每天官方通報感染人數(shù)只有零星幾例。自2019年底疫情暴發(fā)至今,人們將這一漫長時期存于記憶中,形成認知基礎(chǔ)。當類似事件發(fā)生時,會刺激大腦已有的認知記憶網(wǎng)絡(luò)。雖然輿情主體的負面情緒呈現(xiàn)增長,但這種非理性情感并沒有完全被喚醒,而是與理性相互交織,理性在一定程度占據(jù)主導(dǎo)地位。
2.爆發(fā)期:情感移情背后的“價值”轉(zhuǎn)向
情感移情意味著某些群體身上發(fā)生的事件能夠引起真實情感的出現(xiàn),從而引發(fā)情感聚集。其通過“中介”認知歸因,喚醒相應(yīng)情感類型,進而影響輿情走勢。在輿情爆發(fā)階段,感染人數(shù)逐漸上升,尤其在3月9日—11日期間輿情主體的消極與積極情緒出現(xiàn)“高峰低谷”現(xiàn)象。主要由于吉林出現(xiàn)校園聚集性疫情,學(xué)生作為受保護群體而廣受社會關(guān)注,注意力的投射喚起人們心理上的共情氛圍。校園疫情發(fā)生后,網(wǎng)民情緒頓時高漲,認知理性受到?jīng)_擊,成為負面情緒的集中爆發(fā)期。圖3(b)“拜托”“結(jié)束”等詞包含了人們對高校防疫滯后導(dǎo)致蔓延的無奈與質(zhì)疑,以及對高校學(xué)生生命健康的擔憂。大量網(wǎng)民在微博發(fā)文呼吁主流媒體發(fā)聲,推動地方政府及時介入并啟動輿情應(yīng)急管理機制,對相關(guān)涉事人員進行問責處置。負面情緒逐漸得到消減,公眾焦點再次轉(zhuǎn)回疫情防控,“希望”“加油”“公益”“捐款”等積極情感傾向的表述明顯增加,表示人們團結(jié)一致共同抗疫,體現(xiàn)了情感背后的“共同價值”,積極情緒呈現(xiàn)上升趨勢。
3.波動期:認知歸因觸發(fā)情感意識重塑與增強
在信息資源接觸有限致認知歸因不確定的情況下,主體情感意識會加強。波動階段每天新增感染人數(shù)破千,諸如“長春朝陽溝殯儀館成隔離場所”“四平鐵東區(qū)某小區(qū)提前解封”“白山支援長春人員沒有住處”等謠言不斷滋生,主體信息訴求得不到滿足。隨著感染人數(shù)激增,人們對自身及周圍環(huán)境安全產(chǎn)生的恐慌情感被激發(fā),消極情緒明顯呈上升趨勢,積極情緒逐漸下降。圖3(c)“真的”“希望”“加油”雜糅了主體復(fù)雜的情感色彩:對病毒的怨恨,對長時間封閉式管理的焦慮以及對疫情結(jié)束的期盼。積極、消極及理性情感擴散到公眾彼此的互動中,相互交織、此消彼長,主體表現(xiàn)出理性與感性共存的復(fù)雜狀態(tài)。
4.消退期:情感喚醒與認知歸因通過移情共同作用于輿情消減
在輿情消退時期,吉林省本地疫情處于穩(wěn)定階段。根據(jù)相關(guān)報道,吉林在這一階段實現(xiàn)社會面清零,但很多地區(qū)并未立刻解封。消退前期各類情緒都出現(xiàn)明顯的小頻率波動,但總體而言積極和理性情緒逐漸下降并趨于平穩(wěn)。一方面,隨時間推移,吉林省成功控制疫情,實現(xiàn)社會清零。圖3(d)“解封”“結(jié)束”“希望”等積極信息話題涌現(xiàn),體現(xiàn)主體風險感知下降。另一方面,25日前后吉林省政府發(fā)布高校學(xué)生放假通知,“回家”這一新的話題再次吸引網(wǎng)民注意力。吉林省雖實現(xiàn)解封,但各地返鄉(xiāng)政策標準不一,學(xué)生面臨如何回家、回家是否會繼續(xù)隔離等固有認知再次啟動情感喚醒機制,擔憂與困擾情緒滋生,導(dǎo)致消退期中后段負面情緒出現(xiàn)回升。隨著各地針對吉林省返鄉(xiāng)政策的落實、推進,負面情感密度下降,輿情信息傳播量遞減,人們的關(guān)注度下降。
經(jīng)分析發(fā)現(xiàn),情感喚醒、認知歸因與情感移情貫穿事件各個階段,主體情感變化與客體事件的發(fā)展相吻合。情感通過移情強化表達效果以推動輿情發(fā)展,而輿情事件通過影響人的固有認知喚醒情感。在整個疫情階段,爆發(fā)期與波動期的主體情感交織出現(xiàn)。在具體輿情事件的觸發(fā)下,主體在各個階段的情感隨周期變化而變化。但總體來看,此次疫情中主體消極情緒表現(xiàn)與疫情的嚴重程度簡單共振。在疫情防控常態(tài)化背景下,主體情緒存在更大的理性空間。但輿情監(jiān)管部門更應(yīng)注意公眾情緒引發(fā)的負面效應(yīng),如在輿情爆發(fā)階段,政府及相關(guān)部門應(yīng)及時啟動輿情應(yīng)急機制,定位負面情緒累積形成的非理性歸因;在波動期,媒體及政府應(yīng)及時辟謠,發(fā)揮權(quán)威信息發(fā)布的優(yōu)勢,擴散正向情感;在消退期,各地加強對疫情防控地區(qū)相關(guān)政策落實情況的披露,從根本上疏導(dǎo)和控制負面輿情。
本文基于情感社會學(xué)理論和Word2Vec-BiLSTM模型的情感測量方法,從情感喚醒、歸因及情感移情三個維度分析輿情主體情感變化特征及誘因,并提出相應(yīng)對策。未來在模型設(shè)計上將會考慮表情符號對文本語義挖掘的影響;情感上融合地理空間角度把握情感特征分布;輿情引導(dǎo)上將情感疏導(dǎo)與技術(shù)處理相結(jié)合,實現(xiàn)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情綜合治理。