俞定國(guó) 孫學(xué)敏 朱 琳 劉良模
情感是預(yù)測(cè)網(wǎng)絡(luò)輿情的風(fēng)向標(biāo),也是觸發(fā)輿情事件的重要因素。情感社會(huì)學(xué)家帕累托認(rèn)為公共事件中情感對(duì)行動(dòng)產(chǎn)生的作用及影響更大。[1]突發(fā)公共衛(wèi)生事件與人的生命安全息息相關(guān),具有前兆性缺失、持續(xù)性誘發(fā)、不確定性、快速傳播等特點(diǎn),容易造成公眾恐慌和焦慮,情感共鳴現(xiàn)象愈發(fā)強(qiáng)烈[2],產(chǎn)生的影響不會(huì)只局限于個(gè)別群體或單獨(dú)區(qū)域,且話題中一旦含有虛假信息,極易引起輿情危機(jī)。情感傾向作為一種社會(huì)屬性對(duì)研究突發(fā)事件輿情傳播具有重要作用[3]。目前,輿情信息處理方法主要是利用深度學(xué)習(xí)從海量文本中挖掘情感信息,試圖建立適用于多類(lèi)型事件的標(biāo)準(zhǔn)化模型,很少?gòu)那楦猩鐣?huì)學(xué)角度結(jié)合定量方法對(duì)情感本體作出深度解讀。本文將從三個(gè)方面進(jìn)行探討:一是基于情感社會(huì)學(xué)理論,構(gòu)建突發(fā)公共衛(wèi)生事件的輿情分析模型,為突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情治理提供新思路;二是基于Word2Vec-BiLSTM神經(jīng)網(wǎng)絡(luò),以提高情感傾向的預(yù)測(cè)效果;三是在已構(gòu)建模型與理論基礎(chǔ)上,從情感喚醒、認(rèn)知?dú)w因、情感移情三個(gè)維度展開(kāi)分析。具體以吉林省新冠疫情為例,依據(jù)時(shí)間序列對(duì)事件中輿情主客體進(jìn)行綜合分析,探究公眾情感變化特征,深度解讀情感本體與輿情事件之間的關(guān)系。
社會(huì)學(xué)對(duì)情感的研究主要著眼于情感和社會(huì)的互動(dòng)關(guān)系。情感社會(huì)學(xué)作為社會(huì)學(xué)的分支已應(yīng)用于網(wǎng)絡(luò)輿情研究,如彭廣林[4]認(rèn)為網(wǎng)絡(luò)輿情研究應(yīng)實(shí)現(xiàn)顯輿論轉(zhuǎn)向潛輿論、輿情本體轉(zhuǎn)向輿情主體、危機(jī)管理轉(zhuǎn)向綜合治理;余紅[5]等人基于情感社會(huì)學(xué)分析敏感熱點(diǎn)輿情的發(fā)生演化動(dòng)力機(jī)制。本文基于情感社會(huì)學(xué)理論,從情感喚醒、歸因與移情構(gòu)建面向突發(fā)公共衛(wèi)生事件的輿情分析模型。情感喚醒、歸因與移情是情感產(chǎn)生的要素,情感喚醒是經(jīng)過(guò)外界刺激、主觀認(rèn)知經(jīng)驗(yàn),產(chǎn)生反應(yīng)的心理狀態(tài);歸因源于格式塔心理學(xué),是一種認(rèn)知基模不斷變化的過(guò)程,其結(jié)果會(huì)影響情感,是情感喚醒機(jī)制的前提;情感移情是一種情感聚集與情感擴(kuò)散機(jī)制,因他人境遇映射產(chǎn)生的情感反應(yīng)。
情感分析方法主要有情感詞典、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)?;谇楦性~典的分析方法通過(guò)構(gòu)建情感詞典[6]實(shí)現(xiàn)情感極性劃分,但一些網(wǎng)絡(luò)用語(yǔ)和集外詞給情感詞典構(gòu)建帶來(lái)不便,需要不斷更新擴(kuò)展,耗費(fèi)大量時(shí)間和精力。機(jī)器學(xué)習(xí)方法包括支持向量機(jī)[7]、樸素貝葉斯、隨機(jī)森林和深度森林,但該方法也存在一定缺陷,未能充分利用語(yǔ)義信息。因此,深度學(xué)習(xí)算法開(kāi)始被廣泛應(yīng)用于這一領(lǐng)域,該方法利用人工智能神經(jīng)網(wǎng)絡(luò)深度挖掘語(yǔ)言知識(shí),逐漸成為情感分析的主流方法。針對(duì)情感分析的研究不斷深入,一方面體現(xiàn)在算法的創(chuàng)新。目前,國(guó)內(nèi)外學(xué)者創(chuàng)新混合的模型算法,可以有效彌補(bǔ)單一模型存在的不足,成為主流的情感分析模型。另一方面是其應(yīng)用領(lǐng)域的延伸,如商品評(píng)論,股票預(yù)測(cè)及網(wǎng)絡(luò)社交媒體。
針對(duì)突發(fā)公共衛(wèi)生事件,構(gòu)建Word2Vec-BiLSTM模型,從情感社會(huì)學(xué)理論視角分析突發(fā)公共衛(wèi)生事件輿情,為突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情治理提供新思路。
該模型由數(shù)據(jù)處理層、情感分析層與輿情分析層三部分組成?;跀?shù)據(jù)處理層得到規(guī)則化的文本數(shù)據(jù);基于情感分類(lèi)層預(yù)測(cè)情感傾向;基于時(shí)間序列結(jié)合生命周期理論、情感社會(huì)學(xué)理論進(jìn)行輿情分析。模型結(jié)構(gòu)見(jiàn)圖1。
圖1 突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情分析模型
在對(duì)網(wǎng)絡(luò)輿情分析前需要對(duì)獲取數(shù)據(jù)進(jìn)行規(guī)則化處理。數(shù)據(jù)處理層是輿情分析的基礎(chǔ)環(huán)節(jié),主要對(duì)文本進(jìn)行清洗,包括去除無(wú)效文本、垃圾廣告、特殊符號(hào)、空格和表情符號(hào);對(duì)文本進(jìn)行分詞、停用詞過(guò)濾等。
1.詞向量
將文本中對(duì)應(yīng)的詞語(yǔ)以向量的形式表示。使用Word2 Vec詞向量訓(xùn)練模型,基于SGNS(Skip-Gram with Negative Sampling)訓(xùn)練的中文維基百科文本語(yǔ)料集合而成的詞向量,抽取生成本文語(yǔ)料的詞向量。
2.BiLSTM算法
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)通過(guò)增加長(zhǎng)期狀態(tài)Ct實(shí)現(xiàn)長(zhǎng)期狀態(tài)信息的保存。LSTM由遺忘門(mén)ft、輸入門(mén)it及輸出門(mén)Ot組成,計(jì)算公式如①-⑥所示:
其中Wf、Wc、Wi與Wo代表權(quán)重,bf、bc、bi和bo代表偏置值。
基于情感分類(lèi)層預(yù)測(cè)情感傾向是輿情分析的關(guān)鍵。學(xué)者在研究過(guò)程中一般引入生命周期理論,實(shí)現(xiàn)輿情傳播階段劃分。如任凱[8]等將輿情劃分為潛伏期、擴(kuò)散期、爆發(fā)期、波動(dòng)期和衰退期;宴敬東[9]等將輿情劃分為潛伏期、預(yù)熱期、熱議期和衰退期;劉國(guó)威[10]等將輿情演變劃分為醞釀期、爆發(fā)期與衰退期。也有學(xué)者將發(fā)文量、轉(zhuǎn)發(fā)量與評(píng)論量、情感分析值及百度指數(shù)與周期理論結(jié)合作為輿情周期劃分的指標(biāo),但并沒(méi)有統(tǒng)一的劃分標(biāo)準(zhǔn)。本文引入權(quán)威百度指數(shù)與周期理論共同作為輿情周期的劃分依據(jù)。
以“吉林疫情”為關(guān)鍵詞,按時(shí)間順序爬取2022年2月28日—2022年5月5日的微博數(shù)據(jù),共62445條??紤]到官方主流媒體發(fā)布的信息對(duì)網(wǎng)民有預(yù)“情感設(shè)置”功能,剔除官方賬號(hào)發(fā)布內(nèi)容,最終得到42229條數(shù)據(jù)。
本文實(shí)驗(yàn)環(huán)境基于PyTorch實(shí)現(xiàn),設(shè)置模型參數(shù)。
將人工標(biāo)注數(shù)據(jù)分為訓(xùn)練集、測(cè)試集和驗(yàn)證集,采用準(zhǔn)確率及綜合度量指標(biāo)F1值評(píng)估模型。模型預(yù)測(cè)性最終達(dá)77%,可用于“吉林疫情”中輿情主體情緒分析。
本文以百度指數(shù)與生命周期理論作為輿情劃分依據(jù),將此事件劃為醞釀期(2022年2月28日—2022年3月8日)、爆發(fā)期(2022年3月9日—2022年3月22日)、波動(dòng)期(2022年3月23日—2022年4月8日)與消退期(2022年4月9日—2022年5月5日),見(jiàn)圖2。
圖2 吉林省新冠疫情百度指數(shù)
根據(jù)圖2輿情階段劃分,統(tǒng)計(jì)情感分類(lèi)結(jié)果,見(jiàn)表1。消極情緒在波動(dòng)期占比最高,達(dá)到46.4%。但總體上積極與理智情感占比較高,也從側(cè)面說(shuō)明輿情主體的消極表現(xiàn)與疫情的嚴(yán)重程度簡(jiǎn)單共振,存在更大理性空間。
表1 輿情各階段情感分類(lèi)統(tǒng)計(jì)
為剖析吉林省疫情傳播周期內(nèi)拐點(diǎn)出現(xiàn)的原因,用戶(hù)的情感特征及變化的原因,利用TF-IDF算法提取不同輿情階段文本的關(guān)鍵詞繪制詞云圖,見(jiàn)圖3。
圖3 不同階段關(guān)鍵詞云分析
1.醞釀期:認(rèn)知?dú)w因未觸及非理性情感機(jī)制
認(rèn)知?dú)w因是情感喚醒的前提,當(dāng)事件中包含的信息刺激公眾認(rèn)知時(shí),情感會(huì)在短時(shí)間被喚醒。2月28日,吉林省琿春市最先發(fā)現(xiàn)陽(yáng)性病例,經(jīng)專(zhuān)家研判此次病毒傳播呈現(xiàn)出傳播性強(qiáng)、隱匿性強(qiáng)等特點(diǎn)。圖3(a)顯示“疫情”“確診”“病例”等主題詞出現(xiàn)頻次最高,說(shuō)明公眾對(duì)吉林疫情的關(guān)注表現(xiàn)為通過(guò)新聞發(fā)布會(huì)、新聞報(bào)道等權(quán)威信息了解疫情動(dòng)態(tài)。在輿情醞釀階段,吉林市每天官方通報(bào)感染人數(shù)只有零星幾例。自2019年底疫情暴發(fā)至今,人們將這一漫長(zhǎng)時(shí)期存于記憶中,形成認(rèn)知基礎(chǔ)。當(dāng)類(lèi)似事件發(fā)生時(shí),會(huì)刺激大腦已有的認(rèn)知記憶網(wǎng)絡(luò)。雖然輿情主體的負(fù)面情緒呈現(xiàn)增長(zhǎng),但這種非理性情感并沒(méi)有完全被喚醒,而是與理性相互交織,理性在一定程度占據(jù)主導(dǎo)地位。
2.爆發(fā)期:情感移情背后的“價(jià)值”轉(zhuǎn)向
情感移情意味著某些群體身上發(fā)生的事件能夠引起真實(shí)情感的出現(xiàn),從而引發(fā)情感聚集。其通過(guò)“中介”認(rèn)知?dú)w因,喚醒相應(yīng)情感類(lèi)型,進(jìn)而影響輿情走勢(shì)。在輿情爆發(fā)階段,感染人數(shù)逐漸上升,尤其在3月9日—11日期間輿情主體的消極與積極情緒出現(xiàn)“高峰低谷”現(xiàn)象。主要由于吉林出現(xiàn)校園聚集性疫情,學(xué)生作為受保護(hù)群體而廣受社會(huì)關(guān)注,注意力的投射喚起人們心理上的共情氛圍。校園疫情發(fā)生后,網(wǎng)民情緒頓時(shí)高漲,認(rèn)知理性受到?jīng)_擊,成為負(fù)面情緒的集中爆發(fā)期。圖3(b)“拜托”“結(jié)束”等詞包含了人們對(duì)高校防疫滯后導(dǎo)致蔓延的無(wú)奈與質(zhì)疑,以及對(duì)高校學(xué)生生命健康的擔(dān)憂。大量網(wǎng)民在微博發(fā)文呼吁主流媒體發(fā)聲,推動(dòng)地方政府及時(shí)介入并啟動(dòng)輿情應(yīng)急管理機(jī)制,對(duì)相關(guān)涉事人員進(jìn)行問(wèn)責(zé)處置。負(fù)面情緒逐漸得到消減,公眾焦點(diǎn)再次轉(zhuǎn)回疫情防控,“希望”“加油”“公益”“捐款”等積極情感傾向的表述明顯增加,表示人們團(tuán)結(jié)一致共同抗疫,體現(xiàn)了情感背后的“共同價(jià)值”,積極情緒呈現(xiàn)上升趨勢(shì)。
3.波動(dòng)期:認(rèn)知?dú)w因觸發(fā)情感意識(shí)重塑與增強(qiáng)
在信息資源接觸有限致認(rèn)知?dú)w因不確定的情況下,主體情感意識(shí)會(huì)加強(qiáng)。波動(dòng)階段每天新增感染人數(shù)破千,諸如“長(zhǎng)春朝陽(yáng)溝殯儀館成隔離場(chǎng)所”“四平鐵東區(qū)某小區(qū)提前解封”“白山支援長(zhǎng)春人員沒(méi)有住處”等謠言不斷滋生,主體信息訴求得不到滿足。隨著感染人數(shù)激增,人們對(duì)自身及周?chē)h(huán)境安全產(chǎn)生的恐慌情感被激發(fā),消極情緒明顯呈上升趨勢(shì),積極情緒逐漸下降。圖3(c)“真的”“希望”“加油”雜糅了主體復(fù)雜的情感色彩:對(duì)病毒的怨恨,對(duì)長(zhǎng)時(shí)間封閉式管理的焦慮以及對(duì)疫情結(jié)束的期盼。積極、消極及理性情感擴(kuò)散到公眾彼此的互動(dòng)中,相互交織、此消彼長(zhǎng),主體表現(xiàn)出理性與感性共存的復(fù)雜狀態(tài)。
4.消退期:情感喚醒與認(rèn)知?dú)w因通過(guò)移情共同作用于輿情消減
在輿情消退時(shí)期,吉林省本地疫情處于穩(wěn)定階段。根據(jù)相關(guān)報(bào)道,吉林在這一階段實(shí)現(xiàn)社會(huì)面清零,但很多地區(qū)并未立刻解封。消退前期各類(lèi)情緒都出現(xiàn)明顯的小頻率波動(dòng),但總體而言積極和理性情緒逐漸下降并趨于平穩(wěn)。一方面,隨時(shí)間推移,吉林省成功控制疫情,實(shí)現(xiàn)社會(huì)清零。圖3(d)“解封”“結(jié)束”“希望”等積極信息話題涌現(xiàn),體現(xiàn)主體風(fēng)險(xiǎn)感知下降。另一方面,25日前后吉林省政府發(fā)布高校學(xué)生放假通知,“回家”這一新的話題再次吸引網(wǎng)民注意力。吉林省雖實(shí)現(xiàn)解封,但各地返鄉(xiāng)政策標(biāo)準(zhǔn)不一,學(xué)生面臨如何回家、回家是否會(huì)繼續(xù)隔離等固有認(rèn)知再次啟動(dòng)情感喚醒機(jī)制,擔(dān)憂與困擾情緒滋生,導(dǎo)致消退期中后段負(fù)面情緒出現(xiàn)回升。隨著各地針對(duì)吉林省返鄉(xiāng)政策的落實(shí)、推進(jìn),負(fù)面情感密度下降,輿情信息傳播量遞減,人們的關(guān)注度下降。
經(jīng)分析發(fā)現(xiàn),情感喚醒、認(rèn)知?dú)w因與情感移情貫穿事件各個(gè)階段,主體情感變化與客體事件的發(fā)展相吻合。情感通過(guò)移情強(qiáng)化表達(dá)效果以推動(dòng)輿情發(fā)展,而輿情事件通過(guò)影響人的固有認(rèn)知喚醒情感。在整個(gè)疫情階段,爆發(fā)期與波動(dòng)期的主體情感交織出現(xiàn)。在具體輿情事件的觸發(fā)下,主體在各個(gè)階段的情感隨周期變化而變化。但總體來(lái)看,此次疫情中主體消極情緒表現(xiàn)與疫情的嚴(yán)重程度簡(jiǎn)單共振。在疫情防控常態(tài)化背景下,主體情緒存在更大的理性空間。但輿情監(jiān)管部門(mén)更應(yīng)注意公眾情緒引發(fā)的負(fù)面效應(yīng),如在輿情爆發(fā)階段,政府及相關(guān)部門(mén)應(yīng)及時(shí)啟動(dòng)輿情應(yīng)急機(jī)制,定位負(fù)面情緒累積形成的非理性歸因;在波動(dòng)期,媒體及政府應(yīng)及時(shí)辟謠,發(fā)揮權(quán)威信息發(fā)布的優(yōu)勢(shì),擴(kuò)散正向情感;在消退期,各地加強(qiáng)對(duì)疫情防控地區(qū)相關(guān)政策落實(shí)情況的披露,從根本上疏導(dǎo)和控制負(fù)面輿情。
本文基于情感社會(huì)學(xué)理論和Word2Vec-BiLSTM模型的情感測(cè)量方法,從情感喚醒、歸因及情感移情三個(gè)維度分析輿情主體情感變化特征及誘因,并提出相應(yīng)對(duì)策。未來(lái)在模型設(shè)計(jì)上將會(huì)考慮表情符號(hào)對(duì)文本語(yǔ)義挖掘的影響;情感上融合地理空間角度把握情感特征分布;輿情引導(dǎo)上將情感疏導(dǎo)與技術(shù)處理相結(jié)合,實(shí)現(xiàn)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情綜合治理。