中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)志碼:A
Sentiment analysis of online public opinion in universities considering psychological distance
ZHI Luping, ZHAO Yaxin, ZHAO Jinghua (Business School, University of Shanghai forScience and Technology,Shanghai 2Ooo93,China)
Abstract: In order to explore the emotional evolution law of online public opinion in universities, the traditional sentiment analysis method was enhanced by integrating the psychological distance factor to improve the effect of emotional evolution analysis. The latent Dirichlet allocation (LDA) topic model was used for topic recognition, and a dual-channel feature sentiment analysis model incorporating attention mechanism (DCMAM) based on the pre-trained model ALBERT was proposed to classify the sentiment of comment texts. By combining with topic recognition and sentiment classification, three evaluation indexes of temporal relevance, spatial relevance and semantic relevance were constructed, and the evolution of online public opinion sentiment in universities was analyzed from three dimensions: temporal distance, spatial distance and cognitive distance. The results show that the accuracy,recall and F1 value of the DCMAM model reach 91.32% 91.55% and 91.60% , respectively, in the comparative experiments of multiple groups of sentiment analysis models, which can better identify the sentiment tendency of the comment text. The psychological distance evaluation index shows that there are differences in the public opinion atention and emotional evolution of network users under different psychological distances.
Keywords: online public opinion in universities; psychological distance; LDA topic model; topic recognition; sentiment analysis
中國(guó)互聯(lián)網(wǎng)信息中心發(fā)布的《中國(guó)青少年上網(wǎng)行為調(diào)查報(bào)告》顯示,截至2023年,青少年網(wǎng)民規(guī)模達(dá)2.56億人,在整體網(wǎng)民中占 41.5% ,占青少年總體的 71.8% 。當(dāng)代大學(xué)生展現(xiàn)出較高的社會(huì)活躍度,在參與網(wǎng)絡(luò)話題討論方面表現(xiàn)出顯著的主動(dòng)性[1。社交媒體平臺(tái)具有開(kāi)放性、互動(dòng)性和實(shí)時(shí)性等特點(diǎn),短時(shí)間內(nèi)一定數(shù)量的網(wǎng)絡(luò)用戶形成一致性看法可能會(huì)造成網(wǎng)絡(luò)輿情的爆發(fā)2]。已有研究表明,相比一般網(wǎng)絡(luò)輿情,高校網(wǎng)絡(luò)輿情具有內(nèi)容燃點(diǎn)低、爆發(fā)速度快、傳播范圍廣等顯著特點(diǎn)。各種文化、思想、觀點(diǎn)的交融和碰撞使“真相”與“謠言”在時(shí)空發(fā)酵中相互交織,干擾大學(xué)生的思想認(rèn)知并影響他們的心理健康,給高校網(wǎng)絡(luò)輿情治理工作帶來(lái)了新的挑戰(zhàn)[3]。
近年,“高校錄取極短確認(rèn)時(shí)間事件”“天津助學(xué)金事件”等突發(fā)事件使高校頻繁處于輿論的風(fēng)口浪尖。然而,現(xiàn)實(shí)中有不少高校在應(yīng)對(duì)突發(fā)網(wǎng)絡(luò)輿情時(shí),仍采取“亡羊補(bǔ)牢”式的傳統(tǒng)治理手段,導(dǎo)致網(wǎng)絡(luò)輿情熱度持續(xù)攀升。大學(xué)生作為最直接的輿情受眾,他們的情感變化與心理學(xué)因素密切相關(guān),在接受輿情信息后產(chǎn)生的復(fù)雜心理活動(dòng)可能會(huì)引發(fā)情感共鳴或?qū)е屡懦庑睦?,進(jìn)而產(chǎn)生喜悅、驚訝、憤怒、悲傷等情感[4]。因此,在網(wǎng)絡(luò)空間科學(xué)治理工作背景下,重點(diǎn)關(guān)注高校學(xué)生心理變化,深人分析高校網(wǎng)絡(luò)輿情事件的發(fā)展規(guī)律至關(guān)重要。
為此,本文從心理學(xué)角度出發(fā),以心理距離理論為核心,從時(shí)間距離、空間距離和認(rèn)知距離3個(gè)維度對(duì)高校網(wǎng)絡(luò)輿情事件進(jìn)行情感剖析。利用潛在狄利克雷分布(latentDirichletallocation,LDA)主題模型識(shí)別輿情主題,構(gòu)建融合注意力機(jī)制的雙通道特征情感分析模型(dual-channelfeaturesentimentanalysismodel incorporatingattentionmechanism,DCMAM),結(jié)合輿情主題和情感分析,深入探究不同心理距離與網(wǎng)絡(luò)用戶情感演化的關(guān)聯(lián)性,并提出引導(dǎo)與治理策略。本文在理論層面提出時(shí)間關(guān)聯(lián)度、空間關(guān)聯(lián)度及語(yǔ)義關(guān)聯(lián)度等心理距離評(píng)價(jià)指標(biāo),融合心理學(xué)因素以實(shí)現(xiàn)跨學(xué)科融合,同時(shí)使高校網(wǎng)絡(luò)輿情情感分析研究的科學(xué)性得到證實(shí)。在實(shí)踐層面,本文有助于高校及輿情監(jiān)管部門(mén)及時(shí)把握輿情發(fā)展方向,為高校網(wǎng)絡(luò)輿情治理提供新的研究視角。
1相關(guān)研究
網(wǎng)絡(luò)輿情研究已成為國(guó)內(nèi)外學(xué)術(shù)界研究的熱點(diǎn)之一,研究者們從社會(huì)學(xué)、信息學(xué)、傳播學(xué)、心理學(xué)等不同學(xué)科方向?qū)W(wǎng)絡(luò)輿情進(jìn)行了深入研究[5]。其中,高校網(wǎng)絡(luò)輿情因話題獨(dú)特性、受眾多樣性和傳播特殊性等特點(diǎn),吸引了不少學(xué)者展開(kāi)理論分析和定量研究。劉文基于符號(hào)學(xué)視角探究高校網(wǎng)絡(luò)輿情的引爆原因及傳播策略。李洋等[7]基于社會(huì)心理學(xué)原理,提出4種情緒分類(lèi)方式,針對(duì)如何及時(shí)疏導(dǎo)網(wǎng)絡(luò)用戶情緒提出建議。周歡等結(jié)合超網(wǎng)絡(luò)理論,從社交、情感、時(shí)序等不同視角分析高校網(wǎng)絡(luò)輿情的傳播特點(diǎn)。當(dāng)前,學(xué)術(shù)界對(duì)高校網(wǎng)絡(luò)輿情的研究聚焦于網(wǎng)絡(luò)傳播特征與機(jī)制分析、輿情監(jiān)控與引導(dǎo)等方面。
情感分析指通過(guò)自動(dòng)分析各類(lèi)評(píng)論或觀點(diǎn)意見(jiàn)的內(nèi)容,發(fā)現(xiàn)評(píng)論者對(duì)某一事件或物品的褒貶態(tài)度]。目前,網(wǎng)絡(luò)輿情情感分析方法主要有基于情感詞典、基于機(jī)器學(xué)習(xí)和基于深度學(xué)習(xí)的方法。基于情感詞典的方法指通過(guò)構(gòu)建情感詞典進(jìn)行情感計(jì)算。基于機(jī)器學(xué)習(xí)的方法需先進(jìn)行特征提取,然后使用支持向量機(jī)(supportvectormachine,SVM)[o]、K 最近 鄰(K-nearestneighbors,KNN)算法[11]和樸素貝葉斯(naiveBayes,NB)算法[12]等機(jī)器學(xué)習(xí)算法對(duì)評(píng)論文本進(jìn)行情感分類(lèi)?;谏疃葘W(xué)習(xí)的方法主要使用神經(jīng)網(wǎng)絡(luò)模型提取特征并進(jìn)行情感分類(lèi),常見(jiàn)的神經(jīng)網(wǎng)絡(luò)模型有卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,CNN)[13]、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neuralnetwork,RNN)[14]和長(zhǎng)短期記憶(long short-termmemory,LSTM)網(wǎng)絡(luò)[15]等。2018年,谷歌提出預(yù)訓(xùn)練語(yǔ)言 模 型BERT(bidirectional encoderrepresentationsfromtransformers),在多模態(tài)情感分析研究中證實(shí)BERT模型較傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)更優(yōu)異。Liu等[提出一種基于BERT模型的跨領(lǐng)域文本情感分析方法,實(shí)現(xiàn)各領(lǐng)域文本的細(xì)粒度情感分析。Lin等[17]基于Transformer變換器的雙向編碼器,利用集成學(xué)習(xí)方法識(shí)別虛假新聞并取得了較好的結(jié)果。為進(jìn)一步提升模型的有效性與準(zhǔn)確性,研究者在BERT模型基礎(chǔ)上又提出了 ALBERT(a lite BERT)[18]、RoBERTa(robustly optimized BERT pre-training approach)[19]和XLNet(eXtra long net)[20]等預(yù)訓(xùn)練語(yǔ)言模型,并將其作為情感分析任務(wù)中的詞向量嵌人工具。
心理距離一詞始于20 世紀(jì)初對(duì)美學(xué)的研究[21]解釋水平理論認(rèn)為心理距離與人們對(duì)某一事件所產(chǎn)生的感知風(fēng)險(xiǎn)與不確定性顯著相關(guān)[22]。建構(gòu)水平理論認(rèn)為心理距離是以自我為參照點(diǎn),外界客體以不同的方式遠(yuǎn)離參照點(diǎn)所形成的抽象距離[23]。網(wǎng)絡(luò)輿情研究中,網(wǎng)絡(luò)用戶的情感表達(dá)受到輿情發(fā)生時(shí)間、地理位置和社會(huì)關(guān)系等外界客體的影響,導(dǎo)致自身與輿情信息之間產(chǎn)生抽象距離,符合建構(gòu)水平理論所定義的心理距離。張曉君等[24]基于心理距離探究網(wǎng)絡(luò)用戶在面對(duì)網(wǎng)絡(luò)輿情時(shí)的傳播意愿。Skalicky等[25]通過(guò)解釋水平理論,研究不同水平的心理距離如何影響人們對(duì)普通評(píng)論和諷刺評(píng)論的傳播意愿。陳百卉[2從心理距離和建構(gòu)水平角度考察不同心理距離和建構(gòu)水平對(duì)人們情感預(yù)測(cè)強(qiáng)度的影響。
綜上,現(xiàn)有高校網(wǎng)絡(luò)輿情的相關(guān)研究涉及傳播特征、情感分析及輿情引導(dǎo)等方向,研究者多將心理距離應(yīng)用于輿情傳播及情感強(qiáng)度預(yù)測(cè)方面,但綜合考慮高校網(wǎng)絡(luò)輿情特點(diǎn)與受眾心理距離的情感分析研究成果相對(duì)較少。針對(duì)現(xiàn)有研究的不足,本文綜合考慮計(jì)算資源與時(shí)間因素,選取目前效果較為出色的ALBERT預(yù)訓(xùn)練語(yǔ)言模型進(jìn)行詞向量嵌入,構(gòu)建融合雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(bidirectional long short-term memory, BiLSTM)、文本卷積神經(jīng)網(wǎng)絡(luò)(text convolutionalneuralnetwork,TextCNN)及注意力機(jī)制的DCMAM情感分析模型。結(jié)合主題識(shí)別與情感分析,從時(shí)間距離、空間距離、社會(huì)距離3個(gè)心理距離維度分析高校網(wǎng)絡(luò)輿情的情感演變規(guī)律,為高校網(wǎng)絡(luò)與情治理與監(jiān)控提供參考依據(jù)。
2 研究方法
主題識(shí)別部分,采用LDA主題模型進(jìn)行主題聚類(lèi);情感分析部分,提出DCMAM情感分析模型,借助ALBERT預(yù)訓(xùn)練模型進(jìn)行動(dòng)態(tài)詞嵌入,利用融合注意力機(jī)制的BiLSTM-TextCNN雙通道模型充分捕捉文本上下文及局部特征,提高文本的分類(lèi)性能;心理距離部分,選取時(shí)間距離、空間距離和認(rèn)知距離3個(gè)維度,構(gòu)建時(shí)間關(guān)聯(lián)度、空間關(guān)聯(lián)度和語(yǔ)義關(guān)聯(lián)度作為評(píng)價(jià)指標(biāo)
2.1 LDA主題模型
LDA主題模型可以自動(dòng)分析文檔并統(tǒng)計(jì)文檔中的詞語(yǔ),根據(jù)統(tǒng)計(jì)信息判斷當(dāng)前文檔包含主題的個(gè)數(shù)及各個(gè)主題的占比大小[27]。困惑度是衡量概率模型預(yù)測(cè)性能或概率分布擬合效果的重要指標(biāo),用于判斷LDA主題模型的優(yōu)劣,同時(shí)調(diào)整文檔的主題個(gè)數(shù)。因此,本文首先計(jì)算出不同主題數(shù)量的困惑度數(shù)值,然后根據(jù)困惑度曲線確定網(wǎng)絡(luò)輿情事件的最優(yōu)主題聚類(lèi)數(shù)量
2.2 DCMAM情感分析模型
文本情感分析是指對(duì)帶有感情色彩的主觀性文本進(jìn)行分析,為了準(zhǔn)確識(shí)別微博評(píng)論的情感傾向,構(gòu)建DCMAM模型對(duì)網(wǎng)絡(luò)輿情相關(guān)微博評(píng)論進(jìn)行情感判斷。DCMAM模型由輸入層、詞向量嵌入層、特征提取層、特征融合層和輸出層5個(gè)部分構(gòu)成,結(jié)構(gòu)如圖1所示。圖中, ei 表示輸人的第 i 個(gè)單詞向量, i=1,2,…,n 。
a.ALBERT詞嵌人模型
ALBERT模型采用跨層參數(shù)共享的方法,使每一層Transformer變換器的權(quán)重相同。ALBERT模型采用了類(lèi)循環(huán)結(jié)構(gòu),主體結(jié)構(gòu)部分只包含一層Transformer實(shí)體,模型使用句子順序預(yù)測(cè)取代BERT模型中的下一個(gè)句子預(yù)測(cè),能夠?qū)W習(xí)到更加細(xì)微的語(yǔ)義差別和句子連貫性,ALBERT模型結(jié)構(gòu)如圖2所示。圖中: Ei 表示第i個(gè)輸人單詞;Ti 表示第i個(gè)輸入單詞對(duì)應(yīng)的輸出向量;Trm表示經(jīng)過(guò)Transformer變換。
b.BiLSTM模型
BiLSTM模型是一種基于LSTM模型的記憶網(wǎng)絡(luò),其思想是將同一個(gè)序列分別接人前向和后向兩個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)中,然后將兩者的輸出進(jìn)行拼接,使得輸出的特征同時(shí)包含前后語(yǔ)義信息,BiLSTM模型結(jié)構(gòu)如圖3所示。圖中: xt , xt′ 分別表示t時(shí)刻的輸入、輸出向量; ht 表示 t 時(shí)刻隱藏層的輸出向量。
LSTM神經(jīng)網(wǎng)絡(luò)模型由遺忘門(mén)、輸入門(mén)、輸出門(mén)和記憶單元組成,相關(guān)計(jì)算公式如下:
δft=σ(Wf,xhxt+Wf,hhht-1+bf)
Fig.3 Structure diagram of BiLSTM model
θt=σ(Wo,xhxt+Wo,hhht-1+bo)
ut=tanh(Wu,xhxt+Wu,hhht-1+bu)
ct=ft?ct-1+it?ut
ht=σt?tanhut
式中: σ 表示sigmoid激活函數(shù); 、 σσt )ut 分別表示第 t 時(shí)刻的遺忘門(mén)、輸入門(mén)、輸出門(mén)、記憶單元; Wf,xh , Wi,xh 、 Wo,xh 、 Wu,xh 分別表示遺忘門(mén)、輸入門(mén)、輸出門(mén)和記憶單元對(duì) xt 的權(quán)重系數(shù)矩陣; Wf,hh,Wi,hh,Wo,hh 、 Wu,hh 分別表示遺忘門(mén)、輸入門(mén)、輸出門(mén)和記憶單元對(duì) ht-1 的權(quán)重系數(shù)矩陣;
分別表示遺忘門(mén)、輸入門(mén)、輸出門(mén)和記憶單元的偏置向量。
BiLSTM模型中,正向循環(huán)和反向循環(huán)相互獨(dú)立,前向隱藏層向量 和后向隱藏層向量
經(jīng)過(guò)向量拼接后得到最終的隱藏層向量 hi ,更新過(guò)程如下:
式中: 和
分別為雙向LSTM模型在 t 時(shí)刻的前向和后向隱藏層向量; Lf 和 Lb 分別代表前向循環(huán)和后向循環(huán)。
c.TextCNN模型
TextCNN模型結(jié)構(gòu)如圖4所示,由輸人層、卷積層、池化層和全連接層4個(gè)部分組成。卷積過(guò)程通常為使用尺寸不同的濾波器提取不同范圍的特征。將卷積層提取的特征進(jìn)行最大池化操作以保留主要特征,去除冗余信息。池化操作之后,特征被連接起來(lái)并進(jìn)人全連接層,最終被映射到情感標(biāo)簽,并由輸出層輸出結(jié)果。
d.特征融合層與輸出層
首先,將BiLSTM模型與TextCNN模型提取的特征一起輸人特征融合層進(jìn)行拼接;然后,將連接后的特征向量輸人到全連接層,采用注意力機(jī)制對(duì)融合的特征向量進(jìn)行篩選;最后,使用Softmax分類(lèi)器計(jì)算評(píng)論文本中包含每個(gè)情感類(lèi)別的概率。計(jì)算規(guī)則如下:
C(fL,fC)=tanh(W1fL+W2fC)
P(y|V,WC,bC)=Softmax(WCC+bC)
式中: W1 和 W2 為注意力機(jī)制的權(quán)重矩陣;為BiLSTM模型的輸出特征向量; fC 為T(mén)extCNN模型的輸出特征向量; c 為融合BiLSTM模型與TextCNN模型的特征向量; P 表示求取積極、中立及消極情感類(lèi)別的概率; y 表示不同情感類(lèi)別變量; V 為所有情感類(lèi)別構(gòu)成的矩陣; WC 和 bC 為權(quán)重矩陣和偏置矩陣。
2.3 心理距離度量指標(biāo)選取
Liberman在1998年首次提出時(shí)間解釋理論,他認(rèn)為時(shí)間是一種心理距離,對(duì)個(gè)體的建構(gòu)水平會(huì)產(chǎn)生作用,進(jìn)而影響個(gè)體的認(rèn)知和行為[26]。后續(xù)研究中,心理學(xué)家陸續(xù)發(fā)現(xiàn)空間距離、社會(huì)距離和可能性這3個(gè)維度與時(shí)間距離會(huì)產(chǎn)生類(lèi)似的效應(yīng),于是將4個(gè)維度進(jìn)行統(tǒng)一,形成心理距離框架。
網(wǎng)絡(luò)輿情研究中:時(shí)間距離為網(wǎng)絡(luò)用戶接收輿情信息的時(shí)間與輿情首次報(bào)道時(shí)間之間的距離;空間距離為網(wǎng)絡(luò)用戶所處的地理位置與輿情發(fā)生地之間的地理距離;社會(huì)距離是人們?cè)谏鐣?huì)結(jié)構(gòu)中對(duì)其他人的社會(huì)位置和關(guān)系的感知程度[28];可能性指?jìng)€(gè)體對(duì)某種情境、事件或行為的期望程度[29]。心理學(xué)家認(rèn)為社會(huì)距離和可能性與網(wǎng)絡(luò)用戶的認(rèn)知水平有關(guān),即受眾對(duì)客觀輿情信息的價(jià)值傾向評(píng)價(jià)之間的差距,可具體映射到是否產(chǎn)生評(píng)論、點(diǎn)贊、轉(zhuǎn)發(fā)等行為傾向上。由認(rèn)知水平所產(chǎn)生的個(gè)體之間在思想、經(jīng)驗(yàn)、價(jià)值觀等方面接近或遠(yuǎn)離的程度稱為認(rèn)知距離。因此,本研究選擇時(shí)間距離、空間距離和認(rèn)知距離3個(gè)維度對(duì)高校網(wǎng)絡(luò)與情進(jìn)行情感分析。
當(dāng)前的網(wǎng)絡(luò)輿情研究對(duì)心理距離度量方法的研究較少,尚未形成統(tǒng)一的度量標(biāo)準(zhǔn)。本文結(jié)合網(wǎng)絡(luò)輿情特征及心理距離概念,選取心理距離各維度的度量指標(biāo),如表1所示。其中:時(shí)間距離度量指標(biāo)為時(shí)間關(guān)聯(lián)度 G ,反映不同時(shí)間節(jié)點(diǎn)下網(wǎng)絡(luò)用戶情感的偏移程度;空間距離的度量指標(biāo)為空間關(guān)聯(lián)度 Q ,反映某一時(shí)間節(jié)點(diǎn)下不同區(qū)域的輿情情感是否發(fā)生了偏移;認(rèn)知距離的度量指標(biāo)為語(yǔ)義關(guān)聯(lián)度 R ,反映同一時(shí)間節(jié)點(diǎn)下不同輿情主題的情感類(lèi)別波動(dòng)方向及大小。
3 實(shí)驗(yàn)與分析
本文選取“鼠頭鴨脖”數(shù)據(jù)集評(píng)估DCMAM情感分析模型的有效性,并與傳統(tǒng)情感分析模型進(jìn)行對(duì)比,驗(yàn)證DCMAM模型的情感分類(lèi)效果。
3.1 數(shù)據(jù)采集與預(yù)處理
以“鼠頭鴨脖”事件為例,通過(guò)計(jì)算機(jī)智能技術(shù)獲取微博平臺(tái)2023年6月6日至2023年7月7日時(shí)間段內(nèi)的原創(chuàng)博文及評(píng)論數(shù)據(jù),初步獲取數(shù)據(jù)18510條。為增強(qiáng)數(shù)據(jù)的準(zhǔn)確性與可靠性,對(duì)原始數(shù)據(jù)進(jìn)行去重、Jieba分詞、去停用詞等預(yù)處理操作,最終獲得12110條有效數(shù)據(jù)用于構(gòu)建實(shí)驗(yàn)語(yǔ)料庫(kù)。
3.2 輿情生命周期劃分
“鼠頭鴨脖”整個(gè)事件時(shí)間跨度大,衍生話題多,為確保輿情事件生命周期的正確劃分,本文使用百度熱度指數(shù)輔助驗(yàn)證。以“鼠頭鴨脖”為關(guān)鍵詞搜索得到每日百度熱度指數(shù),如圖5所示。圖中顯示,前期話題不斷波動(dòng),中期呈現(xiàn)出峰值分布,后期趨于平穩(wěn)狀態(tài),熱度呈明顯的階段性變化。因此,本文根據(jù)生命周期理論將“鼠頭鴨脖”事件分為起始階段、爆發(fā)階段、衰退階段和平息階段。
3.3 輿情主題識(shí)別
本文以Sklearn為框架,選用Gensim模塊中的實(shí)例化LDA主題模型。首先,選擇區(qū)間[2,20]內(nèi)的整數(shù)作為隨機(jī)候選主題數(shù),計(jì)算不同主題數(shù)下的困惑度數(shù)值。綜合考慮困惑度值及合理性,確定主題數(shù)為12。其次,通過(guò)“主題-詞”概率分布得出每個(gè)主題下所包含的高頻詞,表2為識(shí)別的主題內(nèi)容與每個(gè)主題下出現(xiàn)概率最高的前5個(gè)關(guān)鍵詞。
3.4 情感傾向性分析
本文基于Python3.10和Pytorch深度學(xué)習(xí)框架構(gòu)建DCMAM情感分析模型。DCMAM模型使用Adam優(yōu)化器更新網(wǎng)絡(luò)參數(shù)以有效防止欠擬合,設(shè)置隨機(jī)丟棄機(jī)制和早停機(jī)制以有效防止出現(xiàn)過(guò)擬合現(xiàn)象。為提高模型的泛化性能,采用網(wǎng)格搜索技術(shù)不斷調(diào)整參數(shù),具體超參數(shù)設(shè)置如表3所示。
圖6(a)為模型迭代次數(shù)不同時(shí)對(duì)模型的影響。由圖可見(jiàn):當(dāng)?shù)螖?shù)小于10時(shí),得分呈現(xiàn)快速上升的趨勢(shì);當(dāng)?shù)螖?shù)為10時(shí),得分達(dá)到最高;當(dāng)?shù)螖?shù)大于10時(shí),得分開(kāi)始緩慢下降且趨于穩(wěn)定。因此,設(shè)置迭代次數(shù)為10次。
圖6(b)為隨機(jī)丟棄率取不同數(shù)值時(shí)對(duì)模型的影響。當(dāng)隨機(jī)丟棄率小于0.4時(shí),模型性能不斷提升;當(dāng)隨機(jī)丟棄率大于0.4時(shí),評(píng)價(jià)指標(biāo)不斷下降,模型性能逐漸變低。因此,隨機(jī)丟棄率設(shè)置為0.4。為探究DCMAM模型的分類(lèi)效果,將DCMAM模型與BERT-TextCNN、BERT-BiLSTM、ALBERT-BiLSTM、ALBERT-TextCNN、BERT-RCNN、ALBERT-RCNN這6種模型進(jìn)行對(duì)比,并選取準(zhǔn)確率、召回率和 F1 值判斷模型效果,實(shí)驗(yàn)結(jié)果見(jiàn)表4。
觀察實(shí)驗(yàn)結(jié)果,DCMAM模型的準(zhǔn)確率、召回率和 F1 值分別為 91.32% 、 91.55% 、 91.60% 。其中,將 ALBERT-TextCNN 模型與 BERT-TextCNN模型的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)ALBERT-TextCNN模型在準(zhǔn)確率、召回率和 F1 值上分別提升 0.05% 、 0.01% 、 0.03% 。將 ALBERT-RCNN模型與BERT-RCNN模型的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)ALBERT-RCNN模型的準(zhǔn)確率和召回率分別提升 0.02% 、 0.07% , F1 值下降 0.07% 。將DCMAM模型與ALBERT-RCNN模型的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)DCMAM模型的準(zhǔn)確率、召回率和 F1 值分別提升了 0.52% 、 0.60% 、 0.62% 。
對(duì)比實(shí)驗(yàn)證明DCMAM模型在情感分析方面具有一定的優(yōu)勢(shì)。通過(guò)該模型對(duì)評(píng)論內(nèi)容的情感進(jìn)行分類(lèi),將消極情感、中立情感和積極情感分別設(shè)為-1、0、1。
4融合心理距離的情感分析
結(jié)合輿情生命周期、主題識(shí)別及情感傾向性,從時(shí)間距離、空間距離和認(rèn)知距離3個(gè)維度對(duì)“鼠頭鴨脖”事件的情感演化進(jìn)行分析。
4.1基于時(shí)間距離維度的情感分析
時(shí)間關(guān)聯(lián)度 G 反映了不同時(shí)間節(jié)點(diǎn)網(wǎng)絡(luò)用戶的情感是否發(fā)生了偏移,其計(jì)算如下:
G(t,ν,w)=S(tn,νi,w)k-S(t0,νi,w)k
式中: G 表示第 i 個(gè)主題的情感類(lèi)別在時(shí)刻 tn 時(shí)的情感值與在初始時(shí)刻 t0 時(shí)的情感值之間的差值,反映出不同情感類(lèi)別受時(shí)間距離影響所產(chǎn)生的波動(dòng)大小及方向; ui 表示第i個(gè)討論的輿情主題,i=0,1,2,…,11 ; w 表示網(wǎng)絡(luò)用戶IP顯示的地理位置; S(tn,νi,w)k 表示在時(shí)刻 tn 、區(qū)域 w ,討論主題 ui 的第 k 個(gè)情感類(lèi)別信息
將各個(gè)情感類(lèi)別信息輸人時(shí)間關(guān)聯(lián)度公式,在保持輿情主題及地理位置不變的情況下,計(jì)算不同時(shí)間節(jié)點(diǎn)之間各個(gè)情感類(lèi)別的偏移程度,部分結(jié)果如表5所示。在輿情起始階段至爆發(fā)階段,隨著時(shí)間距離增長(zhǎng),消極情感占比逐漸上升,輿情爆發(fā)至衰退階段,消極情感占比隨時(shí)間距離的增長(zhǎng)逐漸下降。
統(tǒng)計(jì)輿情生命周期各階段不同情感類(lèi)別評(píng)論量占該階段評(píng)論總量的比例,如圖7所示。圖7顯示,輿情起始階段,消極、中立和積極情感的占比分別為 45% 、 35% 、 20% 。調(diào)查發(fā)現(xiàn),該階段產(chǎn)生消極情感的原因?yàn)槭鼙妼?duì)學(xué)校食堂食品衛(wèi)生情況的不滿及對(duì)涉事學(xué)生畢業(yè)情況的擔(dān)憂。輿情爆發(fā)階段,時(shí)間關(guān)聯(lián)度逐漸下降,此時(shí)消極、中立和積極情感的占比分別為 70% 、 20% 、 10% 。消極情感主要為對(duì)學(xué)校和基層干部的質(zhì)疑、嘲諷和氣憤。隨著政府部門(mén)的積極回應(yīng),輿情得到控制并開(kāi)始進(jìn)入衰退階段和平息階段,此時(shí)網(wǎng)絡(luò)用戶的時(shí)間距離較遠(yuǎn),對(duì)于輿情事件的看法逐漸趨于理性。
綜上,時(shí)間距離是網(wǎng)絡(luò)用戶情感演化的重要影響因素,時(shí)間距離與網(wǎng)絡(luò)用戶的情感演化并非線性相關(guān),而是跟隨輿情生命周期呈現(xiàn)峰值分布?!笆箢^鴨脖”輿情事件中,網(wǎng)絡(luò)用戶的消極情感隨著時(shí)間距離的增加,在爆發(fā)期達(dá)到峰值,直至與情衰退階段才開(kāi)始緩慢下降。
4.2 基于空間距離維度的情感分析
空間關(guān)聯(lián)度 Q 作為空間距離維度的度量指標(biāo),反映了某一時(shí)間節(jié)點(diǎn)下不同區(qū)域的輿情情感是否發(fā)生了偏移,計(jì)算如下所示:
式中: Q 表示在 t 時(shí)刻,區(qū)域 wq 相較區(qū)域 wm 的第k 個(gè)情感類(lèi)別的波動(dòng)大小及波動(dòng)方向; S(t,wq)k 表示在t時(shí)刻、區(qū)域 wq ,討論主題的第 k 個(gè)情感類(lèi)別信息。若 Qgt;0 ,則說(shuō)明該情感類(lèi)別在區(qū)域 wq 呈上升趨勢(shì);若 Qlt;0 ,則說(shuō)明該情感類(lèi)別在區(qū)域 wq 呈下降趨勢(shì);若 Q=0 ,則說(shuō)明該情感類(lèi)別在兩個(gè)區(qū)域的變化趨勢(shì)相同。
依據(jù)語(yǔ)義內(nèi)容及用戶動(dòng)態(tài)篩選出學(xué)生身份的評(píng)論用戶,將他們的IP位置按照地理距離進(jìn)行等級(jí)劃分。其中:用戶IP位置顯示在輿情發(fā)生地的省、自治區(qū)設(shè)為3級(jí);與輿情發(fā)生地相鄰的省、自治區(qū)設(shè)為2級(jí);與輿情發(fā)生地不相鄰的省、自治區(qū)設(shè)為1級(jí)。將空間等級(jí)輸入空間關(guān)聯(lián)度公式,計(jì)算出不同空間等級(jí)之間的情感類(lèi)別偏移大小,部分結(jié)果如表6所示。
由表6可知,同一時(shí)刻不同空間等級(jí)的各個(gè)情感類(lèi)別占比不同,總體3級(jí)區(qū)域的消極情感在所有空間等級(jí)中占比最高,隨著空間等級(jí)遞減,消極情感占比逐漸下降,中立情感與積極情感占比逐漸上升。綜上,空間距離對(duì)網(wǎng)絡(luò)用戶的情感變化具有一定的影響作用,“鼠頭鴨脖”網(wǎng)絡(luò)輿情事件中,輿情發(fā)生地的網(wǎng)絡(luò)用戶消極情感占比較大,消極情感隨空間等級(jí)上升而逐層減弱
4.3基于認(rèn)知距離維度的情感分析
語(yǔ)義關(guān)聯(lián)度 R 作為認(rèn)知距離維度的度量指標(biāo),反映了不同輿情主題的情感類(lèi)別波動(dòng)方向及大小,其計(jì)算如下所示:
式中: R 表示在 t 時(shí)刻下,主題 ui 與主題 uj 在第 k 個(gè)情感類(lèi)別中的波動(dòng)大小及方向; S(t,νi)k 表示t時(shí)刻第ui 個(gè)輿情主題的第 k 個(gè)情感類(lèi)別信息。若 Rgt;0 ,則說(shuō)明該情感類(lèi)別在主題 ui 中的占比呈上升趨勢(shì);若Rlt;0 ,則說(shuō)明該情感類(lèi)別在主題 ui 中的占比呈下降趨勢(shì);若 R=0 ,則說(shuō)明該情感類(lèi)別在主題 ui 與主題 uj 中分布相同。
將各個(gè)主題及情感類(lèi)別信息輸人語(yǔ)義關(guān)聯(lián)度公式,計(jì)算出各個(gè)時(shí)間節(jié)點(diǎn)下不同主題之間的情感類(lèi)別偏移大小,按照時(shí)間結(jié)果進(jìn)行排序,部分結(jié)果如表7所示。由表7可知,同一時(shí)刻不同主題之間的情感類(lèi)別波動(dòng)大小及方向不同,在主題6、7、8、11當(dāng)中,主題11的消極情感占比最大。
為進(jìn)一步探究各個(gè)主題的情感強(qiáng)度,本文利用評(píng)論主題、評(píng)論數(shù)量、情感強(qiáng)度三維數(shù)據(jù),繪制基于認(rèn)知距離的主題情感強(qiáng)度分布圖,如圖8所示。由圖可知,網(wǎng)絡(luò)用戶由于認(rèn)知水平差異,在客觀輿情信息基礎(chǔ)上衍生出不同話題,通過(guò)對(duì)語(yǔ)義內(nèi)容進(jìn)行分析發(fā)現(xiàn),學(xué)生群體容易對(duì)認(rèn)知距離較近的主題產(chǎn)生行為決策,對(duì)認(rèn)知距離較遠(yuǎn)的主題產(chǎn)生行為決策的興趣較低,例如對(duì)主題0(市場(chǎng)監(jiān)督管理局確認(rèn)異物為鴨脖)、主題7(涉事學(xué)生澄清確實(shí)是鴨脖)、主題8(涉事學(xué)校首次正式回應(yīng))的關(guān)注度與參與度較高,對(duì)主題4(絕味鴨脖股價(jià)下降)、主題10(工作人員稱學(xué)生點(diǎn)的是豬腳飯)的關(guān)注度較低。
綜上,認(rèn)知距離對(duì)網(wǎng)絡(luò)用戶的行為決策及情感表達(dá)具有重要影響作用,“鼠頭鴨脖”輿情事件中,學(xué)生群體更加關(guān)注與學(xué)校食堂、涉事學(xué)校、涉事學(xué)生相關(guān)的話題,社會(huì)群體則更加關(guān)注與政府官員、調(diào)查局相關(guān)的話題。各個(gè)主題的情感類(lèi)別占比不同,主題1(政府公信力危機(jī))和主題11(局長(zhǎng)“指鼠為鴨”)的消極情感占比最高,高校及輿情相關(guān)部門(mén)對(duì)此類(lèi)主題應(yīng)及時(shí)采取有效措施進(jìn)行疏導(dǎo),防止產(chǎn)生二次輿論危機(jī)。
4.4構(gòu)建心理距離情感強(qiáng)度等級(jí)
綜合考慮3個(gè)心理距離對(duì)輿情事件的情感影響,將3個(gè)心理距離進(jìn)行分級(jí)賦值。時(shí)間距離維度方面,以輿情首次報(bào)道時(shí)間為起點(diǎn),評(píng)論時(shí)間在輿情起始階段和平息階段則將時(shí)間距離設(shè)為1級(jí),評(píng)論時(shí)間在輿情衰退階段則將時(shí)間距離設(shè)為2級(jí),評(píng)論時(shí)間在輿情爆發(fā)階段則將時(shí)間距離設(shè)為3級(jí)??臻g距離方面,將輿情發(fā)生地設(shè)為
3級(jí),與輿情發(fā)生地相鄰區(qū)域設(shè)為2級(jí),與輿情發(fā)生地不相鄰區(qū)域設(shè)為1級(jí)。認(rèn)知距離方面,與政府、公信力相關(guān)的主題設(shè)為3級(jí),與學(xué)校、學(xué)生相關(guān)的主題設(shè)為2級(jí),其他主題設(shè)為1級(jí)。將3個(gè)心理距離等級(jí)進(jìn)行相加,等級(jí)越高代表網(wǎng)絡(luò)用戶的情感越強(qiáng)烈,高校及政府相關(guān)部門(mén)應(yīng)及時(shí)關(guān)注并采取引導(dǎo)措施,部分心理距離情感強(qiáng)度等級(jí)如表8所示。
5結(jié)論
本文以高校學(xué)生持續(xù)關(guān)注的“鼠頭鴨脖”事件為研究對(duì)象,基于輿情生命周期理論和心理學(xué)因素,利用LDA主題模型和DCMAM情感分析模型對(duì)事件各階段評(píng)論文本進(jìn)行主題識(shí)別和情感分類(lèi)。結(jié)合主題與情感,從時(shí)間距離、空間距離和認(rèn)知距離對(duì)高校網(wǎng)絡(luò)輿情進(jìn)行情感演化分析并構(gòu)建心理距離情感強(qiáng)度等級(jí)。
研究發(fā)現(xiàn),心理距離對(duì)網(wǎng)絡(luò)用戶的情感演化具有重要影響,受眾在社會(huì)從眾效應(yīng)的影響下在輿情初期情感表現(xiàn)尚不明顯,隨著時(shí)間距離的延伸,情感由爆發(fā)轉(zhuǎn)至消散??臻g距離越近的網(wǎng)絡(luò)用戶更容易受外界刺激而產(chǎn)生情感反應(yīng),距離越遠(yuǎn)的網(wǎng)絡(luò)用戶對(duì)輿情的感知力及參與度較小,對(duì)于輿情的傳播具有壓制作用。網(wǎng)絡(luò)用戶對(duì)自己認(rèn)知距離近的話題更加關(guān)注與重視,例如人們對(duì)政府及高校信任危機(jī)的關(guān)注遠(yuǎn)遠(yuǎn)超過(guò)對(duì)校園食品安全的關(guān)注。
基于此,本文針對(duì)高校網(wǎng)絡(luò)輿情演變周期提出相應(yīng)的引導(dǎo)對(duì)策,幫助高校進(jìn)行有針對(duì)性的輿情引導(dǎo)和治理。
a.輿情起始階段。該階段,在校師生與事件的心理距離近且關(guān)注程度高,可能會(huì)在網(wǎng)絡(luò)上發(fā)布帶有復(fù)雜情緒的評(píng)論,高校應(yīng)密切關(guān)注在校師生的情感和態(tài)度變化。以“鼠頭鴨脖”事件為例,高??山柚匀徽Z(yǔ)言處理技術(shù)如BERT和DCMAM情感分析模型對(duì)獲取的評(píng)論進(jìn)行情感傾向性判斷,精準(zhǔn)定位負(fù)面情緒聚集的話題。在此基礎(chǔ)上,依據(jù)情感判斷優(yōu)先響應(yīng)學(xué)生關(guān)注度高、心理落差顯著的議題,建立心理距離緩沖機(jī)制,實(shí)施分層分類(lèi)的情緒疏導(dǎo)策略,從而提前遏制潛在輿情風(fēng)險(xiǎn)的爆發(fā)。
b.輿情爆發(fā)階段。根據(jù)心理距離理論,爆發(fā)期是輿情受眾情緒最濃烈的時(shí)期,當(dāng)負(fù)面情緒占據(jù)主導(dǎo)地位時(shí),高校需進(jìn)行全方位溝通:一是確保言行一致,避免出現(xiàn)前后矛盾或模糊不清的表述,有助于提高高校的權(quán)威性和信息的可信度;二是加強(qiáng)與政府、社會(huì)媒體等相關(guān)主體的合作,通過(guò)與官方媒體的良性互動(dòng),大力提升正面信息的傳播力度,減少謠言及虛假新聞的傳播機(jī)會(huì);三是積極回應(yīng)網(wǎng)絡(luò)用戶關(guān)注的問(wèn)題,對(duì)存在的質(zhì)疑和矛盾進(jìn)行歸納分析并通過(guò)官方渠道進(jìn)行澄清,針對(duì)關(guān)鍵問(wèn)題及時(shí)作出回應(yīng)。
c.輿情衰退階段。此階段,公眾對(duì)輿情事件已經(jīng)有了充分的了解,在心理距離作用下情緒得到了緩和,各種極端評(píng)論的消散有助于加速網(wǎng)絡(luò)輿情的冷卻。高校應(yīng)根據(jù)輿情后果的嚴(yán)重性制定處置方案,對(duì)輿情處理過(guò)程中的不當(dāng)行為進(jìn)行追責(zé),明確直接責(zé)任人和輿情處理負(fù)責(zé)人。此外,對(duì)涉事主體進(jìn)行相應(yīng)的責(zé)任追究,促使網(wǎng)絡(luò)用戶從消極情感向積極情感轉(zhuǎn)變。
d.輿情平息階段。高??山⑤浨榉答佋u(píng)價(jià)機(jī)制,對(duì)容易引發(fā)輿情危機(jī)的敏感詞進(jìn)行持續(xù)跟蹤。此外,做好事件的復(fù)盤(pán)工作,及時(shí)總結(jié)經(jīng)驗(yàn)教訓(xùn),并完善相應(yīng)的監(jiān)管機(jī)制,從根本上解決問(wèn)題。
本文的研究仍存在以下不足:a.本文僅選取了微博平臺(tái)的“鼠頭鴨脖”輿情事件進(jìn)行研究,后續(xù)可嘗試跨平臺(tái)收集多類(lèi)型事件數(shù)據(jù),嘗試擴(kuò)大研究范圍;b.本文在探究心理距離對(duì)輿情情感演化的影響時(shí),將時(shí)間距離、空間距離和認(rèn)知距離作為單一變量進(jìn)行研究,后續(xù)可將心理距離各維度進(jìn)行交互分析,探究多變量因素對(duì)輿情情感演化的影響。
參考文獻(xiàn):
[1]于婷.全媒體時(shí)代高校網(wǎng)絡(luò)輿情發(fā)展態(tài)勢(shì)與應(yīng)對(duì)策略
[J].滄州師范學(xué)院學(xué)報(bào),2023,39(4):108-113.
[2]王春東,張卉,莫秀良,等.微博情感分析綜述[J].計(jì)算機(jī) 工程與科學(xué),2022,44(1):165-175.
[3]黃欽,徐柳凡,朱禮龍.基于主題模型和情感計(jì)算的高校 網(wǎng)絡(luò)輿情演化分析[J].成都師范學(xué)院學(xué)報(bào),2023,39(12): 39-46.
[4]張曉君,黃微,宋先智.基于心理距離的網(wǎng)絡(luò)輿情傳播傾 向性研究[J].情報(bào)資料工作,2017,38(6):19-24.
[5]唐婷婷.高校網(wǎng)絡(luò)輿情研究綜述[J].產(chǎn)業(yè)與科技論壇, 2022,21(17): 59-60.
[6]劉文.符號(hào)學(xué)視角下的高校網(wǎng)絡(luò)輿情研究[D].上海:上 海理工大學(xué),2022.
[7]李洋,李思佳,葉瓊元,等.面向突發(fā)事件網(wǎng)絡(luò)輿情的社 會(huì)情緒喚醒綜合評(píng)價(jià)與疏導(dǎo)策略研究[J].情報(bào)資料工 作,2020,41(6): 17-25.
[8]周歡,張培穎,王嘉儀,等.基于超網(wǎng)絡(luò)的高校網(wǎng)絡(luò)輿情 態(tài)勢(shì)感知及傳播分析[J].情報(bào)理論與實(shí)踐,2023,46(8): 131-137,164.
[9]張紫瓊,葉強(qiáng),李一軍.互聯(lián)網(wǎng)商品評(píng)論情感分析研究綜 述[J].管理科學(xué)學(xué)報(bào),2010,13(6): 84-96.
[10]鄧君,孫紹丹,王阮,等.基于Word2Vec 和SVM的微博 輿情情感演化分析[J].情報(bào)理論與實(shí)踐,2020,43(8): 112-119.
[11] ZHANG S C. Challenges in KNN classification[J]. IEEE Transactions on Knowledge and Data Engineering, 2022, 34(10): 4663-4675.
[12]LIU Y,BI J W,F(xiàn)AN Z P. Multi-class sentiment classification: the experimental comparisons of feature selection and machine learning algorithms[J]. Expert Systems with Applications, 2017, 80: 323-339.
[13] ZHANG S Q, XU X Y, PANG Y W, et al. Multi-layer attention based CNN for target-dependent sentiment classification[J]. Neural Processing Letters, 2020, 51(3): 2089-2103.
[14] BAI Q C, ZHOU J, HE L. PG-RNN: using position-gated recurrent neural networks for aspect-based sentiment classification[J]. The Journal of Supercomputing, 2022, 78(3): 4073-4094.
[15] FENG S, WANG Y, LIU L R, et al. Attention based hierarchical LSTM network for context-aware microblog sentiment classification[J]. World Wide Web,2019,22(1): 59-81.
[16] LIU N, ZHAO J H. A BERT-based aspect-level sentiment analysis algorithm for cross-domain text[J]. Computational Intelligence and Neuroscience, 2022, 2022: 8726621.
[17] LIN S Y, KUNG Y C, LEU F Y. Predictive intelligence in harmful news identification by BERT-based ensemble learning model with text sentiment analysis[J]. Information Processing amp; Management, 2022, 59(2): 102872.
[18] CHEN Y Z, KONG L Y, WANG Y, et al. Multi-grained attention representation with ALBERT for aspect-level sentimentclassification[J]. IEEE Access, 2021,9: 106703-106713.
[19] LIAO W X, ZENG B, YIN X W, et al. An improved aspect-category sentiment analysis model for text sentiment analysis based on RoBERTa[J]. Applied Intelligence, 2021, 51(6): 3522-3533.
[20] DANYAL M M, KHAN S S, KHAN M, et al. Proposing sentiment analysis model based on BERT and XLNet for movie reviews[J]. Multimedia Tools and Applications, 2024, 83(24): 64315-64339.
[21] 張曉君,黃微,趙旭.網(wǎng)絡(luò)輿情用戶傳播行為的心理距離 感知強(qiáng)度測(cè)度及實(shí)證研究[J].情報(bào)理論與實(shí)踐,2024, 47(7): 135-144.
[22]蘇怡.多維心理距離對(duì)在線影評(píng)有用性的影響研究[D] 哈爾濱:哈爾濱工業(yè)大學(xué),2020.
[23]華生旭,呂厚超.心理距離與建構(gòu)水平的雙向作用關(guān)系 [J].心理科學(xué),2012,35(6):1519-1523.
[24]張曉君,黃微,李瑞.心理距離視角下網(wǎng)絡(luò)輿情傳播意愿 影響因素研究[J].圖書(shū)情報(bào)工作,2019,63(12):86-93.
[25]SKALICKY S, BRUGMANB C,DROOG E, et al. Satire from a far-away land: psychological distance and satirical news[J]. Information, Communication amp; Society,2023, 26(8): 1548-1565.
[26]陳百卉.心理距離對(duì)情感預(yù)測(cè)強(qiáng)度的影響[D].寧波:寧 波大學(xué),2014.
[27] FARKHOD A, ABDUSALOMOV A, MAKHMUDOV F, et al. LDA-based topic modeling sentiment analysis using topic/document/sentence(TDS)model[J].Applied Sciences, 2021, 11(23): 11091.
[28]WON A S, SHRIRAM K, TAMIR D I. Social distance increasesperceivedphysicaldistance[J].Social Psychological and PersonalityScience, 2018,9(3): 372-380.
[29] CALDERON S, MAC GIOLLA E, ASK K, et al. Subjective likelihood and the construal level of future events: a replication study of Wakslak, Trope, Liberman, and Alony (2O06)[J]. Journal of Personality and Social Psychology,2020,119(5): e27-e37.
(編輯:丁紅藝)