張教萌,師榮蓉
(1.西北大學(xué)數(shù)學(xué)學(xué)院,西安 710127;2.西北大學(xué)經(jīng)濟與管理學(xué)院,西安 710127)
突發(fā)公共衛(wèi)生事件會威脅到人們的生命安全和財產(chǎn)安全,隨即會產(chǎn)生大范圍的社會輿情。社會輿情的表現(xiàn)形式之一是網(wǎng)絡(luò)輿情,然而社交平臺用戶的發(fā)言存在有主張、少依據(jù)、易于情緒化的特征,在突發(fā)事件出現(xiàn)后容易引發(fā)謠言蔓延、群體極化以及利益相關(guān)群體迅速聚集形成群體壓力等危機,所以需要對突發(fā)事件下的網(wǎng)絡(luò)輿情進行監(jiān)管。微博平臺作為突發(fā)事件期間獨特的網(wǎng)絡(luò)輿情信息來源,蘊含豐富的時空信息,對事件的態(tài)勢感知和防控工作有著重要意義。微博數(shù)據(jù)龐大、內(nèi)容混雜,因此,如何通過從非結(jié)構(gòu)化數(shù)據(jù)中快速提取事件信息,進而有效地監(jiān)督互聯(lián)網(wǎng)輿情,并進行正確的輿論疏導(dǎo)就顯得尤為必要。本文以“新冠肺炎”為關(guān)鍵字搜索相關(guān)微博,剔除偏僻詞和頻繁詞對主題提取的影響,先通過LDA(latent Dirichlet allocation)與LDA2vec串行的方法提取主題,并利用SnowNLP計算文本情感值,再劃分時間切片和突發(fā)事件的利益相關(guān)者,最后分別通過絕對關(guān)注度和相對關(guān)注度兩種統(tǒng)計方式得到利益相關(guān)者的輿論演化模式。通過分析社交平臺的輿論演化過程,發(fā)掘不同利益相關(guān)者的關(guān)注點,厘清利益相關(guān)者之間的影響關(guān)系,將有助于及時掌握網(wǎng)絡(luò)輿情的演化態(tài)勢,為政府介入、引導(dǎo)和研判網(wǎng)絡(luò)輿情態(tài)勢提供理論依據(jù)。另外,及時對突發(fā)事件中社交平臺的信息進行復(fù)盤,也有利于為以后突發(fā)事件的輿論監(jiān)控提供決策參考。
近年來,隨著自然語言處理技術(shù)的進步,越來越多的學(xué)者利用機器學(xué)習(xí)和深度學(xué)習(xí)算法研究突發(fā)事件的網(wǎng)絡(luò)輿情,這類研究主要集中于突發(fā)事件的話題識別和情感分析兩個方面。
關(guān)于突發(fā)事件話題的識別主要是利用主題模型對社交平臺上某一段時間內(nèi)的全局話題做演變分析,進而了解不同領(lǐng)域的話題演變過程,發(fā)掘不同時期內(nèi)的熱門話題[1],其中使用最多的是基于LDA的主題模型。針對突發(fā)社會安全事件,吳曉娟[2]利用LDA模型分析“藍(lán)色錢江縱火案”在不同輿情時期的微博話題演化過程。針對突發(fā)事故災(zāi)難事件,Xiong等[3]基于LDA模型捕捉了“印度金奈水危機”事件中的熱點話題,并通過WordNet計算主題熱度來判別一條文本的主題類別。針對突發(fā)自然災(zāi)害事件,Sadri等[4]和Yuan等[5]利用LDA提取颶風(fēng)期間的Twitter數(shù)據(jù)中公眾關(guān)注的問題。王艷東等[6]將支持向量機(support vector machine,SVM)[7]與LDA結(jié)合,先通過主題建模發(fā)現(xiàn)隱藏在微博文本集合中的主題,再利用SVM進行文本主題分類,實現(xiàn)應(yīng)急主題的實時分類與定位,以獲取突發(fā)自然災(zāi)害的主題趨勢和空間分布。Wu等[8]以“2016年中國合肥暴雨洪澇災(zāi)害”為例,將LDA與密度聚類算法結(jié)合,以探索空間子類別的主題。針對突發(fā)公共衛(wèi)生事件,趙華等[9]對H7N9事件中微博和Twit‐ter兩個平臺的主題演化差異進行了對比。Wang等[10]利用LDA模型識別新冠肺炎疫情期間用戶最常發(fā)布的主題,并結(jié)合點贊量、評論量和轉(zhuǎn)發(fā)量等數(shù)據(jù)對不同話題進行了用戶行為分析,研究了用戶關(guān)注度的變化和話題參與度差異。劉雅姝等[11]在突發(fā)事件網(wǎng)民評論的話題圖譜上,利用LDA模型提取了話題圖譜實體中的話題和時間屬性,從多維特征融合角度追蹤突發(fā)事件輿情的演化過程。
突發(fā)事件網(wǎng)絡(luò)輿情的情感分析是指對社交平臺上發(fā)布的相關(guān)文本進行文本情感分析,包含文本情感分類、情感傳播、情感演化等方面的研究。Nep‐palli等[12]對“桑迪”颶風(fēng)期間發(fā)布的推特文本進行地理標(biāo)記的情感分析,在以颶風(fēng)為中心的地理地圖上可視化在線用戶的情緒,分析用戶地理位置與情緒的關(guān)系。Zhang等[13]利用SVM模型對颶風(fēng)“艾瑪”事件的微博做細(xì)粒度情感分類,并在此基礎(chǔ)上使用負(fù)二項回歸分析了情緒和生命周期對信息傳播的影響,使用雙因素方差分析驗證了情緒與生命周期之間的相互作用。崔彥琛等[14]以“藍(lán)色錢江縱火案”為例,采用詞集合并法、SO-PMI(semantic orientation from pointwise mutual information)、PMIIR(pointwise mutual information and information re‐trieval)等方法構(gòu)建了專屬情感詞典,并基于該情感詞典和時間序列分析方法進行了實證分析。Huang等[15]由微博轉(zhuǎn)發(fā)關(guān)系構(gòu)建微博用戶的社會關(guān)系網(wǎng)絡(luò),并運用社交網(wǎng)絡(luò)分析方法和情感挖掘分析技術(shù)研究了輿論傳播中主體與環(huán)境之間的相互作用和演化機制。安璐等[16]則在構(gòu)建微博用戶社會關(guān)系網(wǎng)絡(luò)的基礎(chǔ)上,將用戶劃分為不同的利益相關(guān)者類型,利用情感詞典與句法分析的方法進行情感計算,將情感計算結(jié)果嵌入構(gòu)建的社會網(wǎng)絡(luò)中,得到利益相關(guān)者的社會網(wǎng)絡(luò)情感圖譜。
已有文獻無疑是值得肯定和借鑒的,針對突發(fā)事件網(wǎng)絡(luò)輿情的研究,本文在以下三點加以補充和完善:從研究視角來講,較少有加入突發(fā)事件利益相關(guān)者視角的研究,然而突發(fā)事件網(wǎng)絡(luò)輿情從醞釀到爆發(fā)是由多個利益相關(guān)者相互作用產(chǎn)生的結(jié)果,故本文劃分了11類突發(fā)公共衛(wèi)生事件的利益相關(guān)者,分別觀察這11類利益相關(guān)者在事件發(fā)展過程中的輿論主題變化和情感變化;從使用的主題模型來講,已有文獻主要使用基于LDA的改進模型,本文使用LDA與LDA2vec串行的方法,不僅提高了單獨使用LDA模型在大規(guī)模文本數(shù)據(jù)上進行主題提取的準(zhǔn)確率,還提高了單獨使用LDA2vec模型的實現(xiàn)效率;從統(tǒng)計分析方法來講,本文通過統(tǒng)計絕對關(guān)注度和相對關(guān)注度,得到利益相關(guān)者的絕對關(guān)注話題演化和相對關(guān)注話題演化過程,既縱向?qū)Ρ攘死嫦嚓P(guān)者自身對不同話題的關(guān)注程度,又橫向?qū)Ρ攘死嫦嚓P(guān)者相比于其他利益群體對話題的興趣差異。因此,本文使用LDA與LDA2Vec串行模型提取主題,借助SnowNLP判別文本情感傾向,研究突發(fā)公共衛(wèi)生事件中利益相關(guān)者的話題演化與情感演化特征。
微博輿情演化模式分為主題演化和情感演化,分別利用LDA與LDA2Vec串行模型和SnowNLP實現(xiàn)。將微博用戶劃分為11類新冠肺炎疫情的利益相關(guān)者,統(tǒng)計并可視化得到每類利益相關(guān)者的話題和情感演化過程,研究路線如圖1所示。
主題提取是指利用主題模型發(fā)掘文檔集合中抽象的主題。本文的主題建模涉及LDA模型和LDA2vec模型,下面對它們分別加以介紹。
3.1.1 LDA主題模型
LDA是由Blei等[17]提出的經(jīng)典主題模型,用來識別隱藏在大規(guī)模文檔集或語料庫中的主題信息。它是一種三層貝葉斯概率模型,包含文檔層、主題層和詞層,它假設(shè)整個文檔集合存在K個互相獨立的主題,每個文檔是K個主題的多項式分布,而每個主題又是詞的多項式分布,且多項式分布的先驗分布是Dirichlet分布,即對于任一文檔d和任一主題k,其主題分布和詞分布滿足
其中,α和β為分布的超參數(shù)。對于任一文檔d中的第n個詞,其主題編號z dn的分布和該主題編號下的詞ωd n的分布滿足
則M篇文檔對應(yīng)M個獨立的Dirichlet-multinomial共軛結(jié)構(gòu)。同樣,K個主題對應(yīng)K個獨立的Dirichletmultinomial共軛結(jié)構(gòu),由貝葉斯推斷就可以得到基于Dirichlet先驗分布的θd和φk的后驗分布。
3.1.2 LDA2vec主題模型
LDA2vec是一種融合word2vec[18]與LDA的主題模型[19],結(jié)合了word2vec和LDA的最佳部分。LDA2vec專門在word2vec的skip-gram模型基礎(chǔ)上建模,將詞向量和文檔向量融合進同一個向量空間中同時訓(xùn)練。skip-gram模型通過某個輸入的單詞預(yù)測其上下文詞語的方法來學(xué)習(xí)詞向量,而LDA2vec則使用上下文向量來進行預(yù)測,該上下文向量被創(chuàng)建為詞向量和文檔向量的總和,其中詞向量由skip-gram模型生成,文檔向量是文檔權(quán)重向量和主題矩陣的加權(quán)組合。
LDA2vec模型的損失函數(shù)為
LDA2vec模型在大規(guī)模數(shù)據(jù)上的表現(xiàn)比LDA模型好,但是LDA2vec對設(shè)備GPU的要求比較高,所以會影響到模型實現(xiàn)的效率。然而,如果將LDA模型與LDA2vec模型串行[20],即先利用word2vec和LDA對語料庫進行訓(xùn)練,再利用LDA2vec中的核心算法進行迭代計算得到文本的主題概率分布,那么不僅能夠有效地提高主題提取的準(zhǔn)確率,還能夠有效地提高程序運行效率。
情感分類是指對帶有感情色彩的文本進行分析,判別其情感傾向的過程。SnowNLP是Python的一個自然語言處理庫,它可以快速且高效地處理中文文本內(nèi)容,并且自帶訓(xùn)練語料,可以直接使用SnowNLP庫做文本情感分類。SnowNLP的情感值計算以樸素貝葉斯分類算法為理論基礎(chǔ),計算目標(biāo)詞匯屬于正類或負(fù)類的后驗概率,且將該概率值作為情感值,數(shù)值越接近于1,表示文本內(nèi)容越積極,而越接近于0,則越消極。其計算公式為
依據(jù)文獻[21],將情感值大于等于0.5的微博視為具有積極情感傾向的微博,而情感值小于0.5的微博則視為具有消極情感傾向的微博。
借鑒文獻[22-23],從新冠肺炎疫情中主要涉及的社會角色——抗疫一線單位、政府、媒體和平民來做利益相關(guān)者的劃分??紤]到此次疫情還對旅游業(yè)和學(xué)生復(fù)學(xué)升學(xué)產(chǎn)生了重大影響,故將旅游服務(wù)機構(gòu)和學(xué)校加入利益相關(guān)者當(dāng)中。通過提取用戶的微博認(rèn)證標(biāo)志和用戶主頁中的“行業(yè)分類”信息可以直接得知用戶分類;而對于沒有“行業(yè)分類”信息的用戶,則通過用戶名和用戶主頁內(nèi)“簡介”中的關(guān)鍵詞來進行用戶分類。具體分類標(biāo)準(zhǔn)如表1所示。
表1 新冠肺炎疫情利益相關(guān)者的劃分標(biāo)準(zhǔn)
以“新冠肺炎”為搜索關(guān)鍵詞,采集2020-01-21至2020-10-31時間段內(nèi)的原創(chuàng)微博,共計69922條。對收集的文本進行數(shù)據(jù)清洗,清洗規(guī)則如下:①刪除無效的微博;②刪除重復(fù)項,只保留一條;③去掉文本中的鏈接、@其他用戶、表情。建立“新冠肺炎”詞庫,防止如“人傳人”“火神山”等特殊詞匯被錯誤分詞。利用Python中的jieba庫對清洗后的數(shù)據(jù)進行分詞、去停用詞,然后通過統(tǒng)計詞頻,刪除在每條微博中出現(xiàn)概率小于0.1%的偏僻詞和出現(xiàn)概率接近100%的頻繁詞,最后刪除剩余字段數(shù)量小于8個的過短文本,得到59034條預(yù)處理后的數(shù)據(jù)。其中,用戶數(shù)量分布為普通群眾占比63%,自媒體占比20%,非衛(wèi)生領(lǐng)域政府部門占比8%,其余占比9%;發(fā)文數(shù)量分布為普通群眾占比36%,主流媒體占比23%,自媒體占比22%,其余占比19%。
由于微博指數(shù)只保留近90天的數(shù)據(jù),故參考百度指數(shù)進行時間切片的劃分,截取的“新冠肺炎”百度指數(shù)曲線如圖2所示。
由于“新冠肺炎”的百度指數(shù)具有多峰長尾的特征,不滿足經(jīng)典生命周期理論[24-25],所以本文依據(jù)疫情的發(fā)展階段進行時間切片的劃分。從圖2中可以觀察到幾個比較具有階段特征的低谷點,分別是4月12日、6月6日和8月2日,再結(jié)合歷史新聞,“4月8日武漢市解除封城”“5月27日美國新冠死亡人數(shù)超過10萬人,成為全球第一個死亡病例超過10萬例的國家”“8月9日,巴西成為全球第二個死亡病例超過10萬例的國家”;因此,我們按這幾個時間節(jié)點將時間切片劃分為國內(nèi)疫情爆發(fā)期、國內(nèi)疫情平穩(wěn)期、國際疫情爆發(fā)期和國際疫情平穩(wěn)期。時間切片的起止日期和期間的微博數(shù)量如表2所示。
圖2 “新冠肺炎”的百度指數(shù)曲線
表2 數(shù)據(jù)清洗后的微博文本分布情況
利用LDA與LDA2vec串行的方法提取“新冠肺炎”微博中的主題。當(dāng)設(shè)置主題數(shù)量K=40時,主題困惑度到達一個低谷點,主題之間具有較好的獨立性,提取結(jié)果也相對穩(wěn)定。經(jīng)過主題提取后,得到每條微博的主題概率分布,視概率最大的主題為對應(yīng)微博的主題,即
其中,Topici表示第i條微博的主題;P(Topici,k)表示第i條微博屬于第k主題的概率。統(tǒng)計不同時間切片內(nèi)各主題的微博數(shù)量,繪制主題熱度演變堆積圖,如圖3所示。
圖3 主題熱度演變
由圖3可以直觀地看出,關(guān)于新冠肺炎疫情的實時報道(T8)是所有話題中熱度最高的,在P3時期的占比高達27%。這是由于國際疫情爆發(fā)與國內(nèi)疫情復(fù)發(fā),導(dǎo)致疫情通報數(shù)量大幅增加;其次,中央及地方政府防疫工作(T13)熱度排名第二,說明公眾十分關(guān)注政府的抗疫作為;關(guān)于美國政府對新冠肺炎疫情的態(tài)度(T2)位列話題熱度第三,該話題主要包含美國政府未向美國民眾傳達新冠病毒的真實危害、特朗普推薦的“新療法”等內(nèi)容。話題的熱度演變規(guī)律基本符合事實。例如,圍繞火神山、雷神山兩所醫(yī)院的話題(T6)和新冠肺炎患者成功治愈的新聞(T22)在前兩個時間切片中的數(shù)量較多,而后大幅減少,符合國內(nèi)疫情的發(fā)展情況;關(guān)于表彰抗疫工作杰出代表(T15)和致敬最美逆行者(T16)兩個話題在國內(nèi)疫情爆發(fā)期(P1)內(nèi)大量出現(xiàn),之后減少,是因為9月、10月陸續(xù)舉辦的抗擊新冠肺炎疫情表彰大會而熱度回升;隨著新冠肺炎疫苗的研究和臨床試驗不斷推進,相關(guān)話題(T3)數(shù)量在P4時期大幅增長。
為進一步總結(jié)歸納輿論的分布情況,本文將40個主題歸類為5個大的輿論分支,每個輿論分支包含的主題編號如表3所示。
表3 40個主題的分類情況
統(tǒng)計各時間切片內(nèi)各輿論分支的微博數(shù)量,繪制輿論分支熱度演變堆積圖,如圖4所示。
圖4顯示,在國內(nèi)疫情爆發(fā)期(P1),抗疫行動是被討論最多的輿論分支,主要包含社會對政府工作的關(guān)注,以及如“武漢加油”“致敬最美逆行者”等社會正能量的涌現(xiàn)。隨著國內(nèi)疫情逐漸穩(wěn)定而國際疫情日益嚴(yán)重,關(guān)于國際疫情的話題數(shù)量與P1時期相比明顯增加。雖然有關(guān)經(jīng)濟民生方面的微博數(shù)量相對較少,但是如“企業(yè)破產(chǎn)”“旅游業(yè)重創(chuàng)”“學(xué)生返校復(fù)學(xué)”等話題一度也成為熱議內(nèi)容。
圖4 輿論分支熱度演變
依據(jù)3.3節(jié)中的利益相關(guān)者劃分標(biāo)準(zhǔn),統(tǒng)計各類利益相關(guān)者在每個話題下的微博發(fā)布數(shù)量,得到他們最關(guān)注的5個話題,如圖5所示。
圖5 各類利益相關(guān)者最關(guān)注的5個話題
圖5中每一行表示對應(yīng)利益相關(guān)者最關(guān)注的5個話題。有3組利益相關(guān)者的關(guān)注點在組內(nèi)高度重合,如非衛(wèi)生領(lǐng)域政府部門和學(xué)校最關(guān)注的5個話題完全一致,而醫(yī)療衛(wèi)生部門也有4個話題與上述兩者一致;主流媒體、自媒體和醫(yī)療健康媒體三者最關(guān)注的5個話題完全一致,而普通群眾除了“致敬最美逆行者”話題以外,皆與上述三者一致;醫(yī)院和公益組織也共同關(guān)注了3個話題。由此可見,利益相關(guān)者的關(guān)注點與其在突發(fā)公共衛(wèi)生事件中扮演的社會角色緊密相關(guān)——媒體和普通群眾代表了信息傳播者,政府部門和學(xué)校代表了行政事業(yè)單位,而醫(yī)院和公益組織代表了抗疫一線。
雖然利益相關(guān)者的關(guān)注點受其角色屬性影響,但是不同利益相關(guān)者的關(guān)注傾向仍存在差異。下文將圖5中兩組具有較多共同話題的利益相關(guān)者加以對比,如圖6所示。
圖6 利益相關(guān)者話題分布差異(彩圖請見https://qbxb.istic.ac.cn/CN/volumn/home.shtml)
如圖6所示,主流媒體的話題分布相對均勻,沒有明顯的偏向;醫(yī)療健康媒體主要關(guān)注疾病本身,承擔(dān)了更多的健康知識普及的職責(zé);自媒體熱衷于國際疫情和經(jīng)濟民生中容易引發(fā)社會討論的話題,因為這類話題能夠為自媒體平臺吸引更多的關(guān)注和粉絲;普通群眾則在疫情通報上投入了更多的關(guān)注。對于同屬于行政事業(yè)單位性質(zhì)的3類利益相關(guān)者,他們關(guān)注的話題在分布上都呈現(xiàn)出了對抗疫行動相關(guān)話題的偏向。不同的是,醫(yī)療衛(wèi)生部門明顯顯示出了其醫(yī)療屬性,學(xué)校則需要關(guān)心如學(xué)生返校復(fù)學(xué)等民生問題。
統(tǒng)計各類利益相關(guān)者在各個時間切片下所有話題的微博數(shù)量,即話題的絕對關(guān)注度,得到每類利益相關(guān)者在特定時間段內(nèi)絕對關(guān)注度最高的話題,并計算對應(yīng)的情感值。可視化所有利益相關(guān)者的絕對關(guān)注話題及情感演化過程,如圖7所示。
首先,分析利益相關(guān)者的話題演化特征。從時間流的角度來看,各類利益相關(guān)者關(guān)注的話題在疫情爆發(fā)期內(nèi)比較一致,而在疫情平穩(wěn)期內(nèi)比較分散,這說明在突發(fā)公共衛(wèi)生事件中人們先是關(guān)注于當(dāng)下影響力較強的話題,或者是一些社會上急需解決的問題,而后才逐漸關(guān)注與其利益相關(guān)的話題。從主體的角度來看,在圖6中話題重合度較高的3組利益相關(guān)者——醫(yī)院與公益組織,政府部門與學(xué)校,媒體與普通群眾,他們同樣具有相似的話題演化過程,說明在突發(fā)公共衛(wèi)生事件中相同角色屬性的利益相關(guān)者具有相似的話題演化。前兩組易于理解,而對于媒體與群眾,一個是信息的主要發(fā)布者,一個是信息的主要接收者和擴散者,兩者都是信息傳播過程中的重要角色。在危機傳播的過程中,媒體起著搭起政府與公眾之間信息傳遞通道的“中間人”的作用,是讓信息得以大規(guī)模擴散的主要渠道[26],其中主流媒體充當(dāng)著輿情的預(yù)警者、引導(dǎo)者以及動員者的角色,而自媒體充當(dāng)著輿情的推動者的角色[27]。在新冠肺炎疫情中,《雷火明書》的輿情監(jiān)測數(shù)據(jù)顯示,主流媒體在2月的多個輿情事件中均配合政府重要舉措及時跟進報道,與網(wǎng)民形成了良性互動[28]。在本文收集的微博中,主流媒體發(fā)布的微博平均每條點贊量為365,評論量為24,轉(zhuǎn)發(fā)量為17,其中最高點贊量高達92萬,最高評論量高達3萬,最高轉(zhuǎn)發(fā)量高達1萬。由此可見,主流媒體的發(fā)文得到了大量普通網(wǎng)民的認(rèn)同和討論,說明主流媒體在一定程度上引導(dǎo)著公眾的輿論話題,從而導(dǎo)致兩者具有相似的話題演化過程。
其次,分析利益相關(guān)者的情感演化特征。從時間流的角度來看,在P1時期,由于國內(nèi)疫情嚴(yán)峻,且當(dāng)時還沒有有效的治療方案,導(dǎo)致社會消極情緒在一定范圍內(nèi)激增;而到了P2時期,國內(nèi)疫情基本穩(wěn)定,輿論也隨之轉(zhuǎn)向積極的一面;P3時期沒有明顯的情感傾向;在P4時期,由于國際疫情的持續(xù)蔓延,輿論又傾向于較消極的一面。從主體的角度來看,政府部門和學(xué)校在整個時間線上以傳播正能量為主,醫(yī)生則相對較多地表現(xiàn)出擔(dān)憂的負(fù)面情緒。利益相關(guān)者中主流媒體、自媒體和普通群眾的話題情感演化過程完全一致。為了進一步探究三者之間是否存在情感上的因果關(guān)系,將主流媒體、自媒體和普通群眾的微博文本日情感值做格蘭杰因果關(guān)系檢驗,發(fā)現(xiàn)普通群眾的情緒與主流媒體的情緒互為因果,說明主流媒體在很大程度上影響著公眾看待事件的情緒(表4)。這也體現(xiàn)了隨著融媒體的不斷發(fā)展,主流媒體能夠在重大突發(fā)公共衛(wèi)生事件中發(fā)揮強大的引導(dǎo)力和共情力,在“營造強信心、暖人心、聚民心的環(huán)境氛圍”中起到講好故事的重要作用[28]。
表4 主流媒體、自媒體和普通群眾的日情感值格蘭杰因果關(guān)系檢驗結(jié)果
由圖7易知,由于主流話題在微博數(shù)量上占據(jù)絕對優(yōu)勢,導(dǎo)致如果僅統(tǒng)計絕對關(guān)注度就無法體現(xiàn)利益相關(guān)者之間的差異。因此,本文提出“相對關(guān)注度”的概念,即在同一時間切片下,利益相關(guān)者相比于其他利益相關(guān)者對一個話題的關(guān)注程度。公式為
圖7 各類利益相關(guān)者的絕對關(guān)注話題及情感演化過程
其中,RAk,l,P m表示利益相關(guān)者l在時間切片P m下對話題k的相對關(guān)注度;n k,l,P m表示利益相關(guān)者l在時間切片P m下發(fā)布關(guān)于話題k的微博數(shù)量;r l表示利益相關(guān)者l在總用戶數(shù)量中的占比,該項用于剔除不同類群用戶數(shù)量對微博發(fā)布數(shù)量的影響。如果相對關(guān)注度較高,說明在對應(yīng)時間切片下利益相關(guān)者l相比于其他利益者更關(guān)注話題k。統(tǒng)計各類利益相關(guān)者在各個時間切片內(nèi)相對關(guān)注度最高的話題,并計算對應(yīng)的情感值,可視化所有利益相關(guān)者的相對關(guān)注話題及情感演化過程,如圖8所示。
由圖8可見,利益相關(guān)者的相對關(guān)注話題在各個時間段都比較分散,也沒有出現(xiàn)一致的演化過程,但是這些話題都與利益相關(guān)者自身密切相關(guān),例如,普通群眾積極響應(yīng)政府號召自發(fā)減少外出活動(T34),政府部門第一時間進行辟謠(T37),醫(yī)院組織人員馳援武漢(T7),公益組織呼吁團結(jié)社會力量(T32)。相比于絕對關(guān)注度,相對關(guān)注度排除了主流話題在數(shù)量上的優(yōu)勢,能夠更好地體現(xiàn)與利益相關(guān)者自身利益相關(guān)的話題,反映了利益相關(guān)者在突發(fā)公共衛(wèi)生事件中的輿論立場,這一點在相對關(guān)注話題的情感演化上也得到了驗證。觀察相對關(guān)注話題的情感演化,發(fā)現(xiàn)相對關(guān)注話題的情感傾向更能凸顯利益相關(guān)者在不受主流輿論影響下的情感立場,例如,醫(yī)生傾向于發(fā)布警示性、勸告性的言論,自媒體傾向于發(fā)布抨擊、尖銳、引人耳目的言論,政府部門傾向于發(fā)布提振公眾抗疫士氣、展現(xiàn)政府作為的言論,而主流媒體則配合政府發(fā)布暖人心聚人心的言論。正是因為相對關(guān)注話題體現(xiàn)了利益相關(guān)者在利益關(guān)系網(wǎng)中的位置,所以只要利益相關(guān)者的利益關(guān)系沒有發(fā)生改變,其相對關(guān)注話題的情感傾向一般也不會發(fā)生改變,反映在圖7和圖8中就是相比于絕對關(guān)注話題的情感演化,相對關(guān)注話題的情感演化沒有太多的情感轉(zhuǎn)變。
本文從突發(fā)公共衛(wèi)生事件利益相關(guān)者的角度出發(fā),研究新冠肺炎疫情中11類利益相關(guān)者的網(wǎng)絡(luò)輿情演化過程,得出以下三點研究結(jié)論。第一,按事件發(fā)展的階段來看,利益相關(guān)者們的關(guān)注點在疫情爆發(fā)期內(nèi)比較一致,而在平穩(wěn)期內(nèi)比較分散,最終隨著疫情的逐步控制再次集中。第二,按事件涉及的主體來看,利益相關(guān)者的關(guān)注點與其扮演的社會角色緊密相關(guān),而且相同角色的利益相關(guān)者具有相似的話題和情感演化過程,例如,媒體與普通群眾,政府部門與學(xué)校,醫(yī)院與公益組織。然而即使是相同角色的利益相關(guān)者,彼此關(guān)注的側(cè)重點也存在差異。第三,按生成輿情演化過程的統(tǒng)計方法來看,絕對關(guān)注度反映了各類利益相關(guān)者在主流輿論影響下的關(guān)注點,因此會出現(xiàn)多個利益相關(guān)者共同關(guān)注一些主流話題的情況;而相對關(guān)注度能夠更好地揭示與利益相關(guān)者自身利益相關(guān)的關(guān)注點,所以利益相關(guān)者彼此相對關(guān)注的話題比較分散,對相對關(guān)注話題的情感傾向也不會頻繁轉(zhuǎn)變。將兩種統(tǒng)計方法相結(jié)合,既能從縱向?qū)Ρ壤嫦嚓P(guān)者自身對不同話題的關(guān)注度,又能從橫向?qū)Ρ壤嫦嚓P(guān)者相比于其他利益群體的話題關(guān)注程度。
本文的研究發(fā)現(xiàn)將有助于政府部門掌握突發(fā)公共衛(wèi)生事件中各類利益相關(guān)者在各個階段的話題和情感演化規(guī)律,及時采取應(yīng)對措施,從而減少社會恐慌和輿論偏激等情況的發(fā)生。在未來的工作中,將進行多個社交平臺和多個突發(fā)公共衛(wèi)生事件的對比分析,以期得到更加具有普遍意義的突發(fā)公共衛(wèi)生事件的網(wǎng)絡(luò)輿情演化規(guī)律。