岳 揚,山成虎,彭春霖,鄭小琳,閆玉璽,谷 瓊
(1.湖北文理學院計算機工程學院,湖北 襄陽 441053;2.襄陽市第五中學;3.湖北文理學院文學與傳媒學院)
本文所分析的事件的背景描述:2022 年3 月21 日13 時15 分,中國東方航空集團一架波音737 客機由昆明長水機場起飛,14 時38 分在廣西梧州市藤縣埌南鎮(zhèn)莫埌村附近墜毀[1]。事故發(fā)生后,立即啟動應(yīng)急機制[2]。22 日,“3·21”東航飛行事故國家應(yīng)急處置指揮部召開新聞發(fā)布會[3]。23日16時30分,事故現(xiàn)場主要撞擊點東南方向發(fā)現(xiàn)第一部飛行記錄器(黑匣子)[4]。26 日晚,官方宣布“3·21”東航MU5735 航班上123 名乘客和9 名機組人員已全部遇難。27 日,找到“3·21”東航飛行事故客機第二個黑匣子[6]。
飛機墜毀事件出現(xiàn)頻次較低,由于涉及人數(shù)眾多,且生還率極低,往往會引發(fā)重大網(wǎng)絡(luò)輿情。特別是大量民眾急切了解事件動態(tài),密切關(guān)注搜救進展,自媒體大V 等多種傳播主體的介入,頻頻出現(xiàn)的謠言等讓東航MU5735墜毀事件的輿情復(fù)雜程度劇增。本文對新浪微博平臺中,擁有1.47 億粉絲的人民日報微博所發(fā)表東航MU5735墜毀事件微博的評論數(shù)據(jù)進行爬取、提取關(guān)鍵詞,并進行情感分析,以期了解公眾對此次墜機事件的態(tài)度,總結(jié)重大空難事件的輿情傳播規(guī)律,為科學有效處理突發(fā)性安全事故提供輔助參考。
新浪微博是基于用戶關(guān)系的社交媒體平臺,可實現(xiàn)信息的即時分享和傳播互動[7]。截止2020 年3 月,微博月活躍用戶達到5.5億,日活躍用戶達到2.41億[8],已成為公眾發(fā)表評論,表達自己觀點和訴求的主要途徑之一[9]。本文選取人民日報發(fā)表時間為2022 年3 月21 日至4 月1 日且與東航MU5735 墜毀事件直接相關(guān)的20 條微博,選取時間相對不集中,評論數(shù)量較多且包含多個主題。所選主題如表1所示。
表1 事件相關(guān)微博樣本主題及其數(shù)量
我們爬取新浪微博共30,266 條評論數(shù)據(jù),對部分存在空白數(shù)據(jù)和無效評論數(shù)據(jù)進行預(yù)處理,得到共28399 條評論數(shù)據(jù)。另外,對評論數(shù)據(jù)進行關(guān)鍵詞提取,并根據(jù)該事件具體情況進行停用詞處理。
情感分析最早由Nasukawa 等提出[10],文本情感分析是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程[7]。用戶在微博上發(fā)表自己帶有個人情感的評論,通過對這些評論信息的挖掘和分析,可以了解民眾關(guān)于某一事件的觀點和情感。黃仕靖等用TF-IDF 及LDA 主題模型建模,對不同階段和群體的輿情時空演化及差異進行內(nèi)容分析。朱曉卉[11]結(jié)合詞典與LSTM深度學習模型的情感分析方法,對輿情中心人物相關(guān)的評論情感進行極性分析[12]。本文采取關(guān)鍵詞提取和機器學習相結(jié)合的情感分析方法,由于微博評論數(shù)據(jù)大多屬于短文本,則使用文本摘要算法提取短文本中的關(guān)鍵詞,即用TextRank算法對評論進行關(guān)鍵詞提取,然后對提取的關(guān)鍵詞利用Python的SnowNLP來進行情感分析,由于SnowNPL默認模型訓練的語料為電商評論,故使用SnowNPL自帶的分類器,大連理工大學情感詞匯詞典[13]、臺灣大學NTUSD簡體中文情感詞典、清華大學李軍中文褒貶義詞典來訓練模型。
表2 積極、中性、消極情緒相應(yīng)關(guān)鍵詞示例
網(wǎng)絡(luò)輿情一般會經(jīng)歷從形成到高漲,再到波動,直至最終消退的過程[14]。我們對東航MU5735 墜毀事件的新浪微博熱搜話題數(shù)據(jù)進行熱度演化分析。
微博實時熱搜榜是微博基于短時間內(nèi)的搜索量,對話題詞條進行排名的榜單。榜單共記錄50個詞條,每分鐘更新一次。本文對2022年3月21日至4月1日且與東航MU5735墜毀事件直接相關(guān)的熱搜話題數(shù)據(jù)進行處理,據(jù)新浪微博規(guī)則,熱搜話題熱度計算公式如下:
其中,s指搜索量,包括手動輸入搜索和點擊跳轉(zhuǎn)搜索,反映用戶對熱點的關(guān)注和探索的程度。d指討論量,包括原創(chuàng)發(fā)博和轉(zhuǎn)發(fā)討論,t指閱讀量,i指熱搜結(jié)果頁中的互動率[15]。從熱搜時光機網(wǎng)站獲取每天各時段的熱搜話題及其熱度值,本文對每天各熱搜話題的最高熱度值之和進行統(tǒng)計。例如:2022 年3 月31 日有6 條該事件相關(guān)話題上熱搜榜,各話題熱度值表如表3,故當天熱搜話題最高熱度值之和為6,191,362。
表3 2022年3月31日熱搜榜中MU5735墜毀事件相關(guān)話題最高熱度值表
本文采用一種結(jié)合關(guān)鍵詞提取和機器學習的情感分析方法對東航MU5735墜毀事件相關(guān)的部分微博數(shù)據(jù)進行情感分析,同時,統(tǒng)計、分析墜機事件發(fā)生后的微博熱搜話題數(shù)據(jù),了解該事件的輿情熱度演化情況,所采取的研究方法如圖1所示。
圖1 研究方法路線圖
對本次墜機事件中的評論分詞進行詞頻統(tǒng)計,結(jié)果如表4 所示?!靶量嗔恕焙汀靶量唷眱稍~的詞頻之和高達10,468 次,“搜救人員”和“救援人員”兩詞的詞頻之和達到2216次,這是因為評論所在的微博發(fā)表者人民日報發(fā)表了大量救援進展相關(guān)的微博,因此評論樣本中表達對救援人員的感謝較多?!昂谙蛔印痹~頻達到1901 次,因為黑匣子是查明此次墜機事故原因的關(guān)鍵所在,且各大媒體加大對黑匣子相關(guān)信息的科普,以及公眾對黑匣子的好奇心理,致使黑匣子關(guān)注度較高,同時也與人民日報持續(xù)在微博發(fā)表的“黑匣子”相關(guān)微博有關(guān)。東航MU5735墜毀事件微博評論詞云圖如圖2所示。
表4 2022年3月21日至4月1日MU5735墜毀事件相關(guān)微博評論詞頻統(tǒng)計表(詞頻500以上)
圖2 2022年3月21日至4月1日MU5735墜毀事件相關(guān)微博評論詞云圖
為了觀察東航MU5735墜毀事件輿情熱度的演化情況,本文通過記錄2022 年3 月21 日至4 月1 日內(nèi)各相關(guān)熱搜話題的最高熱度值之和,經(jīng)整理得到的相關(guān)熱搜話題熱度值變化圖如圖3所示。
圖3 2022年3月21日東航MU5735墜毀事件輿情熱度演化圖
一般認為,公共危機事件生命周期分為醞釀期、發(fā)生期、持續(xù)期和消退期四個階段。姜勝洪[16]認為輿情演變會以不同的方式經(jīng)歷一個形成、高漲、波動和最終淡化的發(fā)展過程。輿情生命周期劃分原理基本一致。其中粗粒度的劃分可用于個別事件分析,細粒度劃分可用于所有事件[17]。本文將東航MU5735 墜毀事件輿情熱度演化過程[18]劃分為如下幾個階段。
⑴爆發(fā)階段:墜機事件突發(fā),輿情熱度迅速上升
從圖3 輿情演化形勢可以清晰的看出,當3 月21日墜機事件發(fā)生后,微博相關(guān)熱搜話題熱度值馬上到達一個極高的數(shù)值,爆發(fā)階段主要熱搜話題及其最高熱度值如表5所示。
表5 爆發(fā)階段主要熱搜話題及其最高熱度值表
MU5735 墜機詳細過程的公開讓大家對墜機原因更加關(guān)心,當日媒體報道發(fā)現(xiàn)有部分飛機殘骸和人體組織碎片讓公眾的悲傷情緒加劇,輿情熱度到達頂峰。該類突發(fā)性網(wǎng)絡(luò)輿情通常表現(xiàn)為網(wǎng)絡(luò)輿情熱度迅速升高,導致輿情迅速進入成長期和爆發(fā)期,結(jié)合圖3的輿情熱度演化態(tài)勢,故本文將爆發(fā)階段作為第一階段。之所以會如此快速地進入爆發(fā)階段,原因如下:①微博的話題機制加上熱榜機制,信息量一時劇增,加上微博的熱門話題推送機制,即便是不關(guān)心此事件的民眾也在一定程度上了解了該事件;②事故發(fā)生后,總書記和總理立即作出重要指示,此事件具有一定的政治影響;③有些人對政府部門表現(xiàn)出警惕和不信任,有些人對政府部門表示支持和理解,還有一些人對此次事件進行客觀分析,試圖還原事件的“真相”。
⑵回落階段:下雨搜救受阻,官方及時解答,公眾基本了解事件進展,熱度下降
由于墜機事故現(xiàn)場下雨,搜尋進展緩慢,至3月23日晚,東航飛行事故已舉行三場新聞發(fā)布會,第一部黑匣子已被找到,網(wǎng)友關(guān)心的飛行員以及飛機的基本情況在第三場發(fā)布會上得到解答,公眾對該事件情況已經(jīng)基本了解清楚,于是公眾開始對后續(xù)進展持觀望態(tài)度,等待最新搜救進展,因而輿情熱度回落。
⑶回升階段:第二個黑匣子消息先假后真加上確認全員遇難,輿情熱度回升
此階段官方已經(jīng)確認MU5735航班上人員已全部遇難,一百多條生命,涉及到多少個家庭,令人痛惜。公眾開始更加疑惑:事故原因究竟是什么?之后第二部黑匣子被找到,至此兩部黑匣子均找到,公眾認為查清墜機原因的希望變得更大,因此輿情熱度回升,回升階段主要熱搜話題及其最高熱度值如表6。
表6 回升階段主要熱搜話題及其最高熱度值表
⑷冰點階段:黑匣子被找到,公眾等待事件解密,事件熱度暫達冰點
隨著兩個黑匣子被找到,該起事件得到解密似乎只是時間問題,且已經(jīng)確認機上人員全都遇難,民眾期待的奇跡已經(jīng)破滅?!皦嫏C事故現(xiàn)場有黑蝴蝶飄落”、“墜機現(xiàn)場發(fā)現(xiàn)十幾本結(jié)婚證”、“一名消防員在東航飛行事故處置現(xiàn)場的日記”、“消防員參與東航飛行事故處置的心路歷程”等該事件背后的故事得到關(guān)注。4月1日,熱搜榜上暫時難尋該事件蹤影。雖然網(wǎng)絡(luò)輿情可能會暫時達到冰點,但這不代表著它已經(jīng)徹底消亡了。一旦再發(fā)生相關(guān)聯(lián)的事件,網(wǎng)絡(luò)輿情可能會再度引爆。
本文對本次收集的東航MU5375墜毀事件微博評論使用TextRank算法提取關(guān)鍵詞,將使用TextRank算法計算的分數(shù)排名前50 個關(guān)鍵詞繪制詞云如圖4 所示。TextRank 算法不是簡單的完全基于詞頻,而是進一步考慮了文檔之內(nèi)各詞組之間的語義關(guān)系。TextRank 可表示成一個有向有權(quán)圖G=(V,E),該有向有權(quán)圖由點集合V以及邊集合E組成,而E是V×V的子集。公式中Vi,Vj間的邊權(quán)重為Wji,對某個點Vi,In(Vi)為所有指向此點的點集合,同樣的,Out(Vi)為點Vi指向的所有點的集合,此點的分數(shù)定義如下:
圖4 使用TextRank算法得到的關(guān)鍵詞詞頻詞云
其中,d是阻尼系數(shù),可取數(shù)值區(qū)間為[ 0,1 ],此系數(shù)代表該有權(quán)有向圖中某一點指向其他點的概率[18]。
本文對所提取出來的1336 個關(guān)鍵詞使用SnowNPL 進行情感分析,在1336 個關(guān)鍵詞中,共有122 個呈積極情緒,占總體數(shù)量的9.1%;中性情緒966個,占總體數(shù)量的72.3%;消極情緒248個,占總體數(shù)量的18.6%。同時得到使用TextRank算法計算出的分數(shù)排名前16的重點關(guān)鍵詞情緒值如表7所示。
關(guān)鍵詞中消極情緒比例是積極情緒的兩倍,由于微博評論重復(fù)、跟評現(xiàn)象較多,需參考表4、表7 數(shù)據(jù)。表4 中“逝者安息”詞頻達到2160,排名第三,而表7 中消極情緒關(guān)鍵詞“事故”、“逝者”、“難過”均列其中,說明輿情中情緒較悲痛。該事件造成了132 人全部遇難,連具完好的尸體都未保留,中國歷來有“逝者為大”、“死后留全尸”的傳統(tǒng)觀念,因此網(wǎng)民對此有強烈的悲傷表達欲。加上微博等社交媒體便利的“發(fā)帖”、“轉(zhuǎn)發(fā)”、“評論”、“點贊”等功能,信息互相疊加,墜機事件相關(guān)信息能夠迅速傳播,加上該起事件的悲劇性,消極情緒的產(chǎn)生不可避免。同時,中性情緒的關(guān)鍵詞占到72.3%之多,結(jié)合表4、表7 數(shù)據(jù),中性情緒關(guān)鍵詞“黑匣子”、“飛機”、“真相”均在兩表之列,中性情緒關(guān)鍵詞“搜救”在表7 中出現(xiàn),且在表4 中與之關(guān)聯(lián)的“搜救人員”、“救援人員”頻率較高,這表明公眾除了悲痛之外,還關(guān)心搜救進展、事故真相。由于該墜機事件成因未知,出現(xiàn)大量猜測,人們迫切了解真相,故公眾對“黑匣子”、“真相”關(guān)注程度較高?!爸行郧榫w”占比較高的另一個原因是在官媒和自媒體博主等媒體的科普之下,公眾的消極情緒部分被轉(zhuǎn)換為:去了解“飛機事故調(diào)查的全流程”、“黑匣子到底是什么”等問題。
表7 使用TextRank算法排名前16的重點關(guān)鍵詞情緒值表
從表4、表7看,積極情緒關(guān)鍵詞“辛苦”名列前茅,表明公眾對救援人員的敬意、感激。136 次的“奇跡”表明公眾認為墜機事件發(fā)生后機上人員幸存的可能性較低,但是對平安的追求也讓他們心存一份希望。不過當3月26日官方已經(jīng)確認MU5735航班上人員已全部遇難之后,便再難尋“奇跡”的蹤影。事件發(fā)生后,眾多明星第一時間為失事航班祈福,加上媒體的合理引導,公眾消極情緒一部分轉(zhuǎn)化為對奇跡發(fā)生的期盼,自發(fā)為失事同胞祈福。失事發(fā)生后不久,廣西消防總隊便前往救援,有關(guān)部門反應(yīng)迅速,加上媒體對救援過程的實時跟進,公眾對救援人員心存感激。
本文以東航MU5735 墜毀事件為例,通過對3 月21日至4月1日人民日報20條相關(guān)微博評論數(shù)據(jù)使用Python 語言的SnowNPL 情感分析庫對本次事件的輿情信息進行情感分析,同時分析墜機事件發(fā)生后的微博熱搜話題數(shù)據(jù),分析該事件的輿情熱度演化情況,為網(wǎng)絡(luò)輿情的引導和處置提供參考。
本文研究結(jié)論如下。①東航MU5735墜毀事件的輿情熱度演化整體上遵循生命周期理論,但由于該類突發(fā)性網(wǎng)絡(luò)輿情熱度迅速升高,會導致輿情迅速進入成長期和爆發(fā)期,潛伏期往往很短。這將加大輿情檢測難度,甚至可能錯過最佳應(yīng)急處置的機會,這就需要輿情監(jiān)測相關(guān)部門擁有輿情監(jiān)控軟件系統(tǒng),并能夠及時制定處置方案。②從微博評論數(shù)據(jù)提取的MU5735 墜機事件關(guān)鍵詞情感傾向比例分析可知,公眾對該事件以中性情感為主,其次是消極情感,再次是積極情感。這離不開有關(guān)部門及時公開具體事件進展,積極解答公眾關(guān)心的問題,公開透明,讓謠言沒有發(fā)展的土壤,整個輿情形勢有序可控,公眾情緒較穩(wěn)定。也離不開媒體和意見領(lǐng)袖對事件客觀分析,合理引導公眾排解消極情緒,積極參與辟謠工作,避免公眾出現(xiàn)恐慌。