吳克昌 葉陽(yáng)澍
摘要:信息時(shí)代,網(wǎng)絡(luò)空間是公共事件社會(huì)輿情發(fā)酵、發(fā)展的重要場(chǎng)所。一個(gè)無法回避的現(xiàn)實(shí)是,當(dāng)前并未形成成熟有效的網(wǎng)絡(luò)輿情干預(yù)策略,政府應(yīng)對(duì)仍以“維穩(wěn)”“管控”為主,疏導(dǎo)成效堪憂,往往導(dǎo)致輿情結(jié)果消極化。通過基于計(jì)算機(jī)自然語(yǔ)言處理的文本分析法,以新浪微博作為數(shù)據(jù)源,深入挖掘輿情文本內(nèi)涵,把握網(wǎng)絡(luò)議題、網(wǎng)民情感的分布及變遷,在探析網(wǎng)民言論所反映的期望、訴求基礎(chǔ)上,構(gòu)建了公共事件網(wǎng)絡(luò)輿情干預(yù)可能性策略——“順勢(shì)而為”。
關(guān)鍵詞:公共事件;網(wǎng)絡(luò)輿情;干預(yù)策略;文本分析;自然語(yǔ)言處理
中圖分類號(hào): D63,G206.3 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-055X(2019)02-0033-13
doi:10.19366/j.cnki.1009-055X.2019.02.004
一、引言
隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)越來越成為公眾參與公共事件的重要場(chǎng)域,也日益成為社會(huì)治理的關(guān)鍵陣地?;ヂ?lián)網(wǎng)破除了時(shí)空局限,實(shí)現(xiàn)了人人皆可“上網(wǎng)沖浪”,大幅降低了公民參與的門檻與成本,擴(kuò)充了公民參與的規(guī)模。數(shù)據(jù)顯示,截至2018年6月30日,我國(guó)網(wǎng)民規(guī)模達(dá)8.02億人,其中58.6%的網(wǎng)民,約4.7億人曾通過網(wǎng)絡(luò)接受政務(wù)服務(wù)①。
網(wǎng)絡(luò)公共事件中,公民參與主要表現(xiàn)為網(wǎng)民在網(wǎng)絡(luò)空間內(nèi)的發(fā)帖及評(píng)論,通過圖文、音視頻等媒體形式為載體表達(dá)觀點(diǎn)。這些內(nèi)容借助網(wǎng)站,尤其是新浪微博等網(wǎng)絡(luò)社交平臺(tái)實(shí)現(xiàn)廣泛傳播,將輿論大量聚集從而形成輿情。區(qū)別于傳統(tǒng)媒介,網(wǎng)絡(luò)社交平臺(tái)整合了網(wǎng)民的社會(huì)關(guān)系網(wǎng)絡(luò),因此在傳播功能上具有傳播成本低、輻射范圍廣、擴(kuò)散能力強(qiáng)的特點(diǎn)。信息傳播的鏈路及速度在每一個(gè)節(jié)點(diǎn)發(fā)生裂變,因而公共事件網(wǎng)絡(luò)輿情的規(guī)模能夠在短時(shí)間內(nèi)迅速擴(kuò)張,甚至演變?yōu)槿W(wǎng)熱議的社會(huì)性話題。倘若輿情衍生出消極、負(fù)面內(nèi)涵,亦將隨網(wǎng)絡(luò)的爆發(fā)式增長(zhǎng)發(fā)展為輿情危機(jī),從而催生網(wǎng)絡(luò)社會(huì)風(fēng)險(xiǎn)。因此,需要對(duì)網(wǎng)絡(luò)輿情進(jìn)行必要的干預(yù)及疏導(dǎo),化危機(jī)為契機(jī),維護(hù)網(wǎng)絡(luò)空間秩序。
然而,眾多實(shí)踐表明,政府常常面臨網(wǎng)絡(luò)輿情干預(yù)低效甚至失效的困境,導(dǎo)致公眾滿意度低下以及網(wǎng)絡(luò)情緒的消極化。一旦干預(yù)困境無法破局,意味著負(fù)面網(wǎng)絡(luò)情緒將隨事件輿情的結(jié)束無法舒緩,以一種懸而未決的姿態(tài)影響公眾信任,損傷政府公信力,導(dǎo)致更深層次的社會(huì)后果。
近年來,國(guó)內(nèi)外學(xué)者對(duì)網(wǎng)絡(luò)輿情及其干預(yù)方面的研究不斷升溫。有學(xué)者從宏觀理論視角切入,歸納輿情治理工作中的缺陷,總結(jié)政府治理困境并提出消解辦法[1]。部分學(xué)者聚焦于具體案例,剖析輿情要素,進(jìn)而提出輿情治理策略[2]。如王旭、孫瑞英通過輿情傳播結(jié)構(gòu)分析,認(rèn)為識(shí)別并控制傳播關(guān)鍵節(jié)點(diǎn)有助于提升政府對(duì)網(wǎng)絡(luò)輿情的干預(yù)效果[3];劉怡君、陳思佳等運(yùn)用仿真工具分析了重大突發(fā)事件的輿情形成及演化規(guī)律,并以此提出輿情處置策略[4];王英、龔花萍關(guān)注具體輿情的情感維度,通過統(tǒng)計(jì)情感值變化趨勢(shì),建構(gòu)輿情預(yù)警研判機(jī)制[5]。
以往研究提供了網(wǎng)絡(luò)輿情認(rèn)知維度,介紹了內(nèi)容分析法、自然語(yǔ)言處理技術(shù)在同類研究中的應(yīng)用場(chǎng)景,對(duì)本文具有一定啟發(fā)意義,但同時(shí)仍存在一些局限性。第一,偏重于對(duì)輿情傳播性的探討,輿情內(nèi)容的挖掘較為不足;其二,文本素材全面性欠缺,較少研究能將博文類型文本、評(píng)論類型文本同時(shí)納入研究;其三,僅僅梳理淺層現(xiàn)象,缺乏對(duì)現(xiàn)象背后實(shí)質(zhì)原因的剖析,導(dǎo)致相關(guān)策略浮于表面,實(shí)用價(jià)值欠佳。
本文認(rèn)為,個(gè)體行動(dòng)是其意志的表達(dá),行為背后的邏輯由訴求與期望建構(gòu)。因此,解構(gòu)及把握網(wǎng)民參與公共事件網(wǎng)絡(luò)輿情的特定動(dòng)因,增強(qiáng)政府回應(yīng)與網(wǎng)民訴求及期望的適配度,是破除干預(yù)困境,進(jìn)而消減公共事件網(wǎng)絡(luò)輿情社會(huì)成本,達(dá)成網(wǎng)絡(luò)空間善治的關(guān)鍵。
綜上所述,本文將從主題、情感兩個(gè)考察要件入手,借助計(jì)算機(jī)技術(shù)及大數(shù)據(jù)思維,通過自然語(yǔ)言分析矩陣,構(gòu)建對(duì)壽光洪水事件網(wǎng)絡(luò)輿情意涵的完整認(rèn)知。首先,對(duì)構(gòu)成事件輿情主要部分的熱門微博進(jìn)行LDA主題歸類[6],提煉微博博文的主題,將網(wǎng)絡(luò)輿情基本面梳理清晰;接著,對(duì)分布于不同主題的微博,挖掘其引導(dǎo)、動(dòng)員產(chǎn)生的網(wǎng)民評(píng)論,通過TF-IDF關(guān)鍵詞提取法[7],以及機(jī)器學(xué)習(xí)情感分析法[8-9],掌握網(wǎng)民的關(guān)注點(diǎn)及情緒變遷[10]。
基于上述過程,本文構(gòu)建了網(wǎng)絡(luò)輿情干預(yù)策略轉(zhuǎn)化漏斗模型(如圖1所示),接下來將揭示網(wǎng)絡(luò)輿情內(nèi)涵中蘊(yùn)含的網(wǎng)民期望以及行為邏輯,并以此為切入點(diǎn),提出網(wǎng)民期望所指向的政府角色以及任務(wù),從而論述網(wǎng)絡(luò)輿情善治的達(dá)成要件及具體策略。
二、研究方法概述
(一)數(shù)據(jù)采集
本文以“壽光洪水”“壽光水災(zāi)”“壽光洪災(zāi)”“壽光大雨”為關(guān)鍵詞,檢索新浪微博中聚集轉(zhuǎn)發(fā)、點(diǎn)贊、評(píng)論數(shù)量最多的熱門微博共548篇,借助Python 3計(jì)算機(jī)語(yǔ)言自行編寫爬蟲程序,按照特定字段(見表1)進(jìn)行數(shù)據(jù)抓取、記錄。另外,使用八爪魚采集器對(duì)上述微博所聚集的網(wǎng)民評(píng)論進(jìn)行采集和輸出,再通過必要的數(shù)據(jù)清洗及處理,共獲得數(shù)據(jù)30 573條。
(二)數(shù)據(jù)預(yù)處理
數(shù)據(jù)清洗和處理。為保證文本分析的準(zhǔn)確性,需要對(duì)數(shù)據(jù)進(jìn)行清洗和處理。首先,對(duì)采集工具重復(fù)抓取產(chǎn)生的數(shù)據(jù),以及@、[] 等無實(shí)義的html標(biāo)簽、字符進(jìn)行清洗;其次,對(duì)“蹭熱點(diǎn)”、打廣告或其他包含檢索關(guān)鍵詞,但實(shí)際語(yǔ)意與本文案例不符的內(nèi)容,進(jìn)行人工識(shí)別、剔除;最后,對(duì)繁體字進(jìn)行簡(jiǎn)體轉(zhuǎn)化。
中文分詞、去除停用詞。對(duì)原始文本進(jìn)行分詞處理使用jieba分詞工具實(shí)現(xiàn)。,以滿足中文自然語(yǔ)言處理所要求的文本特征;此外,進(jìn)一步對(duì)分詞后的文本去除無實(shí)際意義的停用詞,如關(guān)聯(lián)詞、語(yǔ)氣詞等,提高關(guān)鍵詞提取、主題凝練的精確性使用《哈爾濱工業(yè)大學(xué)停用詞表》實(shí)現(xiàn)。。
(三)數(shù)據(jù)分析
(1)主題挖掘??紤]到微博博文、微博評(píng)論兩類文本在題材、字?jǐn)?shù)方面的差異,為保證主題挖掘的效率及準(zhǔn)確性,對(duì)主題明確、字?jǐn)?shù)較多、段落化特征顯著的微博博文采取基于無監(jiān)督機(jī)器學(xué)習(xí)的LDA(Latent Dirichlet Allocation)模型方法進(jìn)行主題挖掘和提取,最后人工賦予主題具體內(nèi)涵;對(duì)表達(dá)隨意、字?jǐn)?shù)較少、口語(yǔ)化傾向明顯的微博評(píng)論,LDA模型的準(zhǔn)確性將降低,因此采用TF-IDF關(guān)鍵詞提取法,輸出權(quán)重較高的關(guān)鍵詞(如表2所示)作為定位點(diǎn),返回原始文本并進(jìn)行人工主題歸納和分類。