史偉 薛廣聰 何紹義
(1.湖州師范學(xué)院經(jīng)濟(jì)管理學(xué)院,湖州,313000; 2.湖州師范學(xué)院信息工程學(xué)院,湖州,313000; 3.加州州立大學(xué)圣伯納迪諾分校商業(yè)與公共管理學(xué)院,美國(guó),CA 92418)
根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第48次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2021年6月為止,我國(guó)網(wǎng)民總數(shù)為10.11億,手機(jī)網(wǎng)民總數(shù)為10.07億,互聯(lián)網(wǎng)普及率達(dá)71.6%。隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展和智能設(shè)備的普及,信息獲取和傳遞機(jī)制的改變不僅能使公眾及時(shí)地了解國(guó)內(nèi)外發(fā)生的突發(fā)事件,也使傳統(tǒng)的社會(huì)輿論從線下轉(zhuǎn)移到線上并演變?yōu)榫W(wǎng)絡(luò)輿情。一般說來,網(wǎng)絡(luò)輿情是指在一定的社會(huì)空間內(nèi),網(wǎng)民們通過互聯(lián)網(wǎng)表達(dá)對(duì)于某個(gè)社會(huì)突發(fā)事件的看法、觀點(diǎn)和情感的集合,是社會(huì)輿論在互聯(lián)網(wǎng)上的映射與直接反映,并且表現(xiàn)出較強(qiáng)的自由性、多元性和交互性。如何正確處理網(wǎng)絡(luò)輿情不僅是學(xué)術(shù)界重點(diǎn)關(guān)注的范疇,也是社會(huì)各界共同面對(duì)的問題[1]。
在大數(shù)據(jù)背景下,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用為深層次的網(wǎng)絡(luò)輿情研究提供了方法支持,同時(shí)文本、圖片和短視頻等載體也為多維度的網(wǎng)絡(luò)輿情研究提供了豐富的數(shù)據(jù)支撐。由于載體所包含的情感信息是推動(dòng)輿情傳播和發(fā)酵的重要因素之一,國(guó)內(nèi)外學(xué)者逐漸開始從情感角度對(duì)網(wǎng)絡(luò)輿情展開研究。通過引入情感分析技術(shù)探究網(wǎng)絡(luò)輿情的情感演變規(guī)律和輿情事件的傳播特征,有助于政府部門正確處置網(wǎng)絡(luò)輿情、及時(shí)把控輿情導(dǎo)向,這對(duì)我國(guó)社會(huì)的發(fā)展和進(jìn)步具有重要的現(xiàn)實(shí)意義。
本文系統(tǒng)整理了近些年國(guó)內(nèi)外學(xué)者在情感視角下的網(wǎng)絡(luò)輿情研究進(jìn)展并分析了未來的研究趨勢(shì)。我們的討論基于Web of Science和中國(guó)知網(wǎng)(CNKI)所提供的文獻(xiàn),使用詞云和CiteSpace軟件作為可視化工具進(jìn)行知識(shí)圖譜的構(gòu)建,通過文獻(xiàn)分析法對(duì)國(guó)內(nèi)外網(wǎng)絡(luò)輿情情感分類、情感演化、情感預(yù)測(cè)和網(wǎng)絡(luò)輿情治理四個(gè)方面的研究進(jìn)展進(jìn)行歸納與對(duì)比,旨在幫助相關(guān)學(xué)者進(jìn)一步了解該領(lǐng)域的研究現(xiàn)狀和發(fā)展趨勢(shì),為將來開展深層次研究提供理論參考和依據(jù)。
本文采用文獻(xiàn)研究法分析國(guó)內(nèi)外網(wǎng)絡(luò)輿情的研究現(xiàn)狀,中英文文獻(xiàn)分別選自CNKI全文數(shù)據(jù)庫(kù)和Web of Science數(shù)據(jù)庫(kù)。由于網(wǎng)絡(luò)輿情主要由突發(fā)事件引起,并且考慮到2020年爆發(fā)的“新冠肺炎”疫情引起的網(wǎng)絡(luò)輿情,本文分別以“(主題:網(wǎng)絡(luò)輿情)AND(主題:情感)OR(主題:新冠肺炎)AND(主題:情感)OR(主題:突發(fā)事件)AND(主題:情感)”和“sentiment analysis(All Fields)and public opinion(All Fields)”作為CNKI數(shù)據(jù)庫(kù)和Web of Science數(shù)據(jù)庫(kù)的檢索式進(jìn)行檢索(檢索時(shí)間為2020年12月31日),為了保證參考文獻(xiàn)的質(zhì)量,設(shè)置中文期刊來源類別為“北大核心”和“CSSCI”,英文期刊來源為“Web of Science 核心合集”。鑒于2008年國(guó)內(nèi)接連發(fā)生諸多重大突發(fā)事件,新老媒體的互動(dòng)使得網(wǎng)絡(luò)具有巨大的輿論能量,網(wǎng)絡(luò)輿情開始受到學(xué)者們的關(guān)注與研究,因此本文設(shè)置索引時(shí)間范圍為“2008-1-1至2020-12-31”,最終檢索出304篇中文文獻(xiàn)和231篇外文文獻(xiàn)。
我們統(tǒng)計(jì)了2008年至2020年間CNKI和Web of Science數(shù)據(jù)庫(kù)歷年發(fā)表的相關(guān)文獻(xiàn)數(shù)量,如圖1所示,一方面反映出該研究領(lǐng)域歷年來的發(fā)展趨勢(shì),另一方面也體現(xiàn)出學(xué)術(shù)界對(duì)網(wǎng)絡(luò)輿情情感主題方面研究的關(guān)注程度。
從圖1中可以看出國(guó)內(nèi)外對(duì)該領(lǐng)域的研究趨勢(shì)大致相同,2008年到2011年間該領(lǐng)域研究在國(guó)內(nèi)鮮有人關(guān)注,直至2012年關(guān)注度才有所上升,“7.23溫州動(dòng)車事故”“雅安地震”“南方各地洪澇災(zāi)害”和“上海外灘踩踏事件”等突發(fā)事件在網(wǎng)絡(luò)上不斷發(fā)酵,致使更多學(xué)者從輿情情感的角度出發(fā)對(duì)突發(fā)事件網(wǎng)絡(luò)輿情的演化和傳播進(jìn)行深入研究。2018年以來機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù)被大量應(yīng)用在網(wǎng)絡(luò)輿情的情感分析中,使得情感分類和情感演化得到更加精確的研究結(jié)果,2019年“涼山州森林火災(zāi)事件”和2020年“新冠肺炎疫情”的發(fā)生,使得該領(lǐng)域的關(guān)注度直線上升。相較于國(guó)內(nèi)研究進(jìn)展,國(guó)外學(xué)者從情感角度對(duì)網(wǎng)絡(luò)輿情的研究起步較晚,直至“MH370航班失聯(lián)事件”“埃博拉病毒肆虐”“拉斯維加斯槍擊案”和“印尼海嘯”等突發(fā)事件發(fā)生后該領(lǐng)域研究熱度才逐漸上升,并在2018年以后呈現(xiàn)爆發(fā)式增長(zhǎng)。2020年爆發(fā)的新冠肺炎疫情更是成為引爆網(wǎng)絡(luò)輿情的導(dǎo)火索,網(wǎng)絡(luò)輿情迅速在全球范圍內(nèi)產(chǎn)生并不斷傳播,使得該領(lǐng)域的關(guān)注度達(dá)到頂峰,同時(shí)也激發(fā)了更多學(xué)者對(duì)網(wǎng)絡(luò)輿情的關(guān)注和研究。
圖1 ?國(guó)內(nèi)外網(wǎng)絡(luò)輿情情感研究論文發(fā)表數(shù)量趨勢(shì)圖Fig.1 The Trend Chart of the Number of Published Research Papers on Network Public Opinion at Home and Abroad
關(guān)鍵詞作為文獻(xiàn)的關(guān)鍵信息和知識(shí)標(biāo)簽?zāi)軌蚍从吵鑫恼碌闹行膬?nèi)容,本文統(tǒng)計(jì)了國(guó)內(nèi)外文獻(xiàn)中的關(guān)鍵詞信息并進(jìn)行詞云可視化構(gòu)建(如圖2所示)。TFIDF是一種常用的信息檢索與數(shù)據(jù)挖掘方法,具有很強(qiáng)的適用性和魯棒性,其中詞頻(Term Frequency,TF)用于統(tǒng)計(jì)詞語在語料庫(kù)中出現(xiàn)的頻次,逆文件頻率(Inverse Document Frequency,IDF)則考察詞語在多條評(píng)論中的共現(xiàn)情況,進(jìn)而判斷候選詞對(duì)文章的刻畫能力。某個(gè)詞語對(duì)文章的重要性與它的TF-IDF值成正比,因此通過計(jì)算詞語的TF-IDF值可以較客觀地提取出文章高頻詞。我們抽取TF-IDF值排名前10的關(guān)鍵詞進(jìn)行比較,如表1所示,通過關(guān)鍵詞對(duì)比可以看出,國(guó)內(nèi)外學(xué)者在該領(lǐng)域的研究主要基于三種方法,即機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和情感詞典;同時(shí),國(guó)內(nèi)學(xué)者傾向于研究網(wǎng)絡(luò)輿情的輿情分析、輿情監(jiān)測(cè)、情感演化和情感分類,而國(guó)外學(xué)者對(duì)大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)輿情數(shù)據(jù)挖掘研究較多。
表1 ?國(guó)內(nèi)外網(wǎng)絡(luò)輿情情感研究文獻(xiàn)關(guān)鍵詞排序Table 1 Keywords’Ranking of Domestic and Foreign Research Literatures in Network Public Opinion
研究相關(guān)文獻(xiàn)主題的變遷趨勢(shì)能夠反映出不同時(shí)期學(xué)者重點(diǎn)研究的方向以及該領(lǐng)域的知識(shí)發(fā)展歷史和現(xiàn)狀,因此我們利用CiteSpace軟件繪制國(guó)內(nèi)外相關(guān)文獻(xiàn)的時(shí)間軸視圖(如圖3和圖4所示)。該視圖能夠反映出各個(gè)聚類發(fā)展演變的時(shí)間跨度和研究進(jìn)程,為各個(gè)子領(lǐng)域的演變路徑提供了直觀而準(zhǔn)確的參考。從左到右依次表示關(guān)鍵詞出現(xiàn)的先后時(shí)間順序,從上到下依次表示遞減的聚類信息,通過時(shí)間軸視圖可以梳理出研究熱點(diǎn)的歷史來源及其發(fā)展脈絡(luò)。網(wǎng)絡(luò)輿情和情感分析研究從2010年到2020年一直是學(xué)術(shù)界研究的熱點(diǎn)話題,早期研究方法主要以情感詞典為主,隨著大數(shù)據(jù)和新媒體的發(fā)展,研究方法逐漸多元化,如機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、認(rèn)知情感評(píng)價(jià)模型、社會(huì)網(wǎng)絡(luò)分析、主題建模等。
目前文本情感分析技術(shù)主要應(yīng)用在電子商務(wù)、市場(chǎng)競(jìng)爭(zhēng)和在線評(píng)論等領(lǐng)域,隨著網(wǎng)絡(luò)輿情研究熱度逐漸升高,情感分析也逐漸延伸到網(wǎng)絡(luò)輿情領(lǐng)域。由于網(wǎng)絡(luò)輿情受輿情主體、輿情客體和外部環(huán)境等多種因素的影響,因此對(duì)網(wǎng)絡(luò)輿情進(jìn)行情感分析是一個(gè)復(fù)雜的過程,圖5描述了網(wǎng)絡(luò)輿情情感分析的整個(gè)過程,包括網(wǎng)絡(luò)輿情情感分類、網(wǎng)絡(luò)輿情情感演化、網(wǎng)絡(luò)輿情情感預(yù)測(cè)和網(wǎng)絡(luò)輿情治理,下文將分別從這四個(gè)方面總結(jié)國(guó)內(nèi)外網(wǎng)絡(luò)輿情的研究現(xiàn)狀。
情感分類是情感分析的基礎(chǔ)和依據(jù),傳統(tǒng)的文本分類只關(guān)注文本的客觀內(nèi)容,而情感分類更多研究的是文本作者的“主觀因素”,即表達(dá)者的情感傾向。本節(jié)對(duì)比了部分網(wǎng)絡(luò)輿情情感分類文獻(xiàn)的研究數(shù)據(jù)、研究方法和研究結(jié)果(如表2所示),并分別從三種技術(shù)層面評(píng)述網(wǎng)絡(luò)輿情情感分類相關(guān)研究。
圖2 ?國(guó)內(nèi)外網(wǎng)絡(luò)輿情情感研究文獻(xiàn)關(guān)鍵詞詞云Fig. 2 Keywords Word Cloud of Domestic and Foreign Research Literatures in Network Public Opinion Sentiment
圖3 ?國(guó)內(nèi)網(wǎng)絡(luò)輿情情感研究文獻(xiàn)時(shí)間軸圖譜Fig.3 Timeline Spectrum of Research Literatures in Domestic Network Public Opinion Sentiment
一是基于情感詞典分類方法。情感詞典作為一種重要的情感分類資源,它的分類粒度的粗細(xì)程度直接決定了情感分析結(jié)果的準(zhǔn)確性。有學(xué)者在通用情感詞典的基礎(chǔ)上結(jié)合同義詞表、領(lǐng)域情感詞和網(wǎng)絡(luò)詞匯等詞語構(gòu)建了不同類型的情感詞典,例如表情符號(hào)情感詞典(分為7種情感類:樂、哀、怒、驚、懼、好、惡)[2]、消防領(lǐng)域輿情情感詞典(分為3種情感類:積極、中立、消極)[3]和突發(fā)事件領(lǐng)域情感詞典(分為7大類21小類)[4]等。鑒于大多數(shù)研究集中在文本內(nèi)容的淺層特征,而對(duì)其內(nèi)在特征關(guān)注不足,曾子明[5]基于改進(jìn)后的情感詞典提出一種融合深層演化特征、淺層詞性特征和情感特征的多層次特征組合模型,將情感進(jìn)行正負(fù)性分類并且準(zhǔn)確度達(dá)到85%;栗雨晴等[6]基于HowNet、WordNet和NTUSD詞典構(gòu)建雙語情感詞典將微博文本情感分為社會(huì)關(guān)愛、高興、悲傷、憤怒、恐懼五類,該詞典有效解決了文本情感分析方法多基于單一語種的問題;Xu等[7]結(jié)合基本情感詞、五種場(chǎng)景情感詞和多義情感詞組建新的情感詞典,通過設(shè)計(jì)的情感計(jì)算規(guī)則有效實(shí)現(xiàn)了文本情感分類。雖然情感詞典無須通過大規(guī)模數(shù)據(jù)的訓(xùn)練來提高情感分類準(zhǔn)確率,但對(duì)不同領(lǐng)域的情感分析研究仍需構(gòu)建有針對(duì)性的領(lǐng)域情感詞典。
表2 ?國(guó)內(nèi)外部分網(wǎng)絡(luò)輿情情感分類研究文獻(xiàn)對(duì)比Table 2 Comparison of Some Domestic and Foreign Network Public Opinion Sentiment Classification Research Literature
二是基于機(jī)器學(xué)習(xí)方法。機(jī)器學(xué)習(xí)是一種使用大量有標(biāo)注的或無標(biāo)注的語料進(jìn)行模型訓(xùn)練的學(xué)習(xí)方法,目前已經(jīng)在情感分類方面取得較多不錯(cuò)的成果。鄧君[8]基于Word2Vec和支持向量機(jī)將微博輿情文本情感分為積極和消極兩類,經(jīng)訓(xùn)練后該模型的分類準(zhǔn)確率達(dá)到93%,但其并未考慮句式和語法結(jié)構(gòu)對(duì)情感分類準(zhǔn)確率的影響。C.R.Machuca等[9]運(yùn)用自然語言處理技術(shù)和Logistic回歸算法將新冠肺炎疫情相關(guān)的Twitter文本自動(dòng)分為積極或消極兩個(gè)維度,分類精度達(dá)到78.5%。Kaur等[10]采用N-gram算法和KNN分類器分別進(jìn)行特征提取和情感分類,將文本傾向分為正、負(fù)和中性情感,實(shí)驗(yàn)結(jié)果表明該模型分類性能優(yōu)于現(xiàn)有模型,情感分類準(zhǔn)確率達(dá)到82%。Li等[11]開發(fā)了一種聯(lián)合訓(xùn)練算法,結(jié)合L-BFGS算法和多標(biāo)簽最大熵模型(MME)將短文本情感分為生氣、厭惡、害怕、開心、傷心、驚訝六大類,在微博、推特、BBC論壇等數(shù)據(jù)集上的平均準(zhǔn)確率達(dá)到86.06%。Er等[12]提出一個(gè)情感詞典和機(jī)器學(xué)習(xí)方法相結(jié)合的Twitter情感分析模型,根據(jù)用戶頻繁使用的表情符號(hào)和非正式英語進(jìn)行情感分類,總體準(zhǔn)確率可以達(dá)到81.9%,優(yōu)于傳統(tǒng)的情感詞典和機(jī)器學(xué)習(xí)方法。楊爽等[13]提出一種基于SVM多特征融合的情感分類模型,從詞性、情感、句式和語義等特征實(shí)現(xiàn)情感的五級(jí)分類,該模型在短文本情感分類中取得較高的準(zhǔn)確率。
圖5 ?網(wǎng)絡(luò)輿情情感分析過程Fig. 5 Analysis Process of Network Public Opinion Sentiment
三是基于深度學(xué)習(xí)方法。該方法主要通過情感標(biāo)注、詞向量訓(xùn)練以及長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)[14]、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[15-17]和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)對(duì)情感進(jìn)行正負(fù)性或褒貶性等不同程度的分類。認(rèn)知情感評(píng)價(jià)模型(OCC)被認(rèn)為是第一個(gè)以計(jì)算機(jī)實(shí)現(xiàn)目的而發(fā)展起來的情感模型,吳鵬等[18]提出一種基于OCC的卷積神經(jīng)網(wǎng)絡(luò)情感識(shí)別模型,通過OCC模型進(jìn)行情感標(biāo)注并建立極性計(jì)算規(guī)則對(duì)輿情文本進(jìn)行情感分類,最高可達(dá)90.98%的準(zhǔn)確率。金占用等[19]應(yīng)用OCC情感規(guī)則能提高模型分類準(zhǔn)確率的特點(diǎn),基于長(zhǎng)短期記憶網(wǎng)絡(luò)模型構(gòu)建了網(wǎng)絡(luò)輿情多情感分類模型,將情感分為積極情感、消極情感和中性情感。為解決傳統(tǒng)模型無法根據(jù)語境對(duì)詞語進(jìn)行理解,孫靖超[20]設(shè)計(jì)了一種基于優(yōu)化深度雙向自編碼網(wǎng)絡(luò)的情感分類模型,通過偽標(biāo)簽方法、混合池化以及L2正則化提高模型泛化能力,實(shí)驗(yàn)表明該模型在小數(shù)據(jù)集下具有更好的分類性能。郭修遠(yuǎn)等[21]基于神經(jīng)網(wǎng)絡(luò)模型提出一種多輸入多任務(wù)協(xié)同學(xué)習(xí)的情感分類模型,有效地解決了單任務(wù)單輸入模型分類效果不佳的問題。由于循環(huán)神經(jīng)網(wǎng)絡(luò)編碼器受遞歸模型的限制,導(dǎo)致獲取語句序列信息有限,陳珂等[22]提出一種基于情感詞典與Transformer模型的融合特征信息情感分類模型,引入自注意力機(jī)制使得模型在訓(xùn)練過程中能學(xué)習(xí)到豐富的情感特征信息,最后在不同語言的數(shù)據(jù)集上均取得較好的分類準(zhǔn)確率。
綜上,傳統(tǒng)的情感詞典方法主要依賴種子情感詞和人工設(shè)計(jì)的規(guī)則,但互聯(lián)網(wǎng)時(shí)代信息更新速度加快,不斷涌現(xiàn)出熱門詞語和網(wǎng)絡(luò)特殊用語等,需要不斷擴(kuò)充情感詞典才能滿足需要。為了提高情感分類的準(zhǔn)確率,學(xué)者通過大量有標(biāo)注或無標(biāo)注的語料使用各類機(jī)器學(xué)習(xí)算法進(jìn)行情感分類,雖然情感分類性能一定程度上優(yōu)于情感詞典,但機(jī)器學(xué)習(xí)方法往往忽略了上下文語義信息從而影響情感分類的準(zhǔn)確性。與機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)具有較強(qiáng)的特征學(xué)習(xí)能力,能更好地融合上下文信息以解決傳統(tǒng)情感分類方法中的缺陷,有效提高情感分類的準(zhǔn)確率,但其訓(xùn)練時(shí)間長(zhǎng)、可解釋性差的缺點(diǎn)也較明顯。
此外,目前網(wǎng)絡(luò)輿情情感分類的研究數(shù)據(jù)多來自不同領(lǐng)域的文本信息,但是隨著多媒體時(shí)代的到來,網(wǎng)民的情感表達(dá)方式逐漸向圖像和視頻轉(zhuǎn)移,結(jié)合多媒體數(shù)據(jù)中的多模態(tài)信息可以挖掘出更加準(zhǔn)確和豐富的情感信息,提高情感分類的準(zhǔn)確率。例如:Cao等[23]基于視覺情感本體(Visual Sentiment Ontology,VSO)提出一種視覺情感主題模型(Visual Sentiment Topic Model,VSTM)對(duì)圖像中隱含的情感信息進(jìn)行正面、負(fù)面和中性分類,該模型可以選擇出具有區(qū)別性的視覺情感本體特征來增強(qiáng)視覺情感分析效果;Huang等[24]提出一種新的圖像-文本情感分析模型即深度多模態(tài)注意力融合模型(Deep Multimodal Attention Fusion,DMAF),利用視覺內(nèi)容和文本數(shù)據(jù)之間的區(qū)別特征和內(nèi)在關(guān)聯(lián)進(jìn)行聯(lián)合情感分類,并在四種不同的數(shù)據(jù)集上驗(yàn)證了該模型的有效性;章蓀等[25]提出一種多任務(wù)學(xué)習(xí)的情感分類模型,使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)(BiGRU)進(jìn)行模態(tài)特征維度的統(tǒng)一和序列數(shù)據(jù)關(guān)聯(lián)性的挖掘,引入多頭自注意力機(jī)制實(shí)現(xiàn)跨模態(tài)信息的融合,以情感評(píng)分作為分類依據(jù),在公開多模態(tài)基準(zhǔn)數(shù)據(jù)集上測(cè)試的模型分類精確度和F1值達(dá)到84.7%;范濤等[25]設(shè)計(jì)一種多模態(tài)融合情感識(shí)別方法,分別構(gòu)建BiLSTMs模型和基于遷移學(xué)習(xí)的微調(diào)CNNs模型提取文本和圖片的情感特征,在特征層融合后輸入支持向量機(jī)中進(jìn)行情感分類,實(shí)驗(yàn)將數(shù)據(jù)集的情感極性分為正面、負(fù)面和中性三類,所提出的情感分類模型準(zhǔn)確率達(dá)到85.3%。多模態(tài)情感分析領(lǐng)域的復(fù)雜性體現(xiàn)為情感信息之間的關(guān)聯(lián)性,同時(shí)也影響對(duì)多模態(tài)對(duì)象的情感判斷,如何搭配最佳的模態(tài)內(nèi)容進(jìn)行情感分析值得學(xué)者們進(jìn)一步研究。
情感演化是通過分析帶有情感色彩的主觀性信息,并基于情感態(tài)度和觀點(diǎn)分析情感在時(shí)間和空間上的演化規(guī)律。針對(duì)各種突發(fā)事件中此起彼伏的輿論熱潮,國(guó)內(nèi)學(xué)者從不同維度對(duì)網(wǎng)絡(luò)輿情的情感演化過程進(jìn)行了全面分析和研究,而國(guó)外學(xué)者在這方面的相關(guān)研究較少。本節(jié)系統(tǒng)整理了國(guó)內(nèi)學(xué)者近年來關(guān)于網(wǎng)絡(luò)輿情情感演化的主要研究?jī)?nèi)容,如表3所示。從表3中可以看出目前國(guó)內(nèi)研究所使用的方法有模型構(gòu)建[27]、樸素貝葉斯[28]、態(tài)勢(shì)感知理論[29]、K-鄰近算法[30]、生命周期理論[31-32]、深度學(xué)習(xí)[33]、聚類算法[34]、數(shù)據(jù)仿真[35]等,這些方法的應(yīng)用進(jìn)一步拓展了該領(lǐng)域的理論研究和實(shí)踐探索。例如,為了探究移動(dòng)環(huán)境下網(wǎng)絡(luò)用戶情感演化規(guī)律,王晰巍等[28]應(yīng)用改進(jìn)的樸素貝葉斯模型對(duì)用戶評(píng)論進(jìn)行情感傾向性識(shí)別,分別基于詞頻、地域和時(shí)間三個(gè)可視化維度探究用戶的情感變化趨勢(shì),深度分析移動(dòng)環(huán)境下網(wǎng)絡(luò)用戶不同的情感表達(dá)對(duì)輿情傳播的影響,但樸素貝葉斯分類器往往會(huì)忽略掉特征詞的上下文信息,導(dǎo)致情感文本的信息缺失。在此基礎(chǔ)上,陳凌等[36]利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)結(jié)合情感上下文信息,通過多層次時(shí)間序列分析臺(tái)風(fēng)“利奇馬”事件特性與網(wǎng)民負(fù)面情感之間的關(guān)聯(lián),研究發(fā)現(xiàn)不同危機(jī)情境下社交化媒體用戶表達(dá)出的負(fù)面情感各不相同,后續(xù)可以關(guān)注情感波動(dòng)對(duì)輿情事件期間社交媒體信息的影響。福島核泄漏事故發(fā)生后,Hasegawa等[37]通過對(duì)推文的區(qū)域標(biāo)識(shí)符(名詞、地名、郵政編碼和電話號(hào)碼等)進(jìn)行分類,然后根據(jù)單個(gè)推文的情感傾向(積極或消極)來分析民眾對(duì)這些地區(qū)的感受,研究結(jié)果發(fā)現(xiàn)事故發(fā)生后網(wǎng)民對(duì)輻射的負(fù)面情緒隨時(shí)間推移呈下降趨勢(shì),但對(duì)福島縣的負(fù)面情緒卻變得更加極端。
表3 ?國(guó)內(nèi)網(wǎng)絡(luò)輿情情感演化研究文獻(xiàn)整理Table 3 Domestic Network Public Opinion Emotion Evolution Research Literature Collation
在輿情主題分析方面,安璐等[33]通過用戶轉(zhuǎn)發(fā)關(guān)系、情感類型和情感強(qiáng)度繪制社會(huì)網(wǎng)絡(luò)情感圖譜,結(jié)合輿情話題綜合分析利益相關(guān)者的情感演化過程,結(jié)果表明普通群眾的情感更易受意見領(lǐng)袖的影響,各利益相關(guān)者的主導(dǎo)情感也隨著輿情演化而不斷變化。林永明[38]提出一種動(dòng)態(tài)主題情感模型(dSLDA)識(shí)別輿情主題和網(wǎng)民情感,依據(jù)輿情趨勢(shì)、詞匯主題和情感標(biāo)簽分析輿情事件各個(gè)話題的情感分布特征和波動(dòng)趨勢(shì)。朱曉霞[39]和Liu[40]針對(duì)靜態(tài)情感判斷的局限性提出一個(gè)動(dòng)態(tài)主題—情感演化模型來對(duì)整個(gè)情感演變過程進(jìn)行動(dòng)態(tài)情感分析,在主題提取方面相較于傳統(tǒng)方法性能有所提升。劉麗群等[41]從社會(huì)計(jì)算視角出發(fā),綜合情感分析結(jié)果和輿情主題總結(jié)了網(wǎng)民關(guān)注的熱門輿情話題,從災(zāi)情情況、政府應(yīng)對(duì)、災(zāi)民感受等方面對(duì)輿情相關(guān)因素進(jìn)行分析,社會(huì)計(jì)算技術(shù)提高了網(wǎng)絡(luò)輿情態(tài)勢(shì)的分析能力,從結(jié)果上看更貼近輿情本身。此外,F(xiàn)u[42]和Huang[43]研究了個(gè)體情緒、網(wǎng)絡(luò)結(jié)構(gòu)、輿情傳播主體與環(huán)境等內(nèi)外因素對(duì)網(wǎng)絡(luò)輿情演化的影響。Fang[44]運(yùn)用情感分析技術(shù)和分室模型模擬社交媒體上網(wǎng)絡(luò)輿情信息的傳播過程,根據(jù)公眾情感傾向和模擬結(jié)果對(duì)七個(gè)社會(huì)輿情話題的趨勢(shì)進(jìn)行評(píng)估。Wang等[45]通過分析網(wǎng)民主流情感強(qiáng)度的突變特征來識(shí)別輿情爆發(fā)的關(guān)鍵時(shí)間窗口,有助于防止輿情事件進(jìn)一步惡化。Andrea等[46]通過探討Twitter用戶的情感極性與每日推文數(shù)量峰值的對(duì)應(yīng)關(guān)系,從中發(fā)現(xiàn)可能會(huì)引起公眾興趣或影響公眾輿論的疫苗接種事件,然后根據(jù)相關(guān)事件追蹤公眾對(duì)疫苗接種話題立場(chǎng)的變化趨勢(shì)。Zhang等[47]研究了大規(guī)模金融輿情中公眾的情緒狀態(tài)是否與時(shí)間、股票交易數(shù)相關(guān),基于網(wǎng)絡(luò)輿情空間信息生成多維時(shí)間序列,采用格蘭杰因果分析和信息論的方法研究社交媒體情感對(duì)金融輿情演變過程的影響。
目前網(wǎng)絡(luò)輿情情感演化研究大多從時(shí)空關(guān)聯(lián)、輿情主題和傳播特征等方向出發(fā),從文本中提取信息進(jìn)行情感演化分析,往往忽略了社交網(wǎng)絡(luò)中用戶親密度、用戶影響力等多種因素對(duì)輿情演化的影響,而這些用戶特征可能包含著提高模型解釋性和準(zhǔn)確性的提示。輿情演化過程作為網(wǎng)絡(luò)輿情的核心研究?jī)?nèi)容已經(jīng)得到國(guó)內(nèi)外學(xué)者們的全方位關(guān)注,未來可以從深層次、多維度等方向?qū)W(wǎng)絡(luò)輿情演化進(jìn)行分析。
目前網(wǎng)絡(luò)輿情情感預(yù)測(cè)的研究普遍基于統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和情感分析等方法,通過對(duì)已有情感信息分析來預(yù)測(cè)未來短期內(nèi)的網(wǎng)民情感狀態(tài),但是網(wǎng)絡(luò)輿情演化過程中網(wǎng)民情感會(huì)受到內(nèi)外因素作用的影響而產(chǎn)生偏差。我們分別從研究數(shù)據(jù)、研究方法和研究結(jié)果三個(gè)側(cè)面對(duì)國(guó)內(nèi)外相關(guān)文獻(xiàn)進(jìn)行了梳理(見表4)。在情感態(tài)勢(shì)預(yù)測(cè)方面,李彤[48]以創(chuàng)新的集成學(xué)習(xí)思路為指導(dǎo),構(gòu)建了微博情感走勢(shì)時(shí)間序列提取情感序列特征,然后結(jié)合ARIMA、BPNN等回歸模型和SVM模型對(duì)微博情感趨勢(shì)進(jìn)行預(yù)測(cè),雖然在特征選擇上仍采用了傳統(tǒng)的方法,但比單一使用ARIMA模型的預(yù)測(cè)誤差更小。吳青林等[49]通過設(shè)置特征詞相似度閾值、增加相關(guān)特征詞數(shù)量,克服了短文本相似度的漂移問題,基于微博話題聚類、情感強(qiáng)度計(jì)算和灰度模型跟蹤并預(yù)測(cè)了公眾所關(guān)注熱點(diǎn)話題的情感變化趨勢(shì),實(shí)驗(yàn)表明只有個(gè)體情感穩(wěn)定的情況下情感預(yù)測(cè)結(jié)果才比較準(zhǔn)確。Zhang等[50]將文本情感分為20種細(xì)粒度情感類,結(jié)合文檔頻率和信息增益原則提取文本特征,基于最大熵模型(MaxEnt)對(duì)微博評(píng)論進(jìn)行情緒成分分析和網(wǎng)絡(luò)輿情趨勢(shì)預(yù)測(cè),該方法收斂時(shí)間短,在預(yù)測(cè)民意的準(zhǔn)確性方面優(yōu)于樸素貝葉斯和支持向量機(jī)基線方法。以上研究雖然取得較高的預(yù)測(cè)準(zhǔn)確性,但是并沒有考慮到除輿情文本以外其他因素對(duì)預(yù)測(cè)效果的影響。在此基礎(chǔ)上,郭韌[51]運(yùn)用關(guān)聯(lián)函數(shù)和可拓聚類理論將輿情事件的情感傾向、輿情演化上升期日均提及量和關(guān)注度單位時(shí)間內(nèi)的增長(zhǎng)率三種因素封裝為一個(gè)整體進(jìn)行輿情演化預(yù)測(cè),實(shí)現(xiàn)了定量分析和定性分析的有機(jī)結(jié)合。
在情感傾向預(yù)測(cè)方面,鑒于已有方法大多側(cè)重于從文本本身挖掘信息而很少研究用戶自身特征,Li等[52]提出了一個(gè)“時(shí)間序列+用戶”的雙重關(guān)注機(jī)制模型,將文本情感特征與時(shí)間序列特征相結(jié)合,實(shí)現(xiàn)了單位時(shí)間內(nèi)多用戶多文檔的情感預(yù)測(cè),所提出的雙重關(guān)注機(jī)制模型可以更好地關(guān)注強(qiáng)關(guān)聯(lián)信息,弱化噪聲數(shù)據(jù)的影響,對(duì)提高預(yù)測(cè)結(jié)果起到一定的作用;X.Dong等[53]利用阻尼振蕩模型測(cè)量公眾情感的自我衰變過程,討論模型中彈簧系數(shù)、阻尼系數(shù)和情感臨界值等關(guān)鍵參數(shù)對(duì)輿情動(dòng)態(tài)的影響,使用粒子群優(yōu)化算法調(diào)整模型,并引入自我情感適應(yīng)機(jī)制對(duì)意見領(lǐng)袖和極端情緒化個(gè)體的情感傾向進(jìn)行實(shí)時(shí)預(yù)測(cè);Gupta和Halder[54]提出了一種混合情緒和行為的預(yù)測(cè)系統(tǒng),通過分析文本極性的不同標(biāo)志確定作者的態(tài)度,使用SenticNet4.0詞典和人工配置的文件詞典評(píng)估輸入文本并預(yù)測(cè)文本所傳達(dá)的情感,以此識(shí)別作者的行為和情感模式。在大數(shù)據(jù)背景下,Akhta等[55]提出了一種通過使用多層感知器網(wǎng)絡(luò)組合數(shù)種深度學(xué)習(xí)和經(jīng)典特征模型來預(yù)測(cè)情感傾向和情感強(qiáng)度的堆疊集成方法,具有較好的性能。Thota[56]結(jié)合深度學(xué)習(xí)和主題嵌入技術(shù)開發(fā)了一個(gè)主題情感檢測(cè)框架,實(shí)驗(yàn)結(jié)果表明該框架具有高準(zhǔn)確性。唐曉波構(gòu)造了一個(gè)情感強(qiáng)度時(shí)間序列分析方程來預(yù)測(cè)公眾情感傾向,但未考慮到文本相似度漂移、情感強(qiáng)度模糊性等問題,王秀芳等[57]針對(duì)這些不足對(duì)話題聚類和情感強(qiáng)度量化方法進(jìn)行改進(jìn)并建立了隨時(shí)間變化的公眾情感傾向趨勢(shì)分析模型,其預(yù)測(cè)精確度達(dá)到88.97%。
表4 ?基于情感的網(wǎng)絡(luò)輿情預(yù)測(cè)研究文獻(xiàn)歸納Table 4 Literature Summary of Emotion-based Network Public Opinion Prediction
情感預(yù)測(cè)研究可以有效地對(duì)網(wǎng)絡(luò)輿情情感的未來趨勢(shì)進(jìn)行分析,以便預(yù)先提出針對(duì)性的輿情應(yīng)對(duì)措施。上述研究大多基于文本單一模態(tài),結(jié)合時(shí)間序列特征和情感特征對(duì)輿情情感態(tài)勢(shì)和用戶情感傾向進(jìn)行預(yù)測(cè),但是單模態(tài)數(shù)據(jù)容易存在信息不全面、噪聲干擾等問題,使得情感預(yù)測(cè)系統(tǒng)的魯棒性和精確性等不能得到保證。因此未來可以結(jié)合圖像、視頻和語音等多種模態(tài)數(shù)據(jù)中的情感特征,合理利用多模態(tài)信息互為補(bǔ)充、互為印證的關(guān)系提高情感預(yù)測(cè)模型的性能。
網(wǎng)絡(luò)輿情治理的研究主要針對(duì)政府、企業(yè)和網(wǎng)絡(luò)媒體等不同主體展開(如表5所示)。基于政府方面的研究,研究人員利用實(shí)證研究、數(shù)據(jù)仿真等方法分析了不同階段的輿情載體情感狀況,并從信息透明、輿情預(yù)警、態(tài)度引導(dǎo)、時(shí)度效等方面提出建議[4,58-59],這些研究有助于強(qiáng)化政府部門對(duì)網(wǎng)絡(luò)輿情監(jiān)控、引導(dǎo)和治理?;谄髽I(yè)方面的研究,所提出的輿情治理措施有:提高企業(yè)輿情響應(yīng)速度,加強(qiáng)核心競(jìng)爭(zhēng)領(lǐng)域監(jiān)管,及時(shí)回應(yīng)民意等[60-61]。基于網(wǎng)絡(luò)媒體方面的研究,由于其具有快捷性、開放性和互動(dòng)性等特點(diǎn),相關(guān)研究提出營(yíng)造良好網(wǎng)絡(luò)氛圍,明確溝通態(tài)度,強(qiáng)調(diào)價(jià)值引導(dǎo)等建議[62-64]。此外也有學(xué)者針對(duì)多元主體協(xié)同治理提出應(yīng)對(duì)策略[65]。
提高輿情治理能力是網(wǎng)絡(luò)時(shí)代的必然要求,特別是重大突發(fā)事件發(fā)生期間輿論密度會(huì)加劇,政府、企業(yè)和網(wǎng)絡(luò)自媒體等應(yīng)改進(jìn)網(wǎng)絡(luò)輿情的治理方式,現(xiàn)有單一的治理體系并不能有效地引導(dǎo)輿情,政府應(yīng)加強(qiáng)網(wǎng)絡(luò)環(huán)境建設(shè),與企業(yè)和網(wǎng)絡(luò)媒體等主體形成協(xié)同治理格局。
網(wǎng)絡(luò)輿情不僅具有突發(fā)性,而且蘊(yùn)含著強(qiáng)烈的群體情感極性。隨著微博、Twitter等社交平臺(tái)的興起,研究人員不僅研究話題中輿情特征的分布情況,并且開始結(jié)合用戶情感進(jìn)行網(wǎng)絡(luò)輿情事件識(shí)別。例如,張魯民等[66]基于FP-growth算法和互信息度量構(gòu)建情感符號(hào)模型,利用改進(jìn)Kleiberg算法檢測(cè)情感符號(hào)序列中的突發(fā)期,采用近鄰傳播AP聚類檢測(cè)突發(fā)事件,大大縮短了輿情事件的檢測(cè)時(shí)間,平均準(zhǔn)確率達(dá)到85%;蘭月薪[67]基于生命周期理論將輿情演化過程劃分為潛伏期、擴(kuò)散期和消退期,并根據(jù)特征突發(fā)詞在不同時(shí)期內(nèi)的情感變化規(guī)律來檢測(cè)突發(fā)事件;尉永清等[68]結(jié)合具有時(shí)序突發(fā)性的網(wǎng)絡(luò)數(shù)據(jù)流事件特征和用戶信息情感特征提出一種融合情感特征的突發(fā)事件識(shí)別方法,能夠在相對(duì)較早的時(shí)間內(nèi)識(shí)別在線突發(fā)事件;由于微博通常使用“#”標(biāo)簽來描述事件,Zou等[69]采用情感和標(biāo)簽結(jié)合的模式,基于普魯奇克情感輪[70]和標(biāo)簽傳播算法構(gòu)建離線情感共現(xiàn)圖,通過在線使用互信息和頻繁樹來提取突發(fā)事件關(guān)鍵字,該方法可以在分析微博情感的同時(shí)在線檢測(cè)突發(fā)事件,但也受限于標(biāo)簽的存在性。
在對(duì)突發(fā)事件識(shí)別的研究中只考慮網(wǎng)民的情感變化特征還不夠全面,張雄寶等[71]發(fā)現(xiàn)突發(fā)事件相關(guān)微博的發(fā)布地域隨事件演變呈現(xiàn)出一定的變化規(guī)律,因此提出一種基于突發(fā)詞地域分析的突發(fā)事件檢測(cè)方法,從評(píng)論文本的地域范圍、情感屬性兩個(gè)維度識(shí)別突發(fā)事件,該方法相較于基于爆發(fā)詞識(shí)別的突發(fā)事件檢測(cè)方法(Bursty Words Distinguishing,BWD)和基于突發(fā)詞H指數(shù)的突發(fā)事件檢測(cè)算法(HIndex,HI)在正確率、召回率和F1均值上都有顯著提高;仲兆滿等[72]也考慮到突發(fā)事件的地域特性和微博評(píng)論的時(shí)空特點(diǎn),提出一種地域Top-k突發(fā)事件檢測(cè)框架,利用詞出現(xiàn)頻率、詞關(guān)聯(lián)用戶、詞分布地域以及詞社交行為四種指標(biāo)計(jì)算網(wǎng)絡(luò)詞突發(fā)值并提取突發(fā)特征集,選用凝聚層次聚類方法獲取突發(fā)詞簇集合,最后融合突發(fā)詞地域、頻率、關(guān)聯(lián)評(píng)論、評(píng)論影響力以及關(guān)聯(lián)用戶五種指標(biāo)計(jì)算Top-k突發(fā)事件熱度,實(shí)現(xiàn)基于網(wǎng)絡(luò)地域的突發(fā)事件識(shí)別。
表5 ?國(guó)內(nèi)網(wǎng)絡(luò)輿情治理的策略研究Table 5 Domestic Network Public Opinion Management Strategy Research
網(wǎng)絡(luò)輿情在社交媒體上的傳播具有較強(qiáng)的地理位置性、傳播爆炸性、時(shí)空相關(guān)性等特點(diǎn)[73],傳統(tǒng)的網(wǎng)絡(luò)輿情識(shí)別研究主要依賴于語義信息和復(fù)雜社會(huì)網(wǎng)絡(luò)信息,但網(wǎng)絡(luò)輿情通常是一個(gè)從無到有的傳播過程,往往僅涉及社會(huì)網(wǎng)絡(luò)的局部區(qū)域,通過對(duì)關(guān)鍵結(jié)構(gòu)進(jìn)行監(jiān)控的方法容易存在滯后和遺漏。除了文本形式,網(wǎng)絡(luò)輿情也經(jīng)常以視頻、圖片、聲音等非文本形式存在,基于語義信息的方法無法準(zhǔn)確提煉輿情特征,深度學(xué)習(xí)是近年比較熱門的研究方法,將其與情感分析的研究方法相結(jié)合,可有效提升模型獲取信息、挖掘特征的性能。
近年來,國(guó)內(nèi)外網(wǎng)絡(luò)輿情相關(guān)的研究成果主要分為基礎(chǔ)理論、支持技術(shù)和應(yīng)用研究三個(gè)層次,所分析的領(lǐng)域已經(jīng)從在線產(chǎn)品評(píng)論轉(zhuǎn)向社交媒體文本。除產(chǎn)品評(píng)論之外,情感分析的應(yīng)用已經(jīng)拓展到了股票市場(chǎng)、選舉、災(zāi)難、醫(yī)學(xué)、政治和企業(yè)等領(lǐng)域。本文對(duì)情感視角下的網(wǎng)絡(luò)輿情情感分類、情感演化、情感預(yù)測(cè)和輿情治理四個(gè)方面的相關(guān)文獻(xiàn)進(jìn)行了統(tǒng)計(jì)分析、歸納和對(duì)比,并對(duì)未來研究方向作出如下展望:
(1)多方法融合下的情感分類研究
情感分類是情感分析的重要基礎(chǔ),傳統(tǒng)的方法主要基于情感詞典和機(jī)器學(xué)習(xí)方法,由于語言的多樣性和復(fù)雜性,不同語言在不同領(lǐng)域中的情感表達(dá)可能有所差異,因此構(gòu)建高效的通用情感詞典和情感分析模型是未來的一個(gè)研究方向。此外深度學(xué)習(xí)方法也被逐漸應(yīng)用于情感分類領(lǐng)域,該方法的優(yōu)勢(shì)在于不依賴人工定義特征,可以實(shí)現(xiàn)端到端的自主學(xué)習(xí),但其訓(xùn)練時(shí)間久、解釋性差等缺點(diǎn)也非常明顯。最近兩年出現(xiàn)的圖神經(jīng)網(wǎng)絡(luò)是從卷積神經(jīng)網(wǎng)絡(luò)拓展而來的一種新型神經(jīng)網(wǎng)絡(luò),在反映實(shí)體及其之間的關(guān)聯(lián)性方面展現(xiàn)出了巨大的潛力,圖神經(jīng)網(wǎng)絡(luò)方法的可推理性和高解釋性的特點(diǎn)彌補(bǔ)了傳統(tǒng)深度學(xué)習(xí)方法的局限,可以較好地捕獲單詞之間的依賴關(guān)系,提升方面級(jí)情感分類性能,在今后的研究中將圖神經(jīng)網(wǎng)絡(luò)模型用于情感分析是非常值得探索的方向。
(2)多重信息載體下的輿情情感研究
目前,國(guó)內(nèi)外的網(wǎng)絡(luò)輿情情感研究主要通過對(duì)社交媒體中的文本信息進(jìn)行情感挖掘與分析,隨著互聯(lián)網(wǎng)逐漸向移動(dòng)社交化轉(zhuǎn)變,圖片和視頻等載體因綜合了畫面、色彩、文字等特征成為網(wǎng)民表達(dá)情感的新形式。相較于單模態(tài)信息,多模態(tài)信息情感表達(dá)更加豐富與復(fù)雜,多模態(tài)情感分析也具有更高的準(zhǔn)確性和穩(wěn)定性。目前,多模態(tài)情感分析研究主要包括三種方法:特征級(jí)融合、決策級(jí)融合和混合融合。雖然已經(jīng)有學(xué)者對(duì)圖片和視頻的情感信息進(jìn)行了相關(guān)研究并取得了不錯(cuò)的進(jìn)展,但如何將這種新載體的情感分析應(yīng)用到網(wǎng)絡(luò)輿情領(lǐng)域,以及在對(duì)網(wǎng)絡(luò)輿情情感分析時(shí)如何根據(jù)模態(tài)的不同選擇適當(dāng)?shù)哪B(tài)融合方法,將是未來學(xué)者們需要研究的問題。
(3)多角度集成視域下的輿情預(yù)測(cè)研究
網(wǎng)絡(luò)輿情的預(yù)測(cè)方法普遍基于統(tǒng)計(jì)學(xué)、社會(huì)學(xué)、信息傳播學(xué)和人工智能等學(xué)科,通過分析網(wǎng)絡(luò)輿情在不同階段下的差異時(shí)序特征以及量化傳播過程中用戶的情感極性實(shí)現(xiàn)網(wǎng)絡(luò)輿情的演變趨勢(shì)預(yù)測(cè),該過程是一種時(shí)空序列預(yù)測(cè)[74],即根據(jù)已獲取的歷史數(shù)據(jù)來預(yù)測(cè)未來某個(gè)時(shí)刻的時(shí)空變量值。目前除了從情感角度對(duì)網(wǎng)絡(luò)輿情波動(dòng)情況進(jìn)行研究,還應(yīng)充分考慮輿情數(shù)據(jù)中存在的隱藏信息、關(guān)聯(lián)關(guān)系以及網(wǎng)民的認(rèn)知能力等因素,隨著深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展,如何利用深度學(xué)習(xí)挖掘輿情數(shù)據(jù)中的隱含特征、提高輿情預(yù)測(cè)的精確度、解決“數(shù)據(jù)過剩,信息匱乏”的困境是未來需要努力的方向。
(4)多元主體協(xié)同下的輿情治理研究
網(wǎng)絡(luò)輿情治理是政府職能的重要組成部分,對(duì)網(wǎng)絡(luò)輿情及時(shí)準(zhǔn)確的治理可以有效降低其產(chǎn)生社會(huì)風(fēng)險(xiǎn)的可能性。有學(xué)者針對(duì)傳統(tǒng)治理模式下的政府信息公開不透明、政府“一元主體”等問題提出了相應(yīng)的改進(jìn)建議,但由于網(wǎng)絡(luò)輿情的影響因素具有多樣性特征,未來我們還要根據(jù)多主體、多平臺(tái)、多形式的特點(diǎn)實(shí)施有針對(duì)性的策略,綜合運(yùn)用政府輿情治理能力和線下各主體的協(xié)同治理能力,有效應(yīng)對(duì)網(wǎng)絡(luò)輿情治理過程中出現(xiàn)的次生風(fēng)險(xiǎn),構(gòu)建政府主導(dǎo)下的多主體協(xié)同的網(wǎng)絡(luò)輿情治理模式、治理環(huán)境和治理機(jī)制。
作者貢獻(xiàn)說明
史偉:提出整體研究思路和框架;
薛廣聰:論文起草及修改;
何紹義:論文最終版本修訂。
支撐數(shù)據(jù)
支撐數(shù)據(jù)由作者自存儲(chǔ),Email:xgc735570365@163.com。
1、史偉,薛廣聰.Research data of network public opinion and emotion.txt.網(wǎng)絡(luò)輿情情感研究數(shù)據(jù).