李淑平
(中央民族大學 少數(shù)民族語言文學系,北京 100081)
面向網(wǎng)絡輿情監(jiān)測的新聞主題分類實證分析
李淑平
(中央民族大學 少數(shù)民族語言文學系,北京 100081)
本文采用由面到點、逐步聚焦的方法探討了面向網(wǎng)絡輿情監(jiān)測的新聞主題分類、網(wǎng)民的關注焦點和網(wǎng)民對事件的情感傾向問題,對這些問題的研究對網(wǎng)絡輿情管理將產(chǎn)生積極作用。
網(wǎng)絡輿情;主題分類;關注焦點;情感傾向
隨著信息化時代的到來,網(wǎng)絡上出現(xiàn)了海量的信息,各種重大新聞、熱點事件等在網(wǎng)絡上迅速傳播,而由新聞事件所引發(fā)的網(wǎng)絡輿情也隨之大量涌現(xiàn),網(wǎng)絡輿情已經(jīng)成為國家了解社會輿情的重要渠道。網(wǎng)絡輿情多數(shù)情況下是在某一新聞事件的觸發(fā)下產(chǎn)生的,對網(wǎng)絡輿情進行分析研判,首先需要對引發(fā)輿情的新聞事件構建科學的分類體系。
目前,關于網(wǎng)絡輿情主題分類的研究成果并不多,按分類的領域可將其分為兩類。一是面向通用領域的網(wǎng)絡輿情主題分類。這類成果是面向整體網(wǎng)絡輿情的主題分類,如丁兆云[1]在其文中將輿情主題分為了三級指標,其中,一級指標有五類,分別是公共安全、自然災害、公共衛(wèi)生、重大事故、重大活動。在一級指標下又進一步細分為二級、三級指標,如公共安全又分為社會安全和經(jīng)濟安全兩類;在社會安全下又細分為恐怖襲擊、軍事斗爭、民族宗教事件三類。再如,楊永軍[2]在其文中將輿情主題分為國際和國內(nèi)兩大類。國際又分為政經(jīng)、文化、軍事、反恐、公共、自然和其他領域幾個方面;國內(nèi)又分為公權力、政治與社會問題、公共領域、私權利幾個方面,且每個類別下又有更具體的分類。還有,李雯靜等[3]在其文中提到了兩個參考體系,分別是美國“聯(lián)邦政府組織架構”中的業(yè)務參考模型BRM(Business Reference Model)和我國TRS政府信息公開目錄服務平臺中參考分類體系中的主題分類。此外,戴媛等[4]在文中將輿情信息分為了14大類,分別是社會經(jīng)濟、政府管理、自然災害、公共衛(wèi)生、重大事故災害、社會公共安全、教育、醫(yī)療、三農(nóng)、交通、和諧社會、重大活動、勞動就業(yè)、社會保障類,并下設有更詳細的二級類目。二是面向特定領域的網(wǎng)絡輿情主題分類。有些學者根據(jù)某一領域網(wǎng)絡輿情研究的需要,針對特定領域對網(wǎng)絡輿情進行主題分類。如鄧尚民等[5]在其文中將高校網(wǎng)絡輿情分為7類,分別是時事政治、社會民生、高校內(nèi)部管理、高校安全、大學生權益、高校聲譽和學生心理健康。再如,陸瑞[6]在其文中將水利工程領域分為工程論證與規(guī)劃、工程建設與管理、工程效益、工程評價、工程文化五個方面。此外,談國新等[7]在其文中將突發(fā)公共事件輿情信息分為生存危機、公共安全、分配差距、腐敗現(xiàn)象、時政、法治6大類。
目前關于網(wǎng)絡輿情主題分類的研究主要存在以下兩個問題:一是參考標準少。研究成果大多數(shù)是根據(jù)作者的主觀經(jīng)驗對網(wǎng)絡輿情進行主題分類,而較少參考相應的國家標準等,各家自成一言、差別較大,帶來了主題分類的主觀性。二是缺少實證方法。在構建網(wǎng)絡輿情主題分類體系的過程中,缺少依據(jù)客觀語料和客觀數(shù)據(jù)的實證方法,影響了網(wǎng)絡輿情主題分類的實用性和針對性。
(一)主題分類的原則
針對目前網(wǎng)絡輿情主題分類研究中的不足,本文認為面向網(wǎng)絡輿情監(jiān)測的新聞主題分類需要遵循以下原則:
1.科學性和權威性。面向網(wǎng)絡輿情監(jiān)測的新聞主題分類體系是對新聞事件科學分類的依據(jù),因此,分類體系必須具有科學性和權威性。
2.針對性和實用性。面向網(wǎng)絡輿情監(jiān)測的新聞主題分類是為網(wǎng)絡輿情監(jiān)測服務的,因此,構建的分類體系不需要過于全面和翔實,關鍵是要能夠反映網(wǎng)絡輿情監(jiān)測的重點領域和網(wǎng)民關注的焦點問題,主題分類體系要具有針對性和實用性。
(二)主題分類的方法
依據(jù)以上提出的分類原則,本文參考了我國的政務信息資源目錄體系[8]和中文新聞信息分類的國家標準,[9]將這兩個分類體系進行綜合比較發(fā)現(xiàn),這兩個分類體系大的類目基本一致,但中文新聞信息分類的類目更為全面。因此,本文的一級類目主要參考了中文新聞信息分類的一級類目,共24類,分別是政治、法律、司法、對外關系、國際關系、軍事、社會、勞動、災難、事故、經(jīng)濟、財政、金融、基本建設、建筑業(yè)、房地產(chǎn)、農(nóng)業(yè)、農(nóng)村、礦業(yè)、工業(yè)、能源、水務、水利、電子信息產(chǎn)業(yè)、通運輸、郵政、物流、商業(yè)、外貿(mào)、海關、服務業(yè)、旅游業(yè)、環(huán)境、氣象、教育、科學技術、文化、休閑娛樂、文學、藝術、傳媒、醫(yī)藥、衛(wèi)生、體育。但由于中文新聞信息分類的二級、三級類目,過于全面和詳細,且針對性不強,因此,其并不適合面向網(wǎng)絡輿情監(jiān)測的新聞主題分類。新聞主題分類在進一步構建下級類目的過程中,需要遵循針對性和實用性的原則,體現(xiàn)網(wǎng)民重點關注的領域和焦點問題,通過由面到點、逐步聚焦的方法構建分類體系。
由以上分析可知,要進一步構建主題分類的下級類目,首先需要挖掘網(wǎng)民重點關注的領域和焦點問題。本文采用實證的方法以實際的語料和客觀數(shù)據(jù)對這一問題進行了深入分析。
(一)語料來源
本文所用語料為從數(shù)據(jù)堂網(wǎng)站下載的49000篇新聞語料,其中每一篇語料都有網(wǎng)民對該事件的情感反應投票數(shù)據(jù),包括投票總數(shù)和8類情緒的投票比例。如新聞事件“如此惡警!省道時速破百撞死夜大生”,網(wǎng)民投票數(shù)為15956。其中,網(wǎng)民認為實用的投票數(shù)為1%;感人的投票數(shù)為0%;開心的投票數(shù)為1%;超扯的投票數(shù)為5%;無聊的投票數(shù)為0%;害怕的投票數(shù)為0%;難過的投票數(shù)為5%;火大的投票數(shù)為88%。
(二)語料處理
本文首先使用python語言編寫程序,將49000篇新聞語料的新聞標題、投票數(shù)和8類情緒的投票比例數(shù)據(jù)從文本中抽取出來,然后將抽取的信息、數(shù)據(jù)在excel表格中根據(jù)投票數(shù)由高到低的順序進行排序,并將排名前50位的新聞,根據(jù)中文新聞信息分類的一級類目進行了類別標注。
(三)新聞語料類別的統(tǒng)計分析
通過對語料類別的統(tǒng)計分析,我們發(fā)現(xiàn)新聞事件的類別主要集中在政治,法律、司法,社會、勞動和災難事故四個類目中。政治類新聞有10個,法律、司法類新聞有11個,社會、勞動類新聞有12個,災難事故類新聞有7個。按類別數(shù)由多到少的順序是社會、勞動〉法律、司法〉政治〉災難事故。因此,從網(wǎng)絡輿情監(jiān)測的角度來說,這些領域應該是重點關注的領域。
(四)網(wǎng)民關注焦點分析
為了進一步聚焦網(wǎng)民的關注點,我們通過對新聞內(nèi)容的分析,對以上新聞事件數(shù)量最多的四個領域進行了更深入的分析。
1.政治領域。在政治領域,網(wǎng)民關注的焦點有: (1)關于政府、領導人等的負面新聞,如政府無能、官員腐敗等問題。(2)關于政府、領導人等的正面新聞,如領導人廉潔自律,政績卓著等事跡。(3)和民眾切身利益相關的問題,如社會保障、社會分配不公等問題。
2.法律、司法領域。在法律、司法領域網(wǎng)民關注的焦點有:(1)違背倫理道德的犯罪問題。(2)貪污、腐敗類犯罪問題。(3)犯罪手段特別殘忍的問題,如傷害未成年人的犯罪等。(4)存在爭議的問題,如是否廢除死刑的問題等。
3.社會、勞動領域。在社會、勞動領域網(wǎng)民關注的焦點有:(1)正面社會行為,如保護弱勢群體、救助行為、勵志事跡等。(2)反面社會行為,如以貌取人、不孝、婚外情等社會不良行為。(3)勞動者權益問題,如損害員工利益等行為。(4)離奇事件,生活中一些不合常理的事件往往可以滿足民眾的獵奇心理,因此也常常引起民眾的極大關注,如“雞報恩”等離奇事件。
4.災難事故類。在災難事故類中網(wǎng)民關注的焦點有:
(1)災難事故中的正面行為,如“市長車禍現(xiàn)場搬車救人”“白衣天使車禍現(xiàn)場救人”等。(2)災難事故中的反面行為,如“警察超速撞死夜大生”“撞女童還踹人”等。(3)世界末日危機,這類特殊的災難因關系著全人類的安危,容易引起民眾的極大恐慌而成為關注的焦點。如“世界末日將于本世紀降臨,人類將遭毀滅”等新聞。(4)災難后果嚴重的事件。災難后果嚴重的事件容易引起民眾的憐憫、同情與恐慌,因此,災難事故的后果越嚴重,網(wǎng)民的關注度往往就會越高。
(五)新聞事件性質和網(wǎng)民情感傾向分析
為了進一步分析網(wǎng)民的行為和情感傾向特征,本文對新聞事件的性質進行了統(tǒng)計分析,發(fā)現(xiàn)負面的事件有26個,正面的事件有11個,中性的事件有13個,網(wǎng)民關注的負面事件數(shù)量最多,占了52%的比例,這說明負面事件更容易引起網(wǎng)民的關注。因此,在網(wǎng)絡輿情監(jiān)測中相關人員應更加重視各領域的負面事件。而通過對網(wǎng)民情感投票的分析,我們發(fā)現(xiàn),對于正面的新聞事件,網(wǎng)民的投票大多數(shù)是“感動”或“開心”;對于負面的新聞事件,網(wǎng)民的投票大多數(shù)是“火大”;而對于比較離奇的事件,網(wǎng)民的投票大多數(shù)是“超扯”,其情感傾向和事件的性質呈正相關關系,一般情況下網(wǎng)民支持、欽佩正義的行為而痛恨、鄙視違法犯罪或社會不良行為;而對于離奇的事件,大多數(shù)網(wǎng)民也抱著理性的態(tài)度,沒有表現(xiàn)出明顯的情感傾向;從感情強度和危害程度上來說,負面事件和負面情緒應是網(wǎng)絡輿情監(jiān)測的重點。
本文通過對49000篇標注新聞語料的處理分析,通過由面到點、逐步聚焦的方法總結了網(wǎng)民關注的四大領域。并且,本文分析了各領域內(nèi)網(wǎng)民關注的焦點問題和網(wǎng)民的情感傾向問題,初步總結出一些規(guī)律性的特點和認識,對于構建面向網(wǎng)絡輿情監(jiān)測的主題分類,把握網(wǎng)絡輿情中的重點、關鍵點,及時了解輿情動向都會產(chǎn)生積極的作用。但本文分析的數(shù)據(jù)規(guī)模較小,研究結論還需進一步完善和驗證,筆者今后將在更大規(guī)模數(shù)據(jù)的基礎上總結更一般、全面的結論。
[1] 丁兆云.互聯(lián)網(wǎng)多維層次式輿情指數(shù)若干計算方法的研究與實現(xiàn)[D].國防科學技術大學,2008.
[2] 楊永軍.社會輿情監(jiān)測與預警的指標體系研究[J].現(xiàn)代傳播(中國傳媒大學學報),2014(09):63-71.
[3] 李雯靜,許鑫,陳正權.網(wǎng)絡輿情指標體系設計與分析[J].情報科學,2009(07):986-991.
[4] 戴媛,郝曉偉,郭巖,余智華.我國網(wǎng)絡輿情安全評估指標體系的構建研究[J].信息網(wǎng)絡安全,2010(04):12-15.
[5] 鄧尚民,董亞倩.基于AHP的高校網(wǎng)絡輿情安全評估指標體系構建研究[J].情報雜志,2012(08):31-36.
[6] 陸瑞.水利工程輿情分析模型及指標體系設計[D].華中科技大學,2011.
[7] 談國新,方一.突發(fā)公共事件網(wǎng)絡輿情監(jiān)測指標體系研究[J].華中師范大學學報(人文社會科學版),2010(03):66-70.
[8] GB/T 21063.4-2007,政務信息資源目錄體系(第4部分,政務信息資源分類)[S].北京:中國標準出版社,2008:7-27.
[9] GB/T 20093-2013,中文新聞信息分類與代碼[S].北京:中國標準出版社,2014:7.
G206
A
1674-8883(2016)23-0026-02
本論文為中央民族大學一流大學一流學科經(jīng)費資助
李淑平(1980—),中央民族大學博士在讀,研究方向:計算語言學。