孫麗杰+李春華
摘 要:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展及其廣泛的應(yīng)用,網(wǎng)絡(luò)輿論信息的產(chǎn)生體量、傳播速度和影響范圍等方面都發(fā)生了巨大變化。這些變化要求輿情管理工作者在輿情管理理念、管理方法等方面必須與時(shí)俱進(jìn)。大數(shù)據(jù)既是一種新技術(shù),也是一種新方法,它側(cè)重于信息挖掘和預(yù)測(cè)。將大數(shù)據(jù)運(yùn)用到網(wǎng)絡(luò)輿情管理工作之中,必將對(duì)輿情管理產(chǎn)生重要作用。在大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)輿情的管理方法也必將發(fā)生變革與創(chuàng)新。探討大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)輿情分析方法,以大數(shù)據(jù)為背景和前提創(chuàng)新網(wǎng)絡(luò)輿情管理方法,總結(jié)大數(shù)據(jù)下輿情管理理念、視角、方式和方法等方面的變革與創(chuàng)新的思路,具有重要意義。
關(guān)鍵詞:網(wǎng)絡(luò)輿情;大數(shù)據(jù);管理方法;變革與創(chuàng)新
DOI:10.15938/j.cnki.iper.2017.01.025
中圖分類(lèi)號(hào): G641文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-9749(2017)01-0124-06
據(jù)《第37次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(由中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(簡(jiǎn)稱(chēng):CNNIC)在2016年1月發(fā)布)顯示,截至2015年12月,中國(guó)網(wǎng)民規(guī)模達(dá)6.88億,全年新增網(wǎng)民3951萬(wàn)人?;ヂ?lián)網(wǎng)普及率為50.3%,中國(guó)手機(jī)網(wǎng)民規(guī)模達(dá)6.20億,手機(jī)上網(wǎng)使用率為90.1%[1]。隨著移動(dòng)互聯(lián)網(wǎng)(Mobile Internet)、社交網(wǎng)絡(luò)(Social Networking)、電子商務(wù)(Electronic Commerce)等的迅速發(fā)展,互聯(lián)網(wǎng)的邊界和應(yīng)用范圍有了極大擴(kuò)展,各種信息和數(shù)據(jù)極具增多,并正在迅速膨脹變大。
網(wǎng)民們經(jīng)常通過(guò)互聯(lián)網(wǎng)表達(dá)意愿、觀點(diǎn),討論各種話(huà)題,以表達(dá)自己的思想觀點(diǎn)和訴求?;ヂ?lián)網(wǎng)既是一個(gè)收納器,聚集網(wǎng)民思想動(dòng)態(tài)表達(dá)、文化和社會(huì)生活信息;又是一個(gè)擴(kuò)音器,傳播大眾的社會(huì)輿論。在社交媒體時(shí)代,人們通過(guò)互聯(lián)網(wǎng)平臺(tái)表達(dá)社情民意,體現(xiàn)自己的意愿、態(tài)度和評(píng)論觀點(diǎn)。輿情作為社會(huì)輿論的一個(gè)風(fēng)向標(biāo),開(kāi)展輿情分析主要是針對(duì)民眾態(tài)度、觀點(diǎn)的收集整理,分析出民眾相關(guān)的意見(jiàn)傾向,客觀體現(xiàn)輿情動(dòng)態(tài)。
作為世界上網(wǎng)民數(shù)量最多、互聯(lián)網(wǎng)訪(fǎng)問(wèn)量最大的國(guó)家,有效地分析網(wǎng)絡(luò)輿情,對(duì)于政府,媒體、大型企事業(yè)單位都有著非常重要的意義。從政府的角度,有效的輿情管理有利于政府了解公眾態(tài)度和訴求,有助于提升政府的政務(wù)管理和構(gòu)建良好的社會(huì)和網(wǎng)絡(luò)環(huán)境;從企業(yè)的角度,有效的輿情管理有利于企業(yè)掌握用戶(hù)和大眾對(duì)產(chǎn)品質(zhì)量、產(chǎn)品功能與服務(wù)的評(píng)價(jià)及客戶(hù)特征信息,更好地提供個(gè)性化產(chǎn)品與服務(wù),實(shí)現(xiàn)利潤(rùn)增長(zhǎng),更有利于企業(yè)了解用戶(hù)和大眾對(duì)企業(yè)社會(huì)形象的反饋和認(rèn)知,提升企業(yè)品牌知名度和社會(huì)聲譽(yù);從媒體的角度,有效的輿情管理能夠突破傳統(tǒng)信息搜集和發(fā)布渠道,更能夠通過(guò)對(duì)公眾輿論深入分析,提升新聞效果,實(shí)現(xiàn)新聞價(jià)值增值。因此,社會(huì)各界都非常重視網(wǎng)絡(luò)輿情分析,并不斷創(chuàng)新輿情的分析和管理的方式和方法,都是想最大化輿情的價(jià)值。
一、大數(shù)據(jù)及網(wǎng)絡(luò)輿情的相關(guān)定義及特點(diǎn)
1.大數(shù)據(jù)的定義及特點(diǎn)
隨著人們對(duì)大數(shù)據(jù)的研究和理解的不斷深入,大數(shù)據(jù)已不僅僅是一個(gè)技術(shù)方面的名詞了。而今,大數(shù)據(jù)相關(guān)的理論無(wú)論從內(nèi)涵還是外延上,都在不斷豐富和充實(shí)。關(guān)于大數(shù)據(jù)的定義,不同的機(jī)構(gòu)和學(xué)者從不同的角度給出略有差異的定義:如高德納咨詢(xún)公司(2013)提出,大數(shù)據(jù)是指具有更強(qiáng)的洞察力和流程優(yōu)化能力的海量、多樣化的信息[2]。維基百科對(duì)大數(shù)據(jù)的定義是“一個(gè)超大的、難以用現(xiàn)有常規(guī)的數(shù)據(jù)庫(kù)管理技術(shù)和工具處理的數(shù)據(jù)集”。Gartner對(duì)大數(shù)據(jù)的定義:“大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量高增長(zhǎng)率和多樣化的信息資產(chǎn)” [3]。
IDC市場(chǎng)研究公司2012年提出,“大數(shù)據(jù)”是為了從大容量的、不同類(lèi)型的數(shù)據(jù)中獲取有價(jià)值的信息而設(shè)計(jì)的新型架構(gòu)和技術(shù)[2],并對(duì)大數(shù)據(jù)的采用三步法進(jìn)行了界定,如圖1所示。首先,從數(shù)據(jù)源場(chǎng)景方面,可以有三種情況,或者說(shuō)需要具備三種情況至少滿(mǎn)足一種,即大數(shù)據(jù)的容量大于等于100TB或數(shù)據(jù)源于超高速的數(shù)據(jù)流(Data Streaming),或數(shù)據(jù)產(chǎn)生的年增速大于60%;其次,必須部署在可動(dòng)態(tài)適應(yīng)的基礎(chǔ)設(shè)施(dynamically adaptable infrastructure)上。這里的基礎(chǔ)設(shè)施既可以是傳統(tǒng)的scale-up架構(gòu),也可以是水平擴(kuò)展架構(gòu)(scale-out infrastructure);最后,必須有兩個(gè)以上的數(shù)據(jù)源或數(shù)據(jù)格式,或者高速流數(shù)據(jù)源(如點(diǎn)擊流或機(jī)器產(chǎn)生的數(shù)據(jù)流)。有了以上三個(gè)步驟的界定,才可以形成大數(shù)據(jù)。IDC指出“大數(shù)據(jù)技術(shù)描述了一種新一代技術(shù)和架構(gòu),以非常經(jīng)濟(jì)的方式,以高速的捕獲、發(fā)現(xiàn)和分析技術(shù),從各種超大規(guī)模的數(shù)據(jù)中提取價(jià)值” [2]。
盡管對(duì)大數(shù)據(jù)的定義角度各有不同,但大數(shù)據(jù)的核心本質(zhì)和特征的表述和定義相對(duì)比較統(tǒng)一,均認(rèn)為大數(shù)據(jù)與傳統(tǒng)意義數(shù)據(jù)具有本質(zhì)區(qū)別。較傳統(tǒng)數(shù)據(jù)相比,在數(shù)據(jù)基礎(chǔ)上,大數(shù)據(jù)更傾向于全體數(shù)據(jù)而非抽樣;在分析方法上,更強(qiáng)調(diào)相關(guān)分析而非因果分析;在分析效果上,追求的是效率而非絕對(duì)精確和在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)。
在數(shù)據(jù)和信息的規(guī)模/體量方面、在內(nèi)容形式和數(shù)據(jù)結(jié)構(gòu)方面具有復(fù)雜性/變化頻度多樣、在產(chǎn)生速度方面及價(jià)值密度等四個(gè)方面都極大地超越了傳統(tǒng)的數(shù)據(jù)形態(tài),具有4V特征:
第一,數(shù)據(jù)規(guī)模大(Volume)
第二,數(shù)據(jù)種類(lèi)多樣(Variety)
第三,數(shù)據(jù)處理速度快(Velocity)
第四,數(shù)據(jù)價(jià)值密度高(Value)
如圖2所示:大數(shù)據(jù)的4V特征。
具體而言,一是數(shù)據(jù)規(guī)模大( Volume):從容量角度,大數(shù)據(jù)具有數(shù)據(jù)容量大,“容量”或“體量”,從 TB→PB→EB級(jí),每級(jí)都是按照進(jìn)率1024(2的十次方)計(jì)算,這足以說(shuō)明大數(shù)據(jù)規(guī)模之龐大。二是數(shù)據(jù)種類(lèi)多樣(Variety):結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù),Web數(shù)據(jù)、文字、語(yǔ)音音頻數(shù)據(jù)、圖片圖像數(shù)據(jù)、視頻數(shù)據(jù)、模擬信號(hào)等數(shù)據(jù)都體現(xiàn)了數(shù)據(jù)的多樣性。三是速數(shù)據(jù)處理速度快(Velocity):對(duì)數(shù)據(jù)訪(fǎng)問(wèn)、處理、交付等速度的要求快,而且數(shù)據(jù)產(chǎn)生速度也非常之快;四是價(jià)值(Value):大數(shù)據(jù)的核心價(jià)值在于資源優(yōu)化配置,通過(guò)搜集海量數(shù)據(jù),進(jìn)而展開(kāi)全量數(shù)據(jù)挖掘,分析數(shù)據(jù)背后的相關(guān)性,開(kāi)展預(yù)測(cè)分析,獲得數(shù)據(jù)的應(yīng)用價(jià)值。
這些特性使得大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)區(qū)別開(kāi)來(lái),強(qiáng)調(diào)了大數(shù)據(jù)是具有結(jié)構(gòu)松散性、形式復(fù)雜性和有利用價(jià)值的數(shù)據(jù)信息資源[3]。
2.網(wǎng)絡(luò)輿情的定義與特點(diǎn)
“輿情(Public Opinion)”翻譯為“民眾或公眾的意愿、意見(jiàn)或觀點(diǎn)”。根據(jù)百度百科:輿情是“輿論情況”的簡(jiǎn)稱(chēng),是指在一定的社會(huì)空間內(nèi),圍繞中介性社會(huì)事件的發(fā)生、發(fā)展和變化,作為主體的民眾對(duì)作為客體的社會(huì)管理者、企業(yè)、個(gè)人及其他各類(lèi)組織及其政治、社會(huì)、道德等方面的取向產(chǎn)生和持有的社會(huì)態(tài)度。它是較多群眾關(guān)于社會(huì)中各種現(xiàn)象、問(wèn)題所表達(dá)的信念、態(tài)度、意見(jiàn)和情緒等等表現(xiàn)的總和。
有學(xué)者從社會(huì)學(xué)視域考察輿情的定義,認(rèn)為輿情是指社會(huì)各階層民眾對(duì)社會(huì)現(xiàn)象或事件所持有的情緒、態(tài)度、觀點(diǎn)、看法、意見(jiàn)和行為傾向等[4]。網(wǎng)絡(luò)輿情則是社會(huì)總體輿情的一個(gè)組成部分,是以網(wǎng)絡(luò)為載體存在,以網(wǎng)絡(luò)傳播方式匯聚、形成和表達(dá)的輿情,是在互聯(lián)網(wǎng)上的民眾情緒、態(tài)度和意見(jiàn)匯聚的總和[5]。
網(wǎng)絡(luò)輿情的信息來(lái)源主要有:網(wǎng)絡(luò)新聞(如:搜狐、新浪、人民網(wǎng),或以RSS為基礎(chǔ)聚合類(lèi)新聞,如頭條等),論壇貼吧(如:BBS,百度貼吧,天涯,西祠胡同等),新聞評(píng)論,社會(huì)化媒體社交網(wǎng)絡(luò)(即時(shí)通訊工具:如:聊天室、QQ、微信、微博、博客等),搜索引擎(如:百度,google等),網(wǎng)絡(luò)發(fā)起線(xiàn)上活動(dòng)、網(wǎng)絡(luò)調(diào)查、電子郵件等。
通常我們把網(wǎng)絡(luò)輿情的基本特征概括為自由性與可控性、互動(dòng)性與即時(shí)性、豐富性與多樣性、隱匿性與外顯性、情緒化與非理性、個(gè)體化與群體極化性[6]。如圖3所示:網(wǎng)絡(luò)輿情的特征
3.大數(shù)據(jù)是網(wǎng)絡(luò)輿情管理的有效方式之一
大數(shù)據(jù)的目的在于發(fā)現(xiàn)新的知識(shí)與洞察并進(jìn)行科學(xué)決策。大數(shù)據(jù)與網(wǎng)絡(luò)輿情具有非常相似的特征。從這點(diǎn)上可見(jiàn),利用大數(shù)據(jù)的手段管理網(wǎng)絡(luò)輿情是網(wǎng)絡(luò)輿情管理的有效方式之一。首先,大數(shù)據(jù)能夠全方位記錄民意,完整展現(xiàn)社會(huì)輿情,大數(shù)據(jù)體量巨大,從TB級(jí)到PB乃至ZB級(jí)別,能夠完全、完整的記錄社會(huì)民眾的社情民意;其次,大數(shù)據(jù)的特點(diǎn)是挖掘數(shù)據(jù)背后的相關(guān)聯(lián)性,因此,大數(shù)據(jù)能精準(zhǔn)體現(xiàn)輿情背后的事件、相關(guān)人員以及讀者等要素內(nèi)在邏輯和社會(huì)關(guān)聯(lián);最后,大數(shù)據(jù)具有很強(qiáng)的預(yù)測(cè)能力,通過(guò)分析事件的讀者特征(群體肖像刻畫(huà))、被關(guān)注程度/熱度、傳播速度、傳播范圍、發(fā)展趨勢(shì)、影響程度和網(wǎng)民情緒變化等,也可以針對(duì)某個(gè)觀點(diǎn)的深度研究,從而預(yù)測(cè)輿情走向,幫助決策者進(jìn)行決策和判斷。因此,大數(shù)據(jù)技術(shù)為網(wǎng)絡(luò)輿情的預(yù)測(cè)提供了重要的技術(shù)、理論支撐和保證,也成為輿情研究關(guān)鍵技術(shù)的支撐和核心概念。
二、基于大數(shù)據(jù)技術(shù)網(wǎng)絡(luò)輿情管理的一般步驟與方法
網(wǎng)絡(luò)輿情的管理模型主要分為:信息采集、信息預(yù)處理、輿情分析、輿情報(bào)告四個(gè)步驟。如圖4所示:大數(shù)據(jù)管理模塊及流程示意。
1.信息采集
信息采集當(dāng)前常用方式是網(wǎng)絡(luò)爬蟲(chóng)技術(shù)。在網(wǎng)絡(luò)爬蟲(chóng)的爬行策略中,應(yīng)用最為基礎(chǔ)的是深度優(yōu)先遍歷策略、廣度優(yōu)先遍歷策略。對(duì)于信息抓取過(guò)程,要求信息抓取的覆蓋范圍要全面。高速發(fā)展的信息高速路使得網(wǎng)絡(luò)信息數(shù)據(jù)容量不斷增大、信息和數(shù)據(jù)的類(lèi)型更加豐富和復(fù)雜、網(wǎng)頁(yè)數(shù)量不斷增多,這對(duì)輿情信息抓取的效率和全面性提出了更高的要求。
大數(shù)據(jù)網(wǎng)絡(luò)輿情信息搜集改變了傳統(tǒng)網(wǎng)絡(luò)輿情信息的搜索采集方式,采用定向站點(diǎn)信息抓取輔以全面的實(shí)時(shí)監(jiān)控、聚合內(nèi)容(RSS)、社交網(wǎng)站信息搜集和摘要搜集等搜集技術(shù),與傳統(tǒng)人工監(jiān)測(cè)采集相結(jié)合的方式進(jìn)行,抓取效率和覆蓋范圍都有突破性進(jìn)展。
數(shù)據(jù)監(jiān)測(cè)要全面和實(shí)時(shí),要做到精細(xì)采集信息數(shù)據(jù)。筆者整理了較為常用的監(jiān)測(cè)范圍和基本監(jiān)測(cè)指標(biāo),如表1所示。
2.信息處理
信息處理主要包括數(shù)據(jù)清洗(Data Cleaning)、信息提取、文本分類(lèi)等。信息處理的主要任務(wù)是將采集的各種信息轉(zhuǎn)化成格式化文本存入數(shù)據(jù)庫(kù)。
網(wǎng)絡(luò)輿情在大數(shù)據(jù)環(huán)境中流動(dòng)和變化速度非???,因此,在信息處理部分,要求信息處理的時(shí)效性。
3.輿情挖掘與分析
大數(shù)據(jù)分析就是對(duì)海量數(shù)據(jù)進(jìn)行分析、梳理和加工,獲得具有價(jià)值的產(chǎn)品(Product)和服務(wù)(Service)或深刻洞見(jiàn)(Insight)的數(shù)據(jù)及處理方法。數(shù)據(jù)分析的主要技術(shù)手段是采用數(shù)據(jù)挖掘(Data Mining),數(shù)據(jù)挖掘又稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),即從數(shù)據(jù)庫(kù)的大量數(shù)據(jù)中揭示出隱含的、前所未有的并具有潛在價(jià)值的信息的價(jià)值聚合、提煉的過(guò)程[7]。
輿情分析的技術(shù)方法主要有文本分類(lèi)、聚類(lèi)分析(不預(yù)先設(shè)定數(shù)據(jù)歸類(lèi)類(lèi)目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類(lèi)別)、熱點(diǎn)發(fā)現(xiàn)(利用關(guān)鍵詞過(guò)濾、語(yǔ)義分析、數(shù)值統(tǒng)計(jì)識(shí)別熱點(diǎn)和敏感話(huà)題)、話(huà)題識(shí)別、主題檢測(cè)與跟蹤、觀點(diǎn)/文本傾向性識(shí)別和分析(對(duì)文章的觀點(diǎn)進(jìn)行傾向性分析和統(tǒng)計(jì),識(shí)別正負(fù)面信息)、自動(dòng)摘要等計(jì)算技術(shù)挖掘網(wǎng)絡(luò)文本內(nèi)容蘊(yùn)含的各種觀點(diǎn)(Opinion)、喜好(Preference)、態(tài)度(Attitude)、情感(Emotion)等,也可以明確網(wǎng)絡(luò)傳播者的意圖和傾向,以及影響程度、影響范圍和發(fā)展趨勢(shì)。
當(dāng)前一些實(shí)驗(yàn)室、研究機(jī)構(gòu)等依據(jù)大數(shù)據(jù)分析的方法和實(shí)際的工作相結(jié)合,開(kāi)發(fā)和建立了以下輿情專(zhuān)屬的分析模型和方法。如:人民網(wǎng)推出的“輿論共識(shí)度”指數(shù)將為中國(guó)網(wǎng)絡(luò)輿論場(chǎng)的研究和社會(huì)輿論的理性引導(dǎo)提供新的觀察視角和決策依據(jù)。它把網(wǎng)絡(luò)用戶(hù)分為媒體、網(wǎng)民和意見(jiàn)領(lǐng)袖三大群體,通過(guò)對(duì)不同群體的輿論分析,對(duì)每月前十或前100的社會(huì)熱點(diǎn)問(wèn)題進(jìn)行評(píng)估,形成“輿論共識(shí)度”,進(jìn)而對(duì)用戶(hù)對(duì)輿論話(huà)題的共識(shí)程度進(jìn)行評(píng)價(jià)。
互聯(lián)網(wǎng)與國(guó)家治理研究中心、中山大學(xué)大數(shù)據(jù)傳播實(shí)驗(yàn)室設(shè)計(jì)的“網(wǎng)民認(rèn)知模型”,通過(guò)透析網(wǎng)民對(duì)不同事件的情緒變化、態(tài)度偏向等,評(píng)測(cè)用戶(hù)“正負(fù)能量”,分別從“網(wǎng)民情緒指數(shù)”“網(wǎng)民理性指數(shù)”和“網(wǎng)民態(tài)度指數(shù)”三個(gè)維度來(lái)評(píng)價(jià)具體熱點(diǎn)事件當(dāng)中網(wǎng)絡(luò)輿論場(chǎng)的“網(wǎng)民正能量指數(shù)”,對(duì)輿情分析和研判也非常有幫助。
還有機(jī)構(gòu)建立的熱度評(píng)估指數(shù),通過(guò)話(huà)題在傳統(tǒng)媒體報(bào)道量、網(wǎng)絡(luò)媒體報(bào)道量、微博量、論壇帖文量、博客文章量,轉(zhuǎn)發(fā)數(shù)量、用戶(hù)跟貼數(shù)量、評(píng)論數(shù)量、被關(guān)注數(shù)量、傳播的速度和范圍、關(guān)注的用戶(hù)形態(tài)特征等相關(guān)數(shù)據(jù),之后加權(quán)各項(xiàng)指標(biāo),得到每個(gè)熱度事件或話(huà)題的綜合熱度指數(shù)。
更有一些專(zhuān)項(xiàng)深入分析,如針對(duì)傳播源頭的分析、傳播渠道的分析、意見(jiàn)領(lǐng)袖的分析、傳播主體挖掘分析或針對(duì)隱性數(shù)據(jù)(網(wǎng)絡(luò)日志)的分析。
也有專(zhuān)家學(xué)者提出,輿情分析需要是一個(gè)綜合分析模式,以大數(shù)據(jù)的方式為重點(diǎn),同時(shí)要結(jié)合專(zhuān)項(xiàng)話(huà)題市場(chǎng)調(diào)研、綜合民意調(diào)查(定性與定量)、軟件與人工、分析師與專(zhuān)家會(huì)商等方式相結(jié)合的方法來(lái)分析。
4.輿情報(bào)告
輿情分析的結(jié)果需要以報(bào)告的方式呈現(xiàn),并將分析報(bào)告反饋或發(fā)布,為用戶(hù)、管理者和決策者提供依據(jù)。
輿情報(bào)告要求輿情分析數(shù)據(jù)要真實(shí)可靠,分析方法要恰當(dāng)準(zhǔn)確,描述要符合客觀事實(shí),結(jié)論要簡(jiǎn)明扼要、通俗易懂。輿情報(bào)告中恰當(dāng)采用示意圖、圖表、列表等展示形式,可以更形象、清晰、直觀,并且更邏輯地展示輿情事件的發(fā)生、發(fā)展和變化,輿情的發(fā)展態(tài)勢(shì)等。針對(duì)不同的表達(dá)目的可以選用不同的圖表或圖示方式,如:描述事件發(fā)展趨勢(shì)可用折線(xiàn)圖表示、展示用戶(hù)立場(chǎng)或觀點(diǎn)的比例可用餅狀圖、體現(xiàn)熱點(diǎn)人群的分布可以用散點(diǎn)分布圖、表示頻率分布可以用網(wǎng)狀圖或柱狀圖、說(shuō)明事態(tài)發(fā)展變化可以用流程圖、用戶(hù)之前或背后的人際關(guān)系可以用網(wǎng)狀關(guān)系圖等。豐富的圖表工具可以更形象、生動(dòng)的表述輿情的現(xiàn)狀、發(fā)展和變化。
三、大數(shù)據(jù)環(huán)境下輿情管理模式變革與管理方法創(chuàng)新
雖然,目前對(duì)大數(shù)據(jù)研究越來(lái)越熱,國(guó)內(nèi)諸多大的互聯(lián)網(wǎng)公司、各行業(yè)內(nèi)的企業(yè)及科研機(jī)構(gòu)都投入了巨大的人力、物力開(kāi)展大數(shù)據(jù)及大數(shù)據(jù)下輿情研究,但在我國(guó)大數(shù)據(jù)研究依然處于探索階段,在很多方面還只是停留在理論或?qū)ξ磥?lái)的暢想階段。例如:在技術(shù)方面,目前常見(jiàn)的輿情監(jiān)測(cè)工作的主要手段仍以人工檢索為主,盡管也使用了市面相對(duì)成熟的相關(guān)搜索軟件進(jìn)行輔助搜索,但搜索輿情的技術(shù)仍采用傳統(tǒng)的二維搜索方式,即主題關(guān)鍵詞和網(wǎng)絡(luò)平臺(tái)二維坐標(biāo),由輿情管理的工作人員對(duì)采集的信息進(jìn)行二次加工成輿情產(chǎn)品。而且搜索的輿情信息結(jié)果多為一級(jí)文本信息,對(duì)于深層次的多級(jí)輿情信息,如新聞、微博后的評(píng)論,網(wǎng)民的社會(huì)關(guān)系,網(wǎng)民針對(duì)某一事件評(píng)論反映出的情緒變化等數(shù)據(jù)無(wú)法深度挖掘,仍靠人工采集和分析判斷。受制于輿情分析人員的知識(shí)水平和價(jià)值判斷的不同,極有可能導(dǎo)致有價(jià)值的輿情信息丟失,無(wú)法準(zhǔn)確及時(shí)預(yù)測(cè)輿情走勢(shì),大大降低了輿情監(jiān)測(cè)工作的效率、準(zhǔn)確性。
隨著互聯(lián)網(wǎng)的發(fā)展、自媒體的興起,網(wǎng)絡(luò)、通信技術(shù)在人們信息領(lǐng)域深入運(yùn)用,發(fā)布者在人口統(tǒng)計(jì)學(xué)方面的特征、發(fā)布的載體、發(fā)布的形式、傳播渠道、信息的數(shù)量和形式等有了全新的變化,這對(duì)輿情的管理提出了更高的要求,要求變革網(wǎng)絡(luò)輿情管理方式以適應(yīng)大數(shù)據(jù)時(shí)代的新形勢(shì)。因此,輿情管理工作者在輿情管理的理念、模式和方式方法上均需要有相應(yīng)的變革與創(chuàng)新。
1.輿情工作者的研究視角需要發(fā)生轉(zhuǎn)變
輿情工作者要從全局角度,把輿情研究從單一向度的內(nèi)容研究向多元化、多向度內(nèi)容及關(guān)系研究方向轉(zhuǎn)化。網(wǎng)絡(luò)數(shù)據(jù)和信息背后體現(xiàn)的人的行為軌跡和復(fù)雜的人與人的社會(huì)關(guān)系(Social networking),所以關(guān)系研究將成為未來(lái)的研究重點(diǎn)。大數(shù)據(jù)的特征之一“關(guān)聯(lián)分析”,通過(guò)社會(huì)話(huà)語(yǔ)表達(dá)、社會(huì)關(guān)系分析、社會(huì)心理描繪、社會(huì)訴求預(yù)測(cè)等多個(gè)角度[8],進(jìn)行多向度的分析研究能夠幫助構(gòu)建立體化、全局化和動(dòng)態(tài)化的網(wǎng)絡(luò)輿情數(shù)據(jù)系統(tǒng),通過(guò)輿情分析,挖掘網(wǎng)絡(luò)輿情和社會(huì)動(dòng)態(tài)背后的深層次關(guān)系,實(shí)現(xiàn)網(wǎng)絡(luò)輿情管理和社會(huì)治理的緊密聯(lián)動(dòng)、同步推進(jìn)。
2.輿情的研究方法需要?jiǎng)?chuàng)新
即便是研究的視角發(fā)生了改變,要想真正落實(shí)到具體工作中,研究方法的創(chuàng)新尤為關(guān)鍵。要在分析方法上更加豐富,結(jié)合數(shù)據(jù)挖掘技術(shù)分析(Data Mining)方法與行為分析(Behavior Analysis)方法的研究、結(jié)合云計(jì)算、移動(dòng)可追塑性分析、個(gè)性化特征識(shí)別的網(wǎng)絡(luò)機(jī)器人與社會(huì)心理分析實(shí)驗(yàn)因果模型等方法,一是要提升數(shù)據(jù)監(jiān)測(cè)技術(shù),實(shí)現(xiàn)對(duì)媒體、論壇、博客、微博、微信等各個(gè)網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)的全面抓取和記錄,特別是要提高對(duì)圖片、音視頻、模擬信號(hào)等數(shù)據(jù)的自動(dòng)識(shí)別能力;二方面提高數(shù)據(jù)挖掘技術(shù),從海量數(shù)據(jù)中快速識(shí)別有價(jià)值數(shù)據(jù),并挖掘數(shù)據(jù)背后隱藏的規(guī)律。三要注重?cái)?shù)據(jù)分析技術(shù),包括關(guān)聯(lián)分析、聚類(lèi)分析、語(yǔ)義分析等等,自動(dòng)分析網(wǎng)上言論背后的觀點(diǎn)、意見(jiàn)傾向和信息、相互之間的關(guān)聯(lián)性,揭示輿情發(fā)展趨勢(shì)。四是確保數(shù)據(jù)安全和保密技術(shù),包括網(wǎng)絡(luò)攻擊與攻擊檢測(cè)與防范問(wèn)題、安全漏洞與安全對(duì)策問(wèn)題、數(shù)據(jù)備份與恢復(fù)問(wèn)題、災(zāi)難恢復(fù)問(wèn)題等等,確保數(shù)據(jù)安全和保密[9]。
在數(shù)據(jù)分析方面,數(shù)據(jù)分析的準(zhǔn)確性尤為重要。引入云計(jì)算的概念和技術(shù),與大數(shù)據(jù)相結(jié)合,會(huì)使輿情分析更加準(zhǔn)確。開(kāi)展數(shù)據(jù)間、不同維度、不同領(lǐng)域的數(shù)據(jù)、多樣化的數(shù)據(jù)間的關(guān)聯(lián)分析,是十分重要的。專(zhuān)家認(rèn)為輿情關(guān)聯(lián)關(guān)系是網(wǎng)絡(luò)輿情數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的、可被發(fā)現(xiàn)的知識(shí),引入網(wǎng)絡(luò)輿情支持度和網(wǎng)絡(luò)輿情可信度,可以更準(zhǔn)確表示網(wǎng)絡(luò)輿情間的關(guān)聯(lián)度,量化網(wǎng)絡(luò)輿情關(guān)聯(lián)規(guī)則的相關(guān)性,從而使挖掘結(jié)果更準(zhǔn)確。
3.研究結(jié)果要易懂、易應(yīng)用和可視化呈現(xiàn)
大數(shù)據(jù)的真正價(jià)值是運(yùn)用,輿情的最終價(jià)值是指導(dǎo)工作。研究結(jié)果的使用者未必是大數(shù)據(jù)和輿情分析的專(zhuān)家。因此,研究結(jié)果要求易懂易識(shí),界面必須友好,結(jié)果必須可以直觀識(shí)別。 “用數(shù)據(jù)說(shuō)話(huà)”。數(shù)據(jù)最有說(shuō)服力,由于圖表與列表能夠清晰、直觀、簡(jiǎn)潔、深刻、形象地表現(xiàn)輿情事件,因此輿情的研究結(jié)果要注重運(yùn)用圖表等可視化方式來(lái)展現(xiàn)。
4.重點(diǎn)強(qiáng)調(diào)輿情的預(yù)測(cè),面向未來(lái),做好輿情數(shù)據(jù)的再利用
大數(shù)據(jù)的核心是預(yù)測(cè),未來(lái)輿情研究的重點(diǎn)應(yīng)由輿情監(jiān)測(cè)轉(zhuǎn)向輿情預(yù)警和預(yù)測(cè)。輿情工作者通過(guò)收集分析互聯(lián)網(wǎng)上關(guān)于社會(huì)熱點(diǎn)或網(wǎng)民關(guān)注焦點(diǎn)事件的大量消息報(bào)道,發(fā)掘背后隱藏關(guān)系,進(jìn)而預(yù)測(cè)事態(tài)發(fā)展趨勢(shì),為輿情事件處置提供決策參考。
展望未來(lái),大數(shù)據(jù)時(shí)代數(shù)據(jù)使用的關(guān)鍵是數(shù)據(jù)再利用,數(shù)據(jù)再利用的意義在于:挖掘數(shù)據(jù)的潛在價(jià)值,實(shí)現(xiàn)數(shù)據(jù)重組的創(chuàng)新價(jià)值?;诖髷?shù)據(jù)的輿情分析,能同時(shí)分析更多數(shù)據(jù),揭露更多隱藏價(jià)值,使預(yù)測(cè)更準(zhǔn)確,決策更合理。未來(lái)大數(shù)據(jù)將使輿情監(jiān)測(cè)功能大大豐富,輿情分析功能更加強(qiáng)大,輿情預(yù)測(cè)能力進(jìn)一步增強(qiáng),這將實(shí)現(xiàn)全方位、立體式的綜合輿情管理模式,實(shí)現(xiàn)輿情管理的價(jià)值最大化。
參考文獻(xiàn)
[1] 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC).第37次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].[2016-01-22].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201601/PO20160122444930951954.pdf.
[2] 謝耘耕,劉銳,喬睿,等. 大數(shù)據(jù)與社會(huì)輿情研究綜述[J]. 新媒體與社會(huì),2014(4):133-154.
[3] 張寧熙.大數(shù)據(jù)在突發(fā)公共事件網(wǎng)絡(luò)輿情信息工作中的應(yīng)用[J]. 現(xiàn)代情報(bào),2015(6):38-42.
[4] 王宏偉.輿情信息工作策略與方法[M]. 北京: 中國(guó)人事出版社,2012:6.
[5] 戴維民,劉軼. 我國(guó)網(wǎng)絡(luò)輿情信息工作現(xiàn)狀及對(duì)策思考[J]. 圖書(shū)情報(bào)工作,2014(1):24-29.
[6] 劉毅. 網(wǎng)絡(luò)輿情研究概論[M].天津: 天津人民版社,2007:74.
[7] 喻國(guó)明. 大數(shù)據(jù)分析下的中國(guó)社會(huì)輿情:總體態(tài)勢(shì)與結(jié)構(gòu)性特征——基于百度熱搜詞(2009—2012)的輿情模型構(gòu)建[J].中國(guó)人民大學(xué)學(xué)報(bào),2013(5):2-9.
[8] 李小娜. 大數(shù)據(jù)時(shí)代社會(huì)輿情監(jiān)測(cè)的轉(zhuǎn)變和發(fā)展[J]. 青年記者,2015(11):69-70.
[9] 卿立新. 創(chuàng)新大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿情管理[J]. 紅旗文稿,2014(22):28-29.
[責(zé)任編輯:張學(xué)玲]