◆劉娟 高嘉敏 紀(jì)學(xué)師
探析大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)輿情監(jiān)控的應(yīng)用
◆劉娟 高嘉敏 紀(jì)學(xué)師
(山東醫(yī)學(xué)高等專(zhuān)科學(xué)校 山東 276000)
大數(shù)據(jù)時(shí)代全面到來(lái)后網(wǎng)絡(luò)輿情發(fā)生了變化,其數(shù)據(jù)規(guī)模大幅提升、增長(zhǎng)速度顯著加快,網(wǎng)絡(luò)輿情監(jiān)管工作在這種情況下變得更加困難。鑒于此,本文就網(wǎng)絡(luò)輿情與大數(shù)據(jù)技術(shù)的適用性展開(kāi)討論,研究大數(shù)據(jù)思維方法在網(wǎng)絡(luò)輿情監(jiān)控中的重要作用,對(duì)大數(shù)據(jù)技術(shù)應(yīng)用于網(wǎng)絡(luò)監(jiān)控后可能出現(xiàn)的問(wèn)題進(jìn)行深入討論,以期為網(wǎng)絡(luò)輿情監(jiān)控提供全新的思維方式和解決辦法,對(duì)相關(guān)監(jiān)管部門(mén)提供借鑒和參考。
大數(shù)據(jù);網(wǎng)絡(luò)輿情;監(jiān)控
我國(guó)網(wǎng)絡(luò)社會(huì)已經(jīng)全面進(jìn)入Web2.0時(shí)代,大數(shù)據(jù)技術(shù)以迅猛的態(tài)勢(shì)發(fā)展,互聯(lián)網(wǎng)每天產(chǎn)生以PB計(jì)的海量信息,這些信息匯集在一起形成龐大的數(shù)據(jù)資源。在這種網(wǎng)絡(luò)背景下,原本具有封閉性特點(diǎn)的數(shù)據(jù)已經(jīng)全面轉(zhuǎn)變?yōu)榫哂谢A(chǔ)性特征的重要資源,對(duì)互聯(lián)網(wǎng)中的大量有價(jià)值信息進(jìn)行挖掘并將無(wú)用、虛假信息摒棄已經(jīng)是大勢(shì)所趨。
移動(dòng)終端技術(shù)的日趨成熟使其制造成本大幅度降低,加之無(wú)線網(wǎng)絡(luò)傳輸速度呈指數(shù)性增長(zhǎng)的特性使移動(dòng)終端迅速普及,各種信息以不同的表現(xiàn)形式存在于互聯(lián)網(wǎng)中,互聯(lián)網(wǎng)作為各類(lèi)人群無(wú)差別的集散地成為輿論的放大器,能夠吸納大量輿論也能夠放大一些意見(jiàn)或看法,而海量信息中極易存在一些帶有感情偏向的數(shù)據(jù),這些言論會(huì)迅速發(fā)酵形成網(wǎng)絡(luò)輿情。
網(wǎng)絡(luò)輿情是不同社會(huì)群體在同一時(shí)間和空間內(nèi)發(fā)表觀點(diǎn)的總和,是各類(lèi)人群對(duì)某一社會(huì)熱點(diǎn)或焦點(diǎn)事件發(fā)表的帶有傾向性和影響力的情緒和認(rèn)知。在大數(shù)據(jù)的環(huán)境下網(wǎng)絡(luò)輿情具有諸多特點(diǎn),以信息復(fù)雜、數(shù)據(jù)離散、跨越性強(qiáng)為主,大數(shù)據(jù)同時(shí)也為網(wǎng)絡(luò)輿情監(jiān)控提供了全新的思路與解決方式。采用大數(shù)據(jù)技術(shù)對(duì)輿情數(shù)據(jù)進(jìn)行分析、挖掘可以構(gòu)建網(wǎng)絡(luò)輿情監(jiān)控體系,對(duì)正確引導(dǎo)網(wǎng)絡(luò)輿論、純正社會(huì)政治生態(tài)具有重要意義。
現(xiàn)階段,大數(shù)據(jù)以其科學(xué)實(shí)用的特點(diǎn)被廣泛用于社會(huì)的各個(gè)行業(yè)中,大數(shù)據(jù)與網(wǎng)絡(luò)輿情同樣具有適用性,這種一致性主要體現(xiàn)在以下三個(gè)方面中。
一是網(wǎng)絡(luò)輿情具有海量信息的特性,在大數(shù)據(jù)時(shí)代背景下這種信息量的特點(diǎn)更加凸顯,各種自媒體平臺(tái)使信息的聚集方式與傳播方式徹底改變,人們可以在網(wǎng)絡(luò)中突破時(shí)間空間的限制,快速高效進(jìn)行信息發(fā)布,形成即時(shí)信息選擇與反饋機(jī)制,產(chǎn)生海量信息流。二是網(wǎng)絡(luò)輿情信息具有多樣性特點(diǎn),這種多樣性特點(diǎn)體現(xiàn)在網(wǎng)絡(luò)輿情的信息形態(tài)與交互方式上,具體以非結(jié)構(gòu)化的數(shù)據(jù)為主流數(shù)據(jù)形式,以結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)為輔助數(shù)據(jù)形式,網(wǎng)絡(luò)輿情信息同樣可以通過(guò)文本信息、圖像信息和視頻信息形式進(jìn)行傳播。三是網(wǎng)絡(luò)輿情信息轉(zhuǎn)變同樣具有快速性,作為一個(gè)實(shí)時(shí)動(dòng)態(tài)的傳播過(guò)程,網(wǎng)絡(luò)輿情在原始信息的基礎(chǔ)上出現(xiàn)扭曲和延伸,受到網(wǎng)民情緒的刺激,使一些關(guān)鍵信息迅速發(fā)生轉(zhuǎn)變。
實(shí)際上,網(wǎng)絡(luò)輿情體現(xiàn)的是民眾的看法與情緒,其數(shù)據(jù)信息以碎片化和顆粒化的方式存在于網(wǎng)絡(luò)空間中,而這種信息形式通常是隱性數(shù)據(jù),需要大數(shù)據(jù)技術(shù)的支持以實(shí)現(xiàn)數(shù)據(jù)可視化以及信息價(jià)值的增值。從本質(zhì)上對(duì)網(wǎng)絡(luò)輿情進(jìn)行分析可以發(fā)現(xiàn),網(wǎng)絡(luò)輿情所需要的數(shù)據(jù)信息可視化技術(shù)恰恰是大數(shù)據(jù)所能夠提供的技術(shù),大數(shù)據(jù)可以為精準(zhǔn)判斷輿論走勢(shì)提供技術(shù)上的支持,因此對(duì)網(wǎng)絡(luò)輿情進(jìn)行監(jiān)控迫切需要大數(shù)據(jù)技術(shù)的支持。
大數(shù)據(jù)的增值需要經(jīng)歷挖掘信息、打通渠道、充分流轉(zhuǎn)的過(guò)程,最終的全新數(shù)據(jù)流量都要回到具體的業(yè)務(wù)當(dāng)中才能實(shí)現(xiàn)增值過(guò)程,也在數(shù)據(jù)信息的運(yùn)轉(zhuǎn)流通中自動(dòng)形成一個(gè)信息流通閉環(huán),價(jià)值增值過(guò)程如圖1所示。網(wǎng)絡(luò)輿情的信息價(jià)值增值過(guò)程與之并無(wú)差異,首先要在一些網(wǎng)絡(luò)社區(qū)中進(jìn)行信息采集,對(duì)有價(jià)值的信息進(jìn)行深入挖掘,明確碎片化信息之間的關(guān)聯(lián)情況,打通渠道以實(shí)現(xiàn)信息融合,使有價(jià)值的網(wǎng)絡(luò)輿情信息在媒體、公眾與政府之間充分流轉(zhuǎn),從流通特點(diǎn)和數(shù)據(jù)增值方式上看二者的增值過(guò)程相同。
圖1 價(jià)值增值過(guò)程
綜上,大數(shù)據(jù)和網(wǎng)絡(luò)輿情在數(shù)據(jù)特征、技術(shù)需求以及增值過(guò)程等方面具有較高的適用性,大數(shù)據(jù)在網(wǎng)絡(luò)輿情監(jiān)控方面有技術(shù)上實(shí)現(xiàn)的可能性。
大數(shù)據(jù)技術(shù)對(duì)這個(gè)時(shí)代的影響是顯而易見(jiàn)的,人們對(duì)數(shù)據(jù)結(jié)構(gòu)和功能的認(rèn)識(shí)以及數(shù)據(jù)使用方法都發(fā)生了質(zhì)的改變。以大數(shù)據(jù)技術(shù)為基礎(chǔ)、用大數(shù)據(jù)思維構(gòu)建模型可以將輿情監(jiān)控工作分為數(shù)據(jù)的采集、處理與分析三個(gè)過(guò)程,實(shí)現(xiàn)大數(shù)據(jù)的思維模式、技術(shù)特點(diǎn)與輿情監(jiān)控緊密結(jié)合,開(kāi)創(chuàng)輿情治理的全新局面。
一是要注重廣泛采集各種數(shù)據(jù),其中包含冷、溫、熱數(shù)據(jù)三種形式的數(shù)據(jù)。三種形式的數(shù)據(jù)是通過(guò)數(shù)據(jù)跨度時(shí)間區(qū)分的,冷數(shù)據(jù)的跨度時(shí)間較長(zhǎng)的數(shù)據(jù)形式,溫?cái)?shù)據(jù)與熱數(shù)據(jù)分別是非實(shí)時(shí)數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)形式,熱數(shù)據(jù)更傾向于表示用戶實(shí)時(shí)位置狀態(tài)、瀏覽行為與反饋的數(shù)據(jù)類(lèi)型。目前冷數(shù)據(jù)占大數(shù)據(jù)總信息量的八成以上,溫?cái)?shù)據(jù)和熱數(shù)據(jù)共占大數(shù)據(jù)總信息量的兩成,要完成模型構(gòu)建與輿情監(jiān)控任務(wù)就要并行采集三種不同類(lèi)型的數(shù)據(jù)。
二是使隱性輿情顯性化,網(wǎng)絡(luò)上的各種數(shù)據(jù)不以顯性的文字、圖片和視頻存在,但是零碎的信息可以體現(xiàn)出網(wǎng)民情緒傾向特點(diǎn)、體現(xiàn)出網(wǎng)民關(guān)注點(diǎn),這種信息體現(xiàn)出輿情的隱性特點(diǎn)。在進(jìn)行隱性輿情處理時(shí)可利用大數(shù)據(jù)技術(shù)分析其瀏覽痕跡、關(guān)注重點(diǎn)以及關(guān)鍵詞的搜索記錄,這樣就可以建立輿情社會(huì)化網(wǎng)絡(luò),通過(guò)該網(wǎng)絡(luò)可以實(shí)時(shí)監(jiān)控重大輿情的產(chǎn)生與發(fā)展,選擇合適的時(shí)機(jī)對(duì)網(wǎng)絡(luò)輿情的重要節(jié)點(diǎn)進(jìn)行強(qiáng)制切斷,這樣就可以控制住輿情的擴(kuò)散與蔓延,這就是隱性輿情的顯性化過(guò)程,其最終目的是切斷輿情關(guān)鍵節(jié)點(diǎn)。
三是注重輿情數(shù)據(jù)精準(zhǔn)性到容錯(cuò)性的思維模式轉(zhuǎn)變,判斷網(wǎng)絡(luò)輿情不應(yīng)該過(guò)分糾結(jié)于單一數(shù)據(jù)的準(zhǔn)確性,而是將輿情放在整體性數(shù)據(jù)中進(jìn)行統(tǒng)一考量,引導(dǎo)網(wǎng)絡(luò)輿情監(jiān)控判斷向整體把握轉(zhuǎn)變,單一數(shù)據(jù)可以出現(xiàn)錯(cuò)誤,這就是網(wǎng)絡(luò)輿情的容錯(cuò)性思維。大數(shù)據(jù)技術(shù)有能力從海量數(shù)據(jù)中判斷出整體性輿情趨勢(shì),在這種技術(shù)基礎(chǔ)的前提之下,微觀層面的絕對(duì)精確就顯得毫無(wú)意義。
在進(jìn)行輿情處理時(shí)傳統(tǒng)方法是利用小規(guī)模網(wǎng)絡(luò)爬蟲(chóng)對(duì)相關(guān)論壇的評(píng)論進(jìn)行數(shù)據(jù)爬取,因此對(duì)于采集的數(shù)據(jù),其結(jié)構(gòu)和規(guī)模都相對(duì)單一,關(guān)系型數(shù)據(jù)庫(kù)和并行數(shù)據(jù)倉(cāng)庫(kù)即可滿足數(shù)據(jù)處理的技術(shù)要求,所采集的樣本偏小,不具備普遍輿情的代表性。利用大數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)輿情信息采集時(shí)則是通過(guò)公開(kāi)API提取海量非結(jié)構(gòu)化數(shù)據(jù),優(yōu)點(diǎn)在于數(shù)據(jù)來(lái)源廣泛,數(shù)據(jù)類(lèi)型豐富多樣。
第一,高維度輿情數(shù)據(jù)具有可視化特點(diǎn)。網(wǎng)絡(luò)輿情普遍存在于分布式數(shù)據(jù)庫(kù)中,而這種信息通常以細(xì)粒度分布,輿情關(guān)聯(lián)數(shù)據(jù)已經(jīng)不再是一維、二維以及三維形式,逐漸轉(zhuǎn)變?yōu)楦呔S數(shù)據(jù),圖2為數(shù)據(jù)維度四象限示意圖。高維度數(shù)據(jù)有無(wú)關(guān)性、冗余性特別高的特點(diǎn),因此只能利用大數(shù)據(jù)技術(shù)使其可視化。
圖2 數(shù)據(jù)維度四象限
第二,碎片輿情信息呈現(xiàn)聚合化特點(diǎn)。由于微博、微信等終端的信息編輯方式是不規(guī)則的、散點(diǎn)型的,這就導(dǎo)致大量信息以離散化的形式進(jìn)行傳播,也就是信息具有碎片化特點(diǎn)。碎片化信息中存在大量的虛假、模糊信息,這對(duì)于技術(shù)人員的數(shù)據(jù)處理能力與信息認(rèn)知水平是極大的考驗(yàn),因此運(yùn)用大數(shù)據(jù)技術(shù)將網(wǎng)絡(luò)輿情的碎片化信息加以聚合整理,構(gòu)建出相互關(guān)聯(lián)的網(wǎng)絡(luò)輿情邏輯結(jié)構(gòu),呈現(xiàn)出網(wǎng)絡(luò)輿情真正的面貌有助于網(wǎng)絡(luò)輿情的高效治理。
網(wǎng)絡(luò)輿情信息的產(chǎn)生和發(fā)展都不開(kāi)人這個(gè)主體,網(wǎng)絡(luò)輿情的發(fā)展?fàn)顟B(tài)隨著人內(nèi)心的體驗(yàn)與態(tài)度變化而發(fā)生微妙的變化,這種變化是有一定客觀規(guī)律的。對(duì)人的各種狀態(tài)進(jìn)行分析可以有效引導(dǎo)輿情朝著樂(lè)觀的方向發(fā)現(xiàn),而對(duì)不同的人群進(jìn)行差異化的管理也可以使網(wǎng)絡(luò)輿情的引導(dǎo)工作過(guò)程更加具有針對(duì)性、實(shí)時(shí)性與策略性。為了研究輿情數(shù)據(jù)分析過(guò)程,以傳染病擴(kuò)散為研究對(duì)象建立模型,我們將擴(kuò)散模型設(shè)計(jì)為SIR模型。在模型中S代表易感染人員,I代表感染人員,R代表移出人員,用類(lèi)似的思路進(jìn)行分析,可以將輿情信息主體分為S、I、R三種狀態(tài),各種狀態(tài)之間的聯(lián)系如圖3所示。
圖3 SIR擴(kuò)散模型
將網(wǎng)民分為A、B、C三種類(lèi)型,A類(lèi)網(wǎng)民是轉(zhuǎn)發(fā)了某輿情信息的網(wǎng)民,其狀態(tài)可以稱(chēng)為I狀態(tài);B類(lèi)網(wǎng)民是針對(duì)輿情信息持有保留中性態(tài)度的網(wǎng)民,其狀態(tài)可以稱(chēng)為S狀態(tài);C類(lèi)網(wǎng)民是將自己置于輿情以外的R狀態(tài)。單位時(shí)間內(nèi)I狀態(tài)網(wǎng)民與其他網(wǎng)民接觸的平均概率為?,經(jīng)傳播感染為I狀態(tài)網(wǎng)民(I?)受輿論走勢(shì)等外部因素影響轉(zhuǎn)化為R狀態(tài)網(wǎng)民(R?)的平均概率為β,那么輿情信息主體的感染模型則可表示為:
I+R+S=N (1)
S+I?I?+I(?) (2)
I??R?(β) (3)
根據(jù)上述模型的內(nèi)在聯(lián)系與分析可以對(duì)網(wǎng)絡(luò)輿情傳播有一個(gè)較為清晰的認(rèn)知,也能夠通過(guò)模型研究出輿情信息主體的具體狀態(tài),可通過(guò)信息主體對(duì)輿情的態(tài)度差異有針對(duì)性地制定不同策略,為精準(zhǔn)引導(dǎo)不同種類(lèi)的信息主體奠定堅(jiān)實(shí)基礎(chǔ)。
大數(shù)據(jù)發(fā)展速度之快令人詫異又欣喜,但這背后隱藏的危機(jī)卻一直都沒(méi)有消除。一個(gè)重要問(wèn)題就是網(wǎng)絡(luò)安全和個(gè)人隱私無(wú)法得到保護(hù),大數(shù)據(jù)技術(shù)之下的安全保護(hù)與隱私保護(hù)技術(shù)始終都落后于大數(shù)據(jù)的主體技術(shù)水平。大數(shù)據(jù)技術(shù)在進(jìn)行輿情監(jiān)控時(shí)通常會(huì)查詢(xún)到個(gè)人瀏覽記錄、互動(dòng)信息等,對(duì)這些信息進(jìn)行有效利用的確可以使輿情監(jiān)控工作更加高效地開(kāi)展,但如果這些個(gè)人隱私被別有用心之人開(kāi)發(fā)利用就會(huì)造成非常嚴(yán)重的后果,因此在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)大數(shù)據(jù)技術(shù)不僅要提升技術(shù)本身的各項(xiàng)水平,還要研究與之配套的安全保護(hù)措施。
通過(guò)大數(shù)據(jù)進(jìn)行輿情監(jiān)控與處理需要經(jīng)歷非常復(fù)雜的程序,要進(jìn)行信息采集、信息處理、信息主體情感分析、輿情趨勢(shì)研判與引導(dǎo)等過(guò)程,整個(gè)過(guò)程需要用到很多種專(zhuān)業(yè)知識(shí),也需要掌握各種技能和分析方法,在這種條件下選拔人才的過(guò)程比較嚴(yán)格、選拔標(biāo)準(zhǔn)相對(duì)較高,需要復(fù)合型人才從事相關(guān)工作。但目前大數(shù)據(jù)輿情監(jiān)控學(xué)科剛剛處于起步階段,具有大數(shù)據(jù)分析處理、統(tǒng)計(jì)分析計(jì)算、信息挖掘與預(yù)測(cè)、社會(huì)學(xué)研究等多種能力的復(fù)合型人才嚴(yán)重匱乏,因此從現(xiàn)在開(kāi)始就應(yīng)該有針對(duì)性、目的性的培養(yǎng)多種能力的復(fù)合型人才,為日后的輿情監(jiān)控事業(yè)發(fā)展奠定基礎(chǔ)。
近年來(lái),我國(guó)計(jì)算機(jī)、信息、物聯(lián)網(wǎng)等技術(shù)取得了長(zhǎng)足的發(fā)展進(jìn)步,在此基礎(chǔ)上產(chǎn)生的大數(shù)據(jù)技術(shù)在多個(gè)領(lǐng)域中實(shí)現(xiàn)了廣泛應(yīng)用。但大數(shù)據(jù)應(yīng)用于輿情監(jiān)控仍然處于起步階段,需要科研工作者不斷努力,解決各種技術(shù)難題,為我國(guó)輿情監(jiān)控和社會(huì)穩(wěn)定作出貢獻(xiàn)。
[1]蔡金勝,賈博亞,翁永杰.利用網(wǎng)絡(luò)輿情監(jiān)控實(shí)施心理戰(zhàn)防御的幾種路徑[J].網(wǎng)信軍民融合,2021(03):46-48.
[2]梁瑛楠,于小云.突發(fā)公共事件網(wǎng)絡(luò)輿情政府監(jiān)控體系構(gòu)建研究[J].新聞研究導(dǎo)刊,2021,12(02):22-23.
[3]崇陽(yáng).面向網(wǎng)絡(luò)輿情監(jiān)控的熱點(diǎn)話題發(fā)現(xiàn)技術(shù)研究[J].公關(guān)世界,2020(22):176-177.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2021年10期