胡治宇 利莉
摘 ?要:大數(shù)據(jù)技術(shù)的合理應(yīng)用不僅可以有效地發(fā)現(xiàn)影響高校輿情走向的各種因素,而且可以促使高校運用科學(xué)的方式方法來開展輿情處理應(yīng)急方案。本文主要對大數(shù)據(jù)技術(shù)的特點在高校輿情監(jiān)測中的應(yīng)用進(jìn)行分析,又具體說明輿情應(yīng)急機(jī)制的疏導(dǎo)辦法,不斷分析其原理,得出大數(shù)據(jù)下高校輿情應(yīng)急機(jī)制的研究結(jié)果。
關(guān)鍵詞:大數(shù)據(jù);高校輿情;應(yīng)急機(jī)制
中圖分類號:TP391.1;TP393.2 ? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2019)18-0051-03
Abstract:The rational application of big data technology can not only effectively discover various factors affecting the trend of public opinion in universities,but also can urge universities to use scientific methods to carry out public opinion emergency plans. This paper mainly analyzes the characteristics of big data technology based on the application of public opinion monitoring in universities,and specifically explains the approach of public opinion emergency mechanism,and continuously analyzes its principle to obtain the research results of public opinion emergency mechanism under the big data.
Keywords:big data;public opinion in universities;emergency mechanism
0 ?引 ?言
當(dāng)代大學(xué)生在大數(shù)據(jù)時代的浪潮里缺乏社會閱歷和成熟的思想,在認(rèn)識問題上不夠深刻清晰,易發(fā)生偏差或是做出錯誤的決定。在論壇中的觀點易受集體化思維引導(dǎo),導(dǎo)致輿情發(fā)酵,引發(fā)錯誤思想的大面積擴(kuò)張,或是受到負(fù)面情緒影響而被其主導(dǎo)自己的思想[1]。高校網(wǎng)絡(luò)輿情在大學(xué)生生活中占據(jù)很重要的地位,高校輿情反映了在校大學(xué)生的思想狀況和校園的穩(wěn)定和諧,大數(shù)據(jù)時代下的網(wǎng)絡(luò)環(huán)境影響著校園安全的一部分。
1 ?大數(shù)據(jù)環(huán)境下高校輿情監(jiān)測技術(shù)分析
1.1 ?網(wǎng)絡(luò)輿情信息采集及其預(yù)處理技術(shù)分析
該網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)主要采取了專門的抓取器在網(wǎng)頁上進(jìn)行輿情信息的采集,比如import.io、Gooseeker等編程語言。抓取器能夠?qū)⒉杉臄?shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,并將這些數(shù)據(jù)存儲起來。在進(jìn)行數(shù)據(jù)采集時需要對數(shù)據(jù)進(jìn)行篩選和過濾,而這就需要依靠網(wǎng)頁清洗技術(shù)來完成,這項技術(shù)能夠?qū)⒕W(wǎng)頁當(dāng)中的“噪聲”數(shù)據(jù)過濾掉,目前運用最為廣泛的網(wǎng)頁數(shù)據(jù)清洗技術(shù)主要為開源軟件HTMLParser和DataWrangler。另外,在網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)當(dāng)中還利用了Shark-Search搜索策略算法來進(jìn)行改進(jìn),其主要依靠面向主題爬蟲Heritrixs實現(xiàn)。為了更加快速便捷地對網(wǎng)頁數(shù)據(jù)信息進(jìn)行預(yù)處理,在該網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)當(dāng)中還利用了基于統(tǒng)計信息和語意理解相結(jié)合的算法來進(jìn)行網(wǎng)頁內(nèi)容的自動摘要處理。高校輿情監(jiān)測系統(tǒng)輿情采集功能總體架構(gòu)設(shè)計圖如圖1所示。
1.2 ?開源軟件HTML Parser
現(xiàn)如今,互聯(lián)網(wǎng)上的信息量呈現(xiàn)出幾何式增長的趨勢,人們要想從這些海量的信息當(dāng)中快速、準(zhǔn)確地獲取自己真正需要的信息,比如:圖片、標(biāo)題、鏈接等,那么就必須要借助一些自動化工具[2]。但是目前Web網(wǎng)頁中所采取的HTML語言需要經(jīng)過瀏覽器解析后才能夠正常瀏覽,而HTML語言并不適合作為數(shù)據(jù)交換的方式交由機(jī)器處理。但是現(xiàn)在在網(wǎng)絡(luò)上所獲取的資料大多為HTML文檔,在這些文檔當(dāng)中包含著大量的信息和數(shù)據(jù),其中有很多信息和數(shù)據(jù)都是無用的,甚至還隱藏著錯誤。如果在獲取網(wǎng)頁信息時,將這些資料全部看作字符流,會加大數(shù)據(jù)處理的難度。因此,為了更好地解析和提取Web網(wǎng)頁上的信息,我們通常會采用HTML Parser開源軟件來完成。該軟件會將整個信息處理的過程分為頁面裝載、頁面判斷以及信息提取這三個環(huán)節(jié)。首先,將頁面裝載到程序當(dāng)中,裝載成功之后才會進(jìn)行下一步,如果失敗那么本次信息提取就會結(jié)束。接下來就是進(jìn)行頁面判斷,這一步驟會由程序自動完成,程序會將符合模板規(guī)定的信息部分提取出來。
整個頁面信息提取的過程都是由HTML Parser的過濾器來完成的,這主要是因為每個網(wǎng)站頁面格式以及風(fēng)格都存在較大的差異,在提取網(wǎng)頁信息時,需要先分析網(wǎng)頁的結(jié)構(gòu),然后再根據(jù)不同網(wǎng)站,編寫不同的模塊程序。但是用半結(jié)構(gòu)化HTML語言編寫的網(wǎng)頁,瀏覽器解析起來是比較麻煩的,這時采用HTML Parser開源軟件中的過濾器和Parser解析器來對HTML標(biāo)簽進(jìn)行解析無疑是最好的一種方法。
1.3 ?基于大數(shù)據(jù)技術(shù)的高校輿情分析系統(tǒng)在微博中的具體應(yīng)用
微博具有影響范圍廣、傳播速度快等特點,受到了當(dāng)代大學(xué)生的廣泛青睞,并成為他們應(yīng)用最為廣泛的一種社交平臺。這也使得微博逐漸成為了高校輿情的一種重要的表現(xiàn)形式。學(xué)生可以在微博平臺上,通過關(guān)注他人的方式來獲取他人所發(fā)表的信息,并形成自己的朋友圈。而高校就可以通過網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)對師生在微博上所發(fā)表的信息進(jìn)行有效的監(jiān)管,全面掌握高校輿情的發(fā)展態(tài)勢,并針對突發(fā)輿情事件及時做出應(yīng)對措施,進(jìn)而有效地提升高校輿情治理的水平。
2 ?大數(shù)據(jù)技術(shù)的高校輿情分析系統(tǒng)的作用
2.1 ?利用大數(shù)據(jù)分析功能,主導(dǎo)輿論導(dǎo)向
作為高校中的學(xué)生,有自己的意見和思想是一件必備的技能,做到今日事今日解決,不要拖泥帶水,對生活中的任何情況都要有自己的主見,不要因為集體思想或者從眾心理打敗了獨特的見解,更不要別人做什么自己就要跟著做,不一樣不代表著另類,只有有頭腦有想法的人才能主導(dǎo)自己的人生[3]。比如是提前預(yù)習(xí)的效率高還是課后復(fù)習(xí)的效率高,記單詞是早晨記憶力好還是深夜牢固,走出大門是從A路線快速還是B路線方便,這都是我們將會遇到的問題。在大數(shù)據(jù)時代,我們不能隨時掌握別的思想,但是我們要把住的根基和底線,不會輕易動搖。同時,學(xué)生中的一些代表性人物,比如學(xué)生會主席、班長、學(xué)習(xí)委員、生活委員等等一些活潑開朗、待人接物有準(zhǔn)則又靈活的同學(xué)或是和同學(xué)們打成一片的同學(xué),這些人的一舉一動經(jīng)常會帶動一部分同學(xué)的行為。組織高校人才在高校論壇上進(jìn)行言論發(fā)表,多和同學(xué)進(jìn)行積極的互動,傳播真實有效的信息,在論壇上發(fā)表積極正能量的帖子并適時終止錯誤導(dǎo)向,樹立鮮明的旗幟、堅定立場,有利于在輿情中抓緊主動權(quán)、發(fā)展健康的大數(shù)據(jù)時代輿論。
2.2 ?利用輿情監(jiān)控機(jī)制,降低高校輿論危機(jī)的發(fā)生率
大數(shù)據(jù)環(huán)境下高校輿情形成與傳播的過程如圖2所示。
從圖2中可以看出,某個事件形成一定的聲勢輿論往往都是需要某個導(dǎo)火索所引發(fā)的,一旦導(dǎo)火索被點燃,那么就會超出輿情觸發(fā)的閾值,進(jìn)而導(dǎo)致均衡被打破,進(jìn)而爆發(fā)輿情危機(jī)。因此,高校應(yīng)當(dāng)要建立輿情預(yù)見機(jī)制,隨時監(jiān)控輿情的發(fā)生和演變,及時把控輿情走向,防止發(fā)生不良校園現(xiàn)象。降低突發(fā)事件的發(fā)生概率,維護(hù)學(xué)校的聲譽(yù)和威望。在零碎的碎片信息中找到有用信息,合理分類,有效使用大數(shù)據(jù)找出潛在的危險,從源頭杜絕輿情,控制走向,從而保證將輿情控制在合理范圍內(nèi)。
2.3 ?基于大數(shù)據(jù)技術(shù)的高校輿情監(jiān)測效果
通過大數(shù)據(jù)技術(shù)能夠?qū)Ω咝]浨橹械姆N種不確定因素進(jìn)行有效的捕捉,進(jìn)而推動高校輿情治理的科學(xué)開展[4]。并且大數(shù)據(jù)技術(shù)還能夠為高校的輿情管理提供更多監(jiān)測和判別工具,這樣一來就可以使得高校的輿情危機(jī)預(yù)判能力以及處理能力大大提升,同時大數(shù)據(jù)技術(shù)還能夠?qū)Ω咝]浨楣芾淼哪J胶退季S方式產(chǎn)生較大的影響,這對于高校的輿情管理具有非常重要的意義。
3 ?結(jié) ?論
綜上所述,大數(shù)據(jù)技術(shù)對于高校輿情的監(jiān)測和引導(dǎo)都具有非常重要的作用。高校的輿情能夠反映出全體師生的心態(tài),并通過社交媒體形成輿情大數(shù)據(jù)。這就要求高校應(yīng)當(dāng)合理地運用大數(shù)據(jù)技術(shù),來為高校輿情的管理提供更加先進(jìn)的理念和工具,以此來幫助高校更好地對輿情數(shù)據(jù)進(jìn)行查找、監(jiān)督,并在此基礎(chǔ)上制定出科學(xué)的應(yīng)對策略,從而幫助高校掌握輿情的主導(dǎo)權(quán),提升高校輿情管理的水平。
參考文獻(xiàn):
[1] 侯菲菲,張帆,梁玉琪.大數(shù)據(jù)環(huán)境下突發(fā)事件網(wǎng)絡(luò)輿情分析及應(yīng)對策略 [J].新聞研究導(dǎo)刊,2016,7(18):74-75.
[2] 王曰芬.大數(shù)據(jù)環(huán)境下社會輿情及其演化分析研究 [J].情報資料工作,2016(3):5.
[3] 徐萍.大數(shù)據(jù)在高校網(wǎng)絡(luò)輿情應(yīng)急處置中的應(yīng)用探討 [J].圖書館工作與研究,2016(5):55-58.
[4] 岑詠華,王曰芬.大數(shù)據(jù)環(huán)境下社會輿情分析與決策支持的研究視角和關(guān)鍵問題 [J].現(xiàn)代圖書情報技術(shù),2016(Z1):3-11.
作者簡介:胡治宇(1983.03-),男,漢族,安徽黃山人,講師,碩士,研究方向:網(wǎng)絡(luò)工程、圖形圖像、多媒體技術(shù);利莉(1983.12-),女,漢族,江西景德鎮(zhèn)人,講師,碩士,研究方向:網(wǎng)絡(luò)工程、計算機(jī)科學(xué)與應(yīng)用。