張嘯杰
摘? ?要:融媒體時(shí)代的到來(lái)、互聯(lián)網(wǎng)終端設(shè)備的普及,使得整個(gè)社會(huì)發(fā)生了翻天覆地的變化,人工智能與大數(shù)據(jù)的運(yùn)用使人們的生活更加方便與高效。新媒體的發(fā)展、“草根媒介”的誕生、小視頻的蓬勃發(fā)展,顛覆了原有的傳播方式與信息發(fā)布和獲取方式。青年人作為社會(huì)中最為活躍的一部分人群,往往集中于高校,并且經(jīng)常運(yùn)用互聯(lián)網(wǎng)發(fā)聲,嘗試新手段、新技術(shù)等。文章運(yùn)用大數(shù)據(jù)對(duì)校園網(wǎng)絡(luò)媒體監(jiān)控是當(dāng)今時(shí)代下及時(shí)、有效地引導(dǎo)青年的必要手段進(jìn)行了研究。
關(guān)鍵詞:融媒時(shí)代;校園網(wǎng)絡(luò);數(shù)據(jù)監(jiān)控;內(nèi)容引導(dǎo)
1? ? 校園網(wǎng)絡(luò)媒體監(jiān)控的背景與目的
融媒體時(shí)代的到來(lái)、互聯(lián)網(wǎng)的迅猛發(fā)展、移動(dòng)終端的普及、傳播方式的顛覆,是當(dāng)前社會(huì)給我們的直觀感受,根據(jù)中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)調(diào)查,2018年6月數(shù)據(jù)顯示,我國(guó)互聯(lián)網(wǎng)用戶突破8億,其中學(xué)生占據(jù)了25%左右[1]。他們善于在網(wǎng)絡(luò)上發(fā)聲,利用互聯(lián)網(wǎng)制造輿論,且是思想最為活躍,而又尚未形成個(gè)人價(jià)值觀與世界觀的群體,他們“理想”、獵奇而又沖動(dòng),容易被利用。因此,互聯(lián)網(wǎng)成為當(dāng)今青年獲取和發(fā)布信息的重要手段和輿情高發(fā)的版塊。
學(xué)生的高校時(shí)期正是“三觀”形成的關(guān)鍵期,而高校肩負(fù)著青年學(xué)生思想政治教育責(zé)任,又是連接社會(huì)的紐帶,因此在校園里正確引導(dǎo)學(xué)生、努力使青年學(xué)生成為社會(huì)主義的建設(shè)者和接班人是高校不可推卸的責(zé)任。高校學(xué)生有更多的個(gè)人生活時(shí)間和空間,網(wǎng)絡(luò)不能斷、手機(jī)不離手已成為常態(tài),在這種隨時(shí)都可能獲取負(fù)面信息、時(shí)刻會(huì)造成輿論的情況下,及時(shí)發(fā)現(xiàn)問題、解決問題,甚至未雨綢繆,提前預(yù)判不利情況的發(fā)生成為高校輿情監(jiān)控必不可少的能力。
在當(dāng)前情況下,運(yùn)用大數(shù)據(jù)進(jìn)行校園網(wǎng)絡(luò)媒體監(jiān)控顯得十分必要。在保證個(gè)人信息不被泄露的情況下,全面監(jiān)控校園網(wǎng)絡(luò)信息,以監(jiān)控為手段、內(nèi)容引導(dǎo)為目的,通過(guò)大數(shù)據(jù)手段對(duì)校園內(nèi)青年學(xué)生們從網(wǎng)絡(luò)上獲取的信息及發(fā)布的信息進(jìn)行處理,形成敏感詞庫(kù)。針對(duì)某一時(shí)間集中爆發(fā)的高頻詞語(yǔ)或某一時(shí)間段的高頻詞語(yǔ)甚至某一個(gè)ID賬戶經(jīng)常瀏覽的信息進(jìn)行收集、整理和分析,從而獲取個(gè)人以及集體的關(guān)注重點(diǎn),反向的給學(xué)校提供內(nèi)容引導(dǎo)的向?qū)?,有更好地判斷和更高效、更精?zhǔn)的引導(dǎo)方向[2]。
2? ? 校園網(wǎng)絡(luò)媒體監(jiān)控的現(xiàn)狀
目前國(guó)內(nèi)擁有較多的輿情監(jiān)控軟件,如紅麥輿情監(jiān)控系統(tǒng)、中國(guó)輿情網(wǎng)PALAS帕拉斯網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)、Goonie網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)、樂思輿情監(jiān)測(cè)系統(tǒng)及軍犬網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)等,各自擁有不同的特點(diǎn),而且在自己的領(lǐng)域擁有較強(qiáng)的數(shù)據(jù)挖掘能力,能夠較快地挖掘需要的信息。目前研發(fā)的輿情監(jiān)控系統(tǒng)更多的是為政府部門和企業(yè)所用,幫助政府了解突發(fā)事件或者輿論熱點(diǎn)情況,幫助合作企業(yè)了解競(jìng)爭(zhēng)對(duì)手產(chǎn)品特性、提供決策意見和制定相關(guān)營(yíng)銷方案。但使用成本較高,對(duì)于一般的公司或者一些高校而言,受制于經(jīng)濟(jì)情況,無(wú)法完整地使用相關(guān)監(jiān)測(cè)軟件。而相關(guān)政府部門對(duì)相關(guān)輿情監(jiān)控后,又缺乏預(yù)測(cè)機(jī)制抑或事件已經(jīng)發(fā)生,當(dāng)信息傳遞到高校時(shí),很有可能為時(shí)已晚。因此,高校自主建設(shè)或擁有獨(dú)立的輿情監(jiān)控與引導(dǎo)方式顯得格外重要,能夠讓較早地了解校內(nèi)學(xué)生對(duì)于社會(huì)熱點(diǎn)事件如何看待及其選擇的新聞信息內(nèi)容或者查找內(nèi)容的傾向性,從而幫助學(xué)校更好地了解學(xué)生對(duì)于群體性事件、社會(huì)熱點(diǎn)事件的了解和看法,并時(shí)刻關(guān)注學(xué)生的個(gè)體健康狀況[3]。
3? ? 大數(shù)據(jù)下校園網(wǎng)絡(luò)媒體監(jiān)控研究
本次研究運(yùn)用爬蟲技術(shù)獲取Web頁(yè)面文本信息9 000余條,其中經(jīng)過(guò)識(shí)別,剔除廣告等數(shù)據(jù),獲得可用數(shù)據(jù)7 000余條。在文本預(yù)處理情況下確定文本關(guān)鍵詞,形成數(shù)據(jù)模型,運(yùn)用賦值法形成敏感閾值范圍。
3.1? 數(shù)據(jù)文本預(yù)處理
本次獲取文本多為短文本,短文本預(yù)處理尤其困難,采用rost分詞軟件將獲取文本進(jìn)行分詞,去除停用詞和無(wú)實(shí)際意義的介詞等進(jìn)行簡(jiǎn)單的文本分詞,透過(guò)分詞可以較為明顯地獲取某一時(shí)段或某一IP查找網(wǎng)絡(luò)信息的特點(diǎn)。結(jié)合詞頻—逆文檔處理(Term Frequency–Inverse Document Frequency,TF-IDF)對(duì)文本信息進(jìn)行整理,不能僅依靠頻率數(shù)據(jù)來(lái)確定文本信息的敏感性[4-5]。例如在高校中擁有心理亞健康狀態(tài)的學(xué)生有很多,甚至隱藏著很多存在心理疾病的人群。針對(duì)此種情況,不能僅依靠文本數(shù)據(jù)頻率來(lái)確定是否敏感,更應(yīng)該將或許頻率較少但卻極為重要的信息進(jìn)行監(jiān)控與分析,因此針對(duì)此類信息更應(yīng)該單獨(dú)關(guān)注。
3.2? 文本信息聚類
結(jié)合文本預(yù)處理、關(guān)鍵詞頻率以及高校學(xué)生重點(diǎn)關(guān)注情況,基于DBSCAN算法[6]形成以下5類文本信息聚類:文體娛樂類、校園生活類、社會(huì)熱點(diǎn)時(shí)事政治類、醫(yī)療健康類。其中文體娛樂類多涉及文化、體育、廣告、明星等各類娛樂新聞。校園生活則包含宿舍、班級(jí)、生活日常、購(gòu)物、社團(tuán)等各類校園內(nèi)的日?;蛴嘘P(guān)校園的各類話題。社會(huì)熱點(diǎn)主要指去除微博熱點(diǎn)中一些娛樂新聞熱點(diǎn)的,包含教育、醫(yī)療、國(guó)家、政治等社會(huì)時(shí)政熱點(diǎn)。醫(yī)療健康則是為了了解當(dāng)前學(xué)生身體狀態(tài)。高校學(xué)生身心日漸成熟,對(duì)于一些不方便對(duì)外公布的疾病往往選擇通過(guò)網(wǎng)絡(luò)查詢,來(lái)了解自身狀態(tài)或?qū)で笾委?,因此,醫(yī)療健康分類包含各類疾病的查詢或各類藥品的查詢。
3.3? 構(gòu)建文本信息三維數(shù)據(jù)模型及賦值
根據(jù)文本信息聚類、網(wǎng)絡(luò)信息傳播中個(gè)人選擇信息方式以及信息平臺(tái)影響范圍,對(duì)各類監(jiān)控信息形成三維數(shù)據(jù)模型,校園網(wǎng)絡(luò)媒體監(jiān)控主要是對(duì)一些輿情的監(jiān)控、對(duì)部分個(gè)人IP非正常信息查詢的監(jiān)控。因此,從內(nèi)容分類來(lái)看文體娛樂往往不在監(jiān)控范圍,每一個(gè)大學(xué)生都有自己的愛好以及自己喜歡的明星,其信息的選擇和傳播往往不會(huì)對(duì)社會(huì)或者校園產(chǎn)生重大輿情的影響。校園生活類是能夠在校園內(nèi)形成輿情的重要信息,尤其是一些管理類的失誤、服務(wù)類的不及時(shí)等,一些很小的事情可能都會(huì)在網(wǎng)絡(luò)上引起軒然大波。社會(huì)熱點(diǎn)中的時(shí)政熱點(diǎn)是了解當(dāng)前青年學(xué)生思想政治認(rèn)識(shí)以及人生觀、價(jià)值觀的重要標(biāo)尺,青年人的選擇、是非的認(rèn)知或者思想上的傾向都應(yīng)該是學(xué)校積極掌握的。醫(yī)療健康類中的傳染類疾病、心理疾病等這些存在隱私的疾病,患者往往選擇網(wǎng)絡(luò)查詢,是可以從網(wǎng)絡(luò)監(jiān)控中了解的。通過(guò)這些手段可以更好地進(jìn)行干預(yù),避免事態(tài)影響擴(kuò)大。
操作方式的選擇是依據(jù)個(gè)人對(duì)信息的認(rèn)知程度和信息傳播的影響程度來(lái)確定,在操作方式中閱讀信息是最基本的信息獲取,而點(diǎn)贊或舉報(bào)是個(gè)人對(duì)信息經(jīng)過(guò)思考后對(duì)其是否認(rèn)可或符合個(gè)人傾向的深度表現(xiàn)。網(wǎng)絡(luò)查詢往往基于百度,而查詢則是對(duì)于個(gè)人而言要進(jìn)一步了解相關(guān)信息的一種表現(xiàn),轉(zhuǎn)發(fā)和評(píng)論是除了個(gè)人認(rèn)知外,更想要向其他人傳遞信息的一種深度表現(xiàn)。
網(wǎng)絡(luò)平臺(tái)的選擇一方面有其個(gè)人喜好的原因,但也存在其傳播目的性影響范圍的選擇。在校園網(wǎng)絡(luò)媒體監(jiān)控中,任何高校都有其值得吐槽的地方,系統(tǒng)允許大家吐槽或追問,但要有意識(shí)地進(jìn)行解釋或者干預(yù),尤其一些在論壇、貼吧、網(wǎng)頁(yè)、公眾號(hào)和微博上宣傳的信息更容易引發(fā)全網(wǎng)的輿情。基于此形成數(shù)據(jù)三維模型(見圖1)。在此模型中當(dāng)數(shù)值超過(guò)5時(shí),定義為“敏感”,需要跟進(jìn)關(guān)注;當(dāng)數(shù)值≥8時(shí),定義為“高度敏感”,需要重點(diǎn)關(guān)注。
4? ? 結(jié)語(yǔ)
在互聯(lián)網(wǎng)覆蓋度極高、移動(dòng)終端普及、信息獲取和發(fā)布更加多元化的情況下,校園對(duì)網(wǎng)絡(luò)參與度極高的青年學(xué)生進(jìn)行網(wǎng)絡(luò)監(jiān)控顯得極為重要,能夠更有效地指導(dǎo)教育方向,重點(diǎn)在于防患于未然。文章提出了網(wǎng)絡(luò)監(jiān)控的一種方式,嘗試運(yùn)用大數(shù)據(jù)對(duì)校園網(wǎng)絡(luò)媒體進(jìn)行監(jiān)控,通過(guò)三維數(shù)據(jù)模型對(duì)獲取的文本信息進(jìn)行處理,得到信息是否值得關(guān)注的結(jié)果。但目前仍然缺乏系統(tǒng)的內(nèi)部監(jiān)控系統(tǒng),對(duì)于隱私的保護(hù)也需要進(jìn)一步加強(qiáng),數(shù)據(jù)信息維度仍有待加強(qiáng)。高校青年學(xué)生是國(guó)家的未來(lái),他們的認(rèn)知、“三觀”傾向關(guān)系著個(gè)人的未來(lái),也關(guān)系著國(guó)家和社會(huì)的未來(lái),高校積極、有效地加強(qiáng)對(duì)青年學(xué)生的教育,尤其是思想政治教育,是時(shí)代賦予的重要?dú)v史使命。
[參考文獻(xiàn)]
[1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.2018年上半年中國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展?fàn)顩r[J].科技中國(guó),2018(9):32-39.
[2]葉云峰,葛啟超.新媒體背景下高校輿論引導(dǎo)研究[J].湖北科技學(xué)院學(xué)報(bào),2016(3):8.
[3]李影溪.高校網(wǎng)絡(luò)媒體的輿論監(jiān)督特性研究[J].陜西教育,2012(1):38-39.
[4]牛萍.TF_IDF與規(guī)則結(jié)合的中文關(guān)鍵詞自動(dòng)抽取研究[D].大連:大連理工大學(xué),2015.
[5]馬宏煒.基于語(yǔ)言網(wǎng)絡(luò)的微博特征發(fā)現(xiàn)和話題關(guān)鍵詞提取[D].杭州:杭州電子科技大學(xué),2014.
[6]楊宇,鄒臣嵩.基于COMET的現(xiàn)代學(xué)徒制職業(yè)能力聚類分析[J].廣東技術(shù)師范學(xué)院學(xué)報(bào),2018(3):74-79.