陳洪華 張立
摘 要:利用網(wǎng)頁(yè)文本獲取技術(shù),可以建立一種新的網(wǎng)絡(luò)輿情監(jiān)控方法。利用該方法,可以很好地實(shí)現(xiàn)高校網(wǎng)絡(luò)輿情信息的采集、存儲(chǔ)、分析以及應(yīng)答處理,以引導(dǎo)學(xué)生健康成長(zhǎng)。
關(guān)鍵詞:文本獲?。惠浨楸O(jiān)控;高校
輿情是“輿論情況”的簡(jiǎn)稱,是指在一定的社會(huì)空間內(nèi),圍繞中介性社會(huì)事件的發(fā)生、發(fā)展和變化,作為主體的民眾對(duì)作為客體的社會(huì)管理者及其政治取向產(chǎn)生和持有的社會(huì)政治態(tài)度。它是較多群眾關(guān)于社會(huì)中各種現(xiàn)象、問(wèn)題所表達(dá)的信念、態(tài)度、意見(jiàn)和情緒等等表現(xiàn)的總和。隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)媒體作為一種新的信息傳播形式,已深入人們的日常生活。在高校里,由于用戶的知識(shí)層面、對(duì)新事物的接受程度以及網(wǎng)絡(luò)設(shè)備的普及率比較高,網(wǎng)友言論活躍已達(dá)到前所未有的程度,不論是國(guó)內(nèi)還是國(guó)際重大事件,都能馬上形成網(wǎng)上輿論。
一、高校網(wǎng)絡(luò)輿情監(jiān)控的重要性
負(fù)面的網(wǎng)絡(luò)信息往往比正面的網(wǎng)絡(luò)信息傳播的速度更快、范圍更廣、影響更大,高校里亦是如此。負(fù)面的網(wǎng)絡(luò)信息散布者往往都會(huì)借助網(wǎng)絡(luò)來(lái)更快、更廣地表達(dá)其錯(cuò)誤的觀點(diǎn)、傳播其錯(cuò)誤的思想,并借此產(chǎn)生巨大的社會(huì)影響,給當(dāng)事部門、單位造成巨大的輿論壓力。同時(shí),通過(guò)網(wǎng)民的相互轉(zhuǎn)載、轉(zhuǎn)發(fā)、群聊等,錯(cuò)誤的觀點(diǎn)、思想往往會(huì)被放大、發(fā)酵,形成不好的社會(huì)影響,乃至影響整個(gè)社會(huì)的安定生活,使人心惶惶,對(duì)整個(gè)社會(huì)造成重大負(fù)面影響??梢赃@么說(shuō),有時(shí)網(wǎng)絡(luò)載體已然成為負(fù)面輿情信息的放大器。高校里,由于網(wǎng)友的活躍程度很高,有的大學(xué)生甚至有的教職工都會(huì)被負(fù)面的輿情信息所迷惑并“以訛傳訛”,小到影響整個(gè)學(xué)校的正常教學(xué)秩序,大到影響整個(gè)地區(qū)乃至整個(gè)社會(huì)的安定團(tuán)結(jié)。正是由于大學(xué)生、教職工參與程度極高,高校里的網(wǎng)絡(luò)輿情監(jiān)控顯得尤為重要。
二、高校網(wǎng)絡(luò)輿情監(jiān)控的現(xiàn)狀
高校網(wǎng)絡(luò)輿情信息主要包括學(xué)校新聞、通知公告、學(xué)生論壇、學(xué)生博客、OA辦公討論區(qū)以及各留言板等。這些信息往往來(lái)源于不同的部門、單位,一般情況下,學(xué)校新聞?dòng)牲h委宣傳部管理,通知公告由辦公室發(fā)布,學(xué)生論壇、學(xué)生博客由學(xué)生處監(jiān)督,OA辦公討論區(qū)等由現(xiàn)代教育中心搭建、維護(hù)等。由于高校輿情信息來(lái)源于不同部門、單位,造成各部門、單位在輿情監(jiān)管方面“各自為政”,缺乏統(tǒng)一監(jiān)控,極易造成不良信息的廣泛、迅速擴(kuò)散,進(jìn)而造成不良社會(huì)影響,產(chǎn)生巨大的輿論壓力。另外一方面,作為高校決策制定的領(lǐng)導(dǎo)者,想要在某特定時(shí)間段內(nèi)及時(shí)掌握本校所有網(wǎng)絡(luò)輿情信息將變得很難。甚至,個(gè)別分管領(lǐng)導(dǎo)還要通過(guò)與其他分管領(lǐng)導(dǎo)才能獲取相對(duì)比較全面的輿情信息。在此情況下,領(lǐng)導(dǎo)者很難及時(shí)、準(zhǔn)確地應(yīng)對(duì)網(wǎng)絡(luò)上的突發(fā)事件。第三,依照“誰(shuí)建設(shè)、誰(shuí)監(jiān)管”原則,各輿情信息發(fā)布者都應(yīng)該對(duì)各自所發(fā)布的各種信息負(fù)有監(jiān)管職責(zé)??涩F(xiàn)實(shí)情況是,高校里許多單位把網(wǎng)站建設(shè)好,把交流平臺(tái)搭建好后,就陷入“三不管”狀態(tài),即“不更新、不維護(hù)、不監(jiān)管”。這時(shí),在防范負(fù)面的輿情信息時(shí),做不到“及時(shí)關(guān)注、時(shí)刻警惕”的狀態(tài);另外,一旦出現(xiàn)負(fù)面的輿情信息時(shí),都找不到源頭,出現(xiàn)“扯皮”現(xiàn)象。缺乏統(tǒng)一管理,各家“各自為政”,輿情信息監(jiān)管不到位、不及時(shí),監(jiān)管陷入被動(dòng),這是目前一些高校所面臨的現(xiàn)狀。
三、網(wǎng)頁(yè)文本獲取簡(jiǎn)介
網(wǎng)頁(yè)文本獲取,即通過(guò)搜索互聯(lián)網(wǎng)相關(guān)網(wǎng)頁(yè),并對(duì)網(wǎng)頁(yè)上的文本內(nèi)容進(jìn)行抓取。目前,互聯(lián)網(wǎng)搜索主要包括“爬行和抓取”“索引”“搜索詞處理”以及“排序”四個(gè)步驟。即派“蜘蛛”在互聯(lián)網(wǎng)上發(fā)現(xiàn)新網(wǎng)頁(yè)并抓取文件,然后跟蹤該網(wǎng)頁(yè)文件中的鏈接,發(fā)現(xiàn)更多新網(wǎng)頁(yè)并獲取文件;“蜘蛛”在抓取這些文件后,將其分解、分析,并以巨大表格形式存入數(shù)據(jù)庫(kù)。此時(shí),若用戶通過(guò)搜索引擎進(jìn)行網(wǎng)頁(yè)文本搜索,搜索引擎首先對(duì)用戶搜索詞進(jìn)行判斷是否有錯(cuò)別字或拼寫(xiě)錯(cuò)誤等處理后,啟動(dòng)查詢數(shù)據(jù)庫(kù),返回包含搜索詞的頁(yè)面,并根據(jù)排名算法依序呈現(xiàn)。
四、基于網(wǎng)頁(yè)文本獲取的高校網(wǎng)絡(luò)輿情監(jiān)控方法介紹
某個(gè)高校范圍內(nèi),能否有個(gè)小型系統(tǒng)專門負(fù)責(zé)網(wǎng)站信息的監(jiān)管,做到敏感信息“及時(shí)關(guān)注、時(shí)刻警惕”呢?答案是肯定的。本文提出一種基于網(wǎng)頁(yè)文本獲取技術(shù)的網(wǎng)絡(luò)輿情監(jiān)控方法,可方便、實(shí)時(shí)地應(yīng)對(duì)高校范圍內(nèi)的網(wǎng)絡(luò)輿情監(jiān)控。高校網(wǎng)絡(luò)輿情信息主要包括學(xué)校新聞、通知公告、學(xué)生論壇、學(xué)生博客、OA辦公討論區(qū)以及各留言板等,而包含這些網(wǎng)絡(luò)輿情信息的網(wǎng)頁(yè)文本往往部署在高校自己的服務(wù)器上。這樣,我們就可以直接通過(guò)讀取服務(wù)器上網(wǎng)頁(yè)文件的方式進(jìn)行文本判斷,而不需通過(guò)“蜘蛛”進(jìn)行爬行獲取了。解決了文件獲取問(wèn)題后,文本獲取就變得簡(jiǎn)單多了。但是,可能很多網(wǎng)絡(luò)輿情信息是寫(xiě)在網(wǎng)站程序的某個(gè)數(shù)據(jù)庫(kù)中的,服務(wù)器上并沒(méi)有包含該信息的相關(guān)html或htm等文件出現(xiàn)。針對(duì)這種情況,我們可以對(duì)全校所有包含類似于“學(xué)校新聞”“通知公告”“學(xué)生論壇”等等具有“互動(dòng)”性質(zhì)的網(wǎng)站進(jìn)行梳理,得到其數(shù)據(jù)庫(kù)的存儲(chǔ)地址并通過(guò)讀取數(shù)據(jù)庫(kù)的形式進(jìn)行文本獲取。一旦確定各數(shù)據(jù)庫(kù)的存儲(chǔ)地址后,只要不是新增、減少網(wǎng)站或是重新建設(shè)網(wǎng)站,我們就可以“一勞永逸”地進(jìn)行數(shù)據(jù)庫(kù)內(nèi)容的實(shí)時(shí)監(jiān)控。在對(duì)網(wǎng)頁(yè)文件或數(shù)據(jù)庫(kù)內(nèi)容進(jìn)行文本獲取時(shí),我們可以設(shè)置各種特定的詞,通過(guò)文本“截取”方式進(jìn)行過(guò)濾,一旦發(fā)現(xiàn)網(wǎng)頁(yè)文件或數(shù)據(jù)庫(kù)內(nèi)容中出現(xiàn)特定的詞,即可進(jìn)行相關(guān)預(yù)警,并設(shè)置顯示網(wǎng)頁(yè)文件位置或數(shù)據(jù)庫(kù)名稱等。
總結(jié):為維護(hù)學(xué)校正常的教學(xué)、研究秩序,更好地服務(wù)師生,促進(jìn)高校更好、更快地發(fā)展,本文針對(duì)高校里有可能出現(xiàn)的負(fù)面網(wǎng)絡(luò)輿情信息,提出了基于網(wǎng)頁(yè)文本獲取技術(shù)的高校網(wǎng)絡(luò)輿情監(jiān)控方法。通過(guò)該方法,學(xué)校決策制定的領(lǐng)導(dǎo)者,就可以實(shí)時(shí)掌握第一手資料,做到“未雨綢繆”,即使出現(xiàn)負(fù)面網(wǎng)絡(luò)輿情,也可以及時(shí)做到“亡羊補(bǔ)牢”,為阻止或遏制負(fù)面信息擴(kuò)散打下堅(jiān)實(shí)基礎(chǔ),從而為學(xué)生營(yíng)造一個(gè)良好的學(xué)習(xí)環(huán)境。
參考文獻(xiàn):
[1]陳洪華,張立.高校網(wǎng)絡(luò)宣傳教育及網(wǎng)站建設(shè)管理的幾點(diǎn)思考[J].科技信息,2011(34).
[2]徐建華.網(wǎng)絡(luò)搜索引擎原理、特性分析及未來(lái)發(fā)展趨勢(shì)[J].圖書(shū)情報(bào)工作,2000(8).
(1.淮陰工學(xué)院黨委宣傳部,2.淮安信息職業(yè)技術(shù)學(xué)院商學(xué)院)