摘 要:移動(dòng)網(wǎng)絡(luò)的普及,豐富了人們網(wǎng)上沖浪的方式,提高了網(wǎng)絡(luò)使用效率,促進(jìn)了互聯(lián)網(wǎng)的發(fā)展,也給網(wǎng)絡(luò)信息管理提出更高的要求。移動(dòng)互聯(lián)網(wǎng)絡(luò)信息安全問題已經(jīng)引起政府部門和社會(huì)各界的普遍關(guān)注。文章圍繞移動(dòng)互聯(lián)網(wǎng)不良信息監(jiān)測(cè)技術(shù)有關(guān)問題進(jìn)行討論,介紹了移動(dòng)網(wǎng)絡(luò)不良信息過濾方法和主要應(yīng)用技術(shù),討論了信息過濾監(jiān)測(cè)系統(tǒng)基本要素。
關(guān)鍵詞:不良信息監(jiān)測(cè)系統(tǒng);爬蟲技術(shù);網(wǎng)絡(luò)協(xié)議解析技術(shù);CMNET
引言
隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)等學(xué)科的不斷發(fā)展,以智能手機(jī)、平板電腦等設(shè)備為用戶終端的移動(dòng)網(wǎng)絡(luò)日益繁榮。與此同時(shí),移動(dòng)、電信等通訊服務(wù)供應(yīng)商提供了許多種上網(wǎng)業(yè)務(wù),進(jìn)一步促進(jìn)了移動(dòng)互聯(lián)網(wǎng)的發(fā)展。移動(dòng)互聯(lián)網(wǎng)的出現(xiàn)與成長(zhǎng),在促進(jìn)了互聯(lián)網(wǎng)整體發(fā)展的同時(shí),其開放性的訪問機(jī)制、種類繁多的信息資源和上網(wǎng)用戶移動(dòng)性高等特點(diǎn)給移動(dòng)互聯(lián)網(wǎng)的管理,特別是信息管理方面帶來了更大的困難。大量不良信息利用移動(dòng)互聯(lián)網(wǎng)的管理寬松的條件在網(wǎng)上迅速傳遞,污染了網(wǎng)絡(luò)環(huán)境,給國家安全、經(jīng)濟(jì)建設(shè)、社會(huì)和諧乃至個(gè)人切身利益都造成了嚴(yán)重?fù)p害。加強(qiáng)移動(dòng)互聯(lián)網(wǎng)信息監(jiān)測(cè)管理,營(yíng)造純凈的網(wǎng)絡(luò)環(huán)境,是我國有中國特色的社會(huì)主義事業(yè)順利推進(jìn)、經(jīng)濟(jì)體制改革深入實(shí)施、實(shí)現(xiàn)國家富強(qiáng)和社會(huì)穩(wěn)定的重要保障措施。
1 移動(dòng)網(wǎng)絡(luò)不良信息過濾方法
移動(dòng)互聯(lián)網(wǎng)運(yùn)行機(jī)制和容納的信息種類較多。實(shí)際工作中,根據(jù)網(wǎng)絡(luò)運(yùn)行機(jī)制和監(jiān)督的內(nèi)容種類的不同采用不同方法予以過濾、監(jiān)督。常見的移動(dòng)互聯(lián)網(wǎng)不良信息過濾方法有以下幾種。
1.1 分級(jí)法
通過將互聯(lián)網(wǎng)上的信息按照一定標(biāo)準(zhǔn)進(jìn)行分級(jí)、分類,然后根據(jù)各自的級(jí)別采用針對(duì)性的處置措施的網(wǎng)絡(luò)信息管理方法稱之為分級(jí)法。納入分級(jí)體系的網(wǎng)頁都會(huì)得到一個(gè)分級(jí)標(biāo)記,當(dāng)用戶訪問該網(wǎng)頁時(shí)將其與過濾模板進(jìn)行比較進(jìn)而選址處置方案。
1.2 依據(jù)URL的站點(diǎn)過濾技術(shù)
和分級(jí)法不同的是,站點(diǎn)過濾技術(shù)采用的是以站點(diǎn)為監(jiān)測(cè)對(duì)象。該方法的前置要件是要有一個(gè)不良站點(diǎn)列表。系統(tǒng)通過對(duì)比用戶訪問站點(diǎn)的URL和列表中站點(diǎn)進(jìn)行對(duì)比來決定是否過濾。因此,不良站點(diǎn)列表越齊全、越準(zhǔn)確,那么該方法的執(zhí)行效率和質(zhì)量也就越高?;赨RL的站點(diǎn)過濾技術(shù)是當(dāng)前主流互聯(lián)網(wǎng)不良信息監(jiān)測(cè)方法,廣泛應(yīng)用于國內(nèi)、外的網(wǎng)絡(luò)信息過濾產(chǎn)品中。使用該方法,重點(diǎn)是對(duì)不良站點(diǎn)列表的維護(hù)和整理。
1.3 依據(jù)內(nèi)容關(guān)鍵字的過濾技術(shù)
該項(xiàng)技術(shù)是人工智能技術(shù)在網(wǎng)絡(luò)管理方面的一個(gè)重要應(yīng)用。由于單純對(duì)比關(guān)鍵字而忽視語境、語義的影響,使得關(guān)鍵字過濾技術(shù)的錯(cuò)誤率較高,嚴(yán)重影響用戶上網(wǎng)體驗(yàn)。因此,通過應(yīng)用人工智能技術(shù)將語義分析引入網(wǎng)絡(luò)信息關(guān)鍵字過濾工作中,以提高分析判斷精度。但該技術(shù)缺陷也較為明顯,主要是實(shí)行效果和人工智能技術(shù)水平直接相關(guān)。由于當(dāng)前人工智能技術(shù)還不夠完善,用戶不能自定義問題判定標(biāo)準(zhǔn)。所以該方法在實(shí)際工作中產(chǎn)品較少,主要應(yīng)用于某些特定領(lǐng)域,同時(shí)需要消耗大量計(jì)算機(jī)資源。
1.4 其他信息過濾的方法
除了上述方法外,下面兩種方法也較為常用。
一個(gè)是圖像識(shí)別技術(shù)。該技術(shù)以圖像的色彩、深淺、形狀和彼此間的位置關(guān)系為對(duì)比要素,將用戶訪問的圖像和數(shù)據(jù)庫中的標(biāo)準(zhǔn)圖像進(jìn)行對(duì)比,根據(jù)二者間的相似度決定目標(biāo)圖像的處理方案。由于圖像描述精確程度較低,在應(yīng)用過程中會(huì)造成一定程度的誤判,實(shí)際使用效果水平不高,有待繼續(xù)開發(fā)。
二是動(dòng)態(tài)跟蹤技術(shù)。該技術(shù)通過對(duì)用戶訪問網(wǎng)絡(luò)情況的跟蹤記錄,實(shí)現(xiàn)對(duì)用戶上網(wǎng)行為的全程監(jiān)控,并以此為依據(jù)改進(jìn)信息監(jiān)控、過濾相關(guān)方案。記錄的內(nèi)容包括訪問的時(shí)間、網(wǎng)頁、流量、出錯(cuò)情況、屏幕快照、過濾原因、網(wǎng)頁所屬類目、關(guān)鍵詞等內(nèi)容。
2 不良信息監(jiān)測(cè)系統(tǒng)主要應(yīng)用技術(shù)
2.1 爬蟲技術(shù)
顧名思義,爬蟲技術(shù)就是利用半自動(dòng)程序?qū)ヂ?lián)網(wǎng)上網(wǎng)頁信息進(jìn)行采集,由于其情形如同爬蟲在物體上爬行一般,所以將這種程序稱之為爬蟲。爬蟲程序在啟動(dòng)時(shí),需要一個(gè)初始鏈接,如同爬蟲爬行的出發(fā)點(diǎn),其后爬蟲程序進(jìn)入自動(dòng)運(yùn)行,自動(dòng)決策其“旅行”路線,這也是爬蟲程序半自動(dòng)化的主要特征。爬蟲程序會(huì)對(duì)起始頁面進(jìn)行掃描,經(jīng)由頁面中包含的鏈接訪問其他頁面,然后再對(duì)新頁面的鏈接進(jìn)行掃描,從而去往下一個(gè)頁面。單純從理論而言,只要條件允許,爬蟲程序訪問到互聯(lián)網(wǎng)上所有頁面。這是因?yàn)榛ヂ?lián)網(wǎng)上的頁面彼此間或多或少都會(huì)有鏈接存在。爬蟲技術(shù)的優(yōu)點(diǎn)是通過爬蟲程序的自動(dòng)運(yùn)行,可以通過獲取URL最大限度的對(duì)網(wǎng)頁、網(wǎng)站上的各類信息,比如文本、圖片和音頻、視頻等進(jìn)行下載分析,從而達(dá)到主動(dòng)監(jiān)控網(wǎng)站的目的。但由于該技術(shù)依賴爬蟲程序的正常有效運(yùn)行,一旦網(wǎng)站環(huán)境采用對(duì)爬蟲程序進(jìn)行限制的技術(shù),比如用戶驗(yàn)證碼、反爬蟲技術(shù)等,其監(jiān)測(cè)效果就會(huì)大幅下降。
2.2 網(wǎng)絡(luò)協(xié)議解析技術(shù)
該技術(shù)是建立在網(wǎng)絡(luò)協(xié)議采用層次開發(fā)方式的基礎(chǔ)上的。網(wǎng)絡(luò)協(xié)議在開發(fā)過程中,每一層開發(fā)都有其特定的開發(fā)目的。網(wǎng)絡(luò)協(xié)議技術(shù)就是針對(duì)互聯(lián)網(wǎng)網(wǎng)絡(luò)層和應(yīng)用層中涉及的各類協(xié)議進(jìn)行分析,進(jìn)而處置的技術(shù)。監(jiān)控系統(tǒng)對(duì)數(shù)據(jù)網(wǎng)出口電路的網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行采集,并采用報(bào)文重組、協(xié)議規(guī)則分析等技術(shù)手段對(duì)信息進(jìn)行分析,判斷其安全合法性,以此為基礎(chǔ)開展監(jiān)控工作。實(shí)施該技術(shù)需要配套使用協(xié)議還原設(shè)備,以達(dá)到解析還原、審核網(wǎng)絡(luò)中上下行數(shù)據(jù)內(nèi)容的目的。該技術(shù)應(yīng)用范圍較廣,可以用于網(wǎng)頁、彩信、文件傳輸、郵件等多種業(yè)務(wù)內(nèi)容的信息監(jiān)測(cè)。但受監(jiān)控工作運(yùn)作機(jī)理所限,只能采用被動(dòng)的監(jiān)控模式,同時(shí),監(jiān)控行為對(duì)協(xié)議解析設(shè)備依賴性較大,不同設(shè)備間不能通用。
3 移動(dòng)網(wǎng)絡(luò)不良信息監(jiān)測(cè)系統(tǒng)功能簡(jiǎn)介
CMNET網(wǎng)絡(luò)是移動(dòng)互聯(lián)網(wǎng)的主要架構(gòu)形式,當(dāng)用戶使用移動(dòng)終端對(duì)移動(dòng)互聯(lián)網(wǎng)進(jìn)行訪問時(shí),監(jiān)控系統(tǒng)對(duì)用戶訪問和傳遞的信息進(jìn)行采集和監(jiān)測(cè),并按照一定標(biāo)準(zhǔn)進(jìn)行對(duì)比、篩選,從中選出不良內(nèi)容。篩選過程包括系統(tǒng)自動(dòng)篩選和人工篩選兩個(gè)環(huán)節(jié),這種篩選方法既保證篩選速度又保證篩選質(zhì)量。對(duì)于最終確定的不良信息,將其所屬網(wǎng)站的URL列入黑名單,在依照黑名單進(jìn)行封堵處理,阻止用戶對(duì)其訪問。不良信息監(jiān)測(cè)系統(tǒng)采用中央、大區(qū)、前端采集三級(jí)架構(gòu)體系,首先由前端采集點(diǎn)進(jìn)行信息采集,信息報(bào)送至大區(qū)設(shè)備進(jìn)行分析、判斷,再由將所獲取的不良網(wǎng)站URL及IP地址相關(guān)信息以黑名單形式匯總之中央設(shè)備。中央設(shè)備收到各大區(qū)設(shè)備報(bào)送的黑名單后進(jìn)行匯總和除重作業(yè),形成全網(wǎng)范圍的黑名單,將其提交給流控系統(tǒng),由其進(jìn)行封堵。需要注意的是,如果有網(wǎng)站需要解封處理,也要由中央設(shè)備提交名單給流控系統(tǒng)進(jìn)行解封作業(yè)。
4 結(jié)束語
互聯(lián)網(wǎng)產(chǎn)業(yè)是現(xiàn)代社會(huì)重要的朝陽產(chǎn)業(yè)。它的健康發(fā)展,不僅關(guān)系到國民經(jīng)濟(jì)總體發(fā)展?fàn)顩r,同時(shí)對(duì)于人們的思想、行為習(xí)慣乃至社會(huì)公共道德等主管層面的表現(xiàn)都有著密切的影響。加強(qiáng)移動(dòng)互聯(lián)網(wǎng)不良信息監(jiān)控,維護(hù)網(wǎng)絡(luò)世界的安定和諧,是推動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)順暢發(fā)展的重要舉措。隨著技術(shù)水平的提高,移動(dòng)互聯(lián)網(wǎng)不良信息監(jiān)控技術(shù)勢(shì)必會(huì)更加完善,監(jiān)控系統(tǒng)的運(yùn)行也會(huì)更加成熟。我們有理由相信,移動(dòng)互聯(lián)網(wǎng)的明天一定會(huì)更好。
參考文獻(xiàn)
[1]蔣曉琳,黃紅艷.移動(dòng)互聯(lián)網(wǎng)安全問題分析[J].電信網(wǎng)技術(shù),2009.
[2]曲德祥,唐新亭,徐連誠,等.網(wǎng)絡(luò)信息過濾系統(tǒng)研究綜述[J].山東師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007.