周曉蕾, 趙剛,李海燕,程曉鳴,黃誠歡
(1 中國移動通信集團上海有限公司,上海 200060; 2 中國移動通信集團公司,北京 100032)
隨著網(wǎng)絡技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)為我們檢索信息、網(wǎng)上購物等一系列日?;顒犹峁┝藰O大便利,可以說成為了現(xiàn)代人生活中難以取代的一部分,可是卻在無形中遭到一些不法分子利用。目前,互聯(lián)網(wǎng)上淫穢色情信息泛濫,已經(jīng)成為一種新型的社會公害。淫穢色情網(wǎng)站提供大量的淫穢色情圖片、錄像、電影、文字,對網(wǎng)絡環(huán)境和未成年人的身心健康構(gòu)成嚴重威脅。
在商業(yè)高度發(fā)展的今天,幾乎所有的活動都與經(jīng)濟利益密不可分。同樣,手機淫穢信息泛濫的主要原因也是為了牟取暴利。其中最明顯最突出的利益鏈條莫過于廣告利益鏈。據(jù)國家掃黃打非辦公室公布的調(diào)查報告稱,把淫穢色情信息包裝成電信增值服務,通過手機用戶購買獲利,是各個利益主體的主要獲利模式之一。同時,廣告經(jīng)營者和手機制造商協(xié)商在手機中內(nèi)置吸費軟件和非法淫穢網(wǎng)站鏈接軟件是另外獲利模式之一。無一例外的,這些不法分子通過傳播手機淫穢色情信息,大發(fā)不義之財。
中國移動響應國家號召,對淫穢信息治理工作非常重視。目前中國移動已完成不良信息監(jiān)測系統(tǒng)一期建設工作,實現(xiàn)了北京、上海和廣東3個大區(qū)集中的人工審核,截至2011年8月底,已發(fā)現(xiàn)并封堵淫穢色情域名432831個,不良信息治理工作已經(jīng)卓有成效。同時,重慶移動對于網(wǎng)站內(nèi)容安全治理工作也十分積極,在IDC部署了低俗內(nèi)容審計系統(tǒng),把域名管理、網(wǎng)站備案狀態(tài)信息、低俗文字及圖片審計等一系列工作融入到了日常的運維當中。
中國移動的不良信息監(jiān)測系統(tǒng)已建成3級架構(gòu),由各省采集設備、大區(qū)設備和中央設備構(gòu)成,其中,大區(qū)設備負責管轄區(qū)域下的不良信息監(jiān)控,分別在Gi接口、IDC出口、國內(nèi)網(wǎng)間出口和國際網(wǎng)間出口進行旁路監(jiān)測,并將監(jiān)測到的不良信息URL地址及IP地址以黑名單的形式,通過中央設備上報給流控系統(tǒng)進行封堵/解封。
2.2.1 標準化問題亟待解決
通過實際的交流和調(diào)研發(fā)現(xiàn),目前三大中心在多個工作環(huán)節(jié)的操作存在標準不清楚或標準不統(tǒng)一的情況,需要根據(jù)整體的管理要求和系統(tǒng)建設要求,為多項工作制定明確的標準。比較有代表性的有:“疑似”不良網(wǎng)站的判定標準、網(wǎng)站的解封標準、封堵驗證的標準等。
2.2.2 封堵系統(tǒng)功能受限
目前,封堵系統(tǒng)由于容量受限,一方面需要增加投資給封堵系統(tǒng)進行擴容,另一方面可以考慮通過設定網(wǎng)站排名系統(tǒng)對網(wǎng)站的訪問量、流量等進行排名,進而能夠在封堵系統(tǒng)容量受限的基礎上,根據(jù)網(wǎng)站的排名設定封堵優(yōu)先級。
2.3.1 爬蟲技術(shù)
網(wǎng)絡爬蟲是一個自動提取網(wǎng)頁的程序,它為搜索引擎從Web上下載網(wǎng)頁,是搜索引擎的重要組成部分,通用網(wǎng)絡爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL列表;在抓取網(wǎng)頁的過程中,不斷從當前頁面上抽取新的URL放入待爬行隊列,直到滿足系統(tǒng)的停止條件。利用爬蟲技術(shù)爬取用戶訪問的頁面,其優(yōu)點是在前臺不需要進行內(nèi)容還原,減少了前臺和后臺分析的數(shù)據(jù)交互;并且在后期的人工/自動取證方面成功率較高。
2.3.2 協(xié)議還原技術(shù)
協(xié)議還原技術(shù)是前端數(shù)據(jù)采集關(guān)鍵技術(shù)之一,主要是對采集的數(shù)據(jù)進行基礎協(xié)議解析及處理,并按照支持的協(xié)議范圍,對數(shù)據(jù)中的文本、圖片數(shù)據(jù)進行還原,獲取其內(nèi)容,同時需要解析出關(guān)聯(lián)的URL域名、訪問URL的源IP地址、目的IP地址、源訪問端口、目的端口、訪問時間、省份標識、采集點標識等信息以供后續(xù)處理。一般是指對用戶的HTTP、WAP等應用協(xié)議的數(shù)據(jù)進行數(shù)據(jù)還原。
2.4.1 識別準確率很低
因為各種技術(shù)上的原因,導致了目前三大監(jiān)測中心使用的監(jiān)測系統(tǒng)發(fā)現(xiàn)的“疑似不良網(wǎng)站”的準確率都非常低,根據(jù)最新的統(tǒng)計數(shù)據(jù)分別為“4%”,“10.6%”和“3%”。過低的準確率,導致了人工審核的工作量大大增加,嚴重影響人工審核效率。進而,過低的準確率給落實“先封堵,后取證”的要求帶來極大的困難。
2.4.2 封堵系統(tǒng)沒有應用基于URL的封堵功能
目前,中國移動的封堵設備已經(jīng)部署,但是針對基于URL的Web頁面的封堵功能并沒有全面采用。因此對一些大型的文庫、圖庫網(wǎng)站,容易因為極少量的不良內(nèi)容而造成整個網(wǎng)站的封堵或者迫于壓力不方便進行封堵。
從技術(shù)上講,基于URL的Web頁面的封堵已經(jīng)基本成熟,但是應用此功能,勢必消耗更多的系統(tǒng)資源,更為迫切的要求對現(xiàn)有系統(tǒng)的處理能力進行升級。
3.1.1 精簡人工操作部分
當前階段,不良信息監(jiān)管流程在多個環(huán)節(jié)中人工操作的比例非常高,而且從事的都是大量的重復化操作。人工操作是制約不良信息監(jiān)管效率的瓶頸,全面精簡人工操作在整個流程中的比例,是提高監(jiān)管水平的關(guān)鍵。
根據(jù)分析,如果相關(guān)系統(tǒng)建設均到位,人的職責主要在于對于特殊網(wǎng)站的取證操作,對于自動處理完成的工作進行確認或抽檢。
3.1.2 監(jiān)測、拔測和封堵系統(tǒng)間的互動
監(jiān)測系統(tǒng)適用部署在網(wǎng)絡流量比較匯聚集中的鏈路上,例如IDC到核心網(wǎng)的鏈路、WAP網(wǎng)關(guān)的接入鏈路、BRAS的接入鏈路等。監(jiān)測系統(tǒng)實時性好,數(shù)據(jù)全面準確,但相對于撥測系統(tǒng)來講,監(jiān)測系統(tǒng)設計比較復雜,項目投資規(guī)模較大。
撥測系統(tǒng)適用于特定的網(wǎng)站和主機掃描識別,目前主要應用于對封堵網(wǎng)站的封堵驗證上,也可應用于其它方面,例如對分布較廣的移動自營網(wǎng)站和CP網(wǎng)站頻道進行掃描,對外省市移動網(wǎng)絡進行掃描抽查等應用。撥測系統(tǒng)的優(yōu)點是組網(wǎng)和系統(tǒng)設計簡單,易于擴容,缺點是不能100%對目標網(wǎng)站內(nèi)容進行抓取分析。
封堵系統(tǒng)在網(wǎng)絡中常與監(jiān)測系統(tǒng)共存,現(xiàn)行的成熟應用是對于黑名單網(wǎng)站、網(wǎng)址、搜索引擎特定關(guān)鍵詞進行封堵。
3.2.1 動態(tài)IP、動態(tài)域名的不良網(wǎng)站封堵策略
對于同時使用動態(tài)IP和動態(tài)域名來變換身份的不良網(wǎng)站,直接針對其IP地址和域名進行封堵,容易使運營商陷入被動。IP和域名的組合變化,會大大降低運營商的封堵系統(tǒng)的效果,不得不頻繁更新黑名單。因此,可以考慮從對提供動態(tài)域名的服務器入手,制定評估的策略。實際觀察表明,為不良網(wǎng)站提供動態(tài)域名服務的服務器,往往在IP地址段和地理位置是具有較強的相關(guān)性。一旦在一臺提供動態(tài)域名的服務器上發(fā)現(xiàn)一個不良網(wǎng)站,很可能意味著該服務器上同時還存在有多個使用動態(tài)域名的不良網(wǎng)站。所以,可以基于一定的組合參數(shù),來對此類服務器進行信譽評估,一旦滿足一定條件,直接對此服務器的IP地址進行封堵。
3.2.2 封堵技術(shù)的提高
一些國際網(wǎng)站的知名度比較高,即使出現(xiàn)了達到判定為不良網(wǎng)站要求的信息數(shù)量,也不方便直接封堵。一些文庫或圖庫類的網(wǎng)站難免有一定數(shù)量的不良信息,完全封堵有些不盡合理。
另外,考慮到封堵系統(tǒng)的容量,對于一些流量極低的不良網(wǎng)站,不適宜采用直接封堵的方式。建議考慮基于客戶端請求的內(nèi)容健康性,引入基于源端IP的動態(tài)封堵功能,短時間內(nèi)禁掉某個IP對某個網(wǎng)站的訪問能力。該功能適合在Gi口引入。建議在封堵系統(tǒng)中全面使用基于Web頁面的封堵技術(shù)。
不妨以處理時長、數(shù)量統(tǒng)計、處理效率、來源渠道4個維度作為KPI指標的衡量。其中,處理時長可以包含不良網(wǎng)站判定平均時長,人工審核平均時長,系統(tǒng)處理平均時長,系統(tǒng)封堵平均時長,正常與中標網(wǎng)站判斷平均時長;數(shù)量統(tǒng)計可以包括中標網(wǎng)站數(shù)量,知名網(wǎng)站中標數(shù)量,封堵與審核網(wǎng)站數(shù)量,封堵域名與IP數(shù)量等;通過人均處理量、網(wǎng)站查準率和網(wǎng)站封堵成功率來衡量處理效率;在來源渠道方面,客戶舉報宗數(shù),舉報域名數(shù),有效域名數(shù),涉黃域名數(shù),曾經(jīng)、新增與二次封堵都能作為考量的項目。
每個大類中包含了詳細的KPI指標,以全方位的衡量不良信息治理的建設情況,同時能夠為今后的建設給出有力的數(shù)據(jù)支撐,能夠通過對豐富KPI的分析,得出發(fā)展中存在的問題,亟待解決的環(huán)節(jié),以及未來的目標等。
在手機淫穢信息治理工作上,三大運營商應該擔負起社會責任,積極采取相應措施,如完善舉報投訴受理流程,加強人工撥測力度,研發(fā)移動互聯(lián)網(wǎng)淫穢色情信息監(jiān)測過濾系統(tǒng),清理不合規(guī)定的WAP網(wǎng)站等。
國內(nèi)圖像識別技術(shù)起步較晚,與國外相比基于內(nèi)容的圖像識別與過濾技術(shù)的研究處于剛剛起步階段。同時,不良圖像的識別準確率還有待提高。此外,對多媒體信息內(nèi)容識別技術(shù)的研究項目也不多,特別是對網(wǎng)絡文化安全及基于高級語義進行系統(tǒng)監(jiān)控的研究。因此,加強產(chǎn)品研發(fā)、加大技術(shù)開發(fā)及創(chuàng)新的力度大有必要。
當前互聯(lián)網(wǎng)用戶的心理與行為表現(xiàn)很大程度上是由于其不負責任或者根本沒有責任追究機制所造成的。因此,網(wǎng)絡實名制作為一種以用戶實名為基礎的互聯(lián)網(wǎng)管理方式,可以成為保護、引導互聯(lián)網(wǎng)用戶的重要手段和制度,并保護青少年免受網(wǎng)絡不良因素影響。雖然在如何推行實名制和推行實名制涉及的范圍等問題上還有爭議,但是推行網(wǎng)絡實名制應當是一個發(fā)展趨勢。網(wǎng)絡空間已經(jīng)成為社會生活現(xiàn)實空間之外的另一個重要行為空間與邏輯空間。為維護一個健康安全的網(wǎng)絡生活環(huán)境,促使每一個為網(wǎng)絡使用者在使用網(wǎng)絡的過程中嚴格的遵守網(wǎng)絡行為規(guī)范,并為自己的網(wǎng)絡行為負責,將實名制引入網(wǎng)絡,在虛擬空間模擬現(xiàn)實社會管理,將是最快捷、最有效的網(wǎng)絡健康安全管理的突破口。在網(wǎng)絡中模擬現(xiàn)實社會的模擬,在網(wǎng)絡推行實名制將增強個人行為的責任意識。
由于互聯(lián)網(wǎng)是一個虛擬世界,它沒有一個明確的邊界,因而國內(nèi)國際合作就顯得尤為重要。從國內(nèi)角度看,三大運營商之間的合作顯得尤為重要,如果仍然保持各自為戰(zhàn)的現(xiàn)狀,勢必會造成監(jiān)管效率低下,標準不統(tǒng)一,這也不利于國家法律的制定與執(zhí)行。站在國際角度上,各個國家都會面臨網(wǎng)絡淫穢信息治理的問題,對于國際間信息的共享就顯得尤為重要,從內(nèi)容上,監(jiān)測出的非法網(wǎng)站列表就可以實現(xiàn)共享,從技術(shù)上,通過共享可以引入國外先進的監(jiān)測技術(shù),同時也可以向其他國家介紹我們采用的技術(shù)手段以共同實現(xiàn)網(wǎng)絡信息的凈化。例如巴西警方根據(jù)“EspiaMule”所搜集到的線索,組織了“Carrossl I”和“Carrossl II”兩次行動,不僅取得了極大的成功,而且還成了其與國內(nèi)外相關(guān)機構(gòu)合作的典范。
總的來說,在手機淫穢色情信息治理工作上,技術(shù)和管理兩個方面需要同步進行,除了加強技術(shù)研究和產(chǎn)品研發(fā),更需要從明確責任、強化意識、合作交流、管理流程上進一步提升與完善,從而達到更好的治理效果。
[1] 陳萍主編. 3G時代治理手機有害信息分析與應對策略[R]. 北京: 北京電信規(guī)劃設計院有限公司, 2010.
[2] 萬曉春主編. 巴西打擊利用互聯(lián)網(wǎng)傳播淫穢電子信息犯罪的舉措[J]. 上海公安高等??茖W校學報, 2010.
[3] 張宇潤主編. 保護青少年免受網(wǎng)絡淫穢色情信息影響的法律對策[Z]. 合肥:安徽大學法學院,2006.
[4] 周立柱,林玲主編. 聚焦爬蟲技術(shù)研究綜述[R]. 北京:清華大學計算機科學與技術(shù)系, 2005.
[5] 劉金紅,陸余良主編. 主題網(wǎng)絡爬蟲研究綜述[R]. 安徽:解放軍電子工程學院, 2007.
[6] 覃安俐主編. 打擊淫穢色情凈化網(wǎng)絡環(huán)境[R]. 成都:成都市公安局網(wǎng)監(jiān)處, 2007.
[7] 羅意歡,葉俊清主編. 論淫穢電子信息犯罪最新展及其監(jiān)管應對[R]. 廣東:廣東省佛山市南海區(qū)人民檢察院, 2011.