楊 鶴
(湖北第二師范學(xué)院 計算機學(xué)院, 武漢 430205)
基于人工免疫危險理論的微博輿情預(yù)警方法
楊 鶴
(湖北第二師范學(xué)院 計算機學(xué)院, 武漢 430205)
微博的消息爆炸式傳輸方式使其迅速成為輿情的重要源頭,而其開放性、匿名性也決定了它是謠言和輿情事件滋生的溫床。基于內(nèi)容的網(wǎng)絡(luò)輿情監(jiān)控方式響應(yīng)時間長,隱晦詞、新詞漏網(wǎng)率高,難以監(jiān)控非文字信息。人工免疫系統(tǒng)中的危險理論方法是一種通過監(jiān)測變化發(fā)現(xiàn)異常的自適應(yīng)方法,通過監(jiān)控發(fā)帖率、評論量等微博相關(guān)參數(shù)的改變,在輿情事件萌芽階段及時發(fā)現(xiàn)危險并提出預(yù)警,為微博輿情監(jiān)控提供新思路。
人工免疫;危險理論;輿情監(jiān)控;微博
微博作為一種典型的網(wǎng)絡(luò)社交應(yīng)用,自2006年誕生以來迅速成為虛擬世界中重要的信息傳播工具。2016年1月CNNIC發(fā)布的《第37次中國互聯(lián)網(wǎng)發(fā)展狀況統(tǒng)計報告》[1]顯示,2015年我國網(wǎng)絡(luò)社交應(yīng)用用戶已達53001萬,其中微博用戶占社交應(yīng)用使用率的33.5%,僅次于qq空間。與qq空間分享個人生活狀態(tài)不同,微博具備更廣泛的信息傳播能力。在突發(fā)事件等重大事件的傳播過程中,微博日益成為重要的平臺和推手[2],如何有效應(yīng)對微博輿情,掌握話語權(quán),成為當下亟需面對和解決的重要課題。與傳統(tǒng)紙媒及網(wǎng)絡(luò)新聞媒體相比,微博發(fā)布的信息隨意性大、真實性難以保證、且傳播速度快、傳播范圍廣(呈爆炸式增長),這使得微博輿情具有不確定性、不可控性等特點。
與普通網(wǎng)絡(luò)輿情相比,微博輿情傳播速度更快、影響面更廣,目前常用的網(wǎng)絡(luò)輿情監(jiān)控技術(shù)主要是基于內(nèi)容的,即通過設(shè)置敏感詞和關(guān)鍵詞的方式從抓取網(wǎng)頁,通過解析、清洗和分詞后,挖掘關(guān)鍵詞并將其與詞庫進行比對[3],這類方法在以下幾個方面還存在改進空間:(1)響應(yīng)時間長,難以適應(yīng)微博信息的爆炸式傳播(2)新詞、刻意經(jīng)過隱藏的“未知”關(guān)鍵詞漏網(wǎng)率高(3)難以監(jiān)控圖片、音頻、視頻等非文本信息。如何自動發(fā)現(xiàn)微博輿情事件的 “危險信號”,在最短的時間予以響應(yīng)是微博輿情預(yù)警要解決的關(guān)鍵問題。鑒于微博的個體化差異和動態(tài)性,難以用設(shè)置固定閾值的方式來判斷哪種狀態(tài)“危險”,哪種狀態(tài)“安全”,必須尋找一種能實現(xiàn)智能判定與預(yù)警的方法。
人工免疫系統(tǒng)(Artificial Immune Systems, AIS),是借鑒人體免疫系統(tǒng)檢測未知入侵(病毒)的基本原理,建立的一種自適應(yīng)檢測未知異常的智能系統(tǒng)。從1996年美國學(xué)者Forrest首次提出 “人工免疫系統(tǒng)”的概念以來,它已經(jīng)成為人工智能領(lǐng)域的理論和應(yīng)用研究熱點之一[4],目前全世界已有超過二十個國家,三十個研究組致力于人工免疫領(lǐng)域的研究。
“危險理論”是AIS的一個分支,它的觀點是:發(fā)現(xiàn)機體產(chǎn)生異常變化時的“危險信號”、檢測“異常變化”是否對機體構(gòu)成威脅(Uncomfortable),進而抑制有害的“變化”[5]。實際上微博在重大輿情事件萌芽之初所表現(xiàn)出的“變化”與人體在感染病原體時所表現(xiàn)出的變化非常相似,借鑒人工免疫系統(tǒng)的“危險理論”原理,定義、提取、計算和融合微博狀態(tài)的“危險信號”[6],進而研究基于人工免疫的微博輿情預(yù)警方法,可為微博輿情預(yù)警,提供新的思路。
微博輿情預(yù)警是建立在微博狀態(tài)的采集和處理基礎(chǔ)上的,這就需要建立一整套分析框架,包括微博狀態(tài)變化數(shù)據(jù)的采集、數(shù)據(jù)預(yù)處理、危險輿情監(jiān)測、預(yù)警等。該模型是一個多層式結(jié)構(gòu),每層需保持一定的獨立性,實現(xiàn)整體的柔性結(jié)構(gòu)。因而需要研究模型體系結(jié)構(gòu)的層次劃分、層次功能結(jié)構(gòu)、數(shù)據(jù)處理流程等。
基于人工免疫危險理論的微博輿情預(yù)警模型體系結(jié)構(gòu)如圖1所示,劃分為3層。其中,第一層部署微博狀態(tài)采集器,依據(jù)采集策略實現(xiàn)對微博狀態(tài)數(shù)據(jù)進行采集。第二層是人工免疫判定層,包括變化檢測裝置,采用基于微分的危險信號發(fā)現(xiàn)方法對微博狀態(tài)指標中的“變化”進行計算和檢測,提取出的各類危險信號經(jīng)信號融合與危險判定裝置進行融合計算,得到當前是否存在危險輿情的判定,并將預(yù)警信息提交輿情分析層。輿情分析層根據(jù)危險預(yù)警,捕獲相關(guān)危險博文,依據(jù)危險預(yù)警的等級對其進行敏感詞捕捉分析和人工分析,提出輿情預(yù)警警告。
圖1 基于人工免疫危險理論的微博輿情預(yù)警模型
如何鑒別微博狀態(tài)的異常,是微博輿情發(fā)現(xiàn)的關(guān)鍵?!拔kU理論”是人工免疫系統(tǒng)中一個較新的分支,其核心思想是通過感知機體在異常狀態(tài)下發(fā)出的“危險信號”,激活免疫細胞進行異常判定,從而有效地避免海量數(shù)據(jù)的檢索和識別。將“危險理論”用于微博輿情異常發(fā)現(xiàn),關(guān)鍵問題是確定什么是指示微博狀態(tài)異常的“危險信號”。
一切事物在正常運轉(zhuǎn)時都是有規(guī)律可循的,例如微博用戶的訪問量、關(guān)注度、被轉(zhuǎn)帖數(shù)等指標處于平衡狀態(tài)(均勻的變化可以看做相對靜止)。一旦有重大輿情事件發(fā)生時,上述各種指標勢必發(fā)生變化,平衡被打破。這些變化就是引起免疫反應(yīng)的“危險信號”。
1.危險信號的表達、提取、計算
危險信號來源于微博狀態(tài)的各種變化,微博是人類人際交往關(guān)系在網(wǎng)絡(luò)社區(qū)中的映射,正如現(xiàn)實社會中個人的交際圈子相對固定一樣,正常發(fā)文及交互的微博,其博主的粉絲數(shù)、關(guān)注度,博文的轉(zhuǎn)發(fā)量、評論量應(yīng)該遵循一定的規(guī)律,保持相對穩(wěn)定(或稱之為“相對靜止”)。若某博主發(fā)出博文“爆料”或有水軍刻意操縱,則短時間內(nèi)該博的相關(guān)指標會偏離正常軌道,產(chǎn)生不同于常態(tài)的“變化”。
初步確定需采集的微博狀態(tài)指標包括:微博點擊率、粉絲數(shù)、單位時間的轉(zhuǎn)發(fā)量、評論量、博主排名指數(shù)等等。一段時間內(nèi),微博狀態(tài)數(shù)據(jù)構(gòu)成一個多維空間上的曲線,當輿情事件發(fā)生時,微博狀態(tài)產(chǎn)生變化,形態(tài)曲線發(fā)生較大改變。通過研究微博狀態(tài)數(shù)據(jù)的多維形態(tài)曲線,可以提取指示微博輿情異常的危險信號。
數(shù)學(xué)中用導(dǎo)數(shù)和微分描述變化,對于微博狀態(tài)的變化,本文擬借鑒微分學(xué)的方法表達危險信號。設(shè)V是微博狀態(tài)指標的集合,V=G(R)={g1(R),g2(R),…,g1(R)},其中v1=g1(R),v2=g2(R)…vn=gn(R)。R是觀察微博狀態(tài)的參照系,則總體的微博狀態(tài)變化
微博指標V相對于參照系R的變化可表示為
2.危險信號識的融合及預(yù)警的判定
免疫學(xué)中識別危險信號并判定機體是否危險,是否需要提呈抗原的是抗原提呈細胞。借鑒抗原提呈細胞的原理,可構(gòu)建人工抗原提呈細胞識別危險信號。針對上述描述每一個危險信號,定義一個相應(yīng)的抗原提呈細胞受體,構(gòu)成細胞種群。定義每種危險信號的危險級別,當危險達到一定的程度時候,激活相應(yīng)的識別細胞進行判定。由于微博狀態(tài)是個復(fù)合指標,由各種分指標組成,即判斷是否存在危險的微博輿情需要對多個危險信號進行融合,這就需要通過細胞種群的演化,盡可能覆蓋到整個微博狀態(tài)空間。借鑒生物繁衍過程中的遺傳、雜交、變異原理,可實現(xiàn)相應(yīng)的演化策略。
微博是輿情傳播的重要源頭,基于內(nèi)容和關(guān)鍵詞的輿情預(yù)警方式響應(yīng)時間長,難以發(fā)現(xiàn)隱匿性關(guān)鍵詞和新詞,且難以發(fā)現(xiàn)通過非文本信息傳播的輿情。借鑒計算機免疫系統(tǒng)中的“危險理論”方法對微博關(guān)鍵指標的變化進行自適應(yīng)的實時監(jiān)控,可不依賴文本內(nèi)容和關(guān)鍵詞的匹配,為實現(xiàn)重大輿情事件的自動發(fā)現(xiàn)和預(yù)警提供新的思路。
[1]第37次中國互聯(lián)網(wǎng)發(fā)展狀況統(tǒng)計報告[Z].2016.02.
[2]中國社會輿情與危機管理報告(2012)[Z].2012.08.
[3]高承實,榮星,陳越.微博輿情監(jiān)測指標體系研究[J].情報雜志,2011,(9).
[4]FORRESTS,BEAUCHEMINC.Computerimmunology[J].ImmunolRev, 2007, 216: 176-197.
[5]AICKELINU,GREENSMITHJ.Sensingdanger:Innateimmunologyforintrusiondetection[J].InformationSecurityTechnicalReport, 2007, 12(4): 218 -227.
[6]LIANGY,YANGHe,LiTao,etal.Adifferentialcoefficientinspiredmethodformalicioussoftwaredetection;proceedingsof3rdInternationalSymposiumonIntelligentInformationTechnologyApplication,IITA2009,November21, 2009-November22, 2009,NanChang,China, 2009 [C].IEEEComputerSociety.
責任編輯:彭雷生
Precaution Mechanism for Public Opinion on Microblog Based on Artificial Immune Danger Theory
YANG He
(School of Computer,Hubei University of Education, Wuhan 430205, China)
With explosive transmission of information, microblog has quickly become the source of public opinion, while it’s also a hotbed of rumors and public opinion event for its openness and anonymity. Public opinion monitor mode based on content is characterized by long response time, high failure in capturing disguised and new words, and difficulty in monitoring non-word information. Danger theory of artificial immune system is an adaptive method which finds abnormal event through variation control by monitoring related parameters of microblog, such as posting rate and comment. This method can make early warning at the cradle of public opinion event and provide a new thought on monitoring public opinion on microblog.
artificial immune; danger theory; monitor public opinion; microblog
2016-08-02
湖北省教育廳人文社會科學(xué)研究項目(14G441)
楊 鶴(1980-),女,湖北武漢人,副教授,博士,研究方向為人工免疫學(xué)。
C931
A
1674-344X(2016)10-0126-03