• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于BP神經網絡的突發(fā)傳染病輿情熱度趨勢預測模型研究

      2018-07-11 09:51:06曾子明黃城鶯
      現代情報 2018年5期
      關鍵詞:預測模型BP神經網絡微博

      曾子明 黃城鶯

      〔摘要〕[目的/意義]研究突發(fā)傳染病輿情熱度的發(fā)展趨勢,能夠為制定輿情引導策略提供參考,具有重要的理論意義。[方法/過程]本文首先構建微博輿情熱度評價指標體系,基于信息熵確定各個指標的權重,然后對求得的輿情熱度趨勢值進行分類,在此基礎上,建立基于BP神經網絡的突發(fā)傳染病輿情熱度趨勢預測模型。以新浪微博為例,選取“MERS病毒衛(wèi)生突發(fā)事件”的輿情熱度數據進行實例分析,預測該突發(fā)傳染病事件的發(fā)展趨勢,從而驗證模型的可行性。[結果/結論]實驗結果表明,該模型能有效預測突發(fā)傳染病輿情熱度趨勢,進而為輿情管控提供決策支持。

      〔關鍵詞〕BP神經網絡;輿情熱度;突發(fā)傳染??;微博;預測模型

      DOI:10.3969/j.issn.1008-0821.2018.05.006

      〔中圖分類號〕G2062〔文獻標識碼〕A〔文章編號〕1008-0821(2018)05-0037-08

      〔Abstract〕[Purpose/Significance]It is of great theoretical significance to study the development trend of public opinion in emergent infectious diseases,which can provide reference for making public opinion guidance strategy.[Method/Process]The paper first constructed the index system of microblog public opinion and evaluated the weight of each index based on the information entropy,and then classified the obtained public opinion heat trend,on the base of which,it established the public opinion heat trend prediction model of emergent infectious diseases bases on BP neural network.Taking Sina microblog as an example,it analyzed the public opinion heat data of“MERS virus”to predict the development trend of the emergent infectious disease event,and verified the feasibility of the model.[Result/Conclusion]The experimental results showed that the model could effectively predict the trend of public opinion in emergent infectious diseases,and then provide decision support for public opinion control.

      〔Key words〕BP neural network;heat of public opinion;emergent infectious diseases;microblog;prediction model

      據中國互聯網絡信息中心(CNNIC)發(fā)布的《第40次中國互聯網絡發(fā)展狀況統計報告》顯示,截至2017年6月,我國互聯網普及率較2016年底提升了11個百分點,達到543%,超過全球平均水平46個百分點[1]。在互聯網迅猛發(fā)展的環(huán)境下,國際范圍內頻繁發(fā)生的突發(fā)傳染病引起人們高度關注,如“埃博拉病毒”、“塞卡病毒”、“SARS病毒”、“MERS病毒”等。微博作為傳播媒介的代表,具有互動性高、傳播速度快等特點,突發(fā)傳染病事件借助新浪微博等社交平臺不斷發(fā)酵,往往迅速演化為網絡輿情。以2014年西非爆發(fā)的埃博拉病毒為例,在2014年2月1日至10月31日期間,新浪微博平臺上共產生23萬多條包含“埃博拉”關鍵詞的微博[2]。在描述突發(fā)傳染病輿情的諸多要素中,輿情熱度體現了人們對于輿情事件的關注程度,日益受到政府以及學術界的廣泛關注。

      突發(fā)傳染病輿情同其他類型突發(fā)事件輿情相較而言,具有爆發(fā)性、演變不確定性、負面傾向性等特征。由于涉及公眾的健康和生命安全,社會公眾高度關注致病原因、每日新增病例數、死亡率、治愈情況等與之相關的信息。相關消息一旦發(fā)出就會掀起網絡輿情的浪潮,引起整體輿論環(huán)境的波動,其輿情發(fā)展的管控已經成為應急管理的一個重要組成部分?;诖?,本文結合徐旖旎[3]對媒體奇觀網絡輿情熱度趨勢分析以及趙磊、王松等[4]對輿情熱度趨勢仿真模型的研究思路,將突發(fā)傳染病輿情熱度趨勢預測問題轉化為模式分類問題,并嘗試引入BP神經網絡對輿情熱度趨勢做預測。首先,文章構建面向微博的輿情熱度評價指標體系,基于信息熵確定各個指標的權重,再利用加權求和的方法得到熱度值,然后求出輿情熱度趨勢值并進行分類,接著引入BP神經網絡理論,從新浪微博收集“MERS病毒衛(wèi)生突發(fā)事件”相關數據,對突發(fā)傳染病的輿情熱度趨勢進行預測,探討該方法的可行性和有效性。

      1研究現狀

      11網絡輿情熱度研究

      網絡輿情熱度研究是一門涉及情報學、統計學、傳播學等多學科交叉融合的研究領域。當前,國內外學者針對網絡輿情熱度的研究分為定性研究、定量研究以及定性定量相結合方法。其中,定性研究包含網絡輿情熱度發(fā)展演變規(guī)律、特征、熱度評價指標體系建立等,定量研究包含最優(yōu)化模型、系統動力學模型、馬爾可夫鏈模型等。Lean Yu等[5]提出了以網絡公民、意見領袖、政府以及大眾媒體四大主體為代表的網絡輿情傳播模型,并通過4起典型的危險化學品泄漏事件進行案例研究,驗證模型的有效性;張行欽等[6]使用百度指數,研究了“乙肝疫苗”事件網絡輿情熱度演變規(guī)律;Jeffrey R Lax等[7]根據突發(fā)事件網絡輿情生成過程、熱度漲落的影響因素,提出了較為成熟的輿情熱度指標。曹學艷等[8]引入突發(fā)事件應對等級,構建了網絡輿情熱度評價指標體系;王慧軍等[9]通過最小化輿情熱度的負面作用與監(jiān)控成本之和,研究了政府對輿情熱度的最優(yōu)監(jiān)控問題;袁國平等[10]借助系統動力學的流圖模型,通過Vensim PIE軟件進行模擬仿真,從事件公共度、事件敏感度、網民質疑度、政府公信力4個方面分析對網絡輿情熱度的影響;屈啟興等[11]給出了基于微博的企業(yè)網絡輿情熱度的計算公式,在此基礎上提出基于馬爾可夫鏈的輿情熱度趨勢分析模型;王新猛[12]構建了針對政府負面網絡輿情熱度趨勢的馬爾可夫鏈預測模型。Xue Gang Chen等[13]運用粗糙集理論降低網絡輿情指標體系的屬性,并通過層次分析法確定指標權重,從定量和定性的角度出發(fā),提出一種網絡輿情趨勢預測與評價的新方法。

      12我國突發(fā)傳染病輿情研究

      我國對于突發(fā)傳染病輿情的研究始于2003年的SARS事件。目前,相關研究主要包括輿情傳播規(guī)律、輿情監(jiān)測預警和輿情引導治理3個方面。安璐等[2]以埃博拉(Ebola)有關的微博為調查對象,利用LDA模型和SOM方法比較分析了Twitter和Weibo平臺上相關微博的熱點主題類別,揭示其演化模式和時序發(fā)展趨勢的異同點;靳松等[14]以H7N9禽流感事件為研究對象,通過采集到的數據生成H7N9信息傳播網絡拓撲結構圖,并基于其鄰接矩陣,系統分析傳播網絡的要素和內部簇結構特性;安璐等[15]以“塞卡病毒”的微博數據為研究樣本,利用潛在狄利克雷模型識別微博內容的主題特征,同時結合用戶特征和發(fā)布時間特征,構建決策樹模型,對突發(fā)傳染病微博影響力進行預測;杜洪濤等[16]以新浪微博社區(qū)中MERS疫情數據為樣本,研究如何改善突發(fā)性傳染病輿情中的公共管理溝通問題;翁士洪等[17]以H7N9事件為例,探討微博謠言的產生機制,并結合現有文獻資料和現實狀況,提出針對性的治理對策。

      綜上所述,雖然國內外已經有諸多學者對網絡輿情熱度展開研究,涵蓋了從演變規(guī)律、評價指標到預測模型的多個方面,但是突發(fā)傳染病輿情的相關研究仍然處于發(fā)展階段,還需要深入研究該領域及相關技術方法。BP神經網絡由于具有強大的自學習、自適應的能力,擅長于模式識別、分類、數據擬合等問題的解決,被廣泛應用于應急需求預測、微博轉發(fā)量預測、冬小麥耗水預測等方面。因此,本文將基于BP神經網絡,對突發(fā)傳染病的輿情熱度趨勢進行預測研究。

      2微博輿情熱度評價指標體系構建

      21輿情熱度評價指標

      建立一個科學合理的評價指標體系是衡量微博輿情熱度的基礎,并非指標越多越好,關鍵在于能否定量化反映微博輿情熱度的實質。本文借鑒文獻[11,12]構建的網絡輿情指標,從原創(chuàng)微博發(fā)布量(A)、轉發(fā)量(B)、評論量(C)、點贊量(D)等4個指標來描述微博輿情熱度。這些數據以天為單位進行統計,其與時間的對應關系見表1。

      2)一般而言,不同評價指標的類型、量綱等往往存在差異,為了消除這些差異帶來的影響,將其轉化為無量綱、方向一致的標準指標值,本文采用極值法[19]對評價指標進行無量綱化處理:

      3BP神經網絡

      BP神經網絡(Back Propagation Neural Network)基于梯度下降策略,通過反向傳播來不斷調整網絡連接的權值和閾值,直到輸出值與真實值的誤差減少到可以接受的范圍或預先設定的學習次數為止。BP神經網絡由輸入層、隱含層、輸出層組成,本文選取單隱層的三層BP神經網絡來實現突發(fā)傳染病輿情熱度趨勢的預測。其中輸入向量為原創(chuàng)微博發(fā)布量、轉發(fā)量、評論量、點贊量4個元素,所以輸入層的節(jié)點數為4。輸出向量為微博輿情熱度趨勢值,本文將預測問題轉化為模式分類問題,將微博輿情熱度趨勢值分為6類:C1=急速上升=H(i)max2,H(i)max,C2=明顯上升=H(i)max4,H(i)max2,C3=緩慢上升=0,H(i)max4,C4=緩慢下降=H(i)min4,0,C5=明顯下降=H(i)min2,H(i)min4,C6=急速下降=H(i)min,H(i)min2,其中H(i)max、H(i)min分別為微博輿情熱度趨勢值的最大值和最小值。在此基礎上,分別用二進制001、010、011、100、101、110表示微博輿情熱度趨勢值的類別,所以輸出層的節(jié)點數為3,輸出狀態(tài)為:001、010、011、100、101、110,分別對應6種類別。對于隱含層節(jié)點數而言,若節(jié)點過多,則會致使網絡復雜化甚至出現過度擬合的情況,若節(jié)點過少,則會致使結果不收斂,目前并沒有一個理想的解析式可以用來確定合理的隱含層節(jié)點數,本文采用經驗公式(13)得到隱含層節(jié)點數的估計值:

      4實驗及結果分析

      本研究通過Excel 2007軟件完成描述性統計以及圖形繪制,利用MATLAB R_2016a神經網絡工具箱構建突發(fā)傳染病輿情熱度趨勢預測模型。研究分為突發(fā)傳染病輿情時間跨度選擇、輿情熱度數據收集、輿情熱度數據預處理及清洗、輿情熱度數據歸一化處理等階段,具體的流程見圖2。

      41突發(fā)傳染病輿情時間跨度的選擇

      本文選取2015年上半年人民網輿情監(jiān)測室廣受關注的“MERS(中東呼吸綜合征)病毒衛(wèi)生突發(fā)事件”作為研究對象。根據人民網、中國新聞網關于中東呼吸綜合征的新聞報道得出該突發(fā)傳染病事件的進展見表2。

      結合百度指數搜索指數的網民關注度時間變化趨勢,截止到2015年7月31日,該事件基本平息,網民關注度降到與突發(fā)傳染病爆發(fā)前持平的狀態(tài)。因此,選取2015年5月28日至2015年7月31日為研究時間段。

      42輿情熱度數據收集

      本文利用Gooseeker爬取新浪微博上包含“MERS”詞條的所有原創(chuàng)微博條目,具體字段包括:發(fā)布時間、博主名稱、原創(chuàng)微博內容、微博網頁、轉發(fā)量、評論量、點贊量,共收集數據樣本56 043條。

      43輿情熱度數據預處理及清洗

      對收集到的原創(chuàng)微博進行逐條篩選,剔除232條廣告、重復的1 255條記錄、以及其他與MERS無關的401條微博,得到有效數據54 155條,累計轉發(fā)量1 316 856次,累計評論量572 759次,累計點贊量991 963次。然后,以天為單位,根據公式(1)~(4)整理匯總每日微博輿情熱度數據,得到65條結果見3。

      44輿情熱度數據歸一化處理

      本文中原創(chuàng)微博發(fā)布量、轉發(fā)量、評論量、點贊量均為效益型指標,根據公式(8)進行無量綱化處理,見表4。

      45輿情熱度計算

      根據公式(10)~(12)計算得到原創(chuàng)微博發(fā)布量、轉發(fā)量、評論量、點贊量對應的權重(保留小數點后5位):W1=020364,W2=028456,W3=023797,W4=027383。根據公式(5)計算微博輿情熱度,結果見表5。

      從圖3可以看出,MERS微博輿情熱度的演變具有快速爆發(fā)、回落相對緩慢的特點,大致經歷了萌動、加速、成熟、衰退4個階段,基本符合網絡輿情生命周期的特點。

      萌動期(5月28日~5月30日),公眾開始關注該突發(fā)傳染病事件,輿情熱度上升明顯,此后,網絡輿情熱度進入短暫的加速期(5月30日~5月31日),然后維持在成熟期(6月1日~6月5日)。尤其是在衰退期(6月6日后)前期,出現明顯的波動,體現為在6月18日和6月26日微博輿情熱度劇增,出現兩個小高峰,經過分析原創(chuàng)微博原文發(fā)現在這兩日,“為搶救韓國MERS患者廣東15天花掉逾800萬元”與“韓國籍MERS患者出院”兩大話題引起網友廣泛關注,致使微博輿情熱度上升。

      根據公式(6)計算MERS微博輿情熱度趨勢值,再由上文關于類別的計算方法,將微博輿情熱度趨勢值分為6類,C1=[025779052,051558103],C2=[012889526,025779052],C3=[0,012889526],C4=[-018638998,0],C5=[-037277995,-018638998],C6=[-0745559908,-037277995],計算結果見表6。

      46BP神經網絡參數設置

      隱含層和輸出層的傳遞函數均采用雙曲正切S型函數

      “Tansig”,訓練函數采用Levenberg-Marquardt反向傳播算法訓練函數“Trainlm”[21],訓練目標誤差為0005,學習率為005,最大訓練次數設置為1 000。各訓練參數設置見表7。

      47突發(fā)傳染病輿情熱度趨勢預測

      本文將2015年5月28日至2015年7月23日期間的數據作為訓練樣本。根據隱含層節(jié)點數的公式(12),將α進行逐個試驗,。先設定初始隱含層節(jié)點數為3(α=1時),然后訓練10次,去掉最大和次大誤差,取剩下8個誤差的平均值并記錄下來,再設置隱含層節(jié)點數為4……一直到取隱含層節(jié)點數為12(α=10時),得到不同隱含層節(jié)點數下網絡訓練平均誤差見圖4。

      從圖4可以看出,隨著隱含層個數的增加,訓練樣本的Mse平均值基本呈下降趨勢。當α=8時,即隱含層節(jié)點數N=10時,網絡誤差最小。因此,本文所建BP神經網絡拓撲結構為“4-10-3”,將隱含層為10中訓練誤差較小、預測結果準確率較高的BP神經網絡結構的參數保存。經過141次迭代,達到最小誤差值0005848,網絡訓練提前停止,其訓練結果混淆矩陣見圖5。

      從圖5可知,57個訓練樣本的準確率為877%,說明該模型的訓練結果較為理想。基于此,通過訓練好的網絡預測2015年7月24日至2015年7月31日MERS輿情熱度趨勢值,對應的預測結果見表8。

      48突發(fā)傳染病輿情熱度趨勢預測模型的評價

      將預測得出的MERS微博輿情熱度趨勢值的類別與實際類別進行誤差分析見表9,模型預測結果的混淆矩陣見圖6。

      由表9的誤差分析以及圖5的混淆矩陣可以看出,基于BP神經網絡預測的MERS微博輿情熱度趨勢的后7個類別與實際相符,只有第一個類別預測有偏差,準確率達到875%,預測結果較為理想。說明基于BP神經網絡模型的突發(fā)傳染病輿情熱度趨勢的預測是可行的。

      5結語

      突發(fā)傳染病發(fā)生后,由于嚴重危及生命安全,事件相關信息往往迅速在網絡上傳播交流,從而形成網絡輿情。本文將BP神經網絡應用到突發(fā)傳染病輿情熱度趨勢的預測中。首先在查閱文獻的基礎上,針對微博自身的特點,提出輿情熱度的定量方法,然后利用信息熵確定各個指標的權重,最后建立基于BP神經網絡的突發(fā)傳染病輿情熱度趨勢預測模型,并選取新浪微博“MERS病毒衛(wèi)生突發(fā)事件”的輿情熱度數據進行實例分析,預測該突發(fā)傳染病事件的發(fā)展趨勢,從而驗證模型的可行性。研究結果可以為突發(fā)傳染病微博輿情的管控提供決策支持。

      然而,本文研究也存在一定的局限性:第一,本文僅針對新浪微博這一媒介平臺建立指標體系,忽略了微信、論壇、新聞網站等互聯網平臺上的輿情信息,而且選取的微博輿情熱度評價指標只包括新浪微博的原創(chuàng)微博發(fā)布量、轉發(fā)量、評論量,點贊量四項指標,較為單一,忽略了微博內容主題特征、博主類型,博主粉絲量等信息對輿情熱度的影響,該體系還有待進一步完善;第二,突發(fā)傳染病輿情具有爆發(fā)性、演變不確定性等特點,在一段時間內(1天或者數小時)可能會有大幅度的波動,本文以天為單位進行數據統計,在未來的研究中還需考慮選取更加細粒度的單位進行分析;第三,本文只選取了一個突發(fā)傳染病案例進行實證分析,結果表明模型預測的準確率較高,但對于該模型是否同樣適用于其他突發(fā)傳染病輿情尚未進行探討。因此,在未來的研究中還需要選取一定數量的案例來驗證模型的合理性和有效性。

      參考文獻

      [1]中國互聯網絡信息中心(CNNIC).第40次中國互聯網絡發(fā)展狀況統計報告[R].中國互聯網絡信息中心,2017.

      [2]安璐,杜廷堯,余傳明,等.突發(fā)公共衛(wèi)生事件的微博主題演化模式和時序趨勢[J].情報資料工作,2016,(5):44-52.

      [3]徐旖旎.基于微博的媒體奇觀網絡輿情熱度趨勢分析[J].情報科學,2017,35(2):92-97,125.

      [4]趙磊,王松.基于BP神經網絡的輿情熱度趨勢仿真模型研究[J].情報學報,2016,35(9):989-999.

      [5]Yu L,Li L,Tang L.What Can Mass Media do to Control Public Panic in Accidents of Hazardous Chemical Leakage into Rivers?A Multi-Agent-Based Online Opinion Dissemination Model[J].Journal of Cleaner Production,2017,(143):1203-1214.

      [6]張行欽,張東紅,付剛甌,等.“乙肝疫苗”事件網絡輿情熱度演變特點及應對研究[J].中國預防醫(yī)學雜志,2017,18(1):60-62.

      [7]Lax JR,Phillips JH.How Should we Estimate Public Opinion in the States?[J].American Journal of Political Science,2009,53(1):107-121.

      [8]曹學艷,張仙,劉樑,等.基于應對等級的突發(fā)事件網絡輿情熱度分析[J].中國管理科學,2014,22(3):82-89.

      [9]王慧軍,石巖,胡明禮,等.輿情熱度的最優(yōu)監(jiān)控問題研究[J].情報雜志,2012,31(1):71-75.

      [10]袁國平,許曉兵.基于系統動力學的關于突發(fā)事件后網絡輿情熱度研究[J].情報科學,2015,33(10):52-56.

      [11]屈啟興,齊佳音.基于微博的企業(yè)網絡輿情熱度趨勢分析[J].情報雜志,2014,33(6):133-137.

      [12]王新猛.基于馬爾可夫鏈的政府負面網絡輿情熱度趨勢分析——以新浪微博為例[J].情報雜志,2015,34(7):161-164.

      [13]Chen XG,Duan S,Wang L.Research on Trend Prediction and Evaluation of Network Public Opinion[J].Concurrency and Computation:Practice Practice and Experience,2017,29(24):e4212.

      猜你喜歡
      預測模型BP神經網絡微博
      青少年數字素養(yǎng)的社會與文化內涵及其教育啟示
      基于神經網絡的北京市房價預測研究
      商情(2016年43期)2016-12-23 14:23:13
      中國石化J分公司油氣開發(fā)投資分析與預測模型研究
      經濟師(2016年10期)2016-12-03 22:27:54
      基于BP神經網絡的旅行社發(fā)展方向研究
      商情(2016年39期)2016-11-21 09:30:36
      復雜背景下的手勢識別方法
      BP神經網絡在軟件質量評價中的應用研究 
      軟件導刊(2016年9期)2016-11-07 18:25:50
      事實與流言的博弈
      人間(2016年26期)2016-11-03 18:19:04
      BP神經網絡算法在數值預報產品釋用中的應用
      科技視界(2016年20期)2016-09-29 14:15:12
      基于IOWHA法的物流需求組合改善與預測模型構建
      基于預測模型加擾動控制的最大功率點跟蹤研究
      科技視界(2016年1期)2016-03-30 13:37:45
      蒙阴县| 红原县| 靖边县| 牙克石市| 光泽县| 海宁市| 精河县| 科技| 津南区| 同德县| 金沙县| 麟游县| 同仁县| 梓潼县| 揭阳市| 阳西县| 娄底市| 西安市| 遂昌县| 平顶山市| 获嘉县| SHOW| 通城县| 磐安县| 手游| 安阳县| 望奎县| 深州市| 新乡县| 永泰县| 忻城县| 宜城市| 三亚市| 榕江县| 玉田县| 商水县| 祁阳县| 崇文区| 德钦县| 柞水县| 菏泽市|