• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多重分形態(tài)勢(shì)優(yōu)化的網(wǎng)絡(luò)輿情監(jiān)測(cè)方法

    2022-04-29 04:02:06管永明駱凱波史玉良
    關(guān)鍵詞:態(tài)勢(shì)分形輿情

    管永明,王 剛,駱凱波,鄒 波,呂 梁,史玉良+

    (1.山東大學(xué) 軟件學(xué)院,山東 濟(jì)南 250101;2.山大地緯軟件股份有限公司,山東 濟(jì)南 250100;3.國(guó)網(wǎng)重慶市電力公司,重慶 400015)

    0 引言

    “兩化融合”是我國(guó)現(xiàn)代制造業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展及服務(wù)轉(zhuǎn)型的重大戰(zhàn)略[1]。當(dāng)前,現(xiàn)代制造業(yè)需不斷優(yōu)化經(jīng)營(yíng)模式以提升競(jìng)爭(zhēng)力,故往往采用數(shù)字化改革以適應(yīng)時(shí)代發(fā)展。同時(shí),現(xiàn)代制造轉(zhuǎn)型升級(jí)不僅涉及到企業(yè)在經(jīng)營(yíng)、運(yùn)營(yíng)、組織、資源配置過程中廣泛感知獲取的海量數(shù)據(jù),還涉及跨行業(yè)、跨領(lǐng)域的管理經(jīng)驗(yàn)、業(yè)務(wù)知識(shí)、數(shù)據(jù)分析方法以及應(yīng)用軟件的沉淀、重構(gòu)、創(chuàng)造及復(fù)用。但由于工業(yè)數(shù)據(jù)化轉(zhuǎn)型經(jīng)驗(yàn)不足、產(chǎn)業(yè)生態(tài)構(gòu)建實(shí)踐缺乏等原因,尤其在當(dāng)下5G網(wǎng)絡(luò)等快速發(fā)展的自媒體時(shí)代,偶發(fā)的單個(gè)事件,其局部特性往往會(huì)通過網(wǎng)絡(luò)傳播產(chǎn)生“擴(kuò)音效應(yīng)”/“蝴蝶效應(yīng)”/“漣漪效應(yīng)”,進(jìn)而上升為公眾普遍關(guān)注的輿論事件。因此,在現(xiàn)代制造業(yè)的數(shù)字化轉(zhuǎn)型升級(jí)過程中極易新生各類網(wǎng)絡(luò)輿情[2],不僅對(duì)現(xiàn)代制造業(yè)的生產(chǎn)和運(yùn)營(yíng)造成影響,可能還會(huì)導(dǎo)致企業(yè)面臨嚴(yán)重的名譽(yù)與經(jīng)濟(jì)損失(如“**泄密門”和“涉嫌濫用人臉識(shí)別訴訟事件”等)[3]。輿情預(yù)警監(jiān)測(cè)是指在輿情事件還未對(duì)企業(yè)運(yùn)行造成損失之前,通過采取早期的監(jiān)測(cè)和有效地引導(dǎo)、控制,盡可能地避免輿情危機(jī)的產(chǎn)生,引導(dǎo)現(xiàn)代制造業(yè)度過數(shù)字化轉(zhuǎn)型的動(dòng)蕩期[4]。因此,現(xiàn)代制造業(yè)數(shù)字化轉(zhuǎn)型過程中的網(wǎng)絡(luò)輿情預(yù)警監(jiān)測(cè)研究是當(dāng)前一個(gè)重要的研究熱點(diǎn)。

    目前,關(guān)于輿情的研究主要包括輿情監(jiān)測(cè)和輿情預(yù)警等方面。輿情監(jiān)測(cè)方面,文獻(xiàn)[5]構(gòu)建了面向“We the Media”網(wǎng)絡(luò)上輿論拓?fù)涞亩嗑S網(wǎng)絡(luò)模型,并基于生成和傳播涉及同一事件的多個(gè)主題的實(shí)際過程,設(shè)計(jì)了多維輿論網(wǎng)絡(luò)的主題檢測(cè)算法;文獻(xiàn)[6]基于系統(tǒng)動(dòng)力學(xué)構(gòu)建了全面因果關(guān)系模型,以探討影響網(wǎng)絡(luò)輿情的因素來監(jiān)測(cè)網(wǎng)絡(luò)輿論的形成和傳播過程;文獻(xiàn)[7]提出基于改進(jìn)層次聚類的多源網(wǎng)絡(luò)輿情主題挖掘方法,通過挖掘主題以及主題之間的層次關(guān)系,分析了后續(xù)的輿情主題檢索和演化過程;文獻(xiàn)[8]通過大數(shù)據(jù)分析發(fā)現(xiàn)微博用戶之間的多種關(guān)系,提出一種半監(jiān)督用戶興趣匹配預(yù)測(cè)算法,通過狀態(tài)轉(zhuǎn)移分析和狀態(tài)轉(zhuǎn)移概率的推導(dǎo),建立了基于用戶興趣匹配的網(wǎng)絡(luò)輿論傳播模型。輿情預(yù)警方面,文獻(xiàn)[9]基于突發(fā)事件的生命周期、時(shí)間序列預(yù)測(cè)和輿論演化的自然規(guī)律,建立了應(yīng)急網(wǎng)絡(luò)輿情的時(shí)間模型,實(shí)現(xiàn)了從定量的角度分析輿論趨勢(shì)變化;針對(duì)網(wǎng)絡(luò)輿情預(yù)警的迫切需求,文獻(xiàn)[10]建立并量化了5種預(yù)警指標(biāo),利用BP(back propagation)神經(jīng)網(wǎng)絡(luò)自適應(yīng)學(xué)習(xí)構(gòu)建網(wǎng)絡(luò)輿情預(yù)警模型,從而實(shí)現(xiàn)網(wǎng)絡(luò)輿情預(yù)警。

    由以上研究可得,針對(duì)網(wǎng)絡(luò)輿情的監(jiān)控預(yù)警策略,相關(guān)專業(yè)機(jī)構(gòu)和團(tuán)隊(duì)已經(jīng)進(jìn)行了大量研究,但基于公眾實(shí)時(shí)參與度動(dòng)態(tài)擬合輿情衍進(jìn)態(tài)勢(shì)的輿情預(yù)警方法相對(duì)較少。尤其當(dāng)前企業(yè)數(shù)字化轉(zhuǎn)型屬于改革性事件,新事物輿情代表事件數(shù)據(jù)不足,而各類已有的網(wǎng)絡(luò)輿情發(fā)展態(tài)勢(shì)往往難以擬合新生輿情事件的傳播態(tài)勢(shì)。因此,需基于歷史網(wǎng)絡(luò)輿情態(tài)勢(shì),結(jié)合公眾實(shí)時(shí)參與度進(jìn)行輿情衍進(jìn)態(tài)勢(shì)預(yù)測(cè),以降低不確定突發(fā)事件輿情預(yù)測(cè)效果的偏離性和滯后性,實(shí)現(xiàn)對(duì)新生突發(fā)事件輿情傳播態(tài)勢(shì)的有效洞察。本文的創(chuàng)新點(diǎn)在于,從網(wǎng)絡(luò)輿情的傳播態(tài)勢(shì)入手,通過引入分形理論來挖掘輿情深層的演變規(guī)律,根據(jù)輿情傳播規(guī)律獲取其各重分形特征的狀態(tài)數(shù)據(jù),結(jié)合分類算法及聚類相似度判定輿情的傳播類型,及時(shí)作出判斷和預(yù)警。同時(shí),本文在探索輿情規(guī)律的同時(shí),基于公眾實(shí)時(shí)傳播數(shù)據(jù)引入分形插值算法進(jìn)行輿情態(tài)勢(shì)預(yù)測(cè)擬合,提高輿情預(yù)測(cè)的精準(zhǔn)度,從而有針對(duì)性地控制輿情態(tài)勢(shì)的發(fā)展,控制與引導(dǎo)企業(yè)相關(guān)事態(tài)的良性發(fā)展,做到未雨綢繆,將隱患扼制在萌芽狀態(tài)。

    1 構(gòu)建基于多重分形的輿情態(tài)勢(shì)判別模型

    為高效監(jiān)測(cè)和控制新生輿情的發(fā)展[14-15],進(jìn)而實(shí)現(xiàn)更精確的輿情態(tài)勢(shì)判別分析,首先基于各類歷史網(wǎng)絡(luò)輿情傳播典型事件獲取輿情態(tài)勢(shì)聚類結(jié)果,隨后針對(duì)輿情傳播態(tài)勢(shì)具有的非線性特性,運(yùn)用多重分形維數(shù)理論,對(duì)輿情傳播態(tài)勢(shì)進(jìn)行分形特征提取,并采用支持向量機(jī)(Support Vector Machine, SVM)構(gòu)建一個(gè)輿情態(tài)勢(shì)判別模型。輿情態(tài)勢(shì)判別模型的過程如圖1所示。

    將網(wǎng)絡(luò)輿情態(tài)勢(shì)圖數(shù)據(jù)進(jìn)行分類存儲(chǔ),并進(jìn)一步提取每一類傳播態(tài)勢(shì)圖的多重分形維數(shù)特征。通過綜合考量,本文計(jì)算D(1)~D(10)構(gòu)成多重分形維數(shù)譜,并將其作為SVM的輸入特征向量,訓(xùn)練SVM分類器。本文采用單類型事件輸入、多類型態(tài)勢(shì)輸出的方式構(gòu)建SVM分類器。訓(xùn)練時(shí)將屬于同一聚類類別的樣本歸為一類加以訓(xùn)練,并通過對(duì)分類結(jié)果進(jìn)行精度驗(yàn)證,得到輿情態(tài)勢(shì)判別模型,從而為后續(xù)更精確地進(jìn)行新生輿情態(tài)勢(shì)擬合和預(yù)測(cè)提供基礎(chǔ)支撐。

    1.1 潛在輿情傳播態(tài)勢(shì)分類

    針對(duì)當(dāng)前網(wǎng)絡(luò)輿情事件的傳播發(fā)展趨勢(shì),本文爬取歷史典型網(wǎng)絡(luò)輿情事件的傳播數(shù)據(jù),并基于當(dāng)前爬取的輿情數(shù)據(jù),對(duì)后續(xù)輿情態(tài)勢(shì)進(jìn)行分類判別以及態(tài)勢(shì)預(yù)測(cè)。網(wǎng)絡(luò)輿情數(shù)據(jù)收集主要通過主題詞搜索、關(guān)鍵詞提取等方法在網(wǎng)頁(yè)、論壇、博客、微博為代表的4類網(wǎng)頁(yè)中對(duì)網(wǎng)絡(luò)輿情相關(guān)的數(shù)據(jù)進(jìn)行抓取,主要包括主題關(guān)鍵詞、轉(zhuǎn)發(fā)量、評(píng)論數(shù)、不同時(shí)刻的變化情況數(shù)據(jù)等,并將各種類型的原始數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)。然后,將各網(wǎng)絡(luò)輿情事件捕獲的主題關(guān)鍵詞、轉(zhuǎn)發(fā)量、評(píng)論數(shù)、不同時(shí)刻的變化情況數(shù)據(jù)進(jìn)行規(guī)范化處理,并存儲(chǔ)到數(shù)據(jù)存儲(chǔ)系統(tǒng)中,進(jìn)而從中提取輿情態(tài)勢(shì)傳播的時(shí)間序列以及實(shí)時(shí)傳播狀態(tài),即以時(shí)間為橫坐標(biāo),每小時(shí)的平均轉(zhuǎn)發(fā)量為縱坐標(biāo),刻畫出網(wǎng)絡(luò)輿情傳播態(tài)勢(shì)圖樣本,從而直觀呈現(xiàn)輿情態(tài)勢(shì)發(fā)展階段、階段歷時(shí)、輿情狀態(tài)及各轉(zhuǎn)折點(diǎn)對(duì)應(yīng)事件等信息[11]。

    本文采用均值偏移算法對(duì)網(wǎng)絡(luò)輿情傳播態(tài)勢(shì)圖進(jìn)行聚類,采用迭代求密度函數(shù)極值點(diǎn)的方式實(shí)現(xiàn)樣本聚類。初始定義N個(gè)樣本點(diǎn)的特征空間并初始確定一個(gè)中心點(diǎn),計(jì)算在設(shè)置的半徑為D的圓形空間內(nèi)所有點(diǎn)(xi)與中心點(diǎn)的距離,然后計(jì)算整個(gè)圓形空間內(nèi)所有向量的平均值,從而得到一個(gè)偏移均值,將中心點(diǎn)移至偏移均值位置,重復(fù)移動(dòng)并進(jìn)行迭代式優(yōu)化計(jì)算,具體過程如下:

    首先,從一個(gè)初始估計(jì)X出發(fā),將每一條輿情態(tài)勢(shì)表示為一個(gè)d維空間內(nèi)的點(diǎn),即X=(x1,x2,…,xd),在指定的區(qū)域內(nèi)計(jì)算偏移均值。若總共收集到n個(gè)輿情傳播態(tài)勢(shì),則每個(gè)輿情態(tài)勢(shì)表示為Xi(i=1,2,…,n)。為了確定X鄰居點(diǎn)的權(quán)值,給定高斯核函數(shù)K(Xi-X),并通過這些鄰居點(diǎn)重新計(jì)算均值。這樣,在X點(diǎn)的密度加權(quán)均值為:

    (1)

    式中:N(x)為Xi的鄰居集;m(X)為均值偏移;K(Xi-X)為高斯核函數(shù)。令X=m(X),重復(fù)該估計(jì)過程,直到m(X)收斂。

    通過均值偏移聚類算法對(duì)收集到的輿情數(shù)據(jù)進(jìn)行聚類分析[12],得到潛在輿情傳播態(tài)勢(shì)分類及典型傳播態(tài)勢(shì)數(shù)據(jù),用于后續(xù)進(jìn)行更精確的輿情態(tài)勢(shì)判別和輿情態(tài)勢(shì)預(yù)測(cè)[13]。

    1.2 多重分形特征提取過程

    基于輿情態(tài)勢(shì)聚類結(jié)果,進(jìn)一步提取每一類傳播態(tài)勢(shì)圖的特征來達(dá)到分類構(gòu)建SVM分類器的目的。本文采用多重分形特征提取方法來實(shí)現(xiàn)輿情態(tài)勢(shì)圖的特征提取,為后續(xù)更精確地進(jìn)行輿情態(tài)勢(shì)擬合和預(yù)測(cè)提供基礎(chǔ)支撐。

    分形維數(shù)[16]是用維數(shù)來描述分形集合特征的測(cè)度,多重分形是一種分為多個(gè)區(qū)域的復(fù)雜分形結(jié)構(gòu)。在實(shí)際情況下,由于輿情傳播曲線并不能采用單一維數(shù)來表征,本文采用多重分形方法來實(shí)現(xiàn)特征描述。

    通過盒維數(shù)法[17]對(duì)D(q)進(jìn)行估算。該方法首先將整個(gè)對(duì)象劃分為大小為δ的“盒子”,然后將測(cè)度定義為集合X的點(diǎn)落在每個(gè)小盒子中的概率,即

    Pi(δ)=Ni/N,i=1,2,…,N。

    (2)

    式中:δ為每個(gè)盒子的長(zhǎng)度;N為集合X的總點(diǎn)數(shù),Ni是包含第i個(gè)小盒子中的點(diǎn)數(shù)。已知概率測(cè)度Pi(δ)和給定的參數(shù)q,可以計(jì)算信息量Iq(δ)為:

    (3)

    有了信息量Iq(δ),多重分形維數(shù)譜可以寫為:

    (4)

    改變?chǔ)牡拇笮。?jì)算出一系列的Iq(δ)值,在ln(δ)-lnIq(δ)圖上求出相應(yīng)的區(qū)間;然后采用最小二乘法求解出圖形的斜率,并對(duì)該斜率取絕對(duì)值后,即可得到q值的D(q);最后,分別對(duì)不同的q求出相應(yīng)的D(q),并在q-D(q)坐標(biāo)系中作出曲線圖,從而得到相應(yīng)的D(q)譜。

    1.3 輿情態(tài)勢(shì)判別模型構(gòu)建過程

    為實(shí)現(xiàn)樣本的多分類判別處理,本文采用SVM構(gòu)建輿情態(tài)勢(shì)判別模型。具體流程如下:

    假定訓(xùn)練集合x∈RN由兩類點(diǎn)(A類和B類)組成,若xi屬于A類,yi=1;若xi屬于B類,yi=-1,則訓(xùn)練樣本集為{xi,yi},i=1,2,…,n。SVM分類算法的核心是最大化分類邊際,即尋找一個(gè)超平面,使得樣本數(shù)據(jù)離超平面越遠(yuǎn)越好,從而達(dá)到使數(shù)據(jù)分類更準(zhǔn)確的目的。其表達(dá)式如下:

    ωφ(x)+b=0。

    (5)

    使用輿情風(fēng)險(xiǎn)已知的網(wǎng)絡(luò)輿情態(tài)勢(shì)圖聚類數(shù)據(jù)得到的多重分形維數(shù)作為訓(xùn)練樣本集{D(1),D(2),…,D(10)};隨后將已分類的網(wǎng)絡(luò)輿情態(tài)勢(shì)圖的多重分形維數(shù)作為輸入向量訓(xùn)練SVM分類器,采用非線性的SVM分類算法,給定輸入數(shù)據(jù)和學(xué)習(xí)目標(biāo)f(X)={X1,X2,…,XN},g(Y)={Y1,Y2,…,YN},非線性SVM有如下優(yōu)化問題:

    s.t.

    yi[wTφ(Xi)+b]≥1-ξi;

    (6)

    式中:ω為超平面的法向量;C為常數(shù);ξi為松弛變量,從而控制輸入輿情數(shù)據(jù)X與學(xué)習(xí)目標(biāo)網(wǎng)絡(luò)輿情各組分類Y之間的距離,實(shí)現(xiàn)同類別模型內(nèi)映射距離最小化,不同類別模型內(nèi)映射距離最大化的目的;k為自定義數(shù)據(jù);N為樣本總數(shù);

    非線性SVM有如下對(duì)偶問題:

    s.t.

    (7)

    其中α={α1,α2,…,αN}表示拉格朗日因子,使用核方法直接選取核函數(shù):k(Xi,Xj)=φ(Xi)Tφ(Xj)。

    采用一對(duì)多的方式建立SVM多分類模型,訓(xùn)練時(shí)將屬于同一輿情類別的樣本構(gòu)造出多分類的SVM輿情態(tài)勢(shì)判別模型,并基于隨機(jī)提取驗(yàn)證樣本集輸入SVM輿情態(tài)勢(shì)判別模型,對(duì)分類結(jié)果進(jìn)行精度驗(yàn)證,不斷調(diào)整輸入向量,直到滿足設(shè)定的精度閾值,最終完成SVM輿情態(tài)勢(shì)判別模型。

    2 構(gòu)建分形插值輿情預(yù)測(cè)模型

    在眾多基于曲線擬合的預(yù)測(cè)方法中,以迭代函數(shù)系理論為基礎(chǔ)的分形插值迭代算法逐漸發(fā)展起來,成為數(shù)據(jù)擬合與預(yù)測(cè)的新方法[18],尤其適用于非平穩(wěn)數(shù)據(jù)和非光滑曲線[19]。研究表明,輿情傳播態(tài)勢(shì)的波動(dòng)具有明顯的非線性分形特征[20],將公眾實(shí)時(shí)傳播分形插值數(shù)據(jù)與基于數(shù)據(jù)挖掘的趨勢(shì)預(yù)測(cè)模型相結(jié)合,可提高非線性數(shù)據(jù)預(yù)測(cè)的精度。

    本文在輿情判定模型的基礎(chǔ)上構(gòu)建輿情預(yù)測(cè)模型,如圖2所示為該模型的整體流程。當(dāng)捕獲新的輿情信息時(shí),首先進(jìn)行輿情傳播態(tài)勢(shì)判別,然后根據(jù)態(tài)勢(shì)判別結(jié)果提取該類網(wǎng)絡(luò)輿情的歷史態(tài)勢(shì)圖,并利用重標(biāo)極差分析法(Rescaled Range Analysis, R/S)計(jì)算該網(wǎng)絡(luò)輿情態(tài)勢(shì)圖的Hurst指數(shù),之后根據(jù)結(jié)合公眾實(shí)時(shí)傳播分形插值數(shù)據(jù)構(gòu)造迭代函數(shù)系,最后基于迭代函數(shù)系實(shí)現(xiàn)輿情態(tài)勢(shì)的預(yù)測(cè),得到后續(xù)輿情預(yù)測(cè)結(jié)果。

    2.1 R/S分析與Hurst指數(shù)

    R/S分析法是英國(guó)學(xué)者H.E. Hurst在1965年提出的一種處理時(shí)間序列的方法。該方法的主要內(nèi)容是如果對(duì)象序列的時(shí)間間隔發(fā)生變化,挖掘其序列特性的演變規(guī)律時(shí),小間隔時(shí)間序列的規(guī)律便可以被應(yīng)用于大間隔的時(shí)間序列,反之亦然。對(duì)于網(wǎng)絡(luò)輿情而言,具體流程如下:

    (2)利用公式求極差R和標(biāo)準(zhǔn)差S,在每一個(gè)子區(qū)間Ia上,

    極差

    (8)

    標(biāo)準(zhǔn)差

    (9)

    (3)利用極差和標(biāo)準(zhǔn)差求出長(zhǎng)度為n的平均R/S值:

    (10)

    當(dāng)n充分大時(shí),有(R/S)n∝cnH,其中的參數(shù)H即為Hurst指數(shù),且0≤H≤1。對(duì)不同的n值求出一系列的(R/S)n,以log(R/S)n與logn為坐標(biāo)軸,作出log(R/S)n=logc+Hlogn的圖形,并采用最小二乘法求出該圖形的斜率,該斜率的絕對(duì)值即為Hurst指數(shù)H,用以判斷輿情傳播態(tài)勢(shì)是否具有分形特征。

    2.2 R/S分析與Hurst指數(shù)擬合和與預(yù)測(cè)

    分形插值算法是基于拼貼原理來構(gòu)造迭代函數(shù)的,與傳統(tǒng)算法相比,該算法在某一時(shí)段的數(shù)據(jù)上選取插值點(diǎn)來構(gòu)造迭代函數(shù)系,并從同一傳播類型的歷史輿情態(tài)勢(shì)數(shù)據(jù)中選取插值點(diǎn),構(gòu)造插值函數(shù)。對(duì)于數(shù)據(jù)集{(xn,yn):n=1,2,3,…,m},其迭代變換的形式如下:

    [xy]T=ωi[xy]T+[mi,ni]T。

    (11)

    由上式可得,當(dāng)bi=0時(shí),可以推導(dǎo)出迭代變換ωi的其余4個(gè)常數(shù)ai、ci、ei、fi:

    (12)

    (13)

    (14)

    (15)

    將驗(yàn)證樣本集輸入輿情態(tài)勢(shì)預(yù)測(cè)模型,根據(jù)驗(yàn)證樣本集的實(shí)際輿情傳播態(tài)勢(shì),計(jì)算輿情后續(xù)輿情傳播預(yù)測(cè)準(zhǔn)確率,選取訓(xùn)練樣本集誤差最低且驗(yàn)證樣本集同比最低的迭代函數(shù)系作為輿情態(tài)勢(shì)預(yù)測(cè)模型,輸出輿情預(yù)測(cè)結(jié)果。

    3 實(shí)驗(yàn)結(jié)果

    為了驗(yàn)證本文提出的基于多重分形態(tài)勢(shì)優(yōu)化的網(wǎng)絡(luò)輿情監(jiān)測(cè)方法的可行性,在汽車制造業(yè)數(shù)字化升級(jí)過程中引進(jìn)智能車載系統(tǒng)軟件,并于2020年5月爆出某車載信息娛樂服務(wù)發(fā)生的數(shù)據(jù)泄露事件為例進(jìn)行實(shí)驗(yàn)驗(yàn)證。同類歷史數(shù)據(jù)泄露事件數(shù)據(jù),以輿情監(jiān)測(cè)系統(tǒng)抓取自2016年12月01日~2020年03月10日期間的數(shù)據(jù)泄露樣本集為例進(jìn)行模型構(gòu)建。通過內(nèi)嵌瀏覽器的UI界面,輸入待抓取信息,包括網(wǎng)站的統(tǒng)一資源定位符URL,網(wǎng)站名稱包含百度貼吧、百度搜索、360搜索、新浪微博、貼吧、今日頭條等,關(guān)鍵詞包括網(wǎng)絡(luò)安全、數(shù)據(jù)泄露、隱私泄露等,并在配置界面設(shè)定抓取時(shí)間頻率為5 min/次,搜索關(guān)鍵詞進(jìn)入關(guān)鍵詞更新模塊并傳輸至輿情數(shù)據(jù)庫(kù),進(jìn)入輿情信息處理。如圖3所示為以“數(shù)據(jù)泄露”為關(guān)鍵詞抓捕的部分輿情數(shù)據(jù)示例。

    本文以“數(shù)據(jù)泄露”為網(wǎng)絡(luò)輿情聚類捕獲數(shù)據(jù),輿情信息處理根據(jù)獲取的“數(shù)據(jù)泄露”網(wǎng)頁(yè)內(nèi)容,對(duì)網(wǎng)頁(yè)間相同關(guān)鍵詞進(jìn)行去重,并根據(jù)“數(shù)據(jù)泄露”歷史數(shù)據(jù)提取輿情態(tài)勢(shì)的時(shí)間序列以及實(shí)時(shí)傳播狀態(tài),將收集到的“數(shù)據(jù)泄露”網(wǎng)絡(luò)輿情態(tài)勢(shì)圖進(jìn)行均值漂移算法聚類,如圖4所示為基于網(wǎng)絡(luò)爬取的“數(shù)據(jù)泄露”事件聚類生成的輿情傳播態(tài)勢(shì)圖,目前主要分為4類發(fā)展趨勢(shì)。

    圖中:時(shí)間占比指整個(gè)輿情事件歷時(shí)的百分比;轉(zhuǎn)發(fā)量占比指某一時(shí)間轉(zhuǎn)發(fā)量占該類輿情事件轉(zhuǎn)發(fā)量最高峰值的百分比。

    根據(jù)判別輿情態(tài)勢(shì)的傳播類型來設(shè)置不同的輿情引導(dǎo)提醒:

    (1)類型a 該輿情具有前期爆發(fā)性,需要發(fā)布前期預(yù)警信號(hào),提醒相關(guān)單位在輿情發(fā)出的短時(shí)間內(nèi)進(jìn)行監(jiān)控和引導(dǎo),防止輿情短時(shí)間內(nèi)快速擴(kuò)散而引起不必要的混亂。

    (2)類型b 該輿情具有中期爆發(fā)性,輿情檢測(cè)系統(tǒng)應(yīng)當(dāng)對(duì)此類輿情發(fā)布中期預(yù)警信號(hào),在前期保持緊密監(jiān)控,警惕中期有可能出現(xiàn)的輿情大爆發(fā)現(xiàn)象。

    (3)類型c 該輿情具有后期爆發(fā)性,應(yīng)對(duì)此類輿情發(fā)布后期預(yù)警信號(hào),提醒相關(guān)單位對(duì)于前期沒有爆發(fā)的輿情不要掉以輕心,對(duì)輿情后期的傳播更應(yīng)該嚴(yán)防死守,一旦爆發(fā)就要采取相應(yīng)的應(yīng)對(duì)措施。

    (4)類型d 該輿情具有回蕩爆發(fā)性,一般這樣的輿情具有很強(qiáng)的誘惑力,與群眾的生活息息相關(guān),很容易引起群眾的共鳴,也最不好控制。對(duì)于該類輿情,系統(tǒng)應(yīng)發(fā)布實(shí)時(shí)預(yù)警信號(hào),提醒相關(guān)單位時(shí)刻關(guān)注該類輿情的發(fā)展,隨機(jī)應(yīng)變,及時(shí)注意引導(dǎo)輿論方向的發(fā)展。

    金融扶貧,涉及政府、銀行、擔(dān)保、保險(xiǎn)、企業(yè)、貧困戶等多個(gè)主體,協(xié)調(diào)難度較大,思想難以統(tǒng)一。在國(guó)家多年以來的持續(xù)推動(dòng)下,已經(jīng)摘掉了許多貧困地區(qū)的帽子,但當(dāng)前尚未脫貧的地區(qū),其程度更深、問題更難,嚴(yán)重制約著金融扶貧工作的進(jìn)一步開展。

    如圖5所示為基于“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”事件構(gòu)建的24小時(shí)輿情傳播態(tài)勢(shì)圖。利用多重分形維數(shù)計(jì)算方法,對(duì)獲取的“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”輿情傳播態(tài)勢(shì)圖曲線進(jìn)行多重分形維數(shù)的計(jì)算,進(jìn)而提取輿情傳播態(tài)勢(shì)分形特征,將24 h內(nèi)爬取的“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”輿情事件的多重分形維數(shù)數(shù)據(jù)輸入SVM輿情態(tài)勢(shì)判別模型,以圖4所示4類態(tài)勢(shì)作為模型輸出,“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”輿情態(tài)勢(shì)判別分類結(jié)果為類型a,與“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”實(shí)際態(tài)勢(shì)類別相同。

    “某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”輿情傳播態(tài)勢(shì)分類之后進(jìn)入輿情預(yù)測(cè)模塊,輿情預(yù)測(cè)模塊根據(jù)聚類態(tài)勢(shì)數(shù)據(jù),將具有同種傳播態(tài)勢(shì)類型的輿情態(tài)勢(shì)數(shù)據(jù)進(jìn)行整合,取平均值得到該類型的典型態(tài)勢(shì)分布圖,并將實(shí)時(shí)網(wǎng)絡(luò)爬取的“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”事件數(shù)據(jù)作為其實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),利用分形插值算法構(gòu)建迭代函數(shù)系,通過迭代函數(shù)系進(jìn)行迭代計(jì)算,預(yù)測(cè)“某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”輿情事件的后續(xù)時(shí)刻輿情傳播態(tài)勢(shì),部分預(yù)測(cè)結(jié)果對(duì)比如圖6所示。

    “某車載信息娛樂服務(wù)系統(tǒng)數(shù)據(jù)泄露”后續(xù)時(shí)刻輿情傳播態(tài)勢(shì)實(shí)驗(yàn)結(jié)果與實(shí)際態(tài)勢(shì)對(duì)比如表1所示。以5 min為一個(gè)時(shí)間片段,采用歐式距離判斷預(yù)測(cè)結(jié)果準(zhǔn)確與否,距離閾值為2.33%縱向均值轉(zhuǎn)發(fā)量。實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),采用本文所述基于多重分形優(yōu)化的輿情監(jiān)測(cè)方法對(duì)樣本數(shù)據(jù)的各個(gè)抓取時(shí)間輿情態(tài)勢(shì)預(yù)測(cè)準(zhǔn)確率為95.51%,F(xiàn)1值(準(zhǔn)確率與召回率的調(diào)和平均數(shù))達(dá)到96.53%,輿情傳播態(tài)勢(shì)預(yù)測(cè)數(shù)據(jù)準(zhǔn)確度較高。

    表1 態(tài)勢(shì)實(shí)驗(yàn)結(jié)果與實(shí)際態(tài)勢(shì)對(duì)比

    由上述消融實(shí)驗(yàn)結(jié)果可以得出以下結(jié)論:

    (1)同類網(wǎng)絡(luò)歷史輿情數(shù)據(jù)對(duì)于新生網(wǎng)絡(luò)輿情事件的發(fā)展趨勢(shì)具有一定的借鑒意義,但難以實(shí)現(xiàn)態(tài)勢(shì)曲線的高度擬合。

    (2)分形特征數(shù)據(jù)與公眾實(shí)時(shí)傳播分形插值方法的引入,均可在一定程度上提高新生網(wǎng)絡(luò)輿情傳播態(tài)勢(shì)的預(yù)測(cè)表現(xiàn),前者主要通過在不同維度挖掘曲線的潛在特征,從而細(xì)化后續(xù)的輿情態(tài)勢(shì)分類結(jié)果;后者主要通過引入公眾實(shí)時(shí)傳播數(shù)據(jù)插值,提高曲線的擬合度,且隨著時(shí)間延長(zhǎng)、插值點(diǎn)的增多可維持預(yù)測(cè)的準(zhǔn)確率。

    為了進(jìn)一步驗(yàn)證本文所提方法的性能,采用長(zhǎng)短期記憶(Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)算法[22]和基于規(guī)則分類器方法[23]進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。

    表2 實(shí)驗(yàn)結(jié)果對(duì)比情況

    由表2可知,本文提出的基于多重分形態(tài)勢(shì)優(yōu)化方法的性能優(yōu)于其他方法。由于當(dāng)前現(xiàn)代制造業(yè)數(shù)字化轉(zhuǎn)型升級(jí)引起的輿論事件屬于少樣本事件,而在樣本數(shù)量較少時(shí),LSTM難以捕獲到樣本數(shù)據(jù)的時(shí)序分布規(guī)律,導(dǎo)致模型的預(yù)測(cè)精度較低;對(duì)于基于規(guī)則分類器的方法,前期需依賴專家經(jīng)驗(yàn)形成判定規(guī)則,且難以基于數(shù)據(jù)分布的時(shí)序性進(jìn)行發(fā)展態(tài)勢(shì)擬合,故預(yù)測(cè)精度較低。

    4 結(jié)束語(yǔ)

    針對(duì)現(xiàn)代制造業(yè)數(shù)字化轉(zhuǎn)型升級(jí)過程面臨著日趨復(fù)雜的網(wǎng)絡(luò)輿論態(tài)勢(shì),為防止突發(fā)網(wǎng)絡(luò)輿情事件對(duì)企業(yè)正常運(yùn)行造成影響,解決突發(fā)新生事件網(wǎng)絡(luò)輿情監(jiān)測(cè)問題,本文提出基于多重分形態(tài)勢(shì)優(yōu)化的網(wǎng)絡(luò)輿情監(jiān)測(cè)方法。首先引入多重分形維數(shù)理論分析輿情傳播態(tài)勢(shì)的分形特征,并以分形特征訓(xùn)練SVM多分類器,基于網(wǎng)絡(luò)輿情傳播態(tài)勢(shì)構(gòu)建輿情態(tài)勢(shì)判別模型。然后,在判別模型的基礎(chǔ)上引入公眾實(shí)時(shí)傳播數(shù)據(jù)構(gòu)造分形插值迭代函數(shù)系進(jìn)行輿情態(tài)勢(shì)預(yù)測(cè),從而提高預(yù)測(cè)模型的準(zhǔn)確性和穩(wěn)定性,滿足輿情實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè)及預(yù)警推送的業(yè)務(wù)需求。未來,基于同類網(wǎng)絡(luò)輿情樣本的增多,可采用深度學(xué)習(xí)提高模型的聚類及判定結(jié)果,從而進(jìn)一步提高輿情的預(yù)測(cè)效果。

    猜你喜歡
    態(tài)勢(shì)分形輿情
    感受分形
    2019年12月與11月相比汽車產(chǎn)銷延續(xù)了增長(zhǎng)態(tài)勢(shì)
    汽車與安全(2020年1期)2020-05-14 13:27:19
    匯市延續(xù)小幅震蕩態(tài)勢(shì)
    我國(guó)天然氣供需呈現(xiàn)緊平衡態(tài)勢(shì)
    分形之美
    分形空間上廣義凸函數(shù)的新Simpson型不等式及應(yīng)用
    輿情
    輿情
    輿情
    縣鄉(xiāng)一體化探索呈加速態(tài)勢(shì)
    达尔| 阿城市| 藁城市| 宁武县| 新民市| 三亚市| 凌源市| 古丈县| 南木林县| 卫辉市| 抚远县| 荥阳市| 虞城县| 聊城市| 焦作市| 那坡县| 南宫市| 庆安县| 临夏市| 海城市| 微山县| 乐东| 崇明县| 彝良县| 赫章县| 织金县| 乌兰察布市| 荆州市| 那曲县| 瓦房店市| 和平区| 江川县| 大关县| 娱乐| 佛山市| 行唐县| 广南县| 南通市| 美姑县| 镇巴县| 富民县|