吳詩(shī)賢 張必蘭
〔摘要〕[目的/意義]探討網(wǎng)絡(luò)輿情事件中群體觀點(diǎn)的演變規(guī)律,構(gòu)建有效預(yù)測(cè)其演變趨勢(shì)的方法。[方法/過(guò)程]參考物理學(xué)中場(chǎng)的思想和信息科學(xué)中數(shù)據(jù)場(chǎng)的方法,引入觀點(diǎn)場(chǎng)概念,提出了一種基于觀點(diǎn)勢(shì)的觀點(diǎn)潛在影響力評(píng)估模型;然后將該模型運(yùn)用到微博評(píng)論的群體觀點(diǎn)演化分析中,建立了微博評(píng)論的觀點(diǎn)趨勢(shì)預(yù)測(cè)方法。該方法的基本思想是以當(dāng)前評(píng)論的觀點(diǎn)勢(shì)分布來(lái)預(yù)測(cè)未來(lái)評(píng)論的觀點(diǎn)分布,在觀點(diǎn)勢(shì)計(jì)算時(shí),以既有評(píng)論的排序值代表新的信息受眾所處的參考場(chǎng)點(diǎn)與觀點(diǎn)場(chǎng)中既有評(píng)論之間的距離。[結(jié)果/結(jié)論]通過(guò)實(shí)際的微博輿情事件數(shù)據(jù)實(shí)驗(yàn)表明,該網(wǎng)絡(luò)輿情群體觀點(diǎn)趨勢(shì)預(yù)測(cè)模型能較好地評(píng)估已發(fā)表的顯性觀點(diǎn)對(duì)后來(lái)網(wǎng)民觀點(diǎn)形成的影響力,具有較高的網(wǎng)絡(luò)輿情觀點(diǎn)趨勢(shì)預(yù)測(cè)準(zhǔn)確率。
〔關(guān)鍵詞〕群體極化;觀點(diǎn)場(chǎng);觀點(diǎn)勢(shì);影響力;評(píng)估模型;微博;評(píng)論;演變規(guī)律;演化趨勢(shì);網(wǎng)絡(luò)輿情;輿論趨勢(shì);預(yù)測(cè)
DOI:10.3969/j.issn.1008-0821.2018.09.012
〔中圖分類(lèi)號(hào)〕G202〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2018)09-0074-05
An Opinion-Field-Model-Based Method for Prediction of the
Evolution Trends of Opinions of Microblog CommentsWu Shixian1Zhang Bilan2
(1.Computer Science and Information Engineering College,Chongqing Technology and
Business University,Chongqing,400067,China;
2.Library,Chongqing Technology and Business University,Chongqing 400067,China)
〔Abstract〕[Purpose/Significance]To explore the formation and evolution of group opinion trends in cyber public opinion events,and to construct a corresponding method for efficient prediction of the evolution trends.[Method/Process]Based on the analysis of the generation and evolution of viewpoints in network public opinion events,the concept of opinion field was introduced with reference to the idea of physical fields and data fields in information science.An evaluation model for the impact of opinion potential was thus proposed.The model was applied to the evolution analysis of the group opinions in microblog comment groups to establish a method for protection of such evolution trends.The basic idea of this method was to predict the viewpoints distribution of future comments & opinions based on the distribution of the current opinion potential,the quantification of which was based on the rankings of current comments that represented the distance between the reference field point (in which the new information audience was located) and the existing comments in the opinion field.[Result/Conclusion]The actual data experiments on microblog public opinion events showed that the forecasting model of the evolution trend of network public opinion & group opinion could better evaluate the influence of the published explicit opinion on the forthcoming formation of the netizens opinions,and predict more accurately the corresponding evolution trends.
〔Key words〕group polarization;opinion field;opinion potential;impact;evaluation model;microblog;comment;evolution rule;evolution trend;public opinion;opinion trend;prediction
相較于現(xiàn)實(shí)環(huán)境下的群體交流,傳播過(guò)程的匿名性、輿情匯聚的便利性、輿情演化的馬太效應(yīng)等新媒體輿情發(fā)展特征,使得網(wǎng)絡(luò)輿情事件往往容易形成群體觀點(diǎn)的極化,并極有可能向網(wǎng)絡(luò)群體激化方向發(fā)展乃至釀成現(xiàn)實(shí)社會(huì)群體性事件,甚至危及社會(huì)公眾安全與政治穩(wěn)定。因此,在網(wǎng)絡(luò)輿情事件發(fā)生的早期,及時(shí)把握網(wǎng)絡(luò)輿情觀點(diǎn)發(fā)展趨勢(shì)是輿情監(jiān)控、輿情群體極化預(yù)防的重要措施之一。
情報(bào)學(xué)、社會(huì)學(xué)等多個(gè)領(lǐng)域的學(xué)者們從輿情形成機(jī)理、以及動(dòng)力機(jī)制、演化規(guī)律等多方面展開(kāi)了網(wǎng)絡(luò)輿情群體觀點(diǎn)演化相關(guān)問(wèn)題的研究,取得了豐富的研究成果。典型的輿論演化模型主要有三類(lèi):一類(lèi)是建立在微觀個(gè)體之間有界信任基礎(chǔ)上的DW模型[1]、HK模型[2],以及有界信任模型的改進(jìn)模型[3-4];另一類(lèi)是以復(fù)雜網(wǎng)絡(luò)為載體的輿論演化模型[5-7];還有一類(lèi)是將復(fù)雜網(wǎng)絡(luò)和有界信任相結(jié)合的輿論演化動(dòng)力學(xué)模型[8]?,F(xiàn)有的輿情觀點(diǎn)演化分析,大多基于給定的觀點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu),采用一定的網(wǎng)民觀點(diǎn)交互影響及更新模型來(lái)評(píng)估群體觀點(diǎn)的演化,而在實(shí)際網(wǎng)絡(luò)中,輿情事件的參與者數(shù)量及相互之間的鏈接關(guān)系時(shí)刻都在變化,信息傳播的拓?fù)浣Y(jié)構(gòu)演變非常迅速,是典型的動(dòng)態(tài)時(shí)變網(wǎng)絡(luò),直接定義在兩兩網(wǎng)民對(duì)上的觀點(diǎn)影響模型,難以刻畫(huà)未直接鏈接的網(wǎng)民之間觀點(diǎn)的影響;模型驗(yàn)證也多以仿真為主、基于真實(shí)演化數(shù)據(jù)進(jìn)行的實(shí)證分析較少。同時(shí),筆者通過(guò)對(duì)多個(gè)實(shí)際輿情事件觀點(diǎn)演化案例的分析,發(fā)現(xiàn)一旦網(wǎng)民在網(wǎng)絡(luò)上表達(dá)觀點(diǎn)后,受包括意見(jiàn)領(lǐng)袖在內(nèi)的其他網(wǎng)民的影響而改變觀點(diǎn)的并不多,大量觀點(diǎn)交互的結(jié)果往往是誰(shuí)也說(shuō)服不了誰(shuí)。網(wǎng)絡(luò)輿情事件群體觀點(diǎn)的極化,一般并不是初期參與輿情事件討論的網(wǎng)民的觀點(diǎn)由分散轉(zhuǎn)向極化,而是后期不斷增加的網(wǎng)民觀點(diǎn)向前期影響力大的觀點(diǎn)偏移形成的。因此,輿情事件群體觀點(diǎn)的演化預(yù)測(cè),關(guān)鍵是要較準(zhǔn)確地評(píng)估已發(fā)表觀點(diǎn)對(duì)后來(lái)網(wǎng)民觀點(diǎn)形成的影響力。
微博、微信等新社交傳媒工具能真實(shí)地記錄針對(duì)具體輿情事件的各種評(píng)論的大量屬性(如點(diǎn)贊量、回復(fù)量等),為觀點(diǎn)演化理論和實(shí)證研究帶來(lái)新的機(jī)遇。但是,在微博等社交環(huán)境下,已有評(píng)論與新信息受眾之間很多時(shí)候并無(wú)直接鏈接記錄(比如,網(wǎng)民進(jìn)入某博文評(píng)論區(qū)瀏覽,是難以準(zhǔn)確記錄他實(shí)際看了哪些評(píng)論的),這種情況下已有評(píng)論對(duì)后期網(wǎng)民觀點(diǎn)的影響是在非直接鏈接情況下實(shí)現(xiàn)的。
為了描述這種非直接接觸式作用,本文在對(duì)網(wǎng)絡(luò)輿情觀點(diǎn)形成規(guī)律分析的基礎(chǔ)上,受物理學(xué)中關(guān)于場(chǎng)的思想方法的啟發(fā),引入虛擬的觀點(diǎn)場(chǎng)來(lái)分析輿情事件中既有評(píng)論觀點(diǎn)與新信息受眾之間的作用,通過(guò)擬核力場(chǎng)勢(shì)函數(shù)描述既有觀點(diǎn)在觀點(diǎn)場(chǎng)中空間上的分布,以此為基礎(chǔ)構(gòu)建已發(fā)表觀點(diǎn)對(duì)后來(lái)網(wǎng)民觀點(diǎn)形成的影響力評(píng)估模型,并利用該模型建立微博評(píng)論群體觀點(diǎn)趨勢(shì)預(yù)測(cè)方法,最后利用真實(shí)輿情事件數(shù)據(jù)對(duì)該方法進(jìn)行了驗(yàn)證。
2018年9月第38卷第9期現(xiàn)代情報(bào)Journal of Modern InformationSep.,2018Vol38No92018年9月第38卷第9期基于觀點(diǎn)場(chǎng)模型的微博評(píng)論觀點(diǎn)演化趨勢(shì)預(yù)測(cè)方法Sep.,2018Vol38No91研究對(duì)象界定
輿情的事件的性質(zhì)和敏感程度等很多因素都會(huì)直接或者間接影響網(wǎng)絡(luò)輿情演化的趨勢(shì)。對(duì)于良惡定性毫無(wú)爭(zhēng)議、超越了多元主觀認(rèn)知臨界的輿情事件,網(wǎng)民觀點(diǎn)受基本倫理道德規(guī)范的約束易出現(xiàn)單極群體極化現(xiàn)象;而那些事件信息模糊、話(huà)題爭(zhēng)議性顯著的輿情事件,相對(duì)立的觀點(diǎn)情緒都可能引起廣泛共鳴,受群體情緒演化影響顯著、輿情場(chǎng)極化可向多方向發(fā)展[9]。前一種情況的輿情事件,其極化方向是顯而易見(jiàn)的。本文的目標(biāo)是構(gòu)建觀點(diǎn)可向多方向發(fā)展類(lèi)輿情事件的觀點(diǎn)趨勢(shì)預(yù)測(cè)方法。
2觀點(diǎn)場(chǎng)模型
物理學(xué)中把場(chǎng)作為描述物質(zhì)之間非接觸相互作用的介質(zhì),描述場(chǎng)的性質(zhì)和運(yùn)動(dòng)規(guī)律的場(chǎng)論成為現(xiàn)代物理學(xué)的重要分支,其相關(guān)概念和思想被廣泛引入到其他學(xué)科領(lǐng)域。如,吳國(guó)恩利用情報(bào)場(chǎng)來(lái)描述信息施體、信息受體之間非接觸相互作用[10],淦文燕等利用虛擬數(shù)據(jù)場(chǎng)來(lái)描述數(shù)據(jù)對(duì)象之間相互作用[11]。
借鑒物理學(xué)和情報(bào)學(xué)中場(chǎng)的思想和方法,本文引入觀點(diǎn)場(chǎng)的概念來(lái)量化描述觀點(diǎn)的影響力和相互作用。
21觀點(diǎn)場(chǎng)的定義
參照物理場(chǎng)和數(shù)據(jù)場(chǎng)的概念,假設(shè)在網(wǎng)絡(luò)輿情事件發(fā)生后到某一時(shí)刻T,共產(chǎn)生了n個(gè)觀點(diǎn)構(gòu)成觀點(diǎn)集V={v1,v2,…,vn}。如果將這些觀點(diǎn)及其作用看作一個(gè)物理系統(tǒng),V中的任意一個(gè)觀點(diǎn)視作一個(gè)具有一定觀點(diǎn)質(zhì)量的粒子,那么它在產(chǎn)生之后就會(huì)在周?chē)纬梢粋€(gè)作用場(chǎng),n個(gè)觀點(diǎn)的作用場(chǎng)合成為整個(gè)輿情事件的觀點(diǎn)場(chǎng)。
22觀點(diǎn)場(chǎng)的勢(shì)和勢(shì)函數(shù)
輿情事件觀點(diǎn)場(chǎng)的勢(shì)可理解為已經(jīng)發(fā)出顯性觀點(diǎn)信息的觀點(diǎn)粒子所具有的潛在影響能在觀點(diǎn)場(chǎng)的分布。與物理場(chǎng)類(lèi)似,在觀點(diǎn)場(chǎng)中也可以定義勢(shì)函數(shù),觀點(diǎn)勢(shì)函數(shù)描述的是單個(gè)觀點(diǎn)在觀點(diǎn)場(chǎng)的分布規(guī)律。某場(chǎng)源觀點(diǎn)在場(chǎng)中某點(diǎn)的觀點(diǎn)勢(shì)則由場(chǎng)源觀點(diǎn)的觀點(diǎn)質(zhì)量以及場(chǎng)源與該點(diǎn)之間的距離確定??紤]到觀點(diǎn)影響作用隨著距離的增長(zhǎng)快速衰減的短程特性,參考數(shù)據(jù)場(chǎng)勢(shì)函數(shù)定義,本文用具有良好短程作用數(shù)學(xué)性質(zhì)的擬核力場(chǎng)高斯勢(shì)函數(shù)來(lái)描述任意觀點(diǎn)vi的作用,則任意觀點(diǎn)vi∈V在場(chǎng)點(diǎn)j的勢(shì)函數(shù)為:
φvi(j)=mie-rijσ2(1)
其中,mi為觀點(diǎn)vi的觀點(diǎn)質(zhì)量;σ為控制每個(gè)觀點(diǎn)的作用力程系數(shù),即影響因子;rij為場(chǎng)源觀點(diǎn)vi與場(chǎng)點(diǎn)j的距離。
根據(jù)上述擬核力場(chǎng)高斯函數(shù)的性質(zhì),對(duì)于給定的σ值,每個(gè)觀點(diǎn)的影響范圍近似為3σ/2單位距離的局域區(qū)域,當(dāng)距離大于3σ/2單位距離時(shí),觀點(diǎn)勢(shì)函數(shù)值很快衰減到接近0。因此,為了簡(jiǎn)化計(jì)算,某個(gè)場(chǎng)點(diǎn)的勢(shì)值不需要精確計(jì)算所有觀點(diǎn)對(duì)象的影響合力,而只需要疊加以該場(chǎng)點(diǎn)3σ/2單位距離鄰域內(nèi)的觀點(diǎn)產(chǎn)生的勢(shì)值。
23觀點(diǎn)質(zhì)量
觀點(diǎn)質(zhì)量是指觀點(diǎn)蘊(yùn)含的對(duì)其他網(wǎng)民觀點(diǎn)在距離為0時(shí)影響力的大小。觀點(diǎn)質(zhì)量的大小主要由觀點(diǎn)載體(一般為1篇博文、1個(gè)論壇帖子、1篇新聞文章、1個(gè)評(píng)論等)的說(shuō)服力等屬性以及觀點(diǎn)發(fā)布者的固有影響力確定。承載觀點(diǎn)的文本一經(jīng)發(fā)布,其所蘊(yùn)含的觀點(diǎn)情感傾向和強(qiáng)度等屬性不隨時(shí)間變化而改變、在具體輿情事件演化的一定時(shí)間內(nèi)觀點(diǎn)發(fā)布者的固有影響力也基本不變,因此,一般情況下觀點(diǎn)質(zhì)量可以看成不變量;但觀點(diǎn)在輿情事件演化過(guò)程中所附加的一些屬性也可能改變(如,某個(gè)觀點(diǎn)獲得的點(diǎn)贊量可能不斷變化),這種情況下觀點(diǎn)質(zhì)量則可看成變量。
24觀點(diǎn)極化度和觀點(diǎn)勢(shì)極化度
觀點(diǎn)極化度代表了某一時(shí)刻網(wǎng)絡(luò)輿情觀點(diǎn)場(chǎng)輿論分布的極化程度,而觀點(diǎn)勢(shì)的極化度代表了網(wǎng)絡(luò)輿情觀點(diǎn)場(chǎng)輿論極化的趨勢(shì)。
對(duì)網(wǎng)絡(luò)輿情群體觀點(diǎn)極化程度的度量,需要從其定義和本質(zhì)出發(fā)設(shè)定其計(jì)量模型。如果直接測(cè)量某種傾向觀點(diǎn)數(shù)量的絕對(duì)值,容易受群體大小等因素影響,所以群體極化一般考慮用極端觀點(diǎn)比率這樣的相對(duì)值來(lái)判定群體是否出現(xiàn)極化現(xiàn)象以及極化程度[12]。
德國(guó)科學(xué)家Rudolf Clausius(克勞修斯)最早提出用“熵”來(lái)表示任何一種能量在空間中分布的均勻程度,能量分布得越均勻,熵就越大。香濃將其引入到信息論中,提出用“信息熵”度量信息量的大小。由于觀點(diǎn)是信息的一種,可以用信息熵的方法定義觀點(diǎn)(勢(shì))熵和觀點(diǎn)(勢(shì))極化度:
Hv=-∑ni=1pi×log2(pi)(2)
dgp=1Hv(3)
其中,pi為某種極性觀點(diǎn)數(shù)在所有觀點(diǎn)數(shù)中的比例(計(jì)算觀點(diǎn)極化度時(shí))或某類(lèi)觀點(diǎn)勢(shì)值占總的觀點(diǎn)勢(shì)值的比例(計(jì)算觀點(diǎn)勢(shì)極化度時(shí)),Hv為觀點(diǎn)(勢(shì))熵,dgp為群體觀點(diǎn)極化度或觀點(diǎn)勢(shì)極化度。
顯然,各種觀點(diǎn)(勢(shì))的比例分布越均勻,觀點(diǎn)(勢(shì))熵就越大,如果所有觀點(diǎn)(勢(shì))的比例都一樣,則觀點(diǎn)(勢(shì))熵達(dá)到最大,此時(shí),觀點(diǎn)(勢(shì))極化度最小。
3基于觀點(diǎn)場(chǎng)模型的微博評(píng)論群體觀點(diǎn)趨勢(shì)預(yù)測(cè)方法微博的極大便捷性和交互性特點(diǎn),使其迅速成為使用范圍和影響力都極大的社交媒體,成為個(gè)人參與公共話(huà)題的一個(gè)重要平臺(tái),一些大“v”博主的個(gè)體影響力甚至超過(guò)一個(gè)傳統(tǒng)媒體[13]。微博評(píng)論本身“雖然無(wú)法對(duì)微博進(jìn)行傳播,但獲得較多用戶(hù)評(píng)論的微博會(huì)以熱門(mén)話(huà)題形式被推薦到更多其關(guān)注對(duì)象的用戶(hù)微博主頁(yè)中,實(shí)現(xiàn)廣泛性傳播?!盵14]。盡管微博評(píng)論者大多是普通網(wǎng)民,但是,普通網(wǎng)民的評(píng)論觀點(diǎn)如果成為熱門(mén)評(píng)論也會(huì)對(duì)群體觀點(diǎn)產(chǎn)生極大的影響,在評(píng)論的分布和增長(zhǎng)中仍然體現(xiàn)出“多者越多”的非均衡增長(zhǎng)和“極化效應(yīng)”,“群體極化”現(xiàn)象在微博的傳播過(guò)程中表現(xiàn)得也極為明顯[15]。
本文以知名新浪博主針對(duì)某輿情事件博文作為根源信息構(gòu)成的評(píng)論觀點(diǎn)場(chǎng)為對(duì)象。觀點(diǎn)極化分析主要考慮網(wǎng)絡(luò)輿情受眾面向博文的根源觀點(diǎn)做出的主觀評(píng)論,暫不考慮轉(zhuǎn)發(fā)、點(diǎn)贊和對(duì)評(píng)論的回復(fù)所表達(dá)的觀點(diǎn)。
31模型參數(shù)的討論
利用式(1)計(jì)算微博評(píng)論觀點(diǎn)勢(shì),需要先確定3個(gè)參數(shù):微博評(píng)論觀點(diǎn)場(chǎng)中場(chǎng)源觀點(diǎn)與信息受眾場(chǎng)點(diǎn)的距離rij、觀點(diǎn)質(zhì)量mi、影響范圍因子σ。
311場(chǎng)源觀點(diǎn)與信息受眾場(chǎng)點(diǎn)的距離的確定
在前述觀點(diǎn)場(chǎng)概念模型中,觀點(diǎn)vi∈V在參考場(chǎng)點(diǎn)j的勢(shì)φvi(j)隨著它們之間的距離rij的增長(zhǎng)而快速下降。在具體觀點(diǎn)場(chǎng)中,距離的物理含義是不同的,如果是觀點(diǎn)之間通過(guò)轉(zhuǎn)發(fā)、回復(fù)等構(gòu)成的有鏈接的觀點(diǎn)網(wǎng)絡(luò),則距離rij為場(chǎng)源點(diǎn)和參考場(chǎng)點(diǎn)之間的網(wǎng)絡(luò)距離,一般可由它們之間最短網(wǎng)絡(luò)路徑長(zhǎng)度來(lái)代表,而在微博評(píng)論觀點(diǎn)場(chǎng)中,每一個(gè)進(jìn)入微博網(wǎng)絡(luò)輿情場(chǎng)的網(wǎng)民個(gè)體雖然在理論上都具備遍歷全域觀點(diǎn)的能力,但事實(shí)上不可能遍歷所有觀點(diǎn),新的博文信息受眾(網(wǎng)民)查看評(píng)論的時(shí)候,一般只是查看部分排序在前的評(píng)論,如果把新的信息受眾進(jìn)入微博的點(diǎn)看作參考場(chǎng)點(diǎn)O,則觀點(diǎn)場(chǎng)中既有觀點(diǎn)與這個(gè)參考場(chǎng)點(diǎn)之間的距離則可由觀點(diǎn)在評(píng)論排序中的位置來(lái)代表。
新版新浪微博正文頁(yè)評(píng)論主要提供了按熱度和按時(shí)間倒序方式查看評(píng)論,默認(rèn)按熱度排序。通過(guò)對(duì)多位微博用戶(hù)的調(diào)查,大多數(shù)用戶(hù)通常按新浪微博默認(rèn)的熱度排序?yàn)g覽評(píng)論,少部分通常按時(shí)間倒序展現(xiàn)評(píng)論或兩種排序?yàn)g覽評(píng)論,同時(shí)由于最新評(píng)論不斷變化,在簡(jiǎn)化計(jì)算時(shí),可只考慮熱度排序。這樣,微博評(píng)論觀點(diǎn)與新信息受眾進(jìn)入觀點(diǎn)場(chǎng)場(chǎng)點(diǎn)O的距離rij可由該評(píng)論的熱度排序值代表。
312觀點(diǎn)質(zhì)量的確定
在微博里發(fā)表評(píng)論多是普通網(wǎng)民,再加上觀點(diǎn)的點(diǎn)贊量、轉(zhuǎn)發(fā)量、支持性回復(fù)量等已在新浪微博評(píng)論熱度排序計(jì)算中予以考慮,在簡(jiǎn)化計(jì)算時(shí),可以把所有觀點(diǎn)的質(zhì)量均認(rèn)為1。
313影響范圍因子的確定
在觀點(diǎn)勢(shì)的計(jì)算中,影響因子σ是非常重要的參數(shù),它的取值將會(huì)對(duì)結(jié)果產(chǎn)生很大影響。如果σ取值過(guò)小,那么會(huì)導(dǎo)致任何單位質(zhì)量觀點(diǎn)的勢(shì)值都接近0,觀點(diǎn)源對(duì)參考場(chǎng)點(diǎn)無(wú)影響;但如果取值太大,又會(huì)導(dǎo)致任何單位質(zhì)量觀點(diǎn)的勢(shì)值都接近1,容易忽視觀點(diǎn)源與參考場(chǎng)點(diǎn)間不同距離的影響。兩種情況下都會(huì)使整個(gè)輿情場(chǎng)內(nèi)距離對(duì)結(jié)果幾乎無(wú)影響。
具體到微博評(píng)論觀點(diǎn)場(chǎng),通過(guò)調(diào)查分析發(fā)現(xiàn),信息受眾在查看評(píng)論的時(shí)候,查看的條數(shù)一般在一二十條內(nèi),超過(guò)50條的極少,即微博評(píng)論觀點(diǎn)場(chǎng)既有觀點(diǎn)對(duì)信息受眾的作用力程大多在50個(gè)單位距離以下。因此,為了更好地反映這一特點(diǎn),考慮到擬核力場(chǎng)高斯勢(shì)函數(shù)的性質(zhì),影響因子σ可確定為:
σ=50×2/3≈24(4)
32微博評(píng)論排序的演化趨勢(shì)特點(diǎn)
通過(guò)對(duì)大量微博評(píng)論時(shí)間序列數(shù)據(jù)的分析,發(fā)現(xiàn)按熱度排序前若干名的評(píng)論一般在開(kāi)始階段變動(dòng)較大,但大多在一段時(shí)間后變動(dòng)逐漸減小,甚至不變,相應(yīng)地,觀點(diǎn)勢(shì)場(chǎng)也從不穩(wěn)定場(chǎng)變?yōu)榉€(wěn)定場(chǎng),對(duì)應(yīng)的常見(jiàn)觀點(diǎn)勢(shì)演化趨勢(shì)如圖1所示。圖1微博評(píng)論觀點(diǎn)勢(shì)常見(jiàn)變化趨勢(shì)
利用評(píng)論的觀點(diǎn)勢(shì)場(chǎng)對(duì)觀點(diǎn)演化趨勢(shì)進(jìn)行預(yù)測(cè)時(shí),如果觀點(diǎn)勢(shì)場(chǎng)處于不穩(wěn)定狀態(tài)時(shí),可以根據(jù)其歷史變化趨勢(shì)對(duì)未來(lái)演化趨勢(shì)進(jìn)行預(yù)測(cè),并進(jìn)一步利用其預(yù)測(cè)未來(lái)觀點(diǎn)的演化趨勢(shì),如果觀點(diǎn)勢(shì)場(chǎng)已達(dá)到穩(wěn)定狀態(tài),則可直接利用當(dāng)前觀點(diǎn)勢(shì)的分布預(yù)測(cè)未來(lái)觀點(diǎn)極化趨勢(shì)。許多最終評(píng)論數(shù)達(dá)到上萬(wàn)條的博文,往往在評(píng)論數(shù)達(dá)到幾百條后,前幾十條評(píng)論就基本穩(wěn)定下來(lái)了,因此,本文后面的預(yù)測(cè)算法即以評(píng)論觀點(diǎn)勢(shì)場(chǎng)已達(dá)到穩(wěn)定為條件。
33基于觀點(diǎn)勢(shì)的觀點(diǎn)群體極化趨勢(shì)預(yù)測(cè)算法描述
輸入:各類(lèi)觀點(diǎn)排序向量R(1),R(2),…,R(n),作用力程影響因子σ
輸出:各類(lèi)觀點(diǎn)的觀點(diǎn)數(shù)量增長(zhǎng)比例預(yù)測(cè)、觀點(diǎn)極化度預(yù)測(cè)
算法步驟:
(1)[φ1,φ2,…,φ50]=Cal_opinionstr ength(R(1),R(2),…,R(n),σ)
//對(duì)每一個(gè)觀點(diǎn)根據(jù)觀點(diǎn)勢(shì)公式計(jì)算觀點(diǎn)勢(shì)值
(2)[φc1,φc2,…,φcn]=Sum_opinionstr ength(φ1,φ2,…,φ50)
//對(duì)各類(lèi)觀點(diǎn)的觀點(diǎn)勢(shì)值求和
(3)dgp=Cal_polarizabi lity(φc1,φc2,…,φcn)
//計(jì)算觀點(diǎn)勢(shì)極化度
(4)以各類(lèi)觀點(diǎn)勢(shì)的比值作為觀點(diǎn)增量比值的預(yù)測(cè),以觀點(diǎn)勢(shì)極化度作為觀點(diǎn)極化度的預(yù)測(cè)。
輸入中某類(lèi)觀點(diǎn)排序向量例:設(shè)在前50名排序評(píng)論中,第3、7、10、28、39、47名為第1類(lèi)觀點(diǎn),則第1類(lèi)觀點(diǎn)的排序向量為R(1)=[3710283947]。
4實(shí)驗(yàn)
41數(shù)據(jù)來(lái)源及初步處理
筆者以2017年11月份熱點(diǎn)“喜事變喪事,母親因兒彩禮輕生”中衍生的話(huà)題作為實(shí)證案例,對(duì)前文提出的微博觀點(diǎn)場(chǎng)群體極化趨勢(shì)預(yù)測(cè)方法進(jìn)行驗(yàn)證。以錢(qián)江晚報(bào)微博博文“喜事變喪事,母親因兒彩禮輕生,父親悲痛過(guò)度也跳河”為話(huà)題源的輿情子場(chǎng)來(lái)進(jìn)行觀點(diǎn)的群體極化趨勢(shì)預(yù)測(cè)。
評(píng)論主要聚焦于悲劇發(fā)生的根源討論,其中幾類(lèi)主要觀點(diǎn)為:
A:抨擊彩禮制度,同情男方及父母
B:女方要求不過(guò)分,不能將責(zé)任完全歸咎于女方及其父母,是男方家長(zhǎng)太偏激
C:男孩能力不足,連累父母
利用微博數(shù)據(jù)采集工具獲取從11月22日13點(diǎn)到11月23日9點(diǎn)59分的評(píng)論(不含回復(fù)),每隔1個(gè)小時(shí)采集該博文下評(píng)論原始數(shù)據(jù)1次,構(gòu)成評(píng)論的熱度序列數(shù)據(jù)。對(duì)每條評(píng)論進(jìn)行人工快速觀點(diǎn)判定,剔除少部分垃圾評(píng)論和無(wú)關(guān)評(píng)論,得到上述3類(lèi)關(guān)于悲劇發(fā)生根源的共1 021條評(píng)論作為實(shí)驗(yàn)數(shù)據(jù)。
42實(shí)驗(yàn)方法
到22日16點(diǎn)59分,A、B、C 3類(lèi)觀點(diǎn)共計(jì)達(dá)到229條,熱度排序前50中屬于A、B、C 3類(lèi)的觀點(diǎn)數(shù)為49條,從此時(shí)到數(shù)據(jù)提取截止時(shí)間,熱度排序前50條評(píng)論變動(dòng)極小,按前述觀點(diǎn)勢(shì)計(jì)算模型可知此后觀點(diǎn)勢(shì)變化也極小,實(shí)驗(yàn)就以此時(shí)觀點(diǎn)場(chǎng)勢(shì)分布來(lái)預(yù)測(cè)觀點(diǎn)極化趨勢(shì)。
421預(yù)測(cè)
按33算法計(jì)算各類(lèi)觀點(diǎn)增長(zhǎng)比率預(yù)測(cè)值、增量評(píng)論的觀點(diǎn)極化度預(yù)測(cè)值。
422預(yù)測(cè)偏差率的計(jì)算
統(tǒng)計(jì)22日17點(diǎn)到23日9點(diǎn)59分各類(lèi)觀點(diǎn)的增量并計(jì)算各類(lèi)觀點(diǎn)增量的實(shí)際比率,然后按下述方法計(jì)算各類(lèi)觀點(diǎn)增量預(yù)測(cè)的偏差率。
∑3t=1lt-ktkt2(5)
其中l(wèi)1,l2,l3為預(yù)測(cè)的各類(lèi)觀點(diǎn)增長(zhǎng)比率,k1,k2,k3為各類(lèi)觀點(diǎn)增量的實(shí)際比率。
利用22日17點(diǎn)到23日9點(diǎn)59分各類(lèi)觀點(diǎn)的增量,按觀點(diǎn)勢(shì)極化度公式計(jì)算觀點(diǎn)增量極化度,并按下述方法計(jì)算觀點(diǎn)極化度預(yù)測(cè)的偏差率。
dφ-dvdv×100%(6)
其中dφ為當(dāng)前觀點(diǎn)勢(shì)極化度值,dv為增量評(píng)論的觀點(diǎn)極化度值。
43結(jié)果與分析
431結(jié)果
按照上述方法,用后來(lái)評(píng)論的數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)對(duì)比,得到的結(jié)果如表1所示。表1預(yù)測(cè)結(jié)果
預(yù)測(cè)項(xiàng)目各類(lèi)觀點(diǎn)評(píng)論增量比率增量評(píng)論的
觀點(diǎn)極化度預(yù)測(cè)02299:06327:0137407699實(shí)際02209:06422:0136907786預(yù)測(cè)偏差率(%)131112
432分析
分析結(jié)果可以看到,基于觀點(diǎn)勢(shì)的觀點(diǎn)趨勢(shì)預(yù)測(cè)模型對(duì)于輿情事件的觀點(diǎn)趨勢(shì)預(yù)測(cè)有很高的準(zhǔn)確率。在本例中,雖然預(yù)測(cè)開(kāi)始時(shí)3類(lèi)觀點(diǎn)的極化度較高(08291),但由于觀點(diǎn)勢(shì)的極化度相對(duì)較低(07699)并一直保持基本不變,評(píng)論最終的觀點(diǎn)極化度趨向于觀點(diǎn)勢(shì)的極化度,說(shuō)明利用當(dāng)前觀點(diǎn)勢(shì)的分布能有效判別未來(lái)觀點(diǎn)分布的發(fā)展趨勢(shì)。
5結(jié)束語(yǔ)
輿論趨勢(shì)預(yù)測(cè)是網(wǎng)絡(luò)輿情研究領(lǐng)域中一個(gè)非常重要的課題。常見(jiàn)的輿情演化分析方法大多基于網(wǎng)民觀點(diǎn)相互連接、交互影響和更新模型來(lái)評(píng)估群體觀點(diǎn)演化趨勢(shì),但網(wǎng)絡(luò)輿情事件群體觀點(diǎn)的演化,往往并不是初期參與輿情事件討論的網(wǎng)民的觀點(diǎn)相互碰撞、改變的結(jié)果,更多的是后期不斷增加的網(wǎng)民的觀點(diǎn)受前期影響力大的觀點(diǎn)的作用形成的。因此,輿情事件群體觀點(diǎn)的演化預(yù)測(cè),關(guān)鍵是要較準(zhǔn)確評(píng)估已發(fā)表的顯性觀點(diǎn)對(duì)后來(lái)網(wǎng)民觀點(diǎn)形成的影響力。本文從場(chǎng)的視域?qū)W(wǎng)絡(luò)輿情事件中觀點(diǎn)的演化特征進(jìn)行分析,提出了用觀點(diǎn)勢(shì)來(lái)刻畫(huà)網(wǎng)絡(luò)輿情事件觀點(diǎn)場(chǎng)中各類(lèi)觀點(diǎn)的影響力,并以新浪微博博文作為根源信息構(gòu)成的評(píng)論觀點(diǎn)場(chǎng)為對(duì)象,構(gòu)造了一種基于觀點(diǎn)勢(shì)作用模型的博文評(píng)論觀點(diǎn)趨勢(shì)預(yù)測(cè)方法,所提出的方法利用虛擬觀點(diǎn)場(chǎng)描述網(wǎng)民觀點(diǎn)的作用,相較于常見(jiàn)的基于網(wǎng)民個(gè)體之間觀點(diǎn)直接相互作用的輿情演化模型,大大降低了實(shí)現(xiàn)的難度。實(shí)驗(yàn)結(jié)果顯示,該方法具有較高的預(yù)測(cè)準(zhǔn)確率,且在博文評(píng)論觀點(diǎn)趨勢(shì)預(yù)測(cè)的實(shí)際應(yīng)用中,該方法一般只需對(duì)排序靠前的少量評(píng)論的觀點(diǎn)進(jìn)行識(shí)別即可對(duì)未來(lái)大量評(píng)論的觀點(diǎn)分布進(jìn)行預(yù)測(cè),在目前評(píng)論觀點(diǎn)自動(dòng)識(shí)別技術(shù)還不十分成熟的情況下,更具有現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1]Borra D,Lorenzi T.Asymptotic Analysis of Continuous Opinion Dynamics Models Under Bounded Confidence[J].Communications on Pure and Applied Analysis,2013,12(3):1487-1499.
[2]Su W,Gu Y J,Wang S.et al.Partial Convergence of Heterogeneous Hegselmann-Krause Opinion Dynamics[J].Science China Technological Sciences,2017,60(9):1433-1438.
[3]李根強(qiáng),羅艷艷,臧學(xué)蓮.基于有界信任模型的網(wǎng)絡(luò)社群輿情觀點(diǎn)演化研究[J].情報(bào)科學(xué),2017,(6):63-68.
[4]何建佳,劉舉勝,王祥兵.認(rèn)知失調(diào)視角下網(wǎng)絡(luò)輿論演化模式與對(duì)策研究[J].現(xiàn)代情報(bào),2018,38(3):58-65,78.
[5]Meier J,Zhou X,Hillebrand A.et al.The Epidemic Spreading Model and the Direction of Information Flow in Brain Networks[J].Neuroimage,2017,152:639-646.
[6]Maroufy E I H,Kernane T,Becheket S.et al.Bayesian Inference for Nonlinear Stochastic SIR Epidemic Model[J].Journal of Statistical Computation and Simulation,2016,86(11):2229-2240.
[7]李青,朱恒民.基于BA網(wǎng)絡(luò)的互聯(lián)網(wǎng)輿情觀點(diǎn)演化模型研究[J].情報(bào)雜志,2012,31(3):6-9.
[8]鐘敏娟.無(wú)標(biāo)度特性下的有界信任交互網(wǎng)絡(luò)偽輿情演化建模及仿真研究[J].小型微型計(jì)算機(jī)系統(tǒng),2017,38(6):1284-1289.
[9]黃微,高俊峰.基于觀點(diǎn)勢(shì)能測(cè)度的網(wǎng)絡(luò)輿情場(chǎng)極性識(shí)別研究[J].情報(bào)學(xué)報(bào),2016,35(11):1185-1196.
[10]吳國(guó)恩.論信息的情報(bào)運(yùn)動(dòng)及其規(guī)律[J].圖書(shū)情報(bào)工作,1990,34(3):1-6.
[11]淦文燕,李德毅,王建民.一種基于數(shù)據(jù)場(chǎng)的層次聚類(lèi)方法[J].電子學(xué)報(bào),2006,34(2):258-262.
[12]霍鳳寧,禹婷婷,孫寶文.網(wǎng)絡(luò)群體極化的判定、測(cè)量與干預(yù)策略研究[J].電子政務(wù),2015,(10):19-26.
[13]于欣彤.微博的評(píng)論轉(zhuǎn)發(fā)功能對(duì)群體極化現(xiàn)象的影響分析——以王寶強(qiáng)離婚事件為例[J].新聞研究導(dǎo)刊,2017,8(1):71-74.
[14]黃微,王潔晶,趙江元.微博輿情信息老化測(cè)度研究[J].情報(bào)資料工作,2017,(6):6-11.
[15]蔡荻.微博空間中的輿論形成及社會(huì)影響——以“郭美美事件”為例[J].中國(guó)傳媒科技,2011,(12):5-7.
(責(zé)任編輯:孫國(guó)雷)2018年9月第38卷第9期現(xiàn)代情報(bào)Journal of Modern InformationSep.,2018Vol38No92018年9月第38卷第9期學(xué)術(shù)網(wǎng)絡(luò)社會(huì)資本視角下的學(xué)科評(píng)價(jià)指標(biāo)探索Sep.,2018Vol38No9
收稿日期:2018-06-05