王曰芬 許杜娟 楊振怡 羅浩
〔摘 要〕[目的/意義]針對同一事件新聞報道與輿情評論既相互依存又偏離的現(xiàn)象,通過話題識別與主題關(guān)聯(lián)分析,探索新聞報道引發(fā)的輿情評論在主題內(nèi)容與時間階段上的異同,擬為研究以輿情評論表達的輿情事件和以新聞報道表達的社會現(xiàn)實之間的共振與偏離,進而為探究社會輿情傳播規(guī)律提供參考,為服務(wù)政府科學(xué)決策提供依據(jù)。[方法/過程]以拉斯韋爾(5W)模型、LDA主題模型和Python工具為基礎(chǔ),設(shè)計研究思路和流程,從騰訊新聞和知乎平臺上抓取新聞報道和評論的數(shù)據(jù),經(jīng)過處理加工過后加以分析挖掘。[結(jié)果/結(jié)論]研究發(fā)現(xiàn):輿情事件主題會一定程度偏離社會現(xiàn)實主題,衍生出更多隱性主題;輿情事件與社會現(xiàn)實的發(fā)展走向較一致;此外,社交媒體相較于新聞媒體所衍生的輿情事件主題更多,而兩者反映的社會現(xiàn)實主題類似。
〔關(guān)鍵詞〕輿情評論;新聞報道;主題發(fā)現(xiàn);輿情事件;社會現(xiàn)實;關(guān)聯(lián)分析
DOI:10.3969/j.issn.1008-0821.2018.06.001
〔中圖分類號〕G203 〔文獻標(biāo)識碼〕A 〔文章編號〕1008-0821(2018)06-0003-08
〔Abstract〕[Purpose/Significance]Regarding to the phenomenon that news reports and public opinions of the same event were interdependent and also deviated from each other,the paperexplore the differences and similarities of public opinions triggered by news reports in subject content and time phasing by topic detection and subject association analysis.This research planed to study the resonance and deviation between public events reflected in public opinions and social reality reflected in news reports,which would provide a reference for exploring the communication rule of social public opinions and offer a basis for government to make scientific decisions.[Process/Method]Based on Lasswells 5W communication model,LDA model and Python,the paper designed research ideas and process,crawled the corpus of news reports and their corresponding comments from Tencent News and Quaro and deeply analyzed the processed corpus.[Results/Conclusion]The research results indicated that more derivative latent subjects would be found in public opinions events which partly diverged from the subjects of social reality;the developing trends of public opinions events conformed with that of social reality;in addition,subjects of public opinions events reflected in social media were more than news media,while the subject content of social reality seemed similar on these two platforms.
〔Key words〕public opinions;news reports;topic discovery;public opinions events;social reality;association analysis
輿情被認為是公眾對于現(xiàn)實社會及社會中各種現(xiàn)象、問題所表達的信念、態(tài)度、意見和情緒表現(xiàn)的總和,是實現(xiàn)社會調(diào)控必不可少的制約力量[1]。而輿情事件是指在一定時期、一定的社會空間內(nèi),被公眾廣泛關(guān)注的事件,通常通過某種中介(一般是媒體)擴散,促使公眾產(chǎn)生某種具有廣泛影響力的傾向性,并非所有的事件都必然成為輿情事件[2]。同時,新聞是對現(xiàn)實社會的建構(gòu)[3],是對社會現(xiàn)實事件的表達與反映。新聞報道經(jīng)過傳播后,引發(fā)社會公眾反響,當(dāng)反響的社會影響力較大時會產(chǎn)生輿情事件。伴隨著網(wǎng)絡(luò)傳播即時性、擴散性和社交媒體交互性、多元性的發(fā)展,通過網(wǎng)絡(luò)平臺傳播的突發(fā)或者重大新聞報道通常會迅速引發(fā)社會公眾輿情評論的噴涌。同時,社會現(xiàn)實與公眾認知的斷裂、輿情反響與政府應(yīng)對的沖突等,加大了政府決策與管理的難度[4]。輿情評論與新聞報道導(dǎo)致的輿情事件與社會現(xiàn)實關(guān)聯(lián),作為一種現(xiàn)象或問題,影響網(wǎng)民對社會事件的認知和媒體的報道策略,并影響著政府或者涉事主體的行為選擇。因此,在單一熱點社會現(xiàn)實事件演化過程中,新聞報道引發(fā)的網(wǎng)民評論會牽扯出更多相關(guān)主題,這些衍生主題又會成為社會關(guān)注的新熱點。那么,一旦新聞報道之后,在主題內(nèi)容和時間上會激起哪些輿情評論以及如何發(fā)展,輿情評論主題的偏離現(xiàn)象與共振衍生狀態(tài)怎樣,是深化社會輿情傳播研究中值得探索的。
通過前期的調(diào)研,發(fā)現(xiàn)相關(guān)研究主要集中在輿情關(guān)聯(lián)、輿情信息擴散及其研究方法兩個方面。在輿情關(guān)聯(lián)及其研究方法方面,王國華等[5]認為輿情關(guān)聯(lián)是指網(wǎng)絡(luò)熱點事件輿情通過主體、主題、情緒等要素發(fā)生聯(lián)系生成輿情簇或者輿情集,從而影響輿情演化的現(xiàn)象。王國華等[6]發(fā)現(xiàn)網(wǎng)絡(luò)熱點事件輿情關(guān)聯(lián)是由信息的眼球經(jīng)濟效應(yīng)媒體的協(xié)同過濾和議程設(shè)置以及網(wǎng)民的群體記憶等多種因素而促成。馬曉姝[7]提出一種基于LDA模型的聚類算法來發(fā)現(xiàn)新聞話題,以此來達到將相同新聞聚類并將聚類結(jié)果表示出來的目的。陳京民等[8]針對網(wǎng)絡(luò)輿情關(guān)聯(lián)規(guī)則挖掘的特點,設(shè)計了一種快速有效的基于XQuery的網(wǎng)絡(luò)輿情關(guān)聯(lián)規(guī)則挖掘系統(tǒng)。林萍等[9]根據(jù)網(wǎng)絡(luò)輿情事件時間性強、話題與時間關(guān)聯(lián)度單一的特征,提出了基于LDA模型抽取話題,分別使用后離散時間型話題模型與先離散時間型話題模型來研究話題熱度變化和話題內(nèi)容遷移,以此來體現(xiàn)話題演化路徑。唐曉波等[10]根據(jù)微博的數(shù)據(jù)特點和信息論中信息量的觀點,提出了微博熱度的概念并將其引入到LDA模型的熱點挖掘研究中,構(gòu)建了基于微博熱度的LDA模型;在輿情信息擴散及其研究方法方面,Yu等[11]基于輿情信息擴散過程中的用戶交互過程,考慮到用戶的交互歷史與相互作用的類型和頻率,提出了一種有向樹模型,該模型可以描述信息的擴散,更精確地表達輿情傳播的影響,在數(shù)據(jù)集中識別垃圾郵件更有效。石晶等[12]證實了LDA模型能夠進行準(zhǔn)確有效的文本分割來提取關(guān)鍵詞。而將新聞主題按照時間順序提取出來,會發(fā)現(xiàn)一個事件可能演化發(fā)展成幾個相關(guān)但獨立的主題。普林斯頓大學(xué)Blei[13]等提出的語料庫生成概率模型廣泛應(yīng)用于新聞主題識別和追蹤,以此來發(fā)現(xiàn)主題擴散與演化的規(guī)律。
綜上所述,輿情關(guān)聯(lián)與輿情信息擴散已經(jīng)得到學(xué)者的關(guān)注,在模型構(gòu)建與方法上產(chǎn)生了不少很有價值的研究成果。為了深化與擴展相關(guān)研究,針對社會發(fā)展需求和所提出的問題,本文擬以新聞媒體報道來表達社會現(xiàn)實事件、以公眾評論來表達輿情事件為研究的前提,以騰訊新聞平臺為主、知乎平臺為輔,以“山東辱母殺人事件”這一事件為研究案例,采集該事件數(shù)據(jù),利用LDA模型對新聞內(nèi)容和評論內(nèi)容的主題進行提取,進而從評論數(shù)量、發(fā)展階段與不同媒體3個角度對主題建立關(guān)聯(lián)并加以分析。
1 研究設(shè)計與數(shù)據(jù)處理
1.1 研究的理論基礎(chǔ)與方法
1.1.1 拉斯韋爾(5W)模型
在傳播學(xué)的諸多模式中,拉斯韋爾的5W模型是最基本和最為人們所熟知的模型。它主要通過5個要素,即:“誰(who)”、“說了什么(say what)”、“通過什么渠道(in which channel)”、“對誰說的(to whom)”、“產(chǎn)生了什么效果(with what effect)”,用以描述一個傳播行為,具體如圖1所示。
1.1.2 LDA模型
LDA(Latent Dirichlet Allocation)是一種文檔主題生成模型,也稱為一個三層貝葉斯概率模型,包含詞、主題和文檔三層結(jié)構(gòu)。
LDA模型認為每篇文章是由多個主題組合而成的,而每個主題又是由多個詞語概率所表示的。它可以將文檔集中每篇文檔的主題以概率分布的形式給出,從而通過分析一些文檔并抽取出它們的主題出來后,便可以根據(jù)主題進行主題聚類或文本分類。同時,它是一種典型的詞袋模型,即一篇文檔是由一組詞構(gòu)成,詞與詞之間沒有先后順序的關(guān)系。LDA能夠根據(jù)給定的一篇文檔,推測其主題分布。因此在LDA模型中,要生成一篇文檔,該文檔中每個詞語出現(xiàn)的概率為:
用在本研究中,其主要思想是將每條評論看作所有主題的一個混合概率分布,而將其中的每個主題看作在單詞上的一個概率分布。
根據(jù)所提出的研究問題,借鑒已有的研究成果,本文將拉斯韋爾模式和LDA模型結(jié)合,針對傳播要素及其之間關(guān)聯(lián)關(guān)系進行分析與深度挖掘,突出不同輿論會話在要素層面上的語義關(guān)聯(lián)和深度聚合研究,以揭示社會輿情信息的主題、傳播特點和演變規(guī)律,為輿情信息分析和決策支持提供重要支撐。
1.2 研究框架
在研究設(shè)計中,根據(jù)前述的研究前提,在新聞媒體的選擇上,以騰訊新聞為主要研究平臺,并輔以社交媒體知乎平臺為輔助;在案例事件的選擇上,以“山東辱母殺人事件”新聞報道與輿情評論為實證對象。并擬定輿情事件指的是由新聞報道(或知乎提問)中有關(guān)社會現(xiàn)實所產(chǎn)生的評論(或知乎回答),而社會現(xiàn)實指的是新聞媒體所報道(知乎提問)的基于事件本身的描述。所設(shè)計的分析流程如下:首先,分別從騰訊新聞與知乎上獲取新聞、評論和提問的數(shù)據(jù),進行話題識別;然后,對這些話題進行LDA建模和主題抽取,以此來確定顯性主題;最后,從評論數(shù)量、發(fā)展階段與不同媒體不同角度,對這些顯性主題進行輿情評論與新聞報道之間的關(guān)聯(lián),輔以社交媒體與新聞媒體的對比,以分析輿情事件與社會現(xiàn)實之間的差異,并發(fā)現(xiàn)得到某一輿情事件的隱性主題。具體研究框架如圖2所示:
1.3 數(shù)據(jù)采集與處理
2017年3月的“山東辱母殺人事件”引發(fā)了網(wǎng)民的熱烈討論,關(guān)心的面較寬、關(guān)聯(lián)的話題較多。因此,本文在騰訊新聞與知乎的搜索欄輸入“辱母殺人”檢索相關(guān)新聞(提問)與評論(回答),根據(jù)事件的進展,首先,利用Python爬蟲爬取2017年3月24日至2017年3月30日的騰訊新聞與知乎平臺上有關(guān)此事件的數(shù)據(jù),數(shù)據(jù)包括:騰訊新聞內(nèi)容和評論以及知乎上有關(guān)此話題的提問和回答,得到24篇新聞報道和93 190條相應(yīng)評論以及知乎平臺上51條提問和相應(yīng)的回答。然后,將所爬取的這7天相關(guān)新聞與評論數(shù)據(jù)進行分詞和去停用詞處理,最后,將處理結(jié)果保存到TXT文檔中并分別存放在以相應(yīng)日期命名的文件夾中。
2 基于LDA建模的話題識別
在對所采集數(shù)據(jù)進行處理之后,為發(fā)現(xiàn)以輿情評論(知乎回答)所代表的輿情事件與以新聞報道(知乎提問)所代表的社會現(xiàn)實之間關(guān)聯(lián)的隱性主題,首先采用Python中的WordCloud包制作關(guān)鍵詞云圖來初步識別話題并對其分階段處理與表示,而后基于LDA建模,從整體或分段兩個層面對輿情評論(知乎回答)和新聞報道(知乎提問)進行主題提取。本課題的研究對象是新聞媒體所報道的新聞與它所對應(yīng)的評論信息、知乎提問和它所對應(yīng)的回答信息,在對兩者數(shù)據(jù)進行數(shù)據(jù)預(yù)處理后,分別進行主題識別和基于LDA建模進行主題聚類,提取最能體現(xiàn)兩者內(nèi)容的主題,以探究輿情事件與社會現(xiàn)實之間主題的共振和偏離。本文設(shè)定顯示詞的最大個數(shù)為100。
2.1 輿情評論的話題識別
在對數(shù)據(jù)進行采集與處理后,對體現(xiàn)輿情的評論數(shù)據(jù)進行詞頻統(tǒng)計并制作云圖,結(jié)果如圖3所示(其中,由于2017年3月29日的暫無評論數(shù)據(jù),因此未將該天評論數(shù)據(jù)爬取下來)。由圖3可以看出,在前3天,評論的熱點話題重點在于警察、法官。2017年3月27日至28日評論熱點話題與“高利貸”、“銀行”有關(guān)。2017年3月30日評論話題圍繞侮辱行為、法律、是否應(yīng)判無罪釋放而展開。
2.2 新聞報道的話題識別
在數(shù)據(jù)采集與處理后,對體現(xiàn)社會現(xiàn)實的新聞報道數(shù)據(jù)進行詞頻統(tǒng)計并制作云圖,結(jié)果如圖4所示。由圖4可以看出,前3天的熱點關(guān)鍵詞涉及涉案人員、案件性質(zhì)與類型以及對于警察與法律的探討。2017年3月27日至28日2天的新聞關(guān)鍵詞體現(xiàn)了案件背景,對此案件背后所暗含的企業(yè)銀行貸款以及高利貸進行了討論。2017年3月29日新聞關(guān)鍵詞為“檢查、介入、案件”,報道最高檢察院表示已介入此案件。2017年3月30日,新聞關(guān)鍵詞為“于歡、于秀榮”,主要由于山東通知案件雙方家人閱卷,又一次回顧案件。
從圖3和圖4的熱點話題可以看出,“辱母殺人事件”的話題可被劃分為3個階段,第一階段為2017年3月24日至26日,第二階段為2017年3月27日至28日,第三階段為2017年3月29日至30日。從評論與新聞關(guān)鍵詞云圖所反映的話題中,可以看出,輿情評論所反映的話題更加針對事件背后的問題和原因,而新聞報道所反映的話題主要針對事件本身,描述社會現(xiàn)實。
3 輿情評論與新聞報道之間的主題關(guān)聯(lián)分析
新聞傳播與輿情發(fā)展的時間敏感性很強,為了在后續(xù)主題研究中能夠深入進行分析,首先考察新聞報道與評論數(shù)量隨著時間的分布及其變化趨勢。
3.1 評論與報道數(shù)量隨著時間的變化趨勢
3.1.1 騰訊新聞的相關(guān)評論數(shù)量分布與變化趨勢
通過Python爬取騰訊新聞相關(guān)評論數(shù)據(jù),統(tǒng)計并繪制騰訊新聞的評論數(shù)隨時間的變化,如圖5所示。由此可知,在2017年3月24日,在騰訊新聞上該事件已得到2萬多人的關(guān)注與評論,可以看出人們對于該事件爆發(fā)初期的反應(yīng)還是很大的,而民眾的關(guān)注度在2017年3月26日達到頂峰,而后開始減弱,2017年3月30日由于山東省高級法院做出回應(yīng)而評論量有些許回升。由圖5趨勢線可知,評論數(shù)量總體在前3天逐漸增長,在2017年3月26日之后下降。
3.1.2 騰訊新聞所報道的新聞數(shù)量分布與變化趨勢
統(tǒng)計所爬取的2017年3月24日到30日期間每日所發(fā)新聞的數(shù)量,繪制新聞報道數(shù)隨時間的變化,如圖6所示??梢钥吹?,新聞報道數(shù)量從2017年3月24日逐漸攀升,到26日報道數(shù)量達到頂峰,后面幾天的報道數(shù)量逐漸減少,30日時新聞數(shù)量有小的增長。由圖6趨勢線可知,新聞數(shù)量先增后降,2017年于3月26日左右達到頂峰。
從圖5、圖6的趨勢線可以看出,評論與新聞報道數(shù)量隨時間變化的趨勢大體吻合,新聞媒體與公眾的關(guān)注基本是從2017年3月24日開始,關(guān)注度漸漸提升,至2017年3月26日達到頂峰后逐漸減緩。需要注意的是2017年3月24日雖然只是轉(zhuǎn)載南方周末的一篇文章,但引起了大量的討論。從此可看出輿情事件可能先由一篇報道發(fā)起,引發(fā)輿論關(guān)注后,關(guān)注度逐漸上升,直到達到一個頂峰,最后衰退。
3.2 新聞媒體的評語與報道的主題關(guān)聯(lián)分析
本文采用LDA主題模型抽取主題詞。在抽取主題前需進行主題數(shù)的確定,由于目前對于主題數(shù)的確定一直沒有一個有效的方法。研究中主要采取反復(fù)實驗的方法,觀察實驗效果以確定一個合適的LDA模型主題數(shù)閾值。首先設(shè)定主題數(shù)為5進行實驗,之后主題數(shù)以5為單位疊加并進行實驗,在經(jīng)過4次實驗后,發(fā)現(xiàn)當(dāng)主題數(shù)設(shè)置為5時,不能完全展示主題,而當(dāng)主題數(shù)設(shè)置為10以上時,提取出的某些主題缺少意義。因此,選擇將抽取的主題數(shù)設(shè)置為10,并根據(jù)研究設(shè)計進行后續(xù)的研究。
3.2.1 基于整個時間段的主題關(guān)聯(lián)分析
分別抽取騰訊新聞2017年3月24日至30日期間整體的新聞報道和相應(yīng)評論的主題,并對兩者進行對比分析。抽取的主題結(jié)果如表1所示。
從表1中所列的結(jié)果得知:圍繞著高利貸、法律與警察,新聞報道引發(fā)了針對不同主題的評論,因而產(chǎn)生了不同的關(guān)聯(lián)。如主題1關(guān)于高利貸,新聞報道所述的社會現(xiàn)實是高利貸引發(fā)暴力,而評論所反映的輿情事件是對高利貸是否違法做出的爭論,以及呼吁國家管制懲治高利貸;主題2關(guān)于判決和主題5關(guān)于定罪,所述的是于歡對于一審無期徒刑判決進行上訴,而網(wǎng)民認為警察和法院不應(yīng)作為黑色勢力的保護傘,并支持于歡無罪;主題3和主題7關(guān)于法律,所述的是司法部門對于歡是否屬于正當(dāng)防衛(wèi)進行判決及以故意傷害罪判處無期,而網(wǎng)民關(guān)注中國的法律能否保護人民權(quán)益以及辯論法律究竟是什么和它的意義何在,希望并相信法律公正;主題4關(guān)于借放貸和主題8關(guān)于侮辱,新聞報道主題是關(guān)于蘇銀霞和吳學(xué)占、趙榮榮當(dāng)事人和催債者“罵人”,公眾評論認為媒體把焦點過多放在借貸上是為轉(zhuǎn)移民眾對案件中警察瀆職的關(guān)注,認為“罵人”甚至性侮辱所激發(fā)的于歡殺人行為應(yīng)屬于正當(dāng)防衛(wèi)。主題6關(guān)于警察職責(zé),新聞報道的是警察與法院對“辱母殺人案”有責(zé)任,而輿情事件中人們更關(guān)注在于歡一家被逼債而報警的情況下,警察未采取解決措施從而一定程度上沒有避免殺人案的發(fā)生,希望法律追究警察瀆職的責(zé)任;主題9和主題10關(guān)于行業(yè)現(xiàn)狀和借貸,所反映的社會現(xiàn)實是鋼貿(mào)行業(yè)的借貸融資現(xiàn)狀,蘇銀霞的源大工貿(mào)借款總數(shù)近千萬,而輿情事件所關(guān)注的主題是在該行業(yè)發(fā)展不佳難以取得銀行貸款的情況下,企業(yè)因此轉(zhuǎn)向借高利貸,當(dāng)?shù)鼐炜赡苌婧诓痈呃J勢力。同時,認為借款者兒子因為催債者侮辱母親受到刺激而導(dǎo)致殺人。
通過上述主題關(guān)聯(lián)分析,可以看出針對新聞報道所反映的社會現(xiàn)實,經(jīng)過輿情評論后使輿情事件產(chǎn)生出更多探討社會現(xiàn)實背后原因的主題,這些主題就是輿情衍生出的關(guān)聯(lián)隱性主題,即與社會現(xiàn)實共振又有一定程度偏離,在效果上往往能夠引發(fā)共鳴并得到廣泛傳播且影響更多人。
3.2.2 基于不同階段的主題對比分析
由上述對話題的初步識別,將“山東辱母殺人事件”的話題發(fā)展按時間劃分為3個階段,第一階段為2017年3月24日至26日,第二階段為2017年3月27日至28日,第三階段為2017年3月29日至30日。下面分別對這3個階段的騰訊新聞報道和評論主題進行對比分析。
1)第一階段
表2為第一階段騰訊新聞的評論和報道的主題抽取情況,從中可以得出,新聞報道所反映的社會現(xiàn)實主題主要是陳述案件的起因經(jīng)過、涉案人員、案件性質(zhì)以及法律對于該案件的判決。而評論所反映的輿情事件主題主要是有關(guān)法律的公正性、法律對于案件的裁決、國家對于高利貸的管控、在辱母殺人案發(fā)生之前警察接到報警而未出警的失職行為、于歡因不堪其母被辱而刺死一人的行為的刑事屬性以及對于所牽涉警方和法官公正執(zhí)法的質(zhì)疑。
2)第二階段
表3是第二階段騰訊新聞的評論和新聞的主題抽取情況,從中可以得出,所述的社會現(xiàn)實主要有關(guān)蘇銀霞所有公司源大工貿(mào)的借貸情況、負債情況、經(jīng)營業(yè)務(wù)以及由源大工貿(mào)所反射的近幾年鋼貿(mào)行業(yè)的困境。而針對這些社會現(xiàn)實的主題,評論中輿情事件的主題演變?yōu)閲覒?yīng)扶持民營企業(yè)、推動經(jīng)濟發(fā)展、媒體記者轉(zhuǎn)移輿論話題、暴力催債的道德問題、警察的不作為甚至涉黑問題,黑社會高利貸所引發(fā)的社會問題。
3)第三階段
表4是第三階段騰訊新聞的評論和新聞的主題抽取情況,從中可以得出,新聞報道所反映的社會現(xiàn)實主題主要圍繞法院對此案件的受理、審查、裁決、回應(yīng)展開,還涉及被刺死的催債者杜志浩家人的采訪陳述。而評論所反映的輿情事件主題主要關(guān)于希望加大法律對高利貸的制約,希望法律公正判決此案件,認為于歡是正當(dāng)防衛(wèi)并支持其無罪釋放、警方應(yīng)為此殺人案承擔(dān)責(zé)任、對于于歡為保護母親而殺人的理解和對高利貸及死者杜志浩的譴責(zé)。
從上述3個階段輿情評論和新聞報道的主題對比中可發(fā)現(xiàn),第一階段的新聞報道主要針對案件本身進行描述,其評論主題主要討論案件中所涉及政府司法部門以及政府對于高利貸的管理,這些主題構(gòu)成比較簡單,相關(guān)主題延伸不夠深入;第二階段,新聞報道主要針對高利貸和案件的債權(quán)背景,期間的評論主題延伸到了新聞媒體轉(zhuǎn)移輿論關(guān)注、道德問題、警察涉黑問題、國家經(jīng)濟發(fā)展問題以及黑社會高利貸的不良社會影響;第三階段,新聞報道主要針對法院對于“辱母殺人案”進展的通報。這一階段的輿論主題因此更為關(guān)注案件中的法律問題,比如放高利貸的合法性、法律公正性問題,呼吁法院裁決于歡無罪釋放、警察瀆職所需承擔(dān)的法律責(zé)任。綜上所述,三個階段的輿情事件衍生的主題既有全新的,如媒體轉(zhuǎn)移輿論話題,也有將前階段主題再次聯(lián)系和加深的。但總體來看,輿情事件主題大多是圍繞社會現(xiàn)實進行延伸的,其中核心主題是對高利貸問題、警察執(zhí)法、法院判決、政府管理以及侮辱行為的深入探討。
3.3 新聞媒體與社交媒體的主題關(guān)聯(lián)分析
為了從不同媒體角度進行分析,本文選擇社交媒體知乎作以輔助。采用上述的數(shù)據(jù)處理與主題抽取方法,首先分析知乎平臺上輿情事件和社會現(xiàn)實之間的主題關(guān)聯(lián),然后,對比分析新聞媒體和社交媒體之間的主題,并比較不同平臺所衍生的主題。通過數(shù)據(jù)采集處理與LDA主題抽取后,得到如表5所示的知乎提問與回答的10個主題。
從表5中所列的結(jié)果得知:主題1反映的社會現(xiàn)實是“山東辱母事件”的起因,蘇銀霞的企業(yè)為了企業(yè)周轉(zhuǎn)向吳占學(xué)借高利貸,但有群眾舉報吳占學(xué)其實是招攬黑社會從事高利貸和收款事物,而回答所反映的輿情事件是高利貸是否與黑社會有關(guān);主題2反映的社會現(xiàn)實是法官對于歡的判決,回答反映的輿情事件是社會民眾對中國法律的不信任和對英美法的比較;主題3的社會現(xiàn)實是濟南公安發(fā)布一篇“大巴與驢”嘲諷意味的微博,反映的輿情事件是網(wǎng)民針對梁山革命、南宋王公袞辱母殺人案件等歷史事件的討論;主題4是于歡作為兒子看到母親被侮辱想要為母親復(fù)仇這一社會現(xiàn)實,其輿情事件表現(xiàn)在網(wǎng)友聯(lián)想到“春秋決獄”,“徐元慶為父報仇”等一系列事件;主題5是從社會道德方面引發(fā)于歡的行為是否是正當(dāng)防衛(wèi)的思考,這也從側(cè)面表達出網(wǎng)民對于法官的判決存在異議,也說明了社會民眾現(xiàn)在并不是盲目的觀看事件報告,而是對事件擁有了參與權(quán)并在積極行使這一權(quán)利;主題6反映的是新聞報道了一系列法律與倫理的新聞,引發(fā)了網(wǎng)民的新一輪的關(guān)注熱潮,也讓司法部門全力調(diào)查該案件;主題7是由于法官的判決引發(fā)了人民對政府的討論,使得民眾以后對該類問題高度敏感,思考政府是否還是官僚主義,造成民眾政治冷漠;主題8是因為該案件引發(fā)的社會反應(yīng)較大,一些網(wǎng)民就在知乎上提問或者回答別人的提問,也有網(wǎng)民想到如何將該案件變成高考素材、司考素材等其他;主題9是法律在該案件中的作用:讓人思考平民遇到黑社會催債法律是否會一直這樣判,中國法律是否能真正做到保護公民的利益;主題10是從法律保護階段讓人不得不思考法律是否會真正保護臨時工、驢民等這些基層人民,這有可能已造成政府公信力下降,使得政府與民眾的互動變得更加困難。
綜上所述,在知乎平臺上,網(wǎng)民在關(guān)注社會現(xiàn)實的情況下,也會加入自己的思考,由此衍生出一系列的隱性主題。在獲得“高利貸”、“正當(dāng)防衛(wèi)”、“警察”、“法律”等顯性主題后,經(jīng)過輿情事件與社會現(xiàn)實之間主題關(guān)聯(lián)分析,還獲得“英美法”、“臨時工”、“高考素材”等輿情事件的隱性主題。然后,通過將這些輿情事件的主題與上述對騰訊新聞媒體分析所得到的結(jié)論進行比較,得到表6所示的結(jié)果。
通過對比知乎與騰訊這兩個平臺的輿情事件主題,發(fā)現(xiàn)不管是知乎還是騰訊,評論者都對新聞報道所反映的社會現(xiàn)實問題關(guān)注度較高,尤其是國家法律方面和警察不作為問題等這些和社會民眾現(xiàn)實生活密切相關(guān)的主題。同時,評論者也在思考該事件對自己生活的影響程度,是否有借鑒意義。但是,騰訊用戶更多的是關(guān)注道德問題、媒體是否故意引導(dǎo)并轉(zhuǎn)移輿論關(guān)注、社會不良風(fēng)氣和勢力等,其衍生的主題偏離度不高。而知乎上的評論者由該事件法院的判決聯(lián)想到國外法律是怎樣保護被害人的權(quán)益,由該“辱母殺人案”聯(lián)想到“古代辱母(父)殺人案”,小部分網(wǎng)民還聯(lián)想到“高考素材”、“司考”等。
綜上所述,即使平臺不同,針對某一類現(xiàn)實事件其社會現(xiàn)實主題大都類似,大都是對該事件的描述。在“山東聊城辱母事件”事件中,評論者普遍關(guān)心的還是該案件會如何判決,法律與道德之間到底怎樣才能協(xié)調(diào)好,但由于平臺類型的區(qū)別,騰訊更多的是新聞發(fā)布及其評論,知乎更多的是評論者共同討論,所以導(dǎo)致在知乎這一平臺上所衍生的輿情事件的主題更多,這對輿情事件和社會現(xiàn)實主題關(guān)聯(lián)問題的深入研討,準(zhǔn)確把握輿情時間的發(fā)展變化規(guī)律有著更大地幫助。同時,有助于了解評論者的認知水平和對事物的判斷能力,分析與判斷因評論者影響的輿情事件的走向。
4 結(jié) 語
通過研究,本文得到如下的結(jié)論與思考:
1)從新聞報道數(shù)與輿情評論數(shù)隨著時間變化來看,騰訊新聞通過對某一社會現(xiàn)實的報道,引發(fā)評論者關(guān)注以此形成輿情事件,隨著報道該社會現(xiàn)實事件的關(guān)注度逐漸上升,評論數(shù)量也在逐漸上升,達到輿情事件的高潮階段后隨著時間的推移逐漸回歸平淡。由此可見,新聞報道數(shù)量與輿情評論數(shù)量之間存在著一個正向線性關(guān)系。
2)從騰訊新聞的新聞報道和評論主題的關(guān)聯(lián)來看,新聞媒體報道的社會現(xiàn)實經(jīng)過時間的發(fā)酵,輿情事件的主題在一定程度上偏離了社會現(xiàn)實的主題,而衍生出一些隱性主題。
3)通過對比分析騰訊新聞不同階段新聞報道和評論的主題,得出同一事件在不同的時間段內(nèi)其主題是不斷地變化的,即社會的關(guān)注點隨著時間的推移也在不斷地變化。
4)通過對比分析新聞媒體(騰訊新聞)和社交媒體(知乎)所反映的輿情事件與社會現(xiàn)實的主題,發(fā)現(xiàn)不同平臺針對某一社會現(xiàn)實其評論者關(guān)注點大部分是類似的。但不同于新聞媒體的是,由于社交網(wǎng)站的交互性更強,其衍生的輿情事件主題往往更多。
綜上所述,本文的研究對于深化輿情內(nèi)容分析、把握輿情事件發(fā)展的特點與規(guī)律,對于政府決策和管理,將提供一定的理論參考與依據(jù)。在后續(xù)的研究中,還需要具體研究主題之間的關(guān)聯(lián)程度并挖掘潛在的語義關(guān)聯(lián)。
參考文獻
[1]徐曉日.網(wǎng)絡(luò)輿情事件的應(yīng)急處理研究[J].華北電力大學(xué)學(xué)報,2007,(1):89-93.
[2]高憲春.新媒體環(huán)境下輿情事件互動機制分析[J].當(dāng)代傳播,2011,(6):50-53.
[3]蓋伊·塔奇曼.做新聞[M].北京:華夏出版社,2008.
[4]陳必坤,王曰芬,廖海涵.大數(shù)據(jù)時代社會輿情分析與決策支持研究的現(xiàn)狀及其發(fā)展趨勢[J].情報科學(xué),2016,(10):8-14.
[5]王國華,曾潤喜,方付建.解碼網(wǎng)絡(luò)輿情[M].武漢:華中科技大學(xué)出版社,2011.
[6]王國華,鄧海峰,王雅蕾,等.網(wǎng)絡(luò)熱點事件中的輿情關(guān)聯(lián)問題研究[J].情報雜志,2012,31(7):1-5.
[7]馬曉姝.基于LDA 模型的新聞話題發(fā)現(xiàn)研究[D].長春:東北師范大學(xué),2014.
[8]陳京民,張振.一種基于XQuery的網(wǎng)絡(luò)輿情關(guān)聯(lián)規(guī)則挖掘系統(tǒng)[J].中國制造業(yè)信息化,2009,38(9):68 -70.
[9]林萍,黃衛(wèi)東.基于 LDA 模型的網(wǎng)絡(luò)輿情事件話題演化分析[J].情報雜志,2013,32(12):26-30.
[10]唐曉波,向坤.基于LDA模型和微博熱度的熱點挖掘[J].圖書情報工作,2014,58(5):58-63.
[11]Yu M,Yang W,Wang W,et al.Information Diffusion and Influence Measurement Based on Interaction in Microblogging[M]Social Media Processing.Heidelberg,berlin:Springer Berlin Heidelberg,2014:129-140.
[12]石晶,范 猛,李萬龍.基于LDA模型的主題分析[J].自動化報,2009,35(12):1586-1592.
[13]Blei D M,Ng A Y,Jordan M I.Latent Dirichletal Allocation[J].Journal of Machine Learning Research,2003,(3):993-1022.
(責(zé)任編輯:馬 卓)