摘要:議程設置研究受到廣泛關注,但議程內(nèi)部的傳導結構仍缺乏深入探討。本研究將微博帖子按照熱度進行“等頻分箱”,探索社交網(wǎng)絡信息在不同熱度的內(nèi)容層級間的傳導規(guī)律和議程“梯度擴散”效應與特征。本文對新浪微博中的20117408條樣本帖子分析表明:(1)熱度越接近的帖子層級之間,內(nèi)容傳導程度越高;(2)熱度層級與其他層級距離越小的帖子層,向其他層級的內(nèi)容傳導程度越高;腰部熱度層級比頭部和底部層級具備更高的內(nèi)容傳導程度;(3)層間內(nèi)容傳導程度隨著層級間熱度差距變化而出現(xiàn)階梯式遞增或遞減,可稱為梯度傳導性;(4)高熱度層級之間內(nèi)容傳導程度高于低熱度層級之間內(nèi)容傳導程度,且高熱度層級與低熱度層級之間呈現(xiàn)出傳導阻滯、流通性較低的特征;(5)由各個熱度層級的內(nèi)容傳導關系交錯構成的內(nèi)容傳導網(wǎng)絡,與層間熱度差值網(wǎng)絡存在同構性;(6J任意熱度層級越是處于內(nèi)容傳導網(wǎng)絡的中心層,在熱度差值網(wǎng)絡中的接近中心性越高;(7)全局的內(nèi)容傳導網(wǎng)絡存在“核心-邊緣”結構。本研究剖析議程設置中的內(nèi)容擴散網(wǎng)絡動力和約束,有助于思考在輿論、文化、社會、政治傳播等領域的信息梯度擴散效應與特殊結構。
關鍵詞:議程梯度擴散;內(nèi)容傳導;內(nèi)容熱度層級;議程網(wǎng)絡
中圖分類號:G206 文獻標識碼:A 文章編號:1671-7023(2024)03-0129-11
一、問題提出
麥庫姆斯和肖在1972年提出議程設置理論,闡明大眾傳媒如何為各類議題賦予不同的顯著性,影響公眾看待社會事件的先后順序和方式,其核心內(nèi)涵是“顯著性”(salience)的轉(zhuǎn)移,即媒體議程的顯著性轉(zhuǎn)移為公眾議程的顯著性。該理論已成為覆蓋新聞傳播學、社會學、政治傳播、市場營銷等領域的重要理論,產(chǎn)生了廣泛影響。該理論的相關研究多數(shù)關注具有“顯著性”的熱度最高的議程是否以及如何設置全局輿論。本研究不僅關注輿論場最高熱度的“議程層”,也關注次高熱度或低熱度的“準議程層”“低議程層”及各層級間的內(nèi)容傳導關系,明確重視議程設置中的“梯度擴散”現(xiàn)象,關注不同熱度和不同“顯著性”的內(nèi)容層級之間彼此傳導內(nèi)容的機制與結構。這個問題之所以有討論的必要性,主要因為其關涉以下幾個方面。
其一,關于輿論傳播、公共傳播等領域的研究與實踐高度側(cè)重輿論場“最熱”議程在全局輿論的主導作用,相對易忽視“最熱”“最顯著”以外的其他熱度水平的內(nèi)容層級在擴散中的承接、中轉(zhuǎn)的地位和作用。如經(jīng)典的議程設置理論認為,媒體如同列清單一般為選民安排好先關注什么、后關注什么;韋路、胡雨瀠指出熱門微博基本上涵蓋了網(wǎng)民所關注的焦點:有研究提出社交媒體中具備極高熱度的話題能夠?qū)崿F(xiàn)對公眾的議程設置。無論是官方媒體還是自媒體均不乏追逐熱點的行為,“百萬點擊”博文、“10萬+”推文等被視作內(nèi)容傳播效果最佳的指標。這些都易忽略其他熱度水平的“準議程”乃至“冷議程”等內(nèi)容層級對全局輿論的影響。若把媒體信息劃分為按熱度或顯著性區(qū)分的各個熱度層,則識別其中具有關鍵的“起承轉(zhuǎn)合”作用的層級,有助于更完整地了解甚至調(diào)整全局議程傳導網(wǎng)絡和結構的形成。
其二,相關研究重視高熱議程設置全局輿論,但易忽略高熱議程內(nèi)容擴散至其他各熱度層的程度存在的差異,以及這種差異程度隨著熱度差距而漸變的規(guī)律性。一些研究認為高熱議程的擴散程度是無差異性的,這把被設置的輿論視作一個整體,易忽略局部被影響程度的漸變差異及其約束條件,如“新聞搭車”研究雖發(fā)現(xiàn)媒體帖子跟隨當下最火的新聞,卻忽視不同熱度層帖子在“蹭熱點”時的程度差異,以及所受到的熱度水平約束。在文化傳播和營銷傳播領域,一些研究談論文化模因、病毒式營銷時,易忽視內(nèi)容在不同熱度層間擴散時的近強遠弱、由近及遠等差異化、漸變化特征,認為某些局部熱度層對其他各局部層級無差別地擴散內(nèi)容而“燃爆”至全局。
其三,較多研究關注輿論話題間協(xié)同演化、聯(lián)動、共振,但易忽略話題在不同熱度層間傳遞的機制。正如議程設置研究多強調(diào)議程擴散過程中,輿論場如何形成被設置、被擴散的整體,而忽視擴散過程中由于熱度不同而形成的議程區(qū)隔或“凝塊”及其形成機理。由于高熱度議程的擴散能力,我們需要思考以下可能性,即是否熱度越高的議程層級之間彼此產(chǎn)生擴散和同化的程度越高,熱度越低的議程層級之間彼此產(chǎn)生擴散和同化的程度越低。有研究指出,微博環(huán)境下的議程設置存在有限性;還有研究指出,受媒體影響的公眾議程再難成為社會共識。這顯示在全局議程或內(nèi)容中,熱度不同的層級可能形成割裂與區(qū)隔的局面。也有研究發(fā)現(xiàn),高熱信息層內(nèi),信息熱度越高,信息內(nèi)容就與頂熱信息內(nèi)容越相似,即在高熱層級內(nèi)部,熱度越接近則內(nèi)容越趨同,它們顯示在相鄰近的若干熱度層可能形成具有特殊內(nèi)容的“凝塊”或“子群”,它們的內(nèi)容不同于全局其他層級的內(nèi)容。這種受熱度制約的層級間傳導程度及其結構還有待進一步探討。
其四,有研究探討社交網(wǎng)絡中信息傳播擴散的節(jié)點、鏈路,探究信息交互、節(jié)點間彼此影響,但缺乏對不同熱度議程信息傳播網(wǎng)絡的認識和研究。例如,張蓓研究分析了議程設置過程中的議程網(wǎng)絡結構;其他研究發(fā)現(xiàn),議程設置效應在節(jié)點網(wǎng)絡的影響下,逐漸出現(xiàn)傳播擴散的趨勢,出現(xiàn)多層網(wǎng)絡結構。然而,依據(jù)熱度的不同對網(wǎng)絡信息進行切分后,議程設置的內(nèi)容傳導從一種熱度傳到另一種熱度的方向性、受何種熱度距離制約的擴散梯度性、從層級之間的設置線條到設置線條彼此作用的傳導網(wǎng)絡,亟須進一步討論關注。
綜上所述,本研究強調(diào)社交網(wǎng)絡輿論傳播、議程擴散中以下幾個方面的問題:一是議程或內(nèi)容的擴散是更容易由“頭部”“最熱”層級向低熱度層級等“熱度水位差”較大的層級傳導,抑或是更容易在“熱度水位差”比較鄰近的層級間傳導?也即是“熱強冷弱”抑或是“近強遠弱”?二是議程設置是更容易出現(xiàn)“頭部”議程傳導至頭部、腰部、底部等各個不同的熱度層,抑或是更容易出現(xiàn)腰部、底部的“中間議程”“冷議程”向“頭部”熱度層的反向傳遞?即熱度層間內(nèi)容擴散的方向是“由強及弱”“由熱及冷”抑或是“由近及遠”“由中熱至高熱和低熱”?三是議程或內(nèi)容在不同熱度層級間的傳導程度和層級間熱度距離并無線性的對應,抑或是其傳導程度隨著層級間的熱度距離而“遠近有別”地漸變和對應?四是議程或內(nèi)容在多個熱度層級間的擴散和傳導中,是否存在著“撒胡椒”式的層級間隨機化的內(nèi)容區(qū)隔,抑或是存在著隨熱度差距遠近而呈現(xiàn)的“核心-邊緣”結構等“遠近有別”的規(guī)律性區(qū)隔結構?綜上所述,本研究明確提出和聚焦于社交網(wǎng)絡輿論場中的“梯度擴散”效應與結構,其核心內(nèi)涵是熱度層級間的內(nèi)容傳導存在著“由近及遠、近強遠弱、遠近有別”的梯度化擴散結構,并從后文五個假設予以具體分析。關注議程梯度擴散,不僅是對議程設置、輿論傳播重要理論的探索,也對群體意見傳播、社會傳播、文化傳播、營銷等領域有著重要參考意義。
二、研究回顧與假設內(nèi)涵
本研究探討不同熱度層級間信息內(nèi)容擴散的梯度性,主要涉及熱度層級間隨著熱度不同而“近強遠弱、由近及遠”的梯度化擴散以及由此生成的全局性的特殊擴散結構。它不同于“頭部”高熱和高“顯著性”內(nèi)容集群設置全局輿論的傳統(tǒng)議程設置理論模式,也強調(diào)議程設置中未充分重視的高、中、低等不同熱度層之間的“設置”程度是否以及如何受到彼此熱度及其熱度距離的制約。研究涉及各層級間的傳導路徑、熱度距離,以及二者所分別構成的網(wǎng)絡性質(zhì)。具體研究過程中,對研究樣本帖進行基于熱度的分層,并通過量化方式計算信息在不同層級間的傳導路徑,由此須界定“內(nèi)容傳導程度”概念;其后,研究梯度性與網(wǎng)絡結構則須計算層級間信息傳導路徑所構成的網(wǎng)絡,由此提出和界定“內(nèi)容傳導網(wǎng)絡”“熱度差值網(wǎng)絡”等概念。在進入假設的提出與驗證前,對文中涉及的核心概念首先進行界定解釋。
內(nèi)容傳導程度。內(nèi)容在各個熱度層級間的傳遞情況,衡量任意熱度層級內(nèi)容對其他熱度層級內(nèi)容的設置能力。本研究采取交叉時滯相關分析方法,計算得出tn天的任意熱度層級對tn+1天的其他熱度層級的內(nèi)容設置天數(shù),也稱作內(nèi)容引發(fā)天數(shù)。“傳導”即內(nèi)容從一個熱度層級傳到另一個熱度層級,而內(nèi)容傳導程度就是365天中內(nèi)容引發(fā)成立的天數(shù),即365天中成立的概率。天數(shù)越多,說明傳導程度越高,設置能力越強。
內(nèi)容傳導網(wǎng)絡。由所有熱度層級的“內(nèi)容傳導程度”構成的200x200的矩陣網(wǎng)絡。本研究將所得帖子按照熱度等頻分箱為200個層級,最高熱度為層199,最低熱度為層0,200個熱度層級兩兩之間存在內(nèi)容傳導程度,彼此交錯構成了200x200的矩陣網(wǎng)絡。
內(nèi)容傳導網(wǎng)絡中心層。在“內(nèi)容傳導網(wǎng)絡”里中心性最高、具備最高傳導程度的熱度層級。傳導程度衡量的是內(nèi)容在不同熱度層級間的傳遞,與層級間熱度距離有關,也與層級所連接的其他層級有關。
熱度差值網(wǎng)絡。由任意熱度層級熱度與其他熱度層級熱度的差值絕對值所構成的矩陣網(wǎng)絡。將200個熱度層級的每層均熱度兩兩相減并得到絕對值、以熱度層0到熱度層199的層級序號為橫縱坐標軸,將這40000個數(shù)值進行200x200的對應排列,得到一個對稱矩陣網(wǎng)絡。
熱度相似網(wǎng)絡?!盁岫炔钪稻W(wǎng)絡”的反向表達。任意兩個熱度層級的熱度差距越小,說明二者熱度數(shù)值越相近,熱度就越相似。后文中,在熱度差值網(wǎng)絡里接近中心性越高、與其他熱度層級熱度差值越小的熱度層級,則在熱度相似網(wǎng)絡中具備與其他熱度層級熱度越高的相似程度。
社會網(wǎng)絡分析中,特征向量中心性表示節(jié)點的重要性,它既取決于所連接的節(jié)點數(shù)量,也取決于所連接節(jié)點的重要性。特征向量中心性越高,該節(jié)點所連接的節(jié)點就越重要,越處于社會網(wǎng)絡的重要位置。接近中心性表示該節(jié)點到其他節(jié)點的最短距離,接近中心性越高,說明該節(jié)點到達其他節(jié)點的距離越小,在網(wǎng)絡中更偏向幾何上的中心位置,重要程度就越高。本研究采用特征向量中心性、接近中心性來分別衡量任意層級在內(nèi)容傳導網(wǎng)絡、熱度差值網(wǎng)絡里的中心程度(重要程度)。
在此基礎上,具體文獻回顧、分析與假設的提出詳述如下。
1.輿論演化具有階段性、逐步漸變特征,從局部討論到群體信息空間并非一蹴而就。輿論在演化過程中,熱度距離鄰近的內(nèi)容可能比熱度距離遠的內(nèi)容更為相似。
李彪指出,事件傳播的六個臨界點分別為潛伏、蔓延、爆發(fā)、反復、緩解與長尾。匡文波將新媒體輿情周期分為議題出現(xiàn)、存活、整合、消散四個階段。Chen等提出,在一些具有新聞價值的事件發(fā)生后,網(wǎng)絡中會產(chǎn)生討論話題,影響初步輿論的形成。其中一些話題經(jīng)過一段時間的傳播,進一步衍生出新的子話題,與最初的輿論交織在一起,形成多維輿論。這部分點明輿論傳播擴散的階段性。輿論演化相鄰近的階段,輿論熱度相近,且內(nèi)容相似度大于彼此距離較遠的階段。因此本文提出如下假設:
假設H1 任意兩個熱度層級之間的內(nèi)容傳導程度與這兩層之間的熱度差距成反比。
該假設包含著內(nèi)容在熱度層級間梯度化擴散中的“近強遠弱”特征。
2.“新聞扎堆”和“蹭熱點”均指向社交網(wǎng)絡中信息的趨同現(xiàn)象,這與熱度、內(nèi)容相似度密切相關,表明議程在不同熱度層級間的傳導程度與層級的熱度高低相關,也與層級間的熱度差異相關。一方面,熱度越高的內(nèi)容,對其他熱度層級的內(nèi)容主導性基因就越強,而熱度層級越高的內(nèi)容,彼此間就越相似。一個熱點事件發(fā)生后,社交網(wǎng)絡上會出現(xiàn)大量相似報道,即所謂“新聞扎堆”“媒體風暴”“蹭熱點”等。易艷剛指出,“新聞扎堆”已經(jīng)成為一種媒介現(xiàn)象,某個具有較高價值的新聞出現(xiàn)后,許多媒體便立即在本地搜尋相似線索,故也可稱為“輿論搭車”。吳星星、靖鳴認為,各類媒體在“輿論搭車”時對某熱點新聞的價值判斷趨于一致,最終形成一項議程。另一方面,熱度相近的內(nèi)容對彼此的主導性基因、彼此的相似度高于熱度相距較遠的內(nèi)容。某個新聞事件的熱度越高,越能引起其他媒體的爭相報道,與之熱度相近的新聞內(nèi)容便越類似該事件。換言之,新聞或帖子等內(nèi)容的熱度層級越高,越能引發(fā)其他內(nèi)容的模仿趨同,而熱度越貼近便越相似。對此,沈霄等認為,政務平臺借助當下自帶流量的熱點議題發(fā)布相似政務內(nèi)容,迅速抓住公眾注意力進而獲得高熱度。陰艷、韓月怡指出,許多短視頻制作者盲目跟隨網(wǎng)絡熱點,最終導致內(nèi)容同質(zhì)化嚴重。Lim則發(fā)現(xiàn)流行度排名靠前的新聞網(wǎng)站通常會首先發(fā)布標題,其他網(wǎng)站只是通過發(fā)布類似的標題來跟隨標題。
以上現(xiàn)象與研究反映出與熱點事件熱度越相近的帖子,對該事件內(nèi)容趨同性越高,而與熱點事件內(nèi)容越相似的帖子,和該事件的熱度就越貼近。這進一步支持了假設H1。在此基礎上,比較內(nèi)容傳導網(wǎng)絡與熱度差值網(wǎng)絡,綜合假設H1及上述研究回顧,在內(nèi)容傳導網(wǎng)絡中,彼此間熱度差距越小的層級,其相似度越高,即彼此間內(nèi)容傳導程度越高,則推測出內(nèi)容傳導網(wǎng)絡和熱度差值網(wǎng)絡具備高相關性及相似性,因此本文提出如下假設:
假設H2 內(nèi)容傳導網(wǎng)絡與熱度差值網(wǎng)絡存在同構性。
該假設同樣包含著熱度層級間隨著熱度差異而“近強遠弱、由近及遠”的內(nèi)容的梯度擴散特征。
3.對于各個熱度層級間的內(nèi)容相似度與熱度層級距離的關系,有三種判定:一是認為熱度層級的距離越大,內(nèi)容越相似;二是各個熱度層級間的距離與其內(nèi)容相似度無關;三是各熱度層級間的距離與內(nèi)容相似度相關,且距離越小內(nèi)容越相似。對于判定一,若熱度相差越大內(nèi)容越相似,則與已有研究中的輿論同質(zhì)化、頭版標題相似、議題同質(zhì)性等明顯矛盾,如Dworak等發(fā)現(xiàn)互聯(lián)網(wǎng)媒體中記者更趨向于報道或模仿同質(zhì)化熱點內(nèi)容,而非關注多樣性與原創(chuàng)性內(nèi)容。陳昌鳳分析了中國四個不同地區(qū)在谷歌搜索上關注的熱點內(nèi)容,發(fā)現(xiàn)大部分時間里四地搜索熱點基本一致。對于判定二,如果各個熱度層級間的距離與其內(nèi)容相似度無關,則各個熱度層級間的內(nèi)容呈隨機分布。這與社交網(wǎng)絡中不同熱度的內(nèi)容有所不同是相矛盾的,尤其不符合高熱、中熱、低熱內(nèi)容隨著熱度變化明顯存在差異且頭部熱度與底部熱度內(nèi)容有所不同這一社交網(wǎng)絡現(xiàn)象。推翻前兩種判定后,則推導出判定三成立,即內(nèi)容的熱度距離越小或熱度越接近,其間的相似度就越高。進一步推導,當某個帖子的熱度層級到達全局所有熱度層級的路徑或距離都最短時,相當于一個節(jié)點在社會網(wǎng)絡中到達其他節(jié)點的距離最小,接近中心性最高,那么該帖子的內(nèi)容傳導程度就高于除自己以外的任何熱度層級帖子,即在內(nèi)容傳導網(wǎng)絡中最接近中心層。該層級在熱度相似網(wǎng)絡中的接近中心性越高,就更加“左右逢源”,其內(nèi)容傳導程度越高?;诖?,提出如下假設:
假設H3 任意熱度層級越是內(nèi)容傳導網(wǎng)絡的中心層,其在熱度差值網(wǎng)絡中的接近中心性也越高。
該假設包含著內(nèi)容在不同熱度層級間傳導的“近強遠弱、由近及遠”的擴散結構特征。
4.對于頭部熱度層級內(nèi)的信息而言,其自身熱度越高,則更趨同于最高熱度的信息內(nèi)容。陳彤、鄧理峰發(fā)現(xiàn)帖子議題存在升溫和衰變的快速過程,存在高熱帖子與無人問津的帖子,而在高熱議題內(nèi)部的激烈討論中存在內(nèi)在趨同性。有研究發(fā)現(xiàn),熱度越高的帖子與當時周期內(nèi)最熱層級帖子的相似度越高,且熱度層級越高其內(nèi)部帖子趨同性越強。這進一步支持了假設H1;反之,若假設H1不成立,上述實證結果也難以成立。
綜上所述,本研究的核心觀點為:社交網(wǎng)絡信息內(nèi)容在全局各熱度層級間的傳導程度隨著熱度層級間距離的不同而存在差異,距離越小傳導程度越高,并呈現(xiàn)出全局的網(wǎng)絡結構。
結合假設H1,本文繼續(xù)推導,若層級間熱度差距越大,內(nèi)容相似度越小,而高熱內(nèi)容間存在著高趨同性,那么對于全局帖子而言,高傳導程度或高中心性的層級之間內(nèi)容彼此高度流通,類似于“旋轉(zhuǎn)門”,低傳導程度或低中心性的層級與前者則缺乏流通性,信息阻塞,從而可能導致整個平臺的公共信息出現(xiàn)“富人俱樂部”現(xiàn)象。由此,全局帖子陷入熱門或較熱門內(nèi)容一直熱門,冷門內(nèi)容一直冷門,在實際案例中會令社交媒體平臺形成“抖音之所以為抖音”“快手之所以為快手”的現(xiàn)象。社會網(wǎng)絡分析方法中的“核心-邊緣”結構,其直觀解釋為:一個密集的、有凝聚力的核心和一個稀疏的、不相連的外圍組成的特殊結構。根據(jù)網(wǎng)絡節(jié)點間聯(lián)系的緊密程度,區(qū)分出哪些節(jié)點在網(wǎng)絡中處于核心地位,哪些節(jié)點處于邊緣地位。因此,本文提出如下假設:
假設H4 內(nèi)容傳導網(wǎng)絡存在“核心-邊緣”結構?!昂诵模吘墶苯Y構中,核心層級在內(nèi)容傳導矩陣中的中心性顯著高于邊緣層級在內(nèi)容傳導矩陣中的中心性。
該假設包含著內(nèi)容在不同熱度層級間傳導的“近強遠弱、遠近有別”的擴散結構特征。
根據(jù)H1與H3的提出過程,任意層級對其他層級的傳導能力與層級間熱度距離相關,熱度層級在全局中的中心性越高,對其他層級的內(nèi)容傳導程度就越高,而非僅由熱度高低所決定。結合H4,本研究提出,核心層級是在熱度差值矩陣中的接近中心性最高的層級,即熱度上的“腰部”層級;邊緣層級則是在熱度差值矩陣中接近中心性最低的層級,即偏于“頭部”熱層或“底部”冷層。H4也表明,熱度層級間由于內(nèi)容差異、熱度距離而存在顯著差異,故而整個內(nèi)容傳導網(wǎng)絡中,帖子存在彼此分割的群聚現(xiàn)象。因此本文提出如下假設:
假設H5 在內(nèi)容傳導網(wǎng)絡中,對于任意層級而言,越接近核心層級,其熱度值越接近全局各層熱度均值;越接近邊緣層級,其熱度值越遠離全局各層熱度均值。整個內(nèi)容傳導網(wǎng)絡切分為不同的子群,且內(nèi)容相似、熱度相近的熱度層級聚集為同一子群。
該假設包含著內(nèi)容在不同熱度層級間傳導的“由近及遠、遠近有別”的擴散結構特征。
以上四點研究回顧、五個假設集中表達了對于輿論傳播和議程設置中易產(chǎn)生誤識的在不同熱度的層級間隨著熱度差距而“由近及遠、近強遠弱、遠近有別”的擴散效應與獨特區(qū)隔結構。它們的邏輯關系通過框架圖(圖1)所示。
三、研究方法與研究過程
通過八爪魚采集器和Python編寫網(wǎng)絡爬蟲對新浪微博進行采集,采取成本較低的多階段抽樣。為避免2019年及之后新冠疫情時期微博內(nèi)容的特殊性與波動性,本研究將時間段選為2018年全年。在最初抽取一批種子帖并檢驗其有效性后,采用滾雪球抽樣的方式進行深度抓取,最后共得到65535個用戶所發(fā)的共20117408條樣本帖。具體過程是:從新浪微博首頁47個內(nèi)容版塊采集,各個版塊每天早晚各抓取一次,抓取時間持續(xù)1個月,獲得67362條“種子”帖,它們廣泛且大致均衡地分布在上述版塊;然后從這些種子帖做第一輪“滾雪球”抽樣,每條種子帖抓取500條評論的評論者(不足500條的則全部抓?。コ貜陀脩?、頁面被禁用戶和抓取失敗用戶后,獲取發(fā)布者和評論者共計3501153個,并從中隨機選取10萬個用戶,然后對之抓取87739個有效用戶所發(fā)的帖子。提取其中在2018年具有發(fā)帖記錄的。因這些原始數(shù)據(jù)值較大,故將每個指標原始數(shù)值加1后再經(jīng)對數(shù)函數(shù)轉(zhuǎn)換,其后進行歸一化處理,每個數(shù)據(jù)轉(zhuǎn)為[0,1]內(nèi)的值。對任—數(shù)xi進行歸一化的公式為:[xi-min(x)]/[max(x)-min(x)]。
歸一化處理后得到這些用戶相應的粉絲數(shù)直方圖(圖2)與這些帖子的熱度分布直方圖(圖3)。熱度計算方法為:(評論數(shù)+點贊數(shù))/2,其中評論數(shù)、點贊數(shù)都是微博中的原始官方數(shù)據(jù)設為x,則采取經(jīng)由對數(shù)函數(shù)轉(zhuǎn)換后的值Xnew=log2(x+1)。
(一)帖子內(nèi)容的向量化表示與K-means聚類
采取Word2vec詞向量模型及其平均池化的方式,把帖子轉(zhuǎn)換為向量后計算兩條帖子之間的余弦相似度。該模型利用詞的上下文信息將一個詞轉(zhuǎn)化成一個低維實數(shù)向量,越相似的詞在向量空間中越相近。使用Gensim模塊進行Word2vec模型的計算,語料庫來自課題組自行抓取的26G的txt文本格式的語料,它對社交媒體文本有良好適應性。隨后通過K-means算法進行聚類,采取簇內(nèi)誤差平方和反映聚類誤差(圖4)。太低的聚類數(shù)量不利于統(tǒng)計檢驗,而太多的聚類數(shù)量會出現(xiàn)類型分布上下波動較大的情況。結合誤差指標與實際可操作性和“肘拐點”,將樣本帖子聚為1200類。
(二)每天每層的帖子類型分布
首先,按照帖子熱度對帖子進行分層,采用常用的等頻分箱方法。等頻分箱常見于統(tǒng)計學領域,即針對研究樣本進行定序、定距劃分,令每個區(qū)間內(nèi)包含的樣本數(shù)量一致。這種方法,可在與頭部熱度層級內(nèi)樣本規(guī)模相同的前提下,探究議程與非議程、高熱度議程與中低熱度議程之間的關系。對所涉及的帖子選擇切分為200個熱度層級,每層、每天的帖子數(shù)都相等。由于實際樣本數(shù)量及其分布的不同,每天每層的帖子隨機取132條,這樣保證了365天×200層的每層數(shù)量一致。
其后,對于每天每層的132條帖子,由于它們已經(jīng)屬于1200類帖子中的類,所以每天每層都是一個1200維的向量,向量中每個數(shù)值都是一個比例值,即這132條帖子在1200類的類型上所具有的比例,如表1所示。
(三)對層和層之間交叉滯后相關分析
使用交叉滯后模型對上一步處理后的數(shù)據(jù)進一步進行分析。交叉滯后模型是利用縱向隊列中兩個或兩個以上的面板數(shù)據(jù),探索相互關聯(lián)的兩個變量間時序關系的一種統(tǒng)計分析方法。本研究以天數(shù)為分析單位,滯后期為1天來進行交叉滯后分析。對于層和層之間的影響關系,可通過交叉滯后相關分析計算得到。
四、假設檢驗
(一)對于假設H1
將前文通過交叉時滯相關分析后得到的200x200傳導矩陣進行處理,所得到的一維數(shù)組就是內(nèi)容傳導程度的計量化,數(shù)值越大,說明傳導程度越高。熱度差距則通過任意兩個熱度層級的每層均熱度數(shù)值相減后的差值絕對值來表示,數(shù)值越大,說明熱度層級間距離越大。本假設將傳導程度和熱度差距進行相關分析,若二者相關系數(shù)為負,說明傳導程度越高則熱度差距越小,假設成立。
針對200x200的議程傳導矩陣和200x200的熱度差值矩陣,分別處理后得到一維數(shù)組,分別作為因變量和自變量,計算雙變量相關性,可得皮爾遜相關系數(shù)為-0.399,斯皮爾曼相關系數(shù)為-0.427,Plt;0.01,N=40000,相關性顯著。分析結果支持假設H1成立。
(二)對于假設H2
對200x200的內(nèi)容傳導網(wǎng)絡與熱度差值網(wǎng)絡這兩個矩陣進行相關性分析。用seaborn的heatmap繪制內(nèi)容傳導網(wǎng)絡,如圖6所示。圖中每個點,若其縱坐標為p、橫坐標為q、點數(shù)值為n,則說明在該點上,熱度層p對熱度層q的議程內(nèi)容在1年當中有n天是存在影響或引發(fā)作用的。色塊越深越黑意味著引發(fā)數(shù)值n越大,即影響越大;色塊越淺越白則意味著引發(fā)數(shù)值n越小,即影響越小。
圖6中左上部為低熱度層級,右下部為高熱度層級。色塊最黑最深的部分為40-80層的層級,即全局的腰部/頸部層級,該部分層級對其他層級的作用程度最強。
對200個熱度層繪制熱度差值網(wǎng)絡如圖7所示,色塊越深越黑代表層級間熱度差值越大:色塊越淺越白代表層級間熱度差值越小。左上部為低熱度層級,右下部為高熱度層級。由圖7可得,腰部/頸部層級的色塊最淺最白,即熱度差值最小。和其他熱度層級相比,腰部/頸部層級對全局所有層級的可達性最強。
在圖6、圖7中,可觀測出腰部/頸部層級均占據(jù)關鍵地位,且圖形顏色趨勢趨同,可輔助呈現(xiàn)內(nèi)容傳導網(wǎng)絡與熱度差值網(wǎng)絡的同構性。在Ucinet中采取QAP相關分析,對內(nèi)容傳導網(wǎng)絡與熱度差值網(wǎng)絡這兩個矩陣的相關性進行檢驗,結果顯示兩個矩陣的相關系數(shù)為-0.431,Plt;0.001,顯著性強??傻?,這兩個矩陣呈現(xiàn)出顯著負相關,任意熱度層級在內(nèi)容傳導網(wǎng)絡中引發(fā)數(shù)值越高,在熱度差值網(wǎng)絡中的數(shù)值就越小,即當層級間熱度距離越小,層級內(nèi)容的傳導程度就越高,表明兩個矩陣存在同構性。由此,分析結果支持H2成立。
(三)對于假設H3
分別將兩個網(wǎng)絡的中心性指標導入SPSS進行雙變量相關性分析,結果為:任意層級在內(nèi)容傳導網(wǎng)絡上的特征向量中心性,與其在熱度差值網(wǎng)絡上的接近中心性的相關系數(shù)為0.326,Plt;0.01,N=200,相關性顯著。
內(nèi)容傳導網(wǎng)絡上的特征向量中心性體現(xiàn)了任意熱度層級在內(nèi)容傳導網(wǎng)絡中的重要程度,即對其他層級的引發(fā)程度:而熱度差值網(wǎng)絡上的接近中心性體現(xiàn)了任意熱度層級在熱度差值網(wǎng)絡上到達其他層級的熱度距離,中心性越高距離越短,換言之,體現(xiàn)了任意層級在熱度相似網(wǎng)絡上的中心程度。由此可得,任意層級越處于內(nèi)容傳導網(wǎng)絡的中心層,就越處于熱度相似網(wǎng)絡(熱度差值網(wǎng)絡)的中心地位。假設H3成立。
(四)對于假設H4
將內(nèi)容傳導矩陣導人Ucinet,對矩陣進行“核心-邊緣”結構分析,輸出結果為:迭代次數(shù)為50,初始矩陣與理想矩陣之間的相關系數(shù)(staning ftness)為0.278,經(jīng)過重排后的矩陣與理想矩陣的相關系數(shù)(final fitness)為0.495,N=200。其中,final fitness越大,表明實際數(shù)據(jù)與理想模型越相似,實際數(shù)據(jù)的“核心-邊緣”結構越顯著。
結果還顯示,核心區(qū)域中包含116個層,邊緣區(qū)域包含84個層。將核心層與邊緣層的熱度導入SPSS中,采取獨立樣本K-S方法,檢驗二者的熱度是否存在顯著分布差異。輸出結果顯示,Plt;0.01,總計N=200,最極端差值絕對值=0.432,差異顯著,核心層和邊緣層分別屬于不同的熱度段。
此外,“核心-邊緣”結構劃分了聯(lián)系緊密的節(jié)點與聯(lián)系松散的節(jié)點,區(qū)分出占有比較重要地位的核心層級與占有比較不重要地位的邊緣層級。在內(nèi)容傳導網(wǎng)絡中,中心性高的層級具備重要地位(高傳導能力),中心性低的層級則具備較不重要地位(低傳導能力)。故而在“核心-邊緣”結構中,核心層級在內(nèi)容傳導矩陣中的中心性顯著高于邊緣層級在內(nèi)容傳導矩陣中的中心性。假設H4成立。
(五)對于假設H5
結合上文假設H3的驗證,熱度差值在內(nèi)容傳導矩陣中存在顯著影響,故針對核心層熱度差值矩陣與邊緣層熱度差值矩陣進行比較分析,在Ucinet中,計算得到兩個矩陣中各層級的接近中心性,繼而在SPSS中采取獨立樣本Mann-Whitney U檢驗。結果如下:核心層熱度差值矩陣接近中心性的均值為96.827,邊緣層熱度差值矩陣接近中心性的均值為77.876,200x200的熱度差值矩陣接近中心性均值為90.733,則核心層熱度差值矩陣接近中心性與全局層級熱度差值矩陣接近中心性之間的均值相差6.094,邊緣層熱度差值矩陣接近中心性與全局層級熱度差值矩陣接近中心性之間的均值相差12.857。如圖8所示,核心層的熱度差值矩陣接近中心性顯著高于邊緣層的熱度差值矩陣矩陣接近中心性。
綜上所述,本研究的200層熱度層級的傳導網(wǎng)絡具有可檢驗的“核心-邊緣”結構,存在116個核心層級與84個邊緣層級,核心層級的熱度差值接近中心性更接近全局各層熱度均值,且顯著高于邊緣層級的熱度差值接近中心性。換言之,核心層級的熱度距離比邊緣層級的熱度距離更加簡短緊密,重要性更高。
為進一步驗證,本研究將每層均熱度與全局均熱度的差值絕對值作為變量x1,x1越小說明該層的熱度與全局均熱度差值越小,則該層級越接近腰部層級(中間層級);x1越大說明該層級距離腰部層級越遠,越有可能是頭部或者底部層級。將傳導網(wǎng)絡的每層特征向量中心性作為變量x2,分析變量x1和x2的相關性,皮爾遜相關系數(shù)結果為-0.244,Plt;0.001,N=200。結合已驗證的假設H2、H3、H4,上述結果表明在全局網(wǎng)絡中,熱度層級越接近腰部層級,在傳導網(wǎng)絡中的特征向量中心性就越高,且顯著高于頭部/底部層級。加之,在熱度差值矩陣網(wǎng)絡中核心層的接近中心性顯著高于邊緣層,而假設H3表明任意層級越處于傳導網(wǎng)絡的中心重要地位,就越處于熱度相似網(wǎng)絡(熱度差值網(wǎng)絡)的重要地位,故而,熱度層級越接近腰部層級,就越接近核心層級。
針對H5中的“子群”假設,將內(nèi)容傳導矩陣導人Ucinet,選擇CONCOR法計算。參數(shù)為:最大切分深度為3,最大重復次數(shù)為25,輸出R方結果0.850,N=200,R2大于0.5,故有效性高。內(nèi)容傳導網(wǎng)絡被分割為八個子群,子群一、二、三、四中最低熱度層級為層0,最高熱度層級為層70,共71個層級,均為低熱度子群;子群五、六、七、八中最低熱度層級為層71,最高熱度層級為層199,共129個層級,均為中高熱度子群。各子群熱度方差分別為:0.000000,0.000000,0.000000,0.000011,0.000001,0.000044,0.003112,0.007294。而全局200層的熱度方差大大超出上述各個子群,為0.019533,即各個子群內(nèi)部的層間熱度差異大大低于全局各層間的熱度差異。對各子群熱度與全局各層熱度分別進行方差齊性檢驗,結果顯示各子群熱度與全局熱度均不服從方差齊性,各子群熱度與全局熱度存在顯著差異。
此外,針對各個子群之間兩兩進行K-S檢驗,分析任意兩個子群的熱度分布是否一致,結果顯示,子群一、子群二、子群三、子群四之間,熱度分布無顯著差異;這四個子群分別與子群五、子群六、子群七、子群八存在顯著的熱度分布差異;而子群五、子群六、子群七、子群八四個子群之間,熱度分布存在顯著差異。說明在全局內(nèi)容傳導網(wǎng)絡中,高熱度層級與低熱度層級在內(nèi)容與熱度方面存在鮮明的分割化與條塊化,且高熱層與低熱層之間內(nèi)容更難以流通。
以上結果說明:(1)在內(nèi)容傳導網(wǎng)絡中,網(wǎng)絡帖子并非隨機地四處分散,而是因內(nèi)容、熱度的不同而呈現(xiàn)出圈層化、分段化。內(nèi)容相似、熱度相近的帖子聚集在同一圈層和熱度段中,構成具備中心化、群聚效應的群體。海量帖子以這種方式形成一個個彼此區(qū)分的群體。(2)方差齊性分析說明熱度相近的帖子層聚攏在同一個內(nèi)容傳導圈層中,且內(nèi)容也在相近熱度之間傳遞流通。(3)高熱內(nèi)容與低熱內(nèi)容之間不僅存在顯著的熱度差異,也存在內(nèi)容割裂、溝通阻滯特點。綜上所述,假設H5成立。
五、結語
本研究基于新浪微博平臺,對經(jīng)由熱度分層后的帖子進行交叉時滯相關分析,探究社交網(wǎng)絡信息在不同熱度層級間的傳導規(guī)律和路徑,分析驗證議程傳播擴散的結構。主要結果如下:(1)熱度層與內(nèi)容層密切相關,議程信息在社交網(wǎng)絡中的傳播擴散過程存在差異性,具體表現(xiàn)為:熱度層級間距離越小,傳導程度越高;距離越大,傳導程度越低。(2)不同熱度層級間的議程傳播呈現(xiàn)梯度變化特征,即內(nèi)容傳導程度或影響程度隨著熱度層級變化而階梯式遞增或遞減。(3)無論是議程傳導網(wǎng)絡,還是熱度差值矩陣網(wǎng)絡,都驗證出各個層級間的互相影響構成了一個議程擴散網(wǎng)絡。(4)內(nèi)容傳導網(wǎng)絡或議程擴散網(wǎng)絡與內(nèi)容的熱度差值網(wǎng)絡存在同構性,故社交網(wǎng)絡信息的議程擴散是一個具備梯度性、漸變性的網(wǎng)絡結構。(5)在議程梯度擴散的過程中,在內(nèi)容擴散距離和影響程度上,“熱度腰部”層級明顯優(yōu)于其他熱度層級,打破以往對“熱度頭部”層級設置全局的認定局限。
本研究的主要貢獻在于:(1)從議程設置到議程梯度擴散,提出議程“梯度擴散”理論模式。傳統(tǒng)議程設置理論研究媒體如何通過設置議題、屬性等影響公眾認知,本研究則拓展議程設置過程的內(nèi)部差異性,發(fā)現(xiàn)議程傳導程度隨著熱度層級變化而階梯式遞增或遞減,從而提出“梯度議程設置”的理論。(2)從議程設置“超距作用”到議程的傳導距離有限性、作用方式梯度性。本研究驗證了議程在傳播擴散過程中的傳導程度差異,并進一步發(fā)現(xiàn)議程傳導程度的梯度性,由此本研究突破“議程設置”效果能夠“一把火燒遍全局”的“超距作用”認知局限,并從傳播學角度打破以往對頂熱議程影響全局議題的直觀認知。(3)從網(wǎng)絡議程設置到議程設置網(wǎng)絡——研究議程之間的作用網(wǎng)絡與作用矩陣,即從強調(diào)鏈條式設置議程、影響公眾,到強調(diào)控制全局議程網(wǎng)絡與結構,強調(diào)由“線”到“網(wǎng)”。首先,本研究將簡單的“是議程”與“不是議程”轉(zhuǎn)換為熱度分層的議程分類方式,為研究議程在不同熱度層級間的傳導結構與路徑提供依據(jù):其次,將以往的議程設置鏈條創(chuàng)新擴展為議程設置網(wǎng)絡,說明議程設置不單單是自上而下和自下而上的雙向設置,更是不同熱度層級之間的網(wǎng)絡化設置。(4)從高度關注“頭部”頂熱層級到抓住關鍵“腰部”熱度層級。本研究探索議程內(nèi)部由熱度層級、傳導路徑、設置網(wǎng)絡組成的議程設置結構,發(fā)現(xiàn)熱度分層后的議程傳導差異性,進而提出議程傳導中的關鍵:腰部熱度層級,發(fā)現(xiàn)腰部層級對其他熱度層級議程的輻射影響距離更為長遠和穩(wěn)定。故而,本研究認為,在調(diào)控全局議程時,首先應當注重對全局議程腰部熱度層級議程的合理控制:其次應當關注議程擴散的網(wǎng)絡特征,認識到不同熱度層級間的互相影響,調(diào)控議程擴散網(wǎng)絡。
本研究有待深化之處:(1)本研究考慮的是一般性的“議程向量”傳導,而非某個特定“議程主題”的設置,后續(xù)研究可區(qū)分出細粒度的“議程類”進行單獨研究,并分析、比較各個特殊類的議程傳導網(wǎng)絡結構。(2)本文采取的交叉滯后相關分析是議程設置研究中的經(jīng)典方法,但仍然不能突出“牽一發(fā)而動全身”的整體傳導結構,可考慮采用多變量因果分析、因果圖模型等方法進行更細致的研究。(3)本文現(xiàn)有的分析強調(diào)從線條到網(wǎng)絡的傳播結構,可考慮把熱度層級的信息傳導網(wǎng)絡提升到多元要素的“結構傳播學”分析框架,對熱度層級傳導結構結合“引力模型”等方法探討其“傳播引力”的場效應與特性。
責任編輯 徐昉