徐 翔
社交網(wǎng)絡(luò)是用戶生產(chǎn)內(nèi)容 (User Generated Content,UGC)的自主平臺和自媒體空間,有著各種各樣的 “圈粉”大咖、大V、“頭部用戶”和 “流量擔當”。這些有著高影響力、高粉絲規(guī)模、高關(guān)注度的用戶可稱為社交網(wǎng)絡(luò)中不同程度的 “偶像”用戶。從最原始的層面,“偶像-追隨者/崇拜者”是基本的對應(yīng)關(guān)系,由于其追隨者的數(shù)量和規(guī)模的不同,產(chǎn)生了社交網(wǎng)絡(luò)偶像在程度上的高低差異。由之而產(chǎn)生的是,任一用戶都可以表示出一個或低或高的 “偶像”程度,而不僅僅是那些高圈粉量的用戶。本文的核心內(nèi)容,是探討用戶的 “偶像”程度與他們之間趨同性的關(guān)系。明確提出用戶可能存在、易被忽視的 “偶像趨同性”現(xiàn)象;闡釋和檢驗由用戶的 “偶像趨同性”對社交網(wǎng)絡(luò)產(chǎn)生的趨同后果與連貫效應(yīng),及這些不同路徑之間的同步性和一致性。
本文以新浪微博為社交網(wǎng)絡(luò)對象,考察其中的 “偶像趨同性”現(xiàn)象。社交網(wǎng)絡(luò)中的偶像用戶千差萬別,各個細分領(lǐng)域的意見領(lǐng)袖、內(nèi)容精英 “你方唱罷我登臺”,各種大、中、小 “咖位”的流量用戶百花齊放,容易造成一種錯覺,即認為社交網(wǎng)絡(luò)中的偶像用戶是多種多樣的。關(guān)于網(wǎng)絡(luò)文化和Web2.0不同于傳統(tǒng)媒介的去中心化及其多樣化話語主體,常成為社交網(wǎng)絡(luò)偶像多樣化的理論依據(jù)。例如波斯特對于互聯(lián)網(wǎng)時代作為 “雙向的去中心化的交流”的 “第二媒介時代”的闡述[1](P22-28),吉摩爾認為自媒體 “草根媒體”把 “宣講”變?yōu)?“對話”并動搖主流媒體的信息壟斷[2]。較多對意見領(lǐng)袖的調(diào)研認為,他們是分布在多種領(lǐng)域、內(nèi)容主題分化和差異化的[3][4][5][6]。這些理論觀點在意見市場中擁有巨大擁躉,使得本文對于用戶趨同的強調(diào)面臨著現(xiàn)實必要性。一些研究涉及和分析了社交網(wǎng)絡(luò)中用戶內(nèi)容同質(zhì)化的形成機制,包括網(wǎng)絡(luò) “回音室”、群體極化、網(wǎng)絡(luò)“巴爾干化”等的分析,都指出網(wǎng)絡(luò)中會形成同質(zhì)化用戶的聚集和圈層[7][8][9][10]。對網(wǎng)絡(luò) “巴爾干化”的重要分析表明,信息技術(shù)構(gòu)筑起基于學(xué)科專業(yè)、社會階層、個人偏好、社會文化的分化和相互之間的壁壘[11]。這些社交網(wǎng)絡(luò)用戶的趨同化為本文的分析提供了有益基礎(chǔ),然而仍有巨大的挖掘空間:(1)對于多種社群、用戶階層和 “壁壘”因素的實證分析表明,用戶本身的影響力、“圈粉”流量、偶像地位等因素如何影響他們的同質(zhì)化,尚待明確。(2)對于種種 “局部化”用戶的趨同研究是當前相關(guān)的實證研究的主要傾向之一,但是這些 “局部”視野易于忽略整體中的用戶趨同化是否發(fā)生、如何發(fā)生,或者要以整體分化為局部趨同的背景或代價。如果社交網(wǎng)絡(luò)用戶具有趨同化的現(xiàn)象,我們并不僅需要關(guān)注局部如何趨同化,還要進一步關(guān)注于用戶在全局和整體上,是否以及如何體現(xiàn)其 “趨同”效應(yīng)及驅(qū)動邏輯?但這方面的研究仍然較為匱乏。
一些研究部分認可社交網(wǎng)絡(luò)意見領(lǐng)袖和 “人氣用戶”在類型上的偏倚,及其中隱含的集中和趨同。張玉晨等將新浪微博加V用戶分為專家型、媒體型、政務(wù)型、娛樂型、機構(gòu)型和其他類型六大類,指出媒體型占掘最主要的比重[12]。張志安等對于微博的分析結(jié)果表明,營銷類、娛樂類用戶成為微博意見領(lǐng)袖群體的主流[13]。佟力強[14](P27-28)將新浪微博名人用戶主要分為七類,并指出文化傳媒類、商業(yè)財經(jīng)類、文體明星類占據(jù)著最為主要的比重。但總體上,這些分析還是對于意見領(lǐng)袖的靜態(tài)描述,而非對其動態(tài)化機制的分析:(1)即使在高粉絲規(guī)模的意見領(lǐng)袖中,也仍然存在著強弱程度的分化,這些程度差異是否以及如何體現(xiàn)到用戶的狹窄化和偏倚中?(2)如果 “頭部”用戶是具有偏倚性和趨同性的,那么這種趨同化如何形成?形成之后如何演變?如果把用戶看成鐵板一塊的整體,就難以展開對于用戶驅(qū)同邏輯線條的分析。對于社交網(wǎng)絡(luò)用戶而言,其中的重要動態(tài)條件是用戶在影響力程度上的差異,以及這種條件差異所帶來的趨同程度的結(jié)果差異。
社交網(wǎng)絡(luò)中高影響力用戶/偶像用戶具有更強的內(nèi)容擴散力,對其他用戶會產(chǎn)生更強的同化作用。Matsumura等提出的影響力擴散模型 (Influence Diffusion Model,IDM)[15],反映了意見領(lǐng)袖在內(nèi)容上向其他用戶的擴散力和擴散深度。Borge等[16]分析了推特中的政治意見領(lǐng)袖發(fā)布的相關(guān)信息在推特中的擴散能力。高劑斌等提出在BA無標度網(wǎng)絡(luò)上模擬個體觀念演化驅(qū)動群體行為的模型,表明網(wǎng)絡(luò)中的 “超級節(jié)點”對達成觀念共識和形成全局群體行為具有明顯牽引作用[17]。李根強等運用計算實驗法分析意見領(lǐng)袖對網(wǎng)絡(luò)集群觀點演化的影響作用,指出分散的群體觀點最終會朝向意見領(lǐng)袖的觀點逐漸偏移[18]。李衛(wèi)東等發(fā)現(xiàn)個體的社會網(wǎng)絡(luò)中心性與意見強化現(xiàn)象有明顯的正相關(guān)關(guān)系[19]。Yoo等使用Twitter數(shù)據(jù)分析了意見領(lǐng)袖所產(chǎn)生的內(nèi)容級聯(lián),具有較大網(wǎng)絡(luò)的生產(chǎn)者貢獻的內(nèi)容的擴散更有可能被相似內(nèi)容的擴散所放大,并對其他內(nèi)容的擴散產(chǎn)生抑制[20]。這些顯示著大范圍的用戶節(jié)點圍繞某種具有強同化能力的用戶發(fā)生趨同的可能,尤其是圍繞高影響力的“偶像”用戶發(fā)生的趨同。
用戶為了獲得高影響力而迎合受眾、市場的期待與過濾,使得符合這種內(nèi)容模式的用戶更有可能實現(xiàn)高影響力或高偶像程度,從而影響力越高的用戶和某種 “頂部”用戶的內(nèi)容特征就越切近。用戶的內(nèi)容生產(chǎn)受到以召回率為目標的推薦算法影響,帶來內(nèi)容選題、類型和風格的系統(tǒng)化傾向,影響到內(nèi)容生產(chǎn)者的旨趣,并促使內(nèi)容生產(chǎn)變得愈加標準化[21]。Masson等建立的動態(tài)模型假定用戶只會發(fā)布其認為可能非常受歡迎的內(nèi)容,證明用戶發(fā)帖的收斂性[22]。社交網(wǎng)絡(luò)用戶在發(fā)帖和分享時會受到 “想象的受眾”塑造作用,使得自身內(nèi)容增強朝向某種內(nèi)容特征的收斂[23]。Mikal等認為社交網(wǎng)站具有話語內(nèi)容的某種潛在特質(zhì)和標準,網(wǎng)民受到網(wǎng)站中溝通“標準”的修正,從而在發(fā)帖時相應(yīng)地修改自己的內(nèi)容而趨同于網(wǎng)站內(nèi)容[24]。在這些網(wǎng)站中的內(nèi)容生產(chǎn)行為不斷調(diào)適,使得用戶內(nèi)容不是自主化和多樣化,而是朝向受眾和市場普遍選擇的模式發(fā)生收斂與趨同;這種趨同程度越高也意味著受到受眾、注意力市場的接受程度也越高,從而產(chǎn)生更高的影響力或偶像程度。
總體而言,高影響力用戶具有使得其他用戶和自己趨同的更強的同化能力;高影響力用戶由于符合某種共通的內(nèi)容模式、受眾期待,而產(chǎn)生多樣性的消減、內(nèi)容同質(zhì)化的增強;媒介生產(chǎn)中其他用戶朝向高影響力的用戶發(fā)生內(nèi)容的模仿、學(xué)習(xí)而提升自己的競爭力與影響力。這些都體現(xiàn)出了高影響力用戶在用戶趨同中的重要作用。對此,需要將這種同化作用的程度更進一步具體化,并尋求它和用戶影響力程度之間的對應(yīng)關(guān)系與共變機制。一方面,用戶的偶像程度越高,則使得其他用戶和自己趨同的效能越強;另一方面,其他用戶對于 “頭部”用戶、已成功獲得高影響力的偶像用戶的學(xué)習(xí)和趨近,也反過來使得自身的影響力越可能趨于增強。在這種作用條件和動態(tài)描述基礎(chǔ)上,本文用偶像用戶程度作為指標表示用戶的影響力,明確地凝練和提出社交網(wǎng)絡(luò)用戶 “偶像趨同性”的基本問題 (代稱Q0):用戶作為 “偶像”用戶的程度高低,密切關(guān)系到他和高程度偶像用戶似同化的程度;由之,是否存在如下具有規(guī)律性的現(xiàn)象——高程度偶像用戶和其他任意某用戶之間的內(nèi)容相似程度,和這兩個用戶的偶像程度高低同時具有正相關(guān)?
對于可能存在的 “偶像趨同性”現(xiàn)象的基本界定和操作化的形式如下 (代稱P0):對于社交網(wǎng)絡(luò)中某用戶x而言,其他任意某用戶設(shè)為y,兩者的用戶內(nèi)容相似程度設(shè)為sim(x,y),這兩個用戶各自作為偶像用戶的程度分別設(shè)為ix、iy;當y為不同于x的任意用戶的情況下,如果用戶的“偶像趨同性”程度越強,則sim(x,y)與 (ix+iy)之間的正相關(guān)程度就越高。
由P0和前文的理論分析所延展的重要假設(shè)H0是:用戶的 “偶像趨同性”現(xiàn)象和強度不是隨機分布的,而是與用戶的偶像程度具有正相關(guān)。換言之,高偶像程度的用戶,具有比較穩(wěn)定、強烈、可預(yù)期而非若有若無的 “偶像趨同性”現(xiàn)象。基于H0這一基本假設(shè),對于后文的偶像用戶趨同分析提供了重要準備。
針對P0的基本現(xiàn)象,以典型社交網(wǎng)絡(luò)之一的新浪微博為案例對象,展開后續(xù)實證考察和機理分析,全文的推進步驟按照任務(wù)1、任務(wù)2、任務(wù)3展開,依次如下。
任務(wù)1。這是具有基礎(chǔ)性的一環(huán),結(jié)合用戶作為偶像用戶的影響力維度 (見后文C0、C2),以及用戶之間在內(nèi)容上的相似程度 (C1),提出用戶 “偶像趨同性”的現(xiàn)象與內(nèi)涵 (P0),測度用戶的偶像趨同性現(xiàn)象與程度 (N1),并指出越是高偶像程度的用戶其 “偶像趨同性”就越強烈(H0)。
圖1 研究內(nèi)容與邏輯關(guān)系
任務(wù)2。在 “偶像趨同性”的內(nèi)涵、現(xiàn)象與機制的基礎(chǔ)上,探討和檢驗其蘊藏的社交網(wǎng)絡(luò)用戶單極化、收窄化、大眾化的趨同作用后果 (分別對應(yīng)于假設(shè)H1.1、假設(shè)H1.2和假設(shè)H1.3),它們是和 “偶像趨同性”緊密相關(guān)的組成層面。其中,包括一部分不大符合經(jīng)驗,但卻包含在偶像趨同性的延伸范圍內(nèi)的可以經(jīng)受檢驗的現(xiàn)象。
任務(wù)3。對于任務(wù)2中涉及的三種后果,探討這三者的共變是統(tǒng)一的亦或相互對立的、或存在矛盾和沖突?這部分對應(yīng)于假設(shè)H2,同樣容易產(chǎn)生一些錯誤的 “觀感”。任務(wù)3構(gòu)成對于偶像趨同性所產(chǎn)生的社會后果與微博社會特征的分析。
全文圍繞任務(wù)1、任務(wù)2、任務(wù)3,及其緊密關(guān)聯(lián)的H1.1、H1.2、H1.3、H2,從理論分析和實證檢驗方面系統(tǒng)展開。
由P0可以給出每個用戶的 “偶像趨同性”強烈程度的衡量方法 (N1):用戶x分別和m個其他用戶的內(nèi)容相似度記為數(shù)組Sx1= [s1,s2,s3,…,sm];x自身作為偶像用戶的影響力程度 (內(nèi)涵參見C0,測量方法參見后文C2)記為ix,x依次和其他m個用戶的影響力程度之和記為數(shù)組Ix1= [ix+i1,ix+i2,ix+i3,…,ix+im];則顯然,如果x所表現(xiàn)出的 “偶像趨同性”越是鮮明和強烈,則Sx1和Ix1的皮爾遜相關(guān)系數(shù)也就越高。這兩組數(shù)之間的皮爾遜相關(guān)系數(shù)記為px1,表示的含義是:若x和其他任意一個用戶的偶像程度之和越大;則x和該用戶的內(nèi)容相似度也就相應(yīng)地越高,反之亦然。
由相關(guān)系數(shù)的定義可知,任意用戶的 “偶像趨同性”強度px1取值在 [-1,+1]之間。實際計算過程中,當px1不符合相關(guān)系數(shù)的顯著性要求時,把px1替換為0,表明無相關(guān)關(guān)系。當px1等于1并且顯著時,此時完全可以由x和其他任意用戶各自的偶像程度,精確地預(yù)測兩者之間的內(nèi)容相似度。反之,若px1取值小于或等于0且顯著時,則意味著用戶x不存在P0中所述的偶像趨同性的現(xiàn)象,甚至?xí)l(fā)生與P0相反的現(xiàn)象。
對于個體x層面的偶像趨同性,如果擴展到宏觀和整體也成立,此時對于任意一個個體x,其和任意一個其他個體y,相互之間存在著 “兩者內(nèi)容相似度與兩者偶像程度之和具有正相關(guān)”的現(xiàn)象。個體層面的 “偶像趨同性”,成為關(guān)系到全局 “偶像趨同性”得以成立的微觀基礎(chǔ)。用戶個體的偶像趨同性程度越高,則該個體和全局任一用戶的趨同力就越強烈和鮮明、可預(yù)測。如果這些強“偶像趨同性”的個體越多,則整體越有可能表現(xiàn)出任意兩個用戶之間普遍存在的正向的趨同性。從結(jié)果上會導(dǎo)致高影響力的 “偶像”用戶長得越來越像,而不是由于垂直領(lǐng)域、細分受眾等原因長得越來越差異化。
用戶趨同度/用戶內(nèi)容相似度 (C1)。本研究中,對于用戶趨同的現(xiàn)象和程度,基于用戶內(nèi)容相似度進行衡量。實際操作中,把某個用戶發(fā)布的n條帖子作為一個整體,考察其內(nèi)容特征,進而以此分析用戶之間的內(nèi)容相似、內(nèi)容趨同的程度。選擇向量空間模型 (Vector Space Model,VSM)+潛在語義分析 (Latent Semantic Analysis,LSA),把每個用戶根據(jù)其帖子內(nèi)容轉(zhuǎn)化為一個若干維的向量。這個向量不僅作為用戶的嵌入式表示,也很方便在用戶之間進行向量的相似度計算。
社交網(wǎng)絡(luò)偶像:參見前文C0。
用戶的偶像程度/偶像度 (C2)的衡量。本文中的 “偶像”用戶是廣義上的,不是某個固定的、鐵板一塊的人群,而是具有各種不同 “偶像程度”,既包括各種 “大V”、“中V”,也包括零粉絲的程度為0的 “偶像”。采用 “追隨者”/“粉絲”的規(guī)模,反映一個用戶的偶像程度/偶像度。微博中,粉絲規(guī)模是一個偶像的追隨者的最為直接而原始的體現(xiàn)。對于微博意見領(lǐng)袖、社交網(wǎng)絡(luò)“大V”的研究,突出 “粉絲規(guī)模”這個指標反映用戶影響力和微博話語地位的重要性[25]。實際計算中,由于微博用戶的粉絲規(guī)模懸殊太大,從寥寥幾個到數(shù)千萬不等,因此采取對數(shù)轉(zhuǎn)換后的形式,x為用戶粉絲規(guī)模的原始值,則偶像程度xnew=log2(x+1)。
“偶像趨同性”現(xiàn)象對于微博會帶來什么樣的影響與后果?總的說來:越是高影響力的用戶,就越是發(fā)生多種形態(tài)的趨同、相似,而不是容易誤認為的細分化、差異化與多樣化。
但是這種用戶 “趨同”有著多種嚴格的路徑及條件,而不能籠統(tǒng)地用 “同質(zhì)化”來概括。就此分別稱之為:單極化、收窄化、大眾化。其涉及的層面由窄到寬,而指向越來越泛化的趨同。由偶像用戶的影響力程度、偶像趨同性和用戶趨同現(xiàn)象,進一步的具體問題如下。問題Q1:用戶隨著影響力程度的提升,是否和 “某一個”用戶越來越相似,從而產(chǎn)生單極化的趨同?問題Q2:用戶隨著影響力程度的提升,是否在影響力的 “同一個層級”內(nèi)的用戶彼此之間越來越相似,從而產(chǎn)生由低到高層級的收窄化的趨同?問題Q3:用戶隨著影響力程度的提升,是否和多數(shù)的大眾、“蕓蕓眾生”用戶越來越相似,從而產(chǎn)生大眾化的趨同?這幾種趨同的態(tài)勢和路徑,和一般的經(jīng)驗直觀也有著諸多相悖之處,因此同樣需要結(jié)合實證釋疑。
這里的 “單極化”指的是所有的用戶不僅隨著偶像程度的增加而長得越來越像,更為重要的是:隨著偶像程度/影響力程度越高,則用戶長得越來越像 “同一個模子”里出來的。
為什么如此推測?根據(jù)前文的 “偶像趨同性”現(xiàn)象和效應(yīng)、測量方式 (P0、N1),對于微博中“偶像趨同性”程度最高 (且該程度為正數(shù)的情況下)的那個用戶 (代稱topuser),存在以下情況:其他任意一個用戶 (代稱x)和topuser的偶像程度之和也越高,此時x和topuser的內(nèi)容相似度也傾向于越大,兩者是正相關(guān)的。而且這種正相關(guān)程度與topuser的 “偶像趨同性”程度是等價的。因此可以推測,這種用戶 “單極化”趨同的假設(shè)是有合理性的;而成為這個 “單極”的模子,就是最高 “偶像趨同性”的那個用戶。例如,當topuser的 “偶像趨同性”程度等于1時,則任何一個其他用戶x,只要x自身的偶像程度越高,則和topuser就必定內(nèi)容相似度越高,而且是完全確定的一一對應(yīng)關(guān)系。雖然這是理論上的案例而在現(xiàn)實中難以真實發(fā)生,但是對于其他高 “偶像趨同性”用戶來說,這種情況還是存在的,只是其強烈程度稍弱。同時這里需要注意,體現(xiàn) “單極化”方向的是 “偶像趨同性”程度最高的用戶,而不是 “偶像程度”最高的用戶。
把關(guān)于 “單極化”的推測轉(zhuǎn)為可操作化的假設(shè)H1.1:微博中 “偶像趨同性”程度最高的用戶設(shè)為topuser;其他m個用戶記為Y= [y1,y2,y3,…,ym];Y中每個用戶與topuser的內(nèi)容相似度依次記為S= [s1,s2,s3,…,sm];Y中每個用戶的作為偶像用戶的程度依次為I= [i1,i2,i3,…,im];則I和S之間具有顯著的線性正相關(guān)。
H1.1還原為通俗表述是:任一用戶,如果他作為偶像用戶的程度越高,則他和最高 “偶像趨同性”程度的那個 “模板”就越相似。
這里的 “收窄化”指的是:把某個用戶以及和他同 “偶像程度”的多個用戶組成一個 “用戶層級”,則從低到高的層級中,同層級內(nèi)用戶的 “彼此相像”程度會越來越高。偶像程度最高的偶像層級擁有最高的彼此相似度;次高層級則擁有次高的彼此相似度;依此類推。
為什么做出這樣的推斷?依然是基于 “偶像趨同性”以及H0的簡單延伸。由于越是高偶像程度的用戶其 “偶像趨同性”程度也越強烈,這就意味著,高偶像程度的用戶和其他任意一個用戶的相似度更容易與兩者的偶像程度之和有正相關(guān),而非隨機;反之,低偶像程度用戶和其他任意一個用戶的相似度則更容易隨機而缺乏某種約束性。這樣就可以推測,高偶像程度用戶彼此由于更強的“偶像趨同性”因而更容易具有高相似度;高偶像程度和低偶像程度用戶的相似度同樣由于 “偶像趨同性”的作用而與兩者的偶像程度之和成正相關(guān),因此稍弱;但低偶像程度用戶之間的相似度或者由于 “偶像趨同性”的作用而偏低,或者由于沒有受到 “偶像趨同性”的作用而傾向于圍繞平均相似度波動于一個隨機值。由此,我們提出推測:越是低偶像程度的用戶其彼此相似度越低,越是高偶像程度的用戶其彼此相似度越高,兩者具有正相關(guān)性。
將上述推測轉(zhuǎn)換為本文要驗證的假設(shè)H1.2:微博m個用戶記為Y= [y1,y2,y3,…,ym];Y中對每個用戶而言和自己在偶像程度上最為接近的k個用戶組成一個 “用戶層級”,這樣就得到m個用戶層級。如果每個層級內(nèi)的用戶彼此之間內(nèi)容相似度的均值依次記為S= [s1,s2,s3,…,sm],每個層級中用戶的偶像程度均值依次記為I= [i1,i2,i3,…,im];則I和S之間具有顯著的線性正相關(guān)。
每層用戶內(nèi)部彼此相似度的計算方法,為后文式3。
H1.2通俗表述是:偶像程度越高的用戶層級,層級內(nèi)部各用戶越是長的彼此相像、消減掉了彼此的異質(zhì)性;而偶像程度越低的用戶層級,越是長的 “五花八門”、分布得更為寬泛。
這里的大眾化是指,越是高程度的偶像用戶,他們的內(nèi)容就越不是 “特立獨行”、引領(lǐng)一方或“獨樹一幟”的意見領(lǐng)袖、內(nèi)容精英;相反,他們的內(nèi)容越趨于普通和去個性化、更為 “長著大眾臉”、和多數(shù)人更為相似。
這和一種容易產(chǎn)生的經(jīng)驗是相悖的,也即誤認為擁有很多粉絲規(guī)模的偶像用戶需要獨特的、差異化的或者飄然乎眾人的精英化內(nèi)容,才可能成為某種程度上的 “意見領(lǐng)袖”或某領(lǐng)域的大咖。為什么高粉絲的用戶不是更擁有獨特 “氣質(zhì)”和 “識別度”的用戶,反而是與多數(shù)人更為相似、“泯然眾人矣”?仍然可以從 “偶像趨同性”解釋與推斷。
由前文已得,“偶像趨同性”程度為正的用戶x會和其他任意用戶產(chǎn)生趨似性,趨似的程度隨著其他任意用戶的偶像程度的高低而變化,兩者具有和x的 “偶像趨同性”程度相等的正相關(guān)系數(shù)。那么對于全體的 “偶像趨同性”程度為正的用戶集U= [x1、x2、x3、…、xp]而言,其他任意用戶的偶像程度和U中每個個體的相似度都具有正相關(guān)性。
在此基礎(chǔ)上提出假設(shè)H1.3:微博m個用戶記為Y= [y1,y2,y3,…,ym],Y中用戶的偶像程度依次記為I= [i1,i2,i3,…,im];Y中 “偶像趨同性”程度為正的用戶記為U= [x1、x2、x3、…、xp];Y中單個用戶和U中各個用戶的相似度之和依次記為S= [s1,s2,s3,…,sm],;則I和S之間具有顯著的正相關(guān)。
其中,每個用戶和一群用戶U的平均相似度的計算方法,為后文式2。計算得到的結(jié)果乘以U中的人數(shù)即為某個用戶和U的 “眾人”的總相似度。
H1.3的通俗表述是:偶像程度越高的用戶和全體具有正 “偶像趨同性”用戶的總相似度越高,而這個總相似度越高也等價于平均相似度越高;最后體現(xiàn)為:偶像程度越高的用戶和 “占大部分比例的一大幫子人”的相似度越高,也即隨著自身偶像程度的升高而越是 “貼近和隱匿于滾滾人流之中”。
當然,這個 “去個性化”的強弱和系統(tǒng)中具有正 “偶像趨同性”用戶的數(shù)量比例有關(guān)。根據(jù)本研究樣本的分析,其中 “偶像趨同性”程度為正且顯著的用戶占到了63.38%,從而意味著這些用戶的 “去個性化”的程度較強,和六成以上的用戶 “大眾”保持著 “越來越相似、越來越貼近”的關(guān)系。
微博用戶的單極化、收窄化、大眾化之間是什么關(guān)系?容易產(chǎn)生的誤解之一是,用戶越來越變得和某個頂端 “單極”相似的同時,越來越 “收窄”的同時,應(yīng)該是越來越遠離 “蕓蕓眾生”而變得越來越特別甚至趨于 “獨一無二的那一個”。也即,三者之間看似存在著某種沖突關(guān)系。另一種可能的誤解則是,單極化、收窄化、大眾化可能是相互獨立、互不相干的過程。
但是,既然假設(shè)H1.1、H1.2、H1.3都是基于 “偶像趨同性”機制而產(chǎn)生的,都是伴隨著用戶偶像程度的增加而不斷增強的現(xiàn)象與效應(yīng);我們就難以輕易否認它們之間的內(nèi)在統(tǒng)一性,因為它們是同一種機制、在同一變量變化下的現(xiàn)象演化。因此,這里補充提出假設(shè)H2:用戶隨著作為偶像用戶的程度增加,其單極化、收窄化、大眾化的程度是統(tǒng)一的過程,而非相互獨立或存有沖突的過程;也即用戶作為偶像用戶的程度、用戶單極化程度、用戶收窄化程度、用戶大眾化程度這四者具有一致性。對H2的檢驗方法,采取常用的克朗巴赫系數(shù) (Cronbach's Alpha系數(shù))。四者的克朗巴赫系數(shù)越高,表明相互的統(tǒng)一性越高;反之則一致性越差。
根據(jù)新浪微博數(shù)據(jù)中心 《2018微博用戶發(fā)展報告》,新浪微博月活躍用戶4.62億,月閱讀量過百億,涉及領(lǐng)域達32個[26]。采取成本相對較低的多階段抽樣,從新浪微博首頁47個版塊 (社會、國際、科技、科普、數(shù)碼、財經(jīng)、股市、明星、綜藝、電視劇、電影、音樂、汽車、體育、運動健身、健康、瘦身、養(yǎng)生、軍事、歷史、美女模特、美圖、情感、搞笑、辟謠、正能量、政務(wù)、游戲、旅游、育兒、校園、美食、房產(chǎn)、家居、星座、讀書、三農(nóng)、設(shè)計、藝術(shù)、時尚、美妝、動漫、宗教、萌寵、法律、視頻、上海)中,獲取其發(fā)布者和評論者共3 501 153個用戶的數(shù)據(jù)庫,用八爪魚抓取軟件從中最終抓取到具有有效個人資料的、發(fā)帖數(shù)不少于500條的88 739個用戶;對這些有效用戶抓取每人的前5頁關(guān)注者 (新浪微博官方對每個用戶最多只公開顯示其100位關(guān)注者)。由于不同的用戶所關(guān)注的人可能有重復(fù),經(jīng)過選取發(fā)帖數(shù)不少于500條的用戶、去除重復(fù)用戶、篩選具有個人資料的用戶等清洗環(huán)節(jié),從這些被關(guān)注者中選取到有效用戶130 082個。
對用戶統(tǒng)一橫向的比較口徑。其一是時間段的統(tǒng)一,帖子一律選取在2018年1月1日到2018年12月31日這一年的。該年度沒有經(jīng)歷新冠疫情等特殊的大型公共事件,用戶的帖子生產(chǎn)不會被少數(shù)共同話題所過度牽引。其二是帖子數(shù)量的統(tǒng)一,每個用戶一律隨機選取500條帖子。由于只言片語難以 “察其言、觀其人”,因此少于該帖數(shù)的用戶不納入比較范圍。
經(jīng)過上述取樣和數(shù)據(jù)清洗整理,最后得到的樣本用戶為24 779個。剩下的這些用于計算的用戶分布有廣泛性與代表性,粉絲規(guī)模、發(fā)博量、關(guān)注數(shù)等各主要指標都包含從數(shù)十到數(shù)萬乃至數(shù)千萬的大范圍,各種重度/輕度用戶、活躍/不活躍用戶都有良好的覆蓋。
把單個用戶的各條帖子無順序拼接為一個長文本,先通過向量空間模型 (Vector Space Model,VSM)得到用戶的詞頻矩陣。詞頻矩陣的獲取采取數(shù)據(jù)挖掘模塊sklearn中的Count Vectorizer()函數(shù),其中最低詞頻數(shù)設(shè)為50,即只計算出現(xiàn)次數(shù)達到50次的詞,最大文檔頻率設(shè)為0.2,也即在20%以上的帖子中都出現(xiàn)的詞不予計算,只采用一元詞而未采用二元詞、三元詞等多元詞。得到詞頻矩陣轉(zhuǎn)換為表示每個詞語TF-IDF值的矩陣X,轉(zhuǎn)換函數(shù)為sklearn的Tfidf Transformer(norm='l1')。
對于矩陣X,采取潛在語義分析 (Latent Semantic Analysis,LSA)進行降維和內(nèi)容特征提取[27]。LSA利用奇異值分解技術(shù),可把數(shù)十萬以上的高維、稀疏的矩陣降到只有數(shù)千、數(shù)百的低維表示。本研究中每個用戶的詞頻矩陣原有113 694維,一律通過潛在語義分析降到700維。降維工具選擇目前廣泛應(yīng)用的開源模塊scikit-learn中的TruncatedSVD()函數(shù)。
圖2 樣本用戶的特征分布柱狀圖
選擇700維的維度時,其解釋方差比處于圖3中 “肘拐點”的位置,再增加維度已經(jīng)對于保留原信息的程度增幅平緩;TruncatedSVD()計算得到的解釋方差比值已達0.76,保留了原有的十一余萬維矩陣的大部分信息,用盡可能精簡的維度提取和高效表示用戶特征,剔除冗余或噪音信息特征。
圖3 潛在語義分析對用戶內(nèi)容降維的解釋方差比
每個用戶根據(jù)其內(nèi)容提取為700維的向量之后,就可以直接進行用戶相似度計算。選擇文本挖掘中穩(wěn)健的余弦相似度。任意兩個用戶Um和Un之間的內(nèi)容余弦相似度計算方式表示為:
在上述式 (1)的基礎(chǔ)上擴展,從 “1對1”的用戶相似度擴展到 “n對n”的兩組用戶 (每組中用戶數(shù)量n≥1)之間的相似度。任意一組用戶G1(包含n1個用戶)和另一組用戶G2(包含n2個用戶)的內(nèi)容相似度,表示為:
式 (2)在式 (1)的基礎(chǔ)上,采用 “類平均法”擴展得到。其中G1或G2都可以有且僅有一個用戶。H(G1,G2)的值越大,表明G1、G2這兩組用戶之間兩兩的類同乃至重復(fù)程度越高;若兩組用戶的異質(zhì)化內(nèi)容越大則平均相似度就會越低,也即H(G1、G2)的值越小。
式 (2)中,當n1=n2=1時,則等同于式1。式 (2)中,當n1=1而n2>1時,為計算一個用戶和一組用戶之間的平均相似度,此時用于H1.3中個體和群組的相似度計算。
式 (2)中,當G1=G2且組內(nèi)用戶數(shù)量大于1個時,則為計算組內(nèi)用戶的兩兩之間彼此相似度的平均值 (用于對H1.2中用戶層組 “收窄化”的計算),也即等價于計算G1內(nèi)部的自我相似度。此時采取式 (2)的微調(diào)形式如下,因為不能包含個體和自身的相似度 (因為該值=1):
1.個體層面的用戶 “偶像趨同性”現(xiàn)象與分布。結(jié)合前文P0和N1中的界定,對微博用戶在個體表現(xiàn)中的 “偶像趨同性”程度和分布進行計算,其分布頻次如圖4所示,基本統(tǒng)計特征描述和百分位值如表1、表2所示。
圖4 新浪微博用戶個體的 “偶像趨同性”指標值分布
表1 用戶個體 “偶像趨同性”程度的統(tǒng)計特征描述
表2 用戶個體 “偶像趨同性”程度百分位數(shù)值
這些結(jié)果顯示,用戶個體表現(xiàn)出 “偶像趨同性”不只是一種理論上的想象,而是在現(xiàn)實中表現(xiàn)出的客觀現(xiàn)象。各個體的 “偶像趨同性”程度值有正有負,但總體上正值居多,平均值為0.084,中位數(shù)為0.100。正的最大值為0.406,高于負的最小值-0.22。63.4%的用戶存在顯著的、正向的 “偶像趨同性”,其余的則是無顯著效應(yīng)或指標值為負的用戶。多數(shù)用戶的這種現(xiàn)象的顯著使得個體層面的偶像趨同性具有現(xiàn)實性,并會使得宏觀總體也表現(xiàn)出一般性的偶像趨同性現(xiàn)象。
2.用戶的偶像程度與 “偶像趨同性”程度之間的關(guān)系 (H0)。用戶的 “偶像趨同性”的強度不是任意分布的,而是與用戶的偶像程度之間具有正向關(guān)系。對于24 779個用戶樣本依次得到其偶像程度值的序列、其 “偶像趨同性”程度值的序列,則兩個序列之間,皮爾遜相關(guān)系數(shù)為0.544(p<0.001,N=247 79),斯皮爾曼相關(guān)系數(shù)為0.537(p<0.001,N=247 79),從而驗證了H0。
圍繞用戶偶像程度和 “偶像趨同性”程度之間的正向相關(guān)性與同步性,將用戶按照偶像程度等頻劃分為10個層級 (從低到高依次標為第1、2、3、…、10層),每層對應(yīng)的偶像趨同性程度(95%置信區(qū)間)如圖5所示。
圖5 用戶的偶像程度及其所對應(yīng)的偶像趨同性程度
圖5顯示,偶像程度越高的用戶其偶像趨同性的程度也越強烈。偶像程度處于最低層級的用戶,其偶像趨同性均值只有-0.005;而偶像程度處于最高層級的用戶其偶像趨同性均值已穩(wěn)步提升到0.187,大大超過全體均值0.084。
3.宏觀層面的用戶 “偶像趨同性”現(xiàn)象與效應(yīng)。從上述的特定個體的微觀層面,自然拓展到總體中任意兩個個體的宏觀層面。繼續(xù)對微博宏觀條件下任意兩個用戶之間相互的偶像趨同性是否顯著展開檢驗。由P0延伸而得到的擴展性的假設(shè)為P1:任意兩個用戶x和y的內(nèi)容相似度,與這兩個用戶各自作為偶像的程度相加的和,兩者之間具有正相關(guān)。
對P1的檢驗方法為,抽取新浪微博中的n個用戶,兩兩配對 (不含和自己的配對),形成n×(n-1)對用戶;然后考察每對用戶的內(nèi)容相似度,和對中兩位用戶偶像程度之和,是不是具有正相關(guān)。對本研究的24 779個用戶樣本兩兩之間進行分析,得到每對用戶的內(nèi)容相似度 (代稱序列a)、每對用戶的偶像程度之和 (代稱序列b)。序列a和序列b之間的皮爾遜相關(guān)系數(shù)為0.125(p<0.001,N=613 949 284),斯皮爾曼相關(guān)系數(shù)為0.162(p<0.001,N=613 974 062)。這顯示即使拓展到宏觀總體中的任意用戶,用戶之間的 “偶像趨同性”現(xiàn)象也是存在的和顯著的;越是強偶像程度的用戶相互之間相似度越高,反之則越低。盡管由于受到多種干擾因素,相關(guān)系數(shù)不算高,但仍然清晰可見這種正向效應(yīng)的顯著和規(guī)律性,而不是負向的效應(yīng),也不是雜亂無規(guī)律。
本節(jié)在P0的基礎(chǔ)上,檢驗 “偶像趨同性”所內(nèi)蘊的微博偶像單極化 (H1.1)、收窄化(H1.2)、大眾化 (H1.3)的態(tài)勢與趨同路徑,以及這些不同路徑之間的內(nèi)在一致關(guān)系 (H2)。
對于24 779個樣本用戶,首先依次計算每個用戶的 “偶像趨同性”程度 (記為I= [i1,i2,i3,…,im])。然后依次對于每個用戶計算他和具有最高 “偶像趨同性”程度用戶的內(nèi)容相似度(記為數(shù)值序列St= [st1,st2,st3,…,stm]);每個用戶所屬 “偶像趨同性”層級的用戶層內(nèi)平均相似度 (記為數(shù)值序列Sg= [sg1,sg2,sg3,…,sgm]);每個用戶和具有正的偶像趨同性的多個用戶的總相似度 (記為數(shù)值序列Sp= [sp1,sp2,sp3,…,spm])。
最后通過分析數(shù)值序列I是不是分別和St、Sg、Sp具有顯著的正相關(guān),從而檢驗微博用戶的單極化、收窄化、大眾化規(guī)律是否成立,三者分別依次對應(yīng)于前文所述的H1.1、H1.2、H1.3。檢驗結(jié)果如表3所示。
表3 假設(shè)H1.1、H1.2、H1.3的內(nèi)容及其檢驗
單極化說明,由于用戶個體之間的 “偶像趨同性”,所有用戶隨著自身偶像程度的增加而朝向“同一個”用戶越長越像。偶像用戶在消減著自身的多樣性,而非趨于多樣化和細分差異化。
收窄化同樣是和偶像趨同性高度關(guān)聯(lián)的效應(yīng),并且由于它反映的是層組的趨同邏輯,會減少個體層面的過大波動,所以效應(yīng)更為穩(wěn)定。對于24 779個用戶分別所屬的24 779層用戶階層,其高達0.7乃至0.8以上 (N=24 779)的皮爾遜相關(guān)系數(shù)顯現(xiàn)了偶像趨同性效應(yīng)傳導(dǎo)至收窄化的結(jié)果,規(guī)律性高度穩(wěn)定。圖6鮮明呈現(xiàn)了24 779層用戶的 “收窄化”程度的變化:
圖6 用戶所處偶像程度層級提升而 “收窄化”的趨勢
對于微博偶像的大眾化而言,同樣是顯著的效應(yīng)和規(guī)律,反映著偶像用戶越來越去除獨特性。馬爾庫塞曾提出 “單向度的人”[28],反思著現(xiàn)代社會中主體的重復(fù)性和單一化。這些批判性的社會理論,雖缺乏實際證據(jù)的驗證,但卻留下豐富的啟示。本研究對于微博偶像 “大眾化”的現(xiàn)象檢驗和證據(jù)顯示,越是高粉絲規(guī)模的偶像用戶就越趨于大眾化、相似化和平庸化,而非 “獨特可辯”或“各領(lǐng)風騷”;并且這種大眾化的 “標的”是具體的、而不是籠統(tǒng)的:和全體的 “偶像趨同性”程度為正的用戶,總相似度和平均相似度越來越高,從而表現(xiàn)出對于同一化和重復(fù)化用戶的生產(chǎn)。
本處涉及對假設(shè)H2的檢驗。前文所述的每個用戶的偶像程度,以及在H1.1、H1.2、H1.3所分別涉及的單極化、收窄化、大眾化程度,這四個變量全部轉(zhuǎn)化為正態(tài)得分值,其后計算得到四者的克朗巴赫系數(shù)為0.759。Cronbach's Alpha系數(shù)達到0.6以上屬于可接受,達到0.7以上時表示變量之間具有較高的一致性。這四個變量中,如表4所示,刪除任意一個變量不能明顯提高Cronbach's Alpha系數(shù)的結(jié)果 (僅在刪除 “大眾化程度”的指標時微微從0.759上升到0.763,但這個變化過于微弱,依然可以視四個變量為統(tǒng)一、同步變化的整體)??傮w而言,H2得到實證檢驗與支持。
表4 用戶偶像程度與單極化、收窄化、大眾化的統(tǒng)一性
隨著用戶的粉絲規(guī)模增加,用戶所表現(xiàn)出的單極化程度、收窄化程度、大眾化程度的變化,是一致和同步而不是相互獨立或沖突的。這與常識觀感有相悖之處,值得我們注意。用戶在趨于 “頂部”最高 “偶像趨同性”用戶的同時,也在趨于和多數(shù)化的眾人越來越相似,自身的獨特性降低;同時上述這兩個過程也伴隨著偶像本身彼此的相似程度越來越高。
本文的工作主要如下。
1.針對社交網(wǎng)絡(luò)中的用戶相似關(guān)系和趨同問題,明確提出用戶 “偶像趨同性”的基本現(xiàn)象(P0),并以微博為主體進行實證研究,所得結(jié)果驗證了本文提出的現(xiàn)象和效果,證明 “偶然趨同性”不只是一種理論上的虛構(gòu)或臆造?!芭枷褛呁浴钡默F(xiàn)象體現(xiàn)了微博社會中的用戶演變和趨同分布的規(guī)律性,背后具有豐富的內(nèi)涵值得繼續(xù)從理論上深入挖掘。
2.在 “偶像趨同性”的基礎(chǔ)上,延伸出其對于微博社會帶來的趨同作用后果:用戶的單極化、收窄化、大眾化,這三種后果的規(guī)律性全部得到實證檢驗。它們作為偶像趨同性的社交媒介后果,是與前者緊密相關(guān)聯(lián)的整體,分別是指朝向某一個模子的趨同、同一影響力層級內(nèi)的趨同、朝向多數(shù)用戶的趨同。同時,這三者也表現(xiàn)出高程度的同步,顯現(xiàn)出趨同路向的統(tǒng)一性,表現(xiàn)出了微博在線社會運行的整體同化邏輯。
用戶的偶像趨同性及其所內(nèi)蘊的單極化、收窄化、大眾化等趨同后果,部分程度上是反直觀、不符合常識觀感的,和一些強調(diào)用戶多樣性或分化性的具有較大擁躉的理論觀點具有不符之處,但它們得到了實證結(jié)果的支持,且其作用機理也表現(xiàn)出一定的合理性。這警示我們在面對社交網(wǎng)絡(luò)空間及偶像社會流動的復(fù)雜性時,要更謹慎地存疑與求證。同時,偶像趨同性的個體機制、宏觀現(xiàn)象及其后果的分析顯示出,用戶隨著其影響力的升高,多種趨同路徑都在不斷增強,社交網(wǎng)絡(luò)中的用戶變得越來越相似與同質(zhì)化,并從趨于單極的同質(zhì)化、同層級的同質(zhì)化、大眾的同質(zhì)化進行立體化的系統(tǒng)演變。這為我們分析微博社交網(wǎng)絡(luò)中的趨同化社會特征與相似性傳遞、同質(zhì)性社會文化生產(chǎn)的運行機理,提供了可探索路向與延伸空間。
中國地質(zhì)大學(xué)學(xué)報(社會科學(xué)版)2021年4期