□徐 翔
[同濟(jì)大學(xué) 上海 201801]
微博是一種重要和典型的社交網(wǎng)絡(luò)與社交媒體應(yīng)用。微博中的用戶(hù),隨著粉絲量、影響力的增大而成為各種大咖、大V、各種流量明星、意見(jiàn)領(lǐng)袖,這些高影響力的用戶(hù)之間,較之于低影響力的用戶(hù)之間,在內(nèi)容上是否變得相互越來(lái)越趨同?抑或相互之間變得內(nèi)容越來(lái)越差異化?
基于微博用戶(hù)數(shù)據(jù)提出用戶(hù)隨著影響力的提升,而呈現(xiàn)出“金字塔結(jié)構(gòu)”:影響力越低的“底部”層級(jí),層級(jí)中的用戶(hù)之間的內(nèi)容差異越大、彼此之間越是松散;影響力越高的“頂部”層級(jí),層級(jí)中的用戶(hù)之間的內(nèi)容差異越小、彼此之間越是趨同和“濃稠”;從而從底部到頂部,表現(xiàn)出由松散、內(nèi)容距離大,逐漸提升為內(nèi)容距離越來(lái)越小、越來(lái)越緊密相似的“金字塔結(jié)構(gòu)”。
采用新浪微博樣本用戶(hù)對(duì)此現(xiàn)象進(jìn)行驗(yàn)證。按照粉絲規(guī)模的高低,把24 779個(gè)樣本切分為從低到高的400個(gè)層級(jí);為了統(tǒng)一比較口徑,進(jìn)行“等頻”分層,每層級(jí)的用戶(hù)人數(shù)相等。每個(gè)層級(jí)內(nèi)用戶(hù)內(nèi)容的相互趨同程度,分別用兩個(gè)指標(biāo)來(lái)衡量。(1)指標(biāo)a。層內(nèi)用戶(hù)的內(nèi)容平均相似度:兩兩之間內(nèi)容相似度的均值。(2)指標(biāo)b。層內(nèi)用戶(hù)內(nèi)容相似性網(wǎng)絡(luò)的“平均群聚系數(shù)”(Average Clustering Coefficient)[1]。
對(duì)于這400個(gè)層級(jí)而言,指標(biāo)a和指標(biāo)b,都隨著層級(jí)用戶(hù)平均粉絲規(guī)模的提升而同步上升,具有顯著而且高強(qiáng)度的線性相關(guān)性,如表1所示。
這種規(guī)律性的現(xiàn)象,對(duì)于上述“金字塔結(jié)構(gòu)”表現(xiàn)得非常鮮明。用戶(hù)根據(jù)粉絲規(guī)模劃分為400個(gè)層級(jí)后,隨著層級(jí)提升,越是高層級(jí)則內(nèi)部越是相互趨同化,而非差異化、松散化。相關(guān)系數(shù)甚至達(dá)到0.758乃至0.8以上,這在社會(huì)現(xiàn)象研究中是高程度的正相關(guān)性。雖然對(duì)于微博意見(jiàn)領(lǐng)袖的研究已很多,但是多數(shù)集中于意見(jiàn)領(lǐng)袖的形成與識(shí)別[2~3]、微博意見(jiàn)領(lǐng)袖有哪些重要類(lèi)型[4]、意見(jiàn)領(lǐng)袖具有怎樣的行為特征[5~6]和影響作用[7~8],而意見(jiàn)領(lǐng)袖用戶(hù)、高影響力用戶(hù)的趨似現(xiàn)象和態(tài)勢(shì),特別是上述金字塔結(jié)構(gòu)的演化態(tài)勢(shì),則得到的關(guān)注尚較少。
表1 用戶(hù)層級(jí)的影響力與層級(jí)內(nèi)用戶(hù)趨同程度
本文把具有相似影響力程度且具有相似內(nèi)容的用戶(hù)層級(jí),稱(chēng)為微博“內(nèi)容階層”。主要研究在“金字塔結(jié)構(gòu)”下,三個(gè)相關(guān)方面的問(wèn)題:(1)具有某種相同或相近影響力的用戶(hù)群,也具有相似的內(nèi)容,形成“相似用戶(hù)在同影響力層級(jí)的聚集”,是否一種普遍性的現(xiàn)象與趨勢(shì)?(2)本文后續(xù)的首要任務(wù)之一,是探討用戶(hù)為何會(huì)出現(xiàn)“內(nèi)容階層”的分化和封閉性,同影響力的用戶(hù)之間的內(nèi)容相似度高低及其內(nèi)聚性如何發(fā)生?(3)“內(nèi)容階層”在何種作用機(jī)制與條件下,會(huì)表現(xiàn)出隨著層級(jí)影響力從低到高而不斷收窄、不斷加強(qiáng)層級(jí)內(nèi)用戶(hù)相似度的“金字塔結(jié)構(gòu)”?
對(duì)于這緊密相關(guān)、連貫問(wèn)題的嘗試回答,和微博用戶(hù)、意見(jiàn)領(lǐng)袖的一種隱藏角色有關(guān),我們稱(chēng)之為“意見(jiàn)代表”的用戶(hù)角色。這種角色長(zhǎng)期被重視程度不夠,尤其在和“意見(jiàn)領(lǐng)袖”的主角光環(huán)之下相形見(jiàn)絀。但是它是用戶(hù)的一種客觀存在的角色,對(duì)于社交網(wǎng)絡(luò)的用戶(hù)層級(jí)凝聚和分化、形成內(nèi)容階層內(nèi)聚性,具有不應(yīng)忽視的作用。從意見(jiàn)代表到內(nèi)容階層的路徑和效應(yīng),構(gòu)成本文的中心任務(wù)。
意見(jiàn)領(lǐng)袖是網(wǎng)絡(luò)傳播與社交網(wǎng)絡(luò)領(lǐng)域的熱門(mén)研究主題。拉扎斯菲爾德等人提出,意見(jiàn)領(lǐng)袖是構(gòu)成信息和影響的重要來(lái)源,并能左右多數(shù)人態(tài)度傾向的少數(shù)人[9]。結(jié)合已有研究[10~12]我們把微博意見(jiàn)領(lǐng)袖概括為微博具有高影響力的用戶(hù),并把影響力用于衡量用戶(hù)作為意見(jiàn)領(lǐng)袖強(qiáng)弱的程度。
意見(jiàn)領(lǐng)袖會(huì)對(duì)于其他用戶(hù)形成一定的同化作用。例如輿情場(chǎng)勢(shì)理論認(rèn)為,意見(jiàn)領(lǐng)袖通過(guò)社交網(wǎng)絡(luò)場(chǎng)域節(jié)點(diǎn)中的“振動(dòng)(閃爍)粒子”,同化受眾。但是對(duì)于微博、社交網(wǎng)絡(luò)的多數(shù)研究,強(qiáng)調(diào)的是核心用戶(hù)、有影響力的用戶(hù),對(duì)于其粉絲和關(guān)注者、追隨者帶來(lái)的同質(zhì)化效應(yīng);而不是處于相同或相近影響力的用戶(hù)群本身,如何形成或加強(qiáng)相互的同質(zhì)性。例如,有研究指出Twitter用戶(hù)和其直接粉絲之間存在著信息內(nèi)容和主題上的同質(zhì)現(xiàn)象[13]。博客中的普通用戶(hù)關(guān)注對(duì)象常常集中在特定的核心博客上,容易陷入特定主題的交流社區(qū)[14]。這些對(duì)于意見(jiàn)領(lǐng)袖的同化現(xiàn)象與作用的研究是本研究的基礎(chǔ)和借鑒。然而,高影響力的意見(jiàn)領(lǐng)袖用戶(hù)比低影響力用戶(hù),粗看起來(lái),并沒(méi)有理由需要和同影響力程度的其他用戶(hù)更為趨似。直接從“意見(jiàn)領(lǐng)袖”角色和特征仍然難以直接解釋的是:同影響力的用戶(hù)群體或?qū)蛹?jí)內(nèi)為何會(huì)具有相似的內(nèi)容,從而表現(xiàn)出該“影響力層級(jí)”內(nèi)的特定強(qiáng)度的用戶(hù)趨同性?對(duì)于不同的影響力層級(jí),其層內(nèi)用戶(hù)趨同程度的高低變化受到什么樣的影響因素的作用,尤其是,為何會(huì)隨著層級(jí)影響力的變化而發(fā)生正向?qū)?yīng)的變化?
用戶(hù)的同質(zhì)化聚集以及區(qū)隔受到多種因素影響。Marshall認(rèn)為網(wǎng)絡(luò)信息技術(shù)加深了學(xué)科專(zhuān)業(yè)、社會(huì)階層、個(gè)人偏好、社會(huì)文化的壁壘,加強(qiáng)網(wǎng)絡(luò)“巴爾干化”中的個(gè)體信息相似程度[15]。Itai Himelboim等人通過(guò)社會(huì)網(wǎng)絡(luò)分析Twitter上發(fā)表意見(jiàn)的用戶(hù),發(fā)現(xiàn)集群內(nèi)觀點(diǎn)、立場(chǎng)的同質(zhì)化明顯[16]。張志安等人的研究顯示,微博中公知型意見(jiàn)領(lǐng)袖群落分散,營(yíng)銷(xiāo)類(lèi)、娛樂(lè)類(lèi)用戶(hù)成為微博意見(jiàn)領(lǐng)袖群體的主流[17]。這些顯示社交網(wǎng)絡(luò)用戶(hù)基于某些壁壘發(fā)生“巴爾干化”的局部聚合,產(chǎn)生用戶(hù)類(lèi)型的狹窄化分布的可能。而同質(zhì)用戶(hù)如何在影響力這個(gè)因素下發(fā)生內(nèi)聚與區(qū)隔,也成為亟待繼續(xù)研究的問(wèn)題。這種壁壘不僅僅是用戶(hù)的社會(huì)身份、個(gè)體屬性等線下因素壁壘,也可能是在線的影響力和話語(yǔ)內(nèi)容特征本身帶來(lái)的壁壘,以及由此而生成的不同層級(jí)間的區(qū)隔。
針對(duì)這種在相近影響力條件下,內(nèi)容相似用戶(hù)的聚合及其變化機(jī)制,本研究強(qiáng)調(diào)的是,在用戶(hù)的“意見(jiàn)領(lǐng)袖”角色之外,一種容易被忽視的用戶(hù)角色和功能,我們稱(chēng)之為“意見(jiàn)代表”。微博網(wǎng)絡(luò)中,意見(jiàn)代表的內(nèi)涵定義如下(C0):其他任意用戶(hù)y,若與用戶(hù)x在內(nèi)容上越相似,則y的影響力和x越接近,反之亦然;這亦等價(jià)于,若其他用戶(hù)和x在內(nèi)容相似度、影響力接近度這兩方面正相關(guān)程度越高,則用戶(hù)x的“意見(jiàn)代表”程度越強(qiáng)。這里顯現(xiàn)的是一種“內(nèi)容–影響力”上的對(duì)應(yīng)性,用戶(hù)作為一種影響力的“代表”,指涉著這個(gè)影響力層級(jí)所屬人群的內(nèi)容特征。意見(jiàn)代表不是像意見(jiàn)領(lǐng)袖那樣涉及影響力的擴(kuò)散,而是涉及某種影響力人群的代表。
為便于后文的進(jìn)行,把用戶(hù)作為意見(jiàn)代表的程度簡(jiǎn)稱(chēng)為“代表力”,以區(qū)別于用戶(hù)作為意見(jiàn)領(lǐng)袖的程度或“影響力”。對(duì)于代表力的衡量方法,直接從意見(jiàn)代表的定義(C0)就可以得到,如下(C1):設(shè)微博中的某個(gè)用戶(hù)為x,其他用戶(hù)依次標(biāo)為序列U=[U1,U2,U3,…,Un];U中每個(gè)用戶(hù)和用戶(hù)x的內(nèi)容余弦距離(也即1?內(nèi)容余弦相似度),依次標(biāo)為序列S=[S1,S2,S3,…,Sn];U中每個(gè)用戶(hù)與x的影響力接近度(也即兩者影響力之差的絕對(duì)值),依次標(biāo)為序列H=[H1,H2,H3,…,Hn];其中序列U和序列S、序列H中的每個(gè)元素順序是嚴(yán)格一一對(duì)應(yīng)的;通過(guò)H與S的皮爾遜相關(guān)系數(shù)Px的值,即可以反映用戶(hù)x作為意見(jiàn)代表程度或者“代表力”的高低。如果x的“意見(jiàn)代表程度”(或“代表力”)足夠高,則序列S和序列H應(yīng)該是顯著正相關(guān)的,從而使得,S中的元素值越大則意味著H中對(duì)應(yīng)順序的元素值也越大。其中,若Px相關(guān)系數(shù)不顯著,則表明兩者不存在直接相關(guān)性,把Px記為0;總體上,代表力Px值在[?1,+1]區(qū)間內(nèi)。Px越大,表明:其他任意用戶(hù)若與用戶(hù)x相似度越高,則影響力越接近,兩者的正相關(guān)程度很高,從而等價(jià)于用戶(hù)x作為意見(jiàn)代表的程度也越高。
意見(jiàn)領(lǐng)袖的角色只能夠確證的是,自己是具有影響力的,但是不能夠確證的是,和自己內(nèi)容相似的其他人是不是也具有影響力?以及和自己在內(nèi)容上越相似的其他人,是不是就越擁有和自己相近似的影響力?然而從深層次可以期望的是,影響力不只是指涉自己擁有影響力,也可以指涉自己擁有的影響力程度有可能通過(guò)內(nèi)容相似性而傳遞到其他用戶(hù)的影響力程度。而這種影響力的傳遞,會(huì)進(jìn)而帶來(lái)相關(guān)聯(lián)的社會(huì)后果,這也是我們對(duì)“意見(jiàn)代表”的作用與機(jī)制進(jìn)行審視的進(jìn)一步意義。
“意見(jiàn)代表”與“意見(jiàn)領(lǐng)袖”相比,差異如下:“意見(jiàn)領(lǐng)袖”強(qiáng)調(diào)的是,用戶(hù)自身內(nèi)容所可能具有的影響力,是對(duì)于自身影響力的描述;而“意見(jiàn)代表”強(qiáng)調(diào)的是,與自己內(nèi)容相似的其他用戶(hù)所可能具有的影響力,以及對(duì)于和自身同影響力層級(jí)的其他用戶(hù)在內(nèi)容上的“代表”,也是對(duì)于和自身內(nèi)容相似的其他用戶(hù)在影響力上的“代表”與“標(biāo)桿”。
上述及后文將要涉及幾個(gè)簡(jiǎn)稱(chēng),內(nèi)涵如下。1. 影響力層級(jí)(后文簡(jiǎn)記為Z1)。在本研究中,用戶(hù)所處的影響力層級(jí),指的是對(duì)于某用戶(hù)x而言,與該用戶(hù)x具有相同或最相近影響力的k個(gè)用戶(hù)所組成的用戶(hù)群(也包含x自身)。后文的實(shí)證分析中,選擇k=50,使得層級(jí)既不會(huì)規(guī)模太小而影響穩(wěn)定性,又不至于規(guī)模太大而包含過(guò)多的影響力差距太大的用戶(hù)。2. 內(nèi)容階層(后文簡(jiǎn)記為Z2)。指具有相同或相近影響力的k個(gè)用戶(hù)構(gòu)成的影響力層級(jí)中,這些用戶(hù)群,同時(shí)也具有很強(qiáng)的用戶(hù)內(nèi)容趨同性,形成“特定影響力–特定內(nèi)容”的對(duì)應(yīng)關(guān)系,形成微博中具有本群體的內(nèi)容特質(zhì)的、處于特定的話語(yǔ)地位的用戶(hù)“階層”。3. 影響力層級(jí)或內(nèi)容階層內(nèi)部的用戶(hù)趨同性(后文簡(jiǎn)記為Z3)。指的是,某個(gè)用戶(hù)群或用戶(hù)層級(jí),在內(nèi)容上趨于彼此相似、各個(gè)用戶(hù)內(nèi)容“長(zhǎng)得像同一個(gè)人”的趨勢(shì)和程度。4. 影響力層級(jí)或內(nèi)容階層的內(nèi)聚性(后文簡(jiǎn)記為Z4)。Z4和前文Z3具有共同的指向;為了簡(jiǎn)化行文,后文用內(nèi)聚性,指稱(chēng)層級(jí)內(nèi)部用戶(hù)在內(nèi)容上的趨同態(tài)勢(shì),內(nèi)聚性的高低則指代這種趨同的程度。
對(duì)于微博“意見(jiàn)代表”的現(xiàn)象,要做的基礎(chǔ)性的準(zhǔn)備工作和預(yù)調(diào)研如下:其一,通過(guò)測(cè)量,考察意見(jiàn)代表在現(xiàn)實(shí)中是否存在,在何種程度上存在,而不只是一種理論抽象;其二,既然意見(jiàn)代表和用戶(hù)的影響力存在著密切的內(nèi)在聯(lián)系,所以要考察意見(jiàn)代表和意見(jiàn)領(lǐng)袖這兩種角色之間的關(guān)系,它們是相互獨(dú)立的嗎,抑或具有重合性?
而這兩個(gè)基礎(chǔ)性的準(zhǔn)備工作都服務(wù)于后續(xù)的核心問(wèn)題:微博用戶(hù)作為“意見(jiàn)代表”的角色(C0)與程度(C1),是否以及如何作用于該用戶(hù)所處的影響力層級(jí)(Z1)內(nèi)的用戶(hù)趨同性?對(duì)此,將繼續(xù)圍繞意見(jiàn)代表,從直接和間接兩個(gè)方面,展開(kāi)這個(gè)核心問(wèn)題的分析:其一,直接層面,用戶(hù)作為意見(jiàn)代表的角色和程度,如何影響到用戶(hù)所處的影響力層級(jí)的用戶(hù)趨同性(Z3、Z4)?其二,間接層面,用戶(hù)作為意見(jiàn)代表和意見(jiàn)領(lǐng)袖的角色之間的關(guān)系,如何影響到用戶(hù)所處的影響力層級(jí)的用戶(hù)趨同性(Z3、Z4)?而這直接層面與間接層面的效應(yīng),構(gòu)成本文路徑分析的“意見(jiàn)代表–內(nèi)容階層”效應(yīng)和作用機(jī)制的核心。
本小節(jié)針對(duì)的核心問(wèn)題,是從“意見(jiàn)代表”的角度和直接層面,來(lái)探討微博用戶(hù)中為何會(huì)形成“相近影響力的用戶(hù)具有相似內(nèi)容”的對(duì)應(yīng)性,從而加強(qiáng)用戶(hù)所處的影響力層級(jí)內(nèi)部的趨同性?尤其是,用戶(hù)作為“意見(jiàn)代表”的角色和程度,是否以及如何作用于用戶(hù)所處的“影響力層級(jí)”內(nèi)部趨同性的程度(Z3、Z4)?
從意見(jiàn)代表的內(nèi)涵定義(C0)可以知道,一個(gè)用戶(hù)的“意見(jiàn)代表”程度越高,則和他內(nèi)容越相似的用戶(hù)影響力就越接近,也就意味著和一個(gè)“意見(jiàn)代表”內(nèi)容最為相似的k個(gè)用戶(hù)的影響力和該“意見(jiàn)代表”越接近乃至于趨同。其結(jié)果就是,當(dāng)一個(gè)用戶(hù)的意見(jiàn)代表程度足夠高的情況下,就會(huì)形成相似內(nèi)容的用戶(hù),其具有和他相似的影響力。換一個(gè)角度來(lái)看,具有相同或相近影響力的用戶(hù),表現(xiàn)出更高的內(nèi)容相似度,而非彼此之間的內(nèi)容差異、雜亂和隨機(jī)化。也即,和該“意見(jiàn)代表”的影響力相同或相近的其他用戶(hù),和“意見(jiàn)代表”的內(nèi)容相似度,會(huì)隨著“意見(jiàn)代表”程度提升而升高。由于各個(gè)用戶(hù)都和“意見(jiàn)代表”的相似度提高,導(dǎo)致這些用戶(hù)相互的差異也在減少,共同點(diǎn)變得越來(lái)越多,從而層級(jí)內(nèi)各個(gè)用戶(hù)越像同一個(gè)人,彼此相似度越高。最終結(jié)果是,越強(qiáng)的“意見(jiàn)代表”所處的影響力層級(jí)內(nèi)的用戶(hù),內(nèi)容相似度越高。
如果用戶(hù)x的“意見(jiàn)代表”程度越高,則意味著該用戶(hù)x作為該影響力層級(jí)的“內(nèi)容代表”的程度越強(qiáng),其他與該用戶(hù)x同影響力的用戶(hù)就和x的內(nèi)容相似度越高,兩者的正相關(guān)程度、可預(yù)測(cè)性越強(qiáng)。
總體而言,用戶(hù)的“意見(jiàn)代表”程度,雖然只是用戶(hù)個(gè)體的角色特征,但是卻會(huì)帶來(lái)對(duì)于微博整體中的層級(jí)分化。對(duì)于微博的全局用戶(hù)系統(tǒng)而言,會(huì)形成一個(gè)個(gè)“內(nèi)容相似且影響力接近”的內(nèi)容階層(Z2),而不是用戶(hù)之間內(nèi)容相似但影響力差距雜亂化、隨機(jī)化,或影響力相似的一群用戶(hù)但相互之間內(nèi)容差異雜亂化、隨機(jī)化。更為重要的是,用戶(hù)的意見(jiàn)代表程度,直接關(guān)系到這種“內(nèi)容階層”內(nèi)部的緊密性,或者說(shuō),關(guān)系到該用戶(hù)所處的影響力階層內(nèi)部的趨同性高低。使得微博全局系統(tǒng)中,用戶(hù)不僅出現(xiàn)基于影響力的“內(nèi)容分層”,而且這種層級(jí)的趨同、內(nèi)聚程度受到該用戶(hù)的意見(jiàn)代表程度的正向作用力。
由上分析,可得假設(shè)H1:任意用戶(hù)x的意見(jiàn)代表程度,對(duì)于該用戶(hù)所處的影響力層級(jí)內(nèi)的用戶(hù)趨同程度,具有正向作用。
用戶(hù)作為意見(jiàn)代表的代表力程度,回應(yīng)了用戶(hù)“內(nèi)容階層”(Z2)是否可能的問(wèn)題,也直接作用于用戶(hù)所處的同影響力層級(jí)內(nèi)的趨同程度(Z3、Z4)。而用戶(hù)所處的影響力層級(jí)內(nèi)的趨同程度的高低,正是本研究從“意見(jiàn)代表”要面向的核心對(duì)象之一,它關(guān)系到微博社會(huì)中的層級(jí)分化以及層級(jí)分化的松散或稠密演變。
本小節(jié)針對(duì)的核心問(wèn)題,是從意見(jiàn)代表的間接層面,尤其是意見(jiàn)代表和用戶(hù)影響力之間的關(guān)系,來(lái)探討微博中“相近影響力的用戶(hù)具有相似內(nèi)容”的對(duì)應(yīng)性,是否以及如何與“意見(jiàn)代表”有正向關(guān)聯(lián)?尤其是,“意見(jiàn)代表”用戶(hù)是否以及如何通過(guò)其和“意見(jiàn)領(lǐng)袖”角色的關(guān)系,間接作用于“意見(jiàn)代表”所處的影響力層級(jí)內(nèi)部趨同性的程度?
這里,我們首先需要探討意見(jiàn)代表和意見(jiàn)領(lǐng)袖的角色關(guān)系。高程度的意見(jiàn)代表是誰(shuí)?是高影響力的意見(jiàn)領(lǐng)袖嗎?抑或是低影響力的“普羅大眾”更容易作為代表?這兩者都和用戶(hù)的影響力密切相關(guān),關(guān)系到用戶(hù)的影響力程度或者對(duì)于自身影響力的傳遞程度。對(duì)于這個(gè)問(wèn)題,容易有兩種誤識(shí):一種是不認(rèn)為意見(jiàn)代表的分布有什么規(guī)律,認(rèn)為他們?cè)诟鞣N小咖、中咖、大咖里面的分布是“差不多”的、均勻或隨機(jī)的;另一種誤識(shí),認(rèn)為他們主要是處于影響力最底層的“普羅大眾”或“下里巴人”等最為草根和“群氓”的用戶(hù),因?yàn)檫@些低影響力的用戶(hù)看似無(wú)個(gè)性的蕓蕓眾生,他們中的每個(gè)人似乎都可以很好地“代表”其自身所處的影響力層級(jí)的其他用戶(hù),反映這些同為低影響力用戶(hù)的共同“無(wú)個(gè)性”、無(wú)辨識(shí)度的特征。
關(guān)于這兩種角色的關(guān)系,我們面臨三種不同的可能性:可能1,用戶(hù)作為意見(jiàn)代表的程度和作為意見(jiàn)領(lǐng)袖的程度是正相關(guān)的;可能2,用戶(hù)作為意見(jiàn)代表的程度和作為意見(jiàn)領(lǐng)袖的程度是負(fù)相關(guān)的;可能3,用戶(hù)作為意見(jiàn)代表的程度和作為意見(jiàn)領(lǐng)袖的程度是不相關(guān)的。
如果驗(yàn)證成立的是可能1,則會(huì)意味著:用戶(hù)的影響力越高,則其“意見(jiàn)代表”程度越高,而與其同影響力層級(jí)的k個(gè)用戶(hù)的趨同程度就越強(qiáng),從而表現(xiàn)為在意見(jiàn)代表和意見(jiàn)領(lǐng)袖的共同角色作用下,用戶(hù)的影響力越高則其影響力層級(jí)內(nèi)的用戶(hù)越是彼此“長(zhǎng)得像同一個(gè)人”。在此基礎(chǔ)上,會(huì)形成影響力底部層級(jí)內(nèi)部用戶(hù)松散、彼此內(nèi)容距離稀疏、缺乏相似性,影響力頂部層級(jí)相互似同、內(nèi)容距離窄密,表現(xiàn)為底松頂緊、逐漸遞減的“金字塔”結(jié)構(gòu)。如果驗(yàn)證成立的是可能2,則基于相似的原理,微博用戶(hù)全局會(huì)形成底部稠密、頂部松散、逐漸變化的“倒金字塔”結(jié)構(gòu)。如果驗(yàn)證成立的是可能3,則由底到頂缺乏明顯規(guī)律性的變化趨勢(shì),可能表現(xiàn)為既非金字塔也非倒金字塔的平衡結(jié)構(gòu)?;谖⒉┳罱K表現(xiàn)出來(lái)的是“金字塔結(jié)構(gòu)”,所以我們可以推測(cè)的是,成立的是可能1。否則后兩種的可能2、可能3,都只會(huì)導(dǎo)致倒金字塔結(jié)構(gòu)或平衡結(jié)構(gòu),而不是金字塔結(jié)構(gòu)。這樣,我們提出前后關(guān)聯(lián)的兩個(gè)假設(shè):
H2:任意用戶(hù)x的意見(jiàn)代表程度,對(duì)于該用戶(hù)的意見(jiàn)領(lǐng)袖程度具有正向作用。
H3:任意用戶(hù)x的意見(jiàn)領(lǐng)袖程度,對(duì)于該用戶(hù)所處的影響力層級(jí)內(nèi)的用戶(hù)趨同程度具有正向作用。
H2和H3的假設(shè)如果成立,意味著:同影響力層級(jí)的內(nèi)收,不僅受到用戶(hù)的代表力的作用,也受到“意見(jiàn)代表”和“意見(jiàn)領(lǐng)袖”的共同作用,其中“意見(jiàn)代表”通過(guò)“意見(jiàn)領(lǐng)袖”而對(duì)于用戶(hù)的影響力層級(jí)趨同性產(chǎn)生間接效果,而“意見(jiàn)領(lǐng)袖”則起著連接“意見(jiàn)代表”與用戶(hù)影響力層級(jí)趨同性的中介效應(yīng)。內(nèi)容階層的分化與影響力層級(jí)的內(nèi)聚是金字塔結(jié)構(gòu)的前提;而“金字塔結(jié)構(gòu)”則進(jìn)一步表明這種影響力層級(jí)的內(nèi)聚趨同,受到用戶(hù)的“意見(jiàn)代表”的間接作用,從而表現(xiàn)出與用戶(hù)影響力的關(guān)聯(lián)越來(lái)越強(qiáng)。
對(duì)于前文的三個(gè)子假設(shè)H1、H2、H3進(jìn)行整合,形成下述的“一主線、兩路徑”的問(wèn)題結(jié)構(gòu)和邏輯關(guān)系。“一主線”是:用戶(hù)的“意見(jiàn)代表”角色(C0、C1),是否以及如何加強(qiáng)用戶(hù)所處的“影響力層級(jí)”內(nèi)部趨同性,使得用戶(hù)產(chǎn)生“特定影響力–特定內(nèi)容特征”的對(duì)應(yīng)現(xiàn)象?或者說(shuō),意見(jiàn)代表如何形成與加強(qiáng)內(nèi)容階層內(nèi)部的趨同性和內(nèi)聚性?圍繞這個(gè)主線,從直接路徑和間接路徑兩方面展開(kāi)。直接路徑是:用戶(hù)的意見(jiàn)代表程度,直接作用于該用戶(hù)所處的影響力層級(jí)、加強(qiáng)其層級(jí)內(nèi)的趨同性(假設(shè)H1)。間接路徑是:意見(jiàn)代表同時(shí)也是意見(jiàn)領(lǐng)袖(假設(shè)H2),從而通過(guò)其意見(jiàn)領(lǐng)袖的程度,作用于該用戶(hù)所處的影響力層級(jí),加強(qiáng)其層級(jí)內(nèi)的趨同性,并且在此過(guò)程中表現(xiàn)出影響力層級(jí)的“金字塔結(jié)構(gòu)”現(xiàn)象(假設(shè)H3)。
最終形成直接路徑和間接路徑整合后的作用關(guān)系模型(圖1所示),命名為“意見(jiàn)代表–內(nèi)容階層”效應(yīng)模型。其中的三個(gè)要素:起始的自變量要素指涉為意見(jiàn)代表,中介性的變量指涉為意見(jiàn)領(lǐng)袖,終端的因變量指涉為內(nèi)容階層,結(jié)合三者的英文單詞首字母,將該模型簡(jiǎn)稱(chēng)為“RLC”模型。采取Amos軟件進(jìn)行路徑分析,考察RLC模型中各子路徑的效應(yīng)和總體模型的擬合狀況。
圍繞上文的“一主線、兩路徑”及其H1、H2、H3組成的路徑分析模型,針對(duì)用戶(hù)的意見(jiàn)代表角色和程度如何影響、加強(qiáng)微博社會(huì)“內(nèi)容階層”的分化與凝聚,選取新浪微博的用戶(hù)樣本,進(jìn)行實(shí)證檢驗(yàn)與分析。
根據(jù)新浪微博數(shù)據(jù)中心的資料,新浪微博月活躍用戶(hù)4.62億,月閱讀量過(guò)百億領(lǐng)域達(dá)32個(gè)[18]。新浪微博是我國(guó)具有高度的人氣和輿論覆蓋度的社會(huì)化媒介平臺(tái)。本研究采取廣覆蓋、成本相對(duì)較低的多階段抽樣。首先從新浪微博首頁(yè)47個(gè)內(nèi)容版塊(社會(huì)、國(guó)際、科技、科普、數(shù)碼、財(cái)經(jīng)、股市、明星、綜藝、電視劇、電影、音樂(lè)、汽車(chē)、體育、運(yùn)動(dòng)健身、健康、瘦身、養(yǎng)生、軍事、歷史、藝術(shù)、時(shí)尚、美妝、動(dòng)漫、宗教、萌寵、法律、視頻、上海、美女模特、美圖、情感、搞笑、辟謠、正能量、政務(wù)、游戲、旅游、育兒、校園、美食、房產(chǎn)、家居、星座、讀書(shū)、三農(nóng)、設(shè)計(jì))中,獲取其發(fā)布者和評(píng)論者共3 501 153個(gè)用戶(hù)的數(shù)據(jù)庫(kù),從中最終抓取到具有有效個(gè)人資料的、發(fā)帖數(shù)不少于500條的88 739個(gè)有效用戶(hù);對(duì)這些有效用戶(hù),再采取整群抽樣,以每頁(yè)作為一個(gè)群,抓取每人的前5頁(yè)關(guān)注者資料(新浪微博對(duì)于數(shù)據(jù)抓取的實(shí)際限制,只開(kāi)放最多為5頁(yè)×每頁(yè)20個(gè)=100位關(guān)注者)。由于不同的用戶(hù)其所關(guān)注的人可能有重復(fù),經(jīng)過(guò)選取發(fā)帖數(shù)不少于500條、去重以及具有相匹配的個(gè)人資料等清洗環(huán)節(jié),從這些被關(guān)注者中選取到有效用戶(hù)130 082個(gè)。
對(duì)用戶(hù)統(tǒng)一橫向的比較口徑。其一是帖子發(fā)布的時(shí)間段統(tǒng)一在2018年1月1日~2018年12月31日。其二是帖子數(shù)量,每個(gè)用戶(hù)統(tǒng)一隨機(jī)選取在上述時(shí)間段內(nèi)所發(fā)的500條帖子。以達(dá)到通過(guò)帖子樣本,“察其言、觀其人”,并進(jìn)行用戶(hù)相似度計(jì)算。
經(jīng)過(guò)上述取樣和有效數(shù)據(jù)的清洗整理,最后得到的樣本用戶(hù)為24 779個(gè),這些用于計(jì)算的用戶(hù)有廣泛性與代表性。粉絲量、發(fā)博量、關(guān)注數(shù)等各主要指標(biāo)都包含從數(shù)十到數(shù)萬(wàn)乃至數(shù)千萬(wàn)的大范圍,各種重度/輕度、活躍/不活躍用戶(hù)都有良好覆蓋,如圖2所示。
圖2 樣本用戶(hù)的特征分布柱狀圖
“圈粉”能力和效果,是社交網(wǎng)絡(luò)中的意見(jiàn)領(lǐng)袖、大咖的重要區(qū)分指標(biāo),也是對(duì)于諸多微博用戶(hù)而言,最具有現(xiàn)實(shí)難度和實(shí)際經(jīng)濟(jì)價(jià)值、社會(huì)價(jià)值的事。對(duì)于社交網(wǎng)絡(luò)意見(jiàn)領(lǐng)袖、大V的諸多研究突出“粉絲數(shù)”指標(biāo)的重要性[19]。用粗糙集理論發(fā)現(xiàn),“粉絲數(shù)對(duì)能否成為意見(jiàn)領(lǐng)袖至關(guān)重要”[20]。有研究甚至把粉絲規(guī)模作為區(qū)分微博大V、中V的唯一依據(jù)[21]。本研究把粉絲規(guī)模作為微博用戶(hù)影響力的指標(biāo),用該指標(biāo)反映用戶(hù)的意見(jiàn)領(lǐng)袖程度。實(shí)際抓取得到的粉絲數(shù),將其原始數(shù)值x經(jīng)由對(duì)數(shù)函數(shù)轉(zhuǎn)換為log2(x+1),作為研究中的粉絲規(guī)模指標(biāo)值。
把單個(gè)用戶(hù)的各條帖子,無(wú)順序拼接為一個(gè)長(zhǎng)文本,先通過(guò)向量空間模型(VSM)得到每個(gè)用戶(hù)的詞頻矩陣。詞頻矩陣的獲取,采取常用的模塊scikit-learn中的CountVectorizer()函數(shù),其中最低詞頻數(shù)min_df設(shè)為50,max_df設(shè)為0.2,只采用一元詞,由此得到詞頻矩陣X0。將X0轉(zhuǎn)為經(jīng)L1規(guī)范化的TFIDF矩陣X,轉(zhuǎn)換函數(shù)為sklearn.TfidfTransformer(norm='l1')。
對(duì)于矩陣X,采取潛在語(yǔ)義分析(LSA)進(jìn)行降維和內(nèi)容特征提取[22]。LSA利用奇異值分解(SVD)技術(shù),可把數(shù)十萬(wàn)以上的高維、稀疏的詞頻矩陣,降到只有數(shù)千、數(shù)百的低維表示。其中,對(duì)于矩陣X,進(jìn)行奇異值分解可得:X=TΣDT。LSA保留前k個(gè)最大的奇異值,即通過(guò)TkΣkDkT來(lái)近似地表示原用戶(hù)–詞項(xiàng)矩陣X。
本研究中,每個(gè)用戶(hù)的VSM詞頻矩陣原有113 694維,一律通過(guò)潛在語(yǔ)義分析降維到700維。降維工具選擇廣泛應(yīng)用的開(kāi)源模塊scikit-learn中的TruncatedSVD()函數(shù)。
圖3 潛在語(yǔ)義分析對(duì)用戶(hù)內(nèi)容降維的解釋方差比
選擇700維的維度時(shí),處于圖3中“肘拐點(diǎn)”的位置,再增加維度對(duì)于保留原信息的程度增長(zhǎng)平緩;同時(shí),TruncatedSVD()計(jì)算得到的解釋方差比(explained_variance_ratio_)值已達(dá)0.76,用盡可能精簡(jiǎn)的維度,提取和高效保留了原有的11余萬(wàn)維矩陣的大部分信息,從而表示用戶(hù)特征并用于用戶(hù)之間的內(nèi)容相似度的計(jì)算。
把每個(gè)用戶(hù)轉(zhuǎn)化為一個(gè)若干維的向量后,兩個(gè)用戶(hù)之間的內(nèi)容相似度,由計(jì)算他們各自向量的余弦相似度得到,值域在[?1,+1],值越大表明這兩個(gè)用戶(hù)之間內(nèi)容越相似,當(dāng)該值等于1時(shí)表明這兩個(gè)用戶(hù)的相似度等于1,也即彼此相同。與之對(duì)應(yīng)的兩個(gè)用戶(hù)之間的內(nèi)容距離,則用1減去上述余弦相似度。
任意兩個(gè)用戶(hù)Um和Un之間的內(nèi)容余弦相似度,計(jì)算方式表示為:
在上述式(1)的基礎(chǔ)上進(jìn)行擴(kuò)展,從“1對(duì)1”的用戶(hù)相似度,擴(kuò)展到“n對(duì)n”的兩組用戶(hù)(每組中用戶(hù)數(shù)量n≥1)之間的相似度。任意一組用戶(hù)G1(包含n1個(gè)用戶(hù))和另一組用戶(hù)G2(包含n2個(gè)用戶(hù))的內(nèi)容相似度,表示為:
式(2)在式(1)的基礎(chǔ)上,采用衡量?jī)山M對(duì)象間的平均距離所常用的“類(lèi)平均法”(或稱(chēng)“簇平均法”,average group linkage)擴(kuò)展得到。其中G1或G2都可以有且僅有一個(gè)用戶(hù)。如果H(G1,G2)的值越大,表明G1、G2這兩組用戶(hù)之間兩兩的趨近、類(lèi)同乃至重復(fù)程度越高;若兩組用戶(hù)的異質(zhì)化內(nèi)容越大,則平均相似度就會(huì)越低,也即H(G1,G2)的值越小。
式2中,當(dāng)n1=n2=1時(shí),則等同于式(1)。這種情況下:式(1)中計(jì)算的個(gè)體與個(gè)體之間的兩兩相似度R(Ux1,Ux2),成為式(2)中n1和n2分別是1時(shí)的特例。
當(dāng)n1=1而n2>1時(shí),式(2)為計(jì)算一個(gè)用戶(hù)和一組用戶(hù)之間的平均相似度。
式(2)中,當(dāng)計(jì)算層內(nèi)用戶(hù)的平均相似度(也即前文的指標(biāo)a),此時(shí)過(guò)濾掉個(gè)體和他自身的相似度(因?yàn)樵撝档扔?)后,計(jì)算剩余元素的平均值,所以采取式(2)的微調(diào)形式
根據(jù)對(duì)于意見(jiàn)代表的內(nèi)涵界定(見(jiàn)C0)及其程度的衡量方法(見(jiàn)C1),以及用戶(hù)向量化、用戶(hù)內(nèi)容相似度等的計(jì)算方法,最終對(duì)獲取的24 779個(gè)微博樣本用戶(hù),計(jì)算得到每個(gè)用戶(hù)的意見(jiàn)代表程度(代表力),分布柱狀圖見(jiàn)圖4。
圖4 微博“意見(jiàn)代表”分布柱狀圖
用戶(hù)作為“意見(jiàn)代表”,并不是特殊現(xiàn)象而是普遍現(xiàn)象。全體的意見(jiàn)代表程度均值為0.037,中位數(shù)為0.041。57.7%的用戶(hù)具有正的意見(jiàn)代表程度;32%的用戶(hù)的代表力為負(fù);只有10.3%的少數(shù)用戶(hù)的意見(jiàn)代表程度為0,不具備意見(jiàn)代表的角色和屬性。
接下來(lái),這些“意見(jiàn)代表”的分布至關(guān)重要。用戶(hù)作為“意見(jiàn)代表”的代表力,和作為“意見(jiàn)領(lǐng)袖”的影響力,兩者的程度是否有重合性?因此,針對(duì)H2進(jìn)行驗(yàn)證。對(duì)于24 779個(gè)樣本用戶(hù),分別取得“意見(jiàn)代表”程度的序列和影響力程度的序列:皮爾遜相關(guān)系數(shù)+0.618(p<0.001,n=24 779),斯皮爾曼相關(guān)系數(shù)+0.494(p<0.001,n=24 779)。從而意味著,對(duì)微博用戶(hù)而言,其影響力程度越高,則其意見(jiàn)代表程度越高。這兩種角色的正向兼容而非相互獨(dú)立或?qū)α⒑苤匾?,從而由意?jiàn)代表和意見(jiàn)領(lǐng)袖的共同作用機(jī)制,帶來(lái)了用戶(hù)影響力層級(jí)不斷增強(qiáng)內(nèi)容趨同的“金字塔結(jié)構(gòu)”和變化規(guī)律性。
總體上,H1、H2、H3的檢驗(yàn)過(guò)程和結(jié)果見(jiàn)表2,全部得到了檢驗(yàn)。
表2 子假設(shè)的檢驗(yàn)結(jié)果
其中,對(duì)H3的檢驗(yàn)結(jié)果,顯現(xiàn)了用戶(hù)的影響力與其影響力層級(jí)內(nèi)用戶(hù)趨同程度的高度正相關(guān),上表已經(jīng)顯示了其高達(dá)0.8以上的相關(guān)系數(shù),這在社會(huì)科學(xué)研究中是比較少見(jiàn)的正相關(guān)程度。其具體的可視化圖見(jiàn)圖5。這種較為強(qiáng)烈的正相關(guān),得以形成用戶(hù)隨著影響力層級(jí)的提升而內(nèi)聚性不斷增強(qiáng)的金字塔結(jié)構(gòu)。
對(duì)于“意見(jiàn)代表–內(nèi)容階層”模型,通過(guò)AMOS軟件進(jìn)行整體化的路徑分析。為了簡(jiǎn)化,用戶(hù)的影響力層級(jí)內(nèi)趨同程度,只采用指標(biāo)b表示(因?yàn)橹笜?biāo)a和指標(biāo)b具有高度的重合性,兩者的皮爾遜相關(guān)系數(shù)高達(dá)0.997(p<0.001),所以只選擇其中一種)。分析中涉及的三個(gè)指標(biāo),即用戶(hù)的意見(jiàn)代表程度、影響力、影響力層級(jí)內(nèi)的用戶(hù)趨同程度(也即所采取的指標(biāo)b),全部由BLOM公式轉(zhuǎn)為正態(tài)得分值,轉(zhuǎn)換后符合正態(tài)分布的要求;模型的參數(shù)估計(jì)方法選擇常用的最大似然估計(jì)。
路徑分析的擬合效果,部分重要指標(biāo)及其判斷標(biāo)準(zhǔn)見(jiàn)表3。
各路徑的標(biāo)準(zhǔn)化回歸系數(shù)及其顯著性檢驗(yàn)如表4所示。
圖5 不同影響力層級(jí)的用戶(hù)趨同程度
表3 路徑分析的擬合判斷
表4 標(biāo)準(zhǔn)化回歸系數(shù)
圖6 路徑分析的標(biāo)準(zhǔn)化回歸系數(shù)結(jié)果
圖6所示的模型中,記“用戶(hù)作為意見(jiàn)代表的程度”為變量Vx,記“用戶(hù)的影響力程度(意見(jiàn)領(lǐng)袖程度)”為變量Vm,記因變量“影響力層級(jí)內(nèi)的用戶(hù)趨同程度”為Vy。從Vx到因變量(Vy),各路徑均顯著。經(jīng)由Vm的中間作用,這個(gè)間接作用路徑,通過(guò)Amos的Bootstrap進(jìn)行中介效應(yīng)的檢驗(yàn),Bootstrap次數(shù)設(shè)定為1 000次;Vm的中介效應(yīng)的顯著性為0.004,標(biāo)準(zhǔn)化的中介效應(yīng)是0.317。相比較直接效應(yīng)(也即Vx作用于Vy)的0.16,中介效應(yīng)相對(duì)值足夠大,這也說(shuō)明意見(jiàn)代表–意見(jiàn)領(lǐng)袖的共同作用,于用戶(hù)內(nèi)容階層形塑的重要性。其中蘊(yùn)含著,意見(jiàn)代表和意見(jiàn)領(lǐng)袖這兩種用戶(hù)角色的兼容性與內(nèi)在的聯(lián)系。同時(shí),也是由于這個(gè)中介效應(yīng)的重要性,使得意見(jiàn)領(lǐng)袖程度作用于因變量(Vy)所顯現(xiàn)的“金字塔結(jié)構(gòu)”,構(gòu)成本模型中的重要組成與內(nèi)蘊(yùn)現(xiàn)象。
總體而言,路徑分析的結(jié)果中,明確了Vx到Vy的直接效應(yīng),同時(shí)也明確了從Vx經(jīng)由Vm而對(duì)因變量Vy產(chǎn)生的間接效應(yīng);H1、H2、H3涉及到的作用與效應(yīng)具有整體性,整體模型的評(píng)估指標(biāo)優(yōu)良。
本文的主要工作在于以下方面:(1)強(qiáng)調(diào)在作為研究熱點(diǎn)的意見(jiàn)領(lǐng)袖角色之外,容易被忽視的“意見(jiàn)代表”角色、效應(yīng)及其重要性;(2)“意見(jiàn)代表”的社會(huì)作用不是影響力的擴(kuò)散,而是影響力的分層,生成“同影響力–同內(nèi)容”的內(nèi)容階層現(xiàn)象,并正相關(guān)于這種同影響力層級(jí)內(nèi)的趨同程度,帶來(lái)微博社會(huì)的話語(yǔ)分層和封閉性;(3)對(duì)于用戶(hù)意見(jiàn)代表程度如何作用于影響力層級(jí)內(nèi)聚性的“意見(jiàn)代表–內(nèi)容階層”的效應(yīng),進(jìn)行模型的路徑分析,支持了意見(jiàn)代表帶來(lái)的影響力層級(jí)內(nèi)聚性及其增長(zhǎng)的金字塔結(jié)構(gòu),呈現(xiàn)了意見(jiàn)代表對(duì)于微博話語(yǔ)層級(jí)分化及其結(jié)構(gòu)的社會(huì)作用。
微博中“意見(jiàn)代表”的用戶(hù)角色與功能,使得系統(tǒng)從開(kāi)放走向封閉、從流動(dòng)走向凝聚帶來(lái)了更多可能。微博中不同影響力和話語(yǔ)地位的用戶(hù)分化為具有特定的、趨同化內(nèi)容的影響力階層,消解用戶(hù)層級(jí)內(nèi)部的異質(zhì)性、多樣性并使之趨于窄化。系統(tǒng)在層級(jí)的內(nèi)聚中,“內(nèi)容坐標(biāo)–影響力坐標(biāo)”的組合并非雜亂和隨機(jī),而是具有其對(duì)應(yīng)性的封閉圈層。同影響力層級(jí)的用戶(hù),由于這種封閉性而形成具有相似內(nèi)容特征、特定的影響力坐標(biāo)的內(nèi)容層級(jí)。
在作為主流研究對(duì)象的“意見(jiàn)領(lǐng)袖”占據(jù)各種研究熱點(diǎn)的背景下,“意見(jiàn)代表”的角色、功能由于看起來(lái)和實(shí)踐隔得較遠(yuǎn),因而未被足夠重視,缺乏相關(guān)的明確的“理論自覺(jué)”與實(shí)證分析支撐。但是,“意見(jiàn)代表”本身所反映的在線社會(huì)的“用戶(hù)間性”,對(duì)于“意見(jiàn)領(lǐng)袖”等其他角色發(fā)生屬性傳遞而產(chǎn)生的層級(jí)內(nèi)聚,對(duì)于微博用戶(hù)的話語(yǔ)分層與加強(qiáng)社會(huì)壁壘的“巴爾干化”,這些是在“意見(jiàn)領(lǐng)袖”等的理論框架下難以涵括的,也是“意見(jiàn)代表”在個(gè)體角色之外承載著的更為豐富的系統(tǒng)意義與社會(huì)效應(yīng)。
電子科技大學(xué)學(xué)報(bào)(社科版)2021年2期