黃 微 孫 悅
(吉林大學(xué)商學(xué)與管理學(xué)院,吉林 長(zhǎng)春 130022)
截至2021年12月,我國(guó)網(wǎng)民規(guī)模已達(dá)10.32億,互聯(lián)網(wǎng)普及率達(dá)73.0%,我國(guó)的網(wǎng)民數(shù)量和網(wǎng)民規(guī)模都在穩(wěn)步增加。作為互聯(lián)網(wǎng)技術(shù)的典型代表,社交媒體的概念最早被Unger J B定義為“網(wǎng)絡(luò)用戶(hù)用以交換信息和內(nèi)容創(chuàng)建的平臺(tái)”[1-2]。社交媒體平臺(tái)為用戶(hù)提供了信息內(nèi)容交流和創(chuàng)造的服務(wù)場(chǎng)所,在開(kāi)放話題的關(guān)注討論中,所有社交媒體平臺(tái)用戶(hù)既是話題的發(fā)起者、傳播者,又是信息的消費(fèi)者和生產(chǎn)者[3]。在國(guó)內(nèi),現(xiàn)階段社交媒體平臺(tái)主要包括微博、微信、抖音、小紅書(shū)、知乎等。
由于微博的開(kāi)放性,當(dāng)前針對(duì)社交媒體平臺(tái)用戶(hù)行為的相關(guān)研究,大多基于微博這一主流的社交媒體平臺(tái),如林燕霞等[4]根據(jù)社會(huì)認(rèn)同理論通過(guò)微博用戶(hù)對(duì)感興趣的主題進(jìn)行特征提取,對(duì)微博用戶(hù)進(jìn)行了群體類(lèi)別的劃分,構(gòu)建了以用戶(hù)興趣與行為態(tài)度為依據(jù)的不同主題興趣的用戶(hù)畫(huà)像;部分學(xué)者針對(duì)微信這一社交媒體平臺(tái)進(jìn)行研究,如李嘉興等[5]發(fā)現(xiàn)微信老年用戶(hù)與其他用戶(hù)群體相比使用強(qiáng)度、使用能力偏低,而且微信老年用戶(hù)群體具有顯著差異性,學(xué)歷越高的老年用戶(hù)使用能力、使用強(qiáng)度越高;抖音作為目前最火的短視頻平臺(tái),日活躍用戶(hù)已突破6億,部分學(xué)者針對(duì)抖音這一社交媒體平臺(tái)進(jìn)行研究,如吳劍云等[6]提出了一種基于視頻興趣標(biāo)簽的個(gè)性化推薦方法,考慮了群體用戶(hù)的喜愛(ài)度,不僅能較好地描述用戶(hù)視頻興趣隨時(shí)間的變化,也能通過(guò)視頻興趣標(biāo)簽結(jié)合用戶(hù)畫(huà)像匹配用戶(hù)感興趣的視頻項(xiàng)進(jìn)行推薦,提升了用戶(hù)體驗(yàn)。
現(xiàn)階段針對(duì)社交媒體平臺(tái)用戶(hù)行為分析的研究,大多都是針對(duì)單一平臺(tái)的研究,這些研究都忽略了不同社交媒體平臺(tái)由于用戶(hù)群體(例如小紅書(shū)主要用戶(hù)群體年齡段多為25歲及以下的年輕女性,而微信主要用戶(hù)群體年齡段多為26~35歲,性別分布較均衡)或其他差異會(huì)有各自獨(dú)立的結(jié)構(gòu),而且同一用戶(hù)可以只在某平臺(tái)有注冊(cè)信息、可以在一個(gè)平臺(tái)上有多個(gè)賬號(hào)、可以在多個(gè)平臺(tái)上都有注冊(cè)信息,同一用戶(hù)擁有多重網(wǎng)絡(luò)身份,但卻有相似的行為表現(xiàn)模式,這就組成了一個(gè)巨大的跨平臺(tái)社交媒體網(wǎng)絡(luò)。當(dāng)某個(gè)社會(huì)事件發(fā)生時(shí),與之相關(guān)的信息傳播一般不會(huì)只在單平臺(tái)社交網(wǎng)絡(luò)中,而是在跨平臺(tái)社交網(wǎng)絡(luò)中快速擴(kuò)散[2],如當(dāng)下新型冠狀病毒肺炎疫情相關(guān)信息廣泛傳播于微信、微博、抖音、小紅書(shū)、知乎等多個(gè)社交媒體平臺(tái)[7]。在多元社交網(wǎng)絡(luò)媒體背景下,網(wǎng)絡(luò)輿情信息的跨平臺(tái)性和非結(jié)構(gòu)性都為發(fā)現(xiàn)用戶(hù)參與行為的動(dòng)向、準(zhǔn)確預(yù)判用戶(hù)對(duì)信息參與行為強(qiáng)度的響應(yīng)以及用戶(hù)參與行為強(qiáng)度對(duì)輿情事件傳播造成的影響帶來(lái)巨大的挑戰(zhàn)。因此,以用戶(hù)為中心,對(duì)用戶(hù)實(shí)際使用的所有社交媒體平臺(tái)進(jìn)行參與行為分析,具有重要理論意義。
在大數(shù)據(jù)網(wǎng)絡(luò)時(shí)代背景下,社交媒體平臺(tái)用戶(hù)的情感表達(dá)(轉(zhuǎn)發(fā)、分享、發(fā)布等行為)能夠迅速感染其他用戶(hù)的情緒,導(dǎo)致輿論的爆發(fā)。然而突發(fā)事件產(chǎn)生后,具有負(fù)面情緒的評(píng)論/轉(zhuǎn)發(fā)等內(nèi)容更容易引發(fā)其他用戶(hù)共情,因此更容易得到廣泛傳播,在應(yīng)對(duì)措施不及時(shí)的情況下,負(fù)面情緒集中爆發(fā),產(chǎn)生網(wǎng)絡(luò)謠言和輿情危機(jī)[8]。但對(duì)于輿情事件,用戶(hù)的瀏覽、收藏等行為并不會(huì)對(duì)輿情的傳播產(chǎn)生影響,因此,對(duì)社交媒體平臺(tái)用戶(hù)的參與行為類(lèi)別及參與行為強(qiáng)度進(jìn)行測(cè)定,對(duì)輿論的引導(dǎo)與管控具有重要實(shí)踐意義。
本文以用戶(hù)為核心,考慮不同社交媒體平臺(tái)之間的相似性,實(shí)現(xiàn)社交媒體平臺(tái)用戶(hù)參與行為強(qiáng)度的科學(xué)分析與精準(zhǔn)預(yù)判。
社交媒體平臺(tái)用戶(hù)參與行為的構(gòu)成要素包含社交媒體平臺(tái)用戶(hù)參與行為的主體、社交媒體平臺(tái)用戶(hù)參與行為的客體、社交媒體平臺(tái)用戶(hù)參與行為的本體及社交媒體平臺(tái)用戶(hù)參與行為的媒體。
社交媒體平臺(tái)用戶(hù)參與行為主體是在社交媒體平臺(tái)上為表達(dá)認(rèn)知、情緒、意見(jiàn)、態(tài)度等言論而產(chǎn)生參與行為的主體,即社交媒體平臺(tái)用戶(hù)本身,在社交媒體平臺(tái)用戶(hù)參與行為分析的基礎(chǔ)上,本文認(rèn)為,社交媒體平臺(tái)用戶(hù)主體大體可以分為以下4種屬性,包括用戶(hù)自然屬性、用戶(hù)互動(dòng)傾向度、用戶(hù)情緒屬性和用戶(hù)偏好。
1)用戶(hù)自然屬性是社交媒體平臺(tái)用戶(hù)的基本信息,包含用戶(hù)的昵稱(chēng)、頭像、性別、年齡、地域、聯(lián)系方式、會(huì)員類(lèi)型、注冊(cè)日期、活躍度等,可以在一定程度上辨別用戶(hù)特征和用戶(hù)在新輿情事件中的參與程度。
2)用戶(hù)互動(dòng)傾向度指社交媒體平臺(tái)用戶(hù)在社交媒體平臺(tái)中參與討論的主觀意愿傾向度,互動(dòng)傾向度體現(xiàn)了用戶(hù)在@行為、評(píng)論、轉(zhuǎn)發(fā)、分享、發(fā)布等方面的參與行為的強(qiáng)弱程度,越喜歡參與討論的用戶(hù),對(duì)輿情話題的發(fā)展越有促進(jìn)作用,這種作用可能是積極的也可能是消極的,受到其自然屬性、情感屬性、偏好和所處環(huán)境背景等因素的影響。而一個(gè)只瀏覽信息、從來(lái)不參與討論的用戶(hù),對(duì)任何輿情事件的發(fā)展和傳播都不會(huì)有影響。
3)用戶(hù)情緒屬性指社交媒體平臺(tái)用戶(hù)參與行為發(fā)生時(shí)的情感狀態(tài),情緒是對(duì)一系列主觀認(rèn)知經(jīng)驗(yàn)的通稱(chēng),是多種感覺(jué)、思想和行為綜合產(chǎn)生的心理和生理狀態(tài)。無(wú)論正面還是負(fù)面的情緒,都可能會(huì)引發(fā)輿情事件參與行為。人類(lèi)的情緒會(huì)根據(jù)輿情事件、所處的環(huán)境背景而發(fā)生變化,同一輿情事件、不同的環(huán)境背景,產(chǎn)生的情緒會(huì)有差異。
4)用戶(hù)偏好指社交媒體平臺(tái)用戶(hù)對(duì)輿情事件的關(guān)注偏好,有些用戶(hù)偏好關(guān)注政治類(lèi)事件,有些用戶(hù)偏好娛樂(lè)圈中相關(guān)的輿情事件,有些用戶(hù)偏好關(guān)注科技數(shù)碼類(lèi)輿情事件等。不同用戶(hù)的關(guān)注點(diǎn)可能不同,同一用戶(hù)在不同的年齡階段、不同的地域、不同的社交媒體平臺(tái)的關(guān)注點(diǎn)也可能不同。在用戶(hù)偏好的研究中,可以根據(jù)用戶(hù)的參與行為,發(fā)掘用戶(hù)的偏好,在類(lèi)似輿情事件發(fā)生前,用于判斷該用戶(hù)可能產(chǎn)生的參與行為。
社交媒體平臺(tái)用戶(hù)參與行為客體指的是引發(fā)參與行為產(chǎn)生的刺激物,直接導(dǎo)致參與行為的產(chǎn)生,即社交媒體平臺(tái)事件,有文字、視頻、圖片、音頻等形式,不同社交媒體平臺(tái)對(duì)事件的分類(lèi)有所不同。
結(jié)合融媒體的發(fā)展特性,通過(guò)社交媒體平臺(tái)構(gòu)建特征發(fā)現(xiàn),社交媒體平臺(tái)基于Web2.0為核心搭建,因此具有相似的功能屬性。從參與行為模式中揭示每個(gè)用戶(hù)對(duì)不同話題類(lèi)型的興趣偏好,首先要找到社交媒體平臺(tái),尤其是主流社交媒體平臺(tái)功能的相似性。
在微博這一社交媒體平臺(tái)中,平臺(tái)自帶的對(duì)事件的分類(lèi)給出了熱門(mén)、抗疫、科技、明星、數(shù)碼、國(guó)際等61種[9]。在微信收藏內(nèi)容中的自帶分類(lèi)是按照收藏內(nèi)容的形式劃分的,即最近使用、圖片與視頻、鏈接、文件、音樂(lè)、聊天記錄、語(yǔ)音、筆記、位置等[10]。此外,微信除了主要的通訊功能以及熱門(mén)的支付功能外,其信息交互功能中的微信公眾號(hào)、視頻號(hào)、看一看等同為主要的信息交換方式,公眾號(hào)默認(rèn)是按照字母排序的,沒(méi)有更明確的分類(lèi);視頻號(hào)默認(rèn)給出了推薦、直播、娛樂(lè)等11個(gè)類(lèi)別;看一看則分為朋友在看和精選兩大類(lèi)別,其中精選又分為今日必看和推薦兩個(gè)類(lèi)別。抖音給出了娛樂(lè)、知識(shí)、二次元、游戲、美食等8種分類(lèi)。小紅書(shū)只有關(guān)注、發(fā)現(xiàn)和附近3個(gè)大類(lèi)別。知乎分為圈子、科學(xué)、娛樂(lè)、數(shù)碼等23個(gè)板塊。
結(jié)合以上5種主流社交媒體平臺(tái)對(duì)話題的分類(lèi)可以看出,社交媒體平臺(tái)對(duì)話題的分類(lèi)尚未統(tǒng)一;部分社交媒體平臺(tái)對(duì)話題幾乎未作分類(lèi),比如小紅書(shū);同一社交媒體平臺(tái)下不同話題內(nèi)容存在高度相關(guān)性,比如微博中“美女”這一話題類(lèi)別和“攝影”這一話題類(lèi)別下均存在大量女性自拍/擺拍;“軍事”這一話題類(lèi)別和“國(guó)際”這一話題類(lèi)別下均存在大量國(guó)際戰(zhàn)事及軍事武器等信息。因此,話題類(lèi)別過(guò)多必然會(huì)導(dǎo)致信息內(nèi)容出現(xiàn)交叉現(xiàn)象。此外,社交媒體平臺(tái)作為一個(gè)以“用戶(hù)”為構(gòu)建中心的信息交流平臺(tái),支持用戶(hù)自建話題,在對(duì)社交媒體平臺(tái)話題分類(lèi)的分析中,不能忽略用戶(hù)的主觀能動(dòng)性、自主創(chuàng)造性和自主選擇性,因此參考Jansen B J[11]對(duì)Youtube內(nèi)容的分類(lèi),本文將社交媒體平臺(tái)話題內(nèi)容分為8類(lèi),如表1所示。
表1 社交媒體平臺(tái)話題內(nèi)容分類(lèi)
社交媒體平臺(tái)用戶(hù)參與行為本體就是參與行為本身,是社交媒體平臺(tái)用戶(hù)針對(duì)某些議題、現(xiàn)象或事件,在社交媒體平臺(tái)上表達(dá)的認(rèn)知、情緒、態(tài)度和意見(jiàn)等具體內(nèi)容的參與行為。
心理學(xué)詞典規(guī)定,“行為”一詞的意思是“有機(jī)體與其環(huán)境相互作用的活動(dòng)”。該術(shù)語(yǔ)泛指所有活動(dòng)或某一特定活動(dòng),被定義為有機(jī)體對(duì)生活環(huán)境的總體反應(yīng)。對(duì)行為的研究,認(rèn)知心理學(xué)領(lǐng)域主要從信息加工的角度進(jìn)行。20世紀(jì)60年代后,大多數(shù)心理學(xué)家將內(nèi)部心理活動(dòng)與外顯行為區(qū)別開(kāi)來(lái),試圖從信息加工的角度描述心理活動(dòng)的狀態(tài)和過(guò)程,以此解釋各種外顯行為發(fā)生和發(fā)展的規(guī)律[12]。本文基于不同社交媒體平臺(tái)主頁(yè)面的主要功能及其附屬功能,識(shí)別了包含瀏覽行為、收藏行為、@行為、點(diǎn)贊行為、評(píng)論行為、轉(zhuǎn)發(fā)行為、分享行為、發(fā)布行為在內(nèi)的8個(gè)類(lèi)別的參與行為。信息加工理論(Information Processing Theory)從機(jī)能上將人腦和計(jì)算機(jī)從行為水平上進(jìn)行類(lèi)比,認(rèn)為人的認(rèn)知過(guò)程就是對(duì)信息的加工過(guò)程,涉及人如何對(duì)信息進(jìn)行處理,以及如何利用信息做出決策并指導(dǎo)自己的行為等[13],強(qiáng)調(diào)的是人在對(duì)刺激做出反應(yīng)時(shí)的人為選擇而進(jìn)行的對(duì)原有記憶的調(diào)取與新信息的加工和整合的人腦中的一系列需要提供不同強(qiáng)度認(rèn)知努力的認(rèn)知活動(dòng)。根據(jù)適應(yīng)性增益理論(AGT),任務(wù)投入的程度(由去甲腎上腺素誘導(dǎo)的神經(jīng)元增益調(diào)節(jié)驅(qū)動(dòng)的反應(yīng)速度和敏銳度)受任務(wù)效用(收益減去成本)的調(diào)節(jié),因此增加效用會(huì)產(chǎn)生更大的參與度,降低效用會(huì)導(dǎo)致注意力分散,更高的努力可能對(duì)應(yīng)更高的參與度,而更低的努力對(duì)應(yīng)于注意力分散、走神和注意力不集中。
因此,本文基于信息加工理論,對(duì)識(shí)別到的8個(gè)類(lèi)別的參與行為都進(jìn)行細(xì)分,基于付出認(rèn)知努力的多少將每個(gè)行為類(lèi)別都劃分為2~4個(gè)特定動(dòng)作的子組,總共21個(gè)特定動(dòng)作,構(gòu)建了社交媒體平臺(tái)用戶(hù)參與行為譜,如表2所示。
表2 社交媒體平臺(tái)用戶(hù)參與行為譜
社交媒體平臺(tái)用戶(hù)參與行為媒體即傳播媒介,也被稱(chēng)為渠道或參與行為產(chǎn)生手段,在社交媒體環(huán)境下,參與行為媒體具有物聯(lián)網(wǎng)特征,主要包括PC、移動(dòng)終端及智能電子產(chǎn)品,而這些產(chǎn)品的核心是操作系統(tǒng)(OS)。社交媒體平臺(tái)用戶(hù)常用的操作系統(tǒng)(OS)主要包含Windows、Mac OS和移動(dòng)操作系統(tǒng)。操作系統(tǒng)提供3個(gè)基本功能,其中之一:它通過(guò)CLI(命令行界面)或GUI(圖形用戶(hù)界面)提供UI(用戶(hù)與計(jì)算機(jī)的交互)。不同的操作系統(tǒng)針對(duì)同一社交媒體平臺(tái)用戶(hù)參與行為主體的人機(jī)交互界面設(shè)計(jì)會(huì)有不同,本文根據(jù)UI的不同,將社交媒體平臺(tái)用戶(hù)參與行為媒體分為Windows/Mac OS網(wǎng)頁(yè)端(以下簡(jiǎn)稱(chēng)網(wǎng)頁(yè)端)、智能手機(jī)(App)端和平板電腦(App)端。
強(qiáng)度一詞本指每單位(如面積、電荷、質(zhì)量或時(shí)間)的量(如力或能量)的大小,面積、電荷、質(zhì)量或時(shí)間的量越大,最終的強(qiáng)度也就越大。因此,本文將社交媒體平臺(tái)用戶(hù)參與行為強(qiáng)度定義為某特定話題類(lèi)別下每單位(某特定話題類(lèi)別,即特定話題的1個(gè)事件)的量(具體的參與行為數(shù)量/比例)的大小。例如,某用戶(hù)瀏覽過(guò)10條娛樂(lè)八卦類(lèi)事件,將2條信息轉(zhuǎn)發(fā)給同平臺(tái)內(nèi)的某個(gè)好友,則該用戶(hù)轉(zhuǎn)發(fā)行為t1的強(qiáng)度為2/10即20%。
本文從社交媒體平臺(tái)用戶(hù)參與行為轉(zhuǎn)換的頻率和概率兩個(gè)角度對(duì)用戶(hù)參與行為強(qiáng)度進(jìn)行了分析。
2.2.1 社交媒體平臺(tái)用戶(hù)參與行為轉(zhuǎn)換頻率分析
為了分析總轉(zhuǎn)換頻率,使用了修改的Deming-Stephan迭代比例擬合來(lái)產(chǎn)生期望值,同時(shí)考慮了結(jié)構(gòu)零的存在,即,作為自轉(zhuǎn)換或物理上不可能的轉(zhuǎn)換的結(jié)果而出現(xiàn)的零。每種參與行為都使用了x2測(cè)試,以測(cè)試轉(zhuǎn)換的頻率是否明顯偏離隨機(jī)預(yù)期的頻率。由于有一些期望值小于5,通過(guò)將低頻動(dòng)作和相關(guān)動(dòng)作合并在一起,使用原始矩陣大小來(lái)計(jì)算自由度。
x2擬合優(yōu)度檢驗(yàn)用于將觀察到的轉(zhuǎn)換和預(yù)期的轉(zhuǎn)換進(jìn)行比較,因此,檢查轉(zhuǎn)換頻率是為了檢驗(yàn)關(guān)于轉(zhuǎn)換概率的特定假設(shè)。假設(shè)任何行為原則上可以遵循任何其他行為,則轉(zhuǎn)換頻率可以以表格的形式列出。在這種制表模式中,觀察到的緊跟在第i種動(dòng)作之后的第j種動(dòng)作的頻率出現(xiàn)在第i行和第j列的表項(xiàng)單元格(i,j)中。因此,第i行列出了表格中每個(gè)不同類(lèi)型的動(dòng)作緊跟在第i類(lèi)型之后的頻率,而第j列列出了緊跟在j類(lèi)型之前的表格中的每個(gè)不同類(lèi)型的動(dòng)作的頻率。
(1)
其中xij=單元格(i,j)中的觀測(cè)值,mij=(i,j)中的期望值=[(i行的和)×(j列的和)]/參與行為總數(shù)。
2.2.2 社交媒體平臺(tái)用戶(hù)參與行為轉(zhuǎn)換概率分析
由Haynes和Birch設(shè)計(jì)的定型指數(shù)[14]被用來(lái)分析轉(zhuǎn)換的概率。這為一階矩陣中與特定行為轉(zhuǎn)換相關(guān)聯(lián)的定型水平分配了一個(gè)客觀度量,并通過(guò)式(2)計(jì)算:
(2)
其中Pij=從行為步驟i到所有后續(xù)行為j的轉(zhuǎn)換概率;ri=行為步驟i之前的可能的轉(zhuǎn)換的次數(shù)。
根據(jù)前文分析的社交媒體平臺(tái)用戶(hù)參與行為的構(gòu)成要素確定社交媒體平臺(tái)用戶(hù)參與行為數(shù)據(jù)。
2.3.1 社交媒體平臺(tái)用戶(hù)及傳播媒介確定
在我國(guó),微信的月活躍用戶(hù)數(shù)已經(jīng)超過(guò)12億,已然成為我國(guó)互聯(lián)網(wǎng)史上用戶(hù)數(shù)量最多的應(yīng)用,基本上人人都是微信這一社交媒體平臺(tái)的用戶(hù)。微博月活躍用戶(hù)數(shù)近6億,基本上半數(shù)的國(guó)人都是微博這一社交媒體平臺(tái)的用戶(hù)。小紅書(shū)月活躍用戶(hù)超過(guò)2億。抖音月活躍用戶(hù)超過(guò)5.5億,且增勢(shì)迅猛。
綜合以上圖1~圖3的數(shù)據(jù),結(jié)合Mob研究院的調(diào)研數(shù)據(jù)(85、95、00后人群洞察白皮書(shū)),可以看出社交媒體平臺(tái)用戶(hù)基本特征為:
圖1 社交媒體平臺(tái)用戶(hù)性別分布(部分)
圖2 社交媒體平臺(tái)用戶(hù)年齡分布(部分)
圖3 社交媒體平臺(tái)用戶(hù)城市分布(部分)
①男女相對(duì)較均衡。
②城市無(wú)明顯差異。
③年齡主要集中在35歲以下。
④總體人數(shù)約6億。
⑤日均上網(wǎng)時(shí)長(zhǎng)超過(guò)5個(gè)小時(shí)。
預(yù)先邀請(qǐng)了5名實(shí)驗(yàn)用戶(hù),采取滾雪球的方式隨機(jī)獲得與5名受試者具有社會(huì)相關(guān)性的人員25名,再隨機(jī)獲得與25名受試者具有社會(huì)相關(guān)性的人員125名,基于前文對(duì)社交媒體平臺(tái)用戶(hù)進(jìn)行確定分析得出的社交媒體平臺(tái)用戶(hù)性別分布、年齡分布及日均上網(wǎng)時(shí)長(zhǎng)等信息,最終選取實(shí)驗(yàn)人員20名,實(shí)驗(yàn)用戶(hù)的性別及數(shù)量分布如表3所示,基本信息如表4所示。
表3 實(shí)驗(yàn)用戶(hù)信息及數(shù)量分布
表4 實(shí)驗(yàn)用戶(hù)基本信息(部分)
2.3.2 社交媒體平臺(tái)話題內(nèi)容及參與行為記錄
通過(guò)對(duì)實(shí)驗(yàn)人員社交媒體平臺(tái)使用情況進(jìn)行調(diào)查,具體如表5所示。
表5 實(shí)驗(yàn)人員社交媒體平臺(tái)使用情況
創(chuàng)建網(wǎng)頁(yè)端,每天整理微博熱搜榜、微博文娛榜、微博要聞榜、微信熱點(diǎn)、抖音熱點(diǎn)榜、抖音娛樂(lè)榜、抖音社會(huì)榜、小紅書(shū)社區(qū)精選、知乎熱榜等中的熱點(diǎn)事件信息,每個(gè)平臺(tái)選取熱點(diǎn)事件120件(每個(gè)話題類(lèi)別15件),將事件鏈接放到創(chuàng)建的網(wǎng)頁(yè)上(順序隨機(jī))。
實(shí)驗(yàn)用戶(hù)登錄網(wǎng)頁(yè)后,首先選取自己使用的社交媒體平臺(tái)情況(例如用戶(hù)1需選取微博、微信、抖音、知乎,用戶(hù)2需選取微博、微信、抖音),選取后,平臺(tái)會(huì)根據(jù)用戶(hù)選取情況分配事件(每個(gè)話題從所有選擇平臺(tái)中隨機(jī)選取15件),將分配的事件鏈接到平臺(tái)上,用戶(hù)點(diǎn)擊事件鏈接查看信息后,會(huì)跳轉(zhuǎn)到用戶(hù)相應(yīng)的社交媒體平臺(tái)軟件中(網(wǎng)頁(yè)端用戶(hù)可在網(wǎng)頁(yè)端完成),所有參與行為均在用戶(hù)自己的社交媒體平臺(tái)中完成,用戶(hù)所有的參與行為采取錄屏方式獲取,每天的參與實(shí)驗(yàn)時(shí)間由用戶(hù)自行確定,持續(xù)60天(前20天的數(shù)據(jù)用于參與行為強(qiáng)度測(cè)定,作為預(yù)判用戶(hù)參與行為強(qiáng)度的基礎(chǔ),間隔30天,最后10天的數(shù)據(jù)用于對(duì)預(yù)判結(jié)果進(jìn)行評(píng)估)。
本次實(shí)驗(yàn)記錄了83 465個(gè)參與行為(前20天數(shù)據(jù)記錄,如圖4所示)。
圖4 社交媒體平臺(tái)用戶(hù)(實(shí)驗(yàn)用戶(hù))參與行為數(shù)量分布
分析圖4可見(jiàn):
1)不同用戶(hù)的活躍度有所差異
用戶(hù)2在本次實(shí)驗(yàn)中最活躍,具體表現(xiàn)為產(chǎn)生的參與行為最多(7 373),其中娛樂(lè)八卦類(lèi)話題下參與行為在所有話題中頻度最高(1 002),占全部參與行為的13.59%,科技數(shù)碼類(lèi)話題下參與行為在所有話題中頻度最低(872),一定程度上可以看出用戶(hù)2對(duì)所有話題均感興趣,且興趣相當(dāng);用戶(hù)12在本次實(shí)驗(yàn)中最不活躍,具體表現(xiàn)為產(chǎn)生的參與行為最少(2 909),該用戶(hù)只在教育育兒類(lèi)話題下活躍度較高(784)。
2)不同用戶(hù)所關(guān)注的話題類(lèi)型有明顯不同
有些用戶(hù)對(duì)所有話題活躍度均很高,如用戶(hù)2和用戶(hù)11;有些用戶(hù)只對(duì)單一話題活躍度高,如用戶(hù)5只對(duì)科技數(shù)碼類(lèi)話題活躍度高(849),用戶(hù)13只對(duì)人類(lèi)趣味類(lèi)話題活躍度高(963),用戶(hù)16只對(duì)政治生活類(lèi)話題活躍度高(940)等。
以用戶(hù)1(B1)為例對(duì)其參與行為進(jìn)行分析。
分析表6、圖5及圖6,可以看出:
表6 娛樂(lè)八卦類(lèi)話題的參與行為序列一階矩陣(B1)
注:數(shù)字和相應(yīng)的箭頭是兩種參與行為之間發(fā)生特定轉(zhuǎn)換的概率。
圖6 娛樂(lè)八卦類(lèi)話題的參與行為轉(zhuǎn)換定型指數(shù)(B1)
1)用戶(hù)1最常見(jiàn)的參與行為序列有10種(轉(zhuǎn)換概率≥50%):
e2→d1、e2→d3、l2→d4→t1、a1→d4、d2→t1、d2→s1、t1→d4、t2→s1→c2、t3→c1→t1、t4→s1→c2,具體為粗略瀏覽信息后對(duì)該信息進(jìn)行評(píng)論或評(píng)論該信息下評(píng)論的內(nèi)容、點(diǎn)贊后評(píng)論該信息下評(píng)論的內(nèi)容并將該信息發(fā)送給某個(gè)好友、@某個(gè)好友后將此信息發(fā)送給平臺(tái)外的某些人、對(duì)內(nèi)容進(jìn)行評(píng)論后將此消息轉(zhuǎn)發(fā)給同平臺(tái)某個(gè)好友或是發(fā)布至個(gè)人主頁(yè)面、轉(zhuǎn)發(fā)給同平臺(tái)某個(gè)好友后評(píng)論該信息下評(píng)論的內(nèi)容、轉(zhuǎn)發(fā)給同平臺(tái)某些個(gè)好友后將此信息發(fā)布至個(gè)人主頁(yè)面然后依據(jù)個(gè)人見(jiàn)解發(fā)布信息、將此信息轉(zhuǎn)發(fā)給平臺(tái)外某個(gè)人后發(fā)布至個(gè)人主頁(yè)面然后轉(zhuǎn)發(fā)給同平臺(tái)某個(gè)好友、將此信息轉(zhuǎn)發(fā)給平臺(tái)外某些人后發(fā)布至個(gè)人主頁(yè)面然后依據(jù)個(gè)人見(jiàn)解發(fā)布信息。
2)某些定型指數(shù)SI無(wú)數(shù)值,表示該用戶(hù)無(wú)此參與行為,可能是數(shù)據(jù)樣本較少導(dǎo)致此現(xiàn)象的出現(xiàn)或是偶發(fā)現(xiàn)象。
3)在社交媒體平臺(tái)用戶(hù)參與行為中,全部瀏覽完畢(e3)的參與行為強(qiáng)度為96.67%,評(píng)論行為的參與行為強(qiáng)度為87.67%,其中98.48%為瀏覽完信息內(nèi)容后查看評(píng)論,評(píng)論該評(píng)論的內(nèi)容(d4);轉(zhuǎn)發(fā)行為的參與行為強(qiáng)度為79.67%,其中97.49%為將此信息轉(zhuǎn)發(fā)給同平臺(tái)內(nèi)某個(gè)好友(t1);發(fā)布行為的參與行為強(qiáng)度為50.67%,其中94.08%為將其他現(xiàn)有的內(nèi)容發(fā)布到平臺(tái)自身的賬號(hào)頁(yè)面內(nèi)所產(chǎn)生的發(fā)布行為(c1),5.92%為依據(jù)自身已有的知識(shí)、見(jiàn)解和認(rèn)知發(fā)布原創(chuàng)內(nèi)容到平臺(tái)自身的個(gè)人主頁(yè)面內(nèi)并不為私密發(fā)布(僅自己可見(jiàn),c2)。
Apriori算法是挖掘數(shù)據(jù)間關(guān)聯(lián)規(guī)則的算法,挖掘關(guān)聯(lián)規(guī)則的主要任務(wù)是找出數(shù)據(jù)庫(kù)中所有的數(shù)據(jù)集合(頻繁項(xiàng)集)[15]。判斷頻繁關(guān)聯(lián)規(guī)則的標(biāo)準(zhǔn)是指支持度和置信度都不低于用戶(hù)給定的最小支持度min_support和最小置信度min_confidence。支持度用來(lái)表示項(xiàng)集在數(shù)據(jù)中出現(xiàn)的頻繁程度,置信度則用于表示Y在包含X的項(xiàng)集中出現(xiàn)的頻繁程度。
對(duì)于給定的數(shù)據(jù)集,在挖掘頻繁關(guān)聯(lián)規(guī)則時(shí),首先設(shè)定最小支持度和最小置信度,然后挖掘出滿(mǎn)足條件的頻繁項(xiàng)集,最后生成頻繁關(guān)聯(lián)規(guī)則[15]。
Apriori算法基本思想是使用一種逐層掃描的方法挖掘頻繁項(xiàng)集:
第1次掃描,找出候選集1,在第一次候選集基礎(chǔ)上,求出第一次頻繁項(xiàng)集1(>min_support)。
第2次掃描,找出候選集2,求出頻繁項(xiàng)集2。
第n次掃描,找出候選集n,當(dāng)最后生成的候選集n中,只有0個(gè)或1個(gè)的話,循環(huán)結(jié)束。
Aprori算法可以很好地找出關(guān)聯(lián)關(guān)系,但是每一次求候選集都需要掃描一次所有數(shù)據(jù)記錄,在面臨數(shù)據(jù)較多時(shí)就會(huì)耗費(fèi)大量的時(shí)間。本文通過(guò)改進(jìn)的Aprori算法(Fp-Growth算法,F(xiàn)requent Pattern Tree,頻繁模式樹(shù))來(lái)提高運(yùn)行效率,通過(guò)構(gòu)造一個(gè)樹(shù)結(jié)構(gòu)(FP樹(shù))來(lái)壓縮數(shù)據(jù)記錄,使得挖掘頻繁項(xiàng)集只需要掃描兩次數(shù)據(jù)記錄,且該算法不需要生成候選集合[16]。
FP樹(shù)構(gòu)建方法,以用戶(hù)1娛樂(lè)八卦類(lèi)話題為例,數(shù)據(jù)如表7所示。
表7 娛樂(lè)八卦類(lèi)話題原始數(shù)據(jù)(B1)
第一步,令min_support=50(例),第1次掃描,找出候選集1,如表8所示,在第一次候選集基礎(chǔ)上,求出第一次頻繁項(xiàng)集為e3:290、d4:259、t1:233、c1:143、s1:51(逆序排序)。
表8 娛樂(lè)八卦類(lèi)話題候選集1數(shù)據(jù)(B1)
第二步,構(gòu)建FP樹(shù),數(shù)的根節(jié)點(diǎn)用null表示,如圖7所示。
圖7 娛樂(lè)八卦類(lèi)話題FP樹(shù)(B1)
1)預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)的參與行為強(qiáng)度
預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)參與行為強(qiáng)度≥50%的參與行為,結(jié)果為e3(290)、d4(259)、t1(233)。
預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)參與行為強(qiáng)度≥80%的參與行為,結(jié)果為e3(290)、d4(259)。
2)預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)的參與行為序列(頻度)
預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)≥50%的概率會(huì)出現(xiàn)的參與行為序列(頻度):
設(shè)置min_support=50%(150),計(jì)算出頻繁項(xiàng)集,結(jié)果為:{e3,t1};{d4,t1};{e3,d4,t1},即用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí),超過(guò)50%的概率會(huì)瀏覽完全部信息,查看評(píng)論內(nèi)容,對(duì)評(píng)論內(nèi)容進(jìn)行評(píng)論,并將此信息轉(zhuǎn)發(fā)給同平臺(tái)內(nèi)的某個(gè)好友。
預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)≥80%的概率會(huì)出現(xiàn)的參與行為序列(頻度):
設(shè)置min_support=80%(240),此時(shí)頻繁項(xiàng)集的結(jié)果為{e3,d4},即用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí),超過(guò)80%的概率會(huì)瀏覽完全部信息,查看評(píng)論內(nèi)容,對(duì)評(píng)論內(nèi)容進(jìn)行評(píng)論。
3)預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)的各參與行為強(qiáng)度之間的相關(guān)性
預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)出現(xiàn)某參與行為的同時(shí)會(huì)有≥90%的概率會(huì)出現(xiàn)另一參與行為:
設(shè)置min_confidence為90%,計(jì)算出頻繁項(xiàng)集的結(jié)果為{t1,d4}、{l2,d4}、{l2,c1}、{a1,d4},即用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí),若將此信息轉(zhuǎn)發(fā)給同平臺(tái)的某個(gè)好友后,有≥90%的概率會(huì)對(duì)該信息下的評(píng)論內(nèi)容進(jìn)行評(píng)論,若對(duì)此信息下的某條評(píng)論產(chǎn)生興趣并點(diǎn)贊該信息/評(píng)論則會(huì)有≥90%的概率會(huì)對(duì)該信息下的評(píng)論內(nèi)容進(jìn)行評(píng)論,若對(duì)此信息下的某條評(píng)論產(chǎn)生興趣并點(diǎn)贊該信息/評(píng)論則會(huì)有≥90%的概率會(huì)將其他現(xiàn)有內(nèi)容發(fā)布到平臺(tái)自身賬號(hào)頁(yè)面內(nèi),若將此信息@給某好友則會(huì)有≥90%的概率會(huì)對(duì)該信息下的評(píng)論內(nèi)容進(jìn)行評(píng)論。
預(yù)判用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí)出現(xiàn)某參與行為的同時(shí)會(huì)有≥80%的概率會(huì)出現(xiàn)另一參與行為強(qiáng)度:
設(shè)置min_confidence為80%,計(jì)算出頻繁項(xiàng)集的結(jié)果為{t1,d4}、{l2,d4}、{l2,c1}、{a1,d4}、{e3,d4}、{d4,t1},即用戶(hù)1瀏覽到某娛樂(lè)八卦類(lèi)話題內(nèi)容時(shí),若將此信息瀏覽完畢則會(huì)有≥80%的概率會(huì)對(duì)該信息下的評(píng)論內(nèi)容進(jìn)行評(píng)論,若對(duì)該信息下的評(píng)論內(nèi)容進(jìn)行評(píng)論則會(huì)有≥80%的概率會(huì)將此信息轉(zhuǎn)發(fā)給同平臺(tái)的某個(gè)好友(前4項(xiàng)頻繁項(xiàng)集的解釋見(jiàn)上述min_confidence=90%的內(nèi)容)。
3.2.1 數(shù)據(jù)采集及處理
由前文分析的20位用戶(hù)的參與行為數(shù)據(jù),得出每位用戶(hù)、每個(gè)話題下的每個(gè)參與行為的強(qiáng)度,結(jié)果如圖8所示(以?shī)蕵?lè)八卦類(lèi)話題為例)。
圖8 參與行為強(qiáng)度預(yù)判三維曲面圖
對(duì)最后10天數(shù)據(jù)進(jìn)行分析,共得到41 127條數(shù)據(jù)記錄,得出每位用戶(hù)、每個(gè)話題下的每個(gè)參與行為的強(qiáng)度,結(jié)果如圖9所示(以?shī)蕵?lè)八卦話題為例)。
圖9 參與行為強(qiáng)度概率分布三維曲面圖
3.2.2 預(yù)判結(jié)果
本文以總體偏差率作為評(píng)價(jià)指標(biāo)對(duì)20位用戶(hù)的參與行為強(qiáng)度預(yù)判結(jié)果進(jìn)行分析,總體偏差率描述的是用戶(hù)歷史行為(前20天數(shù)據(jù))中參與行為的強(qiáng)度與評(píng)估樣本(后10天數(shù)據(jù))中對(duì)應(yīng)參與行為的強(qiáng)度差值的絕對(duì)值。若用戶(hù)1瀏覽某條娛樂(lè)八卦類(lèi)消息的歷史行為顯示該用戶(hù)將此消息轉(zhuǎn)發(fā)給同平臺(tái)某好友的強(qiáng)度為80%,評(píng)估樣本中該用戶(hù)將此消息轉(zhuǎn)發(fā)給同平臺(tái)某好友的強(qiáng)度為70%,則偏差率為|80%-70%|=10%。
對(duì)所有用戶(hù)所有話題類(lèi)別下所有參與行為強(qiáng)度進(jìn)行預(yù)判,如圖10所示,最大的偏差率出現(xiàn)在用戶(hù)12的教育育兒類(lèi)話題中的e2、e3,偏差率為20%。
圖10 社交媒體平臺(tái)用戶(hù)(實(shí)驗(yàn)用戶(hù))參與行為強(qiáng)度偏差率
對(duì)所有實(shí)驗(yàn)用戶(hù)所有話題下所有參與行為強(qiáng)度進(jìn)行整理,提取出偏差率大于10%的數(shù)據(jù),結(jié)果如表9所示。
表9 偏差率大于10%的話題及參與行為強(qiáng)度分布 %
由表9可以看出,幾乎所有話題下均存在偏差率大于10%的數(shù)據(jù),近半數(shù)用戶(hù)存在偏差率大于10%的數(shù)據(jù),可見(jiàn)偏差率和用戶(hù)或話題無(wú)明顯直接關(guān)系。其中,偏差率大于10%的數(shù)據(jù)量共有24個(gè),其中瀏覽行為(e1+e2+e3)的數(shù)量最多,占總數(shù)的62.5%,出現(xiàn)該問(wèn)題的原因可能是數(shù)據(jù)記錄過(guò)程造成的:從記錄的數(shù)據(jù)中無(wú)法真正判斷用戶(hù)的認(rèn)知努力量,較難分辨實(shí)驗(yàn)用戶(hù)的瀏覽行為是e2或e3(實(shí)驗(yàn)過(guò)程中一般按閱讀時(shí)間為5秒進(jìn)行區(qū)分,對(duì)于信息量較長(zhǎng)或較短的適當(dāng)增減閱讀時(shí)間),有些用戶(hù)瀏覽的速度很快,有些則較慢。
從總體偏差率可以發(fā)現(xiàn),本文提出的基于全社交媒體平臺(tái)對(duì)用戶(hù)參與行為強(qiáng)度進(jìn)行預(yù)判的方法其總體偏差率在20%以下(含),對(duì)用戶(hù)的參與行為強(qiáng)度具有較好的預(yù)判效果。
本文對(duì)社交媒體平臺(tái)用戶(hù)參與行為的構(gòu)成要素進(jìn)行分析,認(rèn)為社交媒體平臺(tái)用戶(hù)的參與行為包含社交媒體平臺(tái)用戶(hù)參與行為的主體、客體、本體及媒體,并據(jù)此設(shè)計(jì)觀察實(shí)驗(yàn),通過(guò)問(wèn)卷調(diào)查和公開(kāi)的歷史數(shù)據(jù),采取滾雪球的抽樣方式,獲取了20名用戶(hù)數(shù)據(jù),從用戶(hù)使用的所有社交媒體平臺(tái)中抽取熱點(diǎn)事件,記錄實(shí)驗(yàn)用戶(hù)的參與行為,基于社交媒體平臺(tái)用戶(hù)的參與行為譜構(gòu)建了社交媒體平臺(tái)用戶(hù)的參與行為強(qiáng)度序列一階矩陣,對(duì)用戶(hù)的參與行為強(qiáng)度進(jìn)行分析及測(cè)定,基于Fp-Growth算法對(duì)社交媒體平臺(tái)用戶(hù)的參與行為強(qiáng)度進(jìn)行預(yù)判,其總體偏差率可以達(dá)到20%以下(含),對(duì)用戶(hù)的參與行為強(qiáng)度具有較好的預(yù)判效果,可以提高社交媒體平臺(tái)推薦服務(wù)的質(zhì)量,并能實(shí)現(xiàn)和提高輿情危機(jī)事件發(fā)生時(shí)的精準(zhǔn)引導(dǎo)與靶向?qū)Э亍?/p>