吳柳
摘要:基于所采集的某視頻網(wǎng)站用戶訪問(wèn)行為數(shù)據(jù),重點(diǎn)從瀏覽量和訪問(wèn)次數(shù)等兩個(gè)引流指標(biāo)以及轉(zhuǎn)化率、跳出率和視頻類型喜好等三個(gè)粘性指標(biāo)進(jìn)行了深入分析挖掘。發(fā)現(xiàn)了隱藏在數(shù)據(jù)背后的用戶訪問(wèn)行為規(guī)律,包括瀏覽量變化的影響因素,用戶訪問(wèn)網(wǎng)站的時(shí)間規(guī)律,轉(zhuǎn)化率與等待時(shí)間的相關(guān)關(guān)系,對(duì)視頻網(wǎng)站的興趣程度以及對(duì)不同視頻類型的偏好等。根據(jù)所獲取的用戶訪問(wèn)習(xí)慣,提出了網(wǎng)站改進(jìn)的相關(guān)建議以吸引并留住更多用戶,改善其使用體驗(yàn),促進(jìn)視頻網(wǎng)站的快速發(fā)展。
關(guān)鍵詞:數(shù)據(jù)分析與挖掘;在線行為分析;引流指標(biāo);粘性指標(biāo);網(wǎng)站優(yōu)化
1概述
隨著網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的發(fā)展,各類視頻網(wǎng)站已成為人們進(jìn)行學(xué)習(xí)娛樂(lè)的重要場(chǎng)所,而一個(gè)網(wǎng)站的成功與否最重要的衡量標(biāo)準(zhǔn)就是用戶的滿意度。由于Web應(yīng)用能夠以很細(xì)的粒度、很高的頻度不斷記錄用戶的行為軌跡,這些數(shù)據(jù)中隱藏著用戶的訪問(wèn)習(xí)慣、興趣偏好以及情緒變化等,同時(shí)也隱含著用戶群體行為的規(guī)律和發(fā)展趨勢(shì)。挖掘深藏在數(shù)據(jù)背后的知識(shí),能夠發(fā)現(xiàn)用戶習(xí)慣的觀看流程,訪問(wèn)網(wǎng)站的時(shí)間以及喜好的視頻,各視頻間存在的關(guān)聯(lián)關(guān)系等。掌握了這些知識(shí),就能科學(xué)解決用戶跳出等問(wèn)題,根據(jù)用戶訪問(wèn)習(xí)慣改進(jìn)網(wǎng)站服務(wù)流程以及針對(duì)用戶進(jìn)行個(gè)性化服務(wù),變革傳統(tǒng)的網(wǎng)站管理和運(yùn)營(yíng)模式,主動(dòng)提高用戶的體驗(yàn)以促進(jìn)視頻網(wǎng)站的快速發(fā)展。
然而如何對(duì)這些海量的、動(dòng)態(tài)變化的、結(jié)構(gòu)形式多樣的視頻網(wǎng)站訪問(wèn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,挖掘出其中有意義的模式和趨勢(shì),已成為學(xué)術(shù)界和工業(yè)界普遍關(guān)注的熱點(diǎn)研究問(wèn)題。用戶在線行為分析作為一種重要的研究手段被廣泛應(yīng)用在互聯(lián)網(wǎng)領(lǐng)域。而R語(yǔ)言作為能夠進(jìn)行交互式數(shù)據(jù)分析和探索的強(qiáng)大平臺(tái),具備一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),在數(shù)據(jù)分析和挖掘領(lǐng)域應(yīng)用廣泛。
因此,本文基于R語(yǔ)言對(duì)視頻網(wǎng)站的用戶在線行為數(shù)據(jù)進(jìn)行分析挖掘。通過(guò)對(duì)采集到的用戶行為數(shù)據(jù)進(jìn)行引流指標(biāo)、粘性指標(biāo)的分析和挖掘,得到網(wǎng)頁(yè)被訪問(wèn)的頻繁度、停留時(shí)間、用戶觀看視頻的喜好等信息。將分析的結(jié)果應(yīng)用到網(wǎng)站運(yùn)營(yíng)與管理中,不僅能夠?yàn)榫W(wǎng)站個(gè)性化服務(wù)、精準(zhǔn)推銷和開發(fā)新型業(yè)務(wù)模式提供技術(shù)和理論支撐,而且能夠把握當(dāng)前網(wǎng)絡(luò)關(guān)注的熱點(diǎn)問(wèn)題,從而正確引導(dǎo)用戶的網(wǎng)絡(luò)輿論方向。
2引流指標(biāo)分析
引流指標(biāo)包括瀏覽量(PV)、訪問(wèn)次數(shù)、訪問(wèn)人數(shù)(UV)、訪問(wèn)時(shí)間、新訪客數(shù)、新訪客比率、IP等內(nèi)容。本節(jié)主要對(duì)PV趨勢(shì)和訪問(wèn)次數(shù)與訪問(wèn)時(shí)間進(jìn)行可視化分析。
2.1瀏覽量
頁(yè)面瀏覽量即為PV(page view),用戶每打開一個(gè)頁(yè)面就記錄一次。PV越多越說(shuō)明該頁(yè)面被瀏覽的越多。PV之于網(wǎng)站,就像收視率之于電視,已成為評(píng)估網(wǎng)站表現(xiàn)的基本尺度。
2.1.1數(shù)據(jù)準(zhǔn)備
截取了某一視頻網(wǎng)站2016.04.11-2016.04.24的日瀏覽量信息。以一個(gè)星期為周期進(jìn)行了統(tǒng)計(jì),并將數(shù)據(jù)分成上周和本周兩組,如表1所示。
從圖2可以看出,同比增長(zhǎng)率曲線和環(huán)比增長(zhǎng)率曲線都基本處于副Y的正半軸且數(shù)值較大,同比最高為周五達(dá)到了13.87%,環(huán)比增長(zhǎng)最高為周六,達(dá)到了31.41%。周一到周五每日訪問(wèn)量都相差不大,但周六周日訪問(wèn)量明顯增長(zhǎng),環(huán)比增長(zhǎng)率均超過(guò)了30%,充分說(shuō)明該視頻網(wǎng)站在采樣周期內(nèi)正健康快速發(fā)展。
2.2訪問(wèn)次數(shù)
訪問(wèn)次數(shù)即Visit,表示某時(shí)間段內(nèi)訪客在網(wǎng)站上進(jìn)行會(huì)話(session)的次數(shù),一次會(huì)話過(guò)程中可瀏覽多個(gè)頁(yè)面。頁(yè)面瀏覽量(PV)是以頁(yè)面角度衡量加載次數(shù)的統(tǒng)計(jì)指標(biāo),而訪問(wèn)次數(shù)(Visit)則是訪客角度衡量訪問(wèn)的分析指標(biāo)。如果網(wǎng)站的用戶黏性足夠好,同一用戶一天中多次登錄網(wǎng)站,那么訪問(wèn)次數(shù)就會(huì)明顯大于訪客數(shù)。
如圖2所示,如果訪客沒有重新打開和刷新網(wǎng)站的網(wǎng)頁(yè),或者訪客關(guān)閉了瀏覽器超過(guò)30分鐘,則當(dāng)訪客下次訪問(wèn)網(wǎng)站時(shí),訪問(wèn)次數(shù)加1。反之,半小時(shí)內(nèi)再次訪問(wèn)則只算同一次訪問(wèn),以上對(duì)訪客的判斷均以Cookie為準(zhǔn)。
2.2.1數(shù)據(jù)準(zhǔn)備
將一周的日訪問(wèn)次數(shù)按照劃分時(shí)間段(零點(diǎn)到兩點(diǎn)為一個(gè)時(shí)間段,以后每?jī)蓚€(gè)小時(shí)計(jì)為一個(gè)時(shí)間段,一天共12個(gè)時(shí)間段)進(jìn)行統(tǒng)計(jì),并算出總計(jì)結(jié)果,如表2所示。
2.2.2數(shù)據(jù)可視化分析
訪問(wèn)時(shí)間與次數(shù)的曲線矩陣圖如圖3所示,分別表示周一到周日的單位時(shí)間段內(nèi)訪問(wèn)人次圖以及全周單位時(shí)間段內(nèi)的總訪問(wèn)人次圖。
從圖3可以看出,該視頻網(wǎng)站從周一到周日以及總計(jì)圖,其曲線走向基本一致,“0~2”、“2~4”、“4~6”這三個(gè)時(shí)間段內(nèi)基本沒人訪問(wèn)網(wǎng)站;“6~8”時(shí)間段內(nèi)網(wǎng)站訪問(wèn)人數(shù)劇增;再之后一直到20:00,每個(gè)時(shí)間段內(nèi)訪問(wèn)人數(shù)有所波動(dòng)但幅度不大,并在“18~20”這個(gè)時(shí)間段內(nèi)達(dá)到一天訪問(wèn)的峰值;在“20~22”與“22~24”這兩個(gè)時(shí)間段內(nèi),訪問(wèn)人數(shù)直線下降。
2.3結(jié)果分析
在眾多的引流指標(biāo)中,選取每日瀏覽量PV和時(shí)間段內(nèi)訪問(wèn)次數(shù)這兩個(gè)指標(biāo),分別從頁(yè)面角度和訪客角度衡量網(wǎng)站加載次數(shù)。從瀏覽量指標(biāo)來(lái)看,每一周比上一周,每一天比前一天瀏覽量都呈上升趨勢(shì),說(shuō)明網(wǎng)站正健康快速發(fā)展。從訪問(wèn)次數(shù)來(lái)看,時(shí)間段內(nèi)訪問(wèn)次數(shù)曲線走向基本一致,表示網(wǎng)站訪客來(lái)源很穩(wěn)定,整個(gè)網(wǎng)站充滿活力。從總體分析結(jié)果來(lái)看,該視頻網(wǎng)站持續(xù)吸引著用戶的關(guān)注。
從圖3可以看出,不同的時(shí)間段,上網(wǎng)的人數(shù)不同,訪問(wèn)該站點(diǎn)的人數(shù)也不同,因此,有時(shí)PV值的漲落,其主要貢獻(xiàn)在于不同時(shí)段上網(wǎng)人數(shù)的自然波動(dòng)。同樣一個(gè)視頻在不同的時(shí)段發(fā)布,PV值就會(huì)有差別。根據(jù)用戶的生活規(guī)律,一天中休息時(shí)間一般集中在午后和晚上,一周的休息時(shí)間只有周六周日,因此周六周日訪問(wèn)次數(shù)明顯增加。即使其他因素不變,由于人們回訪網(wǎng)站的周期性不一樣,也會(huì)對(duì)網(wǎng)站的PV帶來(lái)影響。當(dāng)然,由于不同的人回訪的周期長(zhǎng)短不一、時(shí)段不一,這個(gè)影響因素未必會(huì)導(dǎo)致明顯的波動(dòng),而可能分散在不同時(shí)段的PV表現(xiàn)中。
由此看來(lái),一個(gè)簡(jiǎn)單的PV數(shù)據(jù),其實(shí)是多種因素綜合貢獻(xiàn)的結(jié)果,所以PV的漲落,有時(shí)不是完全可以通過(guò)人為編輯手段來(lái)加以引導(dǎo)和影響的。因此,盲目以PV來(lái)衡量網(wǎng)站的成敗好壞是不合理的,有些看似變化的東西,其相對(duì)關(guān)系其實(shí)沒有改變,只是一種單純的數(shù)量變化。
3粘性指標(biāo)分析
粘性指標(biāo)指網(wǎng)站對(duì)用戶的吸引程度,本節(jié)主要對(duì)分析跳出率、轉(zhuǎn)化率及視頻類型喜好進(jìn)行可視化分析。
3.1轉(zhuǎn)化率
轉(zhuǎn)化率指用戶進(jìn)行了相應(yīng)目標(biāo)行動(dòng)的訪問(wèn)次數(shù)(成交人數(shù))與總訪問(wèn)次數(shù)的比率,即轉(zhuǎn)化率=轉(zhuǎn)化次數(shù)訪問(wèn)次數(shù)。
這里所指相應(yīng)的行動(dòng)可以是用戶登錄、用戶注冊(cè)、用戶訂閱、用戶下載、用戶購(gòu)買等一系列用戶行為,因此網(wǎng)站轉(zhuǎn)化率是一個(gè)廣義的概念。以用戶登錄為例,如果每100次訪問(wèn)中,就有10個(gè)登錄網(wǎng)站,那么此網(wǎng)站的登錄轉(zhuǎn)化率就為10%,而最后有2個(gè)用戶訂閱,則訂閱轉(zhuǎn)化率為2%,有一個(gè)用戶下訂單購(gòu)買,則購(gòu)買轉(zhuǎn)化率為1%。需要注意的是,很多人將網(wǎng)站轉(zhuǎn)化率僅僅定義為注冊(cè)轉(zhuǎn)化率或者訂單轉(zhuǎn)換率,這都是狹義的網(wǎng)站轉(zhuǎn)化率概念。本文將一次用戶下載定義為一次轉(zhuǎn)化,數(shù)值越高說(shuō)明越多的訪問(wèn)完成了網(wǎng)站運(yùn)營(yíng)者希望訪客進(jìn)行的操作。
3.1.1數(shù)據(jù)準(zhǔn)備
根據(jù)網(wǎng)站提供的視頻模塊(電影、公開課、電視劇等),將采集到的數(shù)據(jù)進(jìn)行整合,得到如表3所示的數(shù)據(jù)集。
3.1.2數(shù)據(jù)可視化分析
將整合的數(shù)據(jù)用氣泡圖展示出來(lái),如圖4所示,其中橫軸表示頁(yè)面瀏覽量,縱軸表示平均等待時(shí)間,氣泡大小表示轉(zhuǎn)化率大小,氣泡顏色代表不同的視頻模塊。
從圖4可以看出,電影、綜藝和電視劇占據(jù)轉(zhuǎn)化率排行的前三甲,當(dāng)然,其頁(yè)面瀏覽量和等待時(shí)間也高于其他模塊。從氣泡的位置能反映出等待時(shí)間可能受頁(yè)面瀏覽量的影響,頁(yè)面瀏覽量越高的等待時(shí)間也越長(zhǎng)。氣泡的大小反映轉(zhuǎn)化率可能也受頁(yè)面瀏覽量的影響,頁(yè)面瀏覽量越高的轉(zhuǎn)化率也大。雖然直觀地來(lái)看,似乎轉(zhuǎn)化率與等待時(shí)間也成正相關(guān),但事實(shí)上我們知道這兩者其實(shí)是沒有關(guān)系的。轉(zhuǎn)化率與等待時(shí)間都受頁(yè)面瀏覽量的影響,某一個(gè)模塊的瀏覽量高,說(shuō)明訪客對(duì)這個(gè)模塊興趣度高,轉(zhuǎn)化率也就越高,訪問(wèn)量越大,服務(wù)器和數(shù)據(jù)庫(kù)處理不過(guò)來(lái)自然等待時(shí)間就要長(zhǎng)。但這兩者與頁(yè)面瀏覽量之間的關(guān)系是沒有傳遞性的,也就是說(shuō)轉(zhuǎn)化率與等待時(shí)間之間沒有正相關(guān)關(guān)系,相反的,單從這兩者分析而言,兩者之間可能存在負(fù)相關(guān)關(guān)系。
3.2跳出率
跳出率指只瀏覽了一個(gè)頁(yè)面便離開了網(wǎng)站的訪問(wèn)次數(shù)占總的訪問(wèn)次數(shù)的百分比,即只瀏覽了一個(gè)頁(yè)面的訪問(wèn)次數(shù)/全部的訪問(wèn)次數(shù)總和。
跳出率是非常重要的訪客黏性指標(biāo),它說(shuō)明了訪客對(duì)網(wǎng)站的興趣程度。跳出率越低說(shuō)明粘性指標(biāo)越好,訪客對(duì)網(wǎng)站的內(nèi)容越感興趣,這些訪客就越可能是網(wǎng)站的有效用戶、忠實(shí)用戶。該指標(biāo)也可以衡量網(wǎng)絡(luò)營(yíng)銷的效果,指出有多少訪客被網(wǎng)絡(luò)營(yíng)銷吸引到宣傳產(chǎn)品頁(yè)或網(wǎng)站上之后,又流失掉了。比如,網(wǎng)站在某媒體上做廣告推廣,分析從這個(gè)推廣來(lái)源進(jìn)入的訪客指標(biāo),其跳出率可以反映出選擇這個(gè)媒體是否合適,廣告語(yǔ)的撰寫是否優(yōu)秀,以及網(wǎng)站入口頁(yè)的設(shè)計(jì)是否用戶體驗(yàn)良好。
根據(jù)表3數(shù)據(jù),按照網(wǎng)站提供的“電影”,“公開課”,“電視劇”,“曲藝”,“綜藝”,“電視TV”,“軍事前沿”,“國(guó)際形勢(shì)”,“動(dòng)漫”,“資料片”這10個(gè)模塊,用堆積柱狀圖表示其跳出率,如圖5所示。
從圖5可以看出,公開課和資料片的跳出率相對(duì)較高,說(shuō)明這兩個(gè)模塊跟網(wǎng)站其他模塊相比受關(guān)注度比較低,說(shuō)明用戶對(duì)政治問(wèn)題關(guān)注較低;電影、綜藝等模塊跳出率相對(duì)較小,說(shuō)明用戶對(duì)娛樂(lè)節(jié)目興趣度較高;曲藝、動(dòng)漫、軍事前沿、國(guó)際形勢(shì)等模塊跳出率低說(shuō)明用戶日常生活愛好廣泛,對(duì)社會(huì)關(guān)注度比較高。
3.3視頻類型喜好
視頻類型喜好指用戶對(duì)視頻類型的偏好。通過(guò)對(duì)視頻類型喜好的分析,得出網(wǎng)站推出的視頻類型在用戶群中占據(jù)的比例,能夠?yàn)榫W(wǎng)站優(yōu)化提供依據(jù)。
根據(jù)表3數(shù)據(jù),按照網(wǎng)站提供的“電影”,“公開課”,“電視劇”,“曲藝”,“綜藝”,“電視TV”,“軍事前沿”,“國(guó)際形勢(shì)”,“動(dòng)漫”,“資料片”這10個(gè)模塊,用餅圖展示每個(gè)模塊占據(jù)的訪問(wèn)量百分比.如圖6所示。
從圖6可以看出,電影、綜藝和電視劇占據(jù)了該視頻網(wǎng)站頁(yè)面瀏覽量的大半部份,結(jié)合轉(zhuǎn)化率和跳出率進(jìn)行分析,可以看出,該視頻網(wǎng)站頁(yè)面瀏覽量越高的其跳出率也很低,轉(zhuǎn)化率也高。頁(yè)面瀏覽量低的如資料片、公開課,其跳出率也高,轉(zhuǎn)化率也很低。曲藝、電視TV的頁(yè)面訪問(wèn)量雖然低,但其轉(zhuǎn)化率卻很高,跳出率也低,說(shuō)明來(lái)訪問(wèn)的訪客都是忠實(shí)的喜愛者。
3.4結(jié)果分析
以上主要從轉(zhuǎn)化率、跳出率和視頻類型喜好三個(gè)方面對(duì)網(wǎng)站的粘性指標(biāo)進(jìn)行了可視化分析。在網(wǎng)站分析中需要掌握多少人進(jìn)入了網(wǎng)站、瀏覽了多少頁(yè)面、多少人看了一個(gè)視頻就關(guān)了網(wǎng)頁(yè)、多少人收藏了網(wǎng)站等,作為后續(xù)業(yè)務(wù)調(diào)整的依據(jù)。網(wǎng)站粘性指標(biāo)分析是用數(shù)據(jù)化的方式呈現(xiàn)用戶依賴網(wǎng)站的狀況,在數(shù)據(jù)中能發(fā)現(xiàn)問(wèn)題和機(jī)遇的線索,幫助網(wǎng)站管理者從各維度了解訪客的喜好,從而達(dá)到優(yōu)化網(wǎng)站的目的。
降低跳出率的關(guān)鍵就是要提高用戶體驗(yàn)。提高用戶體驗(yàn)首先就是要有運(yùn)營(yíng)穩(wěn)定的服務(wù)器;然后就是要根據(jù)分析統(tǒng)計(jì)的結(jié)果確定網(wǎng)站自己鮮明的個(gè)性,內(nèi)容要豐富,獨(dú)特,原創(chuàng)性好;再就是要提高網(wǎng)站的交互性,網(wǎng)站首頁(yè)布局要合理,操作應(yīng)簡(jiǎn)單方便,為訪客節(jié)省時(shí)間。最重要的一點(diǎn),就是要做好高質(zhì)量的內(nèi)容,根據(jù)分析的結(jié)果,針對(duì)多數(shù)用戶喜歡的視頻類型和其他粘性指標(biāo)對(duì)網(wǎng)站內(nèi)容質(zhì)量進(jìn)行優(yōu)化。只有高質(zhì)量?jī)?nèi)容,才能激發(fā)用戶瀏覽的興趣,從而能吸引和留住更多的用戶,達(dá)到網(wǎng)站運(yùn)營(yíng)的效果。
4總結(jié)與展望
隨著社會(huì)媒體和大數(shù)據(jù)的興起和廣泛使用,利用數(shù)據(jù)分析驅(qū)動(dòng)網(wǎng)站優(yōu)化是一種最科學(xué)的決策方式。本文基于所采集的用戶訪問(wèn)某視頻網(wǎng)站行為數(shù)據(jù),重點(diǎn)從引流指標(biāo)和粘性指標(biāo)兩個(gè)角度進(jìn)行了分析。通過(guò)分析訪問(wèn)數(shù)據(jù)的數(shù)量和質(zhì)量,掌握視頻網(wǎng)站的訪問(wèn)情況,提出相關(guān)改進(jìn)建議以吸引并留住更多用戶。同時(shí),在掌握用戶的訪問(wèn)習(xí)慣后,就能夠理解為什么經(jīng)常有用戶跳出的問(wèn)題。服務(wù)流程應(yīng)當(dāng)如何改進(jìn)才能符合用戶訪問(wèn)習(xí)慣以及針對(duì)個(gè)體用戶進(jìn)行個(gè)性化服務(wù),從而變革傳統(tǒng)的管理和運(yùn)營(yíng)模式,改被動(dòng)為主動(dòng)提高用戶的體驗(yàn),促進(jìn)網(wǎng)站的發(fā)展。下一步為了提高視頻網(wǎng)站的個(gè)性化服務(wù),可采用數(shù)據(jù)挖掘中頻繁模式挖掘方法確定視頻與視頻之間、用戶與視頻之間關(guān)聯(lián)規(guī)則,從而其推薦其可能感興趣的相關(guān)視頻,提高服務(wù)質(zhì)量,進(jìn)一步增強(qiáng)網(wǎng)站的用戶體驗(yàn)。