馬林燁,閆強,張笑妍,曹和銳
(1.北京郵電大學 經濟管理學院,北京 100876;2.北京郵電大學 現代郵政學院,北京 100876;3.中國移動政企客戶分公司,北京 100032)
直播購物是一種基于電子社交商務的新型購物渠道,它利用直播的特點培養(yǎng)了一種交互式、信息化和沉浸式的在線購物體驗[1]。通過提供主播和觀眾之間前所未有的實時互動,直播購物有效地縮短了感知距離,解決了信息不透明的問題,徹底改變了傳統(tǒng)的電子商務商業(yè)模式,特別是實現了主播和觀眾的雙向實時互動。2021年“雙十一”期間,直播電商的商品交易總額達到1 318.6億元,比2020“雙十一”期間的729億元增長了80.9%[2]。由于直播購物帶來的巨大收益,大量網絡銷售商和在線供應商都在嘗試直播購物。直播購物成為全球企業(yè)的主流營銷渠道,在學術界也廣受關注。
目前,關于直播購物的研究主要關注觀眾的動機[3-4]、心理機制[5-6]以及主播的信息源特征[7-8]如何影響消費者的購買意愿和參與行為。研究方法主要基于問卷調查的實證研究,較少關注真實的直播內容(如字幕)所傳達的信息,而且缺少評價直播內容質量的標準。一般來說,長期占據銷售榜前十名的直播間為優(yōu)質帶貨直播間,其內容特征可以作為行業(yè)標準。鑒于此,筆者試圖探究優(yōu)質帶貨直播的內容特征及其分布規(guī)律。
作為一種新型的電子商務模式,直播購物近年來受到廣泛關注。直播內容作為直播主要的組成部分具有重要的信息價值。目前,關于直播內容的研究中的關鍵特征變量主要基于文獻研究獲得,數據主要來自問卷,較少關注字幕這一非結構化數據中所傳達的內容信息。
目前,關于直播內容的研究主要關注直播的交互性。Xue等[9]從個性化、響應性、娛樂性、互動性和控制感五個方面研究實時互動對社交商務參與的影響。Kang等[10]利用交互性的響應性和個性化分別代表交互的強度和豐富程度來研究直播購物互動的動態(tài)影響。范小軍等[11]將同步性、響應性、去中心性以及互動頻率作為移動視頻直播互動性的四個維度。除了交互性,與傳統(tǒng)電子商務相比,直播購物還有一些其他的優(yōu)勢特征。Zhang等[12]從可信度、有用性和生動性三方面研究直播信息質量。Ma等[13]認為,直播購物可以使消費者直觀地看到商品,且主播關于商品的講解也更專業(yè)。這些研究提出了很多關于直播內容特征的變量,但是哪些是優(yōu)質帶貨直播的核心變量并不明確,而且這些變量的定義大部分借鑒于其他背景,有可能并不貼合直播購物這一情境。為了彌補這一不足,筆者對字幕文本進行文本挖掘,擬探究優(yōu)質帶貨直播具有哪些內容特征,并給出這些特征變量的規(guī)范定義,然后利用統(tǒng)計分析得出優(yōu)質直播內容特征分布的一般規(guī)律。
首先,錄制直播視頻獲得原始數據,生成并導出字幕文本。其次,對數據進行預處理,利用LDA模型提取主題。最后,通過訓練機器學習算法預測主題概率。研究思路和技術路線如圖1所示。
圖1 技術路線圖
第一,使用錄屏軟件錄制抖音優(yōu)質帶貨直播的視頻,生成字幕,校準后導出帶有時間戳的字幕文本。
第二,對數據進行預處理,包括清洗、中文分詞和去停用詞,最后生成高頻詞的詞云圖。
第三,實用LDA模型進行主題提取。目前,主要的主題分析模型有TextRank、TF-ID和LDA。主題提取可以分為:①確定主題數量;②利用LDA模型提取主題;③結合相關文獻,將提取出的主題整合為與直播內容特征相關的關鍵變量。
第四,通過訓練機器學習算法預測主題概率:①取樣,包括取樣作為訓練集,人工標注和重新取樣(因為標注數據集的分類結果不均衡);②選擇在預測集上表現最好的XGBoost作為分類器;③利用訓練好的模型預測主題概率并進行結果分析。
筆者在抖音上選取了兩個長期占據銷售榜前十名的直播商,于2021年12月錄制了229件商品的直播視頻,視頻總時長19.75小時,單個視頻時長32秒~820秒,商品價格為9.9元~3 999元。其中,主播一直播間的商品68件,主播二直播間的商品76件,主播二衍生的新直播間的商品85件。這229件商品按類別分為搜索品91件和體驗品138件。具體來說有服裝77件、化妝品68件、配飾27件、日用品33件、食品19件、數碼電子5件。
若采用訊飛開放平臺、騰訊云等普通的音頻轉文字工具,需要先將視頻轉為音頻,然后再轉為文本,過程復雜、耗時、校準麻煩。而抖音專屬的視頻剪輯軟件剪映可以直接利用視頻生成帶有時間戳的字幕,準確率高,而且字幕與畫面同步方便校準。因此,筆者選用剪映生成并導出字幕文本,最終共獲得36 899條字幕。
數據預處理主要包括數據清洗、文本分詞、去停用詞。
1.數據清洗
之前進行主題分析的文本主要是在線評論、新聞稿等現成的文段。由于字幕來自主播的推銷詞,存在大量的語氣詞、縮略詞、語序混亂、頻繁重復等問題,容易導致挖掘結果偏差,在數據正式處理前需首先進行數據清洗,去口語化。
2.文本分詞
由于LDA模型是基于詞向量進行計算,正式分析前需要對數據進行文本分詞,即將句子中的漢字按照序列切成一個個單獨的中文詞語。使用Python中的Jieba程序包進行中文文本分詞。Jieba分詞有三種不同的分詞模式:精確模式是最常用的分詞方法;全模式會將句子中所有可能的詞都列舉出來;搜索引擎模式則適用于搜索引擎使用。筆者選用精準模式對字幕文本進行分詞。由于直播購物特定的背景,主播介紹商品時會出現品牌、別名等一些專有名詞,筆者自定義了分詞詞典,詞典包含清瑩露、自留款等4 294個名詞。
3.去停用詞
分詞后發(fā)現很多對文本分析結果解讀沒有幫助的高頻詞,因此需要去停用詞。目前,常見的通用停用詞詞典包括哈工大停用詞表、百度停用詞表、四川大學人工智能實驗室停用詞庫。筆者采用哈工大停用詞詞典,并在此基礎上將那些對結果解讀幫助較小的無用高頻詞加入停用詞詞典,構建了自定義停用詞詞典[14]。自定義停用詞詞典含有1 512個詞。
數據預處理后,字幕文本變成易于解讀的詞組,如表1所示。詞頻排在前100位的詞組的詞云圖如圖2所示,以詞組字體大小表示詞組的頻率,詞組字體越大,出現頻率越高。由圖2可見:直播中主播與觀眾頻繁的互動,如“朋友們”“大家”“看一下”“你們”等;有大量與商品相關的信息,如“價格”“好看”“滋潤款”;而且主播在積極組織觀眾參與活動,如“關注”“燈牌”“刷起來”等。
表1 數據預處理前后效果對比圖
圖2 前100位的詞頻詞云圖
由于LDA模型既可以不經過訓練直接進行文檔的主題提取,也可以利用已經訓練好的LDA模型對一些與訓練集語料庫相關的文檔進行主題預測[14],選用LDA模型進行主題提取,并使用Python中gensim庫提供的LDA模型實現。
1.主題數確定
主題數是LDA模型中最重要的參數之一,主題數的設置直接關系到主題提取的效果和結果的解讀。筆者使用一致性這一Python自帶的評價方法進行LDA模型最優(yōu)主題數的選擇。一致性代表LDA 提取的主題之間詞語語義的關聯程度。當前,常用的計算方法有UCI、UMass、NPMI、C_V等,本研究采用C_V。 不同主題數的模型一致性得分結果如圖3所示。由圖3可知,當主題數值為17時,一致性得分最高,這意味著此時抽取到的主題分布最可靠,因此將模型的主題數定為17。
圖3 不同主題數的模型一致性得分
2.主題提取
進行主題提取,得到17個主題的主要特征值模型,表示為特征詞的加權求和,具體如表2所示。參考關于直播內容特征的相關研究,將17個主題概括為6個與直播內容特征相關的關鍵變量:響應性、個性化、可視化、專業(yè)性、可靠性和娛樂性,對應關系如表3所示。
表2 17個主題的主要特征值(按重要性依次排列)
表3 抽取主題與直播內容特征相關變量的對應關系
參考之前的文獻,結合提取的主題模型,筆者對這6個內容特征進行了定義,如表4所示。研究發(fā)現,響應性、個性化、可視化、專業(yè)性、可靠性和娛樂性會影響直播效果。根據社會傳染理論[1]328,高響應性制造的緊張氛圍會引發(fā)從眾效應,促使觀眾沖動消費。由于信息過載,直播商務注重個性化,產生與觀眾需求相匹配的個性化推薦,會降低觀眾的信息處理成本,提高決策的效率和質量。觀眾發(fā)現主播的推薦與自己的需求相匹配,會產生社會認同,縮短心理距離[9]20??梢暬瘯峁┮环N身臨其境之感,增強社會臨場感,縮短心理距離[13]10。直播間的商品鏈接僅在直播過程中有效,且關于商品的評論、口碑信息較少,會增加消費者的感知風險,但是主播專業(yè)的講解和對商品品質的承諾會提高消費者信任[15],減少感知風險?;谟脩魠⑴c理論[9]8,用戶參與活動會完全沉浸其中,并激發(fā)心流體驗,因此,主播組織的線上活動會激發(fā)觀眾的聯系感和親近感,誘發(fā)其歸屬感和溫暖感,使其獲得愉悅感[15]4。
表4 關于內容特征的規(guī)范定義
句子是觀點抽取的最小單位。在確定6個關鍵的直播內容特征后,利用機器學習算法預測句子級主題,然后通過取平均值計算產品級主題概率。
1.取樣
利用分層抽樣隨機抽取2 000條字幕進行人工標注用于評估分類器的預測效果。每句字幕按主題標注為響應性、個性化、可視化、專業(yè)性、可靠性和娛樂性。將過短或者語義模糊的句子標為“噪音”。首先,邀請兩位電子商務專業(yè)的學生對句子進行人工審核,并協商統(tǒng)一不一致的結果。然后,利用同樣方法對分詞結果進行人工標注。由于預測模型的輸入為分詞結果,通過微調停用詞表使分詞標注的結果與句子標注的結果盡量接近,這樣才能保證預測的主題概率為句子的主題概率。人工標注示例如表5所示。
表5 人工標注示例
標注結果顯示,在2 000個樣本中有1 753個句子(87.65%)與主題類別有關。其中,各類別分別占比為:響應性544個(27.2%)、個性化300個(15%)、可視化144個(7.2%)、專業(yè)性629個(31.45%)、可靠性69個(3.45%)和娛樂性67個(3.35%),可見標注數據集的分類結果不均衡。為了解決這一問題對分類器的影響,將標注數據集進行重新采樣,使7類主題所占比例相同,共得到4 403個句子及其分詞結果。利用隨機數對采樣后的數據重新排序,獲得新的采樣數據。
2.分類器選擇
不同的分類器在不同的模型預測上表現不同。通過比較多種分類方法在標注數據集上的分類表現來選擇合適的分類器。預測句子主題概率常用的機器學習分類方法主要有支持向量機(SVM)、極端梯度提升(XGBoost)、隨機森林。筆者采用提取詞匯特征(詞向量)生成句特征(句向量)再分類的方法預測主題;先使用自然語言處理領域中常用的詞嵌入方法Word2Vec將詞轉換成高維詞向量(100維、200維、300維、400維和500維);再對每個句子的詞向量之和求均值得出句向量;最后利用分類器預測句子主題概率,以概率最高的主題為預測主題。
筆者采用常用的F1-score指標衡量分類器的表現。對于4 403個句子的采樣數據,選取其中4 000個句子,通過五折交叉驗證得到訓練集和驗證集的平均F1-score值,剩余403個句子作為測試集并計算其F1-score值。三類分類器的參數設定如表6至表8所示,三類分類器的表現結果如表9所示。由表9可見,XGBoost在測試集上表現最好,因此選用XGBoost作為分類器。
表6 SVM設定參數
表7 隨機森林設定參數
表8 XGBoost設定參數
表9 三類分類器F1-score指標
3.主題概率預測
首先,利用訓練好的XGBoost模型預測句子級字幕的主題概率;然后,利用句子級主題概率的均值計算產品級直播內容的主題概率。全部產品直播內容主題的整體分布如圖4所示。由圖4可知,在直播購物中,主播對商品屬性和性能的相關介紹(專業(yè)性和可靠性)并不多,只占直播的30.5%,而主播花了大量時間與觀眾互動。由此可見,除了實用價值,直播商務還為觀眾提供了大量的社交價值和娛樂價值[15]3。
圖4 全部產品直播內容的主題整體分布
利用獨立樣本進行T檢驗比較主播二直播間和其衍生的新直播間的商品介紹時長,結果如表10所示。由表10可見,主播二直播間的商品介紹時長顯著長于主播二衍生的新直播間(t=2.283,p=0.024<0.05)。原因可能是,新直播間的粉絲較少,觀眾的購買力有限。當達到觀眾的最大購買力后主播再進行商品介紹,產生的邊際效應將減少,導致新直播間的商品介紹時間較短。
表10 主播二直播間和其衍生的新直播間的商品介紹時長的獨立樣本T檢驗結果
主播二直播間和主播二衍生的新直播間的直播內容特征概率分布如圖5所示。然后利用獨立樣本T檢驗比較主播二直播間和其衍生的新直播間的內容特征概率分布,結果如表11所示。由表11可見,主播二直播間的響應性顯著低于主播二衍生的新直播間(t=-2.809,p=0.006<0.01),兩個直播間在其他直播內容特征并無顯著差異。這是因為,響應性會降低新直播間的感知風險[9]16,而且主播營造的緊張氛圍與沖動購買意愿正相關[16],有助于提高直播效果。雖然是同一批主播在直播,但是由于新的直播間的粉絲較少,主播更在乎營造銷售氛圍,會更快速地響應觀眾的需求。
圖5 成熟直播間與新直播間的直播內容特征概率分布對比圖
表11 主播二直播間和其衍生的新直播間的直播內容特征概率分布的獨立樣本T檢驗結果
利用獨立樣本T檢驗比較體驗品和搜索品的介紹時長,結果如表12所示。由表12可見,體驗品的介紹時長顯著高于搜索品(t=2.983,p=0.003<0.01)。原因可能是,在直播購物中消費者不僅可以直觀地看到商品的試用效果,并且可以與主播實時溝通,這減少了傳統(tǒng)電子商務因時空分離帶來的感知不確定性[17],降低了評估體驗品的難度,有助于體驗品的在線銷售。因此,在直播時,主播會適當延長體驗品的介紹時長。
表12 體驗品和搜索品的介紹時長的獨立樣本T檢驗結果
體驗品和搜索品在不同直播內容上的分布如圖6所示。然后利用獨立樣本T檢驗比較體驗品和搜索品的內容特征概率分布,結果如表13所示。結果顯示,體驗品在專業(yè)性(t=4.745,p=0.000<0.001)和娛樂性(t=5.584,p=0.000<0.001)上顯著高于搜索品。這是因為,體驗品的主要特征是主觀的[18],觀眾購買決策依靠主播的試用體驗來決定,良好的體驗會觸發(fā)消費者的認同機制,提高消費者的購買意愿[19]。因此,主播會適當多介紹商品的專業(yè)性和娛樂性。
圖6 體驗品與搜索品內容特征概率分布對比圖
表13 體驗品和搜索品的直播內容特征概率分布的獨立樣本T檢驗結果
由表13可見,搜索品在可視化(t=3.53,p=0.001<0.01)方面顯著高于體驗品,原因可能是搜索品的商品屬性是客觀的、穩(wěn)定的[18]1,需觸發(fā)消費者的內化機制提高其購買意愿[19]5。只有真正需要商品的消費者會去購買。若無購買需求消費者一般不會因主播更頻繁的互動而沖動消費,而且消費者可以根據傳統(tǒng)電商平臺上以往顧客的購買體驗評估商品[19]5,主播無需過多介紹其商品屬性。有經驗的主播應將更多時間用來全方位展示搜索品來吸引有需求的觀眾。
各類產品在不同直播內容上的分布如圖7所示。由圖7(a)可見,服裝和化妝品的時長高于其他商品。利用獨立樣本T檢驗進一步證實,結果如表14所示。結果顯示,化妝品和服裝的介紹時長無顯著差異,但顯著高于配飾(t=2.809,p=0.006<0.01)、日用品(t=3.229,p=0.002<0.01)和食品(t=2.033,p=0.045<0.05),這一結論正好印證了服裝和化妝品在直播購物中具有明顯優(yōu)勢[2]。下面重點分析服裝和化妝品的直播內容特征概率分布。
圖7 各類商品的直播內容特征分布
表14 部分商品介紹時長的獨立樣本T檢驗結果
利用獨立樣本T檢驗比較部分商品專業(yè)性概率分布,結果如表15所示。結果顯示,在專業(yè)性方面,服裝和化妝品無顯著性差異,但是顯著高于配飾(t=2.301,p=0.023<0.05)、日用品(t=4.608,p=0.000<0.001)、食品(t=2.736,p=0.012<0.01)和數碼電子產品(t=4.278,p=0.000<0.001)。然后利用獨立樣本T檢驗比較各類商品可靠性概率分布,結果見表16。在可靠性方面,化妝品與服裝、日用品和數碼電子產品無顯著差異,但是卻顯著高于配飾(t=4.527,p=0.000<0.001)和食品(t=3.215,p=0.002<0.01)。 服裝和化妝品在專業(yè)性、可靠性方面表現較好。原因在于,服裝和化妝品為體驗品的代表,觀眾非常在意主播的試用體驗,而且直播購物這一新興的銷售模式缺少一定的用戶基礎。為了降低感知風險[9]16,有經驗的主播在直播時會花費較多時間介紹商品的屬性特征并一再強調商品保質保真以提高消費者的參與意愿。
表15 部分商品專業(yè)性概率分布獨立樣本T檢驗結果
表16 部分商品可靠性概率分布獨立樣本T檢驗結果
利用獨立樣本T檢驗比較部分商品娛樂性概率分布,結果如表17所示。結果顯示,在娛樂性方面,服裝與配飾無顯著差異,卻顯著高于化妝品(t=2.205,p=0.029),日用品(t=6.628,p=0.000<0.001)、食品(t=6.114,p=0.000<0.001)和數碼電子產品(t=6.616,p=0.000<0.001)。另外,服裝在娛樂性方面表現也不錯,可能是因為相較于其他商品,服裝對品牌的依賴度低,消費者更看重服裝的上身效果和個人體驗。為了提高商品的感知有用性[9]20,有經驗的主播在介紹服裝時會更賣力地與觀眾互動以調動觀眾的情緒,由此影響消費者的判斷[20],甚至影響消費者的決策行為[21]。
表17 部分商品娛樂性概率分布獨立樣本T檢驗結果
利用獨立樣本T檢驗比較部分商品個性化概率分布,結果如表18所示。結果顯示,在個性化方面,配飾與服裝、日用品、食品、數碼電子產品無顯著差異,但顯著高于化妝品(t=5.266,p=0.000<0.001)?;瘖y品在個性化方面表現較弱,可能是因為化妝品的品牌和口碑很重要,消費者追求高端和品質,互動性與消費者參與呈曲線關系[10]11。若主播過度拉進與消費者的心理距離,會讓消費者感覺商品廉價,因此,有經驗的主播會適當減少個性化互動。
表18 部分商品個性化概率分布獨立樣本T檢驗結果
續(xù) 表
相較于傳統(tǒng)電子商務,在直播購物中主播利用直播視頻介紹商品,傳達了更豐富的信息。目前關于直播購物的研究主要關注消費者行為、主播信息源特征,卻很少關注字幕傳達的內容信息,而且缺少評價直播內容質量的標準。因此,對于優(yōu)質直播有哪些主要內容特征,以及這些特征是如何分布是一個值得關注的問題。鑒于此,筆者利用文本挖掘分析字幕文本,得出以下結論:第一,通過主題提取發(fā)現直播內容具有響應性、個性化、可視化、專業(yè)性、可靠性和娛樂性這六大特征;第二,直播購物具有實用價值、娛樂價值和社交價值;第三,相較于成熟的直播間,新直播間的商品介紹時長較短,而且為了降低感知風險,響應性時間較長;第四,由于直播購物的實時交互性,減少了傳統(tǒng)電子商務時空分離帶來的感知不確定性,降低了評估體驗品的難度,有助于體驗品的在線銷售。因此,體驗品的介紹時長高于搜索品,其專業(yè)性和娛樂性帶來的良好購物體驗會觸發(fā)消費者的認同機制來提高消費者的購買意愿。搜索品通過觸發(fā)消費者的內化機制提高購買意愿,只有真正需要商品的消費者才會購買。因此,體驗品在專業(yè)性、娛樂性上高于搜索品,在可視化上低于搜索品,并進一步發(fā)現服裝和化妝品具有類似特征。
本研究豐富了關注直播內容特征的研究,具體如下:第一,之前關于直播購物的研究主要關注消費者動機和心理以及主播信息源特征,較少關注字幕中隱藏的內容信息對直播效果的影響,本研究豐富了這一研究;第二,相較于單純通過文獻研究獲取自變量,筆者結合文獻研究與文本挖掘,發(fā)現直播內容特征的幾個關鍵變量并進行了重新定義,為之后關于直播內容的研究提供理論基礎;第三,揭示了不同成熟度的直播間和不同類型的商品在直播內容概率分布上的差異,并利用前人研究成果給出了合理解釋,既支撐了前人的研究,又豐富了關于直播影響效果的研究。
本文的研究結論對指導新主播入門和優(yōu)化平臺直播流程具有一定的管理意義:首先,發(fā)現了直播內容質量的關鍵指標,并給出不同類別直播內容分布的規(guī)律;其次,提供的優(yōu)質直播內容特征分布概率可以作為行業(yè)標準,指導新主播入門;最后,平臺可以動態(tài)跟蹤直播內容。當直播內容失衡時及時提醒主播,可以防止直播過程因為主播失誤而失控。
第一,本研究的主要目的是探究優(yōu)質購物直播的內容特征,而非優(yōu)化模型,因此,研究基于原始的LDA模型展開。第二,本研究主要關注字幕文本包含的內容信息,而具體特征變量如何影響消費者行為還需要更多消費者行為數據進行實證研究。第三,字幕中除了主題信息還有情感信息,未來可以把對直播內容的情感分析納入研究范疇。