黃官偉 王 謐
(同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海 201804)
2020年1月,農(nóng)業(yè)農(nóng)村部、中央網(wǎng)信辦印發(fā)的《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019—2025年)》提出到2025年數(shù)字農(nóng)業(yè)農(nóng)村建設(shè)取得重要進(jìn)展,指出了包括深化電子商務(wù)進(jìn)農(nóng)村綜合示范,實(shí)施“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品出村進(jìn)城工程,推動(dòng)人工智能、大數(shù)據(jù)賦能農(nóng)村實(shí)體店,全面打通農(nóng)產(chǎn)品線上線下營銷通道等要求。根據(jù)艾瑞咨詢?cè)?021年發(fā)布的《中國生鮮電商行業(yè)研究報(bào)告》,2020年我國生鮮零售市場(chǎng)規(guī)模在超5萬億元,其中生鮮電商行業(yè)規(guī)模在2020年達(dá)到4584.9億元,增速為64.0%。由此可見,隨著中央和地方對(duì) “互聯(lián)網(wǎng)+”農(nóng)業(yè)的大力推進(jìn),生鮮電商模式和技術(shù)的不斷成熟,以及用戶對(duì)生鮮類產(chǎn)品線上購買習(xí)慣的逐漸養(yǎng)成,生鮮農(nóng)產(chǎn)品電商將在未來一段時(shí)間內(nèi)擁有廣闊的市場(chǎng)發(fā)展前景。
目前我國生鮮電商行業(yè)從傳統(tǒng)的B2C模式逐漸轉(zhuǎn)向多模式共存的局面,相繼出現(xiàn)了例如O2O、前置倉、店倉一體化等多種新形態(tài),代表性電商包括京東到家、每日優(yōu)鮮、盒馬鮮生等。如今,各類新型生鮮電商在獲得新冠疫情下爆發(fā)式推進(jìn)的同時(shí),也面臨愈發(fā)激烈的競(jìng)爭(zhēng)環(huán)境。隨著生鮮線上市場(chǎng)的不斷打開,如何在加劇的市場(chǎng)競(jìng)爭(zhēng)中贏得用戶的支持與信賴,提高用戶黏性以及滿意度成為重中之重。鑒于此,本文擬通過高頻詞分析、情感分析、LDA主題提取等文本挖掘技術(shù),提取各類新型生鮮電商的在線評(píng)論信息,對(duì)影響各類新型生鮮電商滿意度的因素進(jìn)行對(duì)比分析,并給出改善性建議。
隨著各大平臺(tái)資本在生鮮電商領(lǐng)域的投身熱情不斷高漲,越來越多的學(xué)者也開始對(duì)此展開相關(guān)研究。譚本艷等(2016)總結(jié)了中國生鮮農(nóng)產(chǎn)品電商在發(fā)展中遇到的各類制約因素,提出了結(jié)合中國國情發(fā)揮政府企業(yè)共同作用的對(duì)策。李潔(2018)對(duì)生鮮電商各類盈利模式進(jìn)行對(duì)比,指出了增加品類深度、降低品控成本、優(yōu)化物流體系等優(yōu)化路徑。魯釗陽(2021)對(duì)農(nóng)產(chǎn)品電商問卷調(diào)查數(shù)據(jù)進(jìn)行實(shí)證研究,得出網(wǎng)絡(luò)直播通過降低電商店鋪供求雙方之間的交易成本、提高電商店鋪的轉(zhuǎn)化率以及培育電商店鋪?zhàn)杂衅放频确绞津?qū)動(dòng)生鮮農(nóng)產(chǎn)品電商的發(fā)展。
由此可見,學(xué)者們已經(jīng)在生鮮農(nóng)產(chǎn)品電商領(lǐng)域進(jìn)行了多方面研究,但大量集中在宏觀層面,微觀層面的研究較匱乏,且研究方法上以問卷調(diào)查等傳統(tǒng)方式為主,存在來源滯后及可靠性不足等問題。
互聯(lián)網(wǎng)時(shí)代,消費(fèi)者更加樂于通過在線評(píng)論分享他們的體驗(yàn)和感受,這些評(píng)論也為研究用戶需求和滿意度影響因素提供了海量的信息來源,目前有關(guān)評(píng)論挖掘的研究主要集中在挖掘有關(guān)產(chǎn)品服務(wù)的特征詞和情感傾向分析。
在挖掘文本主題作為顧客滿意度的影響因素時(shí)常用的方法是隱含狄利克雷分布模型。Guo等(2016)通過LDA模型挖掘出顧客對(duì)酒店服務(wù)滿意度的影響因素,挖掘出一些以前所忽略的影響因素。Tirunillai和Tellis(2018)采用LDA模型挖掘出了不同市場(chǎng)中影響顧客滿意度的因素,如手機(jī)市場(chǎng)中的影響產(chǎn)品顧客滿意度的主要是使用便捷性、性能、短信等因素。Jung和Suh(2019)利用韓國某公司評(píng)論網(wǎng)站中的在線評(píng)論,基于LDA模型挖掘了 IT、金融等行業(yè)影響雇員工作滿意度的關(guān)鍵因素,如假期、組織文化、工作時(shí)間等。
文本情感分析的目的,是判斷已給的文本片段中所體現(xiàn)評(píng)論者的情感傾向,通常為積極,消極和中性。情感分析的技術(shù)方法主要有語義詞典方法和機(jī)器學(xué)習(xí)法?;谇楦性~典的文本情感分析方法是指使用知網(wǎng)How Net、Word Net以及臺(tái)灣大學(xué)情感詞典NTUSD等詞典來計(jì)算詞語或者語句的情感值。機(jī)器學(xué)習(xí)法需要大量的訓(xùn)練樣本以建立分類模型,目前情感分析的模型主要有樸素貝葉斯、支持向量機(jī)和最大熵等。
根據(jù)以上學(xué)者的研究可以發(fā)現(xiàn),文本挖掘是近年來的熱門課題,基于在線評(píng)論來研究用戶滿意度開始吸引越來越多的學(xué)者注意,但應(yīng)用在生鮮電商領(lǐng)域上的研究還十分有限。因此本研究將文本挖掘方法結(jié)合到生鮮電商的研究中,豐富關(guān)于生鮮電商用戶行為領(lǐng)域的研究成果。
當(dāng)前我國新型生鮮電商主要可分為4種,分別是與線下商超、零售店和便利店等合作的O2O模式,縮小前移倉庫(配送中心)的前置倉模式,以門店為中心服務(wù)的店倉一體化模式以及以社區(qū)為核心的社區(qū)團(tuán)購模式。其中前三種模式主要服務(wù)周邊3公里內(nèi)的消費(fèi)者,在消費(fèi)者下單后的1小時(shí)內(nèi)快速完成生鮮產(chǎn)品配送,所解決的用戶需求較為一致,具有一定的可比性。而社區(qū)團(tuán)購模式一般為次日達(dá),配送時(shí)效相對(duì)較長,暫不考慮為本研究對(duì)象。因此,本文特選取3種模式的代表性電商品牌京東到家、每日優(yōu)鮮和盒馬生鮮作為案例對(duì)象來進(jìn)行研究。
App Store是蘋果公司于2008年7月份推出的應(yīng)用商店平臺(tái),用戶數(shù)超過10億人,全面收集了用戶對(duì)軟件產(chǎn)品的評(píng)分及反饋,且允許進(jìn)行一定程度的數(shù)據(jù)爬取。本研究通過Python設(shè)計(jì)爬蟲程序從App Store分別采集京東到家、每日生鮮以及盒馬鮮生在2020年8月至2021年9月的用戶評(píng)論,經(jīng)整理后得到所需語料共10972條。為保證數(shù)據(jù)的質(zhì)量,消除由評(píng)論中的重復(fù)文本、表情符號(hào)、短句等噪音干擾,需要通過Python對(duì)采集到的數(shù)據(jù)進(jìn)行預(yù)處理操作。數(shù)據(jù)預(yù)處理操作后,共得到9366條有效評(píng)論。
分別對(duì)3家生鮮電商的詞頻進(jìn)行統(tǒng)計(jì),表1展示了前10位的高頻詞語。
表1 在線評(píng)論詞頻
通過高頻詞可以從一定程度上了解用戶的主要關(guān)注點(diǎn),找出影響滿意度的產(chǎn)品服務(wù)特征在哪里。從表中可以看出,價(jià)格、服務(wù)、配送是3家生鮮電商用戶評(píng)論中共同出現(xiàn)的高頻詞,其中京東到家的用戶最主要關(guān)注的是優(yōu)惠、實(shí)惠等價(jià)格因素,每日優(yōu)鮮的用戶對(duì)生鮮產(chǎn)品本身的新鮮程度最為關(guān)注,配送等服務(wù)則是盒馬鮮生用戶評(píng)價(jià)重點(diǎn)。綜合各家排名前十位的高頻詞可得,消費(fèi)者對(duì)于價(jià)格活動(dòng)、產(chǎn)品質(zhì)量、物流配送、客戶服務(wù)這四個(gè)角度較為重視,是滿意度影響的重要因素。
通過高頻詞統(tǒng)計(jì)可以看出消費(fèi)者比較關(guān)注的一些特征,但是沒有辦法得知到底是哪些因素讓用戶感到滿意,又是哪些因素導(dǎo)致用戶給出差評(píng),因此還需要運(yùn)用情感分析技術(shù)來對(duì)評(píng)論語料進(jìn)行正負(fù)面情感分類,以幫助我們獲取關(guān)于用戶對(duì)3家新型生鮮電商優(yōu)缺點(diǎn)的評(píng)價(jià)信息。本研究選擇基于情感詞典的情感分析方法對(duì)生鮮電商評(píng)論大數(shù)據(jù)進(jìn)行處理,使用知網(wǎng)How Net情感詞表并進(jìn)行擴(kuò)充,把針對(duì)生鮮電商場(chǎng)景出現(xiàn)的“好評(píng)”“差評(píng)”“很快”“超時(shí)”“卸載”等詞分別添加至對(duì)應(yīng)詞表。然后將正負(fù)面詞的初始權(quán)重分別設(shè)為1和-1,載入否定詞表,計(jì)算每條評(píng)論的情感值并賦予正負(fù)面評(píng)論類型。
使用詞云圖可以將文本的詞頻信息可視化,幫助我們直觀地感知評(píng)論特征。使用Python中wordcloud和matplotlib庫中的相關(guān)函數(shù),將情感分類所得正負(fù)面評(píng)論經(jīng)過分詞處理后的數(shù)據(jù)通過詞云圖的方式分別展示出來,以此分析影響產(chǎn)品滿意度的正負(fù)面特征。
從圖1、圖2可知,“優(yōu)惠”“服務(wù)”“很快”是京東到家的用戶好評(píng)中最常出現(xiàn)的特征詞,“客服”“配送”“商家”是差評(píng)中最常出現(xiàn)的特征詞??傮w來看,吸引用戶在京東生鮮電商購物的滿意度因素主要是優(yōu)惠的價(jià)格,持不滿態(tài)度的主要因素來源于客服,物流配送相關(guān)的特征詞在正負(fù)面評(píng)價(jià)詞云圖中均有出現(xiàn),說明用戶對(duì)此的評(píng)價(jià)褒貶不一。
圖1 京東到家好評(píng)詞云圖
圖2 京東到家差評(píng)詞云圖
從圖3可知,水果是每日優(yōu)鮮用戶重要的購買品類,“新鮮”“配送”“價(jià)格”出現(xiàn)的頻次較高,說明生鮮的新鮮程度、配送、價(jià)格是發(fā)起積極評(píng)價(jià)的主要因素。從圖4中可以看出用戶對(duì)每日優(yōu)鮮的負(fù)面評(píng)價(jià)特征詞并不集中,價(jià)格、配送、客服等各類因素均有涉及,但是出現(xiàn)了大量與企業(yè)信任有關(guān)的消極詞,例如欺騙、騷擾、廣告、忽悠等。
圖3 每日優(yōu)鮮好評(píng)詞云圖
圖4 每日優(yōu)鮮差評(píng)詞云圖
圖5中觀察盒馬鮮生用戶的正面詞主要為“新鮮”“送貨”“服務(wù)”等,說明消費(fèi)者的積極情緒主要來源于盒馬鮮生的生鮮品質(zhì)、物流配送和服務(wù)。圖6負(fù)面評(píng)價(jià)中較為明顯的詞有“配送”“客服”,以及京東到家和每日優(yōu)鮮中未出現(xiàn)過的“會(huì)員”和“下載”。
圖5 每日優(yōu)鮮好評(píng)詞云圖
圖6 每日優(yōu)鮮差評(píng)詞云圖
綜上所述,消費(fèi)者對(duì)3家生鮮電商情感類別特征有所差別,但物流配送均同時(shí)出現(xiàn)于正負(fù)面的評(píng)論中,客服均出現(xiàn)于負(fù)面評(píng)論中。這說明各家生鮮電商的物流配送能力均未達(dá)到穩(wěn)定可控的水平,另外電商客服的水準(zhǔn)也需要著重提高。
通過詞頻分析、情感分類以及正負(fù)評(píng)論詞云圖,可以對(duì)影響用戶滿意度的因素有了粗略判斷,接下來將利用情感分類完后的文本進(jìn)行主題聚類,以挖掘評(píng)論背后的主題信息。
主題模型是用來發(fā)現(xiàn)文檔中挖掘抽象主題的統(tǒng)計(jì)模型,其中最具代表性的是Blei等學(xué)者在2003年提出LDA模型概念及思想,得到了廣泛應(yīng)用。它是一種包含詞、主題及文檔的三層貝葉斯概率模型,由于引入了狄利克雷先驗(yàn)知識(shí),不容易出現(xiàn)過擬合現(xiàn)象。因此本研究選擇利用LDA主題模型對(duì)分類后的文本進(jìn)行聚類,得到生鮮電商的特征主題詞。
(1)尋找最優(yōu)主題數(shù)
在對(duì)文本進(jìn)行LDA聚類之前,首先需先確定LDA主題數(shù)量。計(jì)算不同主題數(shù)下的各主題之間平均余弦相似度,繪制主題平均余弦相似度圖形,選擇主題間的平均余弦相似度達(dá)到最低時(shí)的主題數(shù)量。
根據(jù)圖7,最終選定京東到家正面評(píng)論主題數(shù)=2,京東到家負(fù)面評(píng)論主題數(shù)=2,每日優(yōu)鮮正面評(píng)論主題數(shù)=3,每日優(yōu)鮮負(fù)面評(píng)論主題數(shù)=3,盒馬鮮生正面評(píng)論主題數(shù)=2,盒馬鮮生負(fù)面評(píng)論主題數(shù)=3。
圖7 主題平均余弦相似度曲線
(2)文本主題挖掘
使用Python中的gensim模塊分別對(duì)3家生鮮電商的正負(fù)面評(píng)論數(shù)據(jù)構(gòu)建LDA主題模型,生成每個(gè)主題下10個(gè)最有可能出現(xiàn)的特征詞以及相應(yīng)的權(quán)重,結(jié)果如表2所示。
表2 京東到家LDA聚類結(jié)果
根據(jù)京東到家的正面評(píng)論主題聚類結(jié)果來看,主題一模型中“喜歡”“優(yōu)惠”“值得”等詞權(quán)重較高,說明物美價(jià)廉的商品價(jià)格是用戶產(chǎn)生滿意的因素。主題二模型中“贊”“速度”“很快”等高頻詞體現(xiàn)了用戶對(duì)配送速度快的認(rèn)可。
根據(jù)京東到家的負(fù)面評(píng)論主題聚類結(jié)果來看,主題一模型中權(quán)重較高的“客服”“打電話”“配送”說明當(dāng)配送問題出現(xiàn)時(shí)客服的解決方案并未使用戶感到滿意,甚至產(chǎn)生不悅。主題二模型中“客服”“下單”“商家”等高頻詞體現(xiàn)了用戶對(duì)涉及到商家相關(guān)的客服的不滿。
表3 每日優(yōu)鮮LDA聚類結(jié)果
根據(jù)每日優(yōu)鮮的正面評(píng)論主題聚類結(jié)果來看,主題一模型中“喜歡”“速度”“滿意”等詞權(quán)重較高,說明配送速度是用戶發(fā)表好評(píng)的因素。主題二模型中“新鮮”“買菜”“疫情”等高頻詞體現(xiàn)了疫情期間仍支持給用戶配送新鮮菜品是獲得用戶支持的原因。主題三模型中“水果”“不錯(cuò)”“值得”等高頻詞說明用戶對(duì)水果品類性價(jià)比的認(rèn)可。
根據(jù)每日優(yōu)鮮的負(fù)面評(píng)論主題聚類結(jié)果來看,主題一模型中權(quán)重較高的“貴”“短信”“優(yōu)惠券”說明每日優(yōu)鮮在價(jià)格活動(dòng)的營銷手段上出現(xiàn)問題,使用戶產(chǎn)生不滿情緒。主題二模型中“高”“客服”“欺騙”“價(jià)格”等高頻詞說明客服并未在用戶產(chǎn)生不滿時(shí)發(fā)揮安撫作用。主題三模型中“垃圾”“配送”等詞的權(quán)重較高,將影響用戶滿意度的因素指向配送服務(wù)。
表4 盒馬鮮生LDA聚類結(jié)果
根據(jù)盒馬鮮生的正面評(píng)論主題聚類結(jié)果來看,主題一模型中“東西”“送貨”“喜歡”“質(zhì)量”等詞說明盒馬鮮生整體的商品品質(zhì)較高,用戶對(duì)此感到滿意。主題二模型中“新鮮”“配送”“準(zhǔn)時(shí)”等高頻詞體現(xiàn)了用戶認(rèn)同盒馬配送及時(shí),食材新鮮度獲得保證。
根據(jù)盒馬鮮生的負(fù)面評(píng)論主題聚類結(jié)果來看,主題一模型中權(quán)重較高的“東西”“退款”“體驗(yàn)”說明盒馬鮮生的商品退款鏈路不夠暢通,使用戶有不好的體驗(yàn)。主題二模型中“客服”“慢”“解決”等高頻詞說明客服并未在用戶產(chǎn)生不滿時(shí)發(fā)揮安撫作用。主題三模型中“垃圾”“配送”“超時(shí)”等詞的權(quán)重較高,說明用戶的部分不滿情緒來源于配送超時(shí)問題。
綜合上述結(jié)論,將各類主題與特征詞關(guān)聯(lián)關(guān)系匯總,得出影響新型生鮮電商用戶滿意度的核心因素,如表5所示。
表5 生鮮電商用戶滿意度影響因素
本研究通過運(yùn)用高頻詞分析、情感分析、LDA主題模型等方法對(duì)新型生鮮電商的在線評(píng)論進(jìn)行文本挖掘,研究影響生鮮電商用戶滿意度的具體因素并進(jìn)行比較分析。研究發(fā)現(xiàn),影響滿意度的因素最主要有生鮮產(chǎn)品情況、物流配送水平以及平臺(tái)功能服務(wù)三個(gè)方面,其中生鮮產(chǎn)品情況包括了產(chǎn)品的價(jià)格和品質(zhì),物流配送水平包括配送速度和與配送的服務(wù)態(tài)度,平臺(tái)服務(wù)功能包含退款流程度、客服溝通以及營銷活動(dòng),說明企業(yè)對(duì)這些維度應(yīng)該著重關(guān)注和改善。根據(jù)三家生鮮電商的分析結(jié)果,京東到家主要以實(shí)惠的商品價(jià)格和配送服務(wù)態(tài)度上打動(dòng)消費(fèi)者;每日優(yōu)鮮則是通過商品整體情況得到用戶喜愛,但平臺(tái)盒部分營銷活動(dòng)使用戶產(chǎn)生不滿情緒;盒馬鮮生則是以高品質(zhì)贏得消費(fèi)者,但用戶退款過程的順暢度還需提高。綜合分析三家電商的滿意度情況,可以發(fā)現(xiàn)物流配送的速度以及平臺(tái)客服質(zhì)量是需要重點(diǎn)改進(jìn)的因素。根據(jù)以上的分析結(jié)果,本文針對(duì)新型生鮮電商用戶滿意度的提高提出以下幾點(diǎn)建議:
生鮮產(chǎn)品質(zhì)量和配送速度是用戶對(duì)生鮮網(wǎng)購消費(fèi)最直觀的感受,是用戶最基本的需求,也是生鮮電商企業(yè)安身立命的必要條件。隨著生活條件水平的提高,人們對(duì)生鮮產(chǎn)品的要求逐漸從溫飽轉(zhuǎn)向口感、營養(yǎng)等,因此企業(yè)必須加強(qiáng)對(duì)生鮮農(nóng)產(chǎn)品的質(zhì)量把控,做到供應(yīng)鏈全流程的產(chǎn)品質(zhì)量監(jiān)控,并且提高“最后一公里”的配送能力,使消費(fèi)者能夠及時(shí)收到完好無損的商品。
在保證產(chǎn)品總體質(zhì)量的前提下,可通過垂直品類打造平臺(tái)的獨(dú)特性,例如研究發(fā)現(xiàn)每日優(yōu)鮮主要以水果被消費(fèi)者熟知。人們可能因?yàn)閷?duì)某類產(chǎn)品的偏好,而產(chǎn)生對(duì)品牌的認(rèn)同和信賴。各生鮮電商可以根據(jù)新時(shí)代壞境下的消費(fèi)者的消費(fèi)偏好趨勢(shì),在產(chǎn)品品類上進(jìn)行優(yōu)化,提高自身品牌的獨(dú)特性優(yōu)勢(shì)。
生鮮電商平臺(tái)功能在搭建時(shí)是否全鏈路閉環(huán),用戶在使用時(shí)操作是否簡(jiǎn)單易懂都會(huì)影響到用戶的使用體驗(yàn),從而影響消費(fèi)過程的整體滿意度。特別是涉及到用戶退款等已影響到用戶情緒的操作,必須搭建一個(gè)更完善的環(huán)路機(jī)制。補(bǔ)救性的服務(wù)若處理妥當(dāng),反而可以起到贏得用戶的信任與喜愛。
例如快遞小哥、客服等與用戶接觸在第一線的服務(wù)人員,是影響用戶評(píng)判生鮮電商服務(wù)水平的重要因素,服務(wù)人員的專業(yè)水準(zhǔn)可以看出企業(yè)對(duì)用戶的重視度。因此,對(duì)企業(yè)來說,完善服務(wù)人員培訓(xùn)機(jī)制,建立用戶服務(wù)標(biāo)準(zhǔn)化體系,從而提高服務(wù)人員的整體素質(zhì),不僅能樹立企業(yè)的優(yōu)質(zhì)形象,還能讓消費(fèi)者感受到企業(yè)對(duì)用戶的體驗(yàn)關(guān)懷,提升滿意度。