郭艷艷,任瑩瑩,原白云 GUO Yanyan, REN Yingying, YUAN Baiyun
(河南理工大學(xué) 工商管理學(xué)院能源經(jīng)濟(jì)研究中心,河南 焦作454000)
(Research Center for Energy Economics, School of Business Administration, Henan Polytechnic University, Jiaozuo 454000, China)
隨著互聯(lián)網(wǎng)技術(shù)的不斷提升,電商行業(yè)和社會化媒體的快速發(fā)展,消費(fèi)者獲得所需物品的方式發(fā)生改變,網(wǎng)絡(luò)購物已經(jīng)成為一種新的購物方式。電商平臺為商家與消費(fèi)者提供了溝通的橋梁,在線顧客評論中更是包含了消費(fèi)者對電商企業(yè)、商品質(zhì)量、物流服務(wù)等因素的購物體驗(yàn)信息。在線顧客評論是指交易完成后消費(fèi)者對購買產(chǎn)品進(jìn)行的即時(shí)反饋評價(jià),能夠直接反映出消費(fèi)者對此次交易產(chǎn)品、服務(wù)質(zhì)量等因素的滿意情況。在線顧客評論不僅為其他消費(fèi)者的購買決策提供重要參考意見,也為企業(yè)及時(shí)挖掘消費(fèi)者的需求信息,提升顧客滿意度,增加企業(yè)競爭力提供決策依據(jù)[1]。經(jīng)研究表明,在線顧客評論中的負(fù)面評論對消費(fèi)者行為影響更突出、參考價(jià)值更大[2]。根據(jù)電商行業(yè)發(fā)展特點(diǎn)可知,高質(zhì)量的物流服務(wù)對消費(fèi)者購買決策產(chǎn)生極大影響,提升物流服務(wù)質(zhì)量已經(jīng)成為電商企業(yè)競爭制勝的關(guān)鍵[3]。利用大數(shù)據(jù)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等信息技術(shù),從海量冗雜的評論數(shù)據(jù)中提取得到物流服務(wù)的關(guān)鍵信息,并加以有效利用是本文的研究方向。
本文利用文本挖掘的相關(guān)方法對京東(簡稱JD) 電商平臺在線顧客評論數(shù)據(jù)中的中差評物流信息進(jìn)行分析研究,從中發(fā)掘出物流環(huán)節(jié)的突出問題,分析影響顧客滿意的JD 電商物流服務(wù)質(zhì)量的問題,并提出改進(jìn)物流服務(wù)的意見。
物流服務(wù)質(zhì)量是消費(fèi)者將感受到的物流服務(wù)與預(yù)期的物流服務(wù)進(jìn)行對比評價(jià)的結(jié)果,是用來衡量物流企業(yè)滿足消費(fèi)者物流服務(wù)需求能力水平的評價(jià)尺度[4]。
有關(guān)電子商務(wù)背景下的物流服務(wù)質(zhì)量是近年來學(xué)者們研究的熱點(diǎn)。謝廣營等[5](2016) 基于SERQUAL(Service Quality)量表和LSQ(Logistics Service Quality) 量表的基礎(chǔ)上,構(gòu)建了網(wǎng)購物流服務(wù)質(zhì)量量表,并進(jìn)行實(shí)證研究得到人員溝通質(zhì)量、訂單質(zhì)量、配送可靠性、配送信息質(zhì)量、訂貨便利性、貨物質(zhì)量、退貨質(zhì)量等7 個(gè)維度。權(quán)春妮等[6](2018) 以跨境網(wǎng)購為背景,以消費(fèi)者感知為視角,從跨境物流服務(wù)質(zhì)量的時(shí)效性、安全性、經(jīng)濟(jì)性、可靠性、配送人員溝通質(zhì)量5 個(gè)維度出發(fā),探討物流服務(wù)質(zhì)量對顧客滿意度的影響。徐廣姝[7](2019) 以生鮮電商物流為研究對象,基于顧客感知視角構(gòu)建了以發(fā)貨能力、信息服務(wù)質(zhì)量、配送速度、產(chǎn)品質(zhì)量、配送人員、增值服務(wù)、誤差性8 個(gè)方面對物流服務(wù)質(zhì)量進(jìn)行評價(jià)。
傳統(tǒng)的服務(wù)質(zhì)量評價(jià)通常采用問卷調(diào)查收集消費(fèi)者意見進(jìn)行研究分析,評價(jià)內(nèi)容很少是真實(shí)交易過程后的即時(shí)評價(jià)和意見反饋,評價(jià)結(jié)果也與問卷質(zhì)量、受訪者質(zhì)量密切相關(guān)。隨著社交媒體的發(fā)展,在線顧客評論隱含消費(fèi)者的主要觀點(diǎn),具有真實(shí)性和即時(shí)性[8]。利用文本挖掘方法提取在線顧客評論數(shù)據(jù)中的隱含信息并加以有效利用,已經(jīng)成為學(xué)者們關(guān)注的重點(diǎn)。王洪偉等[9](2017) 選取SF 和ST 兩家快遞在線評論數(shù)據(jù)進(jìn)行實(shí)證研究,利用情感分析方法對快遞物流服務(wù)質(zhì)量進(jìn)行評價(jià),得到兩家企業(yè)在快遞物流服務(wù)質(zhì)量各指標(biāo)上的差異,為快遞物流企業(yè)改進(jìn)物流服務(wù)提供依據(jù)。施瀅萍等[10](2019) 基于在線顧客評論語料,利用文本挖掘方法得到相關(guān)快遞物流服務(wù)要素,研究結(jié)果找出了快遞物流服務(wù)要素的優(yōu)劣勢,有助于電商企業(yè)篩選合適的快遞物流公司。張振華[11](2019) 基于電商在線評論語料進(jìn)行文本挖掘分析和研究,構(gòu)建電商物流服務(wù)質(zhì)量問題挖掘模型,識別出導(dǎo)致物流服務(wù)失誤的關(guān)鍵問題,進(jìn)而找到相應(yīng)的解決方法,推動(dòng)物流服務(wù)創(chuàng)新。
文本挖掘是一個(gè)涵蓋多學(xué)科方法的新領(lǐng)域,涉及了數(shù)據(jù)挖掘技術(shù)、自然語言處理技術(shù)(Natural Language Processing,NLP)、機(jī)器學(xué)習(xí)、信息檢索、圖論等方法,從文本文件中抽取具有潛在價(jià)值的知識并組織信息的過程,是數(shù)據(jù)挖掘的一個(gè)分支。文本挖掘主要包括文本獲取、文本預(yù)處理、文本挖掘分析、可視化等流程。
TF-IDF(Term Frequency-Inverse Document Frequency,TF-IDF) 是一種用于文本挖掘、特征詞提取等領(lǐng)域的因子加權(quán)技術(shù),其原理是某一詞語的重要性隨著該詞在文件中出現(xiàn)的頻率增加,同時(shí)隨著該詞在語料庫中出現(xiàn)的頻率成反比下降[12]。
TF(Term Frequency,TF) 是指詞頻,表示關(guān)鍵詞(詞條) 在文本中出現(xiàn)的頻率。設(shè)tfi,j為詞語ti在文件dj中出現(xiàn)的頻率,TF 計(jì)算公式如下:
其中:ni,j為該詞在文件dj中出現(xiàn)的次數(shù)。
IDF(Inverse Document Frequency,IDF) 是指逆向文件頻率,用于度量某一詞語的普遍重要性。IDF 越大包含該詞條的文檔數(shù)越少,表明該詞條具有很好的類別區(qū)分能力。計(jì)算公式如下:
TF-IDF 是基于無監(jiān)督學(xué)習(xí)算法的關(guān)鍵詞提取。若某個(gè)詞的TF-IDF 值越大,則該詞越能體現(xiàn)出該文件的特點(diǎn)。TF-IDF 計(jì)算公式如下:
本文基于TF-IDF 算法,利用結(jié)巴(Jieba) 中文分詞系統(tǒng)實(shí)現(xiàn)關(guān)鍵詞提取,通過計(jì)算得到的TF-IDF 值確定關(guān)鍵詞的優(yōu)先級,以此為依據(jù)得到在物流環(huán)節(jié)過程中影響消費(fèi)者滿意的物流服務(wù)質(zhì)量問題。
本文以JD 電商平臺在線顧客評論數(shù)據(jù)為研究對象,以JD 電商物流服務(wù)質(zhì)量問題為研究目標(biāo),具體分析3CE 數(shù)碼電器、美妝、食品、家電、母嬰產(chǎn)品的中差評評論數(shù)據(jù)中的物流相關(guān)評論文本信息。
本文以顧客感知視角出發(fā),通過JD 電商平臺獲取的在線顧客評論數(shù)據(jù)作為挖掘物流服務(wù)質(zhì)量問題的依據(jù)?;谖谋就诰蚍椒▽Ξ?dāng)前JD 平臺的物流服務(wù)進(jìn)行分析,找出影響消費(fèi)者滿意的物流服務(wù)問題并提出改進(jìn)意見,從而更好地提升顧客滿意度和提高電商企業(yè)市場競爭力。具體的分析流程如圖1 所示。
主要研究內(nèi)容:(1) 數(shù)據(jù)獲取。編寫Python 程序?qū)D 電商平臺選定商品進(jìn)行中差評評論數(shù)據(jù)采集。(2) 數(shù)據(jù)處理:對評論數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、篩選物流相關(guān)評論等。利用結(jié)巴分詞對篩選后的物流評論數(shù)據(jù)進(jìn)行關(guān)鍵詞提取和詞頻統(tǒng)計(jì)并繪制詞云圖。根據(jù)關(guān)鍵詞和詞頻統(tǒng)計(jì)結(jié)果,運(yùn)用TF-IDF 算法確定關(guān)鍵詞的優(yōu)先級。(3) 數(shù)據(jù)分析:運(yùn)用ROSTCM(6) 對物流評論數(shù)據(jù)進(jìn)行社會網(wǎng)絡(luò)與語義網(wǎng)絡(luò)分析,繪制高頻詞共現(xiàn)網(wǎng)絡(luò)圖,發(fā)現(xiàn)各個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)圖中的位置,進(jìn)而識別出消費(fèi)者隱含觀點(diǎn)。
圖1 在線顧客評論文本挖掘分析流程圖
本文使用Python 爬蟲程序抓取JD 電商平臺選定的商品評論作為數(shù)據(jù)源。由于JD 電商平臺在商品評論數(shù)據(jù)采集中有限制,每款產(chǎn)品評論采集最多為1 000 條,抓取商品評論內(nèi)容均為最近一年內(nèi)的評論數(shù)據(jù)。為保證采集數(shù)據(jù)的全面性,避免研究對象片面化,本文選取JD 平臺下5 種類型的京東自營品牌商品,分別為3CE 數(shù)碼、美妝、零食、母嬰、家電。每種類型各選取兩個(gè)銷量靠前商品進(jìn)行中差評評論數(shù)據(jù)采集。
本次共采集10 種京東自營商品評論數(shù)據(jù),共計(jì)17 307 條。通過收集歸納得到包含物流服務(wù)特征詞的自定義列表共計(jì)208 條,如:“快遞”、“送貨”、“物流”、“包裝”、“退換貨”、“運(yùn)費(fèi)”、“配送速度”等,利用編寫的Python 篩選語句與自定義列表進(jìn)行匹配,進(jìn)而篩選得到物流服務(wù)相關(guān)的評論數(shù)據(jù)共計(jì)3 045條。對物流評論數(shù)據(jù)進(jìn)一步處理,如數(shù)據(jù)清洗、去缺失值、去除重復(fù)數(shù)據(jù)、短句過濾等,得到最終評論數(shù)據(jù)共計(jì)3 049 條。篩選結(jié)果如表1 所示。
表1 JD 商品評論數(shù)據(jù)統(tǒng)計(jì)
3.2.1 數(shù)據(jù)可視化。根據(jù)篩選得出的3 049 條物流服務(wù)相關(guān)評論數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理?;镜臄?shù)據(jù)預(yù)處理過程包括分詞、去停用詞、數(shù)據(jù)規(guī)范化等,目的是去除數(shù)據(jù)噪聲,避免影響數(shù)據(jù)分析結(jié)果,提高數(shù)據(jù)參考價(jià)值。進(jìn)一步通過Python 語句計(jì)算得出高頻關(guān)鍵詞統(tǒng)計(jì)結(jié)果并繪制詞云圖如圖2 所示。
數(shù)據(jù)分詞。本文采用Jieba 中文分詞工具對采集數(shù)據(jù)進(jìn)行分詞處理,Jieba 分詞系統(tǒng)自帶詞典但可能不包含一些專業(yè)詞匯,為保證分詞結(jié)果的準(zhǔn)確性添加自定義詞典,如“京東自營”、“上門取件”、“運(yùn)行速度”、“快遞小哥”、“么么噠”等詞語共計(jì)123 條,確保分詞結(jié)果準(zhǔn)確可信。
去停用詞。添加哈工大停用詞表進(jìn)行去停用詞處理,然后進(jìn)行分詞處理。停用詞表中包含無意義的符號和“了”、“哦”、“是”等助詞、形容詞,這些詞語無法表達(dá)文本真正含義,去停用詞后可以更精確的進(jìn)行文本分析。
繪制詞云圖。進(jìn)行詞頻統(tǒng)計(jì)得到高頻關(guān)鍵詞統(tǒng)計(jì)結(jié)果,并利用Python 程序中的Wordcloud 模塊繪制詞云圖(圖2)。高頻關(guān)鍵詞是指在物流相關(guān)評論中出現(xiàn)頻率較高的詞語,在一定程度上能反映出消費(fèi)者對商品和服務(wù)關(guān)注的重點(diǎn)。根據(jù)物流相關(guān)評論的高頻關(guān)鍵詞繪制詞云圖,反映出消費(fèi)者購物體驗(yàn)過程中不滿意的重點(diǎn)內(nèi)容,有助于JD 電商平臺針對性的解決消費(fèi)者關(guān)注的物流服務(wù)問題,提高物流服務(wù)能力。
詞云圖中字體的大小表明了評論數(shù)據(jù)中該詞詞頻的高低,詞頻越高,字體越大。由圖2 可知,“京東”、“包裝”、“客服”、“退貨”、“快遞”、“售后”、“問題”、“降價(jià)”、“物流”等詞語出現(xiàn)的頻率較高。詞云圖結(jié)果表明在物流服務(wù)環(huán)節(jié)影響消費(fèi)者滿意的因素有物流配送、退換貨、包裝的完好程度、售后服務(wù)等。詞云圖有助于直觀展現(xiàn)出在線顧客評論數(shù)據(jù)的重點(diǎn),為進(jìn)一步挖掘出JD 物流服務(wù)質(zhì)量問題提供了思路。
3.2.2 關(guān)鍵詞提取。關(guān)鍵詞提取是發(fā)掘在線顧客評論數(shù)據(jù)中具有包含文本特征含義的詞語,隱含評論內(nèi)容觀點(diǎn)。本文采用無監(jiān)督學(xué)習(xí)的TF-IDF 關(guān)鍵詞提取方法,利用評論文本中的詞語統(tǒng)計(jì)信息抽取評論關(guān)鍵詞,并進(jìn)行TF-IDF 值優(yōu)先級排序。本文選取詞語長度大于1 并且TF-IDF 值前200 的關(guān)鍵詞進(jìn)行歸納,得到含有頻次、權(quán)重值的物流關(guān)鍵詞詞表(如表2 所示),如“京東”、“包裝”、“客服”、“快遞”、“退貨”、“差評”等。
圖2 物流相關(guān)評論詞云圖
表2 物流關(guān)鍵詞詞表(部分)
基于ROSTCM(6) 對物流相關(guān)評論關(guān)鍵詞進(jìn)行高頻詞共現(xiàn)與語義網(wǎng)絡(luò)分析,得到共詞矩陣與語義網(wǎng)絡(luò)圖(如圖3 所示),網(wǎng)絡(luò)圖中的每個(gè)節(jié)點(diǎn)代表一個(gè)關(guān)鍵詞,兩節(jié)點(diǎn)之間的數(shù)字表示兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)的頻數(shù),分析物流評論的文檔只取高頻詞前200 的詞語,構(gòu)建共詞矩陣與語義網(wǎng)絡(luò)圖時(shí)取高頻詞前100 的詞語。
根據(jù)圖3 分析可知,共詞頻詞較高的JD 物流服務(wù)詞組有:“京東”與“包裝”(169 次)、“京東”與“服務(wù)”(149次)、“售后”與“京東”(127 次)、“包裝”與“打開”(124 次)、“京東”與“退貨”(110 次)、“正品”與“包裝”(106 次)、“包裝”與“快遞”(98 次)、“保價(jià)”與“降價(jià)”(100 次)、“態(tài)度”與“服務(wù)”(92 次)、“售后”與“問題”(69 次)、“送貨”與“速度”(62 次)、“退貨”與“問題”(59 次)、“時(shí)間”與“京東”(54 次)、“售后”與“聯(lián)系”(53 次) 等。
結(jié)合前文物流關(guān)鍵詞詞表、物流相關(guān)評論詞云圖、共現(xiàn)語義網(wǎng)絡(luò)圖等,分析物流環(huán)節(jié)中基于消費(fèi)者感知的物流服務(wù)質(zhì)量問題如下:第一,在包裝完好程度方面,顧客收到商品時(shí)出現(xiàn)包裝是否打開、包裝是否破損、包裝是否簡陋、包裝是否有味道等問題。第二、在人員溝通質(zhì)量方面,與JD 客服、商家客服人員的溝通效率,消費(fèi)者反饋問題時(shí)是否與客服人員取得有效溝通,能否及時(shí)處理消費(fèi)者的問題。第三,在配送可靠性方面,快遞送貨不及時(shí),快遞從業(yè)人員服務(wù)態(tài)度不好,送貨聯(lián)系不規(guī)范等問題。第四,在企業(yè)整體形象方面,JD 自營產(chǎn)品是否為正品,JD 電商平臺產(chǎn)品保價(jià)能否做到,JD 電商平臺給予顧客的承諾能否做到等問題。第五,在售后服務(wù)方面,退換貨環(huán)節(jié)出現(xiàn)問題,如退換貨困難、退貨售后申請未得到同意、退換貨運(yùn)費(fèi)誰承擔(dān)等。
圖3 物流高頻詞共現(xiàn)語義網(wǎng)絡(luò)圖
綜上可知,影響JD 電商平臺消費(fèi)者滿意的物流服務(wù)質(zhì)量的關(guān)鍵因素為包裝完好程度、人員溝通質(zhì)量、配送可靠性、企業(yè)整體形象以及售后服務(wù)5 個(gè)方面,并以此為依據(jù)提出物流服務(wù)質(zhì)量問題改善措施。
第一、規(guī)范快遞包裝業(yè)務(wù),提高物流從業(yè)人員的專業(yè)技能確保運(yùn)輸過程中產(chǎn)品及產(chǎn)品包裝的完好,避免過度包裝,為產(chǎn)品提供最優(yōu)的合理包裝方案。第二、提高物流從業(yè)人員素質(zhì),滿足消費(fèi)者個(gè)性化服務(wù)需求,JD 電商平臺應(yīng)重視一線物流服務(wù)從業(yè)人員專業(yè)化培訓(xùn),提升服務(wù)人員的服務(wù)意識與溝通能力,為消費(fèi)者提供高質(zhì)量的有效物流服務(wù)。第三、在配送過程中提供物流信息實(shí)時(shí)追蹤服務(wù),規(guī)范配送環(huán)節(jié)的服務(wù)方式,以顧客視角出發(fā)滿足顧客個(gè)性化物流需求;加強(qiáng)JD 自建物流服務(wù)體系與第三方物流企業(yè)合作,提高偏遠(yuǎn)地區(qū)物流配送能力,高效整合物流區(qū)域資源。第四、JD 電商平臺與商家形成戰(zhàn)略合作,加強(qiáng)平臺規(guī)范管理制度,確保平臺售賣的產(chǎn)品質(zhì)量和產(chǎn)品服務(wù),積極響應(yīng)JD 保價(jià)策略,提高消費(fèi)者對電商品牌忠誠度,提升企業(yè)總體印象。第五、提高JD 電商平臺企業(yè)售后服務(wù)能力,提高退換貨服務(wù)能力,簡化退換貨流程,及時(shí)響應(yīng)消費(fèi)者退換貨申請,縮短換貨周期。
由于本文研究評論數(shù)據(jù)來源是JD 電商平臺的5 種類型商品,且有關(guān)物流服務(wù)的中差評數(shù)據(jù)較少,研究結(jié)果可能出現(xiàn)局限性。在研究方法方面,TF-IDF 算法雖然容易實(shí)現(xiàn),但是關(guān)鍵詞提取結(jié)果無法考慮語義信息,無法處理一詞多義或一義多詞的詞語,研究結(jié)果可能出現(xiàn)偏差。