祝洪達
摘 要:本文旨在建立適用于快遞服務的評價指標,因為傳統(tǒng)的SERVQUAL和SERVPERF量表存在依賴調(diào)查問卷以及行業(yè)通用性差等局限性,所以選擇利用網(wǎng)絡爬蟲從互聯(lián)網(wǎng)爬取用戶對于快遞服務的在線評論作為語料,對語料進行分句、判斷文本有效性之后,利用LDA模型挖掘出用戶對于快遞服務的關注點,并將其作為評價快遞服務的指標。
引言
近年來,依托淘寶、京東、蘇寧易購等電子商務平臺的興起與繁榮,快遞市場獲得了極大的發(fā)展。根據(jù)國家郵政局公布的2017年郵政行業(yè)運行情況顯示,業(yè)務總量累計完成9763.7億元,同比增長32%[1]。目前在快遞市場正處于各大快遞公司快速擴張、競爭空前激烈的環(huán)境下,快遞服務質(zhì)量低下的問題逐漸暴露出來,丟件、損毀、延誤、工作人員服務態(tài)度差以及投訴反饋效果不佳等問題層出不窮。在當前以消費者為主導的市場環(huán)境下,快遞企業(yè)服務質(zhì)量的高低會直接影響企業(yè)的形象。低端的服務質(zhì)量會導致顧客源的流失,進而損害企業(yè)的經(jīng)濟效益。因此,提升服務質(zhì)量,塑造良好的企業(yè)形象是快遞企業(yè)競爭過程中不可或缺的一環(huán)。
1.相關理論
1.1傳統(tǒng)的服務質(zhì)量評價模型
傳統(tǒng)的服務質(zhì)量評價模型有SERVQUAL(Service Quality)模型和SERVPERF(Service Performance)模型。
SERVQUAL模型將服務質(zhì)量評價指標分為可靠性、響應性、有形性、保證性以及移情性五個維度,五個維度下又分為22個具體因素。通過用戶填寫調(diào)查問卷的方式,對每個問題的實際感受值和期望值進行評分,由此來確立影響服務質(zhì)量的具體因素,其核心是“服務質(zhì)量差距模型”,即服務質(zhì)量水平的高低取決于用戶所感受的服務水平和用戶期望的用戶實際感受的服務水平之間的差值,即
2.準備工作
本文旨在建立一套合理的用于評價快遞服務質(zhì)量的指標體系,通過對互聯(lián)網(wǎng)中的對于快遞服務的評價進行文本挖掘,利用LDA主題模型發(fā)現(xiàn)用戶對快遞服務的關注點,并將這些關注點作為評價快遞服務好壞的指標。
2.1快遞服務評論文本的獲取
本文利用Python3.6編寫網(wǎng)絡爬蟲從互聯(lián)網(wǎng)獲取用戶對于快遞服務的評論,并經(jīng)過數(shù)據(jù)去重等預處理后保存入本地硬盤,以備后續(xù)處理。本次實驗共抓取3433條快遞評論。
2.2文本預處理
文本預處理主要包括以下評論分句、人工標注有效性、分詞和特征項選擇、建立空間向量模型等。
(1)分句
對評論進行分句的原因在于,一條評論中并不是所有的信息都是有效的。本文將直接提及或從中能推斷出評價的是快遞服務某一方面的評論視為有效評論。以“雖然順豐派送有時候會不及時,但是我對客服和跟蹤的服務是非常滿意的,每個人的需求不同,服務行業(yè)態(tài)度很重要!”該評論為例,該評論中包含了快遞服務的派送、客服、信息追蹤、服務態(tài)度等多方面的信息,但“每個人的需求不同”并不是對于快遞服務的評價,屬于無效數(shù)據(jù),需要從文檔集中去除。所以本文按照“,”、“。”、“?”等標點符號對評論進行分句處理,便于從中剔除無效的數(shù)據(jù)。
(2)人工標注其有效性
對評論分句處理后產(chǎn)生的新評論人工判斷其有效性并進行標注,將有效的分句標記為1,無用的分句標記為0,目的是通過對評論進行少量的人工標注,利用有監(jiān)督的機器學習算法訓練判斷文本有效性的模型。本實驗標注了9000條數(shù)據(jù)作為訓練數(shù)據(jù)集。
(3)分詞和特征選擇
采用ICTCLAS漢語分詞系統(tǒng)的Python API對評論逐條進行分詞,并進行詞性標注。因為我們的關注的是關于快遞服務方面的描述,所以需要將標點符號和方位詞、時間詞等詞性的詞語刪除。
(4)建立空間向量模型(VSM)
經(jīng)過分詞之后,將每個單詞表示為(T_i-W_i )的形式,其中T_i表示語料庫中的第i個單詞,W_i表示第i個單詞的權重。權重通過TF-IDF算法來計算,如(7)。所示。其中〖tf〗_i表示單詞t_i在文檔d_i中出現(xiàn)的頻率,M表示語料庫中的總文檔數(shù),m_i表示訓練文檔中出現(xiàn)單詞t_i的文檔數(shù), 表示單詞t_i的逆文檔頻率[6]。
2.3文本有效性判別
文本有效性判別,本質(zhì)是一個二分類問題,常用的分類模型有Logistic回歸模型、決策樹模型(Decision Tree)和支持向量機模型(SVM)等。本文對各個分類模型的準確率(precision)、召回率(recall)以及F度量值(F-measure)等性能進行比較,結(jié)果見(表1)。從表1可以看出,支持向量機模型的分類性能要優(yōu)于其他的模型,這主要是因為支持向量機模型僅與支持向量有關,所以相對于其他的分類模型而言,需要的數(shù)據(jù)樣本量要少,同時利用高斯核函數(shù)的支持向量機模型能將矩陣映射為高維空間中的一個點,從而提高文本有效性判別的準確率,所以本文利用采用高斯核函數(shù)的SVM模型來判斷文本的有效性。
2.4在線評論主題發(fā)現(xiàn)
對在線評論進行主題挖掘之前,需要先將評論進行分句處理,利用訓練好的SVM模型判斷該評論每一個分句的有效性,舍棄無效的分句,將有效的數(shù)據(jù)再合并為一條數(shù)據(jù),經(jīng)過處理之后,每條評論包含的詞語個數(shù)一般不會超過25個。然后利用LDA模型對全部評論進行主題發(fā)現(xiàn)。中國快遞協(xié)會體驗調(diào)查報告將快遞服務質(zhì)量評價體系分為發(fā)件攬收環(huán)節(jié)、收件環(huán)節(jié)、派件網(wǎng)點以及投訴受理情況4個維度共17個具體指標[7];王洪偉等利用詞頻統(tǒng)計的方法,從企業(yè)整體、價格、時效性、快遞員、信息化、安全性以及客戶服務7個維度18個具體指標來評價快遞服務質(zhì)量的高低[8],所以本次實驗設置主題個數(shù)為25,迭代次數(shù)設置為50,得到的部分結(jié)果見(表 2)。
3.結(jié)論可行性分析
根據(jù)LDA模型的主題發(fā)現(xiàn)結(jié)果,可以將快遞服務的在線評論分為配送環(huán)節(jié)、快遞員、投訴環(huán)節(jié)等8個維度23個評價指標,詳情見(表3)。經(jīng)過與中國快遞協(xié)會調(diào)查報告以及利用詞頻統(tǒng)計建立的快遞質(zhì)量評價指標對比發(fā)現(xiàn),三者的具體指標大致相同,說明利用LDA模型建立快遞服務質(zhì)量評價指標具有一定的可行性。
結(jié)語
本文利用LDA主題模型對快遞服務的在線評論建模,挖掘在線評論的主題,得到用戶對于快遞服務的關注點,并將其作為評價快遞服務質(zhì)量的指標。從用戶對快遞服務的關注點可以看出,快遞服務不僅要優(yōu)化業(yè)務流程,提高作業(yè)的效率,還要注意提升企業(yè)形象,特別是快遞員以及客服等工作人員的專業(yè)素質(zhì)以及工作態(tài)度,建立價格規(guī)范,并注意物流狀態(tài)的實時更新。
參考文獻:
[1]國家郵政局公布2018年4月郵政行業(yè)運行情況[EB/OL]. http://www.spb.gov.cn/xw/dtxx_15079/201805/t20180512_1563793.html,2018-05-12/2018-05-20.
[2]黃敏.基于SERVQUAL模型的商業(yè)銀行服務質(zhì)量評價研究[D].重慶理工大學,2015.
[3]唐曉波,向坤.基于LDA模型和微博熱度的熱點挖掘[J].圖書情報工作,2014,58(5):58-63..
[4]劉兵.情感分析:挖掘觀點?情感和情緒[M].機械工業(yè)出版社,2017.
[5]涂銘,劉祥,劉樹春. Python自然語言處理實戰(zhàn)核心技術與算法[M].機械工業(yè)出版社,2018.
[6]馬剛.基于語義的Web數(shù)據(jù)挖掘[M].東北財經(jīng)大學出版社,2014.
[7]快遞服務體驗式調(diào)查報告[EB/OL]. http://www.cea.org.cn/content/details_21_13959.html,2017-10-09.
[8]王洪偉,宋媛,杜戰(zhàn)其,等.基于在線評論情感分析的快遞服務質(zhì)量評價[J].北京工業(yè)大學學報,2017,43(3):402-412.