廣東省經濟貿易職業(yè)技術學校 楊雄鋼
基于聚類分析的電子商務客戶忠誠度研究
廣東省經濟貿易職業(yè)技術學校 楊雄鋼
全面分析電子商務顧客忠誠度的影響因素,立足于經典RFM客戶忠誠度模型,將RFMSA電子商務客戶忠誠度劃分模型有效地建立起來,借助聚類分析算法劃分顧客忠誠度,立足于經典聚類分析法K-means,將分段確定初始聚類中心的改進算法提出,以此來劃分顧客的忠誠度.借助分析經典樣本數據,從實驗結果可以看成,通過對粗糙集K-means聚類算法進行改進后,可以將聚類的準確率有效提高.
聚類分析;電子商務;客戶忠誠度
在電子商務環(huán)境下,企業(yè)可以對互聯(lián)網進行利用將產品和服務提供給客戶.企業(yè)不認識顧客,顧客也不認識企業(yè),沒有當面交流過一句,所有客戶關系都通過網絡來進行維持.能夠讓消費者更好的進行對比、選擇以及提供各方面綜合程度較高的商品和企業(yè)即為互聯(lián)網的優(yōu)點,對互聯(lián)網進行利用,讓消費者更好的對信息進行搜索,這樣就可以利用相關企業(yè)在網上開設的商城,將商品的價格等相關信息獲取到,并且還可以和企業(yè)服務商進行對比,不僅可以在價格上進行比較,同時還可以在服務商進行比較,通過以上所講到的對比,消費者就會選擇和自己消費意象更相符的產品或商家,因此在電子商務中,客戶忠誠度基本較低,最終流失掉本有的客戶.怎樣才能將客戶的忠誠度提高是現(xiàn)階段電子商務迫切需要解決的問題.
(一)RFM模型
在電子商務行業(yè)中,RFM模型是對客戶忠誠度進行分析時用得最多的一種模型,客戶真實的交易數據即為RFM數據,因此,數據具有較強的準確性,客戶的個人隱私通常不會涵蓋在內,獲取較為容易.RFM模型在客戶忠誠度研究中得到了廣泛的運用,其以客戶的消費金額、購買頻率、購買時間間隔為基礎.
(二)RFMSA 模型
作為電子上我中對客戶行為的重要指標,RFMSA 模型將交易金額、交易頻率、交易時間、關注度、商品評價包括在內.在RFMSA 模型中,每一個屬性維度的重要程度都具有一定的差異性,也就是五個屬性維度的權重不同.五種指標所影響用戶忠誠度的程度不一樣,以綜合反映客戶忠誠度的指標CLV客戶終生價值指標為基礎,來定義RFMSA 模型,如式(1)所示:
其中i表示客戶中的第i個客戶,CLVi表示此客戶的忠誠度指標,Ri、Fi、Mi、Si、Ai分別表示此客戶RFMSA 指標的ωR、ωF、ωM、ωS、ωA分別表示五個指標的權重系數[1].在所有指標當中,CLV與購買時間成反比,而在另外四項指標方面都成正比.在將 RFMSA模型確立之后,應預先處理數據,將其轉換成系統(tǒng)需要的 RFMSA數據并加以規(guī)范,然后在分析數據,在對數據進行分析的過程當中,系統(tǒng)主要是通過采取聚類分析的方式,來實現(xiàn)數據集的分類.
(一)模糊K-means算法
微課可以使模糊聚類更好地實現(xiàn),以下設計和分析了模糊K-means算法,其具體描述如下所示:假設數據集集合為,數據集的簇數量為K個,第i個簇的中心即為mi,i=1,2,...k0uj(xi)表示K-means算法聚類過程中第x個樣本對第j類的隸屬度,模糊K-means算法的目標函數可以對以下式子予以使用來描述.
其中,b使一個可以對模糊聚類結果予以控制的模糊度常數,通過模糊K-means均值隸屬度函數求導數,就可以將K-means算法的最佳解放得到,如以式(2)、(3)所示:
在對K- means算法予以執(zhí)行時,能夠通過對上述兩個方程式予以實際的執(zhí)行,來得到一各具體的模糊K- means算法,這樣就能夠將其應用到實際數據劃分當中[2].給予模糊思想下的K- means算法,在對其進行具體描述時分為以下幾點:第一,對隨機初始法予以采用,以此作為數據集設定K個簇,并將各個簇的中心設定為mi;第二,對客戶的購買記錄數據集中所有的數據對象的隸屬函數進行計算,計算方式為(3);第三,將第二個步驟當中的隸屬函數作為基礎,來對所有簇的中心值mi予以計算,能夠通過算式(2)來進行;第四,遍歷數據集中所有數據對象,當隸屬度不再改變時,算法結束,不然就返回到步驟二.
(二)具體運用
本文所采用的系統(tǒng)實驗工具為Matlab2009程序處理平臺,而第五代智能英特爾酷睿i7處理器是本次實驗采用的服務器,i7一SSOOU為CPU的型號,主頻為2. 40GHz,4G內存,W in8是其操作系統(tǒng),在分析算法、實現(xiàn)算法、運行數據的準確性和有效性中得到了較好的運用.
實驗數據對中科院模式予以采用,對國家重點實驗室采集的SUNING、JD、TMALL等三個購物網站的用戶消費數據進行識別,使用BOW工作預處理數據集,所有的數據集中都將3萬條電子商務瀏覽記錄包括在其中,可以將其分為高、中、低三個客戶忠誠度的類別,黃金消費群體即為高忠誠度的客戶,其具有較高的交易頻率,每個月的消費金額較多,瀏覽了很多的商品,具有極高的潛在消費價值,其黏性較高;普通消費群體即是中忠誠度的客戶,商品流量的數量一般,不能確定出潛在消費價值和黏性;低忠誠度客戶也就是低值客戶,用戶對網站進行訪問的時間具有較長的間隔,交易很少能夠成功完成,消費額度極少.上述三個類別都其記錄都有1萬條.
為了能夠對改進的K- means算法的有效性進行評估,本文對召回率評估算法聚類的精確程度進行使用,其定義如式(4)所示.
其中,T和C分別表示的是改進的K-means的算法執(zhí)行結果的簇標號、實際客戶屬于的忠誠度類型的數目,A1(c,T )和A2(c,T )分別表示瀏覽記錄分到其歸宿的忠誠度類別T中的數目、瀏覽記錄C被錯誤地劃分到非歸屬忠誠度類別T中的數量.
通過以上三種算法運行在TMALL數據集上的結論可以看此,改進的K-means可以對軟化分的思想予以采用,可以以客戶需求為基礎,將數據準確的分為高、中、低三個忠誠度類群中[3].對于改進的k-means算法,相較于用戶興趣度模型,在高忠誠度準確度上提高了16%,相較于RFM模型,在中忠誠度準確度上和低忠誠度模型上分別提高了21.8%、25.7%,使電子商務網站忠誠度劃分準確度得到了有效提高,對弈檔次不同的數據,可以采用不一樣的營銷方法,對客戶群體的消費能力進行維護.在JD數據集上,在中忠誠度上RFM模型所劃分的結果只有32.4%,低于在其它數據集上的劃分,極大的改變了數據劃分準確度;在高忠誠度上,用戶興趣度模型的劃分結果為43.4%,明顯低于在其它數據集上的劃分結果,也改變了數據劃分準確度.而在k-means模型進行了改進后,在山中數據集上的劃分結果沒有較大的差異,比較穩(wěn)定,由此可知,在不同的數據集上,改進的k-means模型魯棒性較高,能夠對用戶忠誠度進行有效獲取.在SUNING數據集上,RFM模型執(zhí)行時間為86ms,用戶興趣度模型執(zhí)行時間為87ms,通過改良折后K-means算法需要的執(zhí)行之間為63ms,因此能夠讓用戶忠誠度在劃分時間方面的效率得到較大的提升,能夠在很短的時間內得到準確的計算結果,進而使得電子商務網站在運行與推薦效率方面得到有效地提升,具體忠誠度模型見表1.
表1 SUNING數據忠誠度模型執(zhí)行時間
大力發(fā)展的網絡技術,在各個領域得到了廣泛的應用,在此背景下,電子商務得到了極大的發(fā)展.電子商務網站要想在競爭激勵的市場中占據優(yōu)勢,就必須立足于先進的數據挖掘及時,和客戶保持良好的關系.本文為了達到將電子商務客戶忠誠度模型的準確性提高的目的,將模糊數學理論引入到了傳統(tǒng)的k-means算法中,使改進的k-means算法被提了出來,據實驗結果表明,這種算法可以將客戶忠誠度挖掘準確度提高,相較于用戶興趣度模型以及RFM模型,本文算法的魯棒性更好,應用的價值較高.
[1]牛詠梅.基于粗糙集的海量數據挖掘算法研究[J].現(xiàn)代電子技術,2016,39(7):115-119.
[2]王林彬,黎建輝,沈志宏.基于NoSQL的RBF數據存儲與查詢技術綜述[J].計算機應用研究,2015,32(2):1281-1286.
[3]謝麗.基于聚類分析的機場客戶細分服務系統(tǒng)的設計與實現(xiàn)[D].西安電子科技大學碩士論文,2014:15-17.