丁學(xué)利 孫娓娓
摘? 要:為有效對(duì)商場會(huì)員價(jià)值進(jìn)行分類研究,首先運(yùn)用K均值聚類并結(jié)合Fisher判別分析對(duì)商場會(huì)員進(jìn)行分類,然后根據(jù)各會(huì)員群的最近一次消費(fèi)時(shí)間間隔、總購買數(shù)量、總消費(fèi)金額、單筆最高消費(fèi)金額、平均消費(fèi)金額、會(huì)員關(guān)系長度等多項(xiàng)指標(biāo)構(gòu)建模糊綜合評(píng)價(jià)模型。通過計(jì)算相對(duì)偏差模糊矩陣及變異系數(shù)法構(gòu)建的各指標(biāo)的權(quán)向量對(duì)會(huì)員群進(jìn)行了綜合評(píng)價(jià),得到了會(huì)員群的綜合排序。該方法可有效地對(duì)大樣本數(shù)據(jù)進(jìn)行綜合評(píng)價(jià)且評(píng)價(jià)結(jié)果更接近實(shí)際,也為商場運(yùn)營商有效地對(duì)會(huì)員進(jìn)行分類管理,實(shí)施針對(duì)性的營銷策略等提供了理論參考。
關(guān)鍵詞:K均值聚類;Fisher判別分析;模糊綜合評(píng)價(jià)法;商場會(huì)員
中圖分類號(hào):O212? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ?文章編號(hào):1672-4437(2019)03-0081-06
在零售行業(yè)中,會(huì)員價(jià)值表現(xiàn)為不斷地為零售運(yùn)營商帶來較好的銷售額和較高的利潤,也為零售運(yùn)營商如何制定營銷策略提供了數(shù)據(jù)支持。零售行業(yè)會(huì)采取各種不同方法來增強(qiáng)會(huì)員的忠誠度,同時(shí)吸引非會(huì)員成為會(huì)員。當(dāng)前電商的發(fā)展使商場會(huì)員不斷流失,給零售運(yùn)營商帶來了嚴(yán)重?fù)p失。因此,運(yùn)營商如何有效地對(duì)會(huì)員進(jìn)行分類管理,以及根據(jù)會(huì)員分類有針對(duì)性地實(shí)施營銷策略來加強(qiáng)與會(huì)員的良好關(guān)系,成為商場運(yùn)營商迫切解決的關(guān)鍵問題。
在對(duì)客戶進(jìn)行有效識(shí)別方面,可通過聚類分析、判別分析等[1-8]方法進(jìn)行分類,然后利用RFM模型[9]、客戶價(jià)值矩陣法[10]等對(duì)客戶進(jìn)行價(jià)值分析。但在對(duì)大樣本數(shù)據(jù)的客戶價(jià)值進(jìn)行評(píng)價(jià)時(shí),往往評(píng)價(jià)指標(biāo)具有不確定性或模糊性,這些方法較難客觀地對(duì)客戶群進(jìn)行綜合評(píng)價(jià)。因此,本文運(yùn)用K均值聚類法對(duì)商場會(huì)員進(jìn)行分類,同時(shí)利用判別分析法對(duì)聚類結(jié)果進(jìn)行判別,驗(yàn)證聚類效果,在此基礎(chǔ)上利用模糊綜合評(píng)價(jià)法對(duì)會(huì)員群進(jìn)行綜合評(píng)價(jià)。該方法可有效地對(duì)大樣本數(shù)據(jù)進(jìn)行綜合評(píng)價(jià)且評(píng)價(jià)結(jié)果更接近實(shí)際。
1? 數(shù)據(jù)來源與分析
1.1 數(shù)據(jù)預(yù)處理
本文采用2018年全國大學(xué)生數(shù)學(xué)建模競賽C題[11]商場會(huì)員消費(fèi)信息數(shù)據(jù)。商場會(huì)員消費(fèi)信息共有911702條數(shù)據(jù),其中包括異常數(shù)據(jù)(會(huì)員卡號(hào)出現(xiàn)科學(xué)計(jì)數(shù)法的數(shù)據(jù),如會(huì)員卡號(hào)6.7738E+21,共計(jì)417條)、缺失數(shù)據(jù)(如有的會(huì)員只有消費(fèi)時(shí)間,缺失會(huì)員入會(huì)時(shí)間,共計(jì)793個(gè)會(huì)員號(hào))等。由于這些數(shù)據(jù)所占的比例非常小,因此可考慮直接刪除。由于每個(gè)會(huì)員的消費(fèi)記錄不只一條,因此可用Excel透視表得到每個(gè)會(huì)員的總購買數(shù)量、總消費(fèi)金額、單筆最高消費(fèi)金額、平均消費(fèi)金額。然后運(yùn)用Access軟件對(duì)數(shù)據(jù)進(jìn)行處理和提取,包括分離商場會(huì)員與非會(huì)員的數(shù)據(jù)、提取會(huì)員最近一次消費(fèi)時(shí)間間隔和會(huì)員關(guān)系長度(會(huì)齡),最后得到43105條會(huì)員消費(fèi)記錄。
1.2 指標(biāo)選取
根據(jù)RFM模型[9]理論,反映顧客的價(jià)值包括三個(gè)指標(biāo):最近購買時(shí)間(R)、購買頻率(F)及購買金額(M)。R值越小,F(xiàn)和M值越大,顧客價(jià)值越高。除了RFM所代表的評(píng)價(jià)指標(biāo),本文還使用了其他特殊變量反映會(huì)員的購買行為,如單筆最高消費(fèi)金額、平均消費(fèi)金額,其值越大,顧客價(jià)值越高;會(huì)員關(guān)系長度越長說明會(huì)員越忠誠。因此,本文選取如下6個(gè)反映顧客價(jià)值的評(píng)價(jià)指標(biāo): ——最近一次消費(fèi)時(shí)間間隔(天); ——總購買數(shù)量(件); ——總消費(fèi)金額(元); ——單筆最高消費(fèi)金額(元); ——平均消費(fèi)金額(元); ——會(huì)員關(guān)系長度(會(huì)齡/天)。表1是將會(huì)員號(hào)按升序排列得到的商場會(huì)員消費(fèi)統(tǒng)計(jì)結(jié)果(由于版面限制,僅列出部分會(huì)員消費(fèi)的統(tǒng)計(jì)結(jié)果)。
2? 基于聚類-判別分析的會(huì)員分類
2.1 聚類和判別分析
聚類分析[1-5]的基本目標(biāo)是按照一定規(guī)則把分類對(duì)象性質(zhì)相似的歸為一類,而把性質(zhì)差距比較大的對(duì)象歸到不同的類,其最終得到類內(nèi)的對(duì)象會(huì)有很高的相似度,而不同類之間的對(duì)象具有較低的相似度。K均值聚類是一種適用于大數(shù)據(jù)且計(jì)算速度快的聚類方法,其算法的基本步驟是在給定數(shù)據(jù)的分類數(shù)K后,該方法會(huì)隨機(jī)選取K個(gè)聚類中心,計(jì)算每個(gè)樣本與這K個(gè)聚類中心的距離,依據(jù)距離最近原則將每個(gè)樣本分別歸到K個(gè)不同的類,然后重新計(jì)算這K個(gè)類的中心,繼續(xù)計(jì)算每個(gè)樣本與這K個(gè)中心的距離,并重新歸類,繼續(xù)上述操作直到達(dá)到設(shè)定的標(biāo)準(zhǔn)時(shí),結(jié)束聚類過程。
判別分析[1, 2]是按照某種判別規(guī)則,對(duì)已經(jīng)分類的研究對(duì)象,計(jì)算判別指標(biāo),確立判別函數(shù),依據(jù)判別函數(shù)即可判定某一對(duì)象屬于何類。Fisher 判別法是判別分析中常用的一種方法,其基本思想是投影降維,即將K類n維數(shù)據(jù)投影到某一個(gè)方向,使得類與類之間的投影盡可能分開,而類內(nèi)離差盡可能小,從而得到一種線性判別函數(shù),最終將各個(gè)類進(jìn)行很好的區(qū)分。
在眾多的聚類和判別方法中,K均值聚類和Fisher判別分析是適應(yīng)性較強(qiáng)且處理大樣本數(shù)據(jù)效果較快的方法。針對(duì)43105條大樣本商場會(huì)員數(shù)據(jù),選取K均值聚類和Fisher判別分析是比較合適的,因此本文選用K均值聚類和Fisher判別分析。其具體步驟如下:
Step1:以 , , , , , 為自變量,將樣本數(shù)據(jù)z-score標(biāo)準(zhǔn)化,計(jì)算不同類別數(shù)下的平均輪廓值,確定K均值聚類的最佳類別數(shù)K;
Step2:選取K個(gè)初始聚類中心,運(yùn)用K均值聚類算法得到最終的聚類中心和聚類結(jié)果(每個(gè)會(huì)員的分類號(hào)及每個(gè)會(huì)員群的數(shù)量及均值);
Step3:繼續(xù)以 , , , , , 為自變量,用聚類分析的分類號(hào)作為分類變量,將所有樣本作為訓(xùn)練樣本進(jìn)行判別分析,得到判別函數(shù)系數(shù),建立Fisher判別線性函數(shù);
Step4:用判別函數(shù)對(duì)所有樣本進(jìn)行判別分類,與聚類結(jié)果比較,檢驗(yàn)聚類效果。
2.2? K均值聚類結(jié)果
為了確定K均值聚類的最佳聚類數(shù)K,首先計(jì)算分類數(shù)與平均輪廓值的關(guān)系,如圖1所示。平均輪廓值越大,表明聚類具有越好的效果。由圖1可知,當(dāng)類別數(shù)為2時(shí)平均輪廓值最大,但分類數(shù)為2時(shí),太籠統(tǒng),效果不好。當(dāng)類別數(shù)為6時(shí),平均輪廓值較大,因此最佳聚類數(shù)可取6。使用SPSS 21.0軟件,選取6個(gè)初始聚類中心,得到最終聚類中心(標(biāo)準(zhǔn)化后的聚類中心,見表2)。根據(jù)最終的聚類中心,可將會(huì)員分成6類會(huì)員群,見表3。由表3可知,會(huì)員群1的會(huì)員數(shù)最多,最近一次消費(fèi)時(shí)間間隔較長,總購買數(shù)量、總消費(fèi)金額、單筆最高消費(fèi)金額、平均消費(fèi)金額較少,會(huì)員關(guān)系長度最短。其余會(huì)員群的詳細(xì)特征也可類似得出。雖然利用K均值聚類得到了聚類結(jié)果,但聚類效果如何,需進(jìn)一步檢驗(yàn)。
2.3? Fisher判別分析結(jié)果
以 , , , , , 為判別自變量,以聚類分析得到的分類號(hào)作為分組變量,使用SPSS 21.0軟件對(duì)所有樣本進(jìn)行判別分析。SPSS 21.0自動(dòng)選取具有會(huì)員分類號(hào)的數(shù)據(jù)進(jìn)行訓(xùn)練,得到判別函數(shù)系數(shù),見表4。方差檢驗(yàn)判別函數(shù)的p值小于0.001,表明判別函數(shù)對(duì)商場會(huì)員類別的區(qū)分差異顯著。SPSS 21.0利用判別函數(shù)可對(duì)每個(gè)會(huì)員所屬的會(huì)員群進(jìn)行有效識(shí)別,判別結(jié)果見表5。由表5可得到,每個(gè)會(huì)員群的聚類結(jié)果與判別結(jié)果基本一致,總的一致率(兩者相同的樣本數(shù)除以總樣本數(shù))達(dá)到96.2%。因此,K均值聚類得到的6類會(huì)員群是較合理的。雖然把商場會(huì)員合理地分成了6類會(huì)員群,但如何對(duì)每類會(huì)員群進(jìn)行評(píng)價(jià)還需進(jìn)一步研究。
3 會(huì)員群模糊綜合評(píng)價(jià)
3.1? 相對(duì)偏差模糊綜合評(píng)價(jià)
針對(duì)多個(gè)方案實(shí)施客觀評(píng)價(jià)時(shí),待評(píng)價(jià)的指標(biāo)因素一般較多且存在主觀判斷。因此,應(yīng)根據(jù)多個(gè)指標(biāo)進(jìn)行綜合評(píng)價(jià)且考慮評(píng)價(jià)指標(biāo)因素的模糊性。模糊綜合評(píng)價(jià)法[12-14]是一種有效克服模糊性的數(shù)學(xué)方法,其本質(zhì)是最大隸屬度原則。在建立模糊矩陣時(shí),隸屬度函數(shù) 可使用多種方式,如越小越優(yōu)型、越大越優(yōu)型等函數(shù)。但有些公式計(jì)算較繁瑣,而相對(duì)偏差模糊矩陣的隸屬度函數(shù) 計(jì)算簡單且可較好地反映評(píng)價(jià)結(jié)果。設(shè)有 個(gè)待評(píng)價(jià)對(duì)象集合 , 個(gè)評(píng)價(jià)指標(biāo)集合 。如果用 中的每個(gè)指標(biāo)對(duì) 中的每個(gè)待評(píng)價(jià)對(duì)象進(jìn)行評(píng)價(jià),那么可得觀測值矩陣 ,其中 為第 個(gè)評(píng)價(jià)對(duì)象關(guān)于第 個(gè)評(píng)價(jià)指標(biāo)的指標(biāo)值,具體的綜合評(píng)價(jià)步驟如下:
Step1: 設(shè)置理想方案
3.2 會(huì)員群模糊綜合評(píng)價(jià)結(jié)果
為更好地區(qū)分6類會(huì)員群的價(jià)值,以表3中 , , , , , 的均值作為評(píng)價(jià)指標(biāo),6類會(huì)員群作為待評(píng)價(jià)對(duì)象,進(jìn)行模糊綜合評(píng)價(jià)。由于變量 的值越小越好,因此可作為成本型指標(biāo),而變量 , , , , 的值越大越好,因而可作為效益型指標(biāo)。理想方案 可設(shè)置為:
= (10.34, 250.42, 453165.81, 37422.52, 20397.5, 2528.21)
相對(duì)偏差模糊矩陣計(jì)算如下:
根據(jù)F值可將6類會(huì)員群進(jìn)行綜合排序,每類會(huì)員群的具體特征如下:
(1)會(huì)員群6綜合排名第一,占總會(huì)員數(shù)的0.42%, 屬于少數(shù)會(huì)員群。該類會(huì)員購買時(shí)間間隔最短,購買數(shù)量最多,交易金額最大,屬于商場重要保持的優(yōu)質(zhì)會(huì)員群。商場應(yīng)加大對(duì)這類會(huì)員的資源投入,增大其為商場創(chuàng)造利潤的時(shí)間。
(2)會(huì)員群3綜合排名第二,占總會(huì)員數(shù)的1.29%, 屬于少數(shù)會(huì)員群。該類會(huì)員雖然購買時(shí)間間隔較大,購買數(shù)量也較低,但平均消費(fèi)金額最大,屬于商場重要發(fā)展的會(huì)員群。對(duì)這類會(huì)員,商場應(yīng)為他們制定相應(yīng)的營銷策略,提升其忠誠度,使其逐步轉(zhuǎn)變成商場的高價(jià)值會(huì)員。
(3)會(huì)員群4綜合排名第三,占總會(huì)員數(shù)的4.96%, 屬于少數(shù)會(huì)員群。該類會(huì)員購買數(shù)量和購買金額較大,屬于商場普通保持的會(huì)員群。針對(duì)該類會(huì)員群,商場應(yīng)及時(shí)了解會(huì)員需求,逐步提高其忠誠度和滿意度。
(4)會(huì)員群2綜合排名第四,占總會(huì)員數(shù)的19.79%, 各項(xiàng)指標(biāo)一般,屬于商場普通發(fā)展的會(huì)員群。該類會(huì)員群當(dāng)前可能對(duì)商場的貢獻(xiàn)一般,但其發(fā)展?jié)摿薮螅瑧?yīng)努力提升其價(jià)值。
(5)會(huì)員群1綜合排名第五,占總會(huì)員數(shù)的64.28%, 屬于多數(shù)會(huì)員群。該類會(huì)員購買數(shù)量和金額較少,會(huì)齡時(shí)間最短,屬于商場一般發(fā)展的會(huì)員群。對(duì)此類會(huì)員,商場應(yīng)謹(jǐn)慎對(duì)其投入資源。
(6)會(huì)員群5綜合排名第六,占總會(huì)員數(shù)的9.25%。該類會(huì)員消費(fèi)時(shí)間間隔最大,購買數(shù)量最少,消費(fèi)金額最低,會(huì)員關(guān)系較長,屬于非活躍低價(jià)值老會(huì)員群。這類會(huì)員,商場可減少對(duì)其投入的資源。
4 結(jié)束語
本文運(yùn)用K均值聚類法對(duì)商場會(huì)員進(jìn)行了分類,再利用判別分析法驗(yàn)證了K均值聚類效果,最后使用模糊綜合評(píng)價(jià)法對(duì)6類會(huì)員群進(jìn)行了綜合排序。實(shí)例表明,該方法的分類和評(píng)價(jià)是有效的,可較好地對(duì)商場會(huì)員進(jìn)行識(shí)別。本研究結(jié)果,為商場運(yùn)營商有效地對(duì)會(huì)員進(jìn)行分類管理,實(shí)施針對(duì)性的營銷策略以及如何加強(qiáng)與會(huì)員的良好關(guān)系等提供了理論依據(jù)。
參考文獻(xiàn):
[1]趙銘,李雪,李秀婷,等.基于聚類分析的商業(yè)銀行基金客戶的分類研究[J].管理評(píng)論,2013(7):38-44.
[2]韓宏穩(wěn),張建磊.層次分析與聚類分析、判別分析在卷煙零售戶分類中的應(yīng)用[J].中國煙草學(xué)報(bào),2014, 20(6):119-126.
[3]姚思雨.改進(jìn)蟻群聚類算法在零售客戶分類中的研究與應(yīng)用[D].大連:大連海事大學(xué),2018.
[4]左國才,楊金民.K-means算法在電信CRM客戶分類中的應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,19(2):155-159.
[5]胡雷芳.基于聚類分析的C2C電子商務(wù)客戶價(jià)值服務(wù)營銷對(duì)策研究[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2007,24(3):34-41.
[6]王軼華.基于層次分析法建立客戶綜合價(jià)值分析體系[J].華東電力,2006(4):36-39.
[7]曹云忠.基于SOM和粗糙集理論的客戶分類研究[J].商場現(xiàn)代化,2009(1):43-44.
[8]黎晗.數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用----以客戶分類為例[J].中外企業(yè)家,2015(36):82-84.
[9]徐文瑞.基于RFM模型的顧客消費(fèi)行為與顧客價(jià)值預(yù)測研究[J].商業(yè)經(jīng)濟(jì)研究,2017(19):44-46.
[10]陳明亮.基于全生命周期利潤的客戶細(xì)分方法[J].經(jīng)濟(jì)管理,2002(20):42-46.
[11]2018年全國大學(xué)生數(shù)學(xué)建模競賽試題[EB/OL]. (2018-09-20)[2019-03-02.]http://mcm.ustc.edu.cn/ahmcm/.
[12]高順成.紡織服裝類高??萍紕?chuàng)新能力評(píng)價(jià)研究----基于相對(duì)偏差距離最小法[J].武漢紡織大學(xué)學(xué)報(bào),2013,26(2):23-26.
[13]許一新,楊鵬輝,汪兆霞,等.基于模糊綜合評(píng)價(jià)對(duì)購房影響因素的定量分析[J].阜陽師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2017,34(2):96-99.
[14]彭清萍,付亞賓.基于模糊分析法的網(wǎng)絡(luò)評(píng)價(jià)體系建構(gòu)與實(shí)施[J].阜陽師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2018,35(1):96-100.