向昆竹 黃凱 侯皓文
摘 要:在如今同質(zhì)產(chǎn)品的市場(chǎng)環(huán)境下,企業(yè)的市場(chǎng)競(jìng)爭(zhēng)從產(chǎn)品質(zhì)量逐步向客戶滿意度轉(zhuǎn)變。企業(yè)通過(guò)客戶細(xì)分,以客戶類群為單位進(jìn)行針對(duì)性的產(chǎn)品銷售可以促進(jìn)提升產(chǎn)品在市場(chǎng)的競(jìng)爭(zhēng)力。本文通過(guò)對(duì)客戶細(xì)分以及聚類分析的研究,運(yùn)用聚類分析中的K-Means算法來(lái)解決客戶細(xì)分問(wèn)題。
關(guān)鍵詞:大數(shù)據(jù);機(jī)器學(xué)習(xí);數(shù)據(jù)挖掘;聚類;k-means算法
隨著經(jīng)濟(jì)的不斷發(fā)展,市場(chǎng)中的大量產(chǎn)品供大于需,不同企業(yè)生產(chǎn)的同類同質(zhì)產(chǎn)品不免會(huì)產(chǎn)生激烈的競(jìng)爭(zhēng)。在這種市場(chǎng)環(huán)境下,企業(yè)若想提升產(chǎn)品競(jìng)爭(zhēng)力,就需要施行有針對(duì)性的營(yíng)銷策略,將客戶分而治之,將重點(diǎn)逐漸從產(chǎn)品質(zhì)量的競(jìng)爭(zhēng)向不同客戶滿意度的競(jìng)爭(zhēng)進(jìn)行轉(zhuǎn)變。
在大數(shù)據(jù)時(shí)代的當(dāng)下,數(shù)據(jù)不斷反映著我們?cè)谌粘I畹母鞣N信息。通過(guò)對(duì)大量數(shù)據(jù)的分析與處理,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一標(biāo)準(zhǔn)、屬性篩選從而獲取有用的信息。在如今的電子商務(wù)中,使用聚類的分析方法可以將客戶進(jìn)行細(xì)分,企業(yè)則可以將已經(jīng)細(xì)分的客戶類群作為銷售的單位,提供更有針對(duì)性的產(chǎn)品與服務(wù),從而提升企業(yè)銷售的競(jìng)爭(zhēng)性。
1 客戶細(xì)分
1.1 客戶細(xì)分概念
客戶細(xì)分是指企業(yè)根據(jù)客戶的屬性、行為、需求、偏好以及價(jià)值等因素,尋求客戶之間的共性特征,從而對(duì)客戶進(jìn)行與歸類。
1.2 客戶細(xì)分原因與做法
在信息快速流通的時(shí)代,企業(yè)與客戶之間的關(guān)系也不斷發(fā)生著變化。當(dāng)企業(yè)在沒(méi)有針對(duì)性的營(yíng)銷時(shí),通常會(huì)因?yàn)槠髽I(yè)產(chǎn)品與一類或多類客戶需求之間的不匹配,造成該一類或多類客戶的流失。若企業(yè)想要提升自己的產(chǎn)品競(jìng)爭(zhēng)性,就必須要了解客戶的需求,施行有針對(duì)的銷售。然而,有些產(chǎn)品若施行一對(duì)一的銷售會(huì)使銷售成本加大,從而也會(huì)影響銷售額。若將客戶的不同信息進(jìn)行篩選分析,從而將其進(jìn)行分類,對(duì)細(xì)分后的客戶類進(jìn)行多樣化具有針對(duì)性的銷售,則會(huì)達(dá)到事半功倍的效果。
在客戶細(xì)分中,不同方向劃分類別的做法也不盡相同。一般可以從不同的業(yè)務(wù)場(chǎng)景以及客戶關(guān)注的不同特征出發(fā),結(jié)合企業(yè)自身實(shí)力的有限資源來(lái)進(jìn)行細(xì)分。常用的參考種類有:消費(fèi)行為、消費(fèi)水平、客戶年齡段、消費(fèi)偏好等以及基于這些種類的多類組合。
消費(fèi)行為:根據(jù)客戶的消費(fèi)頻次、最近消費(fèi)時(shí)間、平均消費(fèi)金額等方面進(jìn)行分析,可以對(duì)客戶評(píng)級(jí),判斷客戶的價(jià)值。
消費(fèi)水平:按消費(fèi)水平劃分,對(duì)不同消費(fèi)水平的客戶提供不同的產(chǎn)品與服務(wù)。如會(huì)員卡分級(jí)策略。
客戶年齡段:客戶年齡段不同,客戶的消費(fèi)理念、產(chǎn)品需求也會(huì)不同。企業(yè)可以根據(jù)不同年齡段推薦不同的產(chǎn)品與服務(wù)。
消費(fèi)偏好:根據(jù)客戶的消費(fèi)習(xí)慣、生活方式、消費(fèi)場(chǎng)所等各方面的不同,從而整理出生活形態(tài)類似的客戶群,給客戶標(biāo)上不同的標(biāo)簽,從而推薦不同的產(chǎn)品與服務(wù)。如RFM模型。其中R、F、M分別指最近一次消費(fèi)、消費(fèi)頻次以及每筆平均消費(fèi)金額。
多類組合:多方面綜合分析客戶的屬性。
2 聚類分析
聚類是數(shù)據(jù)挖掘的最基本方法,一般在無(wú)目標(biāo)劃分中采用。通過(guò)聚類,從而將數(shù)據(jù)的組群分類標(biāo)簽化。其中要根據(jù)最大化類內(nèi)相似性(分類后盡可能保證同類內(nèi)有較高的相似性)、最小化類間相似性(分類后盡可能保證不同類之間有較低的相似性)原則進(jìn)行聚類與分組。
聚類的主要方法分為動(dòng)態(tài)聚類和層次聚類。
K-means算法是動(dòng)態(tài)聚類中的常用算法之一。該算法簡(jiǎn)單且結(jié)果直觀,適合對(duì)多維數(shù)據(jù)進(jìn)行聚類,但是僅適用于連續(xù)的變量,當(dāng)初始值與K值不同時(shí)結(jié)果也會(huì)不同。且結(jié)果無(wú)最優(yōu)解。
譜系聚類(hierarchical clustering)是層次聚類中經(jīng)典的方法。因?yàn)槠淇梢曅詮?qiáng)的特點(diǎn),通過(guò)不同公式與算法的多次計(jì)算,并根據(jù)實(shí)際業(yè)務(wù)分析可以得到最理想的分類。但是當(dāng)分析的樣本容量很大時(shí),會(huì)消耗巨大的資源。因此譜系聚類較適合小樣本使用。
3 K-means算法在客戶細(xì)分的應(yīng)用
3.1 K-means算法基本步驟
(1)選擇類群的K個(gè)值作為初始的聚類中心。
(2)計(jì)算每個(gè)數(shù)據(jù)到K個(gè)聚類中心的距離,并且按照其最小距離將每個(gè)數(shù)據(jù)分配到對(duì)應(yīng)最近的類,形成K個(gè)類。
(3)計(jì)算分類后的均值或者重心作為新的聚類中心,重新計(jì)算每個(gè)數(shù)據(jù)到K個(gè)聚類中心的距離,并將每個(gè)數(shù)據(jù)分配給對(duì)應(yīng)最近的類。
(4)不斷重復(fù)(2)、(3),直到前后計(jì)算的聚類中心不發(fā)生明顯的變化為止。
3.2 在客戶細(xì)分中的應(yīng)用
客戶細(xì)分應(yīng)用的數(shù)據(jù)來(lái)源來(lái)自于某市某銀行2018年客戶交易數(shù)據(jù),針對(duì)銀行客戶信息數(shù)據(jù)量大,采用K-means算法較適合。銀行客戶的分組應(yīng)結(jié)合業(yè)務(wù)經(jīng)驗(yàn)依據(jù)多類組合來(lái)施行。
異常處理:通過(guò)數(shù)據(jù)清洗,將數(shù)據(jù)中的異常值進(jìn)行去除與代替。本實(shí)例使用99分位點(diǎn)法對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。
相關(guān)降維分析:由于數(shù)據(jù)量大,對(duì)數(shù)據(jù)之間相關(guān)性強(qiáng)的變量進(jìn)行降維,從而降低數(shù)據(jù)之間的相關(guān)性。
數(shù)據(jù)標(biāo)準(zhǔn)化:將數(shù)據(jù)轉(zhuǎn)換為各種適當(dāng)?shù)母袷?,獲取需要的指標(biāo)。本實(shí)例抽取交易次數(shù)、平均月交易金額為主要標(biāo)準(zhǔn)數(shù)據(jù)指標(biāo)構(gòu)造。
聚類分析:本實(shí)例隨機(jī)抽取3000名客戶數(shù)據(jù),通過(guò)分析將K設(shè)為6,經(jīng)過(guò) K-means算法實(shí)驗(yàn),得到如下表所示聚類結(jié)果。
從聚類結(jié)果來(lái)看,A、B、F類客戶數(shù)量占比少,其中A類客戶月交易額大,交易次數(shù)頻繁,是銀行的重要價(jià)值客戶;B類客戶交易次數(shù)少,交易額低,是重要的發(fā)展客戶;F類客戶,交易次數(shù)不頻繁但交易額大,屬于銀行的潛力客戶。C、D、E類客戶數(shù)量占比較大,其中C類客戶月交易資金較大,交易次數(shù)較頻繁,屬于較重要的價(jià)值客戶;D類客戶數(shù)量大,交易次數(shù)略低,交易金額處于中等水平,屬于重要發(fā)展客戶;E類客戶數(shù)量最大,交易次數(shù)頻繁,月交易額較低,屬于一般價(jià)值客戶。針對(duì)不同類別的客戶,銀行就可以推薦不同的產(chǎn)品以及服務(wù)。例如針對(duì)F類用戶,銀行可以推薦定期存款或其他適合理財(cái)產(chǎn)品。
4 結(jié)語(yǔ)
在聚類分析中,K-Means算法是最常用且應(yīng)用最廣泛的算法之一,K-means算法簡(jiǎn)單,對(duì)計(jì)算機(jī)性能要求不高,因此適合大量數(shù)據(jù)樣本的聚類。該算法運(yùn)用迭代的方式使不同類間的距離達(dá)到最優(yōu),最終得到聚類中心(類內(nèi)某一特征的均值)。通過(guò)K-means算法對(duì)企業(yè)中客戶進(jìn)行細(xì)分,便于企業(yè)針對(duì)不同客戶推薦不同的產(chǎn)品與服務(wù)。這樣不僅促進(jìn)了企業(yè)的產(chǎn)品競(jìng)爭(zhēng)力,而且使客戶擁有更好的產(chǎn)品體驗(yàn)。
參考文獻(xiàn):
[1]Jiawei Han,Micheline Kamber,Jian Pei.數(shù)據(jù)挖掘概念與技術(shù)[M].第三版.北京:機(jī)械工業(yè)出版社,2012-07.
[2]張建萍,劉希亞.基于聚類分析的K-means算法研究與應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2007-05.
[3]李鑫鑫.聚類算法在電子商務(wù)客戶細(xì)分中的應(yīng)用研究[J].中國(guó)海洋大學(xué),2012.
[4]王麗萍,劉建平.基于密度的K-Means算法在客戶細(xì)分中應(yīng)用的研究[J].工業(yè)控制計(jì)算機(jī),2016-05-26.
作者簡(jiǎn)介:向昆竹(1998-),男,漢族,河南信陽(yáng)人,2016級(jí)本科生在讀,主要研究方向:網(wǎng)絡(luò)工程;侯皓文(1998-),男,漢族,河南信陽(yáng)人,2016級(jí)本科生在讀,主要研究方向:軟件工程。
通訊作者:黃凱(1997-),男,河南南陽(yáng)人,2016級(jí)本科生在讀,主要研究方向:網(wǎng)絡(luò)工程。