劉婷婷+王小麗+葛明濤
摘 要:伴隨著航空公司的競(jìng)爭(zhēng)日益劇烈,怎樣改善個(gè)性化服務(wù)提高客戶滿意度是公司在體驗(yàn)經(jīng)濟(jì)時(shí)代必須面對(duì)的問(wèn)題。面對(duì)海量數(shù)據(jù),傳統(tǒng)的統(tǒng)計(jì)辦法弊病浮現(xiàn),筆者嘗試用數(shù)據(jù)挖掘技術(shù)處理航空公司客戶價(jià)值分析問(wèn)題。數(shù)據(jù)挖掘技術(shù)應(yīng)用到航空范疇,可以實(shí)現(xiàn)對(duì)航空公司現(xiàn)有數(shù)據(jù)資源深度挖掘,為航空公司針對(duì)不同的客戶群采取個(gè)性化的營(yíng)銷方案提供科學(xué)依據(jù)。本文的創(chuàng)新之處在于將數(shù)據(jù)挖掘技術(shù)應(yīng)用于解決航空公司具體問(wèn)題之中,目的在于提高客戶價(jià)值分析的準(zhǔn)確性和高效性,提高信息化應(yīng)用水平。
關(guān)鍵詞:數(shù)據(jù)挖掘;客戶價(jià)值分析;K-Means聚類分析
DOI:10.16640/j.cnki.37-1222/t.2017.04.248
1 緒論
體驗(yàn)經(jīng)濟(jì)時(shí)代消費(fèi)趨勢(shì)主要有以下六個(gè)方面:體驗(yàn)化、情感化、個(gè)性化、主動(dòng)化、休閑化和求美化。[1]第三次工業(yè)革命以來(lái),現(xiàn)代信息技術(shù)得到迅猛發(fā)展,各行各業(yè)意識(shí)到數(shù)據(jù)的重要性,建立了無(wú)數(shù)的數(shù)據(jù)庫(kù),面對(duì)數(shù)以億計(jì)的數(shù)據(jù),傳統(tǒng)的統(tǒng)計(jì)方法的弊端日益顯現(xiàn)。人們面對(duì)海量的數(shù)據(jù),卻不能挖掘出有用的信息,隨著“數(shù)據(jù)爆炸”困惑的增加,人們迫切需要新的數(shù)據(jù)處理技術(shù),因而數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。法國(guó)著名雕塑家羅丹說(shuō),生活中從不缺少美,而是缺少發(fā)現(xiàn)美的眼睛。如今,企業(yè)從不缺少數(shù)據(jù),而是缺少挖掘數(shù)據(jù)價(jià)值的能力。通過(guò)對(duì)現(xiàn)有數(shù)據(jù)的挖掘,發(fā)現(xiàn)隱藏在數(shù)據(jù)里的模式,有用信息,指導(dǎo)航空公司作出決策,增加顧客的滿意度,是航空公司必須解決的問(wèn)題。自從1989年舉行的第十一屆國(guó)際聯(lián)合公認(rèn)學(xué)術(shù)會(huì)上首次提出數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)(KDD),到目前為止,美國(guó)人工智能協(xié)會(huì)曾經(jīng)舉辦了9次KDD全球研討會(huì)。規(guī)模從原來(lái)的專題討論會(huì)到策略和技術(shù)的集成以及多學(xué)科跨領(lǐng)域融合。數(shù)據(jù)挖掘技術(shù)迅速在航空電子領(lǐng)域,航空安全領(lǐng)域,航空維修等等航空領(lǐng)域得到較好的應(yīng)用與發(fā)展。我國(guó)在上世紀(jì)90年代的時(shí)候就已經(jīng)開始的對(duì)數(shù)據(jù)挖掘的研究,經(jīng)過(guò)多年的研究,我國(guó)已經(jīng)形成數(shù)據(jù)挖掘基礎(chǔ)理論的框架,并且越來(lái)越多的學(xué)者投入數(shù)據(jù)挖掘的研究之中。不過(guò)相對(duì)于國(guó)外來(lái)說(shuō),我國(guó)的數(shù)據(jù)挖掘應(yīng)用并沒(méi)有得到較高的發(fā)展,依然面臨著嚴(yán)重的挑戰(zhàn),仍舊有很多問(wèn)題等待著研究人員去探索和發(fā)現(xiàn)。
2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘有三大步驟:第一數(shù)據(jù)籌備,第二數(shù)據(jù)挖掘,第三結(jié)果表達(dá)和解釋[5]。
數(shù)據(jù)籌備包含數(shù)據(jù)集成,數(shù)據(jù)選擇,目標(biāo)數(shù)據(jù)預(yù)處理。
數(shù)據(jù)挖掘主要是對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行挖掘。
結(jié)果表達(dá)和解釋即我們所說(shuō)的結(jié)果可視化。
3 航空公司客戶價(jià)值分析
3.1 傳統(tǒng)客戶價(jià)值分析方法
傳統(tǒng)的客戶價(jià)值分析使用RFM方法(Recency--最近購(gòu)買日期, Frequency--各時(shí)期購(gòu)買頻率, Monetary一段時(shí)間內(nèi)消費(fèi)總和)在多數(shù)領(lǐng)域中的多數(shù)情況下能有效地預(yù)測(cè)老顧客今后可能的消費(fèi)行為和費(fèi)用,之后對(duì)銷售毛利率、關(guān)系營(yíng)銷費(fèi)用進(jìn)行預(yù)測(cè),就能按不同時(shí)間段分析出今后短期內(nèi)的客戶價(jià)值。[6]說(shuō)明, 在這種分析方法中,客戶價(jià)值是指CRM毛利。CRM毛利 = 購(gòu)買金額 - 產(chǎn)品成本 - 關(guān)系營(yíng)銷費(fèi)用。[7]
RFM模型以Recency為X軸,F(xiàn)requency為Y軸,Monetary為Z軸做一個(gè)三維立體模型,可以把客戶價(jià)值分為八種:重要發(fā)展客戶、重要價(jià)值客戶、一般發(fā)展客戶、一般價(jià)值客戶、一般保持客戶、一般挽留客戶、重要保護(hù)客戶、重要挽留客戶。
由于航空公司客戶的獨(dú)特性,RFM方法分析航空公司客戶價(jià)值存在多種弊端和不足,造成分析結(jié)果的不準(zhǔn)確和實(shí)用性降低。
(1)在RFM模型中,消費(fèi)金額是一段時(shí)間內(nèi)客戶消費(fèi)總和,由于航空票價(jià)受到運(yùn)輸距離,艙位等級(jí),閑忙時(shí),天氣等眾多因素的影響,同樣消費(fèi)金額的客戶對(duì)于航空公司的價(jià)值是不同的。所以用這個(gè)指標(biāo)分析航空公司客戶價(jià)值存在不妥。
(2)RFM是使用屬性分箱法分析客戶價(jià)值的,這種方法細(xì)分客戶群較多,需要逐個(gè)識(shí)別客戶特征和行為,大大提高的針對(duì)性營(yíng)銷的成本。
(3)RFM方法在處理大量數(shù)據(jù)時(shí)由于模型的限制需要的成本較高。
3.2 航空公司客戶數(shù)據(jù)分析方法與步驟
航空客戶信息,包含會(huì)員檔案信息和其他乘坐航班記錄信息等
(1)因?yàn)橄M(fèi)金額總和這一指標(biāo)在航空公司客戶價(jià)值分析過(guò)程中不太實(shí)用,所以我們可以選擇航空客戶在一段時(shí)間內(nèi)積累的乘坐距離M和乘坐艙位折扣系數(shù)平均值C來(lái)替代消費(fèi)金額總和。同時(shí),因?yàn)楹娇展緯?huì)員的加入時(shí)間一定程度上可以影響客戶價(jià)值,所以我們?cè)诤娇展究蛻魞r(jià)值分析模型中添加客戶關(guān)系長(zhǎng)度L,當(dāng)做區(qū)分客戶價(jià)值的另一個(gè)指標(biāo),所以我們構(gòu)建出LRFMC模型。
(2)使用聚類分析的方法把客戶進(jìn)行分類,并且分析客戶群的特征,分析客戶價(jià)值。
第1步數(shù)據(jù)抽取。
(1)以2014年3月31為結(jié)束日期,選取寬度為兩年的時(shí)間段作為分析觀測(cè)窗口,抽取觀測(cè)窗口內(nèi)有乘機(jī)記錄的所有顧客的詳細(xì)資料形成歷史數(shù)據(jù)。對(duì)于后來(lái)新增客戶信息利用數(shù)據(jù)中最大的某個(gè)時(shí)間作為結(jié)束時(shí)間,采用同樣的方法進(jìn)行抽取,形成增量數(shù)據(jù)。
(2)根據(jù)末次飛行日期從航空公司系統(tǒng)內(nèi)抽取2012年4月1日至2014年3月31日內(nèi)所有所有乘客的詳細(xì)數(shù)據(jù),共62988條記錄。
第2步數(shù)據(jù)探索分析。
在原始數(shù)據(jù)中存在票價(jià)為空的情況,票價(jià)為空值的數(shù)據(jù)有可能是航空客戶未有乘機(jī)記錄造成的。票價(jià)最小值為0,折扣率最小值為0,總飛行里程不為0的數(shù)據(jù)有可能是顧客使用0折機(jī)票或者是使用積分兌換的機(jī)票造成的。
第3步數(shù)據(jù)預(yù)處理。
(1)數(shù)據(jù)清洗:從航空公司業(yè)務(wù)和數(shù)據(jù)挖掘建模需要考慮篩選出需要的數(shù)據(jù)。
A)不需要票價(jià)為空的數(shù)據(jù)。
B)不需要票價(jià)為0,平均折扣率不為0,總飛行里程不為0的數(shù)據(jù)。
(2)屬性規(guī)約。在原始數(shù)據(jù)中數(shù)據(jù)屬性太多,我們只需要與LRFMC模型相關(guān)的6個(gè)數(shù)據(jù)屬性,所以我們需要?jiǎng)h除不相關(guān),弱相關(guān)和冗余的數(shù)據(jù)屬性。
(3)數(shù)據(jù)變換。A)數(shù)據(jù)屬性構(gòu)造 B)數(shù)據(jù)標(biāo)準(zhǔn)化
第4步建構(gòu)模型。
構(gòu)建航空公司客戶價(jià)值分析LRFMC模型
A)客戶K-Means聚類分析 B)客戶價(jià)值分析 C)應(yīng)用模型
A客戶K-Means聚類分析。
采用K-Means辦法對(duì)所有客戶數(shù)據(jù)進(jìn)行聚類分析,將客戶數(shù)據(jù)聚為5類。(具體情況具體分析,必須依據(jù)實(shí)際狀況決定分幾類)
B客戶價(jià)值分析。
對(duì)聚類結(jié)果進(jìn)行屬性分析:顧客群1在L、M屬性上最??;顧客群2在R屬性上最大,在F、M上最小;客戶群3在屬性F、M上最大,在R上最??;客戶群4在屬性L上最大;客戶群5在屬性C上最大。
根據(jù)航空公司業(yè)務(wù)定義為五個(gè)等級(jí)的客戶類別:重要保持客戶,重要發(fā)展客戶,重要挽留客戶,普通價(jià)值客戶,低價(jià)值客戶。
根據(jù)每種客戶群類型的特征對(duì)客戶群進(jìn)行客戶價(jià)值排名,以便獲得高價(jià)值客戶的信息。
C模型應(yīng)用:根據(jù)每種客戶群的特征,可以采取更多個(gè)性化服務(wù)和營(yíng)銷策略。
由于各種行業(yè)面臨的具體問(wèn)題不同,數(shù)據(jù)挖掘技術(shù)的發(fā)展受到不同的挑戰(zhàn),不過(guò)總大趨勢(shì)來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)必將會(huì)得到更好發(fā)展和更加普遍的運(yùn)用。隨著數(shù)據(jù)量爆炸式的激增,分析決策難度的增加,傳統(tǒng)分析方法弊端的顯現(xiàn),人們對(duì)分析決策智能化和自動(dòng)化的迫切需求,數(shù)據(jù)挖掘技術(shù)與工具將得到更廣泛的使用和發(fā)展。在數(shù)據(jù)爆炸時(shí)代,航空公司面臨的新挑戰(zhàn)為數(shù)據(jù)挖掘技術(shù)提供了發(fā)展背景,個(gè)性化服務(wù)的發(fā)展為數(shù)據(jù)挖掘技術(shù)提供了很好的基礎(chǔ)和發(fā)展平臺(tái)。
數(shù)據(jù)挖掘未來(lái)會(huì)吸引越來(lái)越多的研究人員,會(huì)涌現(xiàn)出越來(lái)越多的研究成果。從目前來(lái)看,數(shù)據(jù)挖掘在中國(guó)的研究與應(yīng)用還有很多務(wù)實(shí)的問(wèn)題沒(méi)有解決。本文僅僅是數(shù)據(jù)挖掘技術(shù)在航空公司客戶價(jià)值分析中的初步嘗試,展望未來(lái)數(shù)據(jù)挖掘的發(fā)展,有以下幾點(diǎn)需要注意的地方:要充分考慮是否有必要進(jìn)行數(shù)據(jù)挖掘。傳統(tǒng)的數(shù)據(jù)分析辦法的確有很多弊病,但是相對(duì)于傳統(tǒng)的方法數(shù)據(jù)挖掘需要成本較高。在傳統(tǒng)數(shù)據(jù)分析技術(shù)可以滿足要求的情況下,沒(méi)有必要必須進(jìn)行數(shù)據(jù)挖掘,這樣能更加節(jié)省成本。數(shù)據(jù)挖掘需要較大的成本,須要大量的人力,物力和財(cái)力用于數(shù)據(jù)籌備,數(shù)據(jù)搜集,問(wèn)題建模,生成模型和數(shù)據(jù)分析等等。
參考文獻(xiàn):
[1]吳釗.體驗(yàn)經(jīng)濟(jì)時(shí)代六大消費(fèi)趨勢(shì)[J].商業(yè)研究,2003(24).[2]Jiaweihan,Miche line kan ber.Data ming:Concepts and techniques.Diane Cerra Publisher.20063
[3]劉浩,韓晶.MATLAB R2014a一本通[J].電子工業(yè)出版社.
[4]李定遠(yuǎn).CIO時(shí)代網(wǎng).2012,09(29).
[5]耿向華.數(shù)據(jù)挖掘在旅游商務(wù)系統(tǒng)中的應(yīng)用研究[J].魅力中國(guó),2013,5(27).
[6]郭良.基于數(shù)據(jù)挖掘技術(shù)的客戶信息分析[J].華東師范大學(xué)碩士論文,2015.
[7]郭良.基于數(shù)據(jù)挖掘技術(shù)的客戶信息分析[J].華東師范大學(xué)碩士論文,2015.
項(xiàng)目基金:鄭州大學(xué)西亞斯國(guó)際學(xué)院2016校級(jí)課題,編號(hào)2016KY0