隋毅,杜宗格
(昆侖數(shù)智科技有限責(zé)任公司)
天然氣具有熱值高、清潔、高效等優(yōu)點,是低碳經(jīng)濟的代表。隨著節(jié)能減排和環(huán)境保護意識的提高,天然氣能源日益受到市場的青睞。尤其是“煤改氣”工程大范圍地推廣、天然氣發(fā)電裝機容量不斷增加,天然氣管網(wǎng)逐步完善,帶動了天然氣在發(fā)電、城市燃氣和工業(yè)燃料等諸多應(yīng)用領(lǐng)域的需求爆發(fā),并將維持高速增長趨勢,我國天然氣市場已進入快速發(fā)展階段。
隨著《石油天然氣管網(wǎng)運營機制改革實施意見》的發(fā)布,天然氣銷售市場化改革步伐加快,2019年12月9日國家石油天然氣管網(wǎng)集團有限公司正式成立,天然氣干線管道獨立,運銷分離,致使天然氣行業(yè)市場格局發(fā)生重大轉(zhuǎn)變。未來將有更多供氣商進入終端消費市場,并且可根據(jù)自身氣源情況擴大銷售范圍,終端用戶也將有更多選擇機會,終端消費市場競爭將更加激烈。
天然氣產(chǎn)品同質(zhì)性強,無明顯差異,天然氣銷售企業(yè)的市場競爭重心很大程度上是圍繞天然氣客戶資源展開。面對行業(yè)發(fā)展機遇,天然氣銷售企業(yè)需要主動適應(yīng)形勢變化,將以“客戶為中心”的服務(wù)理念深入經(jīng)營管理中,加強客戶管理、實現(xiàn)客戶細分、開展精準營銷、拓寬銷售渠道、完善客戶服務(wù),進一步提高客戶滿意度,增強客戶黏性。然而這些舉措得以落地的前提和基礎(chǔ)是全面深入地進行客戶洞察。本文基于天然氣客戶的購氣特征,將多維數(shù)據(jù)整合,建立了天然氣客戶標簽,形成客戶畫像和 360°視圖,同時通過數(shù)據(jù)挖掘算法,對客戶進行科學(xué)合理的分群,為實現(xiàn)精準營銷和個性化服務(wù)提供有效支撐,進一步提升客戶精細化管理水平。
客戶標簽是對客戶和業(yè)務(wù)特征進行分析提煉形成的多維度標記。天然氣客戶標簽設(shè)計是以天然氣客戶為中心,對客戶購氣特征進行總結(jié)歸納,形成客戶畫像。標簽設(shè)計的原則是兼顧完整性和代表性。不僅要把客戶的差異化特點全部展現(xiàn)出來,以最大程度保證標簽完整性,同時也需要有所側(cè)重,突出代表性,建立符合業(yè)務(wù)需要的客戶 360°視圖。天然氣客戶標簽部分指標如圖1所示。
圖1 天然氣客戶標簽設(shè)計(部分指標示意)
天然氣銷售的業(yè)務(wù)場景蘊含在客戶、產(chǎn)品和企業(yè)之間的交互行為上??蛻羰侵行?,企業(yè)通過產(chǎn)品服務(wù)于客戶??蛻襞c產(chǎn)品的交互體現(xiàn)在客戶購買產(chǎn)品、使用產(chǎn)品等環(huán)節(jié);客戶與企業(yè)的交互體現(xiàn)在提報需求、服務(wù)反饋等環(huán)節(jié)。通過分析天然氣銷售的業(yè)務(wù)場景,將天然氣客戶標簽總結(jié)歸納為三大類:客戶基本特征、消費行為特征、計劃執(zhí)行特征。
客戶基本特征是客戶自身具有的屬性,主要分為客戶基本信息、財務(wù)信用情況和客戶狀態(tài)。客戶基本信息是客戶固有屬性,包括客戶名稱、行業(yè)類型等;財務(wù)信用情況是客戶在最近一年內(nèi)履約付款情況,包括預(yù)付款余額、是否有欠款等;客戶狀態(tài)是客戶交易變化趨勢,包括客戶貢獻價值、客戶流失預(yù)警等。
消費行為特征是客戶購買產(chǎn)品、使用產(chǎn)品所表現(xiàn)出來的行為規(guī)律,從時間角度分為近期購氣規(guī)律、歷史購氣規(guī)律和季節(jié)偏好。近期購氣規(guī)律是客戶在最近一年內(nèi)購氣變化的行為規(guī)律,包括年購氣量、銷售價格等;歷史購氣規(guī)律是客戶最近三年內(nèi)購氣變化的行為規(guī)律,包括年購氣量同比增長率、月均購氣量同比增長率等;季節(jié)偏好是客戶在四個季度中購氣變化的行為規(guī)律,包括四個季度的購氣量及其占比情況。
計劃執(zhí)行特征是客戶與企業(yè)的交互規(guī)律,客戶購買天然氣須及時提交購氣計劃,企業(yè)根據(jù)民用保供、調(diào)峰及資源調(diào)配等情況調(diào)整并發(fā)布購氣計劃。計劃購氣情況包括年計劃購氣量、月計劃符合率等;壓減執(zhí)行情況是客戶配合保供政策進行壓減購氣的實施情況,包括日壓減百分比、冬季壓減百分比等。
基于客戶標簽設(shè)計實現(xiàn)了天然氣客戶的多維度分析,但在全面展現(xiàn)每個客戶畫像的同時也要掌握客戶之間的內(nèi)在關(guān)聯(lián)。通過數(shù)據(jù)挖掘算法實現(xiàn)客戶分群,能夠更加深入地洞察各類客群的特征,為營銷、銷售和服務(wù)提供有效的數(shù)據(jù)支撐[1]。
數(shù)據(jù)挖掘技術(shù)中的聚類分析是科學(xué)合理地進行天然氣客戶細分的理論基礎(chǔ)。聚類分析是將一個數(shù)據(jù)集劃分為若干個組,并使同一組內(nèi)數(shù)據(jù)對象的相似度盡可能高,而不同組間數(shù)據(jù)對象的差別性盡可能大的過程。聚類分析算法主要有K-means聚類、層次聚類、兩步聚類等,本文選取了在客戶細分領(lǐng)域應(yīng)用最廣泛的K-means聚類算法。
K-means聚類算法是一種非監(jiān)督的聚類算法,在最小化誤差函數(shù)的基礎(chǔ)上將數(shù)據(jù)劃分為預(yù)定的 K類[2]。K-means聚類算法的一般步驟如下:
(1)從樣本集中選取 K個樣本作為初始簇中心;
(2)計算每個樣本與各簇中心之間的距離,然后把樣本劃入最近的簇中;
(3)重新計算每個簇的中心點(取平均值),更新簇中心;
(4)重復(fù)步驟 2、3,直到簇中心不再發(fā)生變化或者達到某個終止條件;
(5)輸出最終的簇中心和K個聚類劃分。
下面基于K-means聚類算法實現(xiàn)天然氣客戶分群過程。
本文分析的數(shù)據(jù)來源于某公司的批發(fā)客戶數(shù)據(jù),包括客戶基本信息、交易信息、價格信息等。
本文選用數(shù)據(jù)挖掘軟件SPSS Modeler 16.0對數(shù)據(jù)進行篩選、清洗和建模。
3.2.1 數(shù)據(jù)篩選
選取了50%的客戶作為分析對象,這些客戶數(shù)據(jù)相對完整,共1 951個客戶,650萬條記錄。
3.2.2 數(shù)據(jù)清洗和標準化
處理錯誤或缺失數(shù)據(jù),刪除重復(fù)數(shù)據(jù),提高數(shù)據(jù)質(zhì)量。由于距離是K-means聚類的基礎(chǔ),它直接影響最終的聚類結(jié)果,通常在分析前剔除影響距離正確計算的因素,對連續(xù)型變量進行數(shù)據(jù)標準化處理,去除變量量綱的影響,將有量綱的數(shù)值轉(zhuǎn)化為無量綱的數(shù)值[3]。SPSS Modeler 16.0在進行聚類分析時可自動將變量進行轉(zhuǎn)化。
3.2.3 構(gòu)建衍生變量
為了探索各變量對客戶分群的影響,基于天然氣客戶基本信息、交易信息等數(shù)據(jù),根據(jù)客戶標簽的設(shè)計,構(gòu)建了78個衍生變量,建立客戶寬表。
K-means聚類算法需要計算各樣本之間的距離及簇的平均值,輸入變量優(yōu)先選擇連續(xù)型變量。本文構(gòu)建的78個衍生變量中有59個變量為連續(xù)型變量,其中部分變量相關(guān)性較強,若全部用于聚類會導(dǎo)致聚類效果較差,因此需要對變量進行降維處理。
主成分分析是目前常用的一種降維方法,它將多個相互關(guān)聯(lián)的數(shù)值指標轉(zhuǎn)化為少數(shù)幾個互不相關(guān)的綜合指標,即用較少的指標來代替和反映原來較多的信息,這些綜合指標代表原來指標的主要成分,通常將特征值大于 1,且累計貢獻率大于 70%作為指標篩選的判斷標準[4]。
使用SPSS Modeler 16.0軟件主成分分析節(jié)點進行降維處理,即選取特征值大于1的前11個主成分,其載荷矩陣對應(yīng)的累計貢獻率達到 81.2%,也就是選取包含了全部變量所具有的81.2%信息的前11個主成分。為了更易于對變量進行業(yè)務(wù)解釋,采用最大方差法進行因子旋轉(zhuǎn),旋轉(zhuǎn)后的因子具有差異化的特征[5]。根據(jù)旋轉(zhuǎn)后的貢獻度和業(yè)務(wù)經(jīng)驗最終選擇了11個最具代表性的變量作為輸入變量,分別是月均購氣量、上月購氣量環(huán)比、月壓減百分比均值、本年第二、四季度購氣量占比、月計劃符合率、預(yù)付款余額均值、月均購氣量同比增長率以及本年第二、三、四季度購氣量同比增長率。其中,月壓減百分比均值是月需求量減去月購氣量再除以月需求量百分比的平均值;月計劃符合率是月購氣量符合月計劃量的月份占比;月均購氣量同比增長率是月均購氣量相比上年月均購氣量的增長百分比。
本次建模采用輪廓系數(shù)作為評價指標。輪廓系數(shù)是將數(shù)據(jù)集的任一對象與本簇中其他對象的相似性,以及該對象與其他簇中對象的相似性進行量化,并將量化后的兩種相似性進行比較,獲得聚類優(yōu)劣的評價標準[6]。輪廓系數(shù)取值處于[-1,1]范圍內(nèi),系數(shù)小于0,說明聚類效果不佳;系數(shù)大于0小于0.5,說明聚類效果一般;系數(shù)大于0.5,越接近1表示聚類效果越好[7]。根據(jù)輪廓系數(shù)值可以確定K的取值。通常K值不會設(shè)置過大,可以通過枚舉法從2開始設(shè)置K值,在每個K值上自動迭代,并計算當(dāng)前K值對應(yīng)的輪廓系數(shù),選取最大輪廓系數(shù)對應(yīng)的K值作為最終聚類數(shù)目。本文最終選擇聚類數(shù)目為 4,輪廓系數(shù)為0.53的聚類模型。
通過運用聚類模型,天然氣客戶聚類的分布情況如圖2所示,其中聚類2包含客戶最多,占46.9%,而聚類3包含客戶最少,僅有5.3%。
圖2 客戶分群占比
執(zhí)行K-means聚類后結(jié)果如表1所示,表中數(shù)據(jù)為每個簇在各變量中的均值,其中月均購氣量和預(yù)付款余額均值出于客戶數(shù)據(jù)敏感性考慮,分別以聚類1的均值為參照基準,進行相對標準化轉(zhuǎn)換。
表1 客戶聚類分析結(jié)果 單位:%
聚類1是高價值購氣增長型客戶。這類客戶的特點是:月均購氣量最高;預(yù)付款余額均值最高;月均購氣量同比增長率較高,第二季度購氣量同比增長率最高,第三、四季度購氣量同比增長也實現(xiàn)翻番;上月購氣量環(huán)比較高;月壓減百分比均值居中,可壓減空間一般;第二季度和第四季度購氣量占比居中;月計劃符合率一般。
聚類2是穩(wěn)定購氣型客戶。這類客戶的特點是:月計劃符合率最高;月壓減百分比均值最低,可壓減空間最小;月均購氣量較高;月均購氣量同比增長率最低,上月購氣量環(huán)比也略低;第二季度和第四季度購氣量占比居中;第二季度購氣量同比增長率較高,第三、四季度購氣量同比增長率略低;預(yù)付款余額均值略低。
聚類3是低價值流失型客戶。這類客戶的特點是:月均購氣量最低;上月購氣量環(huán)比最低;預(yù)付款余額均值最低;月計劃符合率最低;月均購氣量同比增長率較低,第二季度購氣量同比增長率較低,第三及第四季度購氣量同比增長率最低且負增長;月壓減百分比均值居中,可壓減空間一般;第二季度購氣量占比最高,第四季度購氣量占比最低。
聚類4是冬季補充購氣型客戶。這類客戶的特點是:月均購氣量較低;第二季度購氣量占比最低,第四季度購氣量占比最高;月均購氣量同比增長率最高,但第二季度購氣量同比增長率最低,第三、四季度購氣量同比增長率最高;上月購氣量環(huán)比最高;月壓減百分比均值最高,可壓減空間最大;月計劃符合率較低;預(yù)付款余額均值較高。
根據(jù)上述聚類結(jié)果,天然氣行業(yè)銷售企業(yè)可以針對不同類型的客戶特征,提供更有針對性的營銷和服務(wù),對企業(yè)市場開發(fā)和提升銷售利潤具有重要的指導(dǎo)意義。
聚類1的客戶月均購氣量最高,四個季度購氣量較為均衡,預(yù)付款余額最多,屬于最優(yōu)質(zhì)的客戶類型。這類客戶購氣已呈現(xiàn)高增長趨勢,為了進一步挖掘其潛在購買力,可適時考慮拓展非氣業(yè)務(wù),增加單客戶收入。對于這類高價值客戶,客戶經(jīng)理應(yīng)該定期拜訪,繼續(xù)維持良好的客戶黏性,保持客戶的忠誠度。
聚類2的客戶數(shù)量最多,四個季度購氣量也較為均衡,計劃購氣符合度最高,可壓減空間最小,屬于最穩(wěn)定的客戶類型。這類客戶不僅有利于確保產(chǎn)用平衡,使長輸管道運行壓力相對平穩(wěn),而且有利于天然氣計劃調(diào)度管理,系統(tǒng)控制管網(wǎng)資源,為下游用戶用氣提供可靠保障。
聚類3的客戶月均購氣量最低,四個季度購氣量不均衡,屬于最搖擺的客戶類型。各季度購氣量同比增長率均偏低,說明該類客戶具有潛在的流失風(fēng)險,在氣源充足的情況下,可采取必要的挽留措施,把這類中立搖擺的客戶轉(zhuǎn)化為高忠誠度客戶,有效減少客戶流失,擴展市場份額,增加銷售收入。
聚類4的客戶明顯偏好第四季度購氣,第三、四季度購氣量同比增長率非常高,同時壓減執(zhí)行情況最好,屬于季節(jié)性的客戶類型。在第三季度調(diào)峰壓力小,可在第三季度提供充足的購氣量,但在第四季度冬季調(diào)峰壓力大,可優(yōu)先考慮對其壓減,確保調(diào)峰保供。
本文基于天然氣客戶標簽,分析客戶購氣規(guī)律,通過K-means聚類算法對客戶群體進行細分,總體聚類效果較好,各類客群業(yè)務(wù)特征明顯。下一步將持續(xù)改進和完善客戶聚類模型,按照不同區(qū)域、省份、行業(yè)、客戶類型等維度分別探索和挖掘數(shù)據(jù)的價值。在歷史數(shù)據(jù)量積累充足的情況下,融入預(yù)測性分析,實現(xiàn)更精準的客戶洞察。未來結(jié)合天然氣客戶分群結(jié)果以及客戶標簽中單一或多標簽組合的綜合業(yè)務(wù)應(yīng)用,可以形成“一客一策”的市場營銷和客戶維系策略,有效提升客戶體驗,為實現(xiàn)企業(yè)與客戶的共贏帶來新的價值增長點。