李 洋
(合肥城市學(xué)院 管理工程系,安徽 合肥 230071)
我國經(jīng)濟(jì)的發(fā)展極大地促進(jìn)了汽車市場的發(fā)展。據(jù)報道,在2020 年,我國的汽車銷量占據(jù)全球汽車市場的32%,汽車市場的競爭也越來越激烈。精準(zhǔn)營銷是指根據(jù)現(xiàn)有資料進(jìn)行分析,進(jìn)而制定面向購買可能性較強(qiáng)的客戶的策略[1]。許多學(xué)者對精準(zhǔn)營銷策略的應(yīng)用進(jìn)行了深入研究,如銀行客戶的精確營銷,及基于大數(shù)據(jù)分析的房地產(chǎn)銷售[2-3]?;诖髷?shù)據(jù)挖掘?qū)崿F(xiàn)精準(zhǔn)營銷,提升市場服務(wù),有利于汽車企業(yè)合理配置市場資源,提升市場競爭力[4]。因此,研究基于關(guān)聯(lián)規(guī)則算法中的Apriori 算法構(gòu)建汽車市場數(shù)據(jù)挖掘模型,根據(jù)數(shù)據(jù)挖掘結(jié)果進(jìn)行分析,從而實現(xiàn)汽車企業(yè)的精確營銷。研究結(jié)果表明:該模型具有較高的精度和實用性。
數(shù)據(jù)挖掘技術(shù)能夠從大量的數(shù)據(jù)中挖掘出有價值的信息,從而提高信息的利用效率。利用數(shù)據(jù)挖掘,能夠?qū)ι虅?wù)信息進(jìn)行有效處理,進(jìn)而獲取到一些容易忽略但非常重要的信息,進(jìn)而為商業(yè)決策提供數(shù)據(jù)支撐和依據(jù)[5-6]。數(shù)據(jù)挖掘的基本流程如圖1 所示。
圖1 數(shù)據(jù)挖掘的過程
目前,關(guān)聯(lián)規(guī)則算法是實現(xiàn)數(shù)據(jù)挖掘最常用的算法之一[7]。關(guān)聯(lián)規(guī)則能夠從大規(guī)模的數(shù)據(jù)集中,找到數(shù)據(jù)隱藏特征之間的相關(guān)性,進(jìn)而根據(jù)一種因素的顯現(xiàn)來預(yù)測和尋找到另一種因素的顯現(xiàn)。因此,關(guān)聯(lián)規(guī)則被廣泛應(yīng)用于購物籃問題,以分析顧客的消費習(xí)慣、消費意向以及不同商品之間的聯(lián)系[8-9]。關(guān)聯(lián)規(guī)則算法的基本步驟如下:設(shè)X={x1,x2,...,xn}為數(shù)據(jù)集中所有屬性的集合,Y={y1,y2,...,yN}則表示每一個實例的集合,且每一個實例都具有唯一性的標(biāo)示符,則任意實例yi所包含的項集都是X 的一個子集。其中項集是指屬性的集合。設(shè)A 和B 都是項集,且A 和B 之間有關(guān)聯(lián),設(shè)樣本A 為先導(dǎo),樣本B 為后繼,那么A 和B 的關(guān)聯(lián)規(guī)則蘊(yùn)含表達(dá)式可表述為A→B的形式。關(guān)聯(lián)規(guī)則的數(shù)量十分龐大,因此需要利用支持度(Support)與置信度(Confidence)來對關(guān)聯(lián)規(guī)則進(jìn)行篩選和過濾。
A→B的支持度計算方式如公式(1)所示。
式(1)可描述實例集Y 中同時包含A 和B 的實例集比例,即任意實例同時包含A 和B 的概率。A→B的支持度計算方式如公式(2)所示。
式(2)能夠表示在確定包含了A 的實例中出現(xiàn)Y 的概率。在利用關(guān)聯(lián)規(guī)則算法進(jìn)行數(shù)據(jù)挖掘時,需要預(yù)先設(shè)置兩個閾值,即最小支持度與最小置信度[10-11]。若項集A 滿足公式(3),那么A 就是一個頻繁項集。
在式(3)中,Min_Support表示最小支持度。在頻繁項集中得到的關(guān)聯(lián)規(guī)則,若滿足公式(4),則稱之為強(qiáng)關(guān)聯(lián)規(guī)則。
在式(4)中,Min_Confidence表示最小置信度。在基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘中,找出數(shù)據(jù)庫中的頻繁項集和強(qiáng)規(guī)則能夠有效地減少對數(shù)據(jù)庫的掃描時間,從而提高數(shù)據(jù)挖掘的效率。Apriori 算法是最常用的關(guān)聯(lián)規(guī)則算法之一,采用逐層搜索迭代的方法,主要包含了兩個步驟:首先是Apriori 算法通過迭代更新來尋找頻繁項集,且每一次迭代都會掃描數(shù)據(jù)庫,以避免頻繁項集的遺漏;其次,對于在迭代過程中尋找到的頻繁項集,通過計算找到滿足最小置信度的規(guī)則,即強(qiáng)規(guī)則,進(jìn)而生產(chǎn)關(guān)聯(lián)規(guī)則[12]。Apriori 算法通過掃碼數(shù)據(jù)庫中樣本的支持度,找出頻繁k-項集的集合K1;在下一次迭代過程中,利用頻繁項集集合K1 尋找(k+1)-項集的集合K2;依此類推,找到頻繁項集集合K3、K4、...,直到?jīng)]有新的頻繁項集集合產(chǎn)生,則算法結(jié)束。利用這種方式,能夠避免對數(shù)據(jù)庫中所有項集的支持度進(jìn)行計算,進(jìn)而減少Apriori 算法對數(shù)據(jù)庫進(jìn)行掃描所消耗的時間與空間,提高了數(shù)據(jù)挖掘的效率[13]。根據(jù)上述內(nèi)容,可構(gòu)建汽車市場數(shù)據(jù)挖掘模型,對汽車行業(yè)的大數(shù)據(jù)進(jìn)行深度挖掘,進(jìn)而調(diào)整汽車企業(yè)的營銷策略,實現(xiàn)精準(zhǔn)營銷。
一些學(xué)者認(rèn)為,顧客的購物行為主要受到4種因素的影響,時間、渠道、顧客及營銷信息。當(dāng)上述4 種因素均達(dá)到顧客的期望值,則營銷目標(biāo)的達(dá)成概率會大幅度提高?;诖耍岢鼍_營銷的概念,基于科學(xué)管理,利用人工智能等現(xiàn)代信息技術(shù)來挖掘并分析客戶的心理、行為,從而合理地定位并細(xì)分市場,并針對目標(biāo)客戶群體進(jìn)行制定差異化與針對性的營銷策略,以更好地增加企業(yè)效益。精準(zhǔn)營銷的大致結(jié)構(gòu)如圖2所示。
圖2 精準(zhǔn)營銷大致流程
在汽車行業(yè)的精確營銷中,數(shù)據(jù)挖掘技術(shù)的作用有客戶消費分析、客戶價值評估、發(fā)掘客戶的相關(guān)需求、提供相關(guān)服務(wù)和產(chǎn)品、分析并挽留流失客戶等。以某汽車公司C 企業(yè)為例,C 企業(yè)的數(shù)據(jù)庫中保存有大量的原始客戶購車數(shù)據(jù),這些原始數(shù)據(jù)有23 個維度,包括了客戶ID、客戶姓名、年齡、居住地、客戶類型、客戶從事工作、消費原因、消費目的、銷售渠道、銷售日期、汽車型號等屬性。數(shù)據(jù)庫中的樣本數(shù)據(jù)均源于真實的購車行為,因此根據(jù)這些樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和精確營銷具有較高的可靠性。對精確營銷而言,數(shù)據(jù)庫中的樣本數(shù)據(jù)冗余信息和屬性較多,因此需要對數(shù)據(jù)進(jìn)行預(yù)處理,如降噪、轉(zhuǎn)換和清理[14-15]。結(jié)合實際情況進(jìn)行分析并預(yù)處理后,樣本數(shù)據(jù)的結(jié)構(gòu)見圖3。
圖3 樣本數(shù)據(jù)結(jié)構(gòu)
根據(jù)圖3 所示對樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,分析樣本數(shù)據(jù)中不同維度的屬性的不同屬性值所占的比例,可獲取汽車銷售市場的地區(qū)飽和程度。將地區(qū)與其他屬性的數(shù)據(jù)進(jìn)行交互統(tǒng)計和分析,以及各地區(qū)消費者的購買因素、消費偏好和促銷手段偏好等信息,進(jìn)而實現(xiàn)精準(zhǔn)營銷。如將屬性值為東北地區(qū)的數(shù)據(jù)與購買因素交互,可獲取東北地區(qū)消費者的購買因素占比;與車型交互,則可獲取東北地區(qū)消費者對C 企業(yè)旗下生產(chǎn)的車型偏好。根據(jù)這些信息,可制訂合理的營銷策略,實現(xiàn)精準(zhǔn)營銷。
常用的數(shù)據(jù)挖掘算法有k-means 算法、遺傳算法(Genetic Algorithm,GA)、粒子群優(yōu)化算法(Particle swarm optimization,PSO)以及Apriori 算法。研究采用Apriori 算法構(gòu)建模型來進(jìn)行數(shù)據(jù)挖掘。模型的訓(xùn)練效果,會直接影響到數(shù)據(jù)挖掘效果和效率,為驗證Apriori 算法的挖掘性能和挖掘效率,分別利用上述算法構(gòu)建k-means 汽車市場數(shù)據(jù)挖掘模型、GA 汽車市場數(shù)據(jù)挖掘模型、PSO汽車市場數(shù)據(jù)挖掘模型以及Apriori 汽車市場數(shù)據(jù)挖掘模型。對C 企業(yè)數(shù)據(jù)庫中的樣本數(shù)據(jù)進(jìn)行預(yù)處理,將經(jīng)過預(yù)處理的樣本數(shù)據(jù)用于模型的測試,對比幾種模型達(dá)到目標(biāo)精度所需要的迭代數(shù)量。幾種模型的測試情況如圖4 所示。
圖4 幾種模型的訓(xùn)練效果
從圖4 中可看出,在采用相同的樣本數(shù)據(jù)對上述4 種模型訓(xùn)練后,Apriori 汽車市場數(shù)據(jù)挖掘模型在迭代了187 次后達(dá)到目標(biāo)精度;而k-means 汽車市場數(shù)據(jù)挖掘模型需要迭代756 次才能達(dá)到目標(biāo)精度,比Apriori 汽車市場數(shù)據(jù)挖掘模型多569 次;GA 汽車市場數(shù)據(jù)挖掘模型需要迭代697 次才能達(dá)到目標(biāo)精度,比Apriori 汽車市場數(shù)據(jù)挖掘模型多510 次;PSO 汽車市場數(shù)據(jù)挖掘模型在迭代962 次后達(dá)到目標(biāo)精度,比Apriori汽車市場數(shù)據(jù)挖掘模型多799 次。以上結(jié)果表明,Apriori 汽車市場數(shù)據(jù)挖掘模型的訓(xùn)練效率要顯著優(yōu)于其他幾種汽車市場數(shù)據(jù)挖掘模型,性能比其他模型更加優(yōu)秀。
汽車市場數(shù)據(jù)挖掘模型的數(shù)據(jù)挖掘效果,關(guān)系到汽車市場精準(zhǔn)營銷的營銷策略制訂,及精準(zhǔn)營銷的效果。將經(jīng)過預(yù)處理的10000 條樣本數(shù)據(jù),輸入到上述訓(xùn)練好的k-means 汽車市場數(shù)據(jù)挖掘模型、GA 汽車市場數(shù)據(jù)挖掘模型、PSO 汽車市場數(shù)據(jù)挖掘模型以及Apriori 汽車市場數(shù)據(jù)挖掘模型中,對比幾種模型對挖掘數(shù)據(jù)的屬性及屬性值的分類正確率,對比幾種模型的數(shù)據(jù)挖掘效果,如表1 所示。
表1 幾種模型的數(shù)據(jù)挖掘效果對比
通過表1 可看出,Apriori 汽車市場數(shù)據(jù)挖掘模型對樣本數(shù)據(jù)的屬性維度分類正確率為97.1%,總共挖掘時間為25 s,均比其他模型優(yōu)秀;而k-means 汽車市場數(shù)據(jù)挖掘模型對樣本數(shù)據(jù)的屬性維度分類正確率為92.1%,比Apriori 汽車市場數(shù)據(jù)挖掘模型低5%,總挖掘時間為31s,比Apriori 汽車市場數(shù)據(jù)挖掘模型多6 s。PSO 汽車市場數(shù)據(jù)挖掘模型對樣本數(shù)據(jù)的屬性維度分類正確率為91.7%,比Apriori 汽車市場數(shù)據(jù)挖掘模型低5.4%,總挖掘時間為35 s,比Apriori 汽車市場數(shù)據(jù)挖掘模型多10 s。GA 汽車市場數(shù)據(jù)挖掘模型對樣本數(shù)據(jù)的屬性維度分類正確率為91.6%,比Apriori 汽車市場數(shù)據(jù)挖掘模型低5.5%,總挖掘時間為29 s,比Apriori 汽車市場數(shù)據(jù)挖掘模型多4 s。以上結(jié)果說明,基于Apriori 算法構(gòu)建的汽車市場數(shù)據(jù)挖掘模型準(zhǔn)確率更高,性能更優(yōu)秀,更適用于汽車市場的精準(zhǔn)營銷。
將經(jīng)過預(yù)處理的樣本數(shù)據(jù)輸入到訓(xùn)練好的Apriori 汽車市場數(shù)據(jù)挖掘模型中,并將地區(qū)與車型兩個維度的屬性進(jìn)行交互統(tǒng)計,以進(jìn)行實證分析。地區(qū)與促銷手段之間的交互統(tǒng)計如表2 所示。
表2 地區(qū)與促銷手段之間的交互統(tǒng)計
從表2 中能看出,C 公司在華東地區(qū)的銷售額最多,這表明在華東地區(qū)的汽車市場已經(jīng)趨于飽和狀態(tài),因此只需要維持現(xiàn)狀;而在西北地區(qū)和東北地區(qū)的銷售額占比極低,分別占5.1%和3.2%,這表明這兩個地區(qū)的市場開發(fā)程度不夠,可以適當(dāng)投入資源開拓市場??傮w而言,促銷手段中的員工推銷手段促成的交易最多,銷售額占比為34.1%,其次則是老顧客介紹與推廣,分別為27.4%和24.0%、因此,C 企業(yè)需要在各個區(qū)域加強(qiáng)市場推銷。此外,還需要經(jīng)常聯(lián)系老顧客,重視顧客的意見。提升售后服務(wù)質(zhì)量,以提升顧客的消費滿意程度,進(jìn)而使老顧客自愿介紹新顧客,最終增加銷售額。同時,C 企業(yè)還需要加強(qiáng)推廣手段,如電視推銷、海報廣告等,提升自身汽車品牌的知名度。
基于汽車消費者大數(shù)據(jù)挖掘來實現(xiàn)精準(zhǔn)營銷,有利于提高顧客滿意度,提升汽車企業(yè)的市場競爭力,最終提升企業(yè)的銷售額。結(jié)果表明:Apriori 汽車市場數(shù)據(jù)挖掘模型的挖掘效果較好,具有較高的實用性。研究未對營銷策略進(jìn)行詳細(xì)分析,需要日后深入研究。