周麗莉 王寶軍 梁文敏 袁秋萍 梁鈺娟
摘 要:本文針對電子商務(wù)產(chǎn)品銷售組合的智能化構(gòu)建開展研究,將關(guān)聯(lián)規(guī)則融入PDCA循環(huán)之中,利用其螺旋上升、持續(xù)優(yōu)化的機(jī)制,不斷提升和改進(jìn)關(guān)聯(lián)規(guī)則的生成,并將隨著時間推移不斷變化的消費者需求因素引入到產(chǎn)品組合的構(gòu)建之中,從而幫助電商企業(yè)智能化動態(tài)構(gòu)建和優(yōu)化產(chǎn)品組合。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;PDCA;產(chǎn)品組合;電子商務(wù)
一、引言
隨著電子商務(wù)的高速發(fā)展,企業(yè)的競爭不斷加劇,如何為消費者有效地推送產(chǎn)品組合,成為電商企業(yè)提升客單價與盈利能力的重要手段。傳統(tǒng)的產(chǎn)品銷售組合往往依賴于企業(yè)經(jīng)營者的個人經(jīng)驗以及靜態(tài)的統(tǒng)計分析,時效滯后且精準(zhǔn)度不足。本文將PDCA戴明循環(huán)與關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法相結(jié)合,幫助企業(yè)開展產(chǎn)品組合的智能化構(gòu)建研究,利用企業(yè)歷史交易數(shù)據(jù),動態(tài)地、精準(zhǔn)地智能化構(gòu)建產(chǎn)品組合。
二、研究背景與相關(guān)理論
1.研究背景
國內(nèi)外學(xué)者針對大數(shù)據(jù)、數(shù)據(jù)挖掘技術(shù)與電子商務(wù)的結(jié)合開展了大量研究,但數(shù)據(jù)挖掘與電商產(chǎn)品組合相關(guān)的研究較少,與管理方法融合的研究更為缺乏。本文將PDCA循環(huán)的管理思想與關(guān)聯(lián)規(guī)則融合應(yīng)用,通過計劃、執(zhí)行、檢查、處理的迭代思想,不斷循環(huán)調(diào)整與優(yōu)化,實時、動態(tài)、精準(zhǔn)的生成產(chǎn)品組合。
2.相關(guān)理論
(1)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的重要技術(shù),其反映一個事物與其他事物之間的相互依存性和關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則挖掘目的是發(fā)現(xiàn)強(qiáng)關(guān)聯(lián)規(guī)則,也就是從數(shù)據(jù)中挖掘出滿足用戶需要設(shè)定的最小支持度和最小置信度的規(guī)則。
關(guān)聯(lián)規(guī)則的一般表示形式為:X->Y(S=s%,C=c%)
其中:X表示前項可以是一個項目或者項集,Y表示后項一般為一個項目。
支持度Support(X->Y)=P(X∪Y)是X與Y同時被消費者購買的概率。
置信度Confidence(X->Y)=P(Y|X)是消費者在購買X之后再購買Y的條件概率。
提升度Lift(X->Y)=P(Y|X)/P(X)P(Y)是判斷關(guān)聯(lián)規(guī)則實用性的指標(biāo),當(dāng)提升度大于1,表示X出現(xiàn)對Y的正向促進(jìn),如果小于1,則X與Y為負(fù),等于1則表示不相關(guān)。
本文將選取Apriori作為關(guān)聯(lián)規(guī)則的挖掘算法,該算法具有單維、單層、布爾型的特點,是經(jīng)典的關(guān)聯(lián)規(guī)則算法。
(2)PDCA循環(huán)
PDCA循環(huán)將管理分為四個階段,是一個不斷前進(jìn)的工作循環(huán),每通過一次PDCA循環(huán),就要進(jìn)行檢查總結(jié),分析仍存在問題,提出新目標(biāo),再進(jìn)行循環(huán)優(yōu)化。
(3)產(chǎn)品組合
產(chǎn)品組合指某個銷售商所能提供給消費者整套的或者搭配銷售的產(chǎn)品或項目組合,產(chǎn)品之間往往具有相關(guān)性,能夠引導(dǎo)消費者同時購買,通過產(chǎn)品組合的設(shè)計,可以幫助企業(yè)優(yōu)化客戶體驗、提升客戶轉(zhuǎn)化率與客單價。
三、模型設(shè)計
企業(yè)在經(jīng)營過程中,都會積累客戶消費的歷史記錄,這些歷史記錄包含著不同消費者的購物清單,關(guān)聯(lián)規(guī)則的通過分析這些歷史購物清單,發(fā)現(xiàn)產(chǎn)品之間的聯(lián)系,進(jìn)而挖掘出一系列產(chǎn)品組合。模型可以按固定時間段或者固定銷售量,對樣本數(shù)據(jù)進(jìn)行分組,實施多次基于PDCA循環(huán)的數(shù)據(jù)分析與挖掘。本文兩輪PDCA分組如下:
2020年11月01日-2020年12月13日A組樣本數(shù)據(jù)1641條,A組校驗組數(shù)據(jù)652條。
2020年12月14日-2021年01月28日B組樣本數(shù)據(jù)1975條,B組校驗組數(shù)據(jù)1248條。
并按照以下流程進(jìn)行兩輪P-D-C-A循環(huán)數(shù)據(jù)挖掘,分析模型如下圖:
(1)Plan:實施目標(biāo)與計劃的制定;(2)Do:關(guān)聯(lián)規(guī)則模型設(shè)定與運行;
(3)Check:計算效驗組概率值,執(zhí)行結(jié)果檢查;(4)Act:效果評估與優(yōu)化參數(shù)。
四、數(shù)據(jù)準(zhǔn)備與實驗分析
1.數(shù)據(jù)準(zhǔn)備
(1)數(shù)據(jù)來源
本文選取具有較高銷售量的某化妝品天貓旗艦店作為研究對象,通過八爪魚數(shù)據(jù)采集軟件爬取全店所有商品上述時間段的評論內(nèi)容,結(jié)合購買用戶信息、購買時間和商品SKU模擬還原交易訂單。本文采集該店鋪全店共約5萬條評論數(shù)據(jù),模擬還原交易訂單5516條。
(2)數(shù)據(jù)預(yù)處理
本文選取用戶標(biāo)識和商品標(biāo)識信息兩個數(shù)據(jù)項,然后對數(shù)據(jù)實行轉(zhuǎn)換、清洗等預(yù)處理操作,得到如表1形式的購物籃數(shù)據(jù),在依據(jù)確準(zhǔn)的數(shù)據(jù)類型通過關(guān)聯(lián)規(guī)則挖掘算法實行數(shù)據(jù)挖掘,分析評估挖掘結(jié)果。
①Plan:實施目標(biāo)與計劃的制定
在第一輪環(huán)節(jié),企業(yè)可以通過智能化產(chǎn)品組合的構(gòu)建,提升產(chǎn)品推送的精準(zhǔn)度,促進(jìn)消費者關(guān)聯(lián)購買,提升消費者體驗和提高企業(yè)客單價,利用歷史交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘,為企業(yè)自動化推送產(chǎn)品組合。
②Do:關(guān)聯(lián)規(guī)則模型設(shè)定與運行
運用R語言對采集的數(shù)據(jù)進(jìn)行處理,根據(jù)綜合分析本輪參數(shù)設(shè)定為:最小支持度為1.1%,最小置信度為50%,通過R語言導(dǎo)入A組交易樣本數(shù)據(jù)1641條,運行Apriori算法如下:
共生成的關(guān)聯(lián)規(guī)則共24條,經(jīng)過對關(guān)聯(lián)規(guī)則的提升度進(jìn)行排序,表2展示了前8條關(guān)聯(lián)規(guī)則。
生產(chǎn)的24條規(guī)則置信度在50%以上且提升度都遠(yuǎn)大于1,說明規(guī)則有效且有實用價值,即購買左側(cè)商品項的買家有非常大的可能性會同時購買右側(cè)商品項,如“氣墊BB霜&凍感水光唇釉->絲絨霧面口紅”的支持度與置信度都較高且提升度達(dá)到了9.72,此三個商品非常適合作為關(guān)聯(lián)產(chǎn)品同時展現(xiàn),也適合作為套餐進(jìn)行捆綁銷售。
根據(jù)生成的關(guān)聯(lián)規(guī)則,企業(yè)可以以此為依據(jù)來對生成產(chǎn)品組合,在關(guān)聯(lián)營銷推送產(chǎn)品組合,讓客戶能夠更加方便地瀏覽到所需的產(chǎn)品,獲取需要的組合套餐,促進(jìn)客戶的捆綁銷售、增加銷售額和提升購物體驗。
③Check:計算效驗組概率值,執(zhí)行結(jié)果檢查
接下來將A組樣本數(shù)據(jù)產(chǎn)生的關(guān)聯(lián)規(guī)則在A組校驗組數(shù)據(jù)中進(jìn)行核查檢驗,計算關(guān)聯(lián)規(guī)則在校驗數(shù)據(jù)中出現(xiàn)的置信度,挖掘生成的關(guān)聯(lián)規(guī)則,在校驗集中有較高的置信度,說明規(guī)則有可靠性高,表3展示了前8條關(guān)聯(lián)規(guī)則在校驗組中的置信度。
④Act:效果評估與優(yōu)化參數(shù)
本輪執(zhí)行過程產(chǎn)生了評估指標(biāo)較好的關(guān)聯(lián)規(guī)則,并且驗證了這些規(guī)則的有效性與實用性,企業(yè)可以將這些規(guī)則運用于產(chǎn)品組合關(guān)聯(lián)營銷、產(chǎn)品套餐設(shè)計和客戶接觸點優(yōu)化等領(lǐng)域,但也存在關(guān)聯(lián)規(guī)則數(shù)量偏少,所能覆蓋的產(chǎn)品種類偏少的不足。
(2)第二輪P-D-C-A
①Plan:實施目標(biāo)與計劃的制定
經(jīng)過上一輪PDCA的運行,企業(yè)能夠高質(zhì)量挖掘出一系列關(guān)聯(lián)規(guī)則,但數(shù)量偏少,覆蓋產(chǎn)品較少。因此本輪需對支持度、置信度參數(shù)進(jìn)行調(diào)整,另在結(jié)果分析過程需考慮消費者需求變化因素。
②Do:關(guān)聯(lián)規(guī)則模型設(shè)定與運行
本輪最小支持度為0.7%,最小置信度為35%,通過R語言導(dǎo)入B組交易樣本數(shù)據(jù)1975條,運行Apriori算法如下:
共生成的關(guān)聯(lián)規(guī)則共36條,經(jīng)過對關(guān)聯(lián)規(guī)則的提升度進(jìn)行排序,表4展示了前8條關(guān)聯(lián)規(guī)則。本輪關(guān)聯(lián)規(guī)則數(shù)量得到了一定提升,規(guī)則的支持度雖然有所調(diào)低,但仍有較高的頻數(shù),置信度處于較高水平,規(guī)則提升度均遠(yuǎn)大于1,規(guī)則具有較高的有效性與實用性。
③Check:計算效驗組概率值,執(zhí)行結(jié)果檢查
通過計算規(guī)則在B組校驗數(shù)據(jù)中的置信度,均得到的較高的置信度,因此驗證了生成的關(guān)聯(lián)規(guī)則結(jié)果具有較高的可信度,表5展示了前8條關(guān)聯(lián)規(guī)則在校驗組的置信度。
④Act:效果評估與優(yōu)化參數(shù)
根據(jù)本輪的執(zhí)行產(chǎn)生了更多的關(guān)聯(lián)規(guī)則,且均有較高的有效性與實用性,能夠覆蓋更多的產(chǎn)品,企業(yè)可以運用該方法智能化產(chǎn)品組合構(gòu)建。此外企業(yè)需根據(jù)第一輪與第二輪產(chǎn)品的關(guān)聯(lián)規(guī)則的差異變化,了解季節(jié)性、活動性及流行趨勢等因素影響對產(chǎn)品組合的影響,與時俱進(jìn),不斷優(yōu)化與更新產(chǎn)品組合。
3.實驗結(jié)果分析
(1)雖然本文兩輪PDCA過程都獲得了優(yōu)質(zhì)的關(guān)聯(lián)規(guī)則,但支持度與置信度的設(shè)定會較大的影響關(guān)聯(lián)規(guī)則生成,將關(guān)聯(lián)規(guī)則支持度與置信度的調(diào)整融入到PDCA循環(huán)中,將能實現(xiàn)參數(shù)的精細(xì)化、動態(tài)調(diào)整。
(2)將數(shù)據(jù)源根據(jù)時間維度或銷量維度進(jìn)行合理的劃分,能夠有效地幫助企業(yè)挖掘貼近市場需求變化的關(guān)聯(lián)規(guī)則。
(3)企業(yè)可根據(jù)支持度、置信度的以及提升度的變化趨勢對生成關(guān)聯(lián)規(guī)則的發(fā)展趨勢跟蹤,幫助企業(yè)較早地捕捉到產(chǎn)品及產(chǎn)品組合的需求和生命周期變化。
(4)企業(yè)可以對多輪PDCA循環(huán)產(chǎn)生的規(guī)則進(jìn)行統(tǒng)計分析,根據(jù)關(guān)聯(lián)規(guī)則隨時間的變化程度的大小,區(qū)別性地實施不同的營銷策略。
五、總結(jié)
本文將PDCA管理方法與關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法相結(jié)合,實現(xiàn)了數(shù)據(jù)挖掘算法在企業(yè)商務(wù)應(yīng)用的規(guī)范規(guī)設(shè)計,通過PDCA循環(huán)迭代,螺旋上升的機(jī)制,動態(tài)地調(diào)整關(guān)聯(lián)規(guī)則算法應(yīng)用,保證了數(shù)據(jù)挖掘效果的可靠性與實用性,企業(yè)通過多輪的PDCA循環(huán)迭代,能夠有效積累具有時間維度的關(guān)聯(lián)規(guī)則,幫助企業(yè)識別產(chǎn)品及產(chǎn)品組合的變化趨勢與生命周期,進(jìn)而幫助企業(yè)更加全面系統(tǒng)地實現(xiàn)產(chǎn)品組合的智能化構(gòu)建。
參考文獻(xiàn):
[1]李冬云.利用關(guān)聯(lián)規(guī)則挖掘技術(shù)實現(xiàn)數(shù)字圖書館個性化推薦服務(wù)[J].蘭臺內(nèi)外,2020(34):40-42.
[2]郝海濤,馬元元.基于加權(quán)關(guān)聯(lián)規(guī)則挖掘算法的電子商務(wù)商品推薦系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2016,39(15):133-136.
[3]菲利普.科特勒,加里.阿姆斯特朗.營銷學(xué)導(dǎo)論[M].華夏出版社,1998.
[4]朱晴.融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2020,43(23):159-163.
作者簡介:周麗莉(1999.07- ),女,漢族,籍貫:廣東省揭陽市,本科在讀,研究方向:電子商務(wù);通訊作者:王寶軍(1985.08- ),男,漢族,籍貫:江西省景德鎮(zhèn)市,研究生,工程師,研究方向:電子商務(wù)、數(shù)據(jù)挖掘