張生華 李佳慧 李娜
【摘 要】論文利用關(guān)聯(lián)規(guī)則分析對揚州市某中型連鎖超市會員購物數(shù)據(jù)進行數(shù)據(jù)挖掘,從交易數(shù)據(jù)中發(fā)現(xiàn)顧客購物籃中的不同商品之間的關(guān)聯(lián)性,哪些商品組合會被顧客經(jīng)常一同購買,從而對具有強關(guān)聯(lián)規(guī)則的商品進行捆綁促銷,優(yōu)化超市商品布局,為顧客提供一個快捷便利的購物環(huán)境。
【Abstract】This paper uses association rules analysis to mine the member shopping data of a medium-sized supermarket chain in Yangzhou City, and finds the correlation among different goods in the customer shopping basket from the transaction data. Which combination of goods will be purchased together by customers, so that the goods with strong association rules can be bundled and promoted, the layout of supermarket goods will be optimized, and a fast and convenient shopping environment will be provided for customers.
【關(guān)鍵詞】數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則分析;商品布局
【Keywords】 data mining; association rules analysis; commodity layout
【中圖分類號】F274? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2019)05-0061-02
1 研究背景與意義
超市商品布局是一個非常具有現(xiàn)實意義的問題,隨著人們的消費水平日益提高,超市、賣場和便利店的數(shù)量不斷增長,競爭越來越激烈,潔凈的環(huán)境、優(yōu)質(zhì)的服務、合理的布局顯得尤為重要。由于超市體量龐大,結(jié)構(gòu)復雜,商品種類繁多,并不是每個顧客都對超市的環(huán)境、布局熟悉,需要花費大量時間去尋找目標商品,在節(jié)假日尤其是大促銷的時期,超市內(nèi)經(jīng)常因為擁擠而帶來安全隱患,排隊結(jié)賬時間過長影響顧客的購物體驗,生活的快節(jié)奏要求超市能夠在較短的時間內(nèi)滿足人們的購物需求,節(jié)約消費者購物時間,提升購物體驗。因此,研究超市商品布局的優(yōu)化很有必要。
2 關(guān)聯(lián)規(guī)則分析的定義和算法
在數(shù)據(jù)庫的數(shù)據(jù)挖掘中,關(guān)聯(lián)規(guī)則就是描述兩種或者兩種以上的物品在一個事務中同時出現(xiàn)的規(guī)律模式[1]。關(guān)聯(lián)規(guī)則分析(也叫購物籃分析)主要有Apriori算法和CARMA算法以及GRI算法,其中Apriori算法應用最為廣泛。
3 關(guān)聯(lián)規(guī)則分析在超市購物數(shù)據(jù)挖掘中的應用
本文隨機采集了江蘇省揚州市的一家中型連鎖超市近半年來會員的部分購物數(shù)據(jù),包含58個屬性(包括客戶編號、購物時間、購物金額以及55種商品),共有6502條交易記錄。屬性取值“0”表示顧客本次交易沒有購買該商品,取值“1”表示購買了該商品。
對原始數(shù)據(jù)作了必要的處理后,我們在挖掘軟件Clementine中使用Apriori算法挖掘強關(guān)聯(lián)規(guī)則,設(shè)置規(guī)則支持度大于20%,置信度大于50%,運行得到47項關(guān)聯(lián)規(guī)則,其中按規(guī)則置信度排名靠前的有這樣若干條規(guī)則:①“干菜和啤酒=>精肉”;②“家居清潔用品和熟食=>紙尿褲”;③“紙尿褲和沖調(diào)食品=>奶粉”;④“學生辦公用品和糖果餅干=>膨化食品”;⑤“食用油=>調(diào)味料”等。在上述模型結(jié)果中,規(guī)則“干菜和啤酒=>精肉”的支持度為:(1590/6502)×100%=24.457%,規(guī)則支持度為13.836%,表示整個數(shù)據(jù)集中有13.836%的事務包含項集(干菜and啤酒=>精肉),置信度為(13.836%/24.457%)×100%=56.574%,該規(guī)則的提升=1.135,后項(精肉)的支持度為64.211%,意味著在6502個客戶組成的人群中,購買“精肉”的概率為56.574%,如果對人群加以控制即購買了“干菜和啤酒”的客戶組成的人群,那么購買“精肉”的概率為64.211%,“精肉”被購買的概率提高了1.135倍。根據(jù)這些強關(guān)聯(lián)規(guī)則進行超市商品布局優(yōu)化設(shè)計,將精肉和干菜啤酒、紙尿褲和奶粉、學生辦公用品和糖果餅干以及膨化食品盡量靠近擺放,將牙膏和牙刷、食用油和調(diào)味料等商品捆綁促銷[2]。
4 數(shù)據(jù)挖掘結(jié)果分析
模型結(jié)果顯示:干菜啤酒和精肉這三種商品組合的關(guān)聯(lián)規(guī)則最強,其次是奶粉、紙尿褲和嬰兒輔食等嬰幼兒用品組合,其他如牙膏、牙刷和護膚品、學習辦公用品和零食以及食用油和調(diào)味料等商品組合關(guān)聯(lián)性也比較強。經(jīng)實地走訪了解,發(fā)現(xiàn)該連鎖超市位于郊區(qū)中心繁華地段,附近有中小學、幼兒園、美食街、拆遷安置區(qū)和行政辦公場所,當?shù)厝吮容^熱衷的一道菜就是干菜燒肉,飯店都是客人下單后直接去超市購買食材,順便帶點啤酒或者白酒,當?shù)夭簧偌彝ヒ彩歉羧钗遄鲞@道菜。隨著近幾年城鎮(zhèn)化的迅猛發(fā)展,大量失地農(nóng)民收入提高,紛紛涌入城鎮(zhèn)購房結(jié)婚生子,從而帶動了奶粉、紙尿褲、嬰兒輔食等嬰兒用品的熱銷[3]。小孩子鐘愛糖果餅干、膨化小食品等零食,和家長一起去超市購買學習用品的同時,會選擇順便買一些薯片、薯條和餅干糖果等零食,因而將這些商品靠近擺放可以刺激顧客的購買欲望[4]。
5 結(jié)語
本文針對超市購物數(shù)據(jù)利用關(guān)聯(lián)規(guī)則分析進行了研究,旨在為超市商品布局優(yōu)化提供建設(shè)性方案,找到合理的商品捆綁促銷組合,為顧客提供快捷方便的購物環(huán)境。本文分析的數(shù)據(jù)來自某個中型超市的顧客購物信息,由于提取的數(shù)據(jù)量少,帶有一定的隨機性,得到的結(jié)果可能并不精準和完美,不過挖掘原理大致相同,得到的結(jié)果具有一定的借鑒和指導意義。
【參考文獻】
【1】于芳.關(guān)聯(lián)規(guī)則分析在超市營銷中的應用研究[D].哈爾濱:哈爾濱工業(yè)大學,2010.
【2】熊平.數(shù)據(jù)挖掘算法與Clementine實踐[M].北京:清華大學出版社,2011.
【3】張云濤,龔玲.數(shù)據(jù)挖掘原理與技術(shù)[M].北京:電子工業(yè)出版社,2004.
【4】王軍.數(shù)據(jù)挖掘技術(shù)[M].北京:中國科學院計算技術(shù)研究所,1998.