[摘要] 本文從數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的角度探討了零售業(yè)在現(xiàn)代化的市場進行信息收集和分析的必要性和發(fā)展趨勢。提出了零售業(yè)基于數(shù)據(jù)挖掘的數(shù)據(jù)倉庫設計與構造和利用數(shù)據(jù)挖掘技術進行的各種有效分析,闡明了基于數(shù)據(jù)挖掘技術的信息高效利用是商家競爭的有效手段。
[關鍵詞] 零售業(yè) 數(shù)據(jù)倉庫 數(shù)據(jù)挖掘
零售業(yè)是任何一個處于從事由生產(chǎn)者到消費者的產(chǎn)品營銷活動的個人或公司,他們從批發(fā)商、中間商或者制造商處購買商品,并直接銷售給消費者。當代的零售業(yè)早已不再是傳統(tǒng)的“整買零賣,賤進貴出”的簡單商業(yè)行為。它是行業(yè)間科學管理和高科技應用的競爭。沃爾瑪前CEO David Glass 曾經(jīng)說過這樣一句話:“沃爾瑪是一家科技信息公司”。乍一聽,這句話很難理解:沃爾瑪不是世界上最大的零售商嗎?細細品味,Glass 這句話可以說是一語道出了沃爾瑪?shù)统杀?、高效益的真諦。
眾所周知,現(xiàn)代化的市場信息收集和分析本身就是高科技的體現(xiàn)。消費者的心理、行為、生活習慣,以及收入甚至婚姻狀況無不成為商家的決策必需,由此,新的系統(tǒng)、軟件應運而生。高科技在產(chǎn)品開發(fā)、商品策劃、銷售預測、貨源采購和精確定價等各個環(huán)節(jié)的應用已經(jīng)成為經(jīng)營者們不可缺少的決策依據(jù)。而支持眾多決策的是其中的數(shù)據(jù)倉庫和挖掘技術。
一、構建數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術的必要性
簡單講數(shù)據(jù)倉庫是一種多個異種數(shù)據(jù)源在單個站點以統(tǒng)一的模式組織存儲,以支持管理決策。數(shù)據(jù)挖掘是從存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中的大量數(shù)據(jù)中挖掘有用知識的過程。
數(shù)據(jù)的豐富帶來了對強有力的數(shù)據(jù)分析工具的需求,大量的數(shù)據(jù)被描述為“數(shù)據(jù)豐富”,但“信息貧乏”??焖僭鲩L的海量數(shù)據(jù)收集、存放在大型和大量數(shù)據(jù)庫中,沒有強有力的工具,理解它們已經(jīng)遠遠超出了人的能力。結果,收集在大型數(shù)據(jù)庫中的數(shù)據(jù)變成了“數(shù)據(jù)墳墓”——難得再訪問的數(shù)據(jù)檔案。這樣,重要的決定常常不是基于數(shù)據(jù)庫中的信息豐富的數(shù)據(jù),而是基于決策者的直覺,因為決策者缺乏從海量數(shù)據(jù)中提取有價值知識的工具。此外,考慮當前的專家系統(tǒng)技術,通常,這種系統(tǒng)依賴用戶或領域?qū)<胰斯さ貙⒅R輸入知識庫。不幸的是,這一過程常常有偏差和錯誤,并且耗時、費用高。數(shù)據(jù)挖掘工具進行數(shù)據(jù)分析,可以發(fā)現(xiàn)重要的數(shù)據(jù)模式,對商務決策、知識庫、科學和醫(yī)學研究做出了巨大貢獻。數(shù)據(jù)和信息之間的鴻溝要求系統(tǒng)地開發(fā)數(shù)據(jù)挖掘工具,將數(shù)據(jù)墳墓轉(zhuǎn)換成知識“金塊”。簡單講數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識。
數(shù)據(jù)倉庫中不是存放每個銷售事物的細節(jié),而是存放每個部門每類商品的匯總數(shù)據(jù),或?qū)^高層次的匯總數(shù)據(jù)。OLAP(聯(lián)機分析處理)提供數(shù)據(jù)倉庫中匯總數(shù)據(jù)的多視圖和動態(tài)視圖能力,為成功的數(shù)據(jù)挖掘奠定了堅實的基礎。數(shù)據(jù)挖掘可以幫助商界經(jīng)理們找到合適的客戶,也能獲得對商務的洞察,幫助提高市場份額和增加利潤。此外,數(shù)據(jù)挖掘能夠幫助經(jīng)理們了解客戶的群體特點,并據(jù)此制定價格策略;不是根據(jù)知覺,而是根據(jù)客戶的購買模式導出的實際商品組的排放;在降低推銷商品開銷的同時,提高總體推銷的純效益。
二、零售業(yè)中的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘
零售業(yè)是數(shù)據(jù)挖掘的主要應用領域,這是因為零售業(yè)積累了大量的銷售數(shù)據(jù),顧客購買歷史記錄,貨物進出,消費與服務記錄,等等。其數(shù)據(jù)量在不斷地迅速膨脹,特別是由于日益發(fā)展的Web或電子商務商的商業(yè)方式的方便和流行。今天,許多商店都有自己的Web站點、顧客可以方便地在線購買商品。一些企業(yè),如Amazon.com,只有在線方式,沒有磚瓦構成的(物理的)商場。零售數(shù)據(jù)為數(shù)據(jù)挖掘提供了豐富的資源。
零售數(shù)據(jù)挖掘可有助于識別顧客購買行為,發(fā)現(xiàn)顧客購買模式和趨勢,改進服務質(zhì)量,取得更好的顧客保持力和滿意程度,提高貨品銷售比率,涉及更好的貨品運輸與分銷策略,減少商業(yè)成本。
零售業(yè)中的數(shù)據(jù)挖掘可從以下幾個方面具體實施:
1.基于數(shù)據(jù)挖掘的數(shù)據(jù)倉庫設計與構造
由于零售數(shù)據(jù)覆蓋面廣(包括銷售、顧客、職員、貨品運輸、銷量和服務),所以有許多設計數(shù)據(jù)倉庫的方式。所包含的細節(jié)級別可以變化很大。由于數(shù)據(jù)倉庫的主要用途是支持數(shù)據(jù)分析和數(shù)據(jù)挖掘,預先的一些數(shù)據(jù)挖掘例子的結果可作為設計和開發(fā)數(shù)據(jù)倉庫結構的參考依據(jù)。這些設計要決定哪些維護什么級別,以及為保證高質(zhì)量和有效的數(shù)據(jù)挖掘應進行哪些預處理。建議以遞增、進化的方式(如圖1)實現(xiàn)數(shù)據(jù)倉庫。
圖1 數(shù)據(jù)倉庫開發(fā)的方法
2.銷售、顧客、產(chǎn)品、時間和地區(qū)的多維分析
考慮到顧客的需求,產(chǎn)品的銷售,趨勢和時尚,以及日用品的質(zhì)量、價格、利潤和服務,零售業(yè)需要的是實時的信息。因此提供強有力的多維分析和可視化工具是是十分重要的一件事,這包括提供根據(jù)數(shù)據(jù)分析的需要構成復雜的數(shù)據(jù)立方體如圖2所示。基本方體包含所有的維city,item和year,它可以返回這三維的任意組合。頂點方體表示分組為空的情況,它包含所有銷售的總合。特征數(shù)據(jù)立方體,在零售數(shù)據(jù)分析中是一種有用的數(shù)據(jù)結構,因為它方便了帶有復雜條件的聚集上的分析。
圖2 三維數(shù)據(jù)立方體
3.促銷活動的有效分析
零售業(yè)經(jīng)常通過廣告、優(yōu)惠券和各種折扣和讓利的方式搞促銷活動,以達到促銷產(chǎn)品,吸引顧客的目的。認真分析促銷活動的有效性,有助于提高企業(yè)利潤。多維分析可滿足這方面分析的要求,方法是通過比較促銷期間的銷售量和交易數(shù)量與促銷活動前后的有關情況。此外,關聯(lián)分析可以找出哪些商品可能遂將假商品一同被購買,特別是與促銷活動前后的銷售向比,它廣泛應用于購物車或事物數(shù)據(jù)分析。
4.顧客保持力——顧客忠誠分析
通過顧客榮譽卡信息,可以記錄下一個顧客的夠買序列。顧客的忠誠和購買趨勢可以按系統(tǒng)的方式加以分析。由同一顧客在不同時期購買的商品可以分組為序列。序列模式挖掘可用于分析顧客的消費或忠誠的變化,據(jù)此對價格和商品的花樣加以調(diào)整,以便留住老客戶,吸引新顧客。
5.購買推薦和商品參照
通過從銷售記錄中挖掘關聯(lián)信息,可以發(fā)現(xiàn)買某一品牌香水的顧客很可能夠買其他一些商品。這類信息可用于形成一定的購買推薦,購買推薦可在Web、每周傳單或收據(jù)上宣傳,以便改進服務,幫助顧客選擇商品,增加銷售額。同樣,諸如“本周熱點商品”之類的信息或有吸引力的買賣也可以和相關信息一同發(fā)布,以達到促銷的目的。
總之,與其他行業(yè)一樣,零售業(yè)的競爭是信息獲取和有效利用的競爭。數(shù)據(jù)挖據(jù)可以幫助商界經(jīng)理們找到更合適的客戶,也能獲得對商務的洞察,幫助提高市場份額和增加利潤。此外,數(shù)據(jù)挖掘能夠幫助經(jīng)理們了解顧客的群體特點,并據(jù)此制定價格策略;不是根據(jù)直覺,而是根據(jù)顧客的購買模式導出的實際商品組來修正商品排放;在降低推銷商品開銷的同時,提高總體推銷的純效益。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。