【摘 要】介紹了大數據的基本概念,核心和大數據挖掘,并探討了大數據在零售業(yè)中的應用。
【關鍵字】大數據;數據挖掘;CRISP-DM;顧客價值主張
一、大數據
“大數據”由英文“Big Data”翻譯而來,指大小超出了傳統數據庫軟件工具的抓取、存儲、管理和分析能力的數據群。究竟多大才算大數據,這個定義根據行業(yè)的不同會有所差異,目前眾多行業(yè)的大數據范圍可以從幾十TB到數千TB。
二、大數據的核心
大數據具有數據量大、查詢分析復雜等特點。在大數據時代,建立在人們的習慣思維基礎上的關聯分析已經不適用了,因為數據量太大而且需要考慮的因素眾多?,F在通過計算機就可以完成復雜的相關關系分析,建立在相關關系分析法基礎上的預測是大數據的核心。相關關系分析法更準確、更快,而且不易受偏見影響,能夠得到準確的預測結果。
美國折扣零售商塔吉特(Target)使用大數據的相關關系分析,找出了大概20多種關聯物,使用這些關聯物對顧客進行“懷孕趨勢”評分,比較準確地預測預產期,在孕期每個階段為客戶寄送相應的優(yōu)惠券。大數據時代,找出相關的關聯物并監(jiān)控它,就能夠準確的預測未來。
三、大數據挖掘
從看似平淡無奇的記錄資料中發(fā)現、歸納和獲取有價值信息的過程,就是數據挖掘(Data mining)。大數據不僅僅只有數字,還包含大量的文本、超鏈接、音頻和視頻等信息。大數據挖掘能夠幫助人們從繁雜的數據中找到最有價值的信息。
CRISP-DM是一套被廣泛應用的跨行業(yè)標準流程,這個流程包含業(yè)務理解、數據理解、數據準備、建立模型、模型評估和模型發(fā)布六個階段。
(一)業(yè)務理解:確定挖掘的內容,了解相關對象的現狀,制定目標和計劃。
(二)數據理解:當確定了挖掘的內容和計劃,就需要考慮數據了。包括原始數據搜集、數據描述、數據探索和質量核查。通常和業(yè)務理解反復進行,確定最終的對象和數據。
(三)數據準備:顧名思義,就像裝修需要對建材進行篩選、加工,原始數據中包含大量的錯誤、重復和不符合要求的信息,需要刪除、整理和轉化。數據準備相當于數據探索,對數據進行粗加工,為后續(xù)的模型建立做準備。
(四)建立模型:本階段主要是描繪數據并建立關聯,使用一定的分析方法借助數據挖掘工具進行數據的基礎分析。
(五)模型評估:對于建立的模型結果,要對在第一步建立的工作目標進行評估,這將導致頻繁地返回到前面的步驟。這個過程需要緩慢推進,各種的可視化分析結果、統計和人工智能工具將展現更深層次地理解數據運行的關系,幫助數據挖掘人員進行評估。
(六)模型發(fā)布:通過評估后得到模型應用于“假設檢驗”方法和數據庫知識發(fā)現(KDD)這兩種路徑中,借助CRISP-DM前期步驟中發(fā)現的知識,可以獲得更加健全的模型。發(fā)布的模型可以用于預測或識別關鍵特征,需要通過實際情況檢測其變化。如果發(fā)生重大變化,模型就需要被重新制定。模型發(fā)布讓從實驗數據庫中建立起來的模型在實踐中受到檢驗。
四、大數據在零售業(yè)中的應用
在零售業(yè)中如何有效的利用大數據處理技術,以快速精確的支撐營銷和市場決策,成為零售業(yè)尋找新的業(yè)務增長點和突破點的關鍵。零售業(yè)的大數據應用主要從以下幾個方面考慮:
(一)分析新老顧客在消費行為方面存在的差異。通過大數據挖掘對新老顧客的消費頻次、消費品類的結構變化、消費價格帶的差異、價格敏感度的差異進行分析。例如結合會員卡的卡齡和顧客的實際年齡,將顧客的消費次數、頻次、消費類別和消費金額等信息展示,報表數據查詢,多維分析查詢等,運用于促銷方案的制定,并提供給公司高層做戰(zhàn)略制定依據。通過新老顧客在商品上市后的消費時間來看季節(jié)過程中的銷售側重點。
(二)銷售力和貨架資源利用分析。不同的商品的銷售周期長短不一,但是決定商品銷量一般在剛剛上市的前幾周就能看出。例如各款式商品在第一周、第二周及第三周銷售力變化情況以及各款式貨架資源投入產出效率的分析,就能較好的把握銷售機會以及合理把握庫存規(guī)模。通過貨架資源利用分析,可以得到商品在貨架上陳列時間與它所得到的毛利,將兩者進行比較,就能得到經營過程中的貨架資源利用效率。
(三)商品間的銷售關聯性分析。例如對顧客消費行為進行分析,能夠得到有多少用戶在購買了A商品后,又購買了B商品,從而得出兩款商品的關聯性,以幫助零售企業(yè)更好的調整貨架資源,方便顧客購買,提升商品的銷量。沃爾瑪通過數據挖掘分析,將紙尿片和啤酒、颶風商品和蛋撻擺放在相鄰貨架上,實現了銷量的上升。通過關聯性分析反映現狀,為零售企業(yè)提供了經營決策。
上述都是通過挖掘龐大的業(yè)務數據,圍繞顧客的價值主張進行分析,預測顧客的消費行為,調整經營決策,優(yōu)化貨架資源,根據不同顧客的銷售習慣,通過短信、微信和互聯網向顧客推送相關的新品和促銷等信息,打造個性化的服務,從而實現零售業(yè)的銷量增長。
五、結束語
隨著全球數據量的爆發(fā)式增長,大數據技術得到了飛快的發(fā)展,也為零售業(yè)從龐大的業(yè)務數據中獲取有用信息提供了強有力的支持。但是由于數據本身的局限性,即數據無法反映每一位顧客的消費習慣。還有算法,計算效率和模型的合理性等因素的影響,如何快速的構建適合的大數據平臺,精確的分析大數據中的有用信息,預測顧客的消費行為,從而支持企業(yè)的經營決策,牢牢占據市場先機,將會是零售業(yè)在激烈的市場競爭中獲得勝利的關鍵。
參考文獻:
[1]《大數據》.清華大學出版社.
[2]《大數據時代》.浙江人民出版社.
作者簡介:張敏(1986-),男,福建福州人,在讀碩士,主要研究方向:電子與通信。