喬富強(qiáng) 天津中德應(yīng)用技術(shù)大學(xué)
數(shù)據(jù)挖掘在育嬰市場(chǎng)中的應(yīng)用分析
喬富強(qiáng) 天津中德應(yīng)用技術(shù)大學(xué)
隨著市場(chǎng)經(jīng)濟(jì)的不斷深入,育嬰市場(chǎng)在我國(guó)各個(gè)城市中所占的比例越來(lái)越高,同時(shí)還面臨著潛在的網(wǎng)絡(luò)商店的威脅,我國(guó)企業(yè)的競(jìng)爭(zhēng)越來(lái)越激烈,使得我國(guó)企業(yè)間的利潤(rùn)空間不斷下降。為了提高市場(chǎng)競(jìng)爭(zhēng)力,讓企業(yè)獲得更好的發(fā)展前景,就需要對(duì)育嬰市場(chǎng)的運(yùn)營(yíng)各個(gè)環(huán)節(jié)做優(yōu)化處理。本文將探討數(shù)據(jù)挖掘在育嬰市場(chǎng)中的應(yīng)用分析。
數(shù)據(jù)挖掘 育嬰市場(chǎng) 數(shù)據(jù)預(yù)測(cè)
當(dāng)前育嬰市場(chǎng)的運(yùn)營(yíng)模式主要還是從采購(gòu)到運(yùn)輸、管理、營(yíng)銷(xiāo)和服務(wù)等進(jìn)行運(yùn)轉(zhuǎn)的。而在這運(yùn)轉(zhuǎn)過(guò)程中就會(huì)產(chǎn)生大量的各類(lèi)數(shù)據(jù),對(duì)這些數(shù)據(jù)的分析和利用,將會(huì)是企業(yè)最大的寶貴財(cái)富。數(shù)據(jù)庫(kù)系統(tǒng)能快速的實(shí)現(xiàn)對(duì)數(shù)據(jù)的錄入、查詢(xún)和統(tǒng)計(jì)等功能,但是要對(duì)這些數(shù)據(jù)不能實(shí)現(xiàn)關(guān)聯(lián),根本就不能通過(guò)現(xiàn)有的數(shù)據(jù)預(yù)測(cè)企業(yè)未來(lái)的發(fā)展方向。因此就需要對(duì)數(shù)據(jù)里的關(guān)聯(lián)規(guī)則算法做分析研究,以構(gòu)建起關(guān)聯(lián)規(guī)則算法模型,可以說(shuō)有了數(shù)據(jù)挖掘技術(shù),就可以從大量數(shù)據(jù)中提取出潛在的、有價(jià)值的知識(shí),實(shí)現(xiàn)數(shù)據(jù)應(yīng)用于育嬰市場(chǎng)。
數(shù)據(jù)挖掘又叫做數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是與計(jì)算機(jī)相關(guān)的學(xué)科,包括人工智能、決策數(shù)算法、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)知識(shí)、神經(jīng)計(jì)算與統(tǒng)計(jì)分析等各類(lèi)學(xué)科領(lǐng)域和方法的相互交叉學(xué)科。其定義就是指從海量數(shù)據(jù)里發(fā)現(xiàn)數(shù)據(jù)之間的聯(lián)系和規(guī)則,獲取事先并不知道,潛在的知識(shí),從而提取有用的信息,其目的就是為數(shù)據(jù)庫(kù)理解和應(yīng)用提供自動(dòng)化、智能化的手段。關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘過(guò)程中所能挖掘的一類(lèi)重要的模式或知識(shí),也是數(shù)據(jù)挖掘研究的一個(gè)重要分支??梢杂脕?lái)尋求事物之間在特定環(huán)境條件下存在的某種積極和消極的相關(guān)性聯(lián)系。也就是說(shuō)首先要找到所有支持度大于最小支持度的頻繁項(xiàng)集,也就是頻集。其次是使用第一步找到的頻集產(chǎn)生期望的規(guī)則。如在藥店購(gòu)買(mǎi)了外套的,75%的人還買(mǎi)內(nèi)衣,這樣的關(guān)聯(lián)規(guī)則很有價(jià)值,育嬰市場(chǎng)管理人員可以根據(jù)這些規(guī)則更好地進(jìn)行規(guī)劃,把外套和內(nèi)衣這樣的商品擺放在一起,就能夠提高銷(xiāo)售量。
關(guān)聯(lián)規(guī)則挖掘算法有很多類(lèi)型,包括層次算法、搜索算法、抽樣算法和數(shù)據(jù)集劃算法等。這些算法存在兩個(gè)問(wèn)題就是減小了IO操作以及降低需要計(jì)算支持率項(xiàng)目集數(shù)量,對(duì)于數(shù)據(jù)挖掘的效率影響十分大。Apriori算法作為一種關(guān)聯(lián)規(guī)則經(jīng)典算法,是一種基于兩階段頻集思想的算法,假設(shè)某一項(xiàng)不是頻度集,它的所有超集就不會(huì)是頻度集。反之就是任一頻度集的所有子集一定都是頻度集。該算法主要是先找出全部支持度都超過(guò)了最小支持度的項(xiàng)集,然后把這些項(xiàng)集成為頻集,最后再?gòu)念l集中去找出期望的規(guī)則。
算法流程:
在零售業(yè)合理的商品布局是提高商品銷(xiāo)售的一種手段,合理的布局可以刺激顧客的購(gòu)買(mǎi)沖動(dòng),還可以節(jié)約顧客的購(gòu)物時(shí)間,這對(duì)提高育嬰店的服務(wù)水平與利潤(rùn)都有積極的促進(jìn)效果。通過(guò)數(shù)據(jù)挖掘能夠分析出以往顧客購(gòu)買(mǎi)行為,包括購(gòu)買(mǎi)數(shù)據(jù)、選擇路線(xiàn)、購(gòu)買(mǎi)喜好、購(gòu)買(mǎi)習(xí)慣、暢銷(xiāo)商品的類(lèi)別、生產(chǎn)企業(yè)等數(shù)據(jù),通過(guò)對(duì)顧客購(gòu)買(mǎi)模式和趨勢(shì)的研究,可以改進(jìn)服務(wù)質(zhì)量,建立起最佳的貨架布局,從而提高貨品銷(xiāo)量比率,減少商業(yè)成本。下面是對(duì)某育嬰店的顧客購(gòu)買(mǎi)商品的事務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)分析。數(shù)據(jù)挖掘過(guò)程如下:
首先計(jì)算出表中每類(lèi)商品的關(guān)聯(lián)規(guī)則支持度,根據(jù)定義得出:
其次根據(jù)設(shè)定的最小支持度閥值,將大于或等于最小支持度閥值的商品挑選出來(lái),設(shè)最小支持度閥值為0.3,可挑選出商品外套、內(nèi)衣、鞋子與奶粉。
為了直觀(guān)明了,把其余的數(shù)據(jù)采取X=>Y的信任度表示,
再次依據(jù)設(shè)置的最小信任度閥值,設(shè)最小信任度閥值為0.6,得到下面規(guī)則:
最后,依據(jù)上面分析得到的規(guī)則,可以得到在育嬰店的消費(fèi)者的購(gòu)買(mǎi)習(xí)慣與喜好,私人老板就可以采取這樣的措施,一是調(diào)整貨架,將商品外套、鞋子放在一起,便于消費(fèi)者選購(gòu),甚至可考慮將商品外套、鞋子和奶粉;二是在廠(chǎng)庫(kù)儲(chǔ)存進(jìn)貨方面可以將關(guān)聯(lián)商品統(tǒng)購(gòu)統(tǒng)存;三是商品的促銷(xiāo)廣告可以進(jìn)行相關(guān)聯(lián)印發(fā),可以增加商品的支持度與信任度;四是在網(wǎng)上進(jìn)行商品銷(xiāo)售時(shí)把關(guān)聯(lián)商品放在同一頁(yè)面或增加關(guān)聯(lián)商品間的鏈接。在采取以上措施后,育嬰店可以擴(kuò)大銷(xiāo)售額,提高了服務(wù)水平,顧客可以擴(kuò)大交叉購(gòu)買(mǎi),提高其消費(fèi)。
[1]一種基于組合方式改進(jìn)的頻繁項(xiàng)集挖掘算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,19(68-71
[2]基于數(shù)據(jù)挖掘的商業(yè)銀行客戶(hù)關(guān)系管理研究[D].牛勝利.財(cái)政部財(cái)政科學(xué)研究所2013
[3]大數(shù)據(jù)下第三方物流企業(yè)客戶(hù)關(guān)系管理研究[D].尤翠翠.沈陽(yáng)工業(yè)大學(xué)2015
[4]數(shù)據(jù)挖掘在高職院校就業(yè)信息管理中的應(yīng)用研究[D].黃榮喜.廣西大學(xué)2015
[5]基于數(shù)據(jù)挖掘的高校圖書(shū)館差異化閱讀推廣系統(tǒng)開(kāi)發(fā)[D].胡杰.湖南大學(xué)2015