郭德超+胡昌盛
【摘要】市場(chǎng)營(yíng)銷學(xué)是經(jīng)濟(jì)管理類學(xué)生的專業(yè)基礎(chǔ)課程,在授課過(guò)程中,不僅要教授學(xué)生理論知識(shí),更有教會(huì)學(xué)生融入現(xiàn)實(shí)經(jīng)濟(jì)管理活動(dòng)中,為了激發(fā)學(xué)生的學(xué)習(xí)興趣,提升學(xué)生的實(shí)踐動(dòng)手能力,本文探討了在課堂教學(xué)中引入開(kāi)源數(shù)據(jù)挖掘軟件WEKA的教學(xué)方法,并給出了實(shí)訓(xùn)教學(xué)實(shí)例,對(duì)提升市場(chǎng)營(yíng)銷學(xué)課程的實(shí)訓(xùn)質(zhì)量進(jìn)行了有益的嘗試,課堂效果良好。
【關(guān)鍵詞】WEKA 市場(chǎng)營(yíng)銷學(xué)教學(xué) Apriori關(guān)聯(lián)算法 購(gòu)物籃分析
一、引言
市場(chǎng)營(yíng)銷學(xué)是經(jīng)濟(jì)管理類專業(yè)學(xué)生的專業(yè)基礎(chǔ)課,隨著信息技術(shù)的飛速發(fā)展,無(wú)論是商品信息還是客戶信息均是海量的,如何在大數(shù)據(jù)中挖掘有用的營(yíng)銷信息然后應(yīng)用到我們的營(yíng)銷中去就是市場(chǎng)營(yíng)銷專業(yè)學(xué)生需要解決的課題。計(jì)算機(jī)科學(xué)中的數(shù)據(jù)挖掘技術(shù)就是解決在大型數(shù)據(jù)庫(kù)中自動(dòng)分析發(fā)現(xiàn)有用信息的技術(shù),其中Apriori關(guān)聯(lián)算法主要用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)中的有意義聯(lián)系,本文試圖在市場(chǎng)營(yíng)銷學(xué)中以開(kāi)源軟件WEKA為例,講解Apriori關(guān)聯(lián)算法在超市數(shù)據(jù)分析中的應(yīng)用,以此來(lái)引導(dǎo)學(xué)生用數(shù)據(jù)挖掘的方法來(lái)解決實(shí)際問(wèn)題。
二、開(kāi)源軟件WEKA簡(jiǎn)介
WEKA[1]的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),它的源代碼可通過(guò)http://www.cs.waikato.ac.nz/ml/WEKA得到。在第11屆ACM SIGKDD國(guó)際會(huì)議上,懷卡托大學(xué)的WEKA小組榮獲了數(shù)據(jù)挖掘和知識(shí)探索領(lǐng)域的最高服務(wù)獎(jiǎng),WEKA系統(tǒng)得到了廣泛的認(rèn)可,成為現(xiàn)今較完備的數(shù)據(jù)挖掘工具之一。WEKA作為一個(gè)開(kāi)源的數(shù)據(jù)挖掘工作平臺(tái),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化[2],在現(xiàn)代商業(yè)社會(huì),企業(yè)的數(shù)據(jù)一般是海量的,如果學(xué)生在進(jìn)行營(yíng)銷數(shù)據(jù)管理中能借助于先進(jìn)軟件WEKA進(jìn)行分析,從海量數(shù)據(jù)中挖掘出其背后隱藏的種種關(guān)系,肯定對(duì)于營(yíng)銷數(shù)據(jù)的挖掘利用、商機(jī)的發(fā)現(xiàn)大有好處。
三、開(kāi)源軟件WEKA在市場(chǎng)營(yíng)銷學(xué)教學(xué)的應(yīng)用
在教學(xué)過(guò)程中我們選擇的是購(gòu)物籃分析實(shí)驗(yàn),購(gòu)物籃分析是將關(guān)聯(lián)技術(shù)用于交易過(guò)程,特別是分析超市收銀數(shù)據(jù),找出那些以成組出現(xiàn)的商品。對(duì)于營(yíng)銷者來(lái)說(shuō),這是主要的用于數(shù)據(jù)挖掘的銷售信息來(lái)源,比如自動(dòng)分析收銀數(shù)據(jù)后發(fā)現(xiàn):買啤酒的客戶也同時(shí)購(gòu)買了薯片,對(duì)超市管理人員來(lái)說(shuō)這個(gè)發(fā)現(xiàn)意義非常大,這些信息可以用于多種目的,比如規(guī)劃貨架的擺放位置、僅對(duì)會(huì)同時(shí)購(gòu)買的商品中的一種進(jìn)行打折銷售、提供與單獨(dú)銷售的產(chǎn)品相匹配的產(chǎn)品贈(zèng)券等,商家還可以從顧客的購(gòu)買行為中鑒別特殊客戶,不但可以分析其歷史購(gòu)買模式,而且還能精確地針對(duì)潛在用戶提供特殊的極其可能感興趣的購(gòu)買信息。
教學(xué)實(shí)驗(yàn)中我們的實(shí)驗(yàn)數(shù)據(jù)采用Weka自帶的一個(gè)超市購(gòu)物籃分析數(shù)據(jù)集,文件名為supermarket.arff,這個(gè)數(shù)據(jù)集是從新西蘭的一個(gè)真實(shí)超市里搜集而來(lái)的,數(shù)據(jù)集屬性有217個(gè),實(shí)例數(shù)量有4627個(gè),很適合用來(lái)做購(gòu)物籃分析實(shí)驗(yàn),首先使用Weka的Explorer界面的預(yù)處理面板,加載data目錄下的supermarket.arff文件,在Current relation子面板下,我們可以看到這個(gè)數(shù)據(jù)集的基本信息,由于數(shù)據(jù)集屬性比較多,數(shù)據(jù)量也比較大,因此此時(shí)會(huì)讓學(xué)生單擊預(yù)處理面板上部的Edit按鈕,打開(kāi)數(shù)據(jù)集的Viewer窗口,查看數(shù)據(jù)文件,通過(guò)適當(dāng)?shù)闹v解讓學(xué)生理解數(shù)據(jù)的屬性和結(jié)構(gòu)。然后切換至關(guān)聯(lián)面板,選擇Apriori算法,保持選項(xiàng)為默認(rèn)值,單擊Start按鈕,啟動(dòng)Apriori算法,運(yùn)行結(jié)果如圖示。
運(yùn)算結(jié)果得到的十條關(guān)聯(lián)規(guī)則中,多項(xiàng)商品多次出現(xiàn),而且總金額都很高。我們從中可以分析出:第一,購(gòu)買餅干、冷凍食品等速食的顧客,會(huì)順便采購(gòu)水果、蔬菜,以補(bǔ)充身體所需的維生素;第二,購(gòu)買餅干、冷凍食品以及水果、蔬菜的顧客,會(huì)順便購(gòu)買面包和蛋糕;第三,購(gòu)買上述食品的顧客,一次購(gòu)買量都很大,總金額會(huì)很高;第四,總金額較高的交易,一般都會(huì)購(gòu)買面包和蛋糕等等。這些信息如果提供給超市方面,可以根據(jù)挖掘到的知識(shí)重新安排貨架、重新布局超市、提供快速付款通道以及安排送貨等附加服務(wù),以提升市場(chǎng)競(jìng)爭(zhēng)力。
對(duì)以上結(jié)果進(jìn)行分析以后,可以引導(dǎo)學(xué)生嘗試Apriori算法的不同參數(shù),然后分析其運(yùn)算結(jié)果,看能否得到一些有價(jià)值的營(yíng)銷信息。
四、結(jié)論
為了激發(fā)出學(xué)生學(xué)習(xí)市場(chǎng)營(yíng)銷學(xué)課程的興趣,我們嘗試在教學(xué)過(guò)程中應(yīng)用了一個(gè)開(kāi)源工具——WEKA,并借助它的可視化環(huán)境、典型算法,在課堂上為學(xué)生演示了一個(gè)實(shí)際問(wèn)題的解決過(guò)程,通過(guò)這些教學(xué)步驟,讓學(xué)生循序漸進(jìn)的做到了解開(kāi)源軟件WEKA,掌握典型算法的使用,利用WEKA處理和分析商業(yè)數(shù)據(jù),提高數(shù)據(jù)處理能力,挖掘出對(duì)市場(chǎng)營(yíng)銷有價(jià)值的信息來(lái)。同時(shí)WEKA軟件是開(kāi)源軟件,對(duì)于有編程基礎(chǔ)的同學(xué)可以分析其算法的原理,也可以通過(guò)自己編程來(lái)優(yōu)化算法,進(jìn)一步提升自己解決問(wèn)題的能力。
參考文獻(xiàn)
[1]I.Witten,E.Frank.WEKA Machine Learning Algorithms in Java[D]. Data Mining:Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann Publishers, 2000.
[2]Kirkby R,F(xiàn)rank E.WEKA explorer user guide.[2007].http://www.cs.waikato.ac.nz/ml/WEKA/2004.
作者簡(jiǎn)介:郭德超(1978-),男,碩士,研究方向:信息管理。