王 磊 施新程 陳瑩瑩 李 靜 張盼盼
(信陽(yáng)師范學(xué)院城市與環(huán)境科學(xué)學(xué)院,河南 信陽(yáng) 464000)
超市是人們生活中必不可少的商業(yè)形式。隨著人們生活節(jié)奏的加快,顧客們?cè)絹?lái)越不愿意等待,他們希望到了超市能夠快速選購(gòu)所需要的商品,然后快速的結(jié)賬離開(kāi)超市;但是,很多超市的內(nèi)部結(jié)構(gòu)復(fù)雜,給人們?cè)斐闪藰O大的不便[1]。隨著GIS 技術(shù)的飛速發(fā)展,GIS 技術(shù)在社會(huì)生活各方面的作用也日益凸顯。本文基于GIS技術(shù)結(jié)合信陽(yáng)市沃爾瑪超市為例對(duì)超市的內(nèi)部布局進(jìn)行分析與優(yōu)化設(shè)計(jì),綜合了數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則算法與GIS 空間分析技術(shù),實(shí)現(xiàn)了有科學(xué)依據(jù)的布局分析評(píng)價(jià)與設(shè)計(jì)。
隨著互聯(lián)網(wǎng)的飛速發(fā)展,電子商務(wù)大行其道,究其根源,是因?yàn)榛ヂ?lián)網(wǎng)商業(yè)給人們帶來(lái)了巨大便利。超市作為傳統(tǒng)零售業(yè)的代表形式,也應(yīng)積極改變,以消費(fèi)者為中心,合理分析消費(fèi)者的消費(fèi)習(xí)慣等線(xiàn)索,借助大數(shù)據(jù)的方法進(jìn)行科學(xué)分析,合理優(yōu)化超市布局,使超市的服務(wù)最優(yōu)化,才能達(dá)到利益最大化。
對(duì)于超市布局的研究,是商業(yè)布局分析的一部分,出現(xiàn)過(guò)許多重要理論,如城市市場(chǎng)空間結(jié)構(gòu)研究、中心地理論等,加納(B.J.Garner)的商業(yè)中心空間模式、赫夫(D.L.Huff)的商業(yè)零售引力模式等,加里森(B.J.Garrison)等對(duì)中心地理論的發(fā)展研究中專(zhuān)門(mén)針對(duì)城市內(nèi)部商業(yè)等級(jí)體系進(jìn)行了研究[2]。并且依據(jù)這些理論結(jié)合GIS 的空間分析技術(shù)形成了較為成熟的超市布局分析方法理論。但是,針對(duì)超市內(nèi)部布局、商品陳列位置的分析卻不常見(jiàn),結(jié)合GIS進(jìn)行超市內(nèi)部分析的案例更是十分鮮見(jiàn)。
本文的主要研究?jī)?nèi)容包括數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則算法和GIS空間分析方法。研究過(guò)程分為兩個(gè)部分,一方面使用關(guān)聯(lián)規(guī)則算法對(duì)所超市銷(xiāo)售數(shù)據(jù)進(jìn)行分析挖掘,得出關(guān)聯(lián)結(jié)果;另一方面首先使用GIS 軟件繪制超市商品分布的平面圖,然后利用空間分析方法計(jì)算出超市內(nèi)部不同類(lèi)型商品分布的實(shí)際關(guān)聯(lián)結(jié)果。最后通過(guò)將銷(xiāo)售數(shù)據(jù)挖掘得到的關(guān)聯(lián)規(guī)則與超市實(shí)際關(guān)聯(lián)結(jié)果對(duì)比,得出超市內(nèi)部布局的分析結(jié)果。
圖1 論文基本框架圖
數(shù)據(jù)挖掘是通過(guò)對(duì)數(shù)據(jù)庫(kù)中存儲(chǔ)的各種類(lèi)型數(shù)據(jù)和信息進(jìn)行相關(guān)分析,以揭示其中有意義、有價(jià)值的新的關(guān)系、模式和傾向的過(guò)程[3],如今數(shù)據(jù)挖掘已經(jīng)被應(yīng)用在了人們生活的許多方面。它作為一門(mén)交叉性學(xué)科,融合了人工智能、數(shù)據(jù)庫(kù)技術(shù)、模式識(shí)別、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)可視化等多個(gè)領(lǐng)域的理論和技術(shù)[4]。
3.1.1 算法實(shí)現(xiàn)
使用Java 語(yǔ)言編寫(xiě)Apriori 算法,對(duì)采集所得到的超市銷(xiāo)售數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,得出所有頻繁項(xiàng)集的置信度與支持度。
Apriori算法部分代碼如下。
3.1.2 獲得關(guān)聯(lián)規(guī)則
使用上面的方法,對(duì)銷(xiāo)售記錄進(jìn)行關(guān)聯(lián)規(guī)則挖掘[5],得出了每個(gè)頻繁1 項(xiàng)集的支持度以及277 對(duì)頻繁2 項(xiàng)集及其支持度和置信度。由于數(shù)據(jù)量龐大,這里通過(guò)取較高的置信度和支持度閾值以得到強(qiáng)關(guān)聯(lián)規(guī)則[6]。
表1 頻繁1項(xiàng)集及其支持度
支持度閾值計(jì)算公式:
其中φ表示該頻繁項(xiàng)集對(duì)的支持度閾值,Ii表示每對(duì)頻繁項(xiàng)集的支持度,Ν表示頻繁2項(xiàng)集的對(duì)數(shù),ε表示閾值系數(shù),這里使用15%。
置信度閾值計(jì)算公式:
其中σ表示該頻繁項(xiàng)集對(duì)的置信度閾值,Ci表示每對(duì)頻繁項(xiàng)集的置信度,Ν表示頻繁2項(xiàng)集的對(duì)數(shù),ε表示閾值系數(shù),這里使用15%。
計(jì)算得出支持度與置信度的閾值分別為6.5%和20.62。通過(guò)篩選,得出同時(shí)滿(mǎn)足支持度和置信度閾值的頻繁2項(xiàng)集6對(duì)。
表2 強(qiáng)關(guān)聯(lián)規(guī)則頻繁2項(xiàng)集及其置信度與支持度
在A(yíng)rcGIS 中將信陽(yáng)市沃爾瑪超市的平面圖矢量化,將表1中的數(shù)據(jù)作為新字段添加給商品要素,使頻繁1項(xiàng)集的支持度在圖上直觀(guān)地顯示出來(lái),由于頻繁1 項(xiàng)集的實(shí)際意義即商品的銷(xiāo)售數(shù)量,因此從圖2也能直觀(guān)地看出各類(lèi)商品的銷(xiāo)售情況。
圖2 沃爾瑪超市銷(xiāo)售數(shù)據(jù)頻繁1項(xiàng)集分布
通過(guò)平面圖我們可以看到信陽(yáng)沃爾瑪超市的內(nèi)部結(jié)構(gòu)比起普通的通道型結(jié)構(gòu)和環(huán)形結(jié)構(gòu)要復(fù)雜得多,同時(shí)也發(fā)現(xiàn)該超市內(nèi)部商品分布比較零散,不利于陌生顧客快速尋找自己需要的商品[7]。
在傳統(tǒng)的超市內(nèi)部布局過(guò)程中,通??紤]兩方面內(nèi)容,一是兩種商品的屬性是否相似,比如水果和蔬菜等;另一方面是考慮顧客的購(gòu)買(mǎi)心理[8]。因此,超市中不同商品類(lèi)別之間的位置關(guān)系成了超市布局的重要因素,所以,本文采用不同商品類(lèi)別之間的距離這一量化指標(biāo)代替位置關(guān)系。并依據(jù)每個(gè)商品類(lèi)別占據(jù)的面積及其支持度計(jì)算出強(qiáng)關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的緩沖區(qū)半徑。強(qiáng)關(guān)聯(lián)規(guī)則的緩沖半徑計(jì)算公式:
其中Rb表示緩沖半徑,Si表示強(qiáng)關(guān)聯(lián)規(guī)則中頻繁項(xiàng)集的面積,N 表示符合計(jì)算要求的頻繁項(xiàng)集對(duì)數(shù),σ表示該頻繁項(xiàng)集對(duì)的置信度閾值,φ表示該頻繁項(xiàng)集對(duì)的支持度閾值。
表3 強(qiáng)關(guān)聯(lián)規(guī)則頻繁項(xiàng)集及其面積(表中數(shù)據(jù)均保留3位有效數(shù)字)
使用Apriori 算法得出的強(qiáng)關(guān)聯(lián)規(guī)則與空間分析方法求得的實(shí)際關(guān)聯(lián)結(jié)果進(jìn)行判定,給超市的布局進(jìn)行量化評(píng)分。超市內(nèi)部布局評(píng)分公式:
其中表示超市內(nèi)部布局得分,θi表示強(qiáng)關(guān)聯(lián)規(guī)則中頻繁2 項(xiàng)集與關(guān)聯(lián)面積大于閾值的頻繁項(xiàng)集對(duì)的判定值(以頻繁2 項(xiàng)集為基準(zhǔn),取0或1),Si表示強(qiáng)關(guān)聯(lián)規(guī)則中頻繁項(xiàng)集的面積,N表示符合計(jì)算要求的頻繁項(xiàng)集對(duì)數(shù)。
圖3 沃爾瑪超市重新布局平面圖
通過(guò)依據(jù)銷(xiāo)售數(shù)據(jù)的計(jì)算,得出信陽(yáng)沃爾瑪超市的布局得分為34.87(保留四位有效數(shù)字)。得分較低,則要依據(jù)逆行上述方法,對(duì)信陽(yáng)沃爾瑪超市進(jìn)行重新布局。
超市的布局設(shè)計(jì)應(yīng)該遵循自主性、便利性、人性化的原則。依據(jù)這三個(gè)原則結(jié)合本文的分析結(jié)果對(duì)信陽(yáng)沃爾瑪超市進(jìn)行重新布局[9]。
將優(yōu)化設(shè)計(jì)后的超市布局?jǐn)?shù)據(jù)重新代入關(guān)聯(lián)計(jì)算方法進(jìn)行分析,對(duì)關(guān)聯(lián)結(jié)果進(jìn)行緩沖區(qū)分析和空間疊加分析,并將得出的實(shí)際關(guān)聯(lián)結(jié)果與Apriori 算法分析得出的強(qiáng)關(guān)聯(lián)規(guī)則進(jìn)行對(duì)比判斷,得出重新布局后的結(jié)果得分為87.64(保留兩位有效數(shù)字)。評(píng)為優(yōu)秀等級(jí)。
本文以大型超市為研究對(duì)象,綜合運(yùn)用了數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則方法與GIS 空間分析技術(shù),結(jié)合商業(yè)布局理論和GIS 空間分析方法,對(duì)超市內(nèi)部商品布局的評(píng)價(jià)與優(yōu)化方法做了探討。研究?jī)?nèi)容中包含了Apriori算法在超市銷(xiāo)售數(shù)據(jù)分析中的應(yīng)用以及GIS緩沖區(qū)分析方法和空間疊加分析方法在布局優(yōu)化中的應(yīng)用,涉及了多個(gè)領(lǐng)域的相關(guān)問(wèn)題,探索出了一種量化的超市布局評(píng)價(jià)與優(yōu)化方法。
[1] 安運(yùn)運(yùn).大型超市布局優(yōu)化設(shè)計(jì)[D].吉林大學(xué),2011.
[2] 許昊.基于業(yè)態(tài)優(yōu)先的商業(yè)綜合體內(nèi)部布局研究[D].湖南大學(xué),2013.
[3] 梁循.數(shù)據(jù)挖掘算法與應(yīng)用[M].北京:北京大學(xué)出版社,2006.4.
[4] 趙謙.數(shù)據(jù)挖掘技術(shù)在大型超市中的應(yīng)用研究[D].哈爾濱理工大學(xué),2007.
[5] 朱正國(guó).基于超市銷(xiāo)售數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘算法的研究[J].現(xiàn)代計(jì)算機(jī),2013(1).
[6] 劉華婷,郭仁祥,姜浩.關(guān)聯(lián)規(guī)則挖掘Apriori 算法的研究與改進(jìn)[J].計(jì)算機(jī)應(yīng)用與軟件,2009(1).
[7] 程林,王法輝,修春亮.基于GIS 的長(zhǎng)春市中心城區(qū)大型超市服務(wù)區(qū)分析[J].經(jīng)濟(jì)地理,2014(4).
[8] 于偉,郭敏,宋金平.北京市新型零售業(yè)空間特征與趨勢(shì)研究[J].經(jīng)濟(jì)地理,2012(5).
[9] 肖琛,陳雯,袁豐,程紹鉑.大城市內(nèi)部連鎖超市空間分布格局及其區(qū)位選擇[J].地理研究,2013(3).