陶 浩,吳 旦,田考聰
(重慶醫(yī)科大學(xué),重慶400016)
隨著信息化的不斷發(fā)展,連鎖便利店已經(jīng)成為當(dāng)前社會(huì)便利銷(xiāo)售服務(wù)的核心。中國(guó)連鎖經(jīng)營(yíng)協(xié)會(huì)與波士頓咨詢(xún)公司聯(lián)合發(fā)布的 《2017年中國(guó)便利店發(fā)展報(bào)告》指出,我國(guó)2017年便利店行業(yè)增速達(dá)23%,門(mén)店超過(guò)10萬(wàn)家,市場(chǎng)規(guī)模超過(guò)1900億元。開(kāi)店數(shù)量及門(mén)店銷(xiāo)售額雙雙增長(zhǎng),市場(chǎng)空間大,一二線城市是增長(zhǎng)熱點(diǎn)①。
但看似欣欣向榮發(fā)展的背后,卻存在著巨大的危機(jī)。一方面,本土便利店品牌會(huì)直接遭遇外資品牌在綜合運(yùn)營(yíng)能力上的挑戰(zhàn);另一方面,自身的品牌建設(shè)能力和商品開(kāi)發(fā)能力不足,導(dǎo)致企業(yè)缺乏明確的價(jià)值觀和落地能力②。近年來(lái)店鋪?zhàn)饨稹⑷斯こ杀镜牟粩嗌蠞q也給企業(yè)帶來(lái)更多負(fù)擔(dān)。不少連鎖便利店不僅難以盈利,甚至連維持生計(jì)也成為問(wèn)題。目前對(duì)連鎖便利店的研究主要包括在選址、競(jìng)爭(zhēng)策略、品類(lèi)管理、配送優(yōu)化等方面。很少有學(xué)者從門(mén)店自身產(chǎn)生的大量銷(xiāo)售數(shù)據(jù)入手,對(duì)企業(yè)的發(fā)展和管理提出建議和給予幫助。本文對(duì)X市Y便利店的經(jīng)營(yíng)數(shù)據(jù)進(jìn)行分析,現(xiàn)將結(jié)果進(jìn)行報(bào)告。
本研究取自于X市Y連鎖便利店的150家門(mén)店2017年6月至2018年5月的銷(xiāo)售數(shù)據(jù),主要信息包括交易時(shí)間、流水號(hào)、子店名稱(chēng)、商品名稱(chēng)、購(gòu)買(mǎi)數(shù)量、銷(xiāo)售額、商品成本、商品毛利潤(rùn)等,共計(jì)6145萬(wàn)余條銷(xiāo)售記錄。
對(duì)企業(yè)而言,開(kāi)設(shè)便利店的目的是盈利,因此本文的研究對(duì)象是各門(mén)店的每日毛利潤(rùn)??紤]到便利店的每日毛利潤(rùn)易受到休息日、節(jié)假日等的影響,選擇其毛利潤(rùn)的變異系數(shù)作為穩(wěn)定性的衡量。日均利潤(rùn)越高,說(shuō)明該店的運(yùn)營(yíng)能力越強(qiáng);變異系數(shù)越低,說(shuō)明該店的經(jīng)營(yíng)越穩(wěn)定。經(jīng)提取每家店每日毛利潤(rùn),剔除異常值,求其平均值后,得到最終的數(shù)據(jù)集如表1所示。
表1 各店日均利潤(rùn)及其變異系數(shù)
1.基于熵權(quán)的TOPSIS綜合評(píng)價(jià)。熵權(quán)是根據(jù)各指標(biāo)觀測(cè)值的信息量(熵)來(lái)計(jì)算權(quán)重的一種客觀賦權(quán)方法。它能夠客觀體現(xiàn)決策時(shí)某項(xiàng)指標(biāo)在指標(biāo)體系中的重要程度③?;陟貦?quán)的TOPSIS法的計(jì)算步驟如杜挺和李燦等所論④⑤。用TOPSIS法進(jìn)行評(píng)價(jià),轉(zhuǎn)化方式用倒數(shù)法⑥。然后對(duì)同趨勢(shì)化后的原始數(shù)據(jù)矩陣進(jìn)行歸一化處理:
確定最優(yōu)方案(Z+)與最劣方案(Z-):
采用熵權(quán)權(quán)重模型,計(jì)算權(quán)重。
首先,計(jì)算各指標(biāo)的熵
再計(jì)算各指標(biāo)的差異系數(shù)dj:
式中,dj越大,說(shuō)明該指標(biāo)越重要。最終計(jì)算出各指標(biāo)的權(quán)重wj:
在上述基礎(chǔ)上計(jì)算出Ci。
按照Ci大小將各評(píng)價(jià)對(duì)象排序,Ci值越大,表示綜合效益越好。
有序樣品聚類(lèi)由Fisher于1958年提出,它對(duì)樣品進(jìn)行分類(lèi)時(shí),要求考慮樣品的順序特性這個(gè)前提條件,不破壞樣品間的順序。具體的分析步驟為③⑦:
步驟 1:設(shè)樣品 X1、X2、…、Xn在分檔中,某類(lèi) G 包括的樣本有{Xi、Xi+1、…、Xj},(j>i),則該類(lèi)的均值向量為:
將該類(lèi)內(nèi)部的各樣本間的總差異(其指標(biāo)是離差平方和)定義為該類(lèi)的直徑,用D(i,j)表示:
步驟2:定義此分類(lèi)的最小損失函數(shù)即為類(lèi)內(nèi)總離差平方和:
步驟3:確定聚類(lèi)個(gè)數(shù):最優(yōu)分割就是使L[p(n,k)]達(dá)到最小值的一種分類(lèi)法,聚類(lèi)個(gè)數(shù)通過(guò)做L[p(n,k)]與聚類(lèi)數(shù)k的變化趨勢(shì)圖求得,曲線的拐點(diǎn)處即為最優(yōu)聚類(lèi)個(gè)數(shù)⑧。
決策樹(shù)常用的算法有ID3、C4.5與CART⑨。本文是基于連續(xù)屬性來(lái)生成決策樹(shù),因此使用C4.5算法,它的采用機(jī)制是用二分法對(duì)連續(xù)屬性進(jìn)行處理。從根節(jié)點(diǎn)開(kāi)始,選取最優(yōu)分割點(diǎn)來(lái)進(jìn)行樣本集合的劃分,使其該點(diǎn)二分后的信息增益達(dá)到最大。再對(duì)子節(jié)點(diǎn)遞歸的調(diào)用以上方法,構(gòu)建決策樹(shù),直到所有特征的信息增益均很小或沒(méi)有特征可以選擇為止⑩。
現(xiàn)對(duì)表1中150家門(mén)店進(jìn)行綜合評(píng)價(jià)。日均利潤(rùn)、變異系數(shù)作為原始指標(biāo),屬于權(quán)重未知的情況,故采用熵權(quán)法求得日均利潤(rùn)與變異系數(shù)的權(quán)重分別為:0.79217、0.20783。確定權(quán)重后,進(jìn)行TOPSIS綜合排序。其排序部分結(jié)果如表2所示。
表2 150家門(mén)店基于熵權(quán)的TOPSIS法排序結(jié)果
上述中的C值作為綜合指標(biāo),表示為諸評(píng)價(jià)對(duì)象與最優(yōu)方案接近程度。是綜合考慮了各子店的日均利潤(rùn)、變異系數(shù)而計(jì)算出的值。雖然可以直觀地看到每家門(mén)店經(jīng)營(yíng)能力在連鎖品牌中的排位,但是本研究旨在對(duì)150家門(mén)店進(jìn)行分檔,即把運(yùn)營(yíng)實(shí)力相近的門(mén)店放到相同的檔位?,F(xiàn)利用有序樣品聚類(lèi)法對(duì)TOPSIS法中的C值進(jìn)行聚類(lèi)。主要結(jié)果如表3所示。
表3 有序樣品聚類(lèi)結(jié)果
圖1為聚類(lèi)數(shù)K(只取到20)與其最小損失函數(shù)值的變化趨勢(shì)圖。曲線的拐點(diǎn)出現(xiàn)在K=6時(shí),說(shuō)明有序樣品被分為6檔時(shí)效果較好。此時(shí),最小損失函數(shù)值為0.144。結(jié)合表3可知,第一檔門(mén)店:2家;第二檔門(mén)店:14家;第三檔門(mén)店:28家;第四檔門(mén)店:36家;第五檔門(mén)店:42家;第六檔門(mén)店:28家。各子店的具體分檔情況如表4所示。
圖1 不同分檔數(shù)時(shí)的最小損失函數(shù)值
表4 150家門(mén)店的分檔結(jié)果
現(xiàn)對(duì)各檔位門(mén)店日均利潤(rùn)的均值是否相同做差異性分析。由于第一檔的門(mén)店數(shù)僅有兩家店,樣本過(guò)少,在此不納入分析。Shapiro-Wilk檢驗(yàn)結(jié)果表明,剩下5個(gè)檔位門(mén)店的日均利潤(rùn)數(shù)據(jù)均滿(mǎn)足正態(tài)性分布。而Levene方差齊性檢驗(yàn)結(jié)果為F=1.64,P=0.1667>0.05,表明這五組的數(shù)據(jù)滿(mǎn)足方差齊性。故在此可采用方差分析對(duì)各組間的均值進(jìn)行比較。其結(jié)果如表5所示。
表5 各檔日均利潤(rùn)方差分析
方差分析結(jié)果為F=518.82,P<0.0001,說(shuō)明各檔位門(mén)店的日均利潤(rùn)均數(shù)存在統(tǒng)計(jì)學(xué)差異,SNK-q檢驗(yàn)兩兩比較結(jié)果表明:任意兩個(gè)檔位之間的差異均具有統(tǒng)計(jì)學(xué)意義。具體均數(shù)的高低為:Ⅱ檔(均數(shù):3348.28)>Ⅲ檔 (均數(shù):2560.13)>Ⅳ檔 (均數(shù):1832.62)>Ⅴ檔 (均數(shù):1227.61)>Ⅵ檔 (均數(shù):623.32)。這說(shuō)明有序樣品聚類(lèi)進(jìn)行分檔的結(jié)果比較合理,能夠?qū)⑦\(yùn)營(yíng)實(shí)力相近的店面放到同一檔位,不同檔位間具有明顯的差異。
經(jīng)過(guò)綜合評(píng)價(jià)和有序樣品聚類(lèi),不僅實(shí)現(xiàn)了150家子店的綜合經(jīng)營(yíng)實(shí)力排序,而且對(duì)其完成了所處檔位的標(biāo)注。而企業(yè)管理者較關(guān)心的一個(gè)問(wèn)題是原始指標(biāo)的閾值具體為多少時(shí),子店可以分到何等檔位?,F(xiàn)運(yùn)用機(jī)器學(xué)習(xí)中的分類(lèi)決策樹(shù)對(duì)表6進(jìn)行分類(lèi)學(xué)習(xí),以便能實(shí)現(xiàn)其需求。
表6 150家門(mén)店的原始指標(biāo)及其檔位標(biāo)注
由于該連鎖品牌中子店屬于Ⅰ檔的門(mén)店僅有兩家,這在決策樹(shù)中分成訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集會(huì)造成一定的影響,因此在上表的等級(jí)一列中,其值的意義為:2(Ⅰ、Ⅱ檔)、3(Ⅲ檔)、4(Ⅳ檔)、5(Ⅴ檔)、6(Ⅵ檔)。分別代表門(mén)店的等級(jí):優(yōu)、較優(yōu)、良、中、差。即將樣本較少的檔位合并到鄰近的低檔位中,便于決策樹(shù)的學(xué)習(xí)以及泛化效果的驗(yàn)證。其模型的部分結(jié)果如圖2所示。
圖2 基于信息增益生成的決策樹(shù)
將表6中的150家門(mén)店隨機(jī)分為訓(xùn)練樣本與驗(yàn)證樣本,其比例為7:3。由訓(xùn)練樣本最終生成的決策樹(shù)如圖2所示,一共有四次分叉,且均用了日均利潤(rùn)這個(gè)變量。其4個(gè)劃分節(jié)點(diǎn)分別為2939、2241、1562、984。 表明門(mén)店其日均利潤(rùn)在[2939,+∞+∞)區(qū)間時(shí)被分為優(yōu)店;在[2241,2939)時(shí)被分為較優(yōu)店;在[1562,2241)區(qū)間時(shí)大可判斷為良店;在[984,1562)區(qū)間時(shí)可判斷為中等店;在[0,984)區(qū)間時(shí)可判斷為差店。其生成的決策樹(shù)在驗(yàn)證集上的預(yù)測(cè)準(zhǔn)確率為91.11%,其分類(lèi)準(zhǔn)確率較高,具體的分類(lèi)結(jié)果(混淆矩陣)如表7所示。
便利店作為一個(gè)競(jìng)爭(zhēng)極其殘酷的行業(yè),若企業(yè)沒(méi)有系統(tǒng)性地對(duì)自身進(jìn)行評(píng)估和認(rèn)識(shí),很難做出理性決策來(lái)幫助自身在市場(chǎng)上立足。本文建立了一套連鎖便利店全面的合理性評(píng)價(jià)細(xì)則。綜合考慮便利店的運(yùn)營(yíng)能力和穩(wěn)定性,選取各子店的日均利潤(rùn)和變異系數(shù)來(lái)作為原始指標(biāo),進(jìn)行基于熵權(quán)的TOPSIS綜合評(píng)價(jià)??傻玫骄唧w門(mén)店在其所有店面中的經(jīng)營(yíng)實(shí)力排名,這可以幫助企業(yè)管理人員直觀地看到各門(mén)店的綜合運(yùn)營(yíng)能力高低。
表7 生成決策樹(shù)對(duì)門(mén)店的預(yù)測(cè)結(jié)果
通過(guò)有序樣品聚類(lèi),可以有效地將所有店面劃分為6個(gè)不同優(yōu)劣等級(jí)的檔位,相同檔位內(nèi)的門(mén)店經(jīng)營(yíng)能力比較接近。其中極優(yōu)店面有2家,占比1.33%;較優(yōu)店面有14家,占比9.33%;良好門(mén)店有28家,占比18.67%;中等門(mén)店有36家,占比24%;較差門(mén)店有42家,占比28%;而極差門(mén)店有28家,占比18.67%??傮w看來(lái),該連鎖便利店只有不到30%的優(yōu)良門(mén)店,其經(jīng)營(yíng)狀況亟待改善。
運(yùn)用決策樹(shù)進(jìn)行分類(lèi)學(xué)習(xí)表明,不僅幫助企業(yè)確定了不同檔位間的分檔閾值,可以讓子店的運(yùn)營(yíng)者了解到自身經(jīng)營(yíng)水平屬于何種等級(jí);而且該決策樹(shù)的泛化能力比較強(qiáng),對(duì)新店的經(jīng)營(yíng)水平可直接進(jìn)行預(yù)測(cè)。在此,本文可以有效地對(duì)國(guó)內(nèi)連鎖便利店進(jìn)行高效分檔,并確立其分檔指標(biāo)的閾值大小,可以為企業(yè)的政策制定與調(diào)整提供有效參考。
最后,建議企業(yè)從以下兩個(gè)方面做出改善。首先,對(duì)所有店面的位置進(jìn)行綜合評(píng)分,在這里可以參考便利店選址模型。通過(guò)地址評(píng)分,一方面可以找出位置評(píng)分低而自身經(jīng)營(yíng)能力也很低的門(mén)店,可以直接考慮關(guān)店,及時(shí)止損。另一方面,可以找出位置評(píng)分高但自身經(jīng)營(yíng)能力卻很低的門(mén)店,必須關(guān)注這部分地理位置上的優(yōu)質(zhì)門(mén)店,及時(shí)找出其經(jīng)營(yíng)能力不強(qiáng)的原因,進(jìn)行調(diào)整。其次,該連鎖品牌子店分布于該市各區(qū),可以對(duì)其進(jìn)行地址劃分,結(jié)合其劃分區(qū)域門(mén)店優(yōu)良占比情況,合理選擇建倉(cāng)位置及其大小,在滿(mǎn)足門(mén)店經(jīng)營(yíng)需求下,最大程度地降低運(yùn)輸成本和儲(chǔ)存成本。
注釋?zhuān)?/p>
①中國(guó)連鎖經(jīng)營(yíng)協(xié)會(huì),波士頓咨詢(xún)公司.2018中國(guó)便利店發(fā)展報(bào)告[EB/OL].(2018-05-24)[2018-08-05].http://www.ccfa.org.cn/portal/cn/view.jsp?lt=33&id=434758.
②章曼程.我國(guó)連鎖便利店發(fā)展存在的問(wèn)題及對(duì)策分析[J].時(shí)代金融,2016.
③毛瑋.幾種典型綜合評(píng)價(jià)方法的比較及SAS軟件實(shí)現(xiàn)[D].中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院,2011.
④杜挺,謝賢健,梁海艷等.基于熵權(quán)TOPSIS和GIS的重慶市縣域經(jīng)濟(jì)綜合評(píng)價(jià)及空間分析[J].經(jīng)濟(jì)地理,2014,34(6):40-47.
⑤李燦,張鳳榮,朱泰峰,等.基于熵權(quán)TOPSIS模型的土地利用績(jī)效評(píng)價(jià)及關(guān)聯(lián)分析[J].農(nóng)業(yè)工程學(xué)報(bào),2013,(5):217-227.
⑥孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:人民衛(wèi)生出版社,2016:416-417.
⑦顏虹.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:人民衛(wèi)生出版社,2010:416-417.
⑧蔡亞寧,裴曉婷,孫盼盼等.基于有序聚類(lèi)分析法探討成年人體質(zhì)指數(shù)的年齡和性別分布特征[J].中華流行病學(xué)雜志,2018,39(6):821-825.
⑨李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2018:55-74.
⑩周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2018:79-88.