馬麗娜,萬美妤,杜玉申
(吉林大學(xué) 商學(xué)院,吉林 長(zhǎng)春 130012)
隨著信息技術(shù)的發(fā)展,購物渠道越來越多,促使許多零售商實(shí)施多渠道戰(zhàn)略。但是,由于數(shù)字化的不斷發(fā)展,線上和線下購買渠道之間的區(qū)別正在消失。在這種情況下,傳統(tǒng)的分銷渠道正在發(fā)生變化,全渠道零售成為整個(gè)零售業(yè)發(fā)展的關(guān)鍵路徑[1],多渠道零售正在轉(zhuǎn)向全渠道零售,迎來了第四代零售革命,即零售4.0時(shí)代。
全渠道零售是為顧客提供的一種無縫連接購買渠道,讓顧客通過所有可行渠道體驗(yàn)購物,如線下渠道、線上渠道和移動(dòng)渠道[2]。同時(shí),購買渠道的多樣化使數(shù)據(jù)源越來越多,產(chǎn)品數(shù)據(jù)和顧客數(shù)據(jù)的數(shù)量呈爆炸式增長(zhǎng),使數(shù)據(jù)聚合更困難。由于顧客個(gè)體不斷飛速地產(chǎn)生數(shù)據(jù),因此需要利用大數(shù)據(jù)分析來從數(shù)據(jù)中提取隱含信息,從而為商業(yè)決策提供幫助[3]。大數(shù)據(jù)分析在零售業(yè)雖然已經(jīng)廣泛應(yīng)用,但由于零售業(yè)本身數(shù)據(jù)種類和來源過于繁雜,使得大數(shù)據(jù)在零售行業(yè)的切實(shí)應(yīng)用存在一定的困難。本文通過基于遺傳算法優(yōu)化的模型,完善了大數(shù)據(jù)分析在零售業(yè)中的應(yīng)用和能產(chǎn)生的相關(guān)指導(dǎo)作用。
大數(shù)據(jù)的應(yīng)用主要包括云計(jì)算、關(guān)系數(shù)據(jù)庫以及數(shù)據(jù)挖掘技術(shù)等[4]。大數(shù)據(jù)分析在零售4.0時(shí)代中的重要性表現(xiàn)在以下兩個(gè)方面。其一,在全渠道零售商業(yè)中,零售商必須以顧客為導(dǎo)向,與顧客緊密聯(lián)系。例如,他們需要將所有可行的購買渠道與相匹配的顧客和產(chǎn)品信息連接起來,并匯總所有數(shù)據(jù)進(jìn)行分析,以便與顧客進(jìn)行個(gè)性化交流。大數(shù)據(jù)挖掘可以完成購物籃分析,從而幫助企業(yè)預(yù)測(cè)顧客購買趨勢(shì)并設(shè)計(jì)營(yíng)銷促銷策略。大數(shù)據(jù)分析可以洞察顧客的需求,預(yù)測(cè)顧客的行為,有效幫助企業(yè)做出滿足顧客個(gè)性化需求的決策[5]。其二,無論訂單是在線上還是在線下完成,零售商提供全套發(fā)貨和提貨方式非常重要。顧客希望在下單后快速交付,所以交付績(jī)效是影響全渠道零售交易中顧客購物體驗(yàn)的關(guān)鍵因素之一。例如,亞馬遜申請(qǐng)了先行發(fā)貨專利,用于預(yù)測(cè)顧客何時(shí)進(jìn)行購買并在顧客在線下訂單之前將產(chǎn)品運(yùn)送到最近的配送中心[6]。
通常,衡量交付績(jī)效的兩個(gè)一般因素是成本和時(shí)間。近期的相關(guān)研究中,學(xué)者們考慮用成本和時(shí)間來改善配送網(wǎng)絡(luò),但是較成熟的模型通常假設(shè)已知顧客的需求,它不適用于先行發(fā)貨,因?yàn)椴煌a(chǎn)品的顧客需求完全是根據(jù)顧客行為預(yù)測(cè)的結(jié)果。因此,應(yīng)該考慮預(yù)測(cè)結(jié)果的置信度,因?yàn)樗鼪Q定是否應(yīng)該在收到任何訂單之前把產(chǎn)品預(yù)先運(yùn)送到特定配送中心(DC),而且它可以有效解決當(dāng)優(yōu)化一個(gè)因素時(shí)導(dǎo)致其他因素改變產(chǎn)生的問題。例如,當(dāng)將某類產(chǎn)品運(yùn)送到配送中心A所需的成本低于配送中心B時(shí),但預(yù)計(jì)在配送中心B附近的購買置信度比配送中A附近的購買置信度更大時(shí),零售商不得不面對(duì)交易成本與預(yù)測(cè)置信度之間的權(quán)衡。如果產(chǎn)品運(yùn)送到購買置信度更高的地點(diǎn),預(yù)計(jì)投資回報(bào)率可能會(huì)更好。
本文的目的是分析預(yù)測(cè)顧客的購買行為,并根據(jù)多種因素,包括運(yùn)輸成本、運(yùn)輸時(shí)間和預(yù)測(cè)結(jié)果置信度,提出一種用來確定將產(chǎn)品分配至不同配送中心的優(yōu)化模型。
互聯(lián)網(wǎng)的出現(xiàn)和發(fā)展及其在供應(yīng)鏈管理中的重要性,打開了電子物流發(fā)展新機(jī)會(huì)的大門,由于電子商務(wù)的拓展,除傳統(tǒng)零售外,顧客能夠通過多種渠道進(jìn)行產(chǎn)品購買[7],例如商店、產(chǎn)品目錄、網(wǎng)絡(luò)、移動(dòng)終端等包括在內(nèi)的所有渠道[8]。顧客無論是親自購物,還是通過目錄、手機(jī)、在線等其他方式購物,都會(huì)對(duì)如何購買產(chǎn)品做出決定[9]。隨著一些電商分銷商對(duì)產(chǎn)品不同程度的主導(dǎo),對(duì)傳統(tǒng)零售商產(chǎn)生了不同的影響,甚至?xí)?dǎo)致其退出銷售渠道[10]。這種情況下,傳統(tǒng)零售商將面臨復(fù)雜的電子物流帶來的挑戰(zhàn),他們?cè)谥贫闶鄄呗詴r(shí)不得不考慮技術(shù)問題,因?yàn)橐豁?xiàng)新技術(shù)會(huì)為零售業(yè)創(chuàng)造新渠道,零售商開始采用多渠道零售策略,學(xué)者們已將線上和線下渠道融入零售業(yè)視為零售商較有前景的策略。然而,近幾十年來信息技術(shù)的發(fā)展為全渠道零售提供了動(dòng)力,而全渠道零售業(yè)逐漸成為零售業(yè)4.0時(shí)代的主流戰(zhàn)略。
零售業(yè)4.0依托于工業(yè)4.0,利用大數(shù)據(jù)進(jìn)行計(jì)算和建模,進(jìn)行針對(duì)性的有效營(yíng)銷,并結(jié)合全渠道服務(wù)模式,為消費(fèi)者提供了全新購物體驗(yàn)[11]。中國(guó)的零售業(yè)在經(jīng)歷了計(jì)劃經(jīng)濟(jì)下的傳統(tǒng)零售1.0時(shí)代,市場(chǎng)經(jīng)濟(jì)下客戶主導(dǎo)的終端零售2.0時(shí)代,以及電商線上零售的3.0時(shí)代后,逐步進(jìn)入零售業(yè)4.0時(shí)代[12]。零售業(yè)4.0推崇各零售渠道以及物流之間協(xié)作,通過形成全渠道新零售模式,為消費(fèi)者提供跨渠道無差別服務(wù)[11]。零售渠道發(fā)展的高級(jí)階段是全渠道零售,它是“以消費(fèi)者為中心”為主要特征,實(shí)現(xiàn)各渠道之間的無縫鏈接,為顧客提供更高的消費(fèi)體驗(yàn)價(jià)值[13]。
盡管全渠道零售商業(yè)模式可以讓企業(yè)通過較多的渠道向顧客銷售商品或提供服務(wù),但它也存在潛在的消極因素。一個(gè)主要的現(xiàn)象是“展廳現(xiàn)象”,即顧客在商店中打量商品,但同時(shí)在網(wǎng)上搜索更多信息并以更具吸引力的價(jià)格在競(jìng)爭(zhēng)對(duì)手的網(wǎng)站上購買[14]。同樣,“反展廳現(xiàn)象”與“展廳現(xiàn)象”相反,出現(xiàn)了顧客在網(wǎng)上尋求信息但在線下購買商品的現(xiàn)象。因此,多渠道的快速擴(kuò)散,可能會(huì)造成顧客跨渠道搭便車的問題。我們鼓勵(lì)零售商投入資金來分析顧客的購買行為,顧客大數(shù)據(jù)分析是從大數(shù)據(jù)中提取關(guān)于顧客行為的隱含信息,并用有效的解釋來剖析該隱含信息[15]。
數(shù)據(jù)挖掘技術(shù),如聚類和關(guān)聯(lián),可以從大數(shù)據(jù)中提取隱含信息來實(shí)現(xiàn)目標(biāo)[16]。聚類是基于對(duì)象的相似點(diǎn)將其分成多個(gè)類的非監(jiān)督分類過程,由于聚類所要?jiǎng)澐值念愂俏粗?,僅憑數(shù)據(jù)自然分類,故聚類分析又稱作非監(jiān)督分類,例如高聚類內(nèi)相似性和低聚類間相似性,物體之間的相似性通常通過距離來衡量,而顧客可以通過具有相似的特征,如興趣、收入水平和支出相似,組合為一個(gè)集群。聚類算法通常采用層次聚類方法[17]和K-means聚類方法,例如采用K-means聚類方法對(duì)游客分布分類、對(duì)消費(fèi)者客戶分類等[18-20]。此外,關(guān)聯(lián)規(guī)則挖掘有助于找出所有項(xiàng)集之間的相關(guān)性,并用關(guān)聯(lián)規(guī)則來表達(dá)它們。關(guān)聯(lián)規(guī)則以P→Q的形式表示,其中P和Q分別定義為表示規(guī)則的“如果”部分和“那么”部分的項(xiàng)集。Agrawal et al.提出了Apriori算法,一種挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法,Chung et al.在研究中指出該算法可以用于發(fā)現(xiàn)數(shù)據(jù)集中所有項(xiàng)集之間的關(guān)聯(lián)規(guī)則[21]。戴穩(wěn)勝等使用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)交叉銷售機(jī)會(huì),即研究顧客購買某公司的一種產(chǎn)品后,又購買該公司另一件產(chǎn)品的關(guān)聯(lián)性,通過數(shù)據(jù)挖掘構(gòu)建顧客需求預(yù)測(cè)模型[22]。張德鵬等利用企業(yè)數(shù)據(jù)資源,提出利用關(guān)聯(lián)規(guī)則技術(shù)制定商品的營(yíng)銷組合,為商品提供外在推動(dòng)力[23]。何黎等利用相關(guān)性分析和關(guān)聯(lián)規(guī)則分析對(duì)平臺(tái)用戶進(jìn)行分析,實(shí)現(xiàn)個(gè)性化營(yíng)銷[24]。郭燕等認(rèn)為數(shù)據(jù)挖掘?yàn)榱闶蹣I(yè)創(chuàng)新提供了新工具,對(duì)于傳統(tǒng)零售業(yè)而言,充分運(yùn)用大數(shù)據(jù)成為創(chuàng)新制勝的必由之路[25],范生萬等采用Apriori算法對(duì)通過聚類分析的企業(yè)客戶和商品進(jìn)行關(guān)聯(lián)規(guī)則分析,從而指導(dǎo)商品精準(zhǔn)營(yíng)銷[18]。
顧客在下訂單后希望快速收到產(chǎn)品,一些新型交付方式,諸如多峰性和時(shí)窗方式等越來越重要[9]。另外,改善配送網(wǎng)絡(luò)也成為提高物流績(jī)效的關(guān)鍵,配送網(wǎng)絡(luò)通過不同的配送中心把來自不同來源點(diǎn)(供應(yīng)商)的產(chǎn)品配送到不同的需求點(diǎn)(顧客)。物流的兩種主要屬性是交付速度和交付可靠性,前者是指縮短訂單接收和顧客交付之間時(shí)間的能力,而后者則指準(zhǔn)確報(bào)價(jià)或預(yù)期交付日期和數(shù)量的能力。遺傳算法(GA)是啟發(fā)式方法之一,廣泛使用于配送網(wǎng)絡(luò)問題。相比于其他算法,遺傳算法對(duì)所要優(yōu)化目標(biāo)函數(shù)的連續(xù)性和是否可微沒有嚴(yán)格的要求,并且在一定時(shí)間內(nèi)能夠從大規(guī)模優(yōu)化問題中做出選擇[26]。在遺傳算法中,每個(gè)單獨(dú)的解決方案都用染色體的形式表示,染色體通過使用遺傳算子進(jìn)行修改,如交叉和變異。遺傳算法的目標(biāo)是創(chuàng)建新一代可行的解決方案,使其趨于函數(shù)的最優(yōu)解。Lin et al.開發(fā)了一個(gè)遺傳算法模型來確定交付和回收商品的最佳提貨策略[27];Ko et al.采用遺傳算法優(yōu)化了新型電動(dòng)汽車充電基礎(chǔ)設(shè)施的分配,他們考慮了電力變送器成本這一非線性成本[28];Dib et al.結(jié)合了遺傳算法和可變鄰域搜索算法,解決道路網(wǎng)中的最短路徑問題[29];趙泉午等在優(yōu)化大型零售企業(yè)城市配送網(wǎng)絡(luò)的研究中,運(yùn)用遺傳算法時(shí),考慮了配送中心到需求點(diǎn)的配送距離[30]。
本文創(chuàng)新性地將遺傳算法和基于聚類的關(guān)聯(lián)規(guī)則挖掘相結(jié)合,研究了多因素對(duì)配送網(wǎng)絡(luò)的影響,并提出了先行發(fā)貨的優(yōu)化方法。
圖1是先行發(fā)貨的遺傳算法優(yōu)化模型。圖1構(gòu)建了基于遺傳算法優(yōu)化模型的基本框架,以此分析顧客行為和先行發(fā)貨,它由3個(gè)模塊組成:(1) 大數(shù)據(jù)管理模塊;(2) 顧客預(yù)測(cè)分析模塊;(3) 先行發(fā)貨優(yōu)化模塊。大數(shù)據(jù)中的有些數(shù)據(jù)更能顯著地體現(xiàn)出顧客在全渠道零售中的購買行為,為了篩選出這些數(shù)據(jù),需要把各個(gè)顧客的數(shù)據(jù)集遠(yuǎn)程存儲(chǔ)在大數(shù)據(jù)管理模塊的云端中,零售商能夠從云端獲取大數(shù)據(jù)分析的數(shù)據(jù)。在利用云端管理數(shù)據(jù)的模式下,大數(shù)據(jù)管理模塊為全渠道零售供應(yīng)鏈各方共享信息提供了一個(gè)公共平臺(tái)。顧客預(yù)測(cè)分析模塊嵌入了大數(shù)據(jù)挖掘技術(shù),以確保所有信息源均有效滿足挖掘目標(biāo)。換言之,模型中完成的大數(shù)據(jù)挖掘技術(shù)的功能包括聚類和關(guān)聯(lián)。在預(yù)先發(fā)貨優(yōu)化模塊中,遺傳算法用于為先行發(fā)貨生成近似最優(yōu)配送解決方案,以下介紹各個(gè)模塊的詳細(xì)信息。
云計(jì)算是管理大數(shù)據(jù)的新興技術(shù)之一,是減少運(yùn)營(yíng)和資本成本較有前景的工具,云計(jì)算系統(tǒng)的體系結(jié)構(gòu)要求的細(xì)節(jié)可以參考Rimal et al.的研究[31]。云計(jì)算是基于互聯(lián)網(wǎng)的計(jì)算,通過計(jì)算機(jī)或其他設(shè)備之間提供共享資源、軟件和信息,在大數(shù)據(jù)管理模塊中,把從物理渠道、商品目錄渠道、手機(jī)移動(dòng)渠道和電腦在線渠道收集的數(shù)據(jù)整合并存儲(chǔ)在云中。由于現(xiàn)收現(xiàn)付成本結(jié)構(gòu),其資源成本取決于使用量,可減慢新渠道的增加,為零售商提供更靈活多變的渠道整合技能。
把多種渠道中的數(shù)據(jù)匯總到云端之后,進(jìn)行顧客預(yù)測(cè)分析,進(jìn)而從數(shù)據(jù)中發(fā)現(xiàn)信息,以利于提取顧客隱含的行為模式并預(yù)測(cè)未來的購買行為。在顧客預(yù)測(cè)分析模塊中,數(shù)據(jù)分為兩個(gè)級(jí)別:網(wǎng)絡(luò)層級(jí)和集群層級(jí)。在網(wǎng)絡(luò)層級(jí),應(yīng)用關(guān)聯(lián)規(guī)則挖掘探究整個(gè)配送網(wǎng)絡(luò)中顧客與已購物品之間的關(guān)系。雖然在某些情況下,不同地理位置的顧客可能會(huì)有不同的購買行為,但在網(wǎng)絡(luò)層級(jí)的應(yīng)用關(guān)聯(lián)規(guī)則挖掘,能同時(shí)考慮到一些適用于整個(gè)網(wǎng)絡(luò)的規(guī)則。在集群層級(jí),顧客購買的需求點(diǎn)進(jìn)一步分為不同的集群,同一集群內(nèi)的需求將由同一個(gè)配送中心實(shí)現(xiàn)。因此,配送中心的需求是同一集群內(nèi)所有需求點(diǎn)的總需求,關(guān)聯(lián)規(guī)則挖掘應(yīng)用于研究每個(gè)集群中顧客與已購物品之間的關(guān)系。在這個(gè)模塊中,Apriori算法為預(yù)測(cè)目標(biāo)生成一組關(guān)聯(lián)規(guī)則,輸出則采用“如果-那么”的形式,預(yù)測(cè)當(dāng)某商品被購買時(shí)顧客對(duì)其他商品的購買行為。利用規(guī)則置信度衡量已生成規(guī)則的有效性,規(guī)則置信度也可以作為預(yù)測(cè)結(jié)果置信度的指標(biāo),如果相應(yīng)的預(yù)測(cè)規(guī)則具有較高的置信度,則購買預(yù)測(cè)產(chǎn)品的置信度更高。每條規(guī)則的置信度是包含P和Q的百分比。它可以表示如下
Confidence(P→Q) =P(P|Q)
(1)
式中:P為關(guān)聯(lián)規(guī)則的“如果”部分的項(xiàng)集;Q為關(guān)聯(lián)規(guī)則的“那么”部分項(xiàng)集。置信度臨界值是用戶預(yù)先定義的值,只有大于或等于臨界值的規(guī)則才會(huì)被視為有用的規(guī)則。在先行發(fā)貨優(yōu)化模塊中,當(dāng)優(yōu)化總體規(guī)則置信度時(shí),通過遺傳算法生成預(yù)期運(yùn)輸計(jì)劃,并最大限度地提高對(duì)所考慮規(guī)則的整體置信度。
1.問題描述
表1 參數(shù)和決策變量的符號(hào)
表1中的符號(hào)描述了與先行發(fā)貨相關(guān)的問題,圖2中,配送網(wǎng)絡(luò)由所有需求點(diǎn)D及其包含的各類產(chǎn)品N組成。在先行發(fā)貨期間,不同類型產(chǎn)品將從一組源點(diǎn)S運(yùn)送到一組配送中心H,當(dāng)收到顧客訂單時(shí),每個(gè)配送中心只會(huì)將產(chǎn)品分配到集群內(nèi)的需求點(diǎn)。因此,本文不研究產(chǎn)品如何從總部向需求點(diǎn)交付,產(chǎn)品i運(yùn)送到配送中心k是否會(huì)受到相關(guān)預(yù)測(cè)規(guī)則置信度rik的影響。如果某類產(chǎn)品運(yùn)送到一個(gè)配送中心,則發(fā)貨數(shù)量將能夠滿足服務(wù)水平Lr,并且從每個(gè)源點(diǎn)Qijk運(yùn)出的每種產(chǎn)品i的數(shù)量不超過源點(diǎn)中可發(fā)出數(shù)量zij,每個(gè)配送中心k具有容量限度Pk。把產(chǎn)品從一個(gè)點(diǎn)運(yùn)送到另一個(gè)點(diǎn)時(shí),將會(huì)產(chǎn)生單位運(yùn)輸成本cijk和運(yùn)輸時(shí)間tijk。
f(x)=min[α(C)+β(T)-γ(R)]
(2)
式中:α為運(yùn)輸成本;β為運(yùn)輸時(shí)間;γ為預(yù)測(cè)規(guī)則置信度的權(quán)重。式(2)是考慮多因素的目標(biāo)函數(shù),其目的是使運(yùn)輸成本和運(yùn)輸時(shí)間最小化,并使預(yù)測(cè)規(guī)則置信度最大化。
(3)
(4)
(5)
式中:C為總運(yùn)輸成本;T為總運(yùn)輸時(shí)間;R為預(yù)測(cè)規(guī)則置信度,C′和T′分別表示運(yùn)輸成本、運(yùn)輸時(shí)間的適應(yīng)度值。雖然R總是介于0和1之間,但C和T可以處于不同的等級(jí)。C和T在式(3)和式(4)中分別在0和1之間分別歸一化,這可以使它們的聚合在相同維度下進(jìn)行,消除了對(duì)目標(biāo)結(jié)果的不合理影響。
另一方面,這個(gè)問題受到以下限制
(6)
式(6)確保滿足每個(gè)配送中心的容量。
(7)
式(7)保證了運(yùn)送到配送中心k的數(shù)量可以達(dá)到與預(yù)測(cè)規(guī)則置信度相對(duì)應(yīng)的服務(wù)水平。如果預(yù)測(cè)規(guī)則的置信度大于或等于“高置信度”的最小臨界值,則認(rèn)為服務(wù)水平較高(如80%)。例如,在配送中心k的產(chǎn)品i的預(yù)測(cè)需求是1 000單位,并且根據(jù)預(yù)定臨界值將預(yù)測(cè)規(guī)則置信度視為高置信度,那么從所有源點(diǎn)到配送中心k的產(chǎn)品i的發(fā)貨量應(yīng)當(dāng)是至少80%×1 000=800個(gè)單位。
2,…,s
(8)
式(8)確保配送中心中來自各源點(diǎn)的每類產(chǎn)品數(shù)量不會(huì)超過該類產(chǎn)品的可發(fā)貨數(shù)量。
為了簡(jiǎn)化模型,有兩個(gè)假設(shè):所有計(jì)劃產(chǎn)品一次發(fā)貨;無論數(shù)量如何,每次運(yùn)輸都有固定時(shí)間。
在這樣的假設(shè)下,T與Qijk獨(dú)立,T既不影響顧客也不影響總運(yùn)輸成本。因此,T在模型中的重要性較低,因此預(yù)期在目標(biāo)函數(shù)中β應(yīng)該不大。另外,R在目標(biāo)函數(shù)中與Qijk獨(dú)立,但是R會(huì)影響zij,從而影響Qijk的最小值。
2.引入遺傳算法
在這個(gè)模塊中,使用遺傳算法確定一個(gè)近似最優(yōu)的方案,解決如何從不同的源點(diǎn)將不同類型的產(chǎn)品分配到不同的配送中心進(jìn)行先行發(fā)貨。遺傳算法的最終目標(biāo)是確保當(dāng)顧客在線下單時(shí),該產(chǎn)品已經(jīng)在顧客附近的配送中心有可發(fā)貨的庫存。
(1)染色體編碼。染色體中有兩個(gè)區(qū)域:分配區(qū)域和產(chǎn)品數(shù)量區(qū)域。分配區(qū)域是運(yùn)載μijk值的二進(jìn)制區(qū)域,而產(chǎn)品數(shù)量區(qū)域是運(yùn)載Qijk的值。根據(jù)基因數(shù),染色體的長(zhǎng)度是2×n×s×h。圖3顯示了染色體的一個(gè)例子。父代的染色體是隨機(jī)產(chǎn)生的,輪盤輪法用于染色體選擇,父代與子代的大小相等。根據(jù)適應(yīng)值,在子代中,最差的染色體被進(jìn)化成最優(yōu)的染色體取代。在每對(duì)染色體中,隨機(jī)選擇預(yù)定數(shù)量的基因進(jìn)行交叉和突變,如果違反編碼方案,染色體將被修復(fù)。
(2)適應(yīng)度評(píng)估。為了研究不同因素對(duì)先行發(fā)貨分配網(wǎng)絡(luò)的影響,先用遺傳算法優(yōu)化單一因素。該模型考慮了3個(gè)因素,即運(yùn)輸成本、運(yùn)輸時(shí)間和預(yù)測(cè)規(guī)則置信度,式(9)~式(11)分別計(jì)算遺傳算法優(yōu)化運(yùn)輸成本、運(yùn)輸時(shí)間和預(yù)測(cè)規(guī)則置信度的適應(yīng)度值,根據(jù)結(jié)果得到C'、T'和R';然后用遺傳算法時(shí)要同時(shí)考慮所有的因素,式(2)用來計(jì)算遺傳算法的適應(yīng)度值。
(9)
(10)
(11)
實(shí)驗(yàn)有3個(gè)目的:驗(yàn)證關(guān)聯(lián)規(guī)則挖掘在分析顧客購買模式方面的效果;驗(yàn)證遺傳算法在考慮配送網(wǎng)絡(luò)中多重因素時(shí)的效果;權(quán)衡先行發(fā)貨因素。案例研究中把收集的數(shù)據(jù)輸入到XLMiner(Excel表格數(shù)據(jù)挖掘插件,能有效對(duì)表中數(shù)據(jù)進(jìn)行分析挖掘)中以生成一組關(guān)聯(lián)規(guī)則,使用Evolver(Excel 表格的高級(jí)最優(yōu)化插件,適用于Microsoft Excel 的創(chuàng)新性遺傳算法最優(yōu)化)執(zhí)行遺傳算法進(jìn)行優(yōu)化。
為了驗(yàn)證以預(yù)測(cè)為目的基于集群的關(guān)聯(lián)規(guī)則挖掘的可行性,選擇一家公司進(jìn)行案例研究。該公司是國(guó)內(nèi)小型家電制造企業(yè),總部位于廣東省,在中國(guó)多個(gè)城市有分銷中心,擁有線上線下銷售平臺(tái),為消費(fèi)者提供全渠道銷售服務(wù)。在案例中,我們選取該公司華南地區(qū)某市的分銷供應(yīng)鏈,該市有兩個(gè)分銷中心,即配送網(wǎng)絡(luò)中的發(fā)貨源點(diǎn),有5個(gè)分布在不同位置的直銷門店,即配送網(wǎng)絡(luò)中的配送中心。顧客可以通過線上和線下渠道進(jìn)行購買,供顧客在產(chǎn)品抵達(dá)時(shí)提貨,每個(gè)位置都作為一個(gè)集群提供并收集每個(gè)集群的交易記錄,應(yīng)用關(guān)聯(lián)規(guī)則挖掘來發(fā)現(xiàn)隱含模式以預(yù)測(cè)顧客未來的購買。
Apriori算法涉及兩個(gè)主要階段:從數(shù)據(jù)中找到高頻項(xiàng)目組;使用高頻項(xiàng)目組生成關(guān)聯(lián)規(guī)則。同時(shí),為了識(shí)別高頻項(xiàng)目組,先設(shè)置最小支持度,并關(guān)注高頻項(xiàng)目組。在實(shí)踐中,最小支持度的定義是很嚴(yán)格的,直接從其他相關(guān)實(shí)證中采用這些值顯然不可行。如果閾值設(shè)置得太低,可能會(huì)挖掘出許多無足輕重或無法解釋的規(guī)則,從而不能為實(shí)踐者提供建議;相反,如果閾值設(shè)置得太高,則可能難以獲得任何規(guī)則。因此,閾值的最終選擇在很大程度上要使用試錯(cuò)法,直到可以挖掘出一些有用的關(guān)聯(lián)規(guī)則為止。
在這個(gè)案例研究中,從每個(gè)地點(diǎn)總共收集500筆交易。小家電產(chǎn)品與超市中的日常必需品不同,它并非必需品,因此不會(huì)像超市中出售的產(chǎn)品那樣頻繁地被購買,鑒于此,為了生成關(guān)聯(lián)規(guī)則,最小支持度可以更低。經(jīng)過試錯(cuò)法后,每種產(chǎn)品類型的最低支持值設(shè)為10,如果500筆交易中某種類型產(chǎn)品有10筆以上的交易,則案例公司認(rèn)為該類型產(chǎn)品很受歡迎。考慮到最小支持度的決策較嚴(yán)格并且依賴于一系列試錯(cuò)程序,所以應(yīng)對(duì)選擇的值進(jìn)行定期評(píng)估以保證獲得決策的質(zhì)量[32]。通過關(guān)聯(lián)規(guī)則挖掘找出流行產(chǎn)品之間的關(guān)系,最小規(guī)則置信度設(shè)置為75%,表2列出了從其中一個(gè)集群中獲得的關(guān)聯(lián)規(guī)則。如果顧客購買了某件產(chǎn)品(設(shè)為條件產(chǎn)品),則以置信度為比例購買另一件產(chǎn)品(設(shè)為結(jié)果產(chǎn)品),根據(jù)顧客對(duì)條件產(chǎn)品的需求,案例公司可以更好地估計(jì)對(duì)結(jié)果產(chǎn)品的需求??紤]到顧客希望在產(chǎn)品下單后能夠快速交貨,需要在顧客下訂單之前將相關(guān)產(chǎn)品運(yùn)送到最近的分配中心,可以建立更有效的預(yù)期運(yùn)輸計(jì)劃。
在下一部分中,使用遺傳算法生成先行發(fā)貨的配送解決方案,同時(shí)考慮預(yù)測(cè)規(guī)則的置信度,該解決方案可以確定從特定源點(diǎn)到特定集群應(yīng)該裝運(yùn)產(chǎn)品的數(shù)量。
根據(jù)參數(shù)范圍隨機(jī)生成10組數(shù)據(jù),如表3所示,每組將由遺傳算法分別確定運(yùn)輸成本、運(yùn)輸距離和預(yù)測(cè)規(guī)則置信度的近似最優(yōu)值,之后,每組將同時(shí)考慮α= 0.5,β= 0.1和γ= 0.4權(quán)重的所有3個(gè)因素。如上文所述,因?yàn)門既不會(huì)影響顧客,也不會(huì)影響總運(yùn)輸成本,在總體目標(biāo)中不那么重要,所以β很小。將每個(gè)因子下每一組運(yùn)行10次,其中:種群大小= 50,交叉率= 0.7,突變率= 0.02。 記錄每10次運(yùn)行的平均結(jié)果,并總結(jié)在表4中。例如,在第2~4欄中,應(yīng)用遺傳算法來使運(yùn)輸成本最小化,而記錄運(yùn)輸成本CC、運(yùn)輸距離TC和預(yù)測(cè)規(guī)則置信度RC,并作比較。
表2 關(guān)聯(lián)規(guī)則
表3 模擬配送網(wǎng)絡(luò)中的參數(shù)
表4 優(yōu)化結(jié)果摘要
圖4~圖6是比較結(jié)果,證明了優(yōu)化一個(gè)單一因素會(huì)犧牲其他因素。如圖4所示,運(yùn)輸時(shí)間的最小化導(dǎo)致配送網(wǎng)絡(luò)中的運(yùn)輸成本增高。如圖6所示,其他因素的最小化可能會(huì)產(chǎn)生相對(duì)較低的置信度值。因此,如果根據(jù)先行發(fā)貨的預(yù)測(cè)結(jié)果提供產(chǎn)品,則配送計(jì)劃將與基于其他因素(例如運(yùn)輸成本和運(yùn)輸時(shí)間)的計(jì)劃大不相同。然而,考慮到所有因素的重要性,C-O,T-O和R-O的值表明每個(gè)因素的效能越來越接近最優(yōu)值C'、T'和R'。在圖4中,這種改進(jìn)更為明顯,C-O線更接近C-C線,并且比C-T和C-R線好得多,這是由于賦予C較大的權(quán)重(α= 0.5)。另外,線T-O是圖5中最靠近線T-T的線,線R-O是圖6中最靠近線R-R的線,證明了提出用遺傳算法在處理先行發(fā)貨多種因素時(shí)的優(yōu)化可靠性。
本文是基于以下3種現(xiàn)象而產(chǎn)生思考的。第一,電子商務(wù)的增長(zhǎng)使顧客可以通過不同渠道購物,每秒產(chǎn)生大量數(shù)據(jù),那些未能設(shè)置分析大數(shù)據(jù)業(yè)務(wù)部門的企業(yè)將面臨大數(shù)據(jù)革命中的生存挑戰(zhàn)。第二,在全渠道零售商業(yè)中,競(jìng)爭(zhēng)越來越激烈。由于網(wǎng)上提供了很多產(chǎn)品信息,顧客在商店中定位商品,但同時(shí)在線搜索更多信息,并有可能在競(jìng)爭(zhēng)對(duì)手的網(wǎng)站上購買,這種現(xiàn)象越來越普遍,因此了解顧客購買行為并積極響應(yīng)市場(chǎng)非常重要。第三,顧客在下訂單后希望快速交付產(chǎn)品,因此企業(yè)需要通過先行發(fā)貨以增強(qiáng)顧客購物體驗(yàn),也要求企業(yè)預(yù)測(cè)顧客的購買情況。
本文基于以上問題,提出遺傳算法和基于聚類的關(guān)聯(lián)規(guī)則挖掘相結(jié)合的優(yōu)化模型。首先利用云計(jì)算來管理從所有有效渠道生成的大數(shù)據(jù),應(yīng)用基于集群的關(guān)聯(lián)規(guī)則挖掘來分析大數(shù)據(jù)并發(fā)現(xiàn)顧客隱含的購買模式,求出規(guī)則,幫助預(yù)測(cè)未來購買趨勢(shì)。然后根據(jù)這些規(guī)則,考慮多種因素,利用遺傳算法選擇先行發(fā)貨的近似最優(yōu)解決方案。本文貢獻(xiàn)主要表現(xiàn)在兩方面,一方面在研究配送網(wǎng)絡(luò)時(shí),不僅考慮運(yùn)輸成本、時(shí)間等運(yùn)輸自身存在的影響因素,還考慮到顧客購買產(chǎn)品的情況,通過對(duì)顧客購買產(chǎn)品的預(yù)測(cè),提高了先行發(fā)貨的準(zhǔn)確性;另一方面,通過對(duì)遺傳算法的引入,豐富了大數(shù)據(jù)分析在營(yíng)銷渠道領(lǐng)域的應(yīng)用,解決了快速交付產(chǎn)品帶來的問題。實(shí)驗(yàn)結(jié)果給了實(shí)踐者一個(gè)啟示,即在處理先行發(fā)貨問題時(shí),優(yōu)化單一因素將會(huì)犧牲其他因素。因此,我們應(yīng)該同時(shí)考慮所有因素,這樣才能控制配送網(wǎng)絡(luò)多方面的整體效能,使得其接近最優(yōu)狀態(tài)。
本文也有一些局限。一個(gè)局限在于文中的聚類是根據(jù)地理標(biāo)準(zhǔn)預(yù)先定義的,即需求點(diǎn)是根據(jù)它們的距離聚類。另一個(gè)局限在于模型中做出的假設(shè)。文中假設(shè)所有計(jì)劃物品都立即發(fā)貨,而且無論數(shù)量多少,每次運(yùn)輸都有固定的時(shí)間。這種假設(shè)使得模型變得相對(duì)簡(jiǎn)單,并使運(yùn)輸時(shí)間與發(fā)貨數(shù)量獨(dú)立。因此,需要在未來的研究中建立沒有上述假設(shè)的模型,使得運(yùn)輸時(shí)間與數(shù)量相關(guān),這可以更好地模擬實(shí)際情況。
長(zhǎng)安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2020年5期