,,
(1.浙江工業(yè)大學(xué) 經(jīng)濟(jì)學(xué)院,浙江 杭州 310023;2.浙江工業(yè)大學(xué) 管理學(xué)院,浙江 杭州 310023)
多隨從風(fēng)險(xiǎn)決策問題在供應(yīng)鏈中普遍存在,如一個供應(yīng)商向多個零售商進(jìn)行產(chǎn)品批發(fā)與銷售問題,供應(yīng)商決定供應(yīng)量和批發(fā)價(jià),零售商決定訂購量,多隨從風(fēng)險(xiǎn)決策問題可以用一個雙層優(yōu)化模型刻畫與解決。因此,研究供應(yīng)鏈多隨從問題的雙層規(guī)劃模型的建立與求解具有重要的理論意義和實(shí)際價(jià)值。自1952年Stackelberg提出了雙層決策模型(也稱為雙層規(guī)劃)以來,單從屬雙層規(guī)劃的理論與應(yīng)用研究取得了相當(dāng)豐富的研究成果[1-4],多隨從雙層決策模型(或稱多隨從規(guī)劃、多隨從雙層規(guī)劃、多隨從決策模型)也已經(jīng)有了一定的研究成果,主要包括理論、算法和應(yīng)用等3個方面:1) 研究多隨從決策模型的最優(yōu)解的定義及性質(zhì),其研究內(nèi)容包括最優(yōu)解的存在性、模型轉(zhuǎn)化為另一容易求解形式的等價(jià)性證明和最優(yōu)解的條件等性質(zhì)[5-10];2) 研究多隨從決策模型的求解算法,大多研究都集中在線性多隨從規(guī)劃的求解算法[11-23];3) 研究實(shí)際問題中的多隨從決策模型,一般都是根據(jù)實(shí)際問題來建立特殊的多隨從決策模型,在供應(yīng)鏈、電力供應(yīng)和電信等領(lǐng)域中應(yīng)用[24-33]。特別是在供應(yīng)鏈契約方面,也有部分學(xué)者進(jìn)行了研究[34],如劉玉霜等[35]討論了兩級供應(yīng)鏈含一個制造商與兩個隨從零售商的最優(yōu)協(xié)調(diào)問題。趙泉午等[36]研究了在單個供應(yīng)商和多個零售商構(gòu)成的易逝品兩級供應(yīng)鏈中,建立一個博弈模型,證明了各零售商之間存在NASH均衡。李績才等[37]以一個兩階段的供應(yīng)鏈系統(tǒng)為研究背景,建立了下游損失厭惡型零售商之間存在競爭的收益共享契約協(xié)調(diào)模型。李占雷等[38]運(yùn)用前景理論中損失厭惡概念,研究了零售商在損失厭惡下的供應(yīng)鏈回購契約模型。張春偉等[39]研究了零售商具有多個零售點(diǎn)時的回購契約模型。張寒[40]建立了石油分銷系統(tǒng)中單分銷商多個零售商的多隨從Stackelberg博弈模型。洪璐等[41]研究了CVaR準(zhǔn)則下考慮后續(xù)服務(wù)產(chǎn)品的多隨從收益共享契約模型。以上研究,他們均采用兩級博弈模型,目標(biāo)均為利潤最大化,沒有考慮風(fēng)險(xiǎn)損失。國外關(guān)于契約的研究非常多,如Güray等[42]基于批發(fā)價(jià)合約、回購合約、收益共享合約和數(shù)量折扣合約等,研究了帶隨機(jī)收益和隨機(jī)需求的供應(yīng)鏈的協(xié)同問題。Choi等[43]研究一個批發(fā)價(jià)格契約模型的供應(yīng)鏈協(xié)調(diào)問題。
綜上所述,多隨從雙層決策模型理論研究并不多,算法研究也僅集中在線性情況,應(yīng)用模型在供應(yīng)鏈契約中的研究也不多,均用期望均值考慮風(fēng)險(xiǎn)目標(biāo)。目前,多隨從決策模型的算法基本是針對線性模型提出的,求解多隨從非線性雙層決策模型的主要思路是通過轉(zhuǎn)化成均衡約束研究簡化求解的難度,如利用KKT條件轉(zhuǎn)化成互補(bǔ)約束問題求解,將提出一種銷售獎勵契約的多隨從雙層風(fēng)險(xiǎn)決策模型,提出一種近似求解方法。
供應(yīng)鏈契約主要包括批發(fā)價(jià)折扣契約、數(shù)量柔性契約和回購契約等,其中銷售獎勵契約是數(shù)量柔性契約一種,銷售獎勵契約是指零售商向供應(yīng)商訂購一定數(shù)量的產(chǎn)品,根據(jù)零售商銷售的數(shù)量,供應(yīng)商給出相應(yīng)的利潤獎勵,這樣有利于零售商訂購更多的商品進(jìn)行銷售,使得雙方獲得更多的利潤,同時降低零售商損失風(fēng)險(xiǎn)。現(xiàn)有的銷售獎勵契約研究文獻(xiàn)并不多。Wang等[44]研究了由一位供應(yīng)商和多位零售商構(gòu)成的供應(yīng)鏈獎勵契約(多隨從契約情形),建立了一個基于各方基礎(chǔ)存貨水平的競爭水平下的博弈模型,發(fā)現(xiàn)競爭會在所有的零售商間及與供應(yīng)商之間展開。Christoph等[45]給出了一種如何設(shè)計(jì)獎勵契約來協(xié)調(diào)供應(yīng)鏈內(nèi)的決策,表明了如果與經(jīng)營層面互動那么可以產(chǎn)生大量的契約收益。Adolfo等[46]研究了三種形式的供應(yīng)商數(shù)量激勵契約以得到不同程度的安全性和彈性,包括了在途庫存和倉儲庫存以體現(xiàn)需求可變性。Kremer等[47]研究了一種數(shù)量契約模型,基于數(shù)值研究按照模型來設(shè)計(jì)最優(yōu)的契約訂購量。Youssef等[48]研究了OEM廠商將某些生產(chǎn)行為外包給承包制造商的獎勵契約問題,結(jié)果表明多決策層次的下訂單戰(zhàn)略比只有一個決策層次的下訂單戰(zhàn)略表現(xiàn)更好。Xiong等[49]將回購契約和數(shù)量柔性契約結(jié)合在一起引入一個組合契約(CP),證明了該CP合約在供應(yīng)鏈協(xié)同、利潤分配和風(fēng)險(xiǎn)分配方面比單種契約有優(yōu)勢,在風(fēng)險(xiǎn)分配方面也比成分合約更具彈性。
Sun等[50]研究了一些典型合約的激勵機(jī)制在緩解供應(yīng)鏈成員間破產(chǎn)宣傳的效果,包括收益共享契約、價(jià)格折扣契約及數(shù)量柔性契約。劉彥利[51]系統(tǒng)地研究基于績效獎勵的易逝品供應(yīng)鏈聯(lián)合契約問題,建立了由一個制造商和一個零售商構(gòu)成的易逝品兩階層供應(yīng)鏈模型,在分析績效獎勵機(jī)制對此供應(yīng)鏈協(xié)調(diào)效果的基礎(chǔ)上,建立了相應(yīng)的銷售獎勵契約模型。甘騫等[52]研究了基于銷售獎勵與回購契約的供應(yīng)鏈協(xié)調(diào)機(jī)制,提出了一種銷售獎勵契約模型,導(dǎo)出了在回購契約下最優(yōu)訂貨量和回購價(jià)格的解析形式。李凱等[53]研究了基于獎勵與懲罰的雙重契約的供應(yīng)鏈渠道協(xié)調(diào)問題,設(shè)置獎懲額度和比例作為協(xié)調(diào)因子,建立了一個懲罰和獎勵相結(jié)合的供應(yīng)鏈契約模型。郭飛等[54]運(yùn)用CVaR準(zhǔn)則建立了的一個供應(yīng)商與一個零售商的供應(yīng)鏈銷售獎勵的雙層風(fēng)險(xiǎn)決策模型。
研究表明:獎勵契約可以有效地調(diào)節(jié)供應(yīng)鏈協(xié)調(diào),使得供應(yīng)鏈雙方獲得更多的利潤。但是,對閉環(huán)供應(yīng)鏈以及渠道供應(yīng)鏈獎勵的研究并不多[55-56],而且針對已有的銷售獎勵契約對下層考慮風(fēng)險(xiǎn)損失的研究并不多,運(yùn)用條件風(fēng)險(xiǎn)值測度也很少[57],因此將運(yùn)用條件風(fēng)險(xiǎn)值測度建立零售商的風(fēng)險(xiǎn)損失目標(biāo),提出一種供應(yīng)商與多個零售商的具有銷售獎勵契約的多隨從雙層風(fēng)險(xiǎn)決策模型,并提出了一種近似求解算法,通過給定的實(shí)際數(shù)據(jù),運(yùn)用模型可以獲得供應(yīng)商的獎勵銷售閾值、獎勵折扣和訂購量的最優(yōu)策略。
風(fēng)險(xiǎn)估值VaR(Value at risk)是一種在風(fēng)險(xiǎn)市場條件下和給定的置信水平區(qū)間內(nèi),估計(jì)金融資產(chǎn)或證券投資在給定的時間內(nèi)可能發(fā)生的市場風(fēng)險(xiǎn),即可能遭受潛在的最大價(jià)值損失值,即資產(chǎn)損失的最高可能值?;跊Q策x下的β-VaR值可以表示為
αβ(x)=min{α|Pr[L(x,ξ)≤α]≥β}
(1)
式中:β(β∈(0,1])為給定的置信水平;L(x,ξ):Rm×Rn→R1為決策者的損失函數(shù);x為決策變量;ξ∈Rn為隨機(jī)變量。
Rockafellar等[58]提出了條件風(fēng)險(xiǎn)值模型(Conditional value at risk, CVaR)。CVaR是基于VaR表示下提出的另一種描述風(fēng)險(xiǎn)的工具,它具有許多的良好性質(zhì),避免了VaR一些缺陷,CVaR可以用來測量組合投資的市場風(fēng)險(xiǎn),在給定的置信水平β下,描述組合投資x的損失超過VaR損失的累積損失,那么x決策下的β-CVaR值公式可以表示為
(2)
式中:F(·)為分布函數(shù);CVaR值為損失函數(shù)L(x,ξ)超過VaR值時的累積期望損失,CVaR風(fēng)險(xiǎn)值描述了市場不確定下引起的累積損失,也可以用于研究供應(yīng)鏈庫存訂購的風(fēng)險(xiǎn)決策問題。
為了激勵零售商的銷售量,制造商或供應(yīng)商采用一種銷售數(shù)量激勵機(jī)制,稱為銷售獎勵契約,即供應(yīng)商采用統(tǒng)一的批發(fā)價(jià),規(guī)定零售商按統(tǒng)一的銷售價(jià)進(jìn)行銷售,當(dāng)銷售量超過一定量的話,供應(yīng)商按一定的價(jià)格比例對零售商進(jìn)行利潤獎勵,以刺激零售商想辦法進(jìn)行更多的銷售。因此,供應(yīng)商為了激勵零售商更多的訂貨,制定銷售獎勵契約,所有零售商必須滿足同一契約,鼓勵零售商盡可能多銷售,零售商希望從供應(yīng)商處訂購更多的產(chǎn)品,這樣才有可能獲得銷售獎勵,供應(yīng)商對零售商實(shí)施銷售獎勵策略,不采用回購策略,供應(yīng)商需要制定銷售多少才給出相應(yīng)的獎勵,但是銷售量獎勵閾值不能確定過高,否則零售商不能完成,零售商不會積極地銷售,或者訂購更多的產(chǎn)品。
W={wj|j=0,1,2,…,n;0=w0< 假設(shè)市場需求信息是公開的,零售商在訂貨過程中,供應(yīng)商對所有零售商實(shí)施相同的獎勵策略,零售商根據(jù)市場預(yù)測,確定訂貨量yi;供應(yīng)商則根據(jù)市場需求情況以及零售商的訂貨量確定批發(fā)價(jià)格。 當(dāng)供應(yīng)商給定批發(fā)價(jià)、獎勵折扣和獎勵閾值時,當(dāng)供應(yīng)商批發(fā)價(jià)為a時,第i個零售商的訂貨量為yi,供應(yīng)商考慮期望收益最大化,即 (3) 式中:a為制造商或供應(yīng)商確定商品批發(fā)價(jià)格;yi為第i個零售商根據(jù)批發(fā)價(jià)確定的訂貨量;w為供應(yīng)商確定的銷售量閾值,其中w屬于給定的閾值集合W;r為獎勵折扣(因子);供應(yīng)商按商品每單位批發(fā)價(jià)a的ar元進(jìn)行獎勵,其中r屬于折扣集合,即 式(3)中:ayi-arE(vi-w)+第1項(xiàng)為批發(fā)獲得的利潤,第2項(xiàng)為獎勵損失,需要滿足(w,r)∈{(wj,rj)|j=1,2,…,n}。 零售商訂貨yi單位時,零售商損失函數(shù)可以表示為 gi(w,r,yi,vi)=a(yi-vi)++(p- (4) 式中t+=max{t,0}。設(shè)Y為制造商提供零售商總的產(chǎn)品數(shù)量;p為零售商的產(chǎn)品零售價(jià)格;vi為第i個零售商產(chǎn)品需求(銷售量),是一個隨機(jī)變量;qi(vi)為第i個零售商產(chǎn)品需求對應(yīng)的概率分布密度函數(shù)。式(4)中第1項(xiàng)為過剩損失,第2項(xiàng)為缺貨損失,第3項(xiàng)為達(dá)不到獎勵造成的獎勵損失。給定置信水平αi(0<αi<1),定義第i(i=1,2,…,m)個零售商的VaR損失為 定義 得出結(jié)論為 則得到多隨從雙層規(guī)劃: s.t.y1+y2+…+ym≤Y (w,r)∈{(wj,rj)|j=1,2,…,n} 對于i=1,2,…,m,(yi,ti)是問題Pi(w,r)的最優(yōu)解,即 s.t. 0≤yi≤Y,ti∈R1 s.t.y1+y2+…+ym≤Y (w,r)∈{(wj,rj)|j=1,2,…,n} 對于i=1,2,…,m,(yi,ti)是下面問題Pi(w,r)的最優(yōu)解,即 s.t. 0≤yi≤Y,ti∈R1 模型規(guī)劃2中目標(biāo)函數(shù)不是連續(xù)函數(shù),由于獎勵折扣一般僅為有限多個,采用下面一種近似計(jì)算方法: 1) 對每個i=1,2,…,m,求m個子問題Pi((wj,rj))′(j=1,2,…,m),若得到第i零售商在每個獎勵(wj,rj)下的最優(yōu)解(yi(wj,rj),ti(wj,rj))(j=1,2,…,m)。 2) 求問題的最優(yōu)解,即 s.t.y1(w,r)+y2(w,r)+…+ym(w,r)≤Y (w,r)∈{(wj,rj)|j=1,2,…,n} 對一個面包制造商和它的三家零售店的批發(fā)和訂購調(diào)研,獲取了相應(yīng)的數(shù)值,根據(jù)調(diào)查產(chǎn)品的歷史銷售樣本數(shù)據(jù),計(jì)算出了一個近似概率分布(表1)。 表1零售商的銷量近似概率分布 Table1Distributionofsalesapproximationprobabilityoftheretailers 銷量零售商1零售商2零售商3<1000.050.020.011500.200.080.052000.300.100.132500.250.350.223000.100.280.323500.070.120.19>4000.030.050.08 為了測試獎勵對訂購的影響,在表2中設(shè)h∈[1,20]為獎勵折扣倍增系數(shù),銷售初始閾值增加系數(shù)k=1,2,3,4,5,6,7,8。已知數(shù)值實(shí)驗(yàn),固定值為:批發(fā)價(jià)a=10元/個,零售價(jià)p=15元/個,總生產(chǎn)量為900,置信水平α=0.95。數(shù)值實(shí)驗(yàn)的目的是在不同獎勵倍增系數(shù)確定供應(yīng)商的最優(yōu)獎勵閾值、最優(yōu)獎勵折扣和生產(chǎn)總量范圍,以及零售商的最優(yōu)訂購量。 表2產(chǎn)品的獎勵契約閾值和獎勵折扣范圍 Table2Thethresholdsandtherangeofincentivediscountsfromthemanufacturer 銷售閾值范圍獎勵折扣>50+10k0.01h>50+20k0.02h>50+30k0.03h>50+40k0.04h 首先,取幾個不同的折扣因子,通過數(shù)值計(jì)算分析8個不同起始因子下供應(yīng)商的最佳獎勵閾值、最佳折扣和利潤,以及零售商的最優(yōu)訂購量和風(fēng)險(xiǎn)損失變化。 圖1中5個獎勵倍增系數(shù)h分別為1,5,10,15,20,而8個獎勵起始閾值系數(shù)k分別為1,2,…,8,其供應(yīng)商的最優(yōu)獎勵閾值為w。從圖1可以看出:一般當(dāng)獎勵起始閾值系數(shù)或獎勵倍增系數(shù)增大,最優(yōu)獎勵起始閾值也增大,即提高獎勵倍增系數(shù)或起始閾值系數(shù)可以顯著提高最優(yōu)獎勵閾值。 圖1 不同倍增系數(shù)下的最優(yōu)獎勵閾值變化Fig.1 Change in optimal reward threshold under different multiplication coefficients 圖2為5個獎勵倍增系數(shù)h,8個獎勵起始閾值系數(shù)k的供應(yīng)商的最優(yōu)獎勵折扣r,從圖2可以看出:當(dāng)獎勵倍增系數(shù)h>15時,倍增系數(shù)增大時最優(yōu)獎勵折扣增大,此時,倍增系數(shù)對獎勵折扣有顯著影響,但當(dāng)獎勵倍增系數(shù)h<15,最優(yōu)獎勵折扣不變或減小,即此時倍增系數(shù)對獎勵折扣沒有影響,說明大的倍增系數(shù)有利于提高獎勵折扣。 圖2 不同倍增系數(shù)下的最優(yōu)獎勵折扣變化Fig.2 Changes in optimal reward discount under different multiplication coefficients 圖3為5個獎勵倍增系數(shù)h,8個獎勵起始閾值系數(shù)k的零售商的最優(yōu)訂購總量y。從圖3可以看出:當(dāng)獎勵倍增系數(shù)增大時零售商最優(yōu)訂購量增大,說明獎勵折扣提高,零售商的訂購量提高,但是當(dāng)獎勵倍增系數(shù)不變且獎勵起始閾值系數(shù)增大時一般零售商的訂購量會減小(如h=1,5,10,k>1),因?yàn)樘岣叱跏吉剟铋撝?零售商獲得的銷售獎勵會減少。 圖3 不同倍增系數(shù)下的最優(yōu)總訂購量變化Fig.3 Changes in optimal total order volume under different multiplication coefficients 圖4為5個獎勵倍增系數(shù)h,8個獎勵起始閾值系數(shù)k的零售商的最優(yōu)總損失。從圖4可以看出:當(dāng)獎勵倍增系數(shù)h>10,增大倍增系數(shù),零售商損失也會增大,說明雖然提高銷售獎勵倍增系數(shù),但是起始閾值提高后,零售商需要完成更多的銷售才能獲得獎勵;當(dāng)h<10時,零售商損失隨著倍增系數(shù)增大時增加很少,說明提高獎勵折扣,零售商的風(fēng)險(xiǎn)損失會增大。 圖4 不同倍增系數(shù)下的零售商最優(yōu)總損失的變化Fig.4 Changes in the optimal total loss of retailers under different multiplication coefficients 圖5為5個獎勵倍增系數(shù)h,8個獎勵起始閾值系數(shù)k的供應(yīng)商的最優(yōu)總利潤。從圖5可以看出:當(dāng)獎勵倍增系數(shù)增大h>10,倍增系數(shù)增大時,供應(yīng)商總利潤增大,當(dāng)h<10時,供應(yīng)商的總利潤隨著倍增系數(shù)增大反而增加很少,這時零售商獲得獎勵更多,說明提高獎勵折扣,供應(yīng)商的利潤會增大。 圖5 不同倍增系數(shù)下的供應(yīng)商最優(yōu)總利潤的變化Fig.5 Optimal change of the supplier’s total profits under multiplication coefficients 從圖1~5數(shù)值結(jié)果來看:初始獎勵閾值增大,供應(yīng)商的最佳獎勵閾值和折扣也增大,供應(yīng)商利潤增大,但是零售商的損失風(fēng)險(xiǎn)會增大,零售商的總訂購量會適當(dāng)減少,零售商的總訂購量不超過800,在獎勵契約下,供應(yīng)商不需要生產(chǎn)超過800的總量,總的生產(chǎn)量范圍在700~800。供應(yīng)商確定較高的獎勵閾值和獎勵折扣,零售商會提高訂購量,但風(fēng)險(xiǎn)增大比較明顯,供應(yīng)商應(yīng)根據(jù)零售商的風(fēng)險(xiǎn)來確定最優(yōu)閾值和最優(yōu)獎勵折扣,以保證供應(yīng)商自己能獲得更多的利潤。所以倍增系數(shù)影響了最優(yōu)獎勵閾值和獎勵折扣的確定,在同一個初始獎勵閾值,同批發(fā)折扣契約相比,銷售獎勵契約對激勵零售商訂購量增加的影響不如批發(fā)折扣契約。 通過模型規(guī)劃2數(shù)值實(shí)驗(yàn),總結(jié)了如何使用模型規(guī)劃2進(jìn)行獎勵批折扣契約制定,注意有3點(diǎn): 1) 收集銷售數(shù)據(jù),計(jì)算需求概率分布,確定訂購量范圍與對應(yīng)的起始獎勵閾值范圍和對應(yīng)的獎勵折扣倍增系數(shù)。 2) 確定起始獎勵閾值,首先在不同的總產(chǎn)量下,計(jì)算不同獎勵閾值下的最優(yōu)獎勵折扣和訂購量,比較供應(yīng)商的利潤和零售商的風(fēng)險(xiǎn),確定供應(yīng)商的起始獎勵閾值和生產(chǎn)總量范圍。 3) 確定最優(yōu)獎勵折扣與最優(yōu)訂購量,取置信水平0.95~0.99,在給定的起始獎勵下計(jì)算最優(yōu)獎勵閾值、獎勵折扣和訂購量,通過給定供應(yīng)商的期望利潤目標(biāo)和零售商的風(fēng)險(xiǎn)目標(biāo),確定在某個起始閾值下的供應(yīng)商最優(yōu)批發(fā)折扣和零售商最優(yōu)訂購量范圍。 建立銷售獎勵契約的多隨從雙層條件風(fēng)險(xiǎn)值模型和計(jì)算方法,銷售獎勵目標(biāo)的總訂購量決定了生產(chǎn)商的總產(chǎn)量,銷售獎勵最低閾值不能過低或過高,通過降低獎勵閾值和提高獎勵倍增系數(shù)來增加零售商的訂購量,但即使獎勵閾值很低或獎勵倍增系數(shù)很大,零售商的總訂購量不會大幅度提高,因?yàn)槭艿戒N售需求限制,零售商提高訂購量會增加供給過剩的需求,導(dǎo)致?lián)p失。因此,銷售獎勵契約模型可以確定最優(yōu)的銷售閾值和倍增折扣,以保證供應(yīng)商有更多利潤,保證零售商有更低的風(fēng)險(xiǎn)損失。
w1
a+ar)(vi-yi)++ar(w-vi)+3 數(shù)值案例
4 結(jié) 論