孫 紅,李海虹,郭 宏
(太原科技大學(xué) 機(jī)械工程學(xué)院,太原 030024)
近年來,制造業(yè)正面臨著資源全球化的挑戰(zhàn)[1],資源閑置與資源短缺問題制約著制造供應(yīng)鏈的運(yùn)行效率,實(shí)現(xiàn)制造資源服務(wù)共享對(duì)制造業(yè)的發(fā)展至關(guān)重要。云制造(Cloud Manufacturing,CMfg)通過集成先進(jìn)技術(shù)(云計(jì)算、物聯(lián)網(wǎng)等)而成為制造業(yè)的一種面向服務(wù)的高效率、低消耗的先進(jìn)制造模式[2-3],正在改變制造企業(yè)組織生產(chǎn)和業(yè)務(wù)活動(dòng)的方式,以應(yīng)對(duì)全球化競(jìng)爭(zhēng)和產(chǎn)品個(gè)性化制造。作為服務(wù)管理平臺(tái),CMfg系統(tǒng)將分布式制造資源和制造能力封裝到服務(wù)中,以滿足不同用戶的多項(xiàng)任務(wù)需求[4],鼓勵(lì)制造資源服務(wù)提供方(SP)與需求方(SD)實(shí)現(xiàn)資源服務(wù)共享是CMfg系統(tǒng)持續(xù)發(fā)展的重要階段。
關(guān)于制造資源服務(wù)共享問題[5],國(guó)內(nèi)外學(xué)者已進(jìn)行了廣泛的研究。Tao F等[6]將云計(jì)算與物聯(lián)網(wǎng)融入到CMfg系統(tǒng)中,建立了CCIOT-CMfg技術(shù)體系并實(shí)現(xiàn)了制造資源共享協(xié)作、按需使用。鮑世贊等[7]建立了智能生產(chǎn)共享模式,重點(diǎn)分析了共享過程中的用戶體驗(yàn)。Liu Y等[8]基于Gale-Shapley算法,對(duì)需求方和提供者的總效用及其性能進(jìn)行了理論和仿真分析。Li K等[9]、Szaller等[10]基于多Agent建立分布式制造資源共享系統(tǒng),實(shí)現(xiàn)全局最優(yōu)共享調(diào)度。為了更好地描述制造資源服務(wù)共享決策的具體過程,博弈論被引入共享模型中,如序貫博弈[11]、合作博弈[12]、非合作博弈[13]等。
以上模型將博弈方視為“完全理性”經(jīng)濟(jì)人,與實(shí)際供應(yīng)鏈中博弈雙方動(dòng)態(tài)決策行為不完全符合,因此具備“有限理性”的演化博弈理論被引入共享決策模型[14-15],但缺乏存在主導(dǎo)方的博弈情況研究。本文建立以SP為主導(dǎo)的共享決策演化模型,由支付矩陣得出系統(tǒng)復(fù)制動(dòng)態(tài)方程,求出均衡點(diǎn)并進(jìn)行穩(wěn)定性分析,通過數(shù)值仿真驗(yàn)證了模型的正確性,并分析不同因素對(duì)演化結(jié)果的影響情況,以確定云平臺(tái)博弈建模的重要參數(shù)。
CMfg系統(tǒng)包括SP、SD及云平臺(tái)三個(gè)主體,云平臺(tái)以虛擬云池的方式為各類用戶提供服務(wù),SD與SP可實(shí)現(xiàn)“一對(duì)一”“多對(duì)一”“一對(duì)多”及“多對(duì)多”服務(wù)。作為制造企業(yè),因自身加工能力不足而選擇加入云平臺(tái),將通過尋找合適的SP實(shí)現(xiàn)協(xié)同制造;作為制造資源供應(yīng)商,因自身閑置資源過多而選擇加入云平臺(tái)提高資源利用率,通過尋找對(duì)應(yīng)的SD增加訂單量,以提高企業(yè)效益。CMfg系統(tǒng)鼓勵(lì)眾多SP“接入”云平臺(tái),以滿足SD的不同制造需求,然而SP與SD可結(jié)合自身具體情況及云平臺(tái)服務(wù)情況決定是否加入云平臺(tái),此過程為動(dòng)態(tài)演化過程,引入演化博弈理論建立制造服務(wù)演化共享決策博弈模型,以制造服務(wù)提供者SP為云平臺(tái)主導(dǎo),制造服務(wù)需求者SD為參與者,分析不同要素影響下的演化均衡過程,歸納各因素具體影響情況并提出利于SD與SP實(shí)現(xiàn)協(xié)同制造的建議。
博弈模型中雙方策略具體影響因素如表1所示:
表1 模型變量及其意義Tab.1 Model variables and significance
以SP為主導(dǎo)的CMfg系統(tǒng)為研究對(duì)象,實(shí)現(xiàn)合作化制造是云平臺(tái)持續(xù)發(fā)展的目標(biāo),考慮實(shí)際中的眾多影響因素,提出以下假設(shè)以便于分析:
(1)SP與SD具有兩種選擇策略,SP作為CMfg系統(tǒng)主導(dǎo)方,可以選擇“積極管理”策略,如盡可能共享自身制造資源與服務(wù)信息,提升自身管理技術(shù)以吸引更多SD選擇加入云平臺(tái),隨著制造資源會(huì)數(shù)量級(jí)種類增加,“積極管理”下的額外費(fèi)用會(huì)大幅度提升,此時(shí)SP可能會(huì)綜合自身利益而轉(zhuǎn)為“消極管理”;SD有“參與”及“不參與”兩種策略。當(dāng)雙方選擇策略為“積極管理”、“參與”時(shí),將達(dá)成合作協(xié)議,可實(shí)現(xiàn)協(xié)同制造。
(2)SD選擇“參與”策略概率為x,則“不參與”概率為1-x;SP選擇“積極管理”策略概率為y,則“消極管理”概率為1-y,且0≤x≤1,0≤y≤1.
(3)當(dāng)SP、SD分別選擇“積極管理”“參與”時(shí),此時(shí)云平臺(tái)發(fā)揮了最大的制造資源共享作用,二者均可獲得超額增量ΔM1,分配系數(shù)為r,SP超額增量為(1-r)ΔM1,SD超額增量為rΔM1.
(4)假設(shè)云平臺(tái)管理能力系數(shù)為α,共享制造資源種類及數(shù)量不斷增加時(shí),云平臺(tái)會(huì)產(chǎn)生SP企業(yè)規(guī)模效益,假設(shè)一個(gè)SP加入云平臺(tái)給整個(gè)SP企業(yè)群集帶來的效益為β,SP的規(guī)模效益用共享概率表達(dá)為f=α2β(1-y),因此云平臺(tái)規(guī)模效益由其管理能力及進(jìn)駐企業(yè)數(shù)量決定。
根據(jù)以上變量假設(shè),可得SP與SD不同演化博弈決策下的支付矩陣如表2所示。
表2 SP-SD雙方博弈支付矩陣Tab.2 SP-SD game payoff matrix
由支付矩陣可得SP選擇策略集為(積極管理,消極管理),選擇不同的策略對(duì)應(yīng)不同的收益,SP選擇“積極管理”策略時(shí)的期望收益如下:
EP1=x[M-P-Q+(1-r)ΔM1+f+π0]+
(1-x)(M-P-Q)
(1)
SP選擇“消極管理”策略時(shí)的期望收益如下:
EP2=x[M-P+ΔM2]+(1-x)(M-P)
(2)
則SP混合決策下的總期望收益為:
EP=yEP1+(1-y)EP2
(3)
由表2得SD選擇策略集為(參與,不參與),不同策略下的SD的收益不同,SD選擇“參與”策略時(shí)的期望收益為:
(4)
同理,SD選擇“不參與”策略時(shí)的期望收益為:
ED2=y(N+W)+(1-y)N
(5)
SD混合決策下的總期望收益為:
ED=xED1+(1-x)ED2
(6)
根據(jù)Malthusian方程可得,博弈策略的變化率為其適應(yīng)度,因此可得:
(7)
令演化復(fù)制動(dòng)態(tài)方程中的x′=0,y′=0,求解得五個(gè)均衡點(diǎn),為E1(0,0)、E2(0,1)、E3(1,1)、E4(1,0)、E5(x*,y*),E5為混合策略,其中
由系統(tǒng)穩(wěn)定性判定方法可知,通過分析系統(tǒng)雅克比矩陣可驗(yàn)證上述局部穩(wěn)定點(diǎn)在系統(tǒng)中的演化穩(wěn)定策略(ESS),雅克比矩陣如下所示:
(8)
將式(7)代入上式得:
[y(rΔM1+ΔN1-ΔN2-W+π0)-C+ΔN2]
x(1-x)(rΔM1+ΔN1-ΔN2-W+π0)
y(1-y)[(1-r)ΔM1+α2β(1-y)+π0-ΔM2]
y(1-y)[(1-r)ΔM1+α2β(1-y)+π0-ΔM2]
(9)
(10)
(11)
(12)
(13)
E=
因x、y分別表示SP選擇“積極管理”策略的概率、SD選擇“參與”策略的概率,因此0≤x*≤1,0≤y*≤1,即得系統(tǒng)約束條件為:
(14)
由此得出五個(gè)均衡點(diǎn)穩(wěn)定性分析結(jié)果如表3所示,由表可知系統(tǒng)存在兩個(gè)ESS,即滿足det(J)>0、tr(J)<0條件的均衡點(diǎn)為E1(0,0)及E3(1,1),對(duì)應(yīng)演化策略為(消極管理,不參與)、(積極管理,參與),E2(0,1)與E4(1,0)為不穩(wěn)定點(diǎn),E5(x*,y*)為鞍點(diǎn)。
表3 系統(tǒng)均衡點(diǎn)穩(wěn)定性分析結(jié)果Tab.3 Stability analysis results of system equilibrium point
該演化系統(tǒng)最后穩(wěn)定策略為SP選擇“積極管理”、SD選擇“參與”;SP選擇“消極策略”、SD選擇“不參與”,鞍點(diǎn)E5(x*,y*)演化主要受初始概率x0、y0、超額增益分配系數(shù)r及其它因素如P、Q、C、ΔM1、ΔM2、ΔN1、ΔN2等影響,演化相位圖如圖1.
圖1 共享決策演化博弈相位圖Fig.1 Shared decision evolution game phase diagram
系統(tǒng)動(dòng)態(tài)演化因果關(guān)系模型如圖2所示,包括四個(gè)水平變量1-x、x、1-y、y及兩個(gè)復(fù)制動(dòng)態(tài)變量Δx(SD決策變化率)、Δy(SP決策變化率),Δx、Δy由前面的動(dòng)態(tài)復(fù)制方程(公式7)得出。
圖2 SP-SD演化因果關(guān)系模型Fig.2 SP-SD evolutionary causality model
以某產(chǎn)品制造服務(wù)供應(yīng)鏈為例,基于MATLAB進(jìn)行數(shù)值仿真,分析SP與SD不同收益狀態(tài)下的系統(tǒng)演化趨勢(shì),以驗(yàn)證上述系統(tǒng)演化結(jié)果的正確性,分析不同參數(shù)對(duì)制造資源服務(wù)共享的影響程度.
通過對(duì)某產(chǎn)品制造過程追蹤調(diào)查獲得有效參數(shù)初值為ΔM1=0.5、ΔM2=0.3、ΔN1=0.3、ΔN2=0.2、α=0.1、β=0.2、π0=0.1、C=0.1、Q=0.2、W=0.3、r=0.1.本模型在固定一部分參數(shù)的情況下,分析了初始共享概率x0、超額增量分配系數(shù)r及云平臺(tái)管理系數(shù)α對(duì)系統(tǒng)演化結(jié)果的影響趨勢(shì)。
(1)初始共享概率對(duì)系統(tǒng)演化結(jié)果的影響
為了分析SD初始共享概率x0對(duì)系統(tǒng)演化結(jié)果的影響趨勢(shì),將SP共享概率固定為y=0.6,設(shè)置x0分別為0.2、0.4、0.6、0.8,SD、SP演化結(jié)果分別如圖3、圖4所示。
圖3 不同初始值x0下的SD決策趨勢(shì)Fig.3 SD decision trends under different initial values x0
圖4 不同初始值x0下的SP決策趨勢(shì)Fig.4 SP decision trends under different initial values x0
分析圖3、圖4可得,當(dāng)SP共享概率y0固定時(shí),SD共享決策的收斂速度受x0的影響較為顯著,且x0越大,收斂速度越快,呈正相關(guān)的關(guān)系,但演化均衡狀態(tài)與x0的大小無關(guān),SP共享概率的收斂速度也隨著x0的增大而變快。演化博弈系統(tǒng)中的單個(gè)用戶或企業(yè)的共享概率也可理解為整個(gè)群落中選擇共享策略的比例,因此,企業(yè)在博弈過程中不斷學(xué)習(xí)模仿其他參與者的選擇策略,即當(dāng)某行業(yè)中的大型企業(yè)或領(lǐng)軍企業(yè)選擇共享策略時(shí),其他企業(yè)也會(huì)慢慢地向共享策略發(fā)展,從而改變行業(yè)規(guī)模效益。
(2)超額增量分配系數(shù)對(duì)系統(tǒng)演化結(jié)果的影響
當(dāng)超額增量分配系數(shù)r=0.1時(shí),系統(tǒng)演化結(jié)果如圖5所示,SD與SP初始選擇概率均為0.5,在此種狀態(tài)下,SP投機(jī)收益小于合作收益,SD積極管理收益大于消極管理收益,系統(tǒng)將演化至(1,1),SP趨向于積極管理,SD趨向于參與策略,即雙方達(dá)成合作共享。
圖5 r=0.1時(shí)SP-SD共享演化趨勢(shì)Fig.5 SP-SD shared evolution trends under r=0.1
由圖6知若分配系數(shù)過大時(shí),SP選擇積極管理策略的收益逐漸下降,則隨著雙方動(dòng)態(tài)博弈,系統(tǒng)將演化至(1,0),SP趨向于消極管理策略,而SD因分配系數(shù)增大而獲得更多的效益,最后趨向于參與云平臺(tái)。基于有限理性的動(dòng)態(tài)演化,不同增益分配系數(shù)會(huì)影響博弈方?jīng)Q策結(jié)果,需針對(duì)不同情況下的收益情形制定合理的分配系數(shù),以促進(jìn)博弈雙方達(dá)成穩(wěn)定合作的目標(biāo)。
圖6 r=0.5時(shí)SP-SD共享演化趨勢(shì)Fig.6 SP-SD shared evolution trends under r=0.5
(3)云平臺(tái)管理系數(shù)對(duì)系統(tǒng)演化結(jié)果的影響
當(dāng)SD共享概率x=0.2時(shí),將云平臺(tái)管理系數(shù)α分別設(shè)置為0.1、0.3、0.6、0.9,研究y0分別為0.2、0.8情況下的演化結(jié)果,如圖7、圖8所示。由圖7可知,云平臺(tái)管理系數(shù)α對(duì)SP決策趨勢(shì)的影響較為顯著,且α越大,SP收斂至平衡的速度越快,反之,則越慢。綜合分析圖7、8可知,當(dāng)SP積極管理初始概率y0越大,α對(duì)SP決策趨勢(shì)的影響越小。
圖7 y0=0.2時(shí)不同α下的SP決策結(jié)果Fig.7 The decision results at y0=0.2 from different α
圖8 y0=0.8時(shí)不同α下的SP決策結(jié)果Fig.8 The decision results at y0=0.8 from different α
由此可得,云平臺(tái)管理系數(shù)對(duì)系統(tǒng)演化結(jié)果具有正向作用,當(dāng)云平臺(tái)較為成熟時(shí),管理能力加強(qiáng),即管理系數(shù)較大時(shí),用戶或制造商會(huì)趨于選擇加入云平臺(tái)實(shí)現(xiàn)制造資源共享,即本模型中SP選擇積極管理策略、SD選擇參與策略,而企業(yè)加入云平臺(tái)更加促進(jìn)云平臺(tái)管理能力的提升。
建立了云制造資源服務(wù)共享博弈演化模型,由支付矩陣得出系統(tǒng)復(fù)制動(dòng)態(tài)方程后計(jì)算均衡點(diǎn),后進(jìn)行均衡點(diǎn)穩(wěn)定性分析,運(yùn)用MATLAB進(jìn)行數(shù)值仿真,對(duì)比分析不同因素對(duì)演化結(jié)果的影響,得出以下結(jié)論:
(1)初始共享概率x0、y0對(duì)系統(tǒng)演化平衡狀態(tài)無影響,但影響博弈方收斂速度,呈正相關(guān)的關(guān)系。由此可見在互相學(xué)習(xí)博弈的過程中,領(lǐng)軍企業(yè)對(duì)整個(gè)行業(yè)影響較大;
(2)超額增量分配系數(shù)r影響系統(tǒng)演化結(jié)果,需要針對(duì)不同需求制定合理的分配系數(shù);
(3)云平臺(tái)管理系數(shù)α影響系統(tǒng)收斂速度,α越大,收斂至平衡的速度越快,且隨著初始概率的增大,α的影響程度減小。可知當(dāng)云平臺(tái)管理能力較強(qiáng)時(shí),企業(yè)或個(gè)人會(huì)趨向于制造資源共享。