成國慶,周炳海,李 玲
(1.同濟大學(xué) 機械與能源工程學(xué)院, 上海 201804;2.上海海洋大學(xué) 工程學(xué)院, 上海 201306;3.上海立信會計金融學(xué)院 統(tǒng)計與數(shù)學(xué)學(xué)院,上海 201209)
生產(chǎn)設(shè)備的日益復(fù)雜化、集成化和智能化直接加大了設(shè)備維護和保養(yǎng)的難度,維護費用和強度不斷增高,從而對維護決策與優(yōu)化提出了更高的要求。據(jù)統(tǒng)計,設(shè)備的維修、維護費用大約占總生產(chǎn)成本的15%~70%[1]。因此,如何妥善維護這些復(fù)雜的生產(chǎn)設(shè)備、保障其高效運行、降低生產(chǎn)維護總成本是企業(yè)在提升競爭力方面遇到的一項實際課題,也是“中國制造2025”發(fā)展戰(zhàn)略關(guān)注的焦點之一。
自上世紀90年代以來,有很多學(xué)者對設(shè)備的生產(chǎn)與維護聯(lián)合優(yōu)化問題進行了深入而廣泛的研究。早期的生產(chǎn)維護聯(lián)合優(yōu)化模型在維護方式上基本都采用基于役齡的預(yù)防維護策略[2-4],這難免會導(dǎo)致“維護過?!被颉熬S護不足”。隨著傳感、設(shè)備診斷、故障預(yù)測等技術(shù)的發(fā)展,維護活動可根據(jù)設(shè)備實時或接近實時運行狀態(tài)的診斷、評估結(jié)果來選擇相應(yīng)的預(yù)防性維護措施[5]?;谠O(shè)備運行狀態(tài)的維護(即視情維護)策略比基于役齡的維護策略更高效,因此其在工程中的應(yīng)用越來越廣泛。文獻[6]以馬爾科夫過程刻畫設(shè)備的劣化進程,研究了生產(chǎn)批量與視情維護策略的聯(lián)合優(yōu)化模型,并利用半馬爾科夫決策方法進行了求解。文獻[7]利用更新過程理論建立了生產(chǎn)批量與視情維護策略的聯(lián)合優(yōu)化模型。文獻[8]進一步考慮了生產(chǎn)過程會出現(xiàn)次品的情形,并假設(shè)次品率與設(shè)備的劣化狀態(tài)相關(guān)。
以上文獻在研究生產(chǎn)設(shè)備時均將其視為一個獨立的個體,即看作是一個單部件系統(tǒng)。然而,由于生產(chǎn)設(shè)備日益復(fù)雜化和集成化,部件數(shù)目迅速增長且部件之間的劣化故障機理相差甚大,在制定維護策略時很難將其視為一個簡單的個體。對于多部件系統(tǒng)而言,部件之間可能還存在著隨機相關(guān)性、經(jīng)濟相關(guān)性和結(jié)構(gòu)相關(guān)性[9],這無疑增加了維護優(yōu)化的難度。有較多學(xué)者對隨機相關(guān)性問題與經(jīng)濟相關(guān)性問題進行了研究。相比之下,結(jié)構(gòu)相關(guān)性方面的研究很少,而同時考慮視情維護的研究就更少了。當(dāng)考慮結(jié)構(gòu)相關(guān)性時,挑選部件進行維護不僅要依據(jù)其當(dāng)前狀態(tài)或可靠性,還要依據(jù)其在整個系統(tǒng)中的地位(即結(jié)構(gòu)重要程度)。為此,Birnbaum[10]首先提出了部件的結(jié)構(gòu)重要度概念,隨后,其被應(yīng)用于復(fù)雜系統(tǒng)的維護建模問題[11-12]。
目前針對復(fù)雜系統(tǒng)的研究僅考慮了單純的維護問題,未將其置于實際生產(chǎn)環(huán)境中。事實上,生產(chǎn)活動對維護策略的制定具有重要的影響。維護活動固然可提高系統(tǒng)可靠性、減少隨機故障,但頻繁維護會導(dǎo)致產(chǎn)能下降,增加缺貨損失風(fēng)險,故在制定維護策略時必須考慮產(chǎn)能與需求間的矛盾。又如,為盡量保證生產(chǎn)過程的連續(xù)性(一些生產(chǎn)活動對連續(xù)性要求很高),維護時間節(jié)點的選擇是受限的,只能是在一個生產(chǎn)批量結(jié)束后進行,而這些問題在單純的維護模型中不會遇到。
鑒于此,本文以復(fù)雜多部件生產(chǎn)系統(tǒng)為對象,研究了有限時間域內(nèi)經(jīng)濟生產(chǎn)批量與視情維護策略的聯(lián)合優(yōu)化模型。不僅考慮了部件間的結(jié)構(gòu)相關(guān)性,還針對不同部件劣化故障機理的不同,分別利用Weibull分布與Gamma過程對其壽命或劣化過程進行建模。設(shè)計了基于蒙特卡洛仿真的優(yōu)化算法,對總成本進行了優(yōu)化求解。最后,以集束型晶圓制造設(shè)備為例演示了本模型。并通過敏感性分析將本模型與部件獨立維護模型、單一整體維護模型進行了實驗對比。
考慮一個多部件生產(chǎn)系統(tǒng),其由N個部件通過串聯(lián)、并聯(lián)或串并混聯(lián)的形式構(gòu)成。該生產(chǎn)系統(tǒng)在有限的生產(chǎn)期限T內(nèi),以生產(chǎn)率P生產(chǎn)某種產(chǎn)品,用于滿足需求率為D的外部市場需求(P>D)。
系統(tǒng)中各個部件隨著役齡的增長逐漸劣化,當(dāng)劣化到一定程度時,部件發(fā)生故障。在一個復(fù)雜的多部件系統(tǒng)中,各部件的劣化、故障機理呈現(xiàn)多樣化的特征,難以用單一的壽命分布或隨機過程來刻畫。例如,在集束型晶圓加工設(shè)備內(nèi)部,氧化工藝腔體采用濕氧氧化進行熱生長,腔體受到氣體腐蝕,其劣化形式主要體現(xiàn)為腐蝕過程。Gamma過程是遞增地、具有獨立增量的隨機過程,易于進行數(shù)學(xué)上的解析處理。工程實際中的許多劣化現(xiàn)象如腐蝕、磨損、裂紋增長等都可由Gamma過程很好的進行模擬刻畫[13],故本文采用Gamma過程來擬合設(shè)備中某些腔體的劣化進程。而另外一些腔體,如化學(xué)機械研磨腔體用來對硅片做平坦化處理,可視其為一般的機械部件。Weibull分布是可靠性建模中常用的分布之一,適用于電子元件、機械部件等的壽命刻畫。故此處利用Weibull分布來描述某些腔體的隨機壽命。將系統(tǒng)中的部件分為兩類,其中一類部件i(1≤i≤m)用Weibull分布Fi(t)=1-e-(t/ηi)mi來刻畫其壽命;另一類部件j(m+1≤j≤N)用Gamma過程來描述其劣化過程。設(shè)部件j在時刻t的劣化量為Xj(t),由Gamma過程的定義[13],Xj(t)是連續(xù)時間上的獨立增量過程,且Xj(0)=0。設(shè)t1至t2時間段內(nèi)的劣化增量Xj(t2)-Xj(t1)是服從形狀參數(shù)為αj、尺度參數(shù)為βj的Gamma分布,即Xj(t2)-Xj(t1)的概率密度函數(shù)為
在一個由多部件組成的系統(tǒng)中,某個部件的故障可能不會導(dǎo)致整個系統(tǒng)的停機,這取決于整個系統(tǒng)的結(jié)構(gòu)以及該部件在系統(tǒng)中所處的位置。如串聯(lián)結(jié)構(gòu)中某個部件的故障會導(dǎo)致整個系統(tǒng)停機,稱這樣的部件為“關(guān)鍵部件”;而并聯(lián)結(jié)構(gòu)中某個部件的故障暫時不會影響整個系統(tǒng)的運行,則稱這樣的部件為“非關(guān)鍵部件”。如圖1所示的串、并混聯(lián)系統(tǒng)中,部件1為關(guān)鍵部件,其余均為非關(guān)鍵部件。值得注意的是,當(dāng)部件5故障后,原本非關(guān)鍵的部件6、7則變?yōu)殛P(guān)鍵部件,稱它們?yōu)椤芭R時關(guān)鍵部件”。當(dāng)部件6故障后,部件7停止工作,假設(shè)停止運行后的部件不再劣化、役齡也不增長。
由上述分析可知,不同部件對系統(tǒng)可靠性的影響不一樣,改善某些部件的可靠性,對整個系統(tǒng)可靠性的提升效果也不盡相同。因此,在有限的時間和維修資源約束下,如何選擇部件進行維護以使系統(tǒng)可靠性得到最大程度的改善,是多部件系統(tǒng)在進行維護決策時面臨的一個現(xiàn)實問題。為此,通過Birnbaum結(jié)構(gòu)重要度[10]來刻畫單個部件對系統(tǒng)可靠性的影響。設(shè)IBi為部件i的結(jié)構(gòu)重要度,y=(y1,…,yi,…,yN)為系統(tǒng)的狀態(tài)向量,其中yi為二元變量,yi=1表示部件i正常工作、yi=0表示部件i故障。設(shè)φ(y)為系統(tǒng)的狀態(tài)函數(shù),若系統(tǒng)狀態(tài)正常,則φ(y)=1;若系統(tǒng)故障,則φ(y)=0。當(dāng)固定部件i的狀態(tài)為1i或0i時,系統(tǒng)狀態(tài)(·i,y)=(y1,…,·i,…,yN)有2N-1個不同的值。根據(jù)Birnbaum結(jié)構(gòu)重要度的定義[10],IBi為部件i作為關(guān)鍵狀態(tài)部件在狀態(tài)總數(shù)中所占的比例,
(1)
在圖1所示的串—并混聯(lián)系統(tǒng)中,由式(1)可得IB1=35/64=0.546 9,IB2=IB3=IB4=5/64=0.078 1,IB5=21/64=0.328 1以及IB6=IB7=7/64=0.109 4。
1.2.1 預(yù)防性維護策略
為改善生產(chǎn)系統(tǒng)的可靠性、減少系統(tǒng)在生產(chǎn)過程中的故障停機損失,在每個生產(chǎn)批量Q結(jié)束時,停機對系統(tǒng)中第二種類型的部件(劣化進程由Gamma過程刻畫)進行檢測。根據(jù)部件目前的劣化水平,評估部件在下一個生產(chǎn)批量內(nèi)的可靠性。令τ=Q/P為一個生產(chǎn)批量的生產(chǎn)時間。假設(shè)在第n個批量結(jié)束時,檢測到部件j(m+1≤j≤N)的劣化水平為Xj(tn)=xj,則部件j在下個批量內(nèi)的可靠性可表示為
=P[Xj(tn)+X(τ) (2) (3) 關(guān)于維護效果,此處假設(shè)部件是修復(fù)非新的。對于壽命服從Weibull分布的部件而言,采用役齡遞減因子法來刻畫維修效果。設(shè)役齡遞減因子為rik∈(0,1),則部件i在第k次預(yù)防維護后的故障率為 hi(k+1)(t)=hik(t+rikΔik), (4) 式中:Δik表示第k-1次維護與第k次維護的間隔時間(是一個批量生產(chǎn)時間τ的整數(shù)倍)。 對劣化進程為Gamma過程的部件,假設(shè)預(yù)防維護之后,劣化量不能恢復(fù)為零(修復(fù)非新),而是一個服從Beta分布的隨機變量。設(shè)部件j在維護前檢測到的劣化量為xj,則維護之后剩余的劣化量xj′服從區(qū)間[0,xj]上的Beta分布,其概率密度為 (5) 式中:pj>0,qj>0,1{·}為示性函數(shù)。 1.2.2 反應(yīng)性維修策略 在生產(chǎn)系統(tǒng)運行過程中,各部件可能會隨機發(fā)生故障。在一個復(fù)雜的系統(tǒng)中,各部件通過串聯(lián)、并聯(lián)、混聯(lián)或冷(熱)儲備等方式連接。在并聯(lián)子系統(tǒng)中,某單個部件的故障不會導(dǎo)致整個系統(tǒng)停機;另一方面,集束型設(shè)備是在真空、無塵的密閉環(huán)境中工作,若要對某個故障部件進行維修,勢必會導(dǎo)致整個系統(tǒng)停機。因此,為保持生產(chǎn)過程的連續(xù)性,在不影響系統(tǒng)運行的前提下,對非關(guān)鍵部件的故障暫不作處理。如果關(guān)鍵部件發(fā)生故障,則系統(tǒng)停機,立即進行反應(yīng)性維修(更換),利用這個維修機會,將前面發(fā)生故障的非關(guān)鍵部件一并進行維修。如果沒有關(guān)鍵部件故障,則故障的非關(guān)鍵部件等到本次生產(chǎn)批量結(jié)束后進行維修。 系統(tǒng)的生產(chǎn)率為P,外部需求率為D(P>D),生產(chǎn)計劃期為T,每個生產(chǎn)批量大小為Q。每個批量結(jié)束后,對系統(tǒng)進行檢測、并做預(yù)防性維護(如有必要)。在系統(tǒng)停機維護期間,外部需求由庫存來滿足,若維護時間過長,庫存不能滿足需求,則產(chǎn)生缺貨損失。維修活動結(jié)束且?guī)齑嫦耐曛?,系統(tǒng)重新啟動開始下一批次的生產(chǎn),即Non-Resumption策略[2]。一個生產(chǎn)周期定義為連續(xù)的兩個生產(chǎn)批量開始時間的間隔,其中包括了批量生產(chǎn)時間、停機維護時間以及可能的空閑時間。一個生產(chǎn)周期內(nèi)系統(tǒng)運行的進程如圖2所示。圖2a表示第n個批量生產(chǎn)結(jié)束后,對系統(tǒng)進行檢測、維護,且維護在庫存消耗完之前結(jié)束,下個批量待庫存消耗完后開始生產(chǎn)。而圖2b表示庫存耗完時維護活動尚未結(jié)束,因此產(chǎn)生了缺貨損失。圖2c表示在第n個批量內(nèi)系統(tǒng)發(fā)生故障,則立即進行反應(yīng)性維修,且維修在庫存消耗完前結(jié)束,下個批量待庫存消耗完后開始生產(chǎn)。在圖2d中,反應(yīng)性維修在庫存耗完后才結(jié)束,故產(chǎn)生了缺貨損失。 (1)預(yù)防性維護不能使部件修復(fù)如新,而反應(yīng)性維修(更換)可使部件恢復(fù)如新。設(shè)預(yù)防維護與反應(yīng)維修所需時間均為隨機變量。 (3)以csetup表示生產(chǎn)系統(tǒng)停機后重新啟動的費用;ch表示單位產(chǎn)品在單位時間內(nèi)的存儲費用;cl表示單位時間的缺貨損失。 (6) 設(shè)生產(chǎn)系統(tǒng)在第n個生產(chǎn)周期內(nèi)的tn時刻發(fā)生隨機故障,記SF(tn)為tn時刻所有發(fā)生故障的部件集合,包括了故障的關(guān)鍵部件和非關(guān)鍵部件。則反應(yīng)維修總費用為固定費用部分c0與各部件的維修費用之和,即 (7) 第n個生產(chǎn)周期內(nèi)的庫存費用,如圖2c所示,可表示為系統(tǒng)運行期間的存貯費用與系統(tǒng)停機時的存貯費用之和,即 (8) (9) (10) 反應(yīng)性維修的總費用 (11) 類似第一種情形(即系統(tǒng)發(fā)生隨機故障),由圖2a可算得第n個生產(chǎn)周期內(nèi)的庫存費用 (12) (13) (14) 式中生產(chǎn)批量大小Q和預(yù)防性維護參數(shù)K為二維聯(lián)合決策變量,本文的目標(biāo)就是要尋找最優(yōu)的(Q*,K*),使得平均單位時間成本C(Q,K)達到最低。 特別說明: (2)仿真參數(shù)Ns表示模擬仿真的次數(shù),需足夠大以使算法收斂,并取平均值作為單位成本的估計值。 (3)算法中TCM表示一次反應(yīng)維修活動總時間(為各故障部件維修時間之和)、TPM表示一次預(yù)防維護活動總時間(為需要維護部件的維護時間之和)、Tidle表示當(dāng)維護時間小于庫存消耗時間時,系統(tǒng)空閑時間。 以某集束型設(shè)備為例,對最優(yōu)經(jīng)濟生產(chǎn)批量與視情維護策略進行仿真實例驗證。集束型設(shè)備主要包括以下組件:機械搬運手、氧化加工腔、離子注入腔、光刻加工腔、機械研磨腔、清洗腔。根據(jù)歷史數(shù)據(jù)與先驗知識,設(shè)維護時間與反應(yīng)維修時間分別服從參數(shù)為λi、μi的指數(shù)分布,設(shè)備與維修參數(shù)如表1所示。 設(shè)集束型設(shè)備的生產(chǎn)率P=150單位/天、需求率D=120單位/天、生產(chǎn)計劃期T=180天、設(shè)備的啟動費csetup=800元/次、檢測費cin=200元/次、預(yù)防性維護或反應(yīng)性維修的啟動費用c0=300元/次、庫存存貯費用ch=0.3元/單位/天,缺貨損失cl=10元/單位/天。預(yù)防維護之后部件的劣化剩余量服從Beta分布,其中的參數(shù)為p=0.4,q=1.2。 表1 系統(tǒng)各部件壽命分布/劣化機制與相關(guān)參數(shù) 取預(yù)防性維護參數(shù)K=(1,2,3,4,5,6,7,8,9,10,11,12,13,14),在不同的Q值下,單位成本C(Q,K)的變化規(guī)律如圖4所示。當(dāng)預(yù)防維護參數(shù)K=12、批量大小Q=1 350時,生產(chǎn)系統(tǒng)的單位成本最小,為511.1元/天。當(dāng)集束型設(shè)備生產(chǎn)了1 350單位的晶圓時,對設(shè)備進行檢測。部件1、4、7、8的預(yù)防維護閾值為12×0.07=0.84,即當(dāng)它們的可靠性預(yù)測值低于0.84時,便進行預(yù)防性維護;部件2、3、5、6的預(yù)防維護閾值為12×0.23≈0.28,即當(dāng)它們的可靠性預(yù)測值低于0.28時進行預(yù)防性維護。 作為對比,選取另外兩種維護策略來與本文提出的預(yù)防維護策略來進行比較:①各部件獨立維護策略[14],各部件的最優(yōu)維護閾值Ri是各自獨立優(yōu)化的結(jié)果,未將其視為系統(tǒng)的一部分;②單一整體維護策略[15],將系統(tǒng)視為一個單一整體,確定其預(yù)防維護閾值R,未考慮部件之間的差異。根據(jù)表1中相同的模型參數(shù)設(shè)置,利用MATLAB遺傳算法工具箱算得兩種策略下的最優(yōu)解及其對應(yīng)的最小單位成本,如表2所示。從表2的數(shù)據(jù)可以看出,文中提出的維護策略較獨立維護策略可節(jié)省10.9%的成本、較整體維護策略可節(jié)省8.1%的成本。其原因就在于,該維護策略不只是將系統(tǒng)視為一個整體,同時考慮了部件之間的差異及其在系統(tǒng)中的結(jié)構(gòu)重要程度,彌補了其他兩種策略的短板。 表2 3種預(yù)防維護策略下最優(yōu)解的對比結(jié)果 考慮到維護策略的優(yōu)劣可能還受到參數(shù)設(shè)置的影響,下面通過敏感性分析對以上3種策略進行更為全面的評價。圖5a~圖5d分別為維修啟動費用、缺貨損失、預(yù)防維護費用、反應(yīng)維修費用改變幅度從-50%到+50%時對應(yīng)的平均單位成本。圖中策略1、2、3分別表示部件獨立維護策略、單一整體維護策略以及文中所提出的維護策略。從圖5可看出,策略3在4種情況下的表現(xiàn)均優(yōu)于其他兩種策略。具體闡明如下: (1)在圖5a中,隨著維修啟動費用c0的增加,策略3較策略1、2的優(yōu)勢逐漸擴大,成本的節(jié)約幅度分別從8.1%、5.4%提高至13.2%和10.8%。這說明策略3避免了過度維護、減少了頻繁啟動維護費用。 (2)圖5b與圖5a呈現(xiàn)的結(jié)果正好相反,隨著缺貨損失cl的增加,策略3較策略1、2的優(yōu)勢逐漸減小,成本節(jié)約幅度分別從13.3%、13.7%降至10.6%和6.7%。這說明策略1、2較策略3在減少缺貨損失方面具有優(yōu)勢,這是因為策略1、2更注重設(shè)備的預(yù)防維護,有效地減少了設(shè)備的突發(fā)故障,從而減少了被迫停機導(dǎo)致的缺貨損失。 以多部件復(fù)雜生產(chǎn)系統(tǒng)為研究對象,建立了生產(chǎn)與維護的聯(lián)合優(yōu)化模型。對于多部件的復(fù)雜系統(tǒng),在對各部件進行劣化建模時,根據(jù)其劣化機理恰當(dāng)?shù)剡x擇隨機變量或隨機過程,不作統(tǒng)一的、無差別的處理。視情維護策略中包括設(shè)備檢測周期和預(yù)防維護閾值兩個關(guān)鍵因素。本文將批量大小作為決策變量,是基于以下兩點考慮:①由于檢測在批量生產(chǎn)結(jié)束后進行,故批量大小直接決定了設(shè)備檢測周期,從而會影響維護策略;②本文的維護活動是以生產(chǎn)為驅(qū)動,批量大小(或生產(chǎn)時間長短)會影響設(shè)備的劣化進程。批量越大,設(shè)備在運行過程中故障風(fēng)險越高。鑒于以上事實,批量大小對維護活動具有決定性的影響,故本文將其作為一個決策變量,連同維護閾值進行聯(lián)合優(yōu)化,并設(shè)計了仿真算法求得最優(yōu)聯(lián)合策略。通過集束型晶圓制造設(shè)備的實際生產(chǎn)、維護優(yōu)化問題演示了本模型。敏感性分析的結(jié)果顯示所提維護策略較部件獨立維護策略及單一整體維護策略在減少總成本方面具有優(yōu)勢,特別是在維修啟動費用和預(yù)防維護費用較高的情況下優(yōu)勢更為顯著。因此,本文對于制造企業(yè)合理地制定生產(chǎn)計劃和維護方案,降低運營成本具有一定的參考指導(dǎo)意義和參考價值。 本文只考慮了單產(chǎn)品不變需求的生產(chǎn)情形,為了使模型更加符合生產(chǎn)實際,在未來的研究中,筆者將進一步考慮多產(chǎn)品并且需求隨機變動的情形,建立隨機動態(tài)規(guī)劃模型進行優(yōu)化求解。1.3 批量生產(chǎn)過程描述
1.4 符號與假設(shè)
2 模型建立
2.1 一個生產(chǎn)周期內(nèi)系統(tǒng)發(fā)生故障時的各項費用
2.2 一個生產(chǎn)周期內(nèi)系統(tǒng)未發(fā)生故障時的各項費用
3 仿真算法
4 實驗分析
5 結(jié)束語