鄭菁菁,史旭鵬,徐澤林
(1.南京信息工程大學,南京 210044; 2.中認英泰檢測技術有限公司,蘇州 215104)
可靠性試驗與環(huán)境試驗一樣,本身就是一門技術,不是有了人,有了試驗設備,就能準確的做好試驗,為達高的試驗再現性,如實的評估出裝備的實際戰(zhàn)斗力。在環(huán)境與可靠性試驗前,首先要做好試驗設計。
服務器是軍民融合產品,民用時通常在環(huán)控的條件下工作,軍用時,特別在運載工具上使用時,通常會進行抗振緩沖加固。所以試驗設計的要求和內容會有所不同。本文談的的民用服務器的可靠性試驗設計。
在進行可靠性試驗方案設計時,首先弄清可靠性指標,要明白指標的含義。在當今的可靠性試驗中,任務下達單位,即甲方給試驗室的考核指標,有時就是單純給個MTBF值,并沒有說清是MTBF的什么值,甚至有的產品在研制總要求、合同、任務書上也沒有明確是什么值。
我國當前有二大類型可靠性標準,一類是以國軍標GJB 899A 可靠性鑒定和驗收試驗(它來自美國軍標781和781手冊)為主的可靠性標準,另一類是以國標GB/T 5080(即商用標準,它來自IEC 61124,例如其中的:可靠性試驗,第7部分:恒定失效率和恒定失效強度的驗證試驗)為主的可靠性標準。
1)使用指標
①目標值:
期望裝備達到的指標。既是滿足使用要求的最佳值,又是達到最佳費效比的值,它是確定合同指標中“規(guī)定值”的依據。目標值到裝備成熟期才能達到,成熟期是指裝備已使用了足夠長時間,而且可靠性增長已結束,其維修配套設備已齊全。
②門限值:
它是滿足裝備使用必須達到的指標。它是確定合同指標中“最低可接收值”的依據。門限值是根據目標值,考慮費用、技術水平、設計風險、其它不定因素等,按研制時間推算出來的。
2)合同指標
①規(guī)定值(θ0):
從“目標值”轉換而來,是期望裝備達到的合同指標,是制造方進行可靠性、維修性設計的依據。
②最低可接收值(θ1):
裝備必須達到的合同指標,它是考核或驗收的依據。
3)檢驗指標(可靠性試驗考核方案中的指標)
① MTBF.檢驗下限值(θ1),又稱MTBF假設值的下限值
由最低可接收值轉換而來,它是不可接收的MTBF值,當受試裝備MTBF的真值接近θ1時,統(tǒng)計試驗方案以高概率拒收MTBF真值接近θ1設備。
② MTBF.檢驗上限值(θ0),又稱MTBF假設值的上限值
可接收的MTBF值。它等于鑒別比乘以MTBF檢驗下限值(θ1),當受試裝備的MTBF真值接近θ0時,統(tǒng)計試驗方案以高概率接收MTBF真值接近θ0設備。
4)試驗指標(MTBF的驗證值)
① MTBF置信下限(θL)
由驗證試驗得出的MTBF真值范圍的下限值,此值必須等于或大于MTBF檢驗下限值(θ1),也即必須等于或大于最低可接收值,這樣才能通過可靠性試驗,使用方才能接收。
②MTBF置信上限(θU)
由驗證試驗得出的MTBF真值范圍的上限值,它與真值范圍的下限值一起表示MTBF真值以一定的置信概率落在該上下限范圍內。
m:為MTBF的真值(在可靠性試驗中可靠性水平指標的真值是得不到的,可靠性試驗只能給出真值的置信范圍);
m0:為規(guī)定的MTBF值,m0=1λ0設計目標值(相當于國軍標中的規(guī)定值θ0);例如表1,方案B.8,產品可靠性指標真值已達到設計目標值m0,制造方還有10 %的風險可能交不出去,即可靠性試驗結果報告會有10 %(名義值)的可能會給出沒有達到的判決要求。
m1:為MTBF的下限值,m1=1λ1,(相當于國軍標中的最低可接受值θ1、MTBF的驗證值置信下限);例如表1,方案B.8,使用方接受了可靠性試驗指標達到下限值m1的產品,實際使用方所接收的產品還有10 %(名義值)的風險可能根本沒有達到。
在進行可靠性試驗設計時還應特別注意,不能單獨看指標的高低,它必須結合試驗應力、試驗剖面,失效判據在一起看。否則是空的,不落地的。
1)可靠性指標、試驗剖面、失效判據三個要素
可靠性指標的高低與產品在全壽命期內所要經歷的任務剖面密切相關,即與可靠性試驗中與所用試驗剖面密切相關,因為剖面中應力高低直接影響到最后得出MTBF值的高低。另外,MTBF值的高低與失效判據密切相關,判據的嚴與松,多與少,同樣直接關系到最后得出MTBF值的高低。所以在談論可靠性指標時,如果不談考核用的試驗剖面,不談試驗判據是非常不嚴密的,是空的。得出的指標也是不正確的。然而,當今許多研制總要求、合同、任務書,往往只有指標,沒有考核試驗應力、試驗剖面、失效判據,所以在設計可靠性試驗方案時必須論證清楚,當然這是后補的,否則無法設計出符合實際使用要求的可靠性試驗設計方案。其實這在產品研制初期就應明確的。
2)在設計可靠性試驗方案時,有時會碰到只有可靠性指標,沒有明確是什么指標,即可靠性方案設計時,還要明確考核的是基本可靠性(MTBF)還是任務可靠性(MTBCF),因為基本可靠性給出的是產品所需維修備件和維修人力、維修費用方面的信息。對基本可靠性凡是相關失效都計入MTBF值。任務可靠性給出的是完成任務的信息,任務成功的概率,即平均無致命故障之間的間隔時間。基本可靠性與任務可靠性的關系為: 要基本可靠性高, 任務可靠性必下降; 要任務可靠性高, 基本可靠性必下降。因為任務可靠性要用冗余。所以一個完整的試驗方案,因同時考核出基本可靠性指標和任務可靠性指標,這樣花同樣的經費同樣的時間,得出的產品可靠性水平指標的信息量最多。
在進行可靠性試驗方案設計時,首先要選擇統(tǒng)計試驗方案,在國軍標GJB 899A中有:概率比序貫試驗方案、定時截尾試驗方案、全數試驗方案;在國標中GB/T 5080中有:序貫試驗方案、定時/定數截尾試驗方案、綜合試驗方案。
在選擇方案號時,要考慮的因素有:最低可接受值、設計值、置信度、風險率、試驗時間、試驗經費等,并且從這些因素中平衡。具體來說:
1)設備的成熟程度及預期的壽命:對成熟度高,預期壽命長的產品,通常選擇時間短的風險率高的方案;
2)設備的關鍵與重要程度:這類產品通常選擇置信度高的風險率低的試驗方案;
3)經費和進度:經費與時間足夠時通常選擇置信度高的風險率低的試驗方案,否則,相反之。
當今市場上的服務器,MTBF值一般都說為5 000 h,但一般不說清楚是規(guī)定值(設計值),還是MTBF的下限值。但在軍工產品可靠性設計中將其作為最低可接受值看待,在商貿中一般將其看做為設計值,但可靠性試驗考核時,通常用m0=50 000 h設計試驗方案。因為是民品,現選擇在IEC 61124 ED2:2006中的定時/定數截尾試驗方案進行試驗設計,該方案又有下列具體試驗編號,見表1。
按可靠性試驗的要求:試驗樣品數至少應有兩臺;對十分昂貴和質量控制嚴格的受試設備,可允許一臺。這里需進行可靠性試驗的服務器,其可靠性指標定為:m0=50 000 h,m1=10 000,由于價格高,能投入的樣本量比較少,但統(tǒng)計試驗方案是建立在抽樣理論基礎上的,為了使試驗結果更好代表母體,試驗樣品數為:3臺。
由于服務器的m0=50 000 h,一般都選擇方案號B.8。這里:
表1 定時/定數截尾試驗方案
有效試驗時間:=50 000 h×1.08= 54 000 h,由于樣品數為3,每臺樣品的有效試驗時間為:18 000 h,可接受的失效數c=2。
在IEC 61124 ED2:2006中規(guī)定:為適應高可靠性要求和縮短產品進入市場的時間,所有標準中的試驗類型都是可以加速的。
任何類型的加速試驗都是基于加速損傷模型理論,即產品在其壽命周期內所經歷的應力可對其造成漸進的累積損傷。都是通過提高試驗應力來產生與產品壽命期內預期應力產生的同樣累積損傷。
54 000 h有效臺時,即每臺18 000 h的有效試驗時間,無論從時間還是經費上,客戶都認為不可接受,希望通過加速到一個月內完成試驗。對此,對可靠性試驗設計,必須引入加速試驗方案。
民用服務器是全壽命期間在環(huán)控條件下固定使用的產品,能加速的參數主要是溫度和濕度。因為固定使用時,不會像在運載工具上使用那樣,除溫度濕度外同時存在振動,所以振動主要發(fā)生在運輸過程中,而且在包裝狀態(tài)下。
Peano軌跡在加工平面零件時得到了良好的效果,但對于非球面零件的加工,Peano軌跡無法確保達到預期的加工結果。因此,文獻[42] 在Peano軌跡(圖5(a))的基礎上提出了更適合于非球面零件加工的類Peano軌跡(圖5(b)),在對直徑為100 mm的非球面零件加工的實驗中,經過145 min的加工,使得面型誤差由PV=0.386 λ,RMS=0.056 λ收斂至PV=0.097 λ,RMS=0.011 λ(其中λ=632.8 nm)。
1)加速試驗公式:
選用勞森(Lawson)溫濕度加速模型進行加速,本研究將溫度和濕度之間的“×”修正為“+”號,以提高試驗結果的置信度。得出的加速系數為:
式中:
Ea—激活能,1.0 eV;
kb—波爾茲曼常數(8.617 385E-5 eV/k);
T1—加速前的溫度;
RH1—加速前的濕度;
T2—加速后的溫度;
B—常數,本模型取5.557×10-4。
2)加速系數
①加速條件:
加速前的溫度:25 ℃;
加速后的溫度:35 ℃;
加速前的濕度:60 %RH;
加速后的濕度:90 %RH。
②按上述加速模型計算出放入加速系數:43。
3)加速后平均每臺的試驗時間為:18 000h/43=418.605 h。
1)循環(huán)數
可靠性試驗方案設計時,需足夠的試驗循環(huán)數,因為只有這樣,才能確保試驗數據統(tǒng)計的準確性。試驗循環(huán)數可設計成24 h的倍數或24 h的可約小時數。例如幾倍的24 h或12 h、8 h、6 h和4 h為一個周期??紤]到加速后的每臺試驗樣品的有效臺時數為:418.605 h,本次對服務器可靠性試驗設計成24 h為一循環(huán),共21循環(huán)。
2)環(huán)境應力
每一循環(huán)中:20 h為高應力,采用加速后的35 ℃、90 %RH溫濕度度綜合加速應力,4 h為服務器在環(huán)控條件下的標準大氣環(huán)境應力,即未加速前的25 ℃、60 %RH的應力。第21循環(huán)為16 h采用溫濕度綜合加速應力,余下8 h為標準大氣環(huán)境應力。這樣正好滿足加速前的每臺18 000 h的有效試驗時間。
3)每一循環(huán)中的升降溫速率為5 ℃/min,時間為2 min,包含在高應力的溫濕度綜合加速應力中。
4)電應力
電應力采用:第一循環(huán)標稱電壓220 V,第二循環(huán)高電壓242 V,第三循環(huán)低電壓198 V,以此循環(huán)下去,直至完成全部21個試驗循環(huán)。
5)功能應力
①由于服務器是連續(xù)工作的,通常從開機正式投入后,它會不間斷地工作,一直到徹底報廢。所以本次服務器的可靠性試驗在有效試驗時間內是連續(xù)不間斷開機運行,滿足可靠性長期穩(wěn)定工作的要求。
②在加電應力過程中,硬件和所有軟件同時運行,改變當今許多可靠性試驗實際只是硬件的可靠性試驗,即僅在給定剖面點上進行性能參數測量,而不運行功能的狀態(tài)。由此得出的可靠性指標實際基本是硬件的可靠性指標,這也是導致試驗室試驗得出的可靠性指標比實際使用統(tǒng)計出的可靠性水平低許多的原因,根據美國宇航局給出的數據,軟件的可靠性比硬件可靠性低一個數量級。為此,本次對服務器的可靠性試驗,在試驗的全過程要按服務器全壽命期間各軟件模塊(存儲,運算,數據處理,管理,數據備份、轉換等)功能在實際使用中出現的概率進行運行,運行采用壓力測試軟件(CPU負載測試軟件)進行。并以此同時給出軟硬件一體的可靠性指標。因為軟件測評僅相當于硬件ESS試驗,它給不出軟件的可靠性定量指標。
6)運行剖面
根據上述敘述,設計出的服務器可靠性試驗剖面如圖1。
1)失效判據
①服務器無法啟動
②系統(tǒng)需頻繁重啟(允許3次)
③服務器死機(允許3次)
圖1 服務器可靠性試驗剖面圖
④硬盤損壞
2)判決標準
接收試驗: 若在時,r≤2,則認為符合規(guī)定的要求。
拒收試驗: 若在時或在之前,r>2,則認為不符合規(guī)定的要求。
我國的試驗室可靠性試驗已走過了30個年頭。在這30年中產品的可靠性水平有了很大的提高,特別在軍用裝備可靠性工作的帶動下,民用產品,特別是軍民融合產品,其可靠性工作也愈來愈受到重視。在取得巨大成就的同時,也存在軍民產品指標不統(tǒng)一,給系統(tǒng)可靠性設計帶來了難度,以及,特別是民品指標高,試驗室考核時間長,費用高等問題,對此,本研究給出了二者的轉換關系和用加速的辦法縮短可靠性試驗時間的方法。