李常春, 王新芳, 應露瑤
(1. 寧波緯誠科技股份有限公司,寧波 315000; 2. 中城建(北京)建筑設計有限公司,北京 100061)
隨著全球經(jīng)濟的數(shù)字化轉型,數(shù)據(jù)的運算、存儲與傳輸已成為一種生產(chǎn)資料,而數(shù)據(jù)中心作為數(shù)據(jù)的樞紐和應用載體,既是產(chǎn)業(yè)數(shù)字化的關鍵基礎設施,也是數(shù)字經(jīng)濟的基石。2019年全世界共有180個10萬臺服務器規(guī)模的數(shù)據(jù)中心在建設,但遠遠滿足不了全球經(jīng)濟對數(shù)據(jù)中心的需求。在中國,隨著新基建政策落地,5G基建和工業(yè)互聯(lián)網(wǎng)時代來臨,數(shù)據(jù)中心市場總體規(guī)模將快速增長。
與此同時,數(shù)據(jù)中心一旦發(fā)生故障,帶來的損失將更加無法估量。艾默生網(wǎng)絡能源與Ponemon研究院合作發(fā)布的《2016年數(shù)據(jù)中心宕機成本》中表明,數(shù)據(jù)中心故障每分鐘為企業(yè)帶來損失近9 000美元。其中,意外宕機平均每分鐘總成本從2010年的5 617美元增加到2013年的7 908美元,再到2016年的8 851美元。數(shù)據(jù)中心宕機的成本在持續(xù)攀升,同時給各行各業(yè)帶來了巨大的損失,如圖1所示。
圖1 2016年各行業(yè)數(shù)據(jù)中心業(yè)務每中斷1小時損失統(tǒng)計表
因此,隨著數(shù)據(jù)中心行業(yè)的蓬勃發(fā)展,如何保障數(shù)據(jù)中心的運維安全,減少意外宕機事故也變得更為重要。近年來,數(shù)據(jù)中心使用的高性能計算機和刀片服務器等IT設備功耗的不斷提升,內(nèi)部電子附件封裝密度越來越高,都對硬件的可靠性造成了很多不利影響,使得IT電子設備更容易受到數(shù)據(jù)中心循環(huán)空氣中鋅晶須、粉塵、腐蝕性氣體等污染物的影響,發(fā)生故障的可能性隨之增加,進而導致意外宕機事故發(fā)生的概率大大提升。
本文著眼數(shù)據(jù)中心金屬顆粒污染物-鋅晶須,闡述其對數(shù)據(jù)中心設備可靠性的影響,并給出行之有效的解決方案,為行業(yè)提供有價值的參考,降低高昂的意外宕機成本。
1948年,貝爾實驗室首次發(fā)現(xiàn)鍍鋅支架上的鋅晶須會導致電話傳輸系統(tǒng)中使用的石英濾波器的損耗增加。之后的數(shù)十年內(nèi),航天航空和通信領域發(fā)現(xiàn)的各種不明原因的電氣和電子設備故障漸漸引起人們的關注。2003年,美國航天局數(shù)據(jù)中心新安裝的大型存儲器在一個月內(nèi)發(fā)生了18起以上的災難性電源故障。隨后的調(diào)查認定故障原因是鋅晶須引發(fā)的電氣短路。經(jīng)過研究分析后,NASA的事故調(diào)研小組成員Jay Brusse等人發(fā)表文章介紹了該次事故的詳細調(diào)查過程,并指出鋅晶須引起的電路短路已經(jīng)是世界范圍內(nèi)造成損失慘重的計算機系統(tǒng)故障的主要原因之一。
鋅晶須是由鋅形成的導電細絲,通常直徑為1μm~5μm,遠小于人的頭發(fā),肉眼幾乎不可見;少數(shù)情況下,長度會超過1cm。它們從經(jīng)過防腐蝕鍍鋅處理的金屬表面自發(fā)生長出來,生長速度約為每年250μm,主要的幾種形態(tài)為柱狀、彎折狀和結節(jié)狀。目前的研究成果表明鋅晶須是從底部生長而不是頂部生長的,雖然其生長機理尚未證實,但長期以來的主流觀點認為鍍層內(nèi)部的壓縮應力是鋅晶須生長的主要驅(qū)動力。
雖然鋅晶須的體積很小,但對于今天的微電路而言,它們已經(jīng)足以引發(fā)問題。數(shù)據(jù)表明,NTF(未發(fā)現(xiàn)故障)統(tǒng)計資料中可能由于鋅晶須污染導致的間歇性故障占比很高。這種污染已成為最容易引起電子和計算機設備故障的異常因素之一。
數(shù)據(jù)中心中的鋅晶須來源于常見的鍍鋅產(chǎn)品,例如電鍍鋅網(wǎng)格橋架、靜電地板底部的鍍鋅鋼板等。鋅晶須原本是附著在鋅層表面,當它受到干擾時就會脫落,比如數(shù)據(jù)中心進行維護時,拖動電纜就會使得鋅晶須從附著物的表面脫落,進入到空氣中。然后鋅晶須通過空調(diào)系統(tǒng)循環(huán)流通從而遍布到整個數(shù)據(jù)中心,最后鉆入到設備中,橋接上間隔緊密的電導體,就會導致設備短路、電壓變化和其他信號干擾,造成系統(tǒng)宕機、數(shù)據(jù)丟失,更嚴重者還會引發(fā)電氣火災。
進入21世紀后,關于鋅晶須引發(fā)的數(shù)據(jù)中心故障的報道更加頻繁。一是因為更小型的電子元器件使電路板導體間距越來越小,鋅晶須更容易橋接導體;二是更低的電壓和電流不足以熔化鋅晶須,造成永久性短路;三是更頻繁的機房升級改建,使得鋅晶須斷裂從附著物上脫落。
隨著數(shù)據(jù)中心行業(yè)日益認識到鋅晶須污染引起的問題,各相關行業(yè)也開始致力于探索消除鋅晶須污染的解決方案。同時,數(shù)據(jù)中心不得含有鋅晶須也被寫入相關的行業(yè)指南和標準當中。來自美國采暖、制冷與空調(diào)工程師學會(ASHRAE)于2008年發(fā)布的數(shù)據(jù)中心環(huán)境設備指南對“建議的運行環(huán)境”進行了描述,描述如下。
(1)溫度:18℃(64.4℉)至27℃(80.6℉)。
(2)濕度:上限為60%的相對濕度或15℃(59℉)的露點濕度;下限為5.5℃(41.9℉)的露點濕度。
(3)氣體污染物:ANSI/ISA 71.04-1985的G1級嚴重等級規(guī)定,銅試樣的反應速率低于300C/月(η0.0039μg/cm2一小時的增量)。此外銀試樣的反應速率應低于300C/月(η0.0035μg/cm2一小時的增量)。應在機架進氣口側前端2英寸(5cm),離地面1/4及3/4機架高度處或者空氣流速較高的地方進行氣體腐蝕性的反應監(jiān)測。
(4)顆粒污染物
1)數(shù)據(jù)中心必須達到ISO 14644-1 8級所規(guī)定的清潔等級。
對于沒有安裝空氣側節(jié)能裝置的數(shù)據(jù)中心,只需采用以下過濾方式,就能輕松地達到ISO 14644-1 8級清潔標準:Ⅰ.使用MERV 8過濾器不斷過濾室內(nèi)空氣;Ⅱ.使用MERV 11過濾器(MERV 13更佳)過濾進入數(shù)據(jù)中心的空氣。
對于配有空氣側節(jié)能裝置的數(shù)據(jù)中心,為達到ISO 8級清潔標準,應根據(jù)數(shù)據(jù)中心的特定情況來選擇過濾器。
2)顆粒污染物的潮解相對濕度不應大于60%RH。
3)數(shù)據(jù)中心內(nèi)不得含有鋅晶須。
目前數(shù)據(jù)中心產(chǎn)業(yè)鏈條中關于解決鋅晶須隱患的方案主要分為兩種。第一種屬于圍堵措施,針對含有鍍鋅部件的數(shù)據(jù)中心進行定期監(jiān)測。如果檢測到鋅晶須的存在,可請專業(yè)的清洗技術服務商對數(shù)據(jù)中心定期進行清洗。以美國Data Clean、 AMB Solution等為代表的清洗服務提供商便專門為數(shù)據(jù)中心提供清除鋅晶須的服務。
另一種方案則屬于預防措施,從根源上杜絕鋅晶須的存在,即在方案設計時就采用其他表面處理方式代替電鍍鋅。以數(shù)據(jù)中心電纜敷設中經(jīng)常使用到的電鍍鋅網(wǎng)格橋架為例,英國BEAMA協(xié)會2012年發(fā)布的橋架指南提出,為了杜絕鋅晶須,建議原材料采用不銹鋼、表面為有機涂層的碳鋼或者非金屬材料。許多國際知名的橋架制造商針對數(shù)據(jù)中心的鋅晶須隱患,也紛紛推出各自的解決方案。例如,ABB集團旗下的Thomas & Betts公司建議采用不銹鋼、熱浸鋅以及環(huán)氧樹脂涂層代替電鍍鋅;美國泛達公司提出預鍍鋅工藝不會產(chǎn)生對靈敏的電子設備造成損害的鋅晶須;美國Chatsworth Products公司提出采用預鍍鋅或者噴塑來代替電鍍鋅等。
以上兩種方案雖然為解決鋅晶須污染提供了不同的方向,但在實踐操作中也存在一定的缺點。 圍堵方案中,鋅晶須清除以后仍會繼續(xù)生長,定期、專業(yè)清洗服務成本高昂,性價比低。替代方案中,其他替代電鍍鋅的材質(zhì)存在表面處理方式、綜合性價比低等一系列問題。
例如,(1)采用不銹鋼替代方案,由于其材質(zhì)特性多用于食品加工行業(yè)或腐蝕性環(huán)境,若用于數(shù)據(jù)中心則建設成本過高,難以推廣。(2)采用熱浸鋅替代方案,雖然具有優(yōu)異的耐腐蝕性,但是表面殘留大量鋅瘤需要人工打磨,增加人工成本,并導致鋅層厚度不可控,帶來防腐隱患;另一方面熱浸鋅工藝對環(huán)境污染嚴重。(3)采用預鍍鋅替代方案,預鍍鋅為加工前鍍鋅,雖然價格低廉但自身耐腐蝕性差,再加上加工過程中的斷面、切口和焊點處無鍍層保護,容易產(chǎn)生銹蝕。(4)采用噴塑替代方案,沒有經(jīng)過電鍍直接噴塑,容易刮花,有防腐隱患。
目前在國內(nèi),數(shù)據(jù)中心不應使用鋅晶須已被列入相關的行業(yè)規(guī)范中(參見表1)。但是一方面國內(nèi)缺乏為數(shù)據(jù)中心提供專業(yè)鋅晶須清除服務的清洗技術公司,另一方面上述替代電鍍鋅的方案由于其自身的各種不足,并不能很好地滿足數(shù)據(jù)中心建設中對于預防鋅晶須的要求。
來自中國通信行業(yè)協(xié)會于2019年發(fā)布的《金屬網(wǎng)格式電纜橋架規(guī)范》 表1
化學鍍鎳作為金屬表面防護性工藝的一種,因金屬鎳穩(wěn)定性好、硬度高,其鍍層具有良好的耐腐蝕性和耐磨性,且鍍層表面光滑美觀,工藝經(jīng)濟性相對較高,是替代電鍍鋅的優(yōu)選方案。一支基于硅谷資深科學家領導的研發(fā)團隊創(chuàng)新性地開發(fā)了具有自主產(chǎn)權的環(huán)境友好型表面納米合金催化鍍膜技術。該技術利用化學氧化還原反應,將鎳離子還原沉積在基材表面,形成致密、均勻、高結合力的鎳合金納米膜。在金屬表面形成的鎳鍍層的生長機理為無晶體取向的層狀生長,鍍層致密且無晶須生長,是一種較為理想的解決鋅晶須給數(shù)據(jù)中心帶來的安全隱患的方案。
其次,該鎳鍍層有優(yōu)異的耐磨性和耐腐蝕性。電鍍鋅的薄膜硬度為120 HV左右;鍍鎳的薄膜硬度在500 HV左右,經(jīng)過400℃熱處理或共沉積SiC等納米顆??梢猿^1 100 HV,達到硬鎘的硬度(>800 HV)水平。鍍鎳與電鍍鋅的硬度對比測試和不同表面處理的網(wǎng)格橋架鹽霧試驗時間詳見表2~3。
鍍鎳與電鍍鋅的硬度對比測試 表2
不同表面處理的網(wǎng)格橋架鹽霧試驗時間 表3
鍍鋅薄膜腐蝕后形成的氧化鋅白色粉體,黏附力弱、容易脫落,影響其他設備的穩(wěn)定性和清潔度。而鍍鎳層被腐蝕后形成的氧化鎳黏附力好,不容易脫落。
第三,環(huán)保無晶須納米膜技術可實現(xiàn)豐富的鎳層顏色,符合數(shù)據(jù)中心的色彩管理理念。
第四,環(huán)保無晶須納米膜的生產(chǎn)工藝采用無污染的食品級原料配制鍍液,廢液可以重復利用,達到近乎零排放的環(huán)保處理。
綜合對比分析后,鍍鎳橋架的優(yōu)勢突出,真正從安全防腐、環(huán)保、經(jīng)濟、美觀等各方面契合現(xiàn)代化數(shù)據(jù)中心環(huán)境建設的要求。不同材質(zhì)/表面處理的橋架性能對比詳見表4。
不同材質(zhì)/表面處理的橋架性能對比表 表4