譚力
美國是全球最早開始探索綠色數(shù)據中心技術的國家之一。從數(shù)據中心分布來看,美國占據了全球數(shù)據中心45%的份額。中國和日本分別占有8%和7%。美國互聯(lián)網發(fā)展近50年,當前的數(shù)據中心行業(yè)已進入整合階段,以改建和擴建為主,新建數(shù)據中心規(guī)模占比不大。Equinix等第三方數(shù)據中心企業(yè)憑借靈活的管理及高效的收購,迅速發(fā)展成為全球龍頭。Google、IBM等互聯(lián)網公司自建的數(shù)據中心也已達到世界領先水平。美國發(fā)展綠色數(shù)據中心的做法和經驗值得我國借鑒。
美國政府發(fā)展
綠色數(shù)據中心的舉措
聯(lián)邦數(shù)據中心節(jié)能項目。聯(lián)邦數(shù)據中心節(jié)能項目設立的能效專家中心發(fā)布了數(shù)據中心節(jié)能設計最佳實踐導則,介紹了高效數(shù)據中心設計、場地條件、氣流組織管理、制冷系統(tǒng)、供電系統(tǒng)、分布式發(fā)電等方面的示范案例;發(fā)布了數(shù)據中心能效評估工具包和數(shù)據中心自我對標指南;提供具體節(jié)能案例研究報告;提供數(shù)據中心服務器與存儲器、電力系統(tǒng)等方面的具體節(jié)能技術報告;發(fā)布數(shù)據中心能效對標案例研究報告等。
關閉整合小散舊數(shù)據中心。美國政府在2011年設立了一個目標,在4年內關閉大約800個數(shù)據中心,為美國節(jié)省數(shù)億美元的開支。綜觀整個聯(lián)邦政府內部,單就財務和人力資源管理的軟件項目就多達數(shù)百種。這就造成從1998年到2010年間,聯(lián)邦數(shù)據中心從432座猛增至2000座以上。冗余系統(tǒng)和應用的數(shù)量在過去的時間里無限制增長,造成了極大的資源浪費。項目啟動一年后,美國政府已經關閉了137個數(shù)據中心,美國聯(lián)邦調查局計劃鞏固這項措施,未來關閉數(shù)據中心總數(shù)將達到1100座。關閉這些數(shù)據中心,通過節(jié)省納稅人的開支和更充分地利用硬件和軟件,將會節(jié)約10億美元以上的資金。同時,這項舉措將可以為美國政府每年節(jié)約50億美元的支出。
推行“能源之星”數(shù)據中心計劃。2009年,美國環(huán)境保護局發(fā)布了數(shù)據中心服務器的首個“能源之星”的規(guī)范,它定義了一系列的能源使用、效率要求、存儲系統(tǒng)和大型網絡設備的規(guī)范。這些要求主要集中在提高整體服務器的能源效率、降低整體功耗方面,特別是對服務器空閑時的功耗進行了規(guī)定。該計劃建立了數(shù)據中心“能源之星”評級系統(tǒng),對數(shù)據中心PUE指標進行評分,分值從1到100,每一分代表能效超過1%的數(shù)據中心,得分高于75即可獲得“能源之星”標識。雖然并不是所有的設備都適用于能源之星的評級,但該計劃確實讓IT設備購買方考慮降低能源成本,決策是否采用的重要因素。為了滿足能源之星對數(shù)據中心設備的要求,每一個組件和能量管理系統(tǒng)都要進行能源優(yōu)化。
數(shù)據中心LEED認證。數(shù)據中心LEED認證是2003年由美國綠色建筑委員會建立并推行的綠色建筑評估體系,是目前全球各類建筑環(huán)保評估、綠色建筑評估以及建筑可持續(xù)性評估標準中最具影響力的一個。其評估體系和技術框架由可持續(xù)建筑場址、水資源利用、建筑節(jié)能與大氣、資源與材料、室內空氣質量五大方面的若干指標構成。根據各方面指標對建筑進行打分,綜合評估建筑對環(huán)境的影響。按照綜合得分由高到低劃分為白金、金、銀、通過4個認證級別。LEED是自愿型標準,但從其發(fā)布以來,已被美國各州和其他國家廣泛采用。2012年起,LEED開始重視數(shù)據中心節(jié)能。LEED 2012開發(fā)了一套專門針對數(shù)據中心的節(jié)能指標和評級方法。參與LEED評級的數(shù)據中心需要滿足一個先決條件,即建筑和IT設備的總能耗分別進行評定。近年來,經過LEED認證的數(shù)據中心數(shù)量激增,F(xiàn)acebook、Apple、Internap等公司都已有獲得LEED認證的數(shù)據中心。
人工智能助力節(jié)能技術變革。美國將人工智能與數(shù)據中心結合的根本目的是提升效率、降低成本。人工智能在數(shù)據中心的應用主要有三方面:一是利用預測分析優(yōu)化工作負載分配。通過采用預測分析驅動的管理工具,IT團隊可以將其絕大部分工作負載分配給服務器。這些工具能夠實時優(yōu)化存儲和計算負載平衡,使IT專業(yè)人員能夠在更高和更低勞動密集級別上進行監(jiān)督運營;二是機器學習算法可幫助企業(yè)提高效率和降低能耗。通過人工智能,工作負載可以在服務器合理分布,以最大限度地提高生產力,并解決網絡擁塞問題;三是人工智能可緩解人員短缺情況。人工智能平臺自動執(zhí)行系統(tǒng)更新、安全補丁和文件備份等常規(guī)任務,同時將更細微、定性的任務留給IT人員。在沒有處理每個用戶請求或事件警報的負擔的情況下,IT專業(yè)人員只需承擔以前需要他們重點關注的任務的監(jiān)督角色,從而使他們有更多時間專注于更大的管理挑戰(zhàn)。
優(yōu)秀案例
(一)Google。
Google是一家美國的互聯(lián)網企業(yè),業(yè)務涵蓋互聯(lián)網搜索、云計算、數(shù)據挖掘等領域,開發(fā)并提供大量基于互聯(lián)網的產品與服務。Google在美洲、亞洲、歐洲擁有自建的數(shù)據中心數(shù)十座,還在全球各地還租用了20多個數(shù)據中心。從2007年開始,Google通過提升數(shù)據中心的運行效率,采用可再生能源、循環(huán)利用各種材料等種種舉措降低資源消耗。Goole在其網站上率先公布了他的PUE計量方法,它在全球的數(shù)據中心平均PUE低至1.11。
Google提升數(shù)據中心效率的方法主要包括可再生能源、循環(huán)利用各種材料等。一是采用自定義的服務器以提高效率。優(yōu)化電源架構,減少損耗,減少中間的轉換次數(shù)。取消外部連接器和顯卡,優(yōu)化風扇。二是堅持測量能源使用效率,優(yōu)化能源架構。從2007年開始,Google在網站上公布其數(shù)據中心的運行效率,不斷優(yōu)化測量方法,力求更準確的計量和更精細的管理。三是資源的回收和再利用。通過延長設備的生命周期,提高設備利用率使用本地供應商,降低運輸對環(huán)境的影響,減少購買新設備和新材料,盡可能的利用已有設施。最大限度對數(shù)據中心的材料進行回收利用。四是利用人工智能讓Google的數(shù)據中心制冷PUE改善了40%。Google的人工智能是通過數(shù)據中心內的數(shù)千個傳感器去收集溫度、電量、耗電率、設定值等各種數(shù)據,再對這些歷史數(shù)據做深度分析,調整運行模式和控制閥值,最終實現(xiàn)數(shù)據中心運行的最高效率。五是支持可再生能源電網驅動數(shù)據中心。即通過投資可再生能源發(fā)電,然后將綠色環(huán)保電能賣給電網,然后從電網購電支持數(shù)據中心的運行。
(二)IBM。
IBM是全球數(shù)據中心技術的領導者,擁有非常豐富的數(shù)據中心運營與管理經驗。為達到盡量減少數(shù)據中心的整體用電量、盡量增大數(shù)據中心整體用電中用于IT系統(tǒng)的比例、盡量減少用于非計算設備(電源轉換、冷卻等)的用電消耗的目標,IBM通常采用六大步驟來實現(xiàn):一是引入刀片式架構。使用刀片服務器來取代傳統(tǒng)的臺式或者機架式設備,有望達到20%~44%的能源節(jié)省。二是選擇節(jié)能服務器,使用那些采納了能源高效設計和部件的系統(tǒng)。要求系統(tǒng)供應商能夠提高單位能源消耗下的計算性能。根據廠商設備的不同,會有一定的差異,但總的來說,會達到25%~40%的節(jié)能效果。三是精確計算供電功率。使用用電管理軟件精確計算用電功率和智能化控制系統(tǒng)用電。四是采用虛擬化技術。通過虛擬化合并物理服務器提高服務器使用率,這個可以帶來20%~30%的能源節(jié)約。五是考慮水冷技術。采用風冷和水冷相結合的冷卻方案可以大大降低冷卻成本,大概可以節(jié)約40%~50%的能源。六是考慮改造機房,提高機房設施整體能源使用效率,這將會使得數(shù)據中心的節(jié)能效果有非常顯著的提高,也能夠使數(shù)據中心適應未來的需求。
啟示
強化數(shù)據中心節(jié)能研究。重視數(shù)據中心節(jié)能基礎研究工作。美國聯(lián)邦數(shù)據中心節(jié)能項目支持數(shù)據中心節(jié)能技術研發(fā)和示范、定期發(fā)布的數(shù)據中心節(jié)能技術指南、評價標準、評級工具,無一不需要大量的研究做支撐。對數(shù)據中心的能耗研究不僅有助于準確掌握美國數(shù)據中心的真實能耗和能效情況,也為進一步制定相關能效標準、評估工具和技術指南提供了重要依據。我國應特別對現(xiàn)有計量情況較好的數(shù)據中心開展調查研究,摸清能耗和能效水平,掌握其用能特點,為后續(xù)積累相關節(jié)能標準積累基礎數(shù)據。
整合提升低小散舊數(shù)據中心。整合提升低小散舊數(shù)據中心,通過淘汰一批生產率和能效水平低、功能單一、規(guī)模小、效益差、資源浪費嚴重的數(shù)據中心,騰出能耗指標,推動集約化建設。通過推動企業(yè)上云、政府購買云服務、開展數(shù)據中心績效評估等多種措施,加快淘汰一批規(guī)模小、效益差、資源浪費嚴重的低小散舊數(shù)據中心,力爭通過5~6年左右時間,將低小散舊數(shù)據中心數(shù)量下降50%。實施“騰換”并舉措施,推進集約化建設,實現(xiàn)數(shù)據中心的提質升級,節(jié)約社會資源成本。
建立數(shù)據中心能效評估體系。通過數(shù)據中心節(jié)能項目,美國建立了較完備的數(shù)據中心能效評估體系。數(shù)據中心的管理者可以通過應用這些工具方便地了解自己數(shù)據中心各方面的能效水平,明確差距和節(jié)能潛力,確定節(jié)能工作方向。由此可見,建立一套完備的數(shù)據中心能效評估體系非常必要。我國應該加快制定能耗等級、節(jié)能設計、節(jié)能運維等數(shù)據中心節(jié)能標準、規(guī)范和工具的研究工作,逐步形成完整的數(shù)據中心能效評估體系。
加強認證標準建設。建立一套完備的數(shù)據中心能效認證體系(包括相關標準、規(guī)范、工具等)非常必要。我國應加快數(shù)據中心節(jié)能相關標準、規(guī)范和工具的研究開發(fā)工作,逐步形成完整的數(shù)據中心能效評估體系,并盡早制定出科學合理、明確量化的節(jié)能目標,同時建立有效的管理和監(jiān)督機制,保障節(jié)能目標的落實。
推動人工智能技術的應用。借鑒美國經驗,從三方面推動人工智能在數(shù)據中心產業(yè)的應用。一是利用人工智能提高數(shù)據中心安全性。利用人工智能解決方案監(jiān)測惡意軟件和垃圾郵件,分析異常的活動模式,發(fā)現(xiàn)弱點并加強對潛在威脅的保護。二是優(yōu)化數(shù)據中心的性能。利用人工智能優(yōu)化服務器的配置和利用率,監(jiān)控負載分配,使基礎架構更具可擴展性,同時優(yōu)化冷卻和功耗方面的效率。三是利用人工智能提升數(shù)據中心的節(jié)能效率。用人工智能監(jiān)控和分析來預測各類用戶的活動,將不太常用的數(shù)據轉移到能耗較低的存儲源,并將頻繁使用的數(shù)據轉移到性能更好的存儲源,充分利用每臺服務器的潛力并關閉未使用容量,以此節(jié)約更多能源。