John Edwards 陳琳華
人工智能和機器學習正在逐步接管日常的例行任務和高級任務。管理員和員工會因此而失業(yè)嗎?
大多數(shù)IT領導者都認為自己完全掌握了數(shù)據(jù)中心的管理、運營和規(guī)劃,但實際上他們并沒有。
任何IT領導者或IT專家團隊都無法對基本的數(shù)據(jù)中心任務進行逐秒(甚至更為精細的)控制。人類,即使是受過高等教育和訓練的專業(yè)人員在未來規(guī)劃和其他重要職責任方面也會受到個人偏好、偏見和誤解的影響。
人工智能就沒有這些缺點。這就是為什么即使數(shù)據(jù)中心運營商面臨著混合環(huán)境、物聯(lián)網(wǎng)和其他挑戰(zhàn),仍要考慮人工智能對一系列關鍵數(shù)據(jù)中心運營和服務產(chǎn)生的影響。
以下七件事情是每位IT領導人都需要知道的,這些事情事關人工智能如何將數(shù)據(jù)中心變得更為強大,更為高效。
1.不同類型的數(shù)據(jù)中心都可以從人工智能受益
曾擔任紐約市法律部門首席信息官,現(xiàn)任企業(yè)備份與災難恢復技術提供商Cloud Daddy首席執(zhí)行官的Joe Merces指出,任何類型的數(shù)據(jù)中心都可以從人工智能中受益,但是受益最多的通常是大型設施,如大型企業(yè)數(shù)據(jù)中心、公有云數(shù)據(jù)中心、主機代管數(shù)據(jù)中心和外包數(shù)據(jù)中心。
IEEE研究員兼數(shù)據(jù)存儲分析公司Coughlin Associates總裁的Tom Coughlin認為,任何數(shù)據(jù)中心都可以利用如機器學習等人工智能方法來更好地管理內(nèi)部資源,對未來的硬件和數(shù)據(jù)要求進行預測。他指出,“人工智能正在成為最重要的數(shù)據(jù)中心應用程序之一?!?/p>
數(shù)據(jù)中心維護服務提供商Park Place科技的創(chuàng)新主管Paul Mercina解釋道,機器學習正在從基本模式識別和傳統(tǒng)算法轉變?yōu)楦鼜碗s的深度學習領域。“機器學習的一個關鍵貢獻是它們能夠使用迭代方法發(fā)現(xiàn)數(shù)據(jù)中的結構,無需人類從任何理論或假設開始進行測試?!鄙疃葘W習使用了多層人工神經(jīng)網(wǎng)絡,在對象檢測、分類、語音識別、語言翻譯等任務中能夠提供更高的準確性。
2.人工智能可幫助提升數(shù)據(jù)中心能效
在過去幾年當中,人工智能工具在降低數(shù)據(jù)中心能耗和減少浪費方面發(fā)揮著越來越重要的作用?!斑@些應用程序有助于降低功耗,對低下的冷卻效率進行報告并分析關鍵任務系統(tǒng)的健康狀況,以提高效率、節(jié)約能源,”Mercina指出。
荷蘭數(shù)據(jù)中心協(xié)會常務董事Stijn Grove說:“數(shù)據(jù)中心是一個不斷變化的環(huán)境。” 他表示,通過人工智能分析和監(jiān)測當前的室內(nèi)外溫度并對近期天氣進行預測,可幫助數(shù)據(jù)中心優(yōu)化冷卻資源從而達到節(jié)約能源的目的。
服務器是所有數(shù)據(jù)中心中最耗能的地方。Grove指出,“當你具備了在需要時自動擴展或降低云服務器規(guī)模的能力,那么充分發(fā)揮每臺服務器潛力并關閉未使用的容量,你就會節(jié)約大量的能源?!?/p>
人工智能還可以顯著降低存儲的能耗。通過使用人工智能監(jiān)控和分析預測各類用戶活動,數(shù)據(jù)中心可以快速地將較少使用的數(shù)據(jù)轉移到低能耗的存儲資源上,將頻繁使用的數(shù)據(jù)轉移到更高性能的存儲。“此外,人工智能還可以最大限度地在處理過程中減少數(shù)據(jù)的來回移動,”Coughlin說?!皵?shù)據(jù)智能存放可以讓使用中的數(shù)據(jù)更靠近處理數(shù)據(jù)的地方,通過減少數(shù)據(jù)移動來降低能耗?!?/p>
3.人工智能可提高數(shù)據(jù)中心的安全性
數(shù)據(jù)中心的安全需求正在迅速發(fā)展。一直以來,數(shù)據(jù)中心面臨的最大威脅主要是來自內(nèi)部員工或相對原始的外部暴力攻擊??▋?nèi)基梅隆大學泰珀商學院商業(yè)技術副教授Param Vir Singh表示,“如今,黑客也在構建基于人工智能的算法,這些算法正試圖找到數(shù)據(jù)中心的弱點。人工智能則是應對這一挑戰(zhàn)的最佳技術。”
Mercina表示:“人工智能應用程序使得數(shù)據(jù)中心能夠更快地適應不斷變化的安全要求,同時為用戶提供更為安全的環(huán)境,并且無需強制執(zhí)行嚴苛的規(guī)定。人工智能解決方案還可以幫助檢測惡意軟件和垃圾郵件,分析正常和異常的活動模式,識別弱點并加強對潛在威脅的防護?!?/p>
Coughlin稱,人工智能能夠將惡意入侵行為引誘至“蜜罐”當中,在那里對它們進行密切監(jiān)控,甚至追蹤入侵者。
4. 人工智能可以優(yōu)化數(shù)據(jù)中心的性能
通過不斷監(jiān)控和調整資源(包括處理、網(wǎng)絡和內(nèi)存等),人工智能可讓企業(yè)以最高的效率運行數(shù)據(jù)中心?!叭斯ぶ悄芸捎糜诒O(jiān)控工作負載分配,使基礎設施更具可擴展性,同時提升冷卻和能耗效率,”Merces說。人工智能還可用于優(yōu)化服務器配置和利用率?!袄纾斯ぶ悄芸赏ㄟ^移動工作負載并通過軟重啟、硬重啟和重新制作鏡像等方法識別和修復基礎設施中存在的問題。”
Coughlin也認為,人工智能在優(yōu)化服務器使用方面具有獨特的優(yōu)勢。他說:“這包括將相應的處理流程交給到針對特定應用程序的處理器,例如GPU和TPU。” 人工智能還可以優(yōu)化數(shù)據(jù)中心軟件性能。“例如,限制數(shù)據(jù)庫中相同數(shù)據(jù)的輪詢或限制重復過程,”Grove補充道。
5.人工智能可改善基礎設施管理
據(jù)Ponemon Institute的研究顯示,2016年各行業(yè)數(shù)據(jù)中心宕機時間的平均成本約為每分鐘8850美元。“如果我們能夠在維護性問題發(fā)生前預測到它們,那么我們就可以采取預防措施,”Singh說。
通過不斷改進的基礎設施管理技術和智能傳感器,神經(jīng)網(wǎng)絡可被訓練用于分析當前基礎設施的需求和容量,以便利用最適合的設備來滿足這些需求。專攻商業(yè)法和企業(yè)法的Tuck Northman律師事務所合伙人Tuck Northman稱:“人工智能可以處理比人類或人類團隊更多的信息,幾乎是實時處理,并且以人工智能為導向的系統(tǒng)更加有效、更加可靠?!?同時,他還指出傳感器還可以幫助數(shù)據(jù)中心管理員預測或減輕災難性故障。
Mercina說,大多數(shù)數(shù)據(jù)中心如今都由訓練有素的人員進行管理、監(jiān)控和運維,他們的日常任務包括巡查數(shù)據(jù)中心、查找表示硬件發(fā)生故障的指示燈等?!巴ㄟ^消除無謂的猜測和讓整個生態(tài)系統(tǒng)具備主動性,人工智能和機器學習能夠徹底改變目前這種過時的范式?!?/p>
人工智能有望對數(shù)據(jù)中心安排日常維護任務的方式產(chǎn)生重大影響。通過仔細審查所有相關的數(shù)據(jù)中心資源,人工智能很快就能夠預測出特定設施何時需要服務、升級和更換。因此,定期維護計劃將逐漸會被人工智能生成的建議所取代。Grove認為 “這將改善正常運行時間并降低成本?!?/p>
6.人工智能正在成為強大的數(shù)據(jù)中心規(guī)劃工具
規(guī)劃是最令人感興趣的人工智能數(shù)據(jù)中心應用之一。通過從數(shù)據(jù)中心傳感器中獲取大量信息和利用從以往情境中進行學習的能力,人工智能可以提供精細的預測,更重要的是,它們可以對修改過的設想中存在的差異進行建模。Northman說:“系統(tǒng)部署時間越長,獲得的信息就越多,預測的結果也就越準確?!?/p>
“目前這種情況正在發(fā)生。”例如,將人工智能用于規(guī)劃和配置電力資源,預測冷卻需求。他表示:“它們還被用在了規(guī)劃和管理網(wǎng)絡和帶寬的利用率和優(yōu)化工作上?!?/p>
7.人工智能將管理越來越多的數(shù)據(jù)中心任務
Grove指出,人工智能幾乎可以完全管理目前由人類管理的數(shù)據(jù)中心任務?!皵?shù)字生態(tài)系統(tǒng)需要更多的即時控制和操作,這些只能通過人工智能和機器學習來實現(xiàn)。此外,隨著邊緣計算的出現(xiàn),為了能夠管理眾多的無人站點,我們也需要人工智能來完成這些工作。”
實現(xiàn)一個能夠監(jiān)控、診斷和自我修復的完全自動化數(shù)據(jù)中心是人們一直追求的目標。大數(shù)據(jù)分析公司Guavus的首席科學家Roger Brooks說:“這需要人工智能、機器人甚至是增強現(xiàn)實技術,讓機器之間能夠互相照顧?!?/p>
然而,至少從人類的角度來看,人工智能目前仍然無法可靠地執(zhí)行高級推理和決策任務。不過,Merces預測說,“隨著所有工作都進入了人工智能時代,它們將被劃分為特定的功能,雖然這些功能將變得極為高效,但是它們終究不會獲得智慧?!?/p>
對于這一觀點,Northman 表示同意?!半m然管理人員會越來越依賴人工智能來操作和管理數(shù)據(jù)中心,但是這些流程并非完全不需要人類參與。管理者在一些特定中心的作用將會降低……但是人類還會作為一個防故障要素繼續(xù)存在于各個環(huán)節(jié)當中?!?/p>