胡貴龍
中國移動通信集團江蘇有限公司
機房是信息處理、服務(wù)管理和通信聯(lián)網(wǎng)綜合的重要數(shù)據(jù)中心,伴隨當前大數(shù)據(jù)處理、物聯(lián)網(wǎng)技術(shù)和通信科技的高速發(fā)展,機房建設(shè)項目也日益增多。而機房的人工巡查、人工抄表等大量單純重復(fù)性的工作方法,并不是人機協(xié)同的良好工作方法。人工日常巡查等管理方法雖然解決了機房事故發(fā)生時間的錯報、漏報等諸多問題,但也引入了一些問題,比如巡查人手不足、數(shù)據(jù)處理準確度有限、工作環(huán)境惡劣、設(shè)備運行隱患難以靠肉眼發(fā)現(xiàn)、技術(shù)人員水平不足,以及人員責任心參差不齊等不利因素。網(wǎng)絡(luò)軟件診斷也面臨著測試范圍小、反應(yīng)速度慢和易影響正常工作等諸多問題。伴隨機房建筑越來越偏遠化和社會老齡化的發(fā)展趨勢,機房智能化管理與運維形成了共識。通過多傳感器融合技術(shù)、深度學(xué)習(xí)的日常巡檢管理運維機器人技術(shù)及其相應(yīng)科技的示范運用,助力傳統(tǒng)IDC運維服務(wù)向智慧無人化自主運維服務(wù)的發(fā)展,促進了智慧移動機器人技術(shù)與視覺認知科技的發(fā)展。如圖1所示。
圖1 數(shù)據(jù)中心智能云巡檢機器人
數(shù)據(jù)中心智能化運維管理系統(tǒng)的整體架構(gòu)設(shè)計,構(gòu)建了云-邊-端協(xié)同融合的能力體系,如圖2所示。邊端機器人巡檢提供高效穩(wěn)定的實體巡檢能力和識別能力,云端數(shù)據(jù)平臺提供高性能算力,并借助高性能算力提供開放式功能部署與可擴展能力構(gòu)建,實現(xiàn)機器人巡檢與上層云端能力結(jié)合,構(gòu)建高效尖端的數(shù)據(jù)中心智能化運維管理體系。
圖2 巡檢機器人系統(tǒng)架構(gòu)圖
數(shù)據(jù)中心智能化運維管理系統(tǒng)的整體架構(gòu)設(shè)計遵循云端能力和本地化執(zhí)行力相融合、巡檢和運維管理有機連接、軟件和硬件能力同步構(gòu)建的總體原則。
巡檢機器人系統(tǒng)在機器人側(cè)的運動和傳感能力,圍繞執(zhí)行單元、底層機械和運動平臺,并通過車規(guī)級執(zhí)行單元設(shè)計,保證對底層機械和運動結(jié)構(gòu)的高可靠性控制,實現(xiàn)上層應(yīng)用的運動指令,通過IROS操作系統(tǒng)的數(shù)據(jù)匯集,經(jīng)過軟/硬兩個高安全級別的獨有協(xié)議加密和驗證,最終輸出到機器人運動控制器和傳感器,實現(xiàn)線控級別的高精度運動。
在巡檢能力構(gòu)建方面,圍繞自動導(dǎo)航、傳感器數(shù)據(jù)采集、智能計算三個維度進行模塊化功能設(shè)計。通過SLAM高精度融合定位地圖、路徑規(guī)劃等智能算法,構(gòu)建上層導(dǎo)航能力;通過融合激光雷達、毫米波雷達、機器視覺,構(gòu)建機器人自動運動的實時自動駕駛功能;通過多攝像頭傳感器融合,對接操作系統(tǒng)上層開放式接口,將傳感器數(shù)據(jù)轉(zhuǎn)化為操作系統(tǒng)級別的參數(shù)數(shù)據(jù)。
計算平臺的整體架構(gòu),以IROS操作系統(tǒng)為智算底層,上層圍繞圖像識別、深度學(xué)習(xí)、多傳感器數(shù)據(jù)聯(lián)通融合等多方面能力,進行模塊化封裝,實現(xiàn)統(tǒng)一高性能的計算平臺。當數(shù)據(jù)中心化運維管理系統(tǒng)上層云端巡檢任務(wù)下達后,即會通過IROS操作系統(tǒng)及系統(tǒng)平臺中的任務(wù)執(zhí)行單元,分解成運動、導(dǎo)航、識別等多個動作分解,并傳達給巡檢能力中自動導(dǎo)航、傳感器數(shù)據(jù)采集、智能計算三個維度的模塊化功能模塊實現(xiàn)整體巡檢任務(wù)的執(zhí)行與反饋。
在系統(tǒng)架構(gòu)的上層,支持DCIM平臺接口數(shù)據(jù)聯(lián)動和大屏數(shù)據(jù)展示,支持與已有DCIM系統(tǒng)的聯(lián)調(diào)打通,現(xiàn)場提供的DCIM系統(tǒng)能通過開放式數(shù)據(jù)接口,讀取到智能化運維管理平臺的關(guān)鍵數(shù)據(jù)信息,實現(xiàn)數(shù)據(jù)聯(lián)動。開放大屏數(shù)據(jù)展示接口,支持在數(shù)據(jù)中心現(xiàn)有大屏中顯示機器人的實時巡檢狀態(tài)和對應(yīng)巡檢結(jié)果。
智能巡檢機器人是一款面向數(shù)據(jù)機房、配電室、供電線路以及通信線路等場景的云巡檢機器人,擁有指示燈精準識別、熱傳感檢測、自動讀數(shù)、氣體檢測、24小時巡檢、遠程管理等功能,能夠降低運維成本、提升能效,助力打造高效數(shù)據(jù)運維和管理體系。
智能巡檢機器人融合智能傳感器、大數(shù)據(jù)、機器學(xué)習(xí)、人工智能等多種先進技術(shù),實現(xiàn)對機房環(huán)境、設(shè)備、聲音、氣體、溫度等多維度數(shù)據(jù)實時感知監(jiān)控。通過大數(shù)據(jù)技術(shù)進行數(shù)據(jù)信息深度挖掘,并做出預(yù)測性計算分析和智能化告警,為精準決策提供科學(xué)依據(jù),將機房運維人員從繁瑣的工作中解放出來,提高整體運維效率,降低運維成本,為業(yè)務(wù)系統(tǒng)安全性可靠性保駕護航。
基于機器人的智能巡檢系統(tǒng),包含機器人本體及配套運維平臺系統(tǒng),以機房環(huán)境信息、物理設(shè)備信息、系統(tǒng)基礎(chǔ)配置項為基礎(chǔ),采用SLAM自主導(dǎo)航的方式,實現(xiàn)對機房設(shè)備的指示燈及其他設(shè)備狀態(tài)的故障巡檢,配置資產(chǎn)管理,為調(diào)度指揮提供更直觀的監(jiān)控應(yīng)用。
智能識別:豐富多樣的巡檢對象,能夠快速進行指示燈、表計、開關(guān)、溫濕度、氣體、噪聲等巡檢對象的檢測。
環(huán)境檢測警:對于危險氣體、環(huán)境異常等進行識別,安全隱患一經(jīng)識別,實時自動進行異常預(yù)警;配套全向麥克風(fēng)陣列和視頻,實現(xiàn)遠程全方位對講和交互。
大數(shù)據(jù)分析:整合多元異構(gòu)數(shù)據(jù),實時提取進行預(yù)判和分析,并進行橫向縱向多維度分析。
全面巡檢:實現(xiàn)AI識別、紅外測溫、資產(chǎn)管理等巡檢功能,可實現(xiàn)7×24小時不間斷巡檢。通過地圖全覆蓋與攝像頭高清巡檢,保障巡檢效果與準確率。
智能管理:自主規(guī)劃巡檢路線,并可實現(xiàn)自由導(dǎo)航和固定路徑切換,在機房管理方面可實現(xiàn)資產(chǎn)管理、隨工管理、門禁管理、人員管理與防尾隨跟蹤等,強化管理效果。
數(shù)據(jù)協(xié)同:配套巡檢管理平臺,實現(xiàn)多機器人實時監(jiān)控、多機調(diào)度、任務(wù)管理和報表生成。連通巡檢機器人系統(tǒng)與其他監(jiān)控系統(tǒng),形成一體化運維管理體系,實現(xiàn)數(shù)據(jù)的全面協(xié)同。
智能巡檢機器人可以實現(xiàn)機房智能的數(shù)據(jù)匯集,智能分析告警等自動化運維功能,以協(xié)助機房巡檢工作正常進行,提高系統(tǒng)隱患的發(fā)現(xiàn)率,降低系統(tǒng)故障率。如圖3所示。
圖3 機器人AI智能監(jiān)測能力
采用人工智能、微服務(wù)、容器、自動導(dǎo)航等關(guān)鍵技術(shù),基于5G/Wi-Fi網(wǎng)絡(luò),構(gòu)建云-邊-端高度協(xié)同的AI自動化運維能力,對外提供及時、高效、全面的AI自動化運維服務(wù),實現(xiàn)機房運維的減員、提質(zhì)、增效。
對于機房運維,建議通過如下方面實現(xiàn)智能化運維工作的優(yōu)化。
(1)AI智能導(dǎo)航
基于機器人等智能體的自動巡檢系統(tǒng)具備在機房環(huán)境中導(dǎo)航定位能力,并實現(xiàn)全天候的自主移動巡檢,從而支持無人化、全天候的設(shè)備巡檢和故障報警,降低巡檢工作和運維工作的成本投入,同時設(shè)備管理維護更加便捷,提高工作效率。具備自主移動,自主定位導(dǎo)航,自主充電等基本移動化檢測能力。
(2)指示燈識別
通過高清攝像頭及自身機器識別算法,對機房日常巡檢指示燈進行識別,可進行設(shè)備電源指示燈識別模型訓(xùn)練、設(shè)備柜面板告警燈識別模型訓(xùn)練、空調(diào)故障指示燈識別模型訓(xùn)練、服務(wù)器故障指示燈識別模型訓(xùn)練,并在識別到指示燈報警信息時進行后臺預(yù)警,并能對指示燈報警信息進行推送。
(3)溫濕度監(jiān)測
在巡檢過程當中,溫濕度監(jiān)測功能不間斷地收集帶有房間信息、坐標點位信息、溫度、濕度的數(shù)據(jù),并將采集到的溫濕度數(shù)據(jù)實時上傳到后臺服務(wù)器進行云端存儲記錄,同時在客戶端平臺展現(xiàn)相關(guān)數(shù)據(jù)。
(4)空氣潔凈度監(jiān)測
空氣潔凈度監(jiān)測功能通過傳感器對機房潔凈度進行監(jiān)測,實時將采集到的空氣潔凈度數(shù)據(jù)上傳到后臺服務(wù)器進行云端存儲記錄,并在客戶端平臺展現(xiàn)相關(guān)數(shù)據(jù)。
(5)噪聲監(jiān)測
噪聲監(jiān)測功能可對特定位置或特定場景的環(huán)境聲音進行采集并自主判斷音量分貝,當音量超過閾值能及時預(yù)警后臺,并能對噪聲報警信息進行推送。
(6)紅外測溫
通過紅外測溫裝置對各類設(shè)備進行拍照,判斷對應(yīng)溫度,當設(shè)備溫度超過閾值能及時預(yù)警后臺,并能對高溫報警信息進行推送,方便工作人員實時查看設(shè)備溫度狀態(tài)。
(7)顯示屏識別
通過高清攝像頭及自身識別算法,對空調(diào)、列頭柜等設(shè)備的顯示屏信息進行識別,讀取空調(diào)的溫濕度信息、列頭柜的電壓、電流信息等,可在識別到顯示屏報警信息時進行后臺預(yù)警,并對顯示屏報警信息進行推送。
(8)表針識別
通過高清攝像頭及自身識別算法,對表計信息進行識別,可進行表計讀數(shù)識別模型訓(xùn)練,在識別到表計讀數(shù)信息時進行后臺預(yù)警,并對表計識別報警信息進行推送。
(9)機柜門開關(guān)狀態(tài)識別功能
通過自身搭載的高清攝像頭對機柜開關(guān)門狀態(tài)進行識別,可進行機柜開關(guān)門狀態(tài)、機柜門鎖頭落位狀態(tài)識別模型訓(xùn)練,當開關(guān)門狀態(tài)出現(xiàn)異常結(jié)果及時預(yù)警后臺,并對開關(guān)門狀態(tài)異常信息進行推送。
(10)語音報警
機器人可實現(xiàn)語音提示軟硬件聯(lián)調(diào),播報自檢及自診斷的異常項播報、巡檢過程中的告警信息播報、機器人遇到緊急狀況的播報(如急停、碰撞、跌落等)。
基于自動化運維管理后臺系統(tǒng),如圖4所示,能實現(xiàn)對機房巡檢機器人及巡檢數(shù)據(jù)的管理分析,實現(xiàn)實時的自動化巡檢任務(wù)計劃管理、任務(wù)管理、任務(wù)告警管理、隨工管理、遠程遙控等管理功能,實現(xiàn)機房動態(tài)數(shù)據(jù)的智慧納管。
圖4 系統(tǒng)后臺界面
(1)巡檢任務(wù)管理
機器人后臺系統(tǒng)能對機器人進行任務(wù)管理,主要支持新建巡檢任務(wù)、任務(wù)調(diào)度管理。同時,用戶通過管理后臺可實時監(jiān)控、遠程控制機器人、查看巡檢任務(wù)數(shù)據(jù),對巡檢任務(wù)進行分級管理。每巡檢完成一次,系統(tǒng)可以自動生成巡檢報告。
(2)隨工管理
隨工首先對各類運維人員進行鑒權(quán),然后在其運維過程中進行全程跟隨及視頻錄制。通過后臺可實現(xiàn)隨工運維過程的全面查看。
(3)資產(chǎn)管理
機器人能以二維碼、RFID標簽技術(shù)定位IT設(shè)備的物理位置,通過視覺檢測技術(shù)和RFID技術(shù)獲取設(shè)備資產(chǎn)信息并實時上報后臺管理系統(tǒng)。后臺管理系統(tǒng)可對接資產(chǎn)管理平臺,實現(xiàn)實時監(jiān)測并更新資產(chǎn)狀態(tài)。
(4)人員管理
自動化巡檢機器人可以通過導(dǎo)入人員信息、錄入人員信息以及對接訪客系統(tǒng),實現(xiàn)人臉基礎(chǔ)數(shù)據(jù)的錄入。后臺接口將人員授權(quán)的信息直接下發(fā)到機器人的本體人臉權(quán)限數(shù)據(jù)庫。對于進入機房的人員權(quán)限的設(shè)定,機器人系統(tǒng)實現(xiàn)自動人臉識別功能。
(5)門控管理
能與配套的門禁系統(tǒng)聯(lián)動,使巡檢機器人能夠控制配套系統(tǒng)以順利進入各個待巡檢區(qū)域。
(6)后臺管理
視頻采集:系統(tǒng)能實現(xiàn)采集、存儲機器人傳輸?shù)膶崟r可見光視頻。
自動報告:每巡檢完成一次,機器人可以自動生成巡檢報告。支持定制報告模板,并支持模板定制。
多臺機器人協(xié)調(diào)管理:平臺可實現(xiàn)管理調(diào)度多臺機器人,實現(xiàn)機器人智能調(diào)度、路徑規(guī)劃和協(xié)同工作運行。
報表管理:支持報表管理、報表訂閱、報表查詢、報表自定義、事件日志報表、極值報表等。
報警事件管理:報警事件的統(tǒng)一設(shè)定與管理,內(nèi)容包括:事故類型、事故發(fā)生時間、事件等級分類、報警閥值、報警方式設(shè)定、報警事件分組、事件目錄定義、報警級別提升及事件日志管理等。
巡檢視頻管理:支持視頻的播放、停止、抓圖、錄像、全屏顯示等功能。
數(shù)據(jù)存儲:巡檢機器人的應(yīng)用數(shù)據(jù)主要有三類:應(yīng)用程序、巡檢數(shù)據(jù)、視頻數(shù)。系統(tǒng)應(yīng)可對敏感數(shù)據(jù)進行加密或CRC校驗;可實現(xiàn)備份管理,具備自動備份機制;具備雙機容錯功能,保證系統(tǒng)數(shù)據(jù)和服務(wù)的在線性。
(7)系統(tǒng)接口
后臺管理系統(tǒng)支持與數(shù)據(jù)中心的運維系統(tǒng)、綜合監(jiān)控系統(tǒng)進行互聯(lián)互通,形成一體化運維管理體系。通過北向接口對接,完成巡檢機器人狀態(tài)查看、任務(wù)下發(fā)、巡檢數(shù)據(jù)自動回寫、巡檢異常自動轉(zhuǎn)工單、巡檢結(jié)果異常自動判定等功能。
目前,巡檢運維機器人技術(shù)已經(jīng)在眾多的應(yīng)用領(lǐng)域中都有了廣泛運用,尤其國家電網(wǎng)公司一直是日常巡查管理自動化機器人中最大和最早期的使用者。而除了變電所、高壓線路等國家電網(wǎng)使用場景,使用面更廣泛的智能機房運維機器人技術(shù)也有著巨大的行業(yè)市場和使用前景。
數(shù)據(jù)中心的智慧巡檢機器人設(shè)備采用當前高速發(fā)展的新一代信息技術(shù),融入完善的圖像識別技術(shù)、多感應(yīng)器和無線通信技術(shù)等,對數(shù)據(jù)中心設(shè)備工作狀況實現(xiàn)采集和預(yù)處理,并采集機房的氣溫、濕度、清潔度、空氣流速等環(huán)境數(shù)據(jù),實現(xiàn)對機房健康狀況的綜合分析,為數(shù)據(jù)平臺的運營維護管理提供了準確高效的大數(shù)據(jù)分析,實現(xiàn)無人值守的智能機房。如圖5所示。
圖5 智能機器人巡檢現(xiàn)場畫面
機房與智慧運維服務(wù)機器人之間確實是一個相互垂直的細分產(chǎn)業(yè)行業(yè)市場,不過其體量并不是人們想像的那樣小。以北京一家機房為例,如果要實現(xiàn)二十四小時都有人的工作狀態(tài),最少要五個人,或者五班三倒。根據(jù)2020年的數(shù)據(jù)表明,中國國家電網(wǎng)公司一共有七百多個建筑面積在100~500平方米的機房,最少需要的工作人員數(shù)量為三千人,人力資源成本非常高。相比之下,用智能機器人取代人力實施巡查,一個100~500平方米機房僅需一臺高配兩臺低配智能機器人,400~1000平方米的機房則需兩臺高配和兩臺低配智能機器人,即可做到二十四小時實時巡查。而隨著電力網(wǎng)絡(luò)的發(fā)展和能源數(shù)據(jù)的進一步增多,機房運維機器人的市場發(fā)展容量也會隨之擴大。
智能巡檢自動化機器人的使用大大提高了機房安全巡檢維修作業(yè)的效能與準確度,本文通過對機房安全智能巡檢自動化機器人技術(shù)和技術(shù)體系的研發(fā),有效解決了目前對機房安全無人化、智能巡檢運維管理工作的需要,有效克服了機房人工巡檢業(yè)務(wù)工作效率低、成本費用高的實際問題,在數(shù)據(jù)中心實現(xiàn)了自動化運維、人機協(xié)同運維、云邊端結(jié)合大數(shù)據(jù)融合,為建設(shè)數(shù)據(jù)中心自動化運維管理能力提供有力支撐,促進新基建大背景下數(shù)據(jù)中心運維快速轉(zhuǎn)型,大幅度提高了機房安全巡檢運維工作的工作效率與自動化、智能管理水平。利用移動機器人、多模式認知、機器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù)手段,將極大地推動機房管理巡檢運維智能化的產(chǎn)業(yè)提升。
通過構(gòu)建智能化運維管理系統(tǒng)的整體架構(gòu),確保以數(shù)據(jù)中心為代表的信息系統(tǒng)運行的核心節(jié)點的安全穩(wěn)定,落實持續(xù)健康的運行環(huán)境。數(shù)據(jù)中心作為資產(chǎn)密集場所,通過智能巡檢自動化機器人的使用,使得運維人員自動高效地掌握機房內(nèi)部環(huán)境、基礎(chǔ)設(shè)施、網(wǎng)絡(luò)、計算和存儲單元等運行狀態(tài),從而保證對外提供數(shù)據(jù)服務(wù)的數(shù)據(jù)中心管理基本目標。
智能巡檢自動化機器人技術(shù)有廣泛的應(yīng)用場景,經(jīng)過設(shè)計的機器人融合了數(shù)據(jù)中心管理流程,巡檢機器人能夠通過傳感器獲取巡檢對象的狀態(tài)信息以及環(huán)境信息,檢測出人工難以發(fā)現(xiàn)的線路發(fā)熱、機器異響等故障,實現(xiàn)大范圍、無死角的智能巡檢,為下一代數(shù)據(jù)中心高效運營維護工作的穩(wěn)定性和實時性提供保證。