王彧 尹之伊
浙江威奇電氣有限公司 浙江 海寧 314400
數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展情況,深入剖析數(shù)據(jù)中心預制化、智能化、能源儲存和能源再利用等熱點技術的優(yōu)劣勢、發(fā)展現(xiàn)狀、應用前景以及存在的問題和需要關注的重點方向,總結(jié)數(shù)據(jù)中心基礎設施技術發(fā)展趨勢,為數(shù)據(jù)中心從業(yè)者研究、應用相關技術提供參考。
數(shù)據(jù)中心作為海量數(shù)據(jù)存儲、計算和匯聚的中心,除了綠色化、模塊化等特點外,在新基建浪潮下呈現(xiàn)出如下新的變化特點:一是體系一體化。加強國家大數(shù)據(jù)中心一體化建設是實施網(wǎng)絡強國戰(zhàn)略的重要實踐之一。全國一體化數(shù)據(jù)中心建設,將通過數(shù)據(jù)中心與云計算資源的分級互聯(lián),以技術、業(yè)務和數(shù)據(jù)等三個融合,支撐政企、行業(yè)、區(qū)域、業(yè)務的協(xié)同管理和服務,實現(xiàn)政府決策科學化、社會治理精準化和公共服務高效化。二是運維智能化。隨著云計算、人工智能等新技術的普及,數(shù)據(jù)量級飛速上漲,數(shù)據(jù)中心規(guī)模不斷擴張,設備數(shù)量呈倍數(shù)增長。因此,統(tǒng)一管理海量設備,提高運維效率,成為大數(shù)據(jù)中心亟待解決的問題。基于人工智能和大數(shù)據(jù)技術的智能運維將部分取代人力的重復煩瑣勞動,監(jiān)控和管理潛在的安全問題,變被動人工運維為主動智能運維。三是部署邊緣化。我國移動網(wǎng)絡通信技術的迅猛發(fā)展,迫切需要VR/AR、自動駕駛等業(yè)務場景低時延、多連接,集中式計算處理因遇到難解的瓶頸而難以滿足上述業(yè)務需求。邊緣數(shù)據(jù)中心可提供存儲、計算、網(wǎng)絡等資源,更好地支撐低時延等業(yè)務場景,因而將成為有效解決方式。
信息化管理指的是相關單位應用計算機技術在大數(shù)據(jù)時代,保證有效的規(guī)范自身行為。計算機網(wǎng)絡技術能夠管理外部信息,收集相關單位內(nèi)部信息。由此可知,信息化管理在相關單位中起著重要的作用。第一,可以提高相關單位查找信息的效率,加強核心競爭力??茖W技術快速發(fā)展,相關單位在大數(shù)據(jù)時代若想通過計算機網(wǎng)絡技術構建優(yōu)質(zhì)的管理系統(tǒng),則需要相關單位收集自身相關的指標,通過有效整合獲取信息資料。相關領導人員可根據(jù)核心資料內(nèi)容掌握單位人力資源管理的狀況,有效規(guī)劃相關工作內(nèi)容,保證工作人員開展工作更加順利,同時也能夠?qū)臄?shù)據(jù)資料作為相關單位發(fā)展的依據(jù);第二,計算機技術能夠使信息化管理打破時間、地域等因素的約束。相關單位應用計算機網(wǎng)絡技術能加速收集、整理核心技術的效率,此種操作可以使相關單位提高管理效率,推動相關單位發(fā)展。計算機網(wǎng)絡技術能夠打破管理的時間束縛和空間束縛,工作人員在管理過程中,通過網(wǎng)絡便能夠查詢、收集資料,從而實現(xiàn)有效的控制管理。此種情況也便于管理人員在網(wǎng)站及時找到信息資料,做出相關決策。在某種程度上,單位只有緊抓機遇,才能夠加強核心競爭力,提升經(jīng)濟效益;第三,計算機網(wǎng)絡技術應用在信息化管理中能夠有效整合,提高相關單位經(jīng)濟效益。為讓單位獲取最大化效益,相關單位需要有效的整合外部和內(nèi)部的信息資料,在大數(shù)據(jù)時代,單位需要具備處理數(shù)據(jù)的能力,構建信息化管理體制,加強處理數(shù)據(jù)的能力。應用計算機網(wǎng)絡技術,大批量處理數(shù)據(jù)信息,從而獲取有效信息,推動單位發(fā)展[1]。
大數(shù)據(jù)背景下數(shù)據(jù)質(zhì)量管理存在的問題大數(shù)據(jù)背景下的數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)大不一樣,給數(shù)據(jù)質(zhì)量管理帶來了如下困難。①大數(shù)據(jù)種類繁多決定了數(shù)據(jù)來源具有復雜性。數(shù)據(jù)源之間因結(jié)構不一、來源多樣、眾多不同,出現(xiàn)了不一致、沖突或自相矛盾的情況。在收集數(shù)據(jù)時應盡量保證數(shù)據(jù)質(zhì)量的可靠性和數(shù)據(jù)定義的完整性。②大數(shù)據(jù)由于容量大,在獲取、存儲、計算和傳輸過程中會產(chǎn)生許多錯誤。由于速度極快,大量的數(shù)據(jù)更新會迅速產(chǎn)生過時的數(shù)據(jù),不一樣的數(shù)據(jù)也極易產(chǎn)生。目前僅靠傳統(tǒng)的、簡單的程序匹配處理和人工數(shù)據(jù)錯誤檢測、修復,根本不能處理大數(shù)據(jù)下的數(shù)據(jù)錯誤問題。③由于門類眾多、規(guī)模龐大,發(fā)展迅速,各類數(shù)據(jù)的標準不完善,使其可能產(chǎn)生沖突或不一致。另外,數(shù)據(jù)的收集和集成通常由不同的團隊合作完成,這也增加了處理數(shù)據(jù)時產(chǎn)生錯誤數(shù)據(jù)的概率。④在進行數(shù)據(jù)的質(zhì)量管理工作時,由于大數(shù)據(jù)自身的特點,為確定其時間、空間的復雜程度,需采用線性和亞線性算法,并結(jié)合并行算法才能提高運算效率,得到最好的管理算法,這樣計算的難度大有提高[2]。
大數(shù)據(jù)平臺的出現(xiàn),不僅會給整體經(jīng)濟發(fā)展帶來積極價值,同時也會帶來諸多挑戰(zhàn)。然而,很多數(shù)據(jù)中心的運維管理工作必須隨著時代的變化而不斷創(chuàng)新。根據(jù)目前數(shù)據(jù)中心建設和運營中心建設的階段,一定要從解決信息問題的角度出發(fā),運維團隊管理者應該有多種方法進行自我優(yōu)化和管理。在現(xiàn)代技術維護方面,通過實施整改使之徹底改變,才能不斷有效地提高運維管理效率。例如通過智能電力傳輸,控制好國內(nèi)大型電網(wǎng)平臺的運行,讓多主體軟件系統(tǒng)的運行聯(lián)合,電力企業(yè)主要有兩種合作方式:一種是交叉合作,另一種是平行正式合作,通過代理商之間的溝通與合作,可以很好地實現(xiàn)代理商與代理商之間的信息共享。另外,多智能新系統(tǒng)可以實現(xiàn)智能電源網(wǎng)絡中各種相關信息的全面、深入分析。利用智能數(shù)據(jù)里的縱向和橫向關系合作,達到同級代理商共享數(shù)據(jù)資源的結(jié)果。最后,電力企業(yè)可以利用智能輸電的方法全面掌握所有用戶的用電情況,而電力用戶也可以利用供電網(wǎng)絡的智能化應用系統(tǒng),自己獨立查詢供電問題,全面了解電價價格、能源公司供電方式的綜合能力等信息,進一步保護了終端客戶的合法用電利益。
一是提升數(shù)據(jù)安全風險監(jiān)測技術能力。充分利用數(shù)據(jù)中心強大的資源共享和運算能力,形成風險監(jiān)測預警機制,反映數(shù)據(jù)中心數(shù)據(jù)安全現(xiàn)狀與風險趨勢等態(tài)勢情況,明確數(shù)據(jù)安全風險防控著力點。二是提高數(shù)據(jù)安全風險防范能力和意識。加強數(shù)據(jù)安全風險防范,關鍵在人才,基礎在教育。目前我國數(shù)據(jù)管理、開發(fā)和運維人才極為短缺,難以滿足數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展需求。一方面,完善數(shù)據(jù)安全專業(yè)人才培養(yǎng)機制,依托高校、科研院所等機構開展數(shù)據(jù)安全相關研究項目和教育培訓,提升數(shù)據(jù)安全重要性;另一方面,加強國民通識教育,讓數(shù)據(jù)安全教育深入全民,培育公民數(shù)據(jù)安全意識。
主要通過各種管理協(xié)議和管理接口適配,實現(xiàn)各類管理對象的管理信息采集和運行狀態(tài)感知,收集高質(zhì)量、可信和準確及時的信息,提供對上層運維服務的支撐,保障業(yè)務流程的有效運行,所管理的對象包括:網(wǎng)絡、服務器、存儲、安全、機房動力環(huán)境及應用服務系統(tǒng)等。傳統(tǒng)的配電監(jiān)控系統(tǒng)一般用于監(jiān)控高低壓配電設備、變壓器及電容器等運行狀態(tài),允許通過遠程的方式遙控開關、變壓器檔位,對保護故障進行復歸。因?qū)Π踩㈨憫氨C芤蟾?,配電監(jiān)控系統(tǒng)使用專用協(xié)議,配置單獨的管理型工業(yè)以太網(wǎng)交換機,網(wǎng)絡也需要物理隔離。超大型數(shù)據(jù)中心的配電監(jiān)控可在負荷搬運、一鍵處理等自動化方面進行拓展。具備負載投退通過調(diào)整開關動作順序減少負載對電源側(cè)的沖擊;外市電停電時根據(jù)業(yè)務負載功率啟動與之匹配的柴油發(fā)電機組數(shù)量,縮短故障應急時間;針對不同事件場景,通過預先設計的程序,實現(xiàn)一鍵處理等功能[3]。
經(jīng)過存儲、評估、預處理和清洗后的數(shù)據(jù)達到了有關技術標準的相對質(zhì)量要求,我們稱之為合格數(shù)據(jù),但是難以僅靠上述有關方法就能獲得非常理想的數(shù)據(jù)。隨著時間的推移,許多數(shù)據(jù)一直在變化,需要對此進行反復修改。所以將處理后的數(shù)據(jù)更換到標準庫中,同時需要反復循環(huán)處理這些數(shù)據(jù),這樣得到的結(jié)果才更有效、可靠。①更新合格數(shù)據(jù)。大數(shù)據(jù)背景下,大量的數(shù)據(jù)通過有效處理變?yōu)楹细駭?shù)據(jù),然后根據(jù)優(yōu)先級上傳到數(shù)據(jù)庫中。然而,由于數(shù)據(jù)時效性的原因,大部分的數(shù)據(jù)永遠達不到絕對合格。因此要不斷進行優(yōu)化更新,對大數(shù)據(jù)進行循環(huán)質(zhì)量管理,才能保證其正確可靠。②數(shù)據(jù)監(jiān)控反饋。一般情況下,會存在多組數(shù)據(jù)描述同一事物的屬性,因此需要數(shù)據(jù)監(jiān)控并做相關的分析,根據(jù)監(jiān)控反饋計算,推斷出數(shù)據(jù)的可信度,以找出可信度高、時效性強的合格數(shù)據(jù),利用有關算法去設置和儲存監(jiān)控指標值,同時為這些指標設置閾值,一旦超過有關范圍,系統(tǒng)就會將問題交網(wǎng)絡管理員進行處理,同時保留前一步的反饋數(shù)據(jù)。③制定數(shù)據(jù)治理框架,將零零散散的數(shù)據(jù)需求容納其中。這個框架必須確保各個部分被融合成一個整體,滿足收集、存儲、檢索和安全要求。為此,企業(yè)必須清楚說明其端到端的數(shù)據(jù)策略,以便設計一個覆蓋所有要求和必要操作的框架。必須有計劃地把各個部分結(jié)合起來,彼此支持,這有很多好處,比如在高度安全的環(huán)境中執(zhí)行檢索要求。合規(guī)性也需要專門的設計,成為框架的一部分,這樣就可以追蹤和報告監(jiān)管問題。這個框架還包括日常記錄和其他安全措施,能夠?qū)舭l(fā)出早期預警。在使用數(shù)據(jù)前,對其進行驗證,這也是框架的一部分。數(shù)據(jù)治理委員會應該了解框架的每個部分,明確其用途,以及它如何在數(shù)據(jù)的整個生命周期中發(fā)揮作用。
一是加強數(shù)據(jù)流動監(jiān)測和管理。推動建立數(shù)據(jù)流動軌跡和交易鏈條的安全風險監(jiān)測追溯與綜合管理平臺,持續(xù)研發(fā)數(shù)字水印、數(shù)據(jù)血緣、區(qū)塊鏈等數(shù)據(jù)流動共享安全技術,監(jiān)測流動數(shù)據(jù)的風險態(tài)勢并進行異常預警和溯源處置,強化流動共享數(shù)據(jù)安全保障。二是完善數(shù)據(jù)交易流通規(guī)則制度。結(jié)合我國數(shù)據(jù)交易實踐情況,面對數(shù)據(jù)交易流通過程中可能出現(xiàn)的安全風險問題,制定數(shù)據(jù)交易安全規(guī)則,明確數(shù)據(jù)提供者與需求者安全保障義務、數(shù)據(jù)清洗標準、數(shù)據(jù)交易過程安全標準等內(nèi)容,打造安全、可靠、合法的數(shù)據(jù)交易市場營商環(huán)境[4]。
隨著技術的快速更新迭代,數(shù)據(jù)中心作為技術創(chuàng)新的制高點,仍會出現(xiàn)眾多創(chuàng)新性熱點技術,企業(yè)自身可以深入了解當前數(shù)據(jù)服務中心的具體運維管理模式,了解到數(shù)據(jù)中心運營對企業(yè)發(fā)展的重要影響,并根據(jù)經(jīng)濟大局的格局不斷壯大公司,用數(shù)據(jù)中心運維工作促進企業(yè)自身更好、更快發(fā)展。