國網(wǎng)吳忠供電公司 蔡 娜
在網(wǎng)絡(luò)信息技術(shù)高速發(fā)展的背景之下,伴隨著物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)等各種技術(shù)的快速發(fā)展,全世界的數(shù)據(jù)和信息量得到了前所未有的過程,毫無疑問,那么這種生活在一個(gè)信息和數(shù)據(jù)爆炸的時(shí)代。有統(tǒng)計(jì)顯示,在最近幾年當(dāng)中人類所產(chǎn)生的數(shù)字信息和數(shù)據(jù)量幾乎達(dá)到了人類歷史上所有數(shù)據(jù)的九成,在計(jì)算機(jī)技術(shù)當(dāng)中所采用的GB、TB 等單位已經(jīng)不能夠滿足現(xiàn)代社會(huì)生產(chǎn)領(lǐng)域?qū)?shù)據(jù)量的計(jì)量需求需求,數(shù)據(jù)量單位的量級(jí)已經(jīng)上升到了PB、EB,這種數(shù)據(jù)量的極速擴(kuò)充證標(biāo)志的大數(shù)據(jù)技術(shù)的形式和大數(shù)據(jù)時(shí)代的來臨。
我國現(xiàn)階段已建設(shè)起了發(fā)達(dá)的電力網(wǎng)絡(luò),對(duì)于電力企業(yè)來說在電力生產(chǎn)管理與監(jiān)控當(dāng)中,所需要處理的數(shù)據(jù)量相較于從前也有極大程度的提升,大數(shù)據(jù)的發(fā)展是未來必然的一個(gè)趨勢,本文將進(jìn)一步結(jié)合大數(shù)據(jù)技術(shù)和數(shù)據(jù)分析,在電力企業(yè)當(dāng)中的應(yīng)用現(xiàn)狀簡要的探討這些技術(shù),對(duì)于電力信息和監(jiān)控信息產(chǎn)生的影響,并對(duì)這些技術(shù)在電力行業(yè)中未來的發(fā)展進(jìn)行展望。
目前來說學(xué)術(shù)界對(duì)于大數(shù)據(jù)還沒有一個(gè)確切的定義,但是對(duì)于大數(shù)據(jù)的特征,在學(xué)術(shù)和應(yīng)用領(lǐng)域基本上達(dá)成了共識(shí)。通常來說,大數(shù)據(jù)指的是在一定時(shí)間內(nèi)無法運(yùn)用傳統(tǒng)數(shù)據(jù)軟件進(jìn)行分析處理的大量數(shù)據(jù),關(guān)于大數(shù)據(jù)的特征,當(dāng)前業(yè)界主流且具有代表性的觀點(diǎn)是“4V”特征,也就是Volume、Variety、Velocity、Value,分別代表著數(shù)據(jù)量、數(shù)據(jù)種類、傳輸速度和數(shù)據(jù)價(jià)值,所謂大數(shù)據(jù)也就是數(shù)據(jù)量大、數(shù)據(jù)種類多、傳輸速度快、數(shù)據(jù)價(jià)值高這幾樣特征的集合體。從以上幾個(gè)特征不難發(fā)現(xiàn),大數(shù)據(jù)的應(yīng)用依賴于數(shù)據(jù)處理網(wǎng)絡(luò)建設(shè)高速發(fā)達(dá)的網(wǎng)絡(luò)才能更好的應(yīng)用大數(shù)據(jù),同時(shí)要充分挖掘大數(shù)據(jù)當(dāng)中的價(jià)值,需要一個(gè)更高效的“數(shù)據(jù)處理器”。而關(guān)于數(shù)據(jù)分析則主要指的是在大數(shù)據(jù)處理的基礎(chǔ)上數(shù)據(jù)的實(shí)際應(yīng)用價(jià)值進(jìn)行進(jìn)一步的挖掘,換句話來說數(shù)據(jù)處理可以算作是初步的數(shù)據(jù)分析。對(duì)于電力的生產(chǎn)和管理而言,數(shù)據(jù)分析對(duì)整個(gè)電力的調(diào)配具有重要的意義。
數(shù)據(jù)分析是大數(shù)據(jù)技術(shù)應(yīng)用的重要組成部分,因此大數(shù)據(jù)的關(guān)鍵技術(shù)也包括數(shù)據(jù)分析。此外數(shù)據(jù)的處理管理和展現(xiàn)也同樣是大數(shù)據(jù)技術(shù)應(yīng)用的關(guān)鍵。在數(shù)據(jù)分析方面,現(xiàn)階段數(shù)據(jù)分析的主要類型有統(tǒng)計(jì)分析、關(guān)聯(lián)分析、聚類分析和分類分析。
統(tǒng)計(jì)分析主要指的就是利用統(tǒng)計(jì)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行技術(shù)的收集整理和分析,是在數(shù)據(jù)分析當(dāng)中一種較為直接的方法,可以比較直觀的發(fā)現(xiàn)數(shù)據(jù)之間的內(nèi)在規(guī)律,是將統(tǒng)計(jì)所得的數(shù)據(jù),利用統(tǒng)計(jì)學(xué)原理進(jìn)行篩選并結(jié)合統(tǒng)計(jì)學(xué)的公式來進(jìn)行計(jì)算,將所獲得的結(jié)果結(jié)合生產(chǎn)中的實(shí)際情況進(jìn)行分析;關(guān)聯(lián)分析則主要指的是結(jié)合實(shí)際情況把握不同數(shù)據(jù)之間的內(nèi)在聯(lián)系,例如早期數(shù)據(jù)挖掘的典型案例:在超市的顧客當(dāng)中,購買啤酒的顧客群體里有67%也會(huì)同時(shí)購買尿布,由此可以推斷出大多數(shù)購買啤酒的顧客為有孩子的中青年。利用這條信息就可以對(duì)超市內(nèi)尿布和啤酒兩者的貨架位置進(jìn)行調(diào)整以達(dá)到促銷的目的。
聚類分析則主要應(yīng)用于機(jī)器學(xué)習(xí)領(lǐng)域,在不明確分類標(biāo)準(zhǔn)的前提下,運(yùn)用數(shù)據(jù)之間相似或共同的特征將不同的數(shù)據(jù)進(jìn)行聯(lián)系,自然的將不同的數(shù)據(jù)分成若干個(gè)數(shù)據(jù)簇,之后以數(shù)據(jù)的特征為脈絡(luò)進(jìn)行分析;分類分析技術(shù)和聚類分析的主要區(qū)別在于分類分析是有明確的分類標(biāo)準(zhǔn)的,分類分析的過程當(dāng)中發(fā)現(xiàn)并預(yù)測新的數(shù)據(jù)類型。
在數(shù)據(jù)處理方面,現(xiàn)階段主要運(yùn)用技術(shù),有分布式計(jì)算、內(nèi)存計(jì)算和流處理技術(shù)。具體來說是結(jié)合云端該實(shí)現(xiàn)硬件設(shè)備的虛擬化,該降低硬件設(shè)備的維護(hù)成本和能量的消耗,提高有限的硬件資源利用率,保障數(shù)據(jù)處理和存儲(chǔ)的穩(wěn)定性避免由于硬件設(shè)備的損壞造成不可估量的損失;在數(shù)據(jù)管理方面,這主要包括關(guān)系型與非關(guān)系型的數(shù)據(jù)庫建設(shè),數(shù)據(jù)融合與數(shù)據(jù)集成技術(shù)等,在數(shù)據(jù)展現(xiàn)方面主要是數(shù)據(jù)可視化,歷史流展示技術(shù),空間信息流展示技術(shù),利用圖形學(xué)原理借助各類圖形圖表,對(duì)數(shù)據(jù)的分布、特征等級(jí)展現(xiàn),從而快速直觀的獲取部分信息,有利于促進(jìn)分析工作的開展。
“電力大數(shù)據(jù)”這個(gè)概念是在智能電網(wǎng)建設(shè)的背景下大數(shù)據(jù)技術(shù)和電力生產(chǎn)管理的一次有機(jī)的融合。與大數(shù)據(jù)的概念類似,目前業(yè)界對(duì)于電力大數(shù)據(jù)也沒有一個(gè)較為明確的概念,但具有一些共識(shí)。一般來講,所謂電力檔的數(shù)據(jù)指的是通過傳感器、智能設(shè)備、視頻監(jiān)控設(shè)備、音頻通訊設(shè)備、移動(dòng)終端等各種數(shù)據(jù)采集渠道收集到的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的海量業(yè)務(wù)數(shù)據(jù)集合。電力大數(shù)據(jù)對(duì)于電網(wǎng)建設(shè)的整體質(zhì)量和電力配送以及電網(wǎng)的整體監(jiān)控具有重要的價(jià)值。在掌握了這些大數(shù)據(jù)挖掘大數(shù)據(jù)信息的基礎(chǔ)上可以對(duì)整個(gè)社會(huì)的用電情況有一個(gè)大概了解,為電力企業(yè)后續(xù)的計(jì)劃與決策提供參考,同時(shí),這些信息為電力企業(yè)進(jìn)一步攻克電力工業(yè)和電力供應(yīng)方面的難關(guān)指明了方向。
數(shù)據(jù)分析在電力企業(yè)當(dāng)中的應(yīng)用包括諸多方面,本文會(huì)分別從電力信息挖掘和監(jiān)控信息兩個(gè)方面進(jìn)行簡要的闡述。在電力信息的挖掘和運(yùn)行層面,數(shù)據(jù)分析主要是建立在整個(gè)電力信息系統(tǒng)積累的日志信息數(shù)據(jù)的基礎(chǔ)上,依照認(rèn)識(shí)信息數(shù)據(jù)的來源,可將其大致分為兩類:
第一是系統(tǒng)的運(yùn)行信息,智能化信息系統(tǒng)自身的運(yùn)作狀態(tài)監(jiān)測因此可以通過運(yùn)行信息獲取系統(tǒng)正常運(yùn)行,異常運(yùn)行和預(yù)警等三個(gè)種類的信息。通過對(duì)這一類信息的分析就可以刻畫出整個(gè)電力信息系統(tǒng),在某段時(shí)間內(nèi)的運(yùn)行狀態(tài)并在此基礎(chǔ)上對(duì)系統(tǒng)未來的運(yùn)行進(jìn)行預(yù)測,從而依據(jù)自身的需求,對(duì)系統(tǒng)進(jìn)行及時(shí)的維護(hù)和調(diào)整;第二是系統(tǒng)的訪問日志信息,對(duì)于這些信息數(shù)據(jù)進(jìn)行分析就可以對(duì)系統(tǒng)用戶的行為進(jìn)行刻畫,包括用戶的訪問喜好以及不同類型用戶對(duì)于系統(tǒng)的使用頻次。當(dāng)中就可以得到關(guān)于不同類型用戶對(duì)于電力信息系統(tǒng)的依賴程度以及各類用戶對(duì)于電力信息系統(tǒng)的應(yīng)用場景。在對(duì)這些信息進(jìn)行統(tǒng)計(jì)和處理的基礎(chǔ)上,進(jìn)行關(guān)聯(lián)性分析就可以得出,各類業(yè)務(wù)在公司內(nèi)部的表現(xiàn)狀況從而得出不同客戶對(duì)于電力企業(yè)的業(yè)務(wù)需求,輔助電力企業(yè)在業(yè)務(wù)發(fā)展方向和資源分配方面作出合理決策。
在監(jiān)控信息方面,則主要是輔助對(duì)一些監(jiān)測出的異常信息和異動(dòng)進(jìn)行及時(shí)的處理,在業(yè)務(wù)領(lǐng)域的異動(dòng)信息,主要是指業(yè)務(wù)規(guī)則的變化及業(yè)務(wù)發(fā)展后期計(jì)劃的調(diào)整。及時(shí)發(fā)現(xiàn)業(yè)務(wù)數(shù)據(jù)當(dāng)中發(fā)生異常變動(dòng),有助于工作人員和管理者及時(shí)察覺到業(yè)務(wù)領(lǐng)域的指標(biāo)和規(guī)則的變化,從而對(duì)電力企業(yè)內(nèi)部相關(guān)業(yè)務(wù)的規(guī)劃做出調(diào)整,做到時(shí)刻以最好的狀態(tài)面對(duì)業(yè)務(wù)工作。另外,對(duì)監(jiān)測數(shù)據(jù)的分析也有利于及時(shí)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量不穩(wěn)定的情況,如果發(fā)現(xiàn)沒有及時(shí)接入數(shù)據(jù)或者收集到的數(shù)據(jù)不完整,就表明可能是監(jiān)控系統(tǒng)的狀態(tài)出現(xiàn)了問題,讓相關(guān)的工作人員進(jìn)行檢修。
對(duì)于電力信息運(yùn)行來說,電力大數(shù)據(jù)產(chǎn)生的影響,首先是關(guān)于電力企業(yè)的數(shù)據(jù)中心建設(shè)方面,與大數(shù)據(jù)的數(shù)據(jù)量龐大,對(duì)于硬件設(shè)施的要求也相對(duì)較高,需要大量的網(wǎng)絡(luò)交換機(jī)和硬件設(shè)備,也就是說電力大數(shù)據(jù)背景下的數(shù)據(jù)中心建設(shè)。
首先就要有一個(gè)充足的機(jī)房空間,同時(shí)還需要散熱等方面的問題,以保障數(shù)據(jù)中心的硬件設(shè)施能夠長時(shí)間的正常運(yùn)作。與之相對(duì)應(yīng)的,數(shù)據(jù)中心的維護(hù)和使用需要更多的專業(yè)人員,所以對(duì)于電力企業(yè)來說,加強(qiáng)關(guān)于員工的大數(shù)據(jù)專業(yè)技能培訓(xùn)也是十分有必要的,一方面,需要有充足的運(yùn)維人員,另一方面,需要更多的員工來掌握大數(shù)據(jù)技術(shù)的核心知識(shí)體系,從而能夠更好地對(duì)大數(shù)據(jù)進(jìn)行應(yīng)用。
其次是對(duì)于信息網(wǎng)絡(luò)的影響。大數(shù)據(jù)的一個(gè)特點(diǎn)就是傳說速度快,這對(duì)于電力企業(yè)的信息網(wǎng)絡(luò)建設(shè)也有一定要求:信息網(wǎng)絡(luò)的傳輸帶寬要高,大數(shù)據(jù)網(wǎng)絡(luò)的一個(gè)特點(diǎn)就是持續(xù)的大寬帶通信;由于大數(shù)據(jù)技術(shù),更多地應(yīng)用分布式計(jì)算的方式來提高整體的運(yùn)行效率,因此在信息化網(wǎng)絡(luò)構(gòu)建的過程當(dāng)中,也要體現(xiàn)出分布式的特點(diǎn),保障據(jù)資源的安全性,避免因?yàn)橐徊糠志W(wǎng)絡(luò)出現(xiàn)故障,而導(dǎo)致整個(gè)信息網(wǎng)絡(luò)無法正常運(yùn)作;關(guān)于網(wǎng)絡(luò)的基礎(chǔ)設(shè)施也需要進(jìn)行升級(jí),處于數(shù)據(jù)安全性考慮網(wǎng)絡(luò)交換設(shè)備需要有相應(yīng)的緩存設(shè)置,避免重要數(shù)據(jù)的丟失。由于大數(shù)據(jù)背景下帶寬的提升,信息網(wǎng)絡(luò)基礎(chǔ)設(shè)施也需要能夠承受這種大帶寬傳輸,就目前的發(fā)展趨勢而言,建設(shè)高性能的光纜傳輸網(wǎng)絡(luò)是大勢所趨。
而大數(shù)據(jù)對(duì)于監(jiān)控信息產(chǎn)生的影響,則主要是實(shí)際工作層面的,大數(shù)據(jù)背景下的監(jiān)控信息,同樣具有著信息量大的一個(gè)特點(diǎn),因此對(duì)于相關(guān)工作人員來說,數(shù)據(jù)分析技術(shù)就顯得尤為關(guān)鍵,要能夠從大量的監(jiān)控信息當(dāng)中及時(shí)發(fā)現(xiàn)智能電網(wǎng)當(dāng)中的異常,科學(xué)合理的措施進(jìn)行處理。另外對(duì)于監(jiān)控設(shè)備數(shù)據(jù)采集功能也有一定的要求,監(jiān)控?cái)?shù)據(jù)數(shù)據(jù)要具有實(shí)時(shí)性,準(zhǔn)確性。
最后無論是電力信息還是監(jiān)控信息,在大數(shù)據(jù)時(shí)代的背景之下,關(guān)于信息資源的安全和網(wǎng)絡(luò)安全問題都是重中之重。由于大數(shù)據(jù)的數(shù)據(jù)量大,種類繁多,因此在傳輸過程的安全穩(wěn)定就顯得尤為重要,確保重要信息不能丟失、電力信息網(wǎng)絡(luò)和電力監(jiān)控網(wǎng)絡(luò)的安全防止惡意入侵都是信息資源安全和網(wǎng)絡(luò)安全工作的核心內(nèi)容。目前來說,在這一領(lǐng)域,國內(nèi)已有了不少的研究,如朱海鵬等基于D-S 證據(jù)理論,計(jì)算安全事件的偏離度,來確定安全事件權(quán)重,構(gòu)建了建立在證據(jù)分類基礎(chǔ)上的復(fù)合攻擊檢測防護(hù)策略,這種策略和算法能夠針對(duì)多類型的網(wǎng)絡(luò)攻擊。
就現(xiàn)階段的狀況來說,電力大數(shù)據(jù)的應(yīng)用主要是服務(wù)于整個(gè)電力生產(chǎn)和使用的,通過發(fā)現(xiàn)大量數(shù)據(jù)之間存在的規(guī)律,把握數(shù)據(jù)之間的內(nèi)在聯(lián)系,未來業(yè)務(wù)服務(wù)的發(fā)展走向進(jìn)行分析和預(yù)測。從而進(jìn)一步提高電力企業(yè)的客戶服務(wù)質(zhì)量,具體來說,通過對(duì)電力信息的分析,可以對(duì)客戶用電的行為傾向以及具體的用電量作出預(yù)測,并以此作為脈絡(luò),將客戶進(jìn)行初步的分類,通過對(duì)公司內(nèi)部業(yè)務(wù)狀況數(shù)據(jù)的分析預(yù)測出未來一段時(shí)間內(nèi),客戶業(yè)務(wù)需求的大體走向,從而進(jìn)一步優(yōu)化業(yè)務(wù)流程,使得客戶感到企業(yè)的服務(wù)更加便捷舒心。對(duì)于監(jiān)控信息的分析,就可以及時(shí)發(fā)現(xiàn)電網(wǎng)在運(yùn)行的過程當(dāng)中遇到或產(chǎn)生的技術(shù)上或設(shè)備上的問題,便于相關(guān)工作人員進(jìn)行及時(shí)的維護(hù)修理,同時(shí)也方便管理者對(duì)企業(yè)內(nèi)部的資源進(jìn)行調(diào)配合調(diào)整,優(yōu)化資源分配??偟膩碚f,大數(shù)據(jù)和數(shù)據(jù)分析的應(yīng)用是智能化電網(wǎng)建設(shè)的必然要求。
第一是關(guān)于數(shù)據(jù)質(zhì)量方面的挑戰(zhàn),大數(shù)據(jù)時(shí)代的一大特點(diǎn)就是數(shù)據(jù)量大的數(shù)據(jù)價(jià)值密度相對(duì)較低,電力大數(shù)據(jù)來自于輸送、變壓、調(diào)配、用度等各個(gè)環(huán)節(jié),其中難免存在著許多無用、無價(jià)值的信息,如何進(jìn)一步提升大數(shù)據(jù)的價(jià)值密度、高校的挖掘電力大數(shù)據(jù)當(dāng)中的有效信息,會(huì)議是未來行業(yè)研究電力大數(shù)據(jù)領(lǐng)域的一個(gè)熱點(diǎn)議題。
第二是關(guān)于數(shù)據(jù)集成方面的挑戰(zhàn),由于電力大數(shù)據(jù)在實(shí)際應(yīng)用的過程當(dāng)中,大多采用分布式存儲(chǔ)集中化處理的方式,確保信息資源的安全性和處理的穩(wěn)定性,當(dāng)然是這樣的方式也存在著許多的問題,例如部分?jǐn)?shù)據(jù)庫和數(shù)據(jù)系統(tǒng)的業(yè)務(wù)功能和具體的數(shù)據(jù)內(nèi)容可能存在重復(fù),這樣就很容易導(dǎo)致硬件資源的占用和浪費(fèi)。另外,各類采集設(shè)備在具體工作時(shí)所采用的數(shù)據(jù)采集方法可能存在差異,這也就使得數(shù)據(jù)在采集和測量的過程當(dāng)中存在著各種各樣的誤差,影響數(shù)據(jù)分析的準(zhǔn)確性和實(shí)際效率。
第三是關(guān)于數(shù)據(jù)存儲(chǔ)方面的挑戰(zhàn),正如前文所提到的那樣,大數(shù)據(jù)時(shí)代必然會(huì)對(duì)數(shù)據(jù)中心的建設(shè)產(chǎn)生影響,各種類型的數(shù)據(jù)對(duì)硬件存儲(chǔ)設(shè)施包括存儲(chǔ)的算法提出了新的要求。對(duì)于視頻和圖片這一類半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)在未來將會(huì)成為一個(gè)新的研究熱點(diǎn)。如何在數(shù)據(jù)庫中實(shí)現(xiàn)高效的查詢統(tǒng)計(jì),從而更有效率的輔助數(shù)據(jù)分析,體現(xiàn)出多樣化數(shù)據(jù)類型的優(yōu)勢,也會(huì)成為一個(gè)重要的研究課題。
總之,大數(shù)據(jù)時(shí)代的降臨,對(duì)于智能電網(wǎng)的建設(shè)及電力企業(yè)的信息化進(jìn)程推進(jìn)是一個(gè)關(guān)鍵的機(jī)遇,作為電力行業(yè)的從業(yè)者,需要對(duì)大數(shù)據(jù)和數(shù)據(jù)分析給電力信息和監(jiān)控信息乃至整個(gè)電力生產(chǎn)與管理所帶來的影響有明確的認(rèn)識(shí),了解到大數(shù)據(jù)時(shí)代下,電力行業(yè)未來發(fā)展所需要面臨的挑戰(zhàn),才能以更加積極的心態(tài)獲取相對(duì)客觀、科學(xué)的認(rèn)知。讓大數(shù)據(jù)技術(shù)和數(shù)據(jù)分析在電力行業(yè)當(dāng)中更好的發(fā)揮作用,發(fā)揮出其作為智能化技術(shù)應(yīng)當(dāng)具有的價(jià)值,讓電力企業(yè)更好的為廣大人民提供高質(zhì)量的服務(wù)。