包迅格,張景明,張 吉,尚天婷
(國網(wǎng)浙江省電力有限公司 信息通信分公司,浙江 杭州 310020)
電力能源信息指的是在電力能源網(wǎng)運(yùn)行過程中所產(chǎn)生出的信息數(shù)據(jù),一般情況下會(huì)蘊(yùn)含大量有效信息,因此電力能源信息采集是獲取信息的有效途徑,相應(yīng)的采集方法也應(yīng)勢而生[1]。我國針對電力能源信息采集方法的研究起步較晚,主要是通過通信電力能源信息處理的方式統(tǒng)一采集。但由于電力能源信息基數(shù)龐大且類型不一,導(dǎo)致傳統(tǒng)采集方法在實(shí)際應(yīng)用中存在采集波特率低的缺陷,因此優(yōu)化設(shè)計(jì)電力能源信息采集方法具有現(xiàn)實(shí)意義,能夠?yàn)殡娏δ茉葱畔⒉杉矫娴陌l(fā)展提供支持[2]。大數(shù)據(jù)的核心就是統(tǒng)一處理巨量資料,具有聚類能力強(qiáng)和處理效率高的特點(diǎn)[3-5]。為此,本文將大數(shù)據(jù)應(yīng)用在電力能源信息采集方法設(shè)計(jì)中,致力于從根本上提高電力能源信息采集波特率,進(jìn)而提高其采集效率。
大數(shù)據(jù)通過互聯(lián)網(wǎng)的優(yōu)越性徹底打破了時(shí)間及空間的限制,在海量信息中挖掘出有價(jià)值的信息,以多元的方式呈現(xiàn)數(shù)據(jù),形成龐大的信息隊(duì)列,其中也隱含了實(shí)時(shí)性的優(yōu)勢。大數(shù)據(jù)借助信息化技術(shù)為依托,通過在大量數(shù)據(jù)中提取出有價(jià)值的信息,并挖掘數(shù)據(jù)中存在的內(nèi)部規(guī)律。結(jié)合國外對大數(shù)據(jù)的研究,主要將大數(shù)據(jù)以技術(shù)原理為準(zhǔn)則分為數(shù)據(jù)存儲(chǔ)技術(shù)和數(shù)據(jù)處理技術(shù)兩類,廣泛應(yīng)用在各個(gè)領(lǐng)域。
在電力能源信息采集過程中,首先連接鏈路層,接入采集設(shè)備加載原始電力能源信息,再通過圖像加載電力能源信息信號,顯示信號波形[6]。加載電力能源信息信號具體流程為對原始電力能源信息進(jìn)行數(shù)據(jù)通路,然后通過矢量化處理電力能源信息信號生成拓?fù)?,最后通過WAV格式來描述電力能源信息信號,由數(shù)據(jù)編碼通信運(yùn)行電力能源信息屬性,錄入電力能源信息信號屬性。
基于獲取的電力能源信息信號,利用大數(shù)據(jù)技術(shù)中的Apache Drill對采集到的信號進(jìn)行物理特征切割,并顯示采集要素[7]。由于加載后的電力能源信息信號通常采用ESR1格式,為了更好地顯示電力能源信息信號的物理特征,可以通過傅立葉變換和遙控指令兩種方式實(shí)現(xiàn)信號的定時(shí)和遠(yuǎn)程控制。本文以信號短時(shí)平均能量表示電力能源信息信號物理特征,設(shè)信號短時(shí)平均能量表達(dá)式為E,可得:
式中:n代表的是信號字符長度,為實(shí)數(shù);m代表的是Apache Drill切割函數(shù)長度,為實(shí)數(shù);x代表的是采集頻率;w代表的是開發(fā)環(huán)境延遲。根據(jù)式(1)計(jì)算得到的電力能源信息信號物理特征,經(jīng)過數(shù)據(jù)引擎的空間結(jié)構(gòu)處理和3D可視化擴(kuò)展,針對電力信息信號的物理特征,建立一種綜合可集成的并能根據(jù)具體需求多層次顯示信號的數(shù)據(jù)通道。
以顯示得到的電力能源信息物理特征為依據(jù),基于大數(shù)據(jù)技術(shù)加權(quán)融合電力能源信息特征[8]。本文以電力能源信息特征的重要程度為指標(biāo),基于大數(shù)據(jù)的云計(jì)算計(jì)算電力能源信息特征距離Sim(x,y),其表達(dá)式為:
式中,n代表的是特征矢量,i代表的是特征個(gè)數(shù),w指的是平滑系數(shù),m代表的是摩擦系數(shù),k代表的是權(quán)值系數(shù),g代表的是隸屬度函數(shù),μ代表的是特征嵌入維數(shù),x代表的是一維距平化Hamming距離橫坐標(biāo),y代表的是一維距平化Hamming距離縱坐標(biāo)。電力能源信息一維距平化Hamming距離橫縱坐標(biāo)能夠直接決定其特征屬性中的具體點(diǎn)位信息,即為特征描述[9]。以此得出的電力能源信息特征距離如表1所述。
表1 電力能源信息特征距離
根據(jù)表1所示的電力能源信息特征距離,為便于計(jì)算本文采用對稱性特征距離屬性,基于大數(shù)據(jù)技術(shù)下的Hadoop分布式非結(jié)構(gòu)化表示若干個(gè)小的電力能源信息特征集合,進(jìn)而加權(quán)融合電力能源信息特征[10]。設(shè)大數(shù)據(jù)下電力能源信息特征加權(quán)融合為P=αe-α(c-o),其中α代表的是特征數(shù)量,e代表的是特征的先驗(yàn)概率,c代表的是特征集合中時(shí)間,o代表的是特征加權(quán)融合創(chuàng)建時(shí)間[11]。以此為電力能源信息特征的分?jǐn)?shù)索引,其分?jǐn)?shù)越高證明在采集時(shí)的優(yōu)先級越高,保證盡可能提取更多的電力能源信息結(jié)點(diǎn)。
基于大數(shù)據(jù)技術(shù)加權(quán)融合電力能源信息特征后,還需要處理電力能源信息的發(fā)射點(diǎn)與采集路徑。而后基于大數(shù)據(jù)分析電力能源信息,假定經(jīng)過濾波轉(zhuǎn)換后,電力能源信息信號的能量傳輸呈現(xiàn)逐步遞減趨勢,則可將基于大數(shù)據(jù)Rapid Miner跟蹤電力能源信息信號的目標(biāo)函數(shù)設(shè)為C,可得:
式中,k代表的是信號能量值。以此作為電力能源信息信號跟蹤的依據(jù),確定電力能源信息信號的采集路徑。
針對跟蹤到的電力能源信息信號,本文將捕獲的UWB脈沖基帶調(diào)制為弱無線信號與局部偽碼相關(guān)聯(lián),用閾值方法或求最大值方法確定電力能源信息信號是否被捕獲。如果計(jì)算出的值大于閾值,則說明已成功捕獲該電力能源信息信號,并進(jìn)行后續(xù)跟蹤工作。
在此基礎(chǔ)上,通過基于PB級數(shù)據(jù)采集技術(shù)完成電力能源信息采集,處理后的信息列表項(xiàng)為Mobile Service類Layer屬性的集合,其將編輯過的元素分配到信號對象Feature Layer的實(shí)例中,在信號采集緩沖區(qū)中判斷所選的信號,如果選擇簡化信號處理點(diǎn),則將信號處理點(diǎn)實(shí)例化為Sketch Graphic Layer的Geometry屬性并寫入緩沖區(qū)。通常情況下,電力能源信息數(shù)據(jù)采集結(jié)果的刷新周期為10 s,通過設(shè)置合適的刷新周期目的是防止修改、丟失以及不可重讀電力能源信息,至此實(shí)現(xiàn)基于大數(shù)據(jù)的電力能源信息采集方法研究。
為驗(yàn)證基于大數(shù)據(jù)電力能源信息采集方法的有效性,設(shè)計(jì)實(shí)驗(yàn)分析,在某電力能源信息數(shù)據(jù)庫中選取2 000個(gè)區(qū)域范圍為(0,10 000)中的100 M(±0.02 M)字節(jié)信息。使用本文基于大數(shù)據(jù)設(shè)計(jì)方法采集電力能源信息,將采集端口連接至計(jì)算機(jī),通過MATALB軟件測得其數(shù)據(jù)采集波特率,記為實(shí)驗(yàn)組。再使用傳統(tǒng)方法采集電力能源信息,同樣將采集端口連接至計(jì)算機(jī),通過MATALB軟件測得其數(shù)據(jù)采集波特率,記為對照組。數(shù)據(jù)采集波特率越高,代表同時(shí)段內(nèi)對電力能源信息的采集效率越高。
在上述實(shí)驗(yàn)準(zhǔn)備的基礎(chǔ)上,整理和生成如圖1所示的實(shí)驗(yàn)結(jié)果。
圖1 電力能源信息數(shù)據(jù)采集波特率對比
由圖1可知,本文設(shè)計(jì)的方法采集波特率明顯高于對照組,在相同區(qū)域范圍內(nèi)對于電力能源信息采集效率更高,最高達(dá)0.194 bit/s。由此可知,本文設(shè)計(jì)方法可以解決電力信息采集波特率低的問題,具有一定的實(shí)際應(yīng)用價(jià)值。
本文為了提高電力信息采集效率,以實(shí)驗(yàn)分析的方式證明了設(shè)計(jì)采集方法在實(shí)際應(yīng)用中的適用性,能夠解決傳統(tǒng)電力能源信息采集中存在的效率低的缺陷。但本文同樣存在不足之處,主要表現(xiàn)為未檢驗(yàn)本次電力能源信息采集波特率測定結(jié)果的精密度與準(zhǔn)確度,因此為進(jìn)一步提高電力能源信息采集波特率測定結(jié)果的可信度,需在未來研究中加以補(bǔ)足,以期提高電力能源信息采集能力。