馬秋波,朱廷俊,夏成璧,朱李鈾,潘艷青
(國網(wǎng)甘肅省電力公司慶陽供電公司,甘肅慶陽 745000)
建立健全的電力用戶能效評估指標(biāo)體系,是提升該領(lǐng)域用戶能源利用率的首要環(huán)節(jié)[1-9]。在配電側(cè)降低線路損耗、用戶側(cè)降低設(shè)備損耗是提高企業(yè)電能利用率的基本準(zhǔn)則。隨著大數(shù)據(jù)技術(shù)的推廣,電力用戶的各種用電行為早已“有跡可循”,這些痕跡為調(diào)研不同行業(yè)的電力用戶提供了技術(shù)支持[10-12]。在科學(xué)的評價指標(biāo)體系引導(dǎo)下,電力用戶能及時改進(jìn)經(jīng)營策略,而電力公司可有效降低線路損耗,從而達(dá)到配用電的雙贏。在此背景下,該文從實用性、科學(xué)性與可觀測性的角度出發(fā),對電力用戶在綜合能效評估時所使用的大數(shù)據(jù)分析及存儲方法進(jìn)行了研究?;诙嗑S矩陣的大數(shù)據(jù)分析技術(shù)對電力用戶的觀測值加以擴展,并使用熵值評估法(Entropy Method)避免了評估過程中的主觀因素影響,再利用最小二乘法(Generalized Least Squares,GLS)進(jìn)行算法集成,進(jìn)而提升了評估的精度。
在對電力用戶進(jìn)行能效評估時,隨著企業(yè)數(shù)據(jù)采集密度的增長,各種狀態(tài)數(shù)據(jù)通常采用時間序列的形式在服務(wù)器上加以存儲。記x為電力設(shè)備某個指標(biāo)在復(fù)數(shù)空間上的T維時間序列,則N個序列可以構(gòu)成如式(1)所示的觀測矩陣:
式中,C為復(fù)數(shù)空間。當(dāng)N遠(yuǎn)小于T時,可將xi繼續(xù)拆分,并疊加得到更高維度的X′:
對電力用戶按照指標(biāo)體系進(jìn)行數(shù)據(jù)采集后,再對各個指標(biāo)下的數(shù)據(jù)加以采集,隨后便能建立狀態(tài)量數(shù)據(jù)集的高維矩陣,最終通過大數(shù)據(jù)模型即可實現(xiàn)對能效的評估。數(shù)據(jù)采集后,首先需量化所采集的狀態(tài)量與能效評估間的相關(guān)性。因此,該文引入了置信度指標(biāo)A來進(jìn)行相關(guān)性的度量:
其中,P是事件發(fā)生的概率,σ是方差,Li,j表示狀態(tài)量i在j條件下出現(xiàn)異常,Mi是狀態(tài)量在觀測值中出現(xiàn)異常。隨后,借助ARMA 模型(Auto-Regressive and Moving Average Model)研究高維矩陣的樣本協(xié)方差矩陣并實現(xiàn)數(shù)據(jù)挖掘[13-15],以獲得該矩陣的譜分布,從而得到電力用戶的異常能效指標(biāo)。ARMA 是基于自回歸(Autoregressive Model,AR)與滑動平均(Moving Average,MA)的復(fù)合模型。對于記錄了某個指標(biāo)在n個狀態(tài)的高維矩陣X′=(x1,x2,…,xn),其時間序列xt的功率譜密度計算方法如下:
首先將高維矩陣轉(zhuǎn)化為以p、q為模型參數(shù)的ARMA(p|q)過程,且記B為延遲算子,?、θ為比例因子,則有:
其中,εt是基函數(shù),a和b為展開階數(shù)。
此時,記Φ為序列經(jīng)傅里葉變換后的功率譜密度,則其計算方法為:
其中,ω為傅里葉變換中的角頻率。
當(dāng)a、b均為1時,即可得到該文使用的ARMA(1,1)模型。對于該模型,可根據(jù)式(6)得到功率譜密度的計算方式為:
其中,φ是[-1,1]的常數(shù)。對于采樣矩陣X,其協(xié)方差矩陣的計算方法如下:
對Sn進(jìn)行p個時刻的采樣,并計算Sn的能量譜密度(Energy Spectrum Density,ESD),其計算方式為:
其中,I是采樣點中出現(xiàn)異常數(shù)據(jù)的概率。接著對式(7)進(jìn)行斯蒂爾切斯變換,即可得到極限譜密度函數(shù),此處仍以ARMA(1,1)模型為例,有:
在對樣本數(shù)據(jù)進(jìn)行檢測后,還需確定評價指標(biāo)的權(quán)重值。由于電力用戶的指標(biāo)體系較為復(fù)雜,故該文采用基于最小二乘原理的熵值評估法確定各級指標(biāo)的權(quán)重。
信息熵(Information Entropy)是信息理論中評價空間內(nèi)部信息分布無序程度的評價指標(biāo),信息的無序程度越短,其攜帶的信息量便越大。在大數(shù)據(jù)評估中,通過指標(biāo)觀測值提供的信息量大小可確定該指標(biāo)的權(quán)重,這便是熵值評估法的基本思想。
對于電力用戶在m個評估項目,n個評價指標(biāo)下,能夠得到觀測數(shù)據(jù)矩陣R=(rij)m×n,其可表示為:
對于第j個指標(biāo),其權(quán)重uj的計算方法如下:
在實際的能效評估時,由熵值評估法取得的權(quán)重為客觀權(quán)重uj。由于在現(xiàn)有的評價體系下,存在固有的主觀評價權(quán)重wj,故需盡可能降低兩套權(quán)重間的偏差。為此,該文引入最小二乘法進(jìn)行綜合集成,記最終的綜合權(quán)重為W=(W1,W2,…,Wm),則優(yōu)化的目標(biāo)函數(shù)H為:
由于兩種權(quán)重賦值方法所得到的權(quán)重是離散分布的,因此引入對熵h(u1,u2),并將該問題轉(zhuǎn)化為數(shù)學(xué)規(guī)劃問題,記d為集合權(quán)重:
根據(jù)最小二乘法,該數(shù)學(xué)規(guī)劃模型的最優(yōu)解如下:
此時,可得到綜合賦權(quán)后的客觀權(quán)重a1與主觀權(quán)重a2:
該文基于某地區(qū)200 家重要電力客戶數(shù)據(jù)集進(jìn)行模型的驗證,由于數(shù)據(jù)量大,為提升數(shù)據(jù)的運算分析效率,需基于指標(biāo)評價體系對數(shù)據(jù)的存儲體系加以設(shè)計[16]。該文的指標(biāo)體系共分為三級,其中,一級指標(biāo)體系包括技術(shù)能效A1、經(jīng)濟(jì)能效A2、管理能效A3。圖1 給出了技術(shù)能效A1的部分指標(biāo)。
圖1 文中設(shè)計的部分指標(biāo)體系
由于該文使用的原始數(shù)據(jù)均按照各個指標(biāo)存儲于389 213 個小文件中,而傳統(tǒng)的HDFS(Hadoop Distributed File System)更適合于大文件的流式存儲,故該文使用圖2 所示的策略對存儲方式進(jìn)行優(yōu)化。
圖2 中設(shè)計了小文件合并的數(shù)據(jù)接口,歸并后的大文件元數(shù)據(jù)結(jié)構(gòu)如表1 所示。
圖2 小文件優(yōu)化存儲策略
表1 歸并后大文件的元數(shù)據(jù)結(jié)構(gòu)
在經(jīng)歷前期的數(shù)據(jù)采集后,依據(jù)該指標(biāo)體系與高維矩陣分析方法,得到了不同指標(biāo)觀測值的擴展序列。然后再使用并行化的HDFS 大數(shù)據(jù)處理技術(shù)按照指標(biāo)體系進(jìn)行數(shù)據(jù)存儲,且采用1 個Master 和7個Slave 存儲節(jié)點,單個Master、Slave 節(jié)點的配置均如表2 所示。測試結(jié)果表明,相較于傳統(tǒng)的單服務(wù)器存儲,數(shù)據(jù)的訪問效率提升了64.5%。
表2 Master與Slave節(jié)點的配置
隨后通過讀取HDFS 文件系統(tǒng)上的觀測數(shù)據(jù),確定評估模型的各項指標(biāo)。在確定指標(biāo)體系中一、二級指標(biāo)的權(quán)重時,采用最小二乘法集成賦權(quán),各個指標(biāo)的權(quán)重值計算結(jié)果如表3 所示。
從表中可以看出,在進(jìn)行電力用戶的能效評估時,在該文的評估模型下,用戶的技術(shù)指標(biāo)對用戶影響較大,權(quán)重為57.13%。而用戶的管理效能對用電能效的影響則較小,權(quán)重僅為10.93%。在三級指標(biāo)的權(quán)重賦值中,由于各指標(biāo)下的觀測值已采用高維矩陣進(jìn)行了序列擴展,故可直接使用熵值評估法進(jìn)行權(quán)重賦值。以B8下的三級指標(biāo)C16-C21為例,各個指標(biāo)的熵值、差異系數(shù)及熵權(quán)重的計算結(jié)果如表4所示。
表3 一二級指標(biāo)權(quán)重值
表4 B8下各指標(biāo)權(quán)重計算結(jié)果
表5 給出了200 家電力用戶在技術(shù)、經(jīng)濟(jì)與管理這3 個一級指標(biāo)下的評價結(jié)果。
表5 企業(yè)能效評估結(jié)果
以表中所顯示的5 家用戶為例,通過綜合評價其能效水平依次排序為用戶4>用戶200>用戶1>用戶3>用戶2。通過綜合性的能效評估,各用戶均能夠評估自身在能效上的弱勢項,并針對該項進(jìn)行專項提升,從而更優(yōu)地提升生產(chǎn)效率。
該文引入了大數(shù)據(jù)分析方法進(jìn)行電力用戶的綜合能效評估,基于HDFS 大數(shù)據(jù)存儲結(jié)構(gòu)建立了完備的評價指標(biāo)體系。在數(shù)據(jù)處理上,基于ARMA方法建立了觀測樣本的協(xié)方差矩陣,在確認(rèn)評估模型的三級指標(biāo)時,使用了信息熵理論中的熵值評估法,有效避免了評價過程中的主觀因素影響。計算樣例證明,該方法能夠通過打分的形式有效評估用戶的當(dāng)前能效水平,并可為能效的提升給出合理的改進(jìn)方向。