李雨軒,高 鵬,趙慶磊
(國(guó)網(wǎng)山東省電力公司檢修公司,山東 濟(jì)南 250118)
小波分析(Wavelets Analysis)是 20世紀(jì) 80年代后逐步興起和發(fā)展的一種新的數(shù)學(xué)分析方法。它作為數(shù)學(xué)學(xué)科的一個(gè)分支,汲取了現(xiàn)代分析學(xué)中泛函分析、數(shù)值分析、傅里葉分析、調(diào)和分析等眾多分支中的精華,具有深刻的理論意義[1],在信號(hào)處理、故障診斷、狀態(tài)監(jiān)視、語(yǔ)音識(shí)別、刑事偵破等十幾個(gè)學(xué)科領(lǐng)域得到了廣泛應(yīng)用[2]。
自1822年傅里葉(Fourier)發(fā)表“熱傳導(dǎo)解析理論”以來(lái),傅里葉變換一直是數(shù)學(xué)分析領(lǐng)域中最完美、應(yīng)用最廣泛、效果最好的一種分析手段。但傅里葉變換只是一種純頻域的分析方法,需要利用信號(hào)的全部時(shí)域信息,這是一種整體變換,缺少時(shí)域定位功能[3]。而小波變換是一種時(shí)間—尺度(時(shí)間—頻率)分析方法,它具有多分辨率分析的特點(diǎn),而且在時(shí)頻兩域都具有表征信號(hào)局部特征的能力,很適合探測(cè)正常信號(hào)中夾帶的瞬變反常信號(hào)并能夠分析其成分,所以被稱為“數(shù)學(xué)顯微鏡”[4]。
電力負(fù)荷數(shù)據(jù)是電網(wǎng)公司采集的反映電力用戶用電情況的時(shí)間序列。將電力負(fù)荷數(shù)據(jù)看成是一種大時(shí)間粒度的數(shù)字信號(hào),利用小波分析對(duì)其進(jìn)行去噪和壓縮,極大地方便了電力負(fù)荷數(shù)據(jù)的處理工作,具有很高的應(yīng)用價(jià)值。
函數(shù) f(t)的連續(xù)小波變換為
式中:Ψ(x)∈L2(R)為小波函數(shù);a 為尺度因子;b 為平移因子。
相應(yīng)的重構(gòu)公式為
小波變換在映射到計(jì)算域時(shí)存在信息冗余,計(jì)算量很大[5]。為此,基于多分辨率分析理論的Mallat塔式算法應(yīng)運(yùn)而生。
數(shù)學(xué)上可以證明:
逆運(yùn)算為:
式(9)即 Mallat塔式分解算法,式(10)為 Mallat算法的重構(gòu)算法,如圖1所示。
圖1 Mallat塔式算法分解和重構(gòu)
圖1中,Cj和Dj為2j分辨率下的離散逼近和離散細(xì)節(jié),分別對(duì)應(yīng)信號(hào)的低頻成分和高頻成分。
小波函數(shù)不是唯一存在的,常見小波有Haar小波、Daubechies(dbN)小波系、雙正交小波系、Coiflet小波系等。處理電力負(fù)荷數(shù)據(jù)選擇的小波基至少要滿足條件:1)必須是緊支撐的,且支撐區(qū)間要小,這樣有利于奇異點(diǎn)的檢測(cè)。2)能夠靈活的調(diào)整分辨率,因?yàn)椴煌愋偷呢?fù)荷數(shù)據(jù)擁有不同的時(shí)間粒度。dbN小波系滿足這兩個(gè)條件,因此選用該小波系進(jìn)行分析。
電力負(fù)荷數(shù)據(jù)作為一種特殊的數(shù)字信號(hào),在采集和傳輸過(guò)程中會(huì)摻雜進(jìn)各種噪聲,其噪聲來(lái)源主要有:1)負(fù)荷數(shù)據(jù)的壞點(diǎn)。由于人為失誤或系統(tǒng)故障,數(shù)據(jù)出現(xiàn)壞點(diǎn)和缺失,在負(fù)荷曲線上表現(xiàn)為奇異點(diǎn)。2)系數(shù)的放大效應(yīng)。原始負(fù)荷數(shù)據(jù)通常需要乘以一個(gè)大的系數(shù)才是真實(shí)數(shù)據(jù),因此任何細(xì)小的干擾都可能被放大形成較大的波動(dòng)。3)負(fù)荷本身的不穩(wěn)定性。這種不穩(wěn)定性會(huì)在負(fù)荷曲線上形成無(wú)數(shù)小的毛刺。在一些強(qiáng)調(diào)宏觀性和整體性的應(yīng)用場(chǎng)合,這些細(xì)節(jié)意義不大,也將其視為一種噪聲。
電力負(fù)荷數(shù)據(jù)中的噪聲如不濾除,會(huì)嚴(yán)重干擾電網(wǎng)公司的決策。采用傳統(tǒng)的office軟件篩選耗時(shí)耗力,因此利用小波分析濾除負(fù)噪聲意義重大。
去噪的基本目的就是減少噪聲部分的幅值,使去噪后的信號(hào)盡可能地逼近原始信號(hào)[6]。目前,小波去噪的主流方法主要有模極大值去噪法[7]和閾值去噪法[8-10]。其中,閾值去噪法計(jì)算簡(jiǎn)單,速度快,且在最小均方誤差意義下可達(dá)到近似最優(yōu)[11],因此選用閾值去噪法。
Mallat塔式算法可逐層將信號(hào)分解為逼近和細(xì)節(jié)成分,而噪聲主要隱藏在細(xì)節(jié)成分中。信號(hào)去噪就是有選擇性的濾除一些細(xì)節(jié)系數(shù),則重構(gòu)后的信號(hào)就會(huì)接近于原始信號(hào)。
細(xì)節(jié)系數(shù)中除包含噪聲外,還構(gòu)成了信號(hào)重要的細(xì)節(jié)特征,因此不能將其全部濾除。噪聲強(qiáng)度σ估計(jì)為
式中:dj(n)為第j層小波系數(shù);N為該層小波系數(shù)的個(gè)數(shù);δ為經(jīng)驗(yàn)系數(shù)。
則通用閾值T可表示為
本文提出雙層閾值法,首先將大于T1的系數(shù)收縮進(jìn)T1范圍內(nèi),然后重新估算噪聲形成T2,利用T2對(duì)上一步信號(hào)進(jìn)行軟閾值處理,其取值函數(shù)為:
第一步
第二步
由于奇異點(diǎn)產(chǎn)生的小波系數(shù)往往遠(yuǎn)大于通用閾值,而傳統(tǒng)的軟閾值法只是將大于閾值的系數(shù)收縮一次,因此并不能有效地去除奇異點(diǎn)。而通過(guò)設(shè)置雙層閾值,首先將奇異點(diǎn)系數(shù)進(jìn)行多次收縮,使其回歸正常范圍內(nèi),再對(duì)全局信號(hào)進(jìn)行軟閾值處理,可以較好地解決奇異點(diǎn)問(wèn)題。
圖2為某大型商場(chǎng)2012—2016年的單日最大負(fù)荷曲線。單日最大負(fù)荷可以近似代表一個(gè)用戶的負(fù)荷水平,在電網(wǎng)規(guī)劃中占有重要地位。由圖可知,此曲線的噪聲由兩部分組成:1)數(shù)據(jù)壞點(diǎn)(奇異點(diǎn));2)負(fù)荷不穩(wěn)定而形成的毛刺。
圖2 某大型商場(chǎng)單日最大負(fù)荷曲線
將此曲線用db5小波做5層分解,得到細(xì)節(jié)系數(shù)分布如圖3所示。由圖3可知,前3層分解系數(shù)均含有較為明顯的奇異點(diǎn)和高頻噪聲。估算其噪聲強(qiáng)度,δ分別取0.5和1.5形成雙層閾值,按照雙層閾值策略處理細(xì)節(jié)系數(shù),保留全部逼近系數(shù),重構(gòu)后如圖4所示。其中S1和S2分別為雙層系數(shù)處理的結(jié)果,S3為使用傳統(tǒng)軟閾值法的處理結(jié)果。
圖3 負(fù)荷曲線細(xì)節(jié)系數(shù)分布
圖4 負(fù)荷曲線去噪結(jié)果
由圖2、圖4可知:1)S1相較于S已經(jīng)消除了數(shù)據(jù)奇異點(diǎn),非奇異點(diǎn)處的數(shù)據(jù)與原數(shù)據(jù)有很高的相似度;2)S2變得更加平滑,更能反映負(fù)荷特性和一般趨勢(shì);3)S3雖然較原始曲線更加平滑,但并未有效去除奇異點(diǎn)。綜上說(shuō)明雙層閾值法可以有效地去除數(shù)據(jù)中的奇異點(diǎn)和噪聲,相較于傳統(tǒng)軟閾值法優(yōu)勢(shì)明顯。
為評(píng)價(jià)此方法誤差水平,定義衡量指標(biāo):平均絕對(duì)誤差為β,平均相對(duì)誤差為η,賦范均方誤差為βnorm。
誤差統(tǒng)計(jì)如表1所示。由表1可知,S2、S1、S3曲線誤差逐漸減小且三者誤差都處于較低水平??紤]到S1和S2消除了奇異點(diǎn)造成的誤差增大,其真實(shí)誤差應(yīng)低于此水平,說(shuō)明此方法能夠較好地控制誤差。實(shí)際操作中,可根據(jù)不同的精確度要求靈活的調(diào)整通用閾值,閾值越小,則細(xì)節(jié)越少,去噪后曲線也越光滑,但誤差也越大。
表1 去噪結(jié)果誤差表
電網(wǎng)公司每時(shí)每刻都在生成各種負(fù)荷數(shù)據(jù),這會(huì)占用大量的存儲(chǔ)空間,同時(shí)增加數(shù)據(jù)管理成本,因此有必要對(duì)負(fù)荷數(shù)據(jù)進(jìn)行壓縮。
小波分解后逼近和細(xì)節(jié)系數(shù)的總個(gè)數(shù)與原信號(hào)的采樣點(diǎn)個(gè)數(shù)相同,而時(shí)間序列的能量和宏觀性質(zhì)是由逼近系數(shù)和大幅值的細(xì)節(jié)系數(shù)決定,因此舍去部分小幅值的細(xì)節(jié)系數(shù),再利用特殊的編碼方式記錄沒(méi)有被舍去的細(xì)節(jié)系數(shù)的位置,就可以到達(dá)只存儲(chǔ)少量小波系數(shù)而重構(gòu)原始時(shí)間序列的目的,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的壓縮。
小波細(xì)節(jié)系數(shù)的取舍同樣需要用到閾值,但壓縮閾值沒(méi)有統(tǒng)一的估算方法。本文選用的閾值表示為
式中:j為當(dāng)前分解層數(shù);N為該層小波系數(shù)的個(gè)數(shù);A∈(0,1)命名為壓縮系數(shù),其取值由壓縮率決定。
則細(xì)節(jié)系數(shù)的取值函數(shù)為
如圖5所示為某商業(yè)街一周內(nèi)的負(fù)荷曲線,采樣頻率為1 min,共10 080個(gè)采樣點(diǎn)。
圖5 某商業(yè)街周負(fù)荷曲線
將此負(fù)荷曲線用db5小波做3層分解,壓縮系數(shù)分別設(shè)為0.1、0.3、0.6,壓縮后結(jié)果如圖6所示。
圖6 壓縮后負(fù)荷曲線
由圖 6 可知,S′1、S′2、S′3 均與原負(fù)荷曲線有較高的相似度,說(shuō)明重構(gòu)效果較好,而它們參與重構(gòu)的系數(shù)分別只有3 641、1 857、1 320個(gè),相較于原始信號(hào)的10 080個(gè),均有大幅度減少。
定義壓縮比為:
式中:N*為壓縮后小波系數(shù)的個(gè)數(shù);N為原始信號(hào)的采樣點(diǎn)個(gè)數(shù)。
誤差衡量指標(biāo)同前文所定義,則壓縮比和誤差如表2所示。由表2可知:1)壓縮比越小,壓縮效果越好,但誤差也越大;2)即使達(dá)到了13.1%的壓縮比,其誤差仍然處于較低的水平。所以此方法能僅損失較少的曲線細(xì)節(jié),使負(fù)荷數(shù)據(jù)得到極大的壓縮,從而成倍的提高存儲(chǔ)介質(zhì)的利用率。實(shí)際操作中可以通過(guò)調(diào)整壓縮系數(shù)和分解層數(shù)靈活的改變壓縮比。
表2 壓縮結(jié)果評(píng)價(jià)表
小波分析是數(shù)字信號(hào)處理的支柱理論之一,本文將其應(yīng)用領(lǐng)域擴(kuò)展到電力負(fù)荷數(shù)據(jù)的處理中,并提出了雙層閾值方法。實(shí)際案例分析表明,小波分析應(yīng)用于負(fù)荷數(shù)據(jù)去噪時(shí),能夠有效地去除奇異點(diǎn)和噪聲,極大節(jié)約了人力和時(shí)間成本;而應(yīng)用于負(fù)荷數(shù)據(jù)壓縮時(shí),可以在較小的誤差水平下,獲得很好的壓縮效果,從而成倍減少數(shù)據(jù)占用的存儲(chǔ)空間。因此小波分析在電力負(fù)荷數(shù)據(jù)處理方面具有很高的應(yīng)用價(jià)值。