摘要:針對(duì)傳統(tǒng)奇異值閾值(Singular Value Thresholding,SVT)數(shù)據(jù)恢復(fù)算法在對(duì)電力負(fù)荷數(shù)據(jù)恢復(fù)中忽視數(shù)據(jù)先驗(yàn)信息以及大規(guī)模數(shù)據(jù)計(jì)算效率低等問(wèn)題,提出一種基于相空間重構(gòu)與自適應(yīng)變步長(zhǎng)的改進(jìn)SVT的數(shù)據(jù)恢復(fù)算法. 為解決傳統(tǒng)SVT容易忽視數(shù)據(jù)先驗(yàn)信息的問(wèn)題,引入相空間重構(gòu)算法將原始缺失數(shù)據(jù)映射到高維空間,利用數(shù)據(jù)間的關(guān)聯(lián)性和結(jié)構(gòu)特征,為后續(xù)數(shù)據(jù)恢復(fù)算法提供先驗(yàn)知識(shí);結(jié)合對(duì)數(shù)與Sigmoid函數(shù)構(gòu)建變步長(zhǎng)基礎(chǔ)函數(shù),并利用等比項(xiàng)提高前期步長(zhǎng),構(gòu)建自適應(yīng)變步長(zhǎng)SVT算法,克服傳統(tǒng)SVT在大規(guī)模數(shù)據(jù)情況下計(jì)算效率低的問(wèn)題. 結(jié)合多項(xiàng)公用電力負(fù)荷數(shù)據(jù)集及多種常用電力負(fù)荷數(shù)據(jù)恢復(fù)算法進(jìn)行對(duì)比實(shí)驗(yàn)分析,結(jié)果表明,改進(jìn)SVT算法可獲得更好的數(shù)據(jù)恢復(fù)效果,收斂速度、精度以及穩(wěn)定性得到提升,具有較強(qiáng)的工程實(shí)用性.
關(guān)鍵詞:電力負(fù)荷數(shù)據(jù);數(shù)據(jù)處理;奇異值閾值;相空間方法;自適應(yīng)變步長(zhǎng)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A
隨著智能電網(wǎng)建設(shè)的推進(jìn),大規(guī)模監(jiān)測(cè)設(shè)備納入電力系統(tǒng),使得電力數(shù)據(jù)呈指數(shù)式增長(zhǎng)[1]. 電力負(fù)荷數(shù)據(jù)在優(yōu)化能源利用、設(shè)備運(yùn)行分析等方面發(fā)揮重要作用. 由于設(shè)備故障、通信問(wèn)題等,電力負(fù)荷數(shù)據(jù)易出現(xiàn)缺失問(wèn)題,影響相關(guān)電力決策制定[2]. 為此,需研究數(shù)據(jù)恢復(fù)算法提升數(shù)據(jù)質(zhì)量,為電力負(fù)荷預(yù)測(cè)、電網(wǎng)優(yōu)化配置等領(lǐng)域提供技術(shù)支撐.
目前,針對(duì)電力數(shù)據(jù)恢復(fù)國(guó)內(nèi)外主要關(guān)注三個(gè)方面的研究[3]:統(tǒng)計(jì)學(xué)方法,機(jī)器學(xué)習(xí)方法,矩陣補(bǔ)全方法. 統(tǒng)計(jì)學(xué)方法基于現(xiàn)有電力數(shù)據(jù)特征,利用統(tǒng)計(jì)學(xué)原理對(duì)缺失數(shù)據(jù)進(jìn)行插補(bǔ)和填充. 常見(jiàn)的統(tǒng)計(jì)學(xué)方法有多項(xiàng)式插值法[4]和三次樣條插值法[5]等. 這兩種方法應(yīng)用廣泛,計(jì)算復(fù)雜度低,但對(duì)數(shù)據(jù)點(diǎn)的選擇和分布要求較高,分別存在過(guò)擬合和插值不平滑的缺陷,且隨著缺失數(shù)據(jù)量增多,易忽視電力數(shù)據(jù)的時(shí)空特性,從而導(dǎo)致數(shù)據(jù)恢復(fù)精度不高.
機(jī)器學(xué)習(xí)方法基于歷史數(shù)據(jù)的趨勢(shì),構(gòu)建預(yù)測(cè)模型實(shí)現(xiàn)缺失樣本預(yù)測(cè)并補(bǔ)全. 隨機(jī)森林填補(bǔ)法[6]是一種兼具靈活性和魯棒性的方法,但在處理長(zhǎng)期趨勢(shì)和周期性變化的數(shù)據(jù)時(shí)有一定的局限性. 此外,去噪自編碼器[7]、改進(jìn)生成式對(duì)抗網(wǎng)絡(luò)[8]和改進(jìn)輕量級(jí)梯度提升機(jī)[9]等機(jī)器學(xué)習(xí)方法也被用于缺失數(shù)據(jù)重建中. 上述機(jī)器學(xué)習(xí)方法考慮電力數(shù)據(jù)的時(shí)空特性,提高了數(shù)據(jù)恢復(fù)精度,但當(dāng)歷史數(shù)據(jù)不足時(shí),可能會(huì)影響補(bǔ)全效果,且計(jì)算復(fù)雜度高.
近年來(lái),矩陣補(bǔ)全方法在圖像處理、視頻修復(fù)等領(lǐng)域廣泛應(yīng)用[10],矩陣補(bǔ)全方法采用矩陣分解和重構(gòu),并確定優(yōu)化目標(biāo)函數(shù)得到最佳的結(jié)果. 許多學(xué)者將矩陣補(bǔ)全方法引入電力數(shù)據(jù)恢復(fù)中,以解決算法速度和精度的平衡問(wèn)題. Zhuang等[11]提出自適應(yīng)奇異值分解線性插值數(shù)據(jù)補(bǔ)全方法. Donti等[12]針對(duì)配電系統(tǒng)中低可觀測(cè)性問(wèn)題,提出低秩矩陣補(bǔ)全的電壓估計(jì)方法,能準(zhǔn)確預(yù)估電壓相量,并具有良好的魯棒性. Ghasemkhani等[13]提出正則化低秩張量補(bǔ)全方法,與傳統(tǒng)方法相比,所提方法有更好的插補(bǔ)精度.王毅等[14]建立基于低秩矩陣分解的母線異常數(shù)據(jù)辨識(shí)與修復(fù)模型,提高數(shù)據(jù)預(yù)測(cè)精度. 上述矩陣補(bǔ)全方法所需計(jì)算資源遠(yuǎn)少于機(jī)器學(xué)習(xí)方法,通用性較好.
目前,研究表明,電力負(fù)荷數(shù)據(jù)、低壓臺(tái)區(qū)用電數(shù)據(jù)等電力數(shù)據(jù)都具有周期性、相關(guān)性、隨機(jī)性等多種特征,均表現(xiàn)出低秩性[3]. 奇異值分解(SingularValue Decomposition , SVD)作為一種優(yōu)秀的矩陣補(bǔ)全算法,被許多學(xué)者用于數(shù)據(jù)處理方面. SVT是基于SVD提出的數(shù)據(jù)恢復(fù)算法,可用于實(shí)現(xiàn)電力數(shù)據(jù)恢復(fù),并有更好性能:收斂速度快、精度高[10]. 盡管SVT算法在數(shù)據(jù)補(bǔ)全方面取得了眾多進(jìn)展,但仍有不足之處:忽視數(shù)據(jù)固有的先驗(yàn)信息,大規(guī)模數(shù)據(jù)計(jì)算效率低[15]
為此,本研究針對(duì)海量電力數(shù)據(jù)中含有缺失、異常值等問(wèn)題,開(kāi)展基于改進(jìn)SVT的電力負(fù)荷數(shù)據(jù)恢復(fù)算法的研究,以實(shí)現(xiàn)精度與速度的最優(yōu)平衡.