賀 興,潘美琪,艾 芊
(1.電力傳輸與功率變換控制教育部重點實驗室(上海交通大學(xué)),上海市 200240;2.上海交通大學(xué)國家電投智慧能源創(chuàng)新學(xué)院,上海市 200240)
數(shù)據(jù)驅(qū)動(data-driven)是新型電力系統(tǒng)數(shù)字化轉(zhuǎn)型的核心范式(paradigm),涉及高維統(tǒng)計、深度學(xué)習(xí)、數(shù)字孿生等多項重要的新興理論與技術(shù)。數(shù)據(jù)驅(qū)動主要依托數(shù)據(jù)自身而非機理模型來構(gòu)建模型(可視為引擎),進(jìn)而驅(qū)動數(shù)據(jù)資源(可視為燃料)實現(xiàn)一種免模型(model-free)的數(shù)據(jù)賦能服務(wù)。數(shù)據(jù)驅(qū)動范式為電力系統(tǒng)運管調(diào)控各項業(yè)務(wù)注入了活力。然而,實際工程中往往面臨著樣本不足即“小樣本”問題,嚴(yán)重影響了數(shù)據(jù)驅(qū)動范式的最終效果。
小樣本問題可由以下原因造成:
1)樣本失衡:電力設(shè)備故障、電力系統(tǒng)暫態(tài)失穩(wěn)、極端氣候災(zāi)害等異常事件往往是小概率事件,在歷史數(shù)據(jù)庫中占比較低;基于不平衡樣本訓(xùn)練的模型傾向于高概率事件,難以給予異常事件足夠的關(guān)注。
2)“數(shù)力”(數(shù)據(jù)資產(chǎn)的數(shù)量和質(zhì)量)不足:新型電力系統(tǒng)正處于發(fā)展高峰期,新設(shè)備、場站的持續(xù)投運可能顯著地改變原系統(tǒng)的運營特性,降低有效數(shù)據(jù)樣本的數(shù)量與質(zhì)量,從而誘發(fā)過擬合等問題;隱私保護(hù)、傳感器異常等因素將進(jìn)一步加劇數(shù)力不足的問題。
3)模型失真:相比于顯性的數(shù)力不足,模型失真狀況相對不易覺察;新型電力系統(tǒng)中,大量新元素的涌入往往伴隨著新節(jié)點出現(xiàn)或電網(wǎng)拓?fù)浣Y(jié)構(gòu)變化,致使基于歷史數(shù)據(jù)訓(xùn)練的模型無法適用于實時場景。
綜上所述,小樣本問題已成為制約新型電力系統(tǒng)數(shù)字化轉(zhuǎn)型最終工程效果的重要因素之一。
上述背景下,本文以電力系統(tǒng)中的小樣本問題為出發(fā)點,對小樣本學(xué)習(xí)(few-shot learning,F(xiàn)SL)技術(shù)展開探索。FSL 在機器學(xué)習(xí)領(lǐng)域具有重大意義,是其發(fā)展的重要方向之一;是否擁有從少量樣本中學(xué)習(xí)和概括的能力,是(現(xiàn)行弱)人工智能和(強人工智能)人類智能的分界點。首先,本文從數(shù)據(jù)、特征、模型3 個層面對現(xiàn)行FSL 技術(shù)展開綜述分析;然后,綜述了FSL 技術(shù)在場景生成、故障診斷、功率預(yù)測、暫態(tài)穩(wěn)定評估等業(yè)務(wù)場景的研究現(xiàn)狀,并從數(shù)據(jù)、特征、模型3 個層面分析了其技術(shù)難點;最后,對全文工作進(jìn)行了總結(jié)與展望。
本章從數(shù)據(jù)、特征、模型3 個層面分別綜述了FSL 相關(guān)技術(shù)。首先,引入遷移學(xué)習(xí)(transfer learning,TL)技術(shù),TL 技術(shù)是FSL 技術(shù)的重要工具,旨在通過遷移源域知識來提高在目標(biāo)域上學(xué)習(xí)的最終表現(xiàn)。TL 技術(shù)在FSL 體系中的數(shù)據(jù)、特征、模型3 個層面均有體現(xiàn),如圖1 所示。
圖1 FSL 相關(guān)技術(shù)及其分類Fig.1 Relative technologies of FSL and their classification
1)在數(shù)據(jù)層面綜述了樣本遷移與樣本生成技術(shù):基于樣本遷移從其他輔助樣本中獲取數(shù)據(jù),或基于生成模型生成與原數(shù)據(jù)分布相似的新數(shù)據(jù);該技術(shù)通過實現(xiàn)數(shù)據(jù)增強,解決了數(shù)據(jù)不足與不平衡的問題,提升了數(shù)力[1]。
2)在特征層面綜述了特征遷移技術(shù):該技術(shù)通過形成公共可遷移特征空間,降低了特征偏移。
3)在模型層面綜述了模型在線更新技術(shù):該技術(shù)通過模型參數(shù)微調(diào),實現(xiàn)了系統(tǒng)狀態(tài)在線更新與實時跟隨,從而增強了模型輔助實時決策的能力。
1.1.1 樣本遷移
在數(shù)據(jù)稀缺時,樣本遷移方法通過使用相似的輔助樣本來擴充樣本集。在FSL 技術(shù)中,輔助樣本是源域,小樣本是目標(biāo)域。樣本遷移的目標(biāo)是選擇與目標(biāo)域分布接近的源域?qū)嵗龜U充訓(xùn)練集,以充分訓(xùn)練目標(biāo)域模型。TrAdaBoost 是一個典型的基于樣本遷移的模型,它降低了錯誤分類的源域樣本的權(quán)重,減弱了對分類器的影響。樣本遷移需要源域和目標(biāo)域的高度相似性和充足的源域樣本,但電力系統(tǒng)工程中的偶發(fā)故障可能不滿足這些條件。因此,需要利用目標(biāo)域樣本生成新樣本。
1.1.2 樣本生成
樣本生成是解決小樣本問題的重要手段,與電力領(lǐng)域仿真推演、元宇宙[2]等新興方向的技術(shù)強相關(guān)。樣本生成的典型模型分為變分自動編碼器(variational autoencoder,VAE)和 生 成 對 抗 網(wǎng) 絡(luò)(generative adversarial network,GAN)。
1)VAE。VAE 由一個編碼網(wǎng)絡(luò)和一個解碼網(wǎng)絡(luò)組成,文獻(xiàn)[3-4]詳細(xì)介紹了模型原理,其結(jié)構(gòu)如圖2 所示。
圖2 VAE 結(jié)構(gòu)示意圖Fig.2 Schematic diagram of VAE structure
為提高生成樣本的質(zhì)量,VAE 還有多個衍生版本。條件變分自編碼器(CVAE)模型[5]通過添加類別信息輔助特定類別樣本生成;重要加權(quán)變分自編碼器(IWAE)模型[6]通過增加隱藏變量采樣數(shù)量增強模型對不同數(shù)據(jù)分布的泛化能力;變分損失自編碼器(VLAE)[7]通過結(jié)合自回歸模型增強局部特征提取能力。VAE 的改進(jìn)模型從不同角度提升生成樣本的質(zhì)量,但這些改進(jìn)模型在電力系統(tǒng)的應(yīng)用相對較少或還未引入,很大原因在于其原理在本質(zhì)上并未改變,都是將似然函數(shù)假設(shè)為某一分布(通常是正態(tài)分布),具有一定的局限性。Goodfellow 等人不再進(jìn)行假設(shè),而是通過添加判別網(wǎng)絡(luò)擬合似然函數(shù),基于這一思想的GAN 模型往往可以獲得更高質(zhì)量的生成樣本[3]。
2)GAN。GAN 由一個生成網(wǎng)絡(luò)和一個判別網(wǎng)絡(luò)組成,文獻(xiàn)[3]詳細(xì)介紹了模型原理,其基本結(jié)構(gòu)如圖3 所示。
圖3 GAN 結(jié)構(gòu)示意圖Fig.3 Schematic diagram of GAN structure
由于GAN 不再假設(shè)樣本分布,生成過程通過隨機采樣生成樣本,這導(dǎo)致GAN 的訓(xùn)練需要更多的時間且收斂性難以保證。條件生成對抗網(wǎng)絡(luò)(CGAN)[8]引入條件信息作為約束條件,使生成網(wǎng)絡(luò)可以根據(jù)類別標(biāo)簽(如天氣、季節(jié)等)學(xué)習(xí)數(shù)據(jù)特征并定向生成樣本,但GAN 的訓(xùn)練過程仍不穩(wěn)定,存在梯度消失和模式崩壞問題。Wasserstein 生成對抗網(wǎng)絡(luò)(WGAN-GP)[9]引入梯度懲罰更新權(quán)重,并使用Wasserstein 距離代替JS 距離量度真假樣本分布之間的差異,可以穩(wěn)定訓(xùn)練過程且生成更高質(zhì)量的樣本[1],但相應(yīng)的代價是訓(xùn)練時間更長且樣本多樣性不足[10]。為獲得多元表征的效果,深層卷積生成對抗網(wǎng)絡(luò)(DCGAN)[11]基于卷積神經(jīng)網(wǎng)絡(luò)建立生成網(wǎng)絡(luò)與判別網(wǎng)絡(luò),提高神經(jīng)網(wǎng)絡(luò)的特征提取能力,可以更好地處理具有時空特性的高維數(shù)據(jù),但生成效果一般且訓(xùn)練過程不穩(wěn)定。
綜上所述,GAN 的生成效果良好,但由于缺少后驗分布而存在難以收斂和模式坍塌的問題[12],收斂性不如VAE,且對電力時空數(shù)據(jù)間多相關(guān)性的捕捉能力較弱[13]。GAN 的衍生模型從不同角度對傳統(tǒng)GAN 做出改進(jìn),但其優(yōu)勢往往并不互用。還有一些優(yōu)秀的GAN 改進(jìn)模型尚未被引入電力領(lǐng)域。例如,StackGAN 可以基于文本描述生成數(shù)據(jù),適合基于電力知識定向生成故障樣本;BigGAN 優(yōu)秀的穩(wěn)定性和超高生成能力使其幾乎成為目前表現(xiàn)最好的生成模型[10],適用于基于圖像的電力線路異常檢測。
3)生成數(shù)據(jù)評價指標(biāo)。評價生成數(shù)據(jù)與真實數(shù)據(jù)相似度可以從定性評價和定量評價兩個角度進(jìn)行。定性評價通過將高維數(shù)據(jù)投影在低維空間,提供可視化效果,主要方法有主成分分析(principal component analysis,PCA)法和t 分布隨機臨近嵌入(t-distributed stochastic neighbor embedding,t-SNE)法;定量評價主要有相關(guān)性分析、距離函數(shù)和基于下游任務(wù)表現(xiàn)效果等方法。其中,基于下游任務(wù)表現(xiàn)效果的定量評價是指:在故障分類、負(fù)荷預(yù)測等研究領(lǐng)域中,數(shù)據(jù)生成是優(yōu)化分類/預(yù)測效果的基礎(chǔ)支撐,部分文獻(xiàn)并未評估生成數(shù)據(jù)質(zhì)量,但下游任務(wù)(故障分類/負(fù)荷預(yù)測)效果間接反映了生成效果。因此,本文將其作為數(shù)據(jù)質(zhì)量評估指標(biāo)。
特征的選擇決定了模型的泛化性能?;谔卣鞯腇SL 實質(zhì)上是基于量度的遷移學(xué)習(xí),基本特點是使用距離函數(shù)衡量特征之間的差異,通過最小化源域與目標(biāo)域數(shù)據(jù)特征差異得到兩域的公共可遷移特征空間[14],在公共特征空間內(nèi)訓(xùn)練的模型可以跨域測試?;谔卣鞯腇SL 方法主要有遷移成分分析(transfer component analysis,TCA)、基于量度的網(wǎng)絡(luò)模型、對抗遷移學(xué)習(xí)模型等。
1.2.1 TCA
TCA 是使用核函數(shù)將源域樣本和目標(biāo)域樣本映射至高維再生核希爾伯特空間中。高維再生核希爾伯特空間中,源域和目標(biāo)域樣本間的最大均值差異(maximum mean discrepancy,MMD)為:
式中:xsrci為第i個源域樣本;xtari為第i個目標(biāo)域樣本;n1和n2分別為源域樣本和目標(biāo)域樣本的數(shù)量;H表示高維再生核希爾伯特空間;?(?)為映射函數(shù)(核函數(shù));x?src和x?tar分別為高維再生核希爾伯特空間中的源域和目標(biāo)域樣本。
TCA 通過最小化MMD 修正源域與目標(biāo)域樣本邊緣概率分布差異,使x?src和x?tar的分布相似,從而可以進(jìn)行訓(xùn)練分類任務(wù)[15]。
1.2.2 基于量度的網(wǎng)絡(luò)模型
基于量度的網(wǎng)絡(luò)模型與TCA 的基本思想一致,不同之處在于其映射方式采用神經(jīng)網(wǎng)絡(luò)。目前,基于量度的遷移學(xué)習(xí)網(wǎng)絡(luò)有孿生網(wǎng)絡(luò)、匹配網(wǎng)絡(luò)、原型網(wǎng)絡(luò)、關(guān)系網(wǎng)絡(luò)等模型,其量度方式、特點及缺陷如表1 所示。
表1 基于量度的遷移學(xué)習(xí)網(wǎng)絡(luò)Table 1 Measurement based transfer learning network
1.2.3 對抗遷移學(xué)習(xí)模型
對抗遷移學(xué)習(xí)模型中,特征提取器向標(biāo)簽分類器和域判別器輸出數(shù)據(jù)特征。其中,標(biāo)簽分類器根據(jù)特征劃分樣本類別,域判別器根據(jù)特征判別樣本來自源域還是目標(biāo)域,兩者通過梯度翻轉(zhuǎn)層與特征提取器連接。梯度翻轉(zhuǎn)層會在域判別誤差反向傳播過程中引入平衡系數(shù),使特征提取器不斷縮小源域與目標(biāo)域特征的邊緣分布距離[22],最終,域判別器難以辨別數(shù)據(jù)來自哪個域。域判別器與標(biāo)簽分類器聯(lián)合訓(xùn)練可以實現(xiàn)特征空間既具有公共性又具有判別性。公共性指不能根據(jù)特征區(qū)分源域與目標(biāo)域,判別性指根據(jù)這些特征可以進(jìn)行標(biāo)簽預(yù)測,完成分類任務(wù)。對抗遷移學(xué)習(xí)模型結(jié)構(gòu)如圖4 所示。
圖4 對抗遷移模型結(jié)構(gòu)Fig.4 Structure of adversarial transfer model
1.2.4 基于隨機矩陣的統(tǒng)計指標(biāo)
以上TCA、基于量度的網(wǎng)絡(luò)模型、對抗遷移學(xué)習(xí)模型都需要構(gòu)造公共特征空間,這就要求輔助樣本和小樣本之間具有一定的相似性,當(dāng)不滿足這一條件時,這3 種方法難以實施。隨機矩陣模型(random matrix model,RMM)基于高維統(tǒng)計提取高維多源拼接數(shù)據(jù)的深層特征,在缺乏可靠輔助樣本時仍然可以基于高維指標(biāo)判斷電力系統(tǒng)狀態(tài)。
RMM 以高維矩陣(電力時空數(shù)據(jù))為分析對象,通過特征值、線性特征根統(tǒng)計量、平均譜半徑等特征指標(biāo)實現(xiàn)對矩陣信息的凝煉。隨機矩陣?yán)碚撜J(rèn)為在某一事件擾動下,系統(tǒng)的運行機制和內(nèi)部狀態(tài)將會被影響,其統(tǒng)計隨機特性隨之改變,具體體現(xiàn)在特征指標(biāo)的異常[23]。RMM 通常結(jié)合滑動窗口法感知數(shù)據(jù)實時動態(tài)變化,對數(shù)據(jù)異常、缺失、異步有較好的包容性。
模型直接關(guān)聯(lián)數(shù)據(jù)驅(qū)動范式及其各類算法的最終工程效果。模型微調(diào)法是基于模型層面的FSL技術(shù)。基于源域訓(xùn)練模型,將訓(xùn)練好的模型參數(shù)劃分為凍結(jié)部分和非凍結(jié)部分。當(dāng)模型應(yīng)用于目標(biāo)域時,對比預(yù)測結(jié)果與真實結(jié)果的差異,通過反向誤差傳播機制更新非凍結(jié)部分網(wǎng)絡(luò)參數(shù),即可使用少量目標(biāo)域數(shù)據(jù)得到基于目標(biāo)域的模型。基于模型微調(diào)的遷移學(xué)習(xí)通常利用神經(jīng)網(wǎng)絡(luò)提取電力數(shù)據(jù)特征,通過優(yōu)化網(wǎng)絡(luò)層數(shù)、神經(jīng)元個數(shù)、凍結(jié)層個數(shù)提升模型特征提取能力與遷移能力[24-25]。
為提升訓(xùn)練效率,可以僅對與輸出結(jié)果密切相關(guān)的分類層進(jìn)行微調(diào)[26],或先用較大的學(xué)習(xí)率對非凍結(jié)部分進(jìn)行訓(xùn)練,再采用較小的學(xué)習(xí)率對整個網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過多階段參數(shù)調(diào)整提高算法精度并節(jié)約訓(xùn)練時間[27]。為提高模型挖掘源域與目標(biāo)域共同特征的能力,可以調(diào)整感受野的大小生成多種參數(shù)和層凍結(jié)策略,以分別應(yīng)用于不同的小樣本數(shù)據(jù)[28],或直接采用多尺度卷積核串行疊加和并行拼接的方式有效提取不同層級特征,還可以在源域數(shù)據(jù)訓(xùn)練時通過分層遷移保存每層最優(yōu)權(quán)重[29]。凍結(jié)層的模型參數(shù)是基于源域的先驗知識,體現(xiàn)了源域與目標(biāo)域的共同特征。因此,模型微調(diào)法對源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)分布相似度的要求較高,源域與目標(biāo)域數(shù)據(jù)越相似,需要調(diào)整的參數(shù)越少,且微調(diào)后的模型表現(xiàn)越好。
FSL 技術(shù)已在多個新型電力系統(tǒng)領(lǐng)域開展了示范應(yīng)用,但由于FSL 技術(shù)本身的特點和局限性,使其工程效果難以保障甚至無法有效應(yīng)用??紤]FSL 應(yīng)用于電力領(lǐng)域,從數(shù)據(jù)層面看,生成數(shù)據(jù)的目的是提供能反映原始樣本分布的仿真樣本,但完全相同的數(shù)據(jù)不符合工程場景動態(tài)變化的實際情況;從特征層面看,需要提供具有相似特征的歷史樣本等輔助信息;從模型層面看,參數(shù)調(diào)整的范圍、路徑都對最終效果有難以量化的影響。
面對上述挑戰(zhàn),本章綜述FSL 技術(shù)在場景生成、故障診斷、功率預(yù)測、暫態(tài)穩(wěn)定評估等業(yè)務(wù)應(yīng)用場景的研究現(xiàn)狀,并從數(shù)據(jù)、特征、模型3 個層面依次分析其技術(shù)難點。
以深度學(xué)習(xí)為代表的數(shù)據(jù)驅(qū)動方法憑借其強大的特征提取和高維分析能力,成為新型電力系統(tǒng)感知與預(yù)測領(lǐng)域研究的主流選擇。但在新型電力系統(tǒng)中,新加入的大量新能源設(shè)備往往不具備良好的數(shù)據(jù)條件支撐數(shù)據(jù)建模。通過生成數(shù)據(jù)增強訓(xùn)練集,可以直接在數(shù)據(jù)層面解決樣本不足的問題。近5 年內(nèi)的通過生成數(shù)據(jù)解決小樣本問題的部分代表性文獻(xiàn)如表2 所示。
表2 數(shù)據(jù)生成方法在新型電力系統(tǒng)中的應(yīng)用Table 2 Application of data generation methods in new power system
由表2 可以看出,當(dāng)前研究將相似性作為評判生成數(shù)據(jù)質(zhì)量的依據(jù),即認(rèn)為生成數(shù)據(jù)與歷史數(shù)據(jù)越相似則質(zhì)量越好,但高度相似的數(shù)據(jù)不符合工程場景動態(tài)變化的實際情況。因此,部分研究基于不同場景生成數(shù)據(jù)以滿足場景多樣化需求。文獻(xiàn)[40-41]為考慮氣象條件對新能源功率的影響,分別基于聚類算法、季節(jié)和天氣劃分歷史樣本類型,將功率和溫度、輻照強度等氣象數(shù)據(jù)作為輸入量,通過WGAN-GP 模型構(gòu)造面向多種氣象場景的高質(zhì)量光伏功率生成樣本;文獻(xiàn)[42]通過建立噪聲分布與日前場景集之間的映射關(guān)系,可以使模型具有多樣性表征能力,生成場景可體現(xiàn)新能源的隨機性。極端(氣候)場景作為影響新能源發(fā)電的風(fēng)險因素,將影響新型電力系統(tǒng)的安全與穩(wěn)定。場景的極端性需要考慮合適的指標(biāo)量度,功率平均值、峰谷差值、爬坡率、功率差值等設(shè)備狀態(tài)量可以有效反映場景極端程度,將這些極端場景指標(biāo)作為生成模型的附加條件,可以實現(xiàn)在一定范圍內(nèi)進(jìn)行極端場景生成。文獻(xiàn)[37]選取合適的轉(zhuǎn)移因子和歷史數(shù)據(jù)中較為極端的場景,先對數(shù)量較少的極端樣本進(jìn)行增強處理,再基于WGAN-GP 生成相似場景并入數(shù)據(jù)集,對原始數(shù)據(jù)集進(jìn)行重新分布處理。
以上研究雖然生成了多場景數(shù)據(jù),實現(xiàn)了電力應(yīng)用場景的多樣化,但對考慮生成數(shù)據(jù)分布波動性的研究較少。波動性與相似性相反,是指生成數(shù)據(jù)與歷史數(shù)據(jù)分布的偏差,相似性的不斷提高易導(dǎo)致生成模型泛化能力下降。文獻(xiàn)[43]引入拉格朗日乘子平衡VAE 隱空間維度與生成精度的關(guān)系,生成與原始樣本集概率分布相似、時序分布不同的電動汽車充電行為場景集。適當(dāng)增加生成數(shù)據(jù)的波動性可以實現(xiàn)與歷史數(shù)據(jù)的差異化,擴大適用范圍。然而,如何確定合適的波動程度,實現(xiàn)生成數(shù)據(jù)相似性與波動性的平衡是FSL 技術(shù)尚未解決的問題。
除了生成數(shù)據(jù)擴充訓(xùn)練樣本,F(xiàn)SL 技術(shù)還可以通過特征遷移建立源域與目標(biāo)域的公共特征空間,實現(xiàn)基于小樣本的感知與預(yù)測,這一方法依賴于與目標(biāo)域具有一定相似性的輔助樣本。例如,在軸承故障診斷領(lǐng)域:電力設(shè)備滾動軸承的型號多樣,某些型號的故障數(shù)據(jù)較少,而且軸承運行工況隨時間動態(tài)變化,不同時間區(qū)間內(nèi)的監(jiān)測數(shù)據(jù)是對應(yīng)不同工況的小樣本,但不同型號或不同工況的軸承工作原理相似,其振動信號樣本具有共性特征。文獻(xiàn)[44]通過局部最大均值距離來完成不同工況下同類故障特征的適配,削弱了因電機軸承工況變化造成的數(shù)據(jù)分布差異,實現(xiàn)變工況場景下軸承故障的有效診斷。
但在實際工程中,可能無法同時提供滿足上述要求的樣本。例如,設(shè)備的A 故障和B 故障發(fā)生機理相似且影響惡劣,但歷史數(shù)據(jù)只有A 故障樣本,僅基于A 故障樣本對B 故障進(jìn)行診斷,這一問題是極端的FSL 問題,也稱為零樣本故障診斷。零樣本問題無法通過生成數(shù)據(jù)解決。目前,有研究利用專業(yè)知識揭示A 故障與B 故障的關(guān)聯(lián)特征,通過知識嵌入定義潛在語義空間,在特征層面實現(xiàn)零樣本遷移學(xué)習(xí),但在電力系統(tǒng)故障診斷領(lǐng)域研究較少。
相比于軸承故障診斷,電力系統(tǒng)暫態(tài)穩(wěn)定評估對時效性的要求更高,評估模型需要滾動式監(jiān)測以適應(yīng)系統(tǒng)運行方式和拓?fù)涞淖兓话憷蒙倭繉崟r樣本更新模型局部參數(shù)[45]。為快速響應(yīng)系統(tǒng)狀態(tài)變化,部分研究基于系統(tǒng)當(dāng)前狀態(tài)仿真生成樣本,通過樣本遷移擴充訓(xùn)練集。當(dāng)系統(tǒng)狀態(tài)變化不大時,歷史數(shù)據(jù)與實時數(shù)據(jù)分布相似,可以基于模型分類效果篩選歷史樣本作為訓(xùn)練集[46];當(dāng)系統(tǒng)狀態(tài)變化較大時,則需要通過仿真生成樣本,并選擇距離相近的可遷移歷史樣本與仿真樣本共同組成訓(xùn)練集[47]。文獻(xiàn)[48]將模型在線更新分為兩個子階段:第1 階段通過領(lǐng)域自適應(yīng)挖掘無標(biāo)注數(shù)據(jù)信息,初步更新模型快速響應(yīng)異常;第2 階段通過樣本遷移更新模型參數(shù),直至評估模型性能恢復(fù)到較高水平。文獻(xiàn)[49]通過主動學(xué)習(xí)篩選信息價值較大的少量仿真數(shù)據(jù)用于更新模型參數(shù),顯著縮短了模型訓(xùn)練時間。另外,拓?fù)渥兓赡軙?dǎo)致模型輸入特征維數(shù)改變。當(dāng)特征維數(shù)改變時,模型不僅要更新參數(shù)還要調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)[50],采用圖神經(jīng)網(wǎng)絡(luò)作為特征提取器可以拓展節(jié)點,很好地適應(yīng)特征維度的變化[47]。
由于調(diào)整對象往往是黑箱模型,對提取不同層級抽象特征的網(wǎng)絡(luò)進(jìn)行更新,其效果可解釋性較差。因此,模型參數(shù)調(diào)整缺乏科學(xué)理論的指導(dǎo)體系和系統(tǒng)性的尋優(yōu)策略,需要人工篩選方案。模型參數(shù)調(diào)整過程的可解釋性重點包括:1)關(guān)鍵特征的可解釋性,提供影響模型決策的關(guān)鍵特征及其對模型決策的貢獻(xiàn)度;2)決策機制的可解釋性,實現(xiàn)認(rèn)識模型參數(shù)更新動機、更新機制,在此基礎(chǔ)上形成科學(xué)的改進(jìn)方法。
數(shù)據(jù)驅(qū)動及其相關(guān)的機器學(xué)習(xí)和深度學(xué)習(xí)算法,已經(jīng)成為新型電力系統(tǒng)建設(shè)和數(shù)字化轉(zhuǎn)型的重要支持。在電力領(lǐng)域,針對數(shù)據(jù)不足的現(xiàn)狀,F(xiàn)SL技術(shù)具有廣泛的應(yīng)用前景。本文從FSL 技術(shù)的不同層面(基于數(shù)據(jù)、特征和模型)介紹了其關(guān)鍵技術(shù)和特點,并探討了FSL 技術(shù)在新型電力系統(tǒng)中場景生成、故障診斷、非侵入式負(fù)荷監(jiān)測、暫態(tài)穩(wěn)定評估等業(yè)務(wù)的應(yīng)用現(xiàn)狀。同時,也明確了FSL 技術(shù)在電力領(lǐng)域的不足和挑戰(zhàn),為FSL 技術(shù)在電力系統(tǒng)中的應(yīng)用和發(fā)展提供了有益的指導(dǎo)和參考。
電力領(lǐng)域仍然存在許多待研究的FSL 問題。例如,F(xiàn)SL 可以有效地構(gòu)建電力知識圖譜,這是一個結(jié)構(gòu)化的語義知識庫,需要從文本中提取關(guān)鍵信息,形成清晰的知識結(jié)構(gòu),以管理電力系統(tǒng)中的大量實體、屬性和關(guān)聯(lián)關(guān)系。處理多源異構(gòu)的文本信息是構(gòu)建電力知識圖譜的關(guān)鍵步驟,而傳統(tǒng)的基于人工或關(guān)鍵字索引的方法效率較低,難以滿足信息多樣性和復(fù)雜性的要求。FSL 技術(shù)可以通過少量標(biāo)注樣本來完成文本分類和句間關(guān)系等任務(wù),從而創(chuàng)建結(jié)構(gòu)明確、關(guān)系清晰的電力知識圖譜[51]。此外,電力系統(tǒng)中的隱私保護(hù)問題也需要考慮。由于不同利益主體之間存在數(shù)據(jù)隔離,聯(lián)邦學(xué)習(xí)等方法被用于加密處理數(shù)據(jù)[52]。引入FSL 技術(shù)可以幫助開發(fā)更高效的聯(lián)邦學(xué)習(xí)方案,減輕通信和計算負(fù)擔(dān)。
在推進(jìn)電力系統(tǒng)信息化、數(shù)字化和智能化的過程中,從示范區(qū)到全域推廣是必經(jīng)之路。然而,示范區(qū)的歷史數(shù)據(jù)和經(jīng)驗相對有限,被視為“小樣本”。如何從示范工程中提取通用性知識,確保其準(zhǔn)確性和可推廣性,將試點經(jīng)驗擴展到整個電力系統(tǒng),是一個長期面臨的FSL 問題。同時,這也是人工智能領(lǐng)域的共性前沿問題,需要綜合運用復(fù)雜系統(tǒng)理論、高維分析、數(shù)字孿生等多門新興數(shù)據(jù)科學(xué)技術(shù),進(jìn)行系統(tǒng)性討論和定量分析。綜上所述,電力系統(tǒng)中的“小樣本”問題將在相當(dāng)長的一段時間持續(xù)構(gòu)成挑戰(zhàn)。為系統(tǒng)性地解決該問題,需要將專業(yè)知識、專家經(jīng)驗與數(shù)據(jù)科學(xué)有機結(jié)合,從而提升FSL 技術(shù)的最終工程效果。