孫安黎 向 春 喻建波
(重慶電力設(shè)計(jì)院有限責(zé)任公司 重慶 401120)
三維設(shè)計(jì)主成分分析(Principal Component Analysis,3DPCA)通常使用于模式識別、特征提取等方面的一種統(tǒng)計(jì)學(xué)理論方法。該方法能夠有效、精準(zhǔn)地提取出所需的主成分,去除非主成分[1]。電網(wǎng)工程算量信息包括對象化工程和非對象化工程計(jì)算的相關(guān)信息。由于電網(wǎng)工程算量包含的種類較多,且每個(gè)種類對應(yīng)多個(gè)單項(xiàng)指標(biāo),指標(biāo)之間又存在或多或少的關(guān)聯(lián)性,主要信息和非主要信息混雜在一起,使信息提取變得很困難。為了更好地管理電網(wǎng)工程的算量信息,如何確定幾個(gè)重要單項(xiàng)狀態(tài)量的權(quán)重顯得尤其重要[2]。
目前針對電網(wǎng)工程算量信息權(quán)重提取方法的研究有很多,例如:徐長寶等[3]研究的基于貝葉斯理論的繼電保護(hù)設(shè)備狀態(tài)評價(jià)權(quán)重更新方法,該方法依據(jù)繼電保護(hù)設(shè)備的各狀態(tài)指標(biāo),利用貝葉斯理論的先驗(yàn)概率思想進(jìn)一步提取、融合繼電保護(hù)設(shè)備實(shí)際運(yùn)行數(shù)據(jù)特征得到權(quán)重的分布,但是該方法在獲取權(quán)重分布時(shí)的召回率略低;白恒遠(yuǎn)等[4]研究基于拉格朗日函數(shù)的配電網(wǎng)評價(jià)指標(biāo)權(quán)重,該方法利用拉格朗日函數(shù)的經(jīng)濟(jì)學(xué)意義來確定指標(biāo)權(quán)重,但是該方法確定的權(quán)重并非是原始指標(biāo)的權(quán)重,而是經(jīng)過分析之后的各個(gè)成分的權(quán)重,無法直接加以利用。因此,為了提高電網(wǎng)工程算量信息權(quán)重提取的效率,提出基于三維設(shè)計(jì)主成分分析算法的電網(wǎng)工程算量信息權(quán)重提取方法,更好地管理電網(wǎng)工程算量信息。
為了實(shí)現(xiàn)三維設(shè)計(jì)的空間中的電網(wǎng)工程算量信息權(quán)重的采集,需要確定三維設(shè)計(jì)空間內(nèi)的電網(wǎng)工程算量信息的內(nèi)容[5]。
設(shè)定3DPCA的協(xié)方差三維矩陣為:
(1)
1) 高維張量二維矩陣展開方式:以N=3為例,設(shè)置H∈Rb1×b2×…×bN的N維張量可開展為H1、H2、H3的三種二維矩陣。H的奇異值分解為:
(2)
式中:W是H的奇異值三維矩陣;×N為N模式乘法;D(N)是對應(yīng)H的N模式的酉矩陣。
通過高階張量展開式(2)后得出:
H(N)=D(N)·W(N)·(D(N+1)?D(N+2)…D(N)?
D(1)?D(2)…D(N-1))T
(3)
式中:?為Kronecker乘積;T為階數(shù)。
式(3)能夠轉(zhuǎn)換為下述三種方式:
(4)
(5)
圖1 3DPCA算法流程
通過采集的電網(wǎng)工程算量信息,可進(jìn)一步建立評判矩陣,以提取電網(wǎng)工程算量信息權(quán)重。
評判矩陣是電網(wǎng)工程算量信息權(quán)重提取的基礎(chǔ),提取電網(wǎng)工程算量信息權(quán)重信息量,需要確定其重要指數(shù)的單項(xiàng)算量信息指標(biāo)數(shù)量h,通過對電網(wǎng)工程算量具有豐富經(jīng)驗(yàn)的Q位專家人員(ZJ),得出h組算量信息Sh專家評分值Pi,j,i=1,2,…,Q;j=1,2,…,Q,其中每組數(shù)據(jù)中具備Q個(gè)元素,以此得出專家人員打分評判如表1所示。
表1 專家人員評分表
由于各專家人員所在的崗位和研究方向不同,導(dǎo)致評分結(jié)果存在誤差。但是經(jīng)過研究發(fā)現(xiàn),咨詢的專家人數(shù)越多,最終獲取的工程算量信息權(quán)重指數(shù)就越科學(xué)。因此,為保證所提取到的電網(wǎng)工程算量信息權(quán)重的精準(zhǔn)性,通過各專家人員給出的指標(biāo)評分之間的線性關(guān)系,簡化指標(biāo)評分[8-9]。通過主成分分析法獲取電網(wǎng)工程算量信息權(quán)重。
電網(wǎng)工程算量信息權(quán)重獲取的過程就是利用主成分分析法,以提取到的電網(wǎng)工程算量信息內(nèi)容為基礎(chǔ),結(jié)合評判矩陣,獲取綜合評價(jià)函數(shù)的過程[10]。其核心是從新的三維矩陣中的獲取的電網(wǎng)工程算量信息的內(nèi)容后,選擇幾種主成分指標(biāo),使這些主成分指標(biāo),盡量具有完整的原來指標(biāo)的信息,并且指標(biāo)之間沒有關(guān)聯(lián)[11]。保證主要工程算量信息不丟失的情況下,解決了指標(biāo)間的共線性,其基本原理是:通過一個(gè)正交變換,將與指標(biāo)相關(guān)的原始隨機(jī)變量X=(x1,x2,…,xp)T轉(zhuǎn)換成與其不相關(guān)的新的隨機(jī)多維變量C=(c1,c2,…,cp)T,并指向已選指標(biāo)樣本點(diǎn)分布最大的p個(gè)方向,對多維變量U完成降維處理,使其轉(zhuǎn)換成一個(gè)精度很高的低維變量[12]。主成分分析算法計(jì)算電網(wǎng)工程算量信息權(quán)重,可以看作是通過因子載荷矩陣獲取原始指標(biāo)變量的線性組合,將因子載荷矩陣中的每列系數(shù)矩陣與其相應(yīng)特征值的平方根相除,得出指標(biāo)在主成分中的比重,將每個(gè)主成分所對應(yīng)的特征值,占所提取主成分總的特征值之和的比例,作為權(quán)重計(jì)算主成分綜合模型[12-15]。綜合模型中的比重,經(jīng)歸一化處理得到因子在綜合模型中的權(quán)重。
權(quán)重模型就是主成分模型,其為:
(6)
式中:分析后取得的m個(gè)主成分和決策矩陣中的系數(shù)分別為K1,K2,…,Km和cQj,各指標(biāo)i的權(quán)重指數(shù)為φi,(i=1,2,…,Q)。由于在主成分分析時(shí),獲取的結(jié)果是一個(gè)初始因子載荷kQj,并不是決策矩陣中的系數(shù),因此兩者之間的換算公式為:
(7)
式中:ξj為主成分特征值,j=1,2,…,m。
根據(jù)式(6)和式(7),建立綜合評價(jià)函數(shù)KZ為:
(8)
κ=ξ1+ξ2+…+ξm
(9)
式中:φ1,φ2,…,φQ為指標(biāo)o1,o2,…,oQ在主成分中的綜合重要度;κ為所有主成分特征值之和。
結(jié)合式(9)和專家評分值,獲取原指標(biāo)的綜合值SZi為:
(10)
根據(jù)式(9)獲取各指標(biāo)權(quán)重指數(shù)為:
(11)
結(jié)合式(8)-式(11)獲取二級權(quán)重模型為:
(12)
綜上,通過高階張量奇異值分解方法保留主成分,根據(jù)新形成的三維矩陣,提取權(quán)重的信息的初始位置,獲取完整的電網(wǎng)工程算量的信息內(nèi)容;依據(jù)電網(wǎng)工程算量的信息內(nèi)容獲取電網(wǎng)工程算量信息主成分指標(biāo),通過建立權(quán)重模型獲取主成分特征值和初始因子載荷,完成各指標(biāo)權(quán)重指數(shù)提取。
以某電網(wǎng)公司的工程算量中的對象化工程算量和非對象化工程算量兩大種類指標(biāo)為測試對象。選取對象化工程算量中的5個(gè)相關(guān)單項(xiàng)指標(biāo)為:電纜溝、檢查井、端子箱、線路塔桿和框架柱。選取的非對象化工程算量中的5個(gè)相關(guān)單項(xiàng)指標(biāo)為:排水、電氣照明、零星砌體、地基處理和場地平整。采用本文方法提取該電網(wǎng)工程算量信息權(quán)重,并通過對比方法驗(yàn)證本文方法優(yōu)勢。
邀請5位專家人員根據(jù)單項(xiàng)指標(biāo)算量信息和綜合算量信息之間的關(guān)聯(lián)度,完成單項(xiàng)指標(biāo)算量評分,獲取評價(jià)得分表如表2所示。
表2 單項(xiàng)指標(biāo)算量信息專家評分表(分)
表2中,1分為不重要;2分為不太重要;3分為一般重要;4分為比較重要;5分為非常重要。
將表2中的單項(xiàng)指標(biāo)原狀態(tài)算量信息,進(jìn)行主成分分析,獲取主成分單項(xiàng)指標(biāo)初始因子載荷和成分特征值,分別如表3和表4所示。
表3 主成分單項(xiàng)指標(biāo)初始因子載荷
表4 成分特征值
主成分?jǐn)?shù)量提取原則是對應(yīng)主成分特征值大于1,并且主成分貢獻(xiàn)率≥85%的前m個(gè)主成分。分析表3數(shù)據(jù)可知,該電網(wǎng)公司的工程算量中的對象化工程算量和非對象化工程算量均有兩個(gè)主成分,對于對象化工程算量而言,電纜溝、框架柱兩項(xiàng)單項(xiàng)指標(biāo)在主成分2上的載荷較高,說明主成分2可以顯著體現(xiàn)電纜溝、框架柱的信息;線路塔桿、檢查井和端子箱等單項(xiàng)指標(biāo)在主成分2上的載荷較高,說明主成分1主要體現(xiàn)這三種信息。同理可知在非對象化工程算量中,主成分1主要體現(xiàn)地基處理、場地平整、零星砌體和電氣照明4項(xiàng)信息,主成分2主要體現(xiàn)排水信息。綜上可知,主成分1和主成分2基本可以體現(xiàn)該電網(wǎng)工程算量的全部信息。
利用式(7)計(jì)算表4中的結(jié)果,可以得出cQj;結(jié)合表2、表4及式(6)得出的結(jié)果,一同代入式(12)中,得出對象化和非對象化工程算量中各單項(xiàng)指標(biāo)算量信息的權(quán)重指數(shù)依照表4中的排列順序由上到下依次為0.115、0.1306、0.205、0.191、0.145 9、0.211、0.145 8、0.115 8、0.210 5和0.130 7。
2.2.1召回率測試
為驗(yàn)證本文方法的提取性能,采用基于貝葉斯理論的繼電保護(hù)設(shè)備狀態(tài)評價(jià)權(quán)重更新方法(文獻(xiàn)[3]方法)和基于拉格朗日函數(shù)的配電網(wǎng)評價(jià)指標(biāo)權(quán)重提取方法(文獻(xiàn)[4]方法)與本文方法作對比,選取召回率和F1-measure均值作為方法的測試指標(biāo)。召回率越大表明提取結(jié)果越精準(zhǔn);F1-measure均值越大,提取效果越好。隨機(jī)選取對象化工程算量中的端子箱單項(xiàng)指標(biāo)進(jìn)行10次提取測試,測試結(jié)果如圖2和圖3所示。
圖2 三種方法的召回率對比結(jié)果
圖3 三種方法的F-measure均值對比結(jié)果
分析圖2圖3可以得出:本文方法的召回率和F1-measure均值分別為97.5%、97.0%左右,文獻(xiàn)[3]方法的召回率和F-measure均值分別為94%和93%左右,文獻(xiàn)[3]方法的召回率和F-measure均值分別為90%和89.6%左右,說明本文方法信息提取的查全性較好,具備明顯優(yōu)勢。實(shí)驗(yàn)結(jié)果表明本文方法的電網(wǎng)工程算量信息提取效果好,原因在于本文方法在信息提取時(shí),去除了影響工程算量信息提取的冗余信息,獲取完整的電網(wǎng)工程算量的信息內(nèi)容,使信息提取效果更好。
2.2.2準(zhǔn)確率測試
為了驗(yàn)證本文方法對電網(wǎng)工程算量信息權(quán)重提取的準(zhǔn)確性,測試三種方法在沒有噪聲和有噪聲的情況下,對象化工程算量的5項(xiàng)指標(biāo)的信息權(quán)重提取的準(zhǔn)確率,測試結(jié)果如表5所示。
表5 五項(xiàng)指標(biāo)信息權(quán)重提取準(zhǔn)確率對比結(jié)果(%)
通過觀察表5可以看出:本文方法在沒有噪聲和有噪聲的情況下,提取不同的單項(xiàng)指標(biāo)信息權(quán)重準(zhǔn)確率均在98.5%以上,另外兩種對比方法在沒有噪聲的和有噪聲的情況下,準(zhǔn)確率均在94%以下,且存在較大浮動。說明本文方法具備較高的電網(wǎng)工程算量信息權(quán)重提取準(zhǔn)確率,且?guī)缀醪皇茉肼曈绊憽?/p>
2.2.3效率測試
為了測試本文方法的提取效率,測試三種方法在15 s內(nèi),提取大小不同的對象化工程算量信息權(quán)重時(shí)的提取效率,對比結(jié)果如圖4所示。
圖4 三種方法提取效率對比結(jié)果
分析圖4可以看出:在相同的15 s的時(shí)間內(nèi),針對不同大小的算量,信息權(quán)重提取效率均在96%以上,即便信息大小為500 GB時(shí),本文方法在15 s內(nèi)依舊完成96.4%的算量信息權(quán)重提取;另外兩種對比方法,隨著算量信息大小的增加,提取效率明顯下降,當(dāng)信息大小為500 GB時(shí),分別完成了82.1%和78.2%的算量信息權(quán)重提取,明顯低于本文方法的提取效率。說明本文方法的提取效率較高,能夠快速地完成工程算量信息權(quán)重提取。
綜上所述,本文方法的召回率和F1-measure均值分別為97.5%、97.0%左右,在沒有噪聲和有噪聲的情況下,提取不同的單項(xiàng)指標(biāo)信息權(quán)重準(zhǔn)確率均在98.5%以上,在相同的15 s的時(shí)間內(nèi),針對不同大小的算量,信息權(quán)重提取效率均在96%以上,即便信息大小為500 GB時(shí),本文方法在15 s內(nèi)依舊完成96.4%的算量信息權(quán)重提取。主要原因在于本文方法引入三維設(shè)計(jì)主成分分析,得出要提取權(quán)重的信息的初始位置,并采用區(qū)域生長法,獲取完整的電網(wǎng)工程算量的信息內(nèi)容,更好地管理電網(wǎng)工程的算量信息。
本文研究了基于三維設(shè)計(jì)主成分分析算法的電網(wǎng)工程算量信息權(quán)重提取方法,三維設(shè)計(jì)主成分分析算法能夠有效、精準(zhǔn)地提取出所需的主成分,去除非主成分特點(diǎn)獲取電網(wǎng)工程算量信息內(nèi)容,基于此信息內(nèi)容,采用主成分分析法的權(quán)重指數(shù)確定方法,建立了權(quán)重計(jì)算模型,實(shí)現(xiàn)電網(wǎng)工程算量信息權(quán)重提取。然而,針對基于三維設(shè)計(jì)主成分分析算法的電網(wǎng)工程算量信息權(quán)重提取,還需不斷進(jìn)行拓展研究,例如實(shí)現(xiàn)變電工程的量價(jià)聯(lián)合計(jì)算、自動計(jì)算、如何運(yùn)用到輸變電工程甚至電網(wǎng)工程全面造價(jià)管理等問題,以及如何基于三維設(shè)計(jì)主成分分析,實(shí)現(xiàn)數(shù)字化的電網(wǎng)工程管理。