孟子杰,吳龍騰,蔡新雷,黎嘉明,梁升洪
(1.廣東電網(wǎng)調(diào)度控制中心,廣東廣州 510600;2.肇慶供電局電力調(diào)度控制中心,廣東 肇慶 526201)
智能配網(wǎng)安全和最優(yōu)經(jīng)濟(jì)運(yùn)行是持續(xù)性研究的關(guān)鍵課題[1-2]。目前我國(guó)用電負(fù)荷日益攀升,供電短缺問(wèn)題非常嚴(yán)重。電力調(diào)度是電力生產(chǎn)與分配的關(guān)鍵,在發(fā)電與供電企業(yè)中均占據(jù)重要地位[3]。調(diào)度員為電網(wǎng)操作者,肩負(fù)著電網(wǎng)穩(wěn)定安全運(yùn)行的職責(zé)。各級(jí)別調(diào)度均規(guī)劃出嚴(yán)格的電力調(diào)度操作規(guī)范與記錄的填寫需求,下發(fā)每項(xiàng)調(diào)度命令前要謹(jǐn)慎填寫和打印調(diào)度命令票,調(diào)度命令票即為電網(wǎng)設(shè)備操作中最為核心的步驟[4]。
為確保調(diào)度命令票內(nèi)容嚴(yán)謹(jǐn)性與可靠性,該文在獲取調(diào)度文本內(nèi)容的同時(shí),使用基于規(guī)則的設(shè)計(jì)標(biāo)準(zhǔn),完成語(yǔ)義合規(guī)性校驗(yàn)?zāi)P偷臉?gòu)建。
為準(zhǔn)確校驗(yàn)智能配網(wǎng)調(diào)度命令票語(yǔ)義合規(guī)性是否符合要求,首先采集調(diào)度命令票中的文本數(shù)據(jù)。將調(diào)度命令票數(shù)據(jù)作為研究目標(biāo),創(chuàng)建蟻群優(yōu)化下的文本數(shù)據(jù)采集方法。蟻群優(yōu)化算法包含如下步驟:更改信息素更新模式、增添信息素負(fù)載調(diào)節(jié)元素。
設(shè)定待處理文本集合為Task,可用服務(wù)器集合為M,分別描述為:
式中,Taski代表第i個(gè)任務(wù)僅在一個(gè)服務(wù)器內(nèi)接收,Mj是第j個(gè)服務(wù)器。
智能電網(wǎng)調(diào)度取決于待處理任務(wù)與服務(wù)器,對(duì)Task 和M采取笛卡爾積運(yùn)算,獲得調(diào)度數(shù)據(jù)集合K。依照K值推算出調(diào)度命令票打印執(zhí)行時(shí)間,打印時(shí)間為T。
初始化蟻群優(yōu)化算法內(nèi)的啟發(fā)函數(shù)與信息素函數(shù),依次將兩個(gè)函數(shù)解析式記作:
信息素函數(shù)代表Taski分配至Mj的信息素濃度,Δτij為信息素增量,1-ρ是信息素濃度殘余量。在螞蟻k實(shí)現(xiàn)一次遍歷后,獲得遍歷選擇節(jié)點(diǎn)局部信息素更新后的增量值:
更新全局信息素最佳路徑增量,得到:
螞蟻b從目前節(jié)點(diǎn)i訪問(wèn)下一個(gè)鄰近節(jié)點(diǎn)j的幾率是:
式中,α、β分別為螞蟻在打印調(diào)度命令票時(shí)路徑內(nèi)的殘余信息素與啟發(fā)式數(shù)據(jù)對(duì)智能電網(wǎng)調(diào)度的影響。
引入信息素負(fù)載調(diào)節(jié)元素[5],記載各臺(tái)服務(wù)器目前打印調(diào)度命令票的時(shí)間,將信息素函數(shù)改寫為:
對(duì)比全部螞蟻此次迭代內(nèi)的路徑,挑選最佳路徑,調(diào)節(jié)信息素[6],記載此次挑選的目前最優(yōu)解。憑借調(diào)整后的信息素與啟發(fā)式數(shù)據(jù)實(shí)施下一次搜尋,直至迭代終止。從迭代結(jié)果內(nèi)挑選最優(yōu)解,完成數(shù)據(jù)采集任務(wù)。
獲得調(diào)度命令票內(nèi)的文本數(shù)據(jù)后,使用k 均值聚類算法將具有相同特性的調(diào)度命令票語(yǔ)義內(nèi)容聚類在一起,減少后續(xù)校驗(yàn)操作復(fù)雜度。k 均值聚類算法類屬聚類技術(shù)內(nèi)的基礎(chǔ)分類手段,擁有簡(jiǎn)便快捷的計(jì)算優(yōu)勢(shì)。k 均值聚類算法將歐式距離當(dāng)作相似度權(quán)衡標(biāo)準(zhǔn),歐式距離計(jì)算公式記作:
式中,x1,x2,…,xn為文本數(shù)據(jù)的橫向序列,y1,y2,…,yn為文本數(shù)據(jù)的縱向序列。k 均值聚類算法使用偏差平方與準(zhǔn)則函數(shù)[7]當(dāng)作聚類標(biāo)準(zhǔn),描述成:
其中,k表示要構(gòu)成聚類的數(shù)量,nj是第j類內(nèi)樣本數(shù)量,mj是第j類樣本平均值,也是此種類型集合的核心點(diǎn):
從N個(gè)樣本數(shù)據(jù)目標(biāo)任意擇取D個(gè)點(diǎn)當(dāng)作原始聚類中心,針對(duì)其他剩余點(diǎn),按照其自身和聚類中心的間距,依次將其配發(fā)至和自身最相近的聚類集合,再推算新聚類集合的聚類中心,按照相似度完成重新分配[8-9],重復(fù)執(zhí)行以上操作,直至各個(gè)簇中的對(duì)象不會(huì)發(fā)生改變?yōu)橹埂?/p>
研究傳統(tǒng)k 均值聚類算法可知,D值是預(yù)先設(shè)定的,在真實(shí)應(yīng)用中,D值的挑選過(guò)程難度很高,多數(shù)情況下無(wú)法獲得準(zhǔn)確數(shù)值。k 均值聚類算法任意擇取原始聚類中心,致使很多的迭代結(jié)果精度不高[10]。下面對(duì)傳統(tǒng)k 均值聚類算法做出以下完善:
想獲取準(zhǔn)確的聚類結(jié)果,最大限度維持每個(gè)聚類中心的間距為最大,因此,設(shè)計(jì)一個(gè)最遠(yuǎn)距離下的原始聚類中心挑選方法。
最遠(yuǎn)距離方法首先要獲取參加聚類的N個(gè)數(shù)據(jù)目前兩兩之間的間距,繼而構(gòu)造距離矩陣[11]。掃描矩陣擇取全部目前距離最遠(yuǎn)的兩個(gè)點(diǎn)當(dāng)作前兩個(gè)原始聚類中心。挑選不同的中心點(diǎn),直至中心點(diǎn)數(shù)量與D值相等。利用余弦夾角推算矢量之間的相似度,將余弦夾角距離運(yùn)算過(guò)程描述成:
矢量之間的相似度和余弦值為反比例關(guān)聯(lián),余弦值越高,表明兩個(gè)點(diǎn)的間距越小,反之兩點(diǎn)之間的距離越大。k 均值聚類算法的關(guān)鍵點(diǎn)是明確D值,也就是聚類數(shù)量。由于傳統(tǒng)方法缺少得到D值的先驗(yàn)知識(shí),因此對(duì)D值的計(jì)算難度較高。一般狀態(tài)下,聚類數(shù)量要遠(yuǎn)低于樣本集合內(nèi)的目標(biāo)總量,不然會(huì)削減后續(xù)校驗(yàn)?zāi)P陀?jì)算結(jié)果精度。該文使用和錯(cuò)誤率相似的目標(biāo)函數(shù)來(lái)完善調(diào)度命令票文本數(shù)據(jù)測(cè)量性能。
設(shè)定xi為第i個(gè)目標(biāo)的矢量,ci∈{1,k}表示與之相呼應(yīng)的聚類索引,創(chuàng)建一個(gè)明確聚類D值的方法[12],即求解聚類平均值的總方差:
關(guān)于各個(gè)目標(biāo)的矢量xi及其聚類平均值mci,算出N個(gè)文本的平方誤差均值E(k),更改k值,計(jì)算出三個(gè)聚類集合,并返回k 均值聚類算法。利用k值的改變對(duì)比目標(biāo)函數(shù)值大小,挑選k值的基礎(chǔ)原則是增加k值,對(duì)應(yīng)的方差不會(huì)減小。
假如用戶不知曉智能配網(wǎng)調(diào)度命令票文本數(shù)據(jù)目標(biāo)集合分布情況,就不能選定一個(gè)恰當(dāng)?shù)腄值。改進(jìn)后的k 均值聚類算法可完成簇個(gè)數(shù)D的自適應(yīng)評(píng)判,利用聚類結(jié)果及聚類均值方差總和獲得最優(yōu)聚類結(jié)果相應(yīng)的D值。對(duì)于N個(gè)文本目標(biāo)聚類,其簇的個(gè)數(shù)一定低于D值。
通過(guò)上述計(jì)算過(guò)程,把調(diào)度命令票按特征分為不同的數(shù)據(jù)集合,此時(shí)要進(jìn)一步對(duì)其進(jìn)行合規(guī)性校驗(yàn)。該文創(chuàng)建一個(gè)基于規(guī)則的語(yǔ)義合規(guī)性校驗(yàn)?zāi)P?,系統(tǒng)性分析模型構(gòu)建過(guò)程及其性能。
針對(duì)普通用戶,模型供應(yīng)的圖像界面配備規(guī)則文件,具備可擴(kuò)展標(biāo)記語(yǔ)言基礎(chǔ)知識(shí)的用戶,采用規(guī)則描述文檔[13],模仿可擴(kuò)展標(biāo)記語(yǔ)言文件模式直接完成校驗(yàn)工作;具備相關(guān)編程知識(shí)的用戶,則能創(chuàng)建專屬的規(guī)則類,拓寬規(guī)則類型,使語(yǔ)義合規(guī)性校驗(yàn)的應(yīng)用范圍更加廣泛,降低校驗(yàn)失誤的可能性。
所建模型包含數(shù)據(jù)格式變換、重復(fù)記錄辨別、規(guī)則設(shè)定和分析、數(shù)據(jù)校驗(yàn)、結(jié)果顯示和交互等模塊,模型運(yùn)行過(guò)程如圖1 所示。
圖1 語(yǔ)義合規(guī)性校驗(yàn)?zāi)P瓦\(yùn)行過(guò)程
3.2.1 數(shù)據(jù)格式變換
用戶挑選需要校驗(yàn)的調(diào)度命令票數(shù)據(jù)項(xiàng),加載相對(duì)的數(shù)據(jù)表、Excel 數(shù)據(jù)表,通過(guò)數(shù)據(jù)格式變換模塊將數(shù)據(jù)表封裝成Java 數(shù)據(jù)目標(biāo)列表[14]。數(shù)據(jù)變換操作中,還能挖掘調(diào)度命令的調(diào)度類型錯(cuò)誤,變換流程如圖2 所示。
圖2 數(shù)據(jù)格式變換流程示意圖
3.2.2 重復(fù)記錄辨別與規(guī)則設(shè)定
按照編輯距離和距離算法,尋找相似度較多的記錄,讓用戶估算是否具備多次錄入狀況。
在用戶設(shè)定的校驗(yàn)規(guī)范內(nèi),某些值源自往年觀測(cè)數(shù)據(jù)的平均值、最高值、最低值、空間變異等統(tǒng)計(jì)變量,用戶按照自己對(duì)網(wǎng)絡(luò)的熟練程度,使用不同的層次設(shè)定,拓展原始規(guī)則庫(kù)。
3.2.3 數(shù)據(jù)校驗(yàn)與輸出
憑借用戶自定義的規(guī)則,對(duì)數(shù)據(jù)表實(shí)施校驗(yàn),同時(shí)把校驗(yàn)結(jié)果記錄至各個(gè)錯(cuò)誤列表內(nèi)。數(shù)據(jù)輸出過(guò)程中,用戶根據(jù)校驗(yàn)結(jié)果,挑選是否進(jìn)行校驗(yàn)值輸出,輸出包含兩種模式[15]:一是以Excel 表的模式導(dǎo)出并引入語(yǔ)義合規(guī)性校驗(yàn)結(jié)果的Excel 文件;二是把數(shù)據(jù)輸出值儲(chǔ)存在數(shù)據(jù)庫(kù)。數(shù)據(jù)輸出前,用戶首先編輯規(guī)則,然后進(jìn)行校驗(yàn),直到輸出準(zhǔn)確的合規(guī)性校驗(yàn)結(jié)果。
規(guī)則引擎架構(gòu)如圖3 所示。
圖3 規(guī)則引擎架構(gòu)
模型設(shè)計(jì)使用規(guī)則定義語(yǔ)言,規(guī)則定義語(yǔ)言是在模板語(yǔ)言前提下,實(shí)施二次改造開發(fā)得到的。規(guī)則定義語(yǔ)言可以在校準(zhǔn)過(guò)程中,準(zhǔn)許人為控制變量,動(dòng)態(tài)地把語(yǔ)義本文引入模板內(nèi)替換任意變量,確保在不同環(huán)境下的高效率應(yīng)用。其次是規(guī)則分析技術(shù)與背景知識(shí)庫(kù)技術(shù)。通過(guò)解析模式串后返回的字符串判斷是否滿足模式串描述的規(guī)則。背景知識(shí)庫(kù)技術(shù)中,通過(guò)專家描述文本語(yǔ)義數(shù)據(jù)格式、臨界值及作用于填充缺失值的某類數(shù)值,反復(fù)記錄度量規(guī)則,數(shù)據(jù)規(guī)則設(shè)定時(shí)要代入的關(guān)鍵值也源自背景知識(shí)庫(kù)。規(guī)則分發(fā)技術(shù)使用可擴(kuò)展標(biāo)記語(yǔ)言來(lái)描述,因此在每個(gè)校驗(yàn)流程中均能完成自由分發(fā)[16]。
為檢測(cè)該文語(yǔ)義合規(guī)性校驗(yàn)?zāi)P托阅艿膬?yōu)劣[17],對(duì)其進(jìn)行仿真實(shí)驗(yàn)分析,實(shí)驗(yàn)計(jì)算機(jī)硬件環(huán)境是Intel(R)Core(TM)CUP T6600,2.2 GHz,仿真軟件是SimuWorks。
圖4 為該文方法與文獻(xiàn)[14]、文獻(xiàn)[15]的語(yǔ)義合規(guī)性校驗(yàn)輸出頻譜的比較情況。
圖4 語(yǔ)義合規(guī)性數(shù)據(jù)校驗(yàn)輸出頻譜對(duì)比圖
根據(jù)圖4 可知,文獻(xiàn)[14-15]方法語(yǔ)義合規(guī)性校驗(yàn)受到冗余數(shù)據(jù)干擾較多,振幅頻度較高,這樣會(huì)大幅降低語(yǔ)義合規(guī)性校驗(yàn)精度。而該文方法具備極強(qiáng)的抗干擾能力,旁瓣波束抑制性能也得到顯著增強(qiáng),可以充分保證智能配電調(diào)度命令票語(yǔ)義規(guī)范性。出現(xiàn)此種現(xiàn)象的原因在于,該文方法采用k 均值聚類算法,可以快速精準(zhǔn)分類文本信息,一旦校驗(yàn)結(jié)果顯示某個(gè)數(shù)據(jù)為冗余數(shù)據(jù),則判斷該數(shù)據(jù)集合為冗余數(shù)據(jù)集合,從根本上剔除冗余數(shù)據(jù)對(duì)校驗(yàn)的干擾。
為提升智能配網(wǎng)調(diào)度命令票文本語(yǔ)義規(guī)范性與準(zhǔn)確性,設(shè)計(jì)基于規(guī)則的調(diào)度命令票語(yǔ)義合規(guī)性校驗(yàn)?zāi)P汀Ec傳統(tǒng)方法相比,所建模型抗干擾能力強(qiáng),校驗(yàn)精度高,時(shí)延低,可充分保障調(diào)度命令票內(nèi)容的嚴(yán)謹(jǐn)性,提升調(diào)度員工作效率,為實(shí)現(xiàn)智能配網(wǎng)高質(zhì)量電力調(diào)度提供扎實(shí)基礎(chǔ)。