胡航海,劉海濤,安東升,朱承治,杜 斌
(1.國家電網(wǎng)公司,北京110000;2.北京中電普華信息技術(shù)有限公司,北京110000;3.國網(wǎng)浙江省電力公司,南京210024)
早在20世紀(jì)60年代,為了有效描述數(shù)據(jù)集,Jack Mayers提出了Metadata一詞的概念。這個概念最初的剔除是指一種能夠有效描述資料的方式,后來隨著信息的存儲、發(fā)布、傳播等技術(shù)和手段的不斷發(fā)展,信息具有了更大的分散性、變動性和多元性,關(guān)于Metadata的討論也再度引起了更多人的關(guān)注。而“元數(shù)據(jù)”這種稱呼是眾多中文譯名中被使用最廣泛的一個。與最開始被剔除時對元數(shù)據(jù)概念的解釋相比,如今關(guān)于元數(shù)據(jù)概念的界定,無論是內(nèi)容還是數(shù)量都有了很大的變化。
元數(shù)據(jù)與傳統(tǒng)圖書館編目錄的不同之處在于它除了具有描述功能外,還具有控制、管理信息資源的能力。元數(shù)據(jù)是適用于描述任何網(wǎng)絡(luò)數(shù)據(jù)和資源,促進(jìn)網(wǎng)絡(luò)信息資源組織和獲取的數(shù)據(jù)。
國內(nèi)的研究學(xué)者中,張曉林[1]認(rèn)為,元數(shù)據(jù)是描述信息資源等對象的數(shù)據(jù),用于識別資源、評價資源、追蹤資源在使用過程中的變化,實現(xiàn)信息的有效發(fā)現(xiàn)、查找、組織和管理;李郎達(dá)[2]引用了國際圖聯(lián)(IFLA)對元數(shù)據(jù)的定義:元數(shù)據(jù)就是描述資料的資料,可用來協(xié)助對網(wǎng)絡(luò)電子資源的辨識、描述、指示其位置的任何資料等。
隨著我國經(jīng)濟(jì)社會快速發(fā)展,各級統(tǒng)計部門對統(tǒng)計數(shù)據(jù)科學(xué)性、準(zhǔn)確性和及時性的要求不斷增加,并且呈多樣化趨勢,統(tǒng)計任務(wù)將變得越來越艱巨,越來越復(fù)雜。為此,統(tǒng)計部門正在對現(xiàn)有體系做調(diào)整,改變過去從基層、企業(yè)至縣、市、省、國家逐級上報的情況,對數(shù)據(jù)直報方式的探索,在工作理念、工作方法上進(jìn)一步創(chuàng)新,以適應(yīng)新形勢發(fā)展的要求。
本文針對電網(wǎng)運營銷售過程中的供、售、購、用電業(yè)務(wù),立足于元數(shù)據(jù)的思想,研究基于明細(xì)數(shù)據(jù)的設(shè)備類指標(biāo)統(tǒng)計算法,建立基礎(chǔ)單位供、售、購、用電業(yè)務(wù)計算關(guān)系模型,研究電力統(tǒng)計大數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù),以便能更大限度地挖掘數(shù)據(jù)中潛在的價值,服務(wù)于業(yè)務(wù)分析及市場預(yù)測,為決策提供指導(dǎo)。
基于全面梳理各類明細(xì)設(shè)備包括輸變電設(shè)備、配電設(shè)備和發(fā)電設(shè)備等的設(shè)備屬性信息,研究各類設(shè)備的特殊數(shù)據(jù)處理關(guān)系,建立元數(shù)據(jù)倉庫。數(shù)據(jù)源包括含多電壓等級變電站、多家資產(chǎn)變壓器、跨區(qū)線路、線路條數(shù)匯總規(guī)則、換流站統(tǒng)計規(guī)則等,明確各類設(shè)備的填報單位、管理單位及統(tǒng)計單位,明確數(shù)據(jù)責(zé)任,研究數(shù)據(jù)權(quán)限控制機制,確定數(shù)據(jù)逐級負(fù)責(zé)制,實現(xiàn)統(tǒng)計數(shù)據(jù)逐級加鎖。
同時,加強總部集中權(quán)限控制,實現(xiàn)逐級解鎖數(shù)據(jù)修改,保證設(shè)備明細(xì)數(shù)據(jù)來源唯一,真實有效。梳理并確定設(shè)備(變電站、變電設(shè)備、輸電設(shè)備)相關(guān)屬性描述,建立元數(shù)據(jù)倉庫。
變電站的統(tǒng)計過程中,經(jīng)常出現(xiàn)變電站含有多個電壓等級、多家資產(chǎn)變壓器,導(dǎo)致對變電站的統(tǒng)計出現(xiàn)失真。根據(jù)特殊業(yè)務(wù)關(guān)系,研究合理有效的設(shè)備統(tǒng)計模型,重點在規(guī)范變電站與變壓器兩種設(shè)備的屬性,做到不重不漏。如變壓器的臺數(shù)和容量屬性,只作為變壓器的屬性進(jìn)行描述,變電站不做此兩種屬性的統(tǒng)計。設(shè)備統(tǒng)計模型中根據(jù)變電站與變壓器的關(guān)系進(jìn)行計算,以獲取變電站的容量和變壓器臺數(shù)之和。
跨區(qū)線路在統(tǒng)計過程中,根據(jù)所跨越區(qū)域范圍,歸屬多個統(tǒng)計單位分別統(tǒng)計,在上級單位基于下級單位報送的數(shù)據(jù)進(jìn)行匯總時經(jīng)常發(fā)生線路條數(shù)難以正確計算的情況。根據(jù)這一特殊業(yè)務(wù)統(tǒng)計關(guān)系,研究合理有效的線路統(tǒng)計模型。引入項目、子項目管理機制,整條線路作為母線路由上級單位維護(hù),縣公司在整條線路下維護(hù)本區(qū)域線路數(shù)據(jù)作為子線路;子線路作為母線路的一部分,用于縣公司數(shù)據(jù)匯總,子線路長度之和等于母線路長度;每條子線路都記錄條數(shù),母線路的條數(shù)單獨記錄,分縣、市、省匯總時只需匯總相應(yīng)層級的線路,即可得到相應(yīng)的匯總數(shù)據(jù),這樣統(tǒng)計的結(jié)果可保證每個層級數(shù)據(jù)統(tǒng)計的完整性。
梳理生產(chǎn)、投資、能耗、農(nóng)網(wǎng)、一套表等統(tǒng)計業(yè)務(wù)元數(shù)據(jù)及單位元數(shù)據(jù),明確省、市、縣(全資分公司、市本部、客服中心)等各級統(tǒng)計單位信息及其信息變更流程,建立統(tǒng)計單位名錄庫;依據(jù)以上研究建立統(tǒng)一的統(tǒng)計指標(biāo)體系,明確各類單位的統(tǒng)計指標(biāo)及數(shù)據(jù)責(zé)任,實現(xiàn)縣(區(qū))單位負(fù)責(zé)基礎(chǔ)數(shù)據(jù)管理,地市、省、總部負(fù)責(zé)各層級網(wǎng)損、單位之間聯(lián)絡(luò)關(guān)口等數(shù)據(jù)維護(hù)管理;并研究基層各單位類型間互售關(guān)系,建立自下而上的計算規(guī)則;實現(xiàn)由基礎(chǔ)數(shù)據(jù)進(jìn)行按需匯總。
深入研究基層供電單位信息及行政區(qū)域信息,研究各單位間供、售、購電業(yè)務(wù)關(guān)系及供電區(qū)域與行政區(qū)域間關(guān)系,制定出基于基層單位基礎(chǔ)明細(xì)的供、售、購、用電等業(yè)務(wù)元數(shù)據(jù),計算出市、省、總部各層級匯總數(shù)據(jù)的計算關(guān)系模型。
地區(qū)數(shù)據(jù)要統(tǒng)計地區(qū)內(nèi)各種企業(yè)性質(zhì)單位的供、售、用、購電數(shù)據(jù),包含地方電力企業(yè)的數(shù)據(jù)。
基層單位根據(jù)資產(chǎn)等情況被賦予不同的屬性,電力統(tǒng)計業(yè)務(wù)中對供電相關(guān)數(shù)據(jù)要求區(qū)分不同口徑,各層級單位間計算關(guān)系復(fù)雜。必須深入研究實際業(yè)務(wù)關(guān)系,制定出合理的供電業(yè)務(wù)計算關(guān)系模型(如圖1)。
圖1中紅框內(nèi)為地區(qū)口徑業(yè)務(wù)關(guān)系,其中:
A1、A2為本部、全資子公司及控股公司對全資分公司的輸入電量;A3為全資分公司間的輸入/輸出電量;A4為全資分公司從全資子公司及控股公司的購電量;B1、B2、B4為客服中心與全資分公司對全資子公司及控股公司的躉售電量;B3為全資子公司及控股公司之間的互售電量;C1、C2、C3、C4為全資分公司、全資子公司、控股公司對代管公司的躉售電量;C5 為代管公司間的互售電量;D1、D2、D3、D4 為全資分公司對地方電力企業(yè)(含外地區(qū))、地方電廠(含外地區(qū))的購電量;E1、F1為全資分公司對地方電力企業(yè)(含外地區(qū))的躉售電量;G1為地方電力企業(yè)間的輸入/輸出電量。
地區(qū)供電量計算公式:
Y(地區(qū)口徑)=主網(wǎng)網(wǎng)損+本部(開展售電業(yè)務(wù))+∑全資分公司地區(qū)供電量+∑全資子公司、控股公司地區(qū)供電量+∑代管公司地區(qū)供電量+∑地方電力企業(yè)(作為統(tǒng)計單位)-∑B-∑C-A4-D1-E1。
式中∑B、∑C、A4、D1、E1 為計算雙份的供電量,故需要減去。
售電業(yè)務(wù)主要是發(fā)生在各供電單位之間的電量交換(分公司之間的除外),對于統(tǒng)計報送單位已經(jīng)在供電單位中完成維護(hù),對于地方電力公司、孤立電網(wǎng)的非統(tǒng)計報送單位,由所在區(qū)縣或地市公司代為統(tǒng)計維護(hù)。
圖2 售電業(yè)務(wù)計算關(guān)系
圖2為售電量統(tǒng)計范圍。其中,A1為本部對全資分公司1的輸入電量,A2為本部對全資分公司2的輸入電量,A3為全資分公司1、2間的輸入輸出電量,A4為全資子公司、控股公司躉售給全資分公司的電量;B1、B2、B4為全資分公司、客服中心躉售給全資子公司、控股公司的電量,B3為全資子公司間、控股公司間、全資子公司和控股公司之間的躉售電量;C1為客服中心售給代管公司1的電量,C2為客服中心售給代管公司2的電量,C3為全資分公司售電代管公司的電量,C4為全資子公司、控股公司售給代管公司的電量。
含代管口徑的計算公式:
含代管口徑=∑分公司售電量+∑子公司售電量+∑控股公司售電量+∑代管公司售電量-互供互售電量(分、子、控)-售代管公司售電量(包括代管公司互售)
注:互供互售電量、售代管公司售電量分別在以下兩個指標(biāo)中扣除:
(a)售電量合計
(b)躉售電量
地區(qū)用電數(shù)據(jù)統(tǒng)計的數(shù)據(jù)為基層單位所在地區(qū)的行業(yè)用電情況等指標(biāo),包括該地區(qū)自備電廠的、孤立地區(qū)的用電情況。
縣公司用電模型:由直供用電220kV級以上、直供用電110kV及以下、直供線損、地方電力公司、地方電廠和孤網(wǎng)構(gòu)成。
市公司用電模型:統(tǒng)計范圍內(nèi)所有縣級分公司的地區(qū)其他+縣級子公司、控股公司、代管和地方電力公司的用電數(shù)據(jù)。
省公司用電模型:統(tǒng)計范圍內(nèi)所有市級分公司的地區(qū)其他+市級子公司、控股公司、代管的全口徑。
縣公司用電業(yè)務(wù)計算:
本部=網(wǎng)損+地方電廠+地方電力公司;
客服中心=市轄區(qū)用電量+直供縣域220kV及以上+縣C區(qū)域內(nèi)110kV及以下電量+線損;
全資分公司=直供用電220kV及以上+直供用電110kV及以下+直供線損+地方電廠+地方電力公司;
全資子公司/控股公司=直供用電110kV及以下+直供線損+地方電廠+地方電力公司;
代管公司/地方電力公司=直供用電35kV及以下+直供線損+地方電廠+地方電力公司;
市公司全口徑=本部+客服中心+全資分公司+全資子公司/控股公司+代管公司/地方電力公司。
表1 購電業(yè)務(wù)關(guān)系表
購電在縣公司中主要體現(xiàn)在購電、躉售月報當(dāng)中,購電業(yè)務(wù)按照購售電單位可以分為購電廠、購電網(wǎng)、購地方電力公司三種。其中,購電廠是指從電廠購電,根據(jù)購電類型可以分為自購和代購,自購即由縣公司直接和電廠發(fā)生財務(wù)結(jié)算,代購則是由上級單位負(fù)責(zé)與電廠發(fā)生結(jié)算,縣公司本身與電廠無財務(wù)關(guān)系;購電網(wǎng)則是指從國網(wǎng)系統(tǒng)內(nèi)其他單位購電,國網(wǎng)系統(tǒng)中,存在分公司、子公司、控股公司、代管公司,除分公司之間電量交換屬輸入輸出外,其相互之間發(fā)生電量交換的情況均屬于購電躉售關(guān)系;購地方電力公司一般指購本地區(qū)孤立電網(wǎng)。除此之外購電業(yè)務(wù)還可以根據(jù)購電電壓等級區(qū)分。
購電量是衡量一個單位購電多少的數(shù)據(jù),相應(yīng)的本單位既可以作為購電方,也可以作為躉售方。
市公司購電廠電量由縣公司購電躉售電量報表形成購電量月報。表內(nèi)含有所購電量的電廠明細(xì)??h公司內(nèi),首先維護(hù)好購電躉售月報后,相應(yīng)的供電生產(chǎn)調(diào)度情況表內(nèi)的購電躉售數(shù)據(jù)從此表取得。
購電網(wǎng)取別于購電廠電量在于,購電網(wǎng)的電量來源于其他電力公司。期來源與購電廠數(shù)據(jù)一致。也需要先維護(hù)縣公司購電躉售月報,供電生產(chǎn)調(diào)度表內(nèi)獲取到購電躉售數(shù)據(jù)后,上報到市公司。市公司將數(shù)據(jù)匯總到購電量月報中。
購地方電力公司比較特殊,它所購電的對象不屬于國家電網(wǎng)管理。以這種方式購來的電量在用電報表中的地區(qū)全口徑統(tǒng)計而不在電網(wǎng)口徑中統(tǒng)計。期數(shù)據(jù)源獲取方式均與購電廠和購電網(wǎng)一致。
以MD電力有限公司MDA市公司2015年8月供電數(shù)據(jù)為例。其中,除MDB供電分公司為全資分公司外,其他縣公司均為全資子公司。當(dāng)月MDA市公司供電量為159 418萬千瓦時,其中,MDA1縣公司10 393萬千瓦時、MDA2縣公司10 407萬千瓦時、MDA3縣公司4 844萬千瓦時、MDA4縣公司6 364萬千瓦時、MDA5縣公司3 557萬千瓦時、MDA6縣公司12 577萬千瓦時、MDB供電分公司4 311萬千瓦時、MDC供電公司3 442萬千瓦時、MDD供電公司4 028萬千瓦時、MDE有限公司1 237萬千瓦時,MDA市公司直供98 258萬千瓦時。以上各種企業(yè)性質(zhì)的縣級供電公司供電量本月求和為159 418萬千瓦時。由此可驗證上述模型算法正確可行。
以MT電力公司為例,MT分公司MTA直屬電廠上網(wǎng)電量1 093萬千瓦時,MT分公司躉售給子公司、控股公司266萬千瓦時,子公司控股公司躉售給代管公司128萬千瓦時。
由上述可得:
∑分公司售電量=1093萬千瓦時;∑子公司售電量+∑控股公司售電量=266萬千瓦時;互供互售電量(分、子、控)=266萬千瓦時;售代管公司售電量=128萬千瓦時;∑代管公司售電量=128萬千瓦時。
根據(jù)售電業(yè)務(wù)計算關(guān)系公式:
含代管口徑=∑分公司售電量+∑子公司售電量+∑控股公司售電量+∑代管公司售電量-互供互售電量(分、子、控)-售代管公司售電量=1093+266+128-266-128=1093萬千瓦時。由此可驗證上述模型算法正確可行。
1.以JSA市公司2015年10月全口徑用電數(shù)據(jù)為例。JSA市公司無客服中心,有市公司本部,其他下級單位均為全資分公司。
其中當(dāng)月全口徑用電數(shù)據(jù)分別為:本部75 490萬千瓦時、棲霞JSA1公司289 265萬千瓦時、溧水JSA2公司13 939萬千瓦時、高淳JSA3公司6 923萬千瓦時。求和可得385 617萬千瓦時。當(dāng)月JSA市公司全口徑用電量為385 617萬千瓦時,由此可得計算模型實用可行。
2.以JSB市公司2015年1月全口徑用電數(shù)據(jù)為例。JSB供電公司本部2015年1月地區(qū)全口徑口徑用電量合計47 079萬千瓦時,JSB1市供電公司2015年1月地區(qū)全口徑口徑用電量合計33 973萬千瓦時,JSB2供電公司2015年1月地區(qū)全口徑口徑用電量合計47 336萬千瓦時,JSB3市供電公司2015年1月地區(qū)全口徑口徑用電量合計53 301萬千瓦時,JSB4供電公司2015年1月地區(qū)全口徑口徑用電量合計25 044萬千瓦時。經(jīng)模型計算得到JSB市公司全市其他口徑用電量合計206 733萬千瓦時,與原系統(tǒng)中數(shù)據(jù)一致,且全口徑數(shù)據(jù)為直供口徑用電量和其他口徑用電量合計之和,符合業(yè)務(wù),模型算法正確。
3.以JSC市供電公司2015年10月的用電數(shù)據(jù)為例。JSC下轄無客服中心,其他縣級供電企業(yè)包括本部的企業(yè)性質(zhì)均為全資分公司。全資分公司的用電量分別為:JSC1供電公司全口徑用電量合計47 838萬千瓦時,JSC2供電公司全口徑用電量合計54 729萬千瓦時,JSC3營業(yè)部全口徑用電量合計46 944萬千瓦時,JSC園區(qū)營業(yè)部全口徑用電量合計85 714萬千瓦時,JSC4全口徑用電量合計136 169萬千瓦時,JSC5全口徑用電量合計240 037萬千瓦時,JSC6全口徑用電量合計157 984萬千瓦時,JSC7全口徑用電量合計190 826萬千瓦時,JSC8全口徑用電量合計74 605萬千瓦時。JSC本部全口徑用電量合計25 001萬千瓦時。市公司直供用電當(dāng)月值為1 059 847萬千瓦時。由模型計算得到JSC市公司內(nèi)縣級供電企業(yè)用電量合計為1 059 847萬千瓦時。與原系統(tǒng)中數(shù)據(jù)一致,經(jīng)驗證,模型算法正確。
表2 購電業(yè)務(wù)關(guān)系表
以JSD市為例,說明購電業(yè)務(wù)關(guān)系,如表2所示。
JSD市A供電公司經(jīng)過35千伏線路從A電廠進(jìn)行購電,屬于代購類型,購電量為100萬千瓦時,不存在躉售電量;JSD市B供電公司經(jīng)過35千伏線路從B電廠進(jìn)行購電,屬于代購類型,購電量為300萬千瓦時,不存在躉售電量;JSD市C供電公司經(jīng)過10千伏線路從E供電公司進(jìn)行購電,屬于自購類型,購電量為1 000萬千瓦時,躉售電量為270萬千瓦時;JSD市D供電公司經(jīng)過35千伏線路從F地方電力企業(yè)進(jìn)行購電,屬于代購類型,購電量為200萬千瓦時,躉售電量為120萬千瓦時。
在基于元數(shù)據(jù)理論的基礎(chǔ)上,全面梳理了電力統(tǒng)計各業(yè)務(wù)中指標(biāo)間的計算關(guān)系、勾稽關(guān)系和依賴關(guān)系,研究制定了各指標(biāo)及指標(biāo)間的完整性、合理性、強制性的數(shù)據(jù)校驗關(guān)系,以期加強源頭數(shù)據(jù)采集質(zhì)量和總部集中權(quán)限控制力。通過研究數(shù)據(jù)權(quán)限控制機制,建立起數(shù)據(jù)逐級審核負(fù)責(zé)制,實現(xiàn)統(tǒng)計數(shù)據(jù)逐級加鎖,實現(xiàn)逐級解鎖數(shù)據(jù)修改,保證數(shù)據(jù)真實性。
研究了基于明細(xì)數(shù)據(jù)的統(tǒng)計算法。梳理電廠基本屬性及各類信息,補充缺少項、確定必填項,統(tǒng)一規(guī)范標(biāo)準(zhǔn),確定了基于明細(xì)數(shù)據(jù)的設(shè)備類指標(biāo)統(tǒng)計算法;梳理了各類明細(xì)設(shè)備包括輸變電設(shè)備、配電設(shè)備和發(fā)電設(shè)備等的設(shè)備屬性信息,研究了各類設(shè)備的特殊數(shù)據(jù)處理關(guān)系,確定了基于明細(xì)數(shù)據(jù)的設(shè)備類指標(biāo)統(tǒng)計算法。
全面梳理生產(chǎn)、投資、能耗、農(nóng)網(wǎng)、一套表等統(tǒng)計業(yè)務(wù)元數(shù)據(jù)及單位元數(shù)據(jù),明確省、市、縣(市本部、客服中心、市轄供電區(qū)、縣級供電企業(yè)、地方電力公司)等各級統(tǒng)計單位信息及其信息變更流程。研究基層各單位類型間互售關(guān)系,建立自下而上的計算規(guī)則,實現(xiàn)由基礎(chǔ)數(shù)據(jù)進(jìn)行按需匯總。深入研究基層供電單位信息及行政區(qū)域信息,研究各單位間供、售、購電業(yè)務(wù)關(guān)系及供電區(qū)域與行政區(qū)域間關(guān)系,制定出基于基層單位基礎(chǔ)明細(xì)的供、售、購、用電等業(yè)務(wù)元數(shù)據(jù)的計算市、省、總部各層級匯總數(shù)據(jù)的計算關(guān)系模型。
此外,有待進(jìn)一步研究大數(shù)據(jù)中大體量、有噪聲、分布式存儲情況下的數(shù)據(jù)挖掘技術(shù),并研究大數(shù)據(jù)生態(tài)環(huán)境中的統(tǒng)計分析模型的建模方法,以便更大限度地挖掘數(shù)據(jù)中潛在的價值,服務(wù)于業(yè)務(wù)分析及市場預(yù)測,為決策提供指導(dǎo)。
參考文獻(xiàn):
[1]張曉林.元數(shù)據(jù)研究與應(yīng)用[M].北京:北京圖書館出版社,2002.
[2]李郎達(dá).Metadata 初探[J].情報科學(xué),2001,19(6):605.
[3]安弟.電力行業(yè)統(tǒng)計分析系統(tǒng)設(shè)計[J].科技展望,2015,(3):69.
[4]陳力娟.淺談元數(shù)據(jù)及其應(yīng)用[J].中國統(tǒng)計,2006,(11):43-44.
[5]李曉東.電力企業(yè)數(shù)據(jù)中心數(shù)據(jù)管控的研究與應(yīng)用[J].電力信息化,2012,(8).
[6]王穎.企業(yè)統(tǒng)計數(shù)據(jù)質(zhì)量影響因素研究[D].杭州:浙江大學(xué),2006.
[7]陳蘇,柏文陽,徐潔磐.一種新的數(shù)據(jù)質(zhì)量模型的研究[J].計算機應(yīng)用研究,2005,(7):52-54.