唐鳳珍 顧圣平 張佳丹 鄭斯水 馬志鵬
摘?要:為加強(qiáng)梯級(jí)水電站優(yōu)化調(diào)度和經(jīng)濟(jì)運(yùn)行的管理,針對(duì)梯級(jí)水電站效益考核中各水電站之間經(jīng)濟(jì)效益關(guān)系復(fù)雜的問(wèn)題,采用數(shù)據(jù)挖掘模型進(jìn)行梯級(jí)水電站效益關(guān)聯(lián)性探索。首先,選取各電站相關(guān)效益指標(biāo)的長(zhǎng)序列監(jiān)測(cè)統(tǒng)計(jì)資料,建立數(shù)據(jù)倉(cāng)庫(kù);其次,根據(jù)關(guān)聯(lián)規(guī)則的基本原理,選擇合適的最小支持度和最小置信度,建立數(shù)據(jù)挖掘模型;再次,采用適當(dāng)?shù)臄?shù)據(jù)挖掘算法Apriori算法對(duì)模型求解,得到梯級(jí)水電站經(jīng)濟(jì)效益之間的關(guān)聯(lián)規(guī)則;最后,對(duì)模型應(yīng)用效果進(jìn)行分析和驗(yàn)證。結(jié)果表明:基于數(shù)據(jù)挖掘模型進(jìn)行梯級(jí)水電站效益關(guān)聯(lián)性分析,可快速有效地獲得梯級(jí)水電站的經(jīng)濟(jì)效益關(guān)系,為梯級(jí)水電站的效益考核研究提供了新思路。
關(guān)鍵詞:梯級(jí)水電站;關(guān)聯(lián)規(guī)則;數(shù)據(jù)挖掘模型;Apriori算法;效益考核
中圖分類號(hào):TV-9文獻(xiàn)標(biāo)志碼:A
doi:10.3969/j.issn.1000-1379.2020.06.029
Research on Benefit Relevance of Cascade Hydropower Stations Based on Data Mining Model
TANG Fengzhen1, GU Shengping1, ZHANG Jiadan1, ZHENG Sishui1, MA Zhipeng2
(1.College of Water Conservancy and Hydropower Engineering, Hohai University, Nanjing 210098, China;
2.Pearl River Hydraulic Research Institute, Guangzhou 510611, China)
Abstract:In order to strengthen the cascade hydropower station management on reservoir optimal operation and economic operation, Data Mining Model was applied to study the benefit relevance of cascade hydropower stations, because of complicated benefit distribution of cascade hydropower stations in benefit evaluation. This method was divided into four steps: selected long-term data of benefit indicators to establish data warehouse; chose appropriate Tmins and Tminc to establish a data mining model according to the principle of association rules; applied Apriori algorithm to calculate the data mining model and obtained quantitive relations between the benefits of cascade hydropower stations; verified and analyzed the feasibility of this model. The results suggest that applying Data Mining Model to research the benefit relevance of cascade hydropower stations can get profit distribution relations between each station quickly and efficiently. These relations give reference to the benefit evaluation of cascade hydropower stations. This model provides new thought for research on the benefit evaluation of cascade hydropower stations.
Key words: cascade hydropower stations; association rules; Data Mining Model; Apriori algorithm; benefit evaluation
1?引?言
為加強(qiáng)水電站優(yōu)化調(diào)度和經(jīng)濟(jì)運(yùn)行的管理,2017年國(guó)家能源局印發(fā)了《流域梯級(jí)工程特性及運(yùn)行情況資料報(bào)表(試行)》,水力發(fā)電企業(yè)大多也制定了相應(yīng)的運(yùn)行考核制度,對(duì)運(yùn)行效益考核提出了更為明確具體的要求。常規(guī)意義上的水電站效益考核主要是指發(fā)電經(jīng)濟(jì)效益考核,單一水電站的效益通常僅需對(duì)水電站自身所產(chǎn)生的經(jīng)濟(jì)效益進(jìn)行考核[1-3]。但是,梯級(jí)水電站在聯(lián)合調(diào)度過(guò)程中效益是相互影響的,龍頭水電站對(duì)下游水電站具有蓄豐補(bǔ)枯的作用[4],下游水電站對(duì)上游水電站也有效益補(bǔ)償?shù)淖饔肹5],一個(gè)水電站運(yùn)行效益的提高既有可能促進(jìn)其他水電站效益的提高,也有可能導(dǎo)致其他電站效益的降低,梯級(jí)水電站經(jīng)濟(jì)效益相互影響的機(jī)理比較復(fù)雜。因此,在梯級(jí)水電站效益考核中如何考慮各電站效益之間的關(guān)聯(lián)性是一個(gè)至關(guān)重要的問(wèn)題。
目前,關(guān)聯(lián)性分析的方法主要有回歸分析方法、層次分析法、神經(jīng)網(wǎng)絡(luò)方法等[6-8],這些關(guān)聯(lián)分析方法雖然在各個(gè)領(lǐng)域里應(yīng)用比較廣泛,但是依舊存在局限性,其中回歸分析方法比較適用于變化趨勢(shì)較為明顯的數(shù)據(jù)序列,層次分析法太過(guò)于依賴專家學(xué)者的主觀判斷,神經(jīng)網(wǎng)絡(luò)方法計(jì)算結(jié)果的穩(wěn)定性與網(wǎng)絡(luò)參數(shù)的設(shè)置具有較為密切的關(guān)系。筆者嘗試采用數(shù)據(jù)挖掘方法進(jìn)行梯級(jí)水電站效益關(guān)聯(lián)性探索。數(shù)據(jù)挖掘方法是在大量的數(shù)據(jù)中提取有用的信息,從而建立關(guān)聯(lián)并且給出定量關(guān)系的過(guò)程[9]。該方法首次是在購(gòu)物籃分析問(wèn)題中被提出,后來(lái)在金融、醫(yī)學(xué)等領(lǐng)域得到了良好的應(yīng)用[10],但是其在梯級(jí)水電站的效益關(guān)聯(lián)性探索上鮮少應(yīng)用。近年來(lái)隨著智慧水利的發(fā)展,水電站效益的監(jiān)測(cè)數(shù)據(jù)以及統(tǒng)計(jì)數(shù)據(jù)不斷增多,使得采用數(shù)據(jù)挖掘方法探索梯級(jí)水電站效益的關(guān)聯(lián)性成為可能。筆者將數(shù)據(jù)挖掘方法應(yīng)用到梯級(jí)水電站效益的關(guān)聯(lián)性分析當(dāng)中,建立梯級(jí)水電站效益關(guān)聯(lián)性分析的數(shù)據(jù)挖掘模型,在以往較長(zhǎng)的梯級(jí)水電站發(fā)電效益序列數(shù)據(jù)基礎(chǔ)上,挖掘出各電站經(jīng)濟(jì)效益之間的關(guān)聯(lián)規(guī)則并進(jìn)行驗(yàn)證,再將得到的關(guān)聯(lián)規(guī)則應(yīng)用到今后的電站效益考核當(dāng)中,旨在提高考核的公平性和水電站運(yùn)行管理的積極性,進(jìn)而提高梯級(jí)水電站的綜合效益。
3.1?數(shù)據(jù)預(yù)處理
選擇Apriori算法進(jìn)行數(shù)據(jù)挖掘,將數(shù)據(jù)庫(kù)中存在的變量S1水電站年發(fā)電量、S2水電站年發(fā)電量進(jìn)行離散化,本案例中采用等寬離散化的方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,離散規(guī)則見表2、表3。
將數(shù)據(jù)庫(kù)中25條數(shù)據(jù)所涉變量均按照上述方法進(jìn)行離散化,離散結(jié)果見表4,然后將數(shù)據(jù)輸入Apriori數(shù)據(jù)挖掘算法進(jìn)行建模。
3.2?效益關(guān)聯(lián)分析模型應(yīng)用與分析
模型參數(shù)中的最小支持度Tmins和最小置信度Tminc目前還沒有明確的計(jì)算方法和規(guī)定,通常采用試算法來(lái)進(jìn)行確定。本模型中最小支持度和最小置信度分別取10%和50%。在此基礎(chǔ)上采用數(shù)據(jù)挖掘模型進(jìn)行梯級(jí)水電站效益關(guān)聯(lián)性分析。滿足10%最小支持度和50%最小置信度要求的關(guān)聯(lián)規(guī)則主要有兩條,見表5。
表5中E12、E13表示S1水電站的年發(fā)電量范圍為[330 259,452 780) MW·h、[452 780,575 301) MW·h,E21、E22表示S2水電站的年發(fā)電量范圍是[456 860,663 524) MW·h、[663 524,870 188) MW·h。
(1)由關(guān)聯(lián)規(guī)則E12E21可知:當(dāng)S1水電站的年實(shí)際發(fā)電量在[330 259,452 780) MW·h區(qū)間時(shí),S2水電站的年實(shí)際發(fā)電量在[456 860,663 524) MW·h區(qū)間內(nèi)。
(2)由關(guān)聯(lián)規(guī)則E13E22可知:當(dāng)S1水電站的年實(shí)際發(fā)電量在[452 780,575 301) MW·h區(qū)間時(shí),S2水電站的年實(shí)際發(fā)電量在[663 524,870 188) MW·h區(qū)間內(nèi)。
3.3?模型驗(yàn)證與結(jié)果應(yīng)用
采用2001—2007年S1、S2兩水電站的年實(shí)際發(fā)電量數(shù)據(jù)來(lái)驗(yàn)證上述得到的兩個(gè)水電站發(fā)電效益關(guān)聯(lián)規(guī)則,2001—2007年S1、S2兩水電站的年實(shí)際發(fā)電量數(shù)據(jù)見表6。
由表6可見,2002年S1水電站的年實(shí)際發(fā)電量373 194 MW·h,處于[330 259,452 780) MW·h區(qū)間內(nèi),屬于E12等級(jí),此時(shí)S2水電站的年實(shí)際發(fā)電量為636 200 MW·h,處于[456 860, 663 524) MW·h區(qū)間內(nèi),屬于E21等級(jí),驗(yàn)證關(guān)聯(lián)規(guī)則E12E21;2003年和2005年S1水電站的年實(shí)際發(fā)電量分別為534 262 MW·h和564 525 MW·h,均處于[452 780,575 301) MW·h區(qū)間內(nèi),屬于E13等級(jí),此時(shí)S2水電站的年實(shí)際發(fā)電量分別為731 180 MW·h和800 023 MW·h,均處于[663 524, 870 188) MW·h區(qū)間內(nèi),屬于E22等級(jí),驗(yàn)證關(guān)聯(lián)規(guī)則E13E22。由此可見,采用該數(shù)據(jù)挖掘模型求解得到的梯級(jí)水電站效益之間的上述兩條關(guān)聯(lián)規(guī)則是有效的。
據(jù)此,本文提出在梯級(jí)水電站發(fā)電效益考核當(dāng)中,為提高考核結(jié)果的公平性,可依據(jù)這兩條關(guān)聯(lián)規(guī)則,按以下方法處理梯級(jí)水電站之間的發(fā)電效益補(bǔ)償問(wèn)題:
(1)當(dāng)S1水電站年實(shí)際發(fā)電量在E12等級(jí)時(shí),若S2水電站的年實(shí)際發(fā)電量在E21等級(jí),則兩水電站之間不需要進(jìn)行發(fā)電效益的補(bǔ)償;若S2水電站年實(shí)際發(fā)電量高于E21等級(jí),則S2水電站需要對(duì)S1水電站進(jìn)行一定額度的發(fā)電效益補(bǔ)償;若S2水電站年實(shí)際發(fā)電量低于E21等級(jí),則S1水電站需要對(duì)S2水電站進(jìn)行一定額度的發(fā)電效益補(bǔ)償。
(2)當(dāng)S1水電站年實(shí)際發(fā)電量在E13等級(jí)時(shí),若S2水電站的年實(shí)際發(fā)電量在E22等級(jí),則兩水電站之間不需要進(jìn)行發(fā)電效益的補(bǔ)償;若S2水電站年實(shí)際發(fā)電量高于E22等級(jí),則S2水電站需要對(duì)S1水電站進(jìn)行一定額度的發(fā)電效益補(bǔ)償;若S2水電站年實(shí)際發(fā)電量低于E22等級(jí),則S1水電站需要對(duì)S2水電站進(jìn)行一定額度的發(fā)電效益補(bǔ)償。
(3)若不屬于以上兩種情況時(shí),記在當(dāng)年來(lái)水情況下S1、S2兩水電站在梯級(jí)調(diào)節(jié)方式下的年發(fā)電量分別為EA和EB,在聯(lián)合運(yùn)行方式下的年實(shí)際發(fā)電量分別為Ea、Eb,且聯(lián)合運(yùn)行方式下梯級(jí)水電站群的總發(fā)電量應(yīng)不低于梯級(jí)調(diào)節(jié)方式下的總發(fā)電量,即Ea+Eb≥EA+EB,則兩電站之間發(fā)電效益補(bǔ)償問(wèn)題可按以下方式處理:
①當(dāng)Ea>EA時(shí),若Eb≥EB,則S1、S2兩電站之間不需要進(jìn)行發(fā)電效益的補(bǔ)償;若Eb ②當(dāng)Ea 3.4?與其他關(guān)聯(lián)分析方法的比較 為說(shuō)明應(yīng)用數(shù)據(jù)挖掘方法探索梯級(jí)水電站經(jīng)濟(jì)效益關(guān)系的優(yōu)越性,采用回歸分析方法和神經(jīng)網(wǎng)絡(luò)方法分別計(jì)算本文案例并進(jìn)行結(jié)果比較,見表7。 運(yùn)用回歸分析方法來(lái)探索S1、S2兩電站年實(shí)際發(fā)電量的關(guān)系,由于從以往的25條監(jiān)測(cè)數(shù)據(jù)中無(wú)法找到S1、S2兩水電站年實(shí)際發(fā)電量之間的線性關(guān)系,因此采用MATLAB編程進(jìn)行高階擬合,結(jié)果發(fā)現(xiàn)采用五階多項(xiàng)式擬合效果最好,但是殘差模依舊高達(dá)130.27,可見采用回歸分析方法對(duì)S1、S2兩水電站年實(shí)際發(fā)電量進(jìn)行關(guān)聯(lián)分析的效果并不良好。神經(jīng)網(wǎng)絡(luò)方法與數(shù)據(jù)挖掘模型方法得到的計(jì)算結(jié)果相近,也與實(shí)際較為相符,但是神經(jīng)網(wǎng)絡(luò)方法得到的結(jié)果與設(shè)置的訓(xùn)練參數(shù)密切相關(guān),計(jì)算結(jié)果并不穩(wěn)定。 4?結(jié)?論 (1)在影響機(jī)理比較復(fù)雜的情況下,運(yùn)用數(shù)據(jù)挖掘模型探索梯級(jí)水電站經(jīng)濟(jì)效益之間的關(guān)聯(lián)性,可以快速有效地獲得梯級(jí)水電站發(fā)電效益之間的定量關(guān)系,且與回歸分析、神經(jīng)網(wǎng)絡(luò)等方法相比,結(jié)果更準(zhǔn)確、更穩(wěn)定。 (2)將關(guān)聯(lián)規(guī)則應(yīng)用到梯級(jí)水電站效益考核中,給出了各電站之間經(jīng)濟(jì)效益補(bǔ)償問(wèn)題的處理原則,為梯級(jí)水電站的經(jīng)濟(jì)效益考核提供參考。若在梯級(jí)水電站綜合考核中還要考慮安全效益和生態(tài)效益,則可以將安全效益和生態(tài)效益相關(guān)指標(biāo)數(shù)據(jù)補(bǔ)充到數(shù)據(jù)倉(cāng)庫(kù)中,并進(jìn)行更加深入的關(guān)聯(lián)規(guī)則挖掘。 (3)采用數(shù)據(jù)挖掘模型進(jìn)行梯級(jí)水電站效益關(guān)聯(lián)規(guī)則挖掘,需要大量的監(jiān)測(cè)統(tǒng)計(jì)數(shù)據(jù)為依據(jù),因此應(yīng)重視對(duì)梯級(jí)水電站實(shí)際運(yùn)行調(diào)度管理過(guò)程的監(jiān)測(cè)和相關(guān)數(shù)據(jù)資料的收集、整理和積累。 參考文獻(xiàn): [1]?粟運(yùn)華.新安江水電站綜合利用效益調(diào)查報(bào)告[J].水電能源科學(xué),1991,9(1):65-69. [2]?陳大鵬,周歧方.陳村水電站綜合效益分析[J].水利水電技術(shù),1994(1):52-55. [3]?樊啟祥,汪志林,吳關(guān)葉.金沙江白鶴灘水電站工程建設(shè)的重大作用[J].水力發(fā)電,2018,44(6):1-6,12. [4]?王琨,歐陽(yáng)碩,邵駿.上游水電站梯級(jí)調(diào)度對(duì)龍頭石水電站效益的影響[J].水力發(fā)電,2018,44(11):104-108. [5]?曲家峰.Shapley值熵權(quán)法在梯級(jí)水電站效益補(bǔ)償分?jǐn)傊械膽?yīng)用[J].水利規(guī)劃與設(shè)計(jì),2016(9):39-42. [6]?金保明.多元線性回歸分析方法在計(jì)算閩江十里庵洪水流量中的應(yīng)用[J].水利科技,2007(1):18-19,38. [7]?于永強(qiáng),沙曉軍,劉俊,等.基于模糊層次分析法的大型水利樞紐效益評(píng)估[J].水資源與水工程學(xué)報(bào),2016,27(3):154-159. [8]?程芳,陳守倫.水利水電規(guī)劃方案優(yōu)選的人工神經(jīng)網(wǎng)絡(luò)方法[J].水電能源科學(xué),2002,20(1):48-50. [9]?AFSHARI M H,DEHKORDI M N,AKBARI M.Association Rule Hiding Using Cuckoo Optimization Algorithm[J].Expert Systems with Application,2016,64:340-351. [10]?商桑,趙春菊,周宜紅,等.溪洛渡拱壩施工期混凝土中期降溫速率與通水冷卻參數(shù)關(guān)系的數(shù)據(jù)挖掘模型[J].長(zhǎng)江科學(xué)院院報(bào),2019,36(6):116-120. [11]?崔妍,包志強(qiáng).關(guān)聯(lián)規(guī)則挖掘綜述[J].計(jì)算機(jī)應(yīng)用研究,2016,33(2):330-334. [12]?林倩瑜.關(guān)聯(lián)規(guī)則挖掘算法研究綜述[J].軟件導(dǎo)刊,2012,11(6):27-29. 【責(zé)任編輯?趙宏偉】