趙中華,張緒輝,王 太,劉 科,張利孟
(1.國(guó)網(wǎng)山東省電力公司電力科學(xué)研究院,山東 濟(jì)南 250003;2.華北電力大學(xué)能源動(dòng)力與機(jī)械工程學(xué)院,河北 保定 071003)
近些年,隨著全球工業(yè)化水平以及經(jīng)濟(jì)貿(mào)易的飛速發(fā)展,以二氧化碳為主的溫室氣體大量排放所引發(fā)的一系列連鎖性惡劣影響逐漸受到關(guān)注。二十大報(bào)告中明確我國(guó)將積極穩(wěn)妥推進(jìn)碳達(dá)峰碳中和,協(xié)調(diào)推進(jìn)降碳、減污,進(jìn)一步完善碳排放總量和強(qiáng)度“雙控”制度。結(jié)合我國(guó)“十四五”階段碳排放強(qiáng)度規(guī)劃與宏觀發(fā)展戰(zhàn)略,各級(jí)政府紛紛將“雙碳”目標(biāo)列為經(jīng)濟(jì)發(fā)展環(huán)節(jié)的重要任務(wù),相繼頒布一系列政策措施。在節(jié)能減排的大背景下,通過(guò)理論方法實(shí)現(xiàn)碳排放量準(zhǔn)確預(yù)測(cè),對(duì)于政府部門(mén)制定合理決策具有重要意義[1-3]。
在碳排放預(yù)測(cè)這一領(lǐng)域,相關(guān)學(xué)者已開(kāi)展一系列探索工作。Wang 等將相關(guān)變量功率指數(shù)項(xiàng)作為外因變量輸入至非線性灰度多變量模型,預(yù)測(cè)我國(guó)由于化石能源消耗而導(dǎo)致的碳排放量[4]。宋杰鯤以城市化率、工業(yè)化水平、煤炭及石油消費(fèi)比例等因素作為自變量,提出基于偏最小二乘回歸的碳排放量預(yù)測(cè)方法[5]。仇國(guó)芳等充分利用粗糙集理論的不完備信息分析能力,選取碳排放影響因素并構(gòu)建約簡(jiǎn)指標(biāo)體系,結(jié)合神經(jīng)網(wǎng)絡(luò)對(duì)陜西省碳排放趨勢(shì)進(jìn)行預(yù)測(cè)[6]。王迪等同時(shí)考慮能源結(jié)構(gòu)背景、基準(zhǔn)背景和政策法規(guī)背景,通過(guò)波動(dòng)規(guī)律解析法有效預(yù)測(cè)我國(guó)二氧化碳的減排潛力[7]。劉廣為等融合脈沖響應(yīng)函數(shù)、二階差分方程和向量自回歸模型,從第三產(chǎn)業(yè)占比角度預(yù)測(cè)我國(guó)未來(lái)碳排放強(qiáng)度[8]。由于碳排放受多種因素影響,上述方法會(huì)出現(xiàn)相關(guān)變量互相耦合、過(guò)擬合和欠擬合造成的準(zhǔn)確度降低問(wèn)題,還存在相關(guān)參數(shù)設(shè)置的主觀性導(dǎo)致的模型穩(wěn)定性降低問(wèn)題。
在我國(guó)各類(lèi)行業(yè)領(lǐng)域中,電力行業(yè)耗能遠(yuǎn)高于其他行業(yè),相應(yīng)的碳排放量居于各類(lèi)行業(yè)之首。圍繞電力行業(yè)碳排放量展開(kāi)預(yù)測(cè)研究,已成為我國(guó)各省市地區(qū)快速能源轉(zhuǎn)型關(guān)鍵所在。在傳統(tǒng)人工蜂群算法中引入遺傳學(xué)習(xí)策略,提出進(jìn)化人工蜂群算法,并充分發(fā)揮其全局搜尋能力,對(duì)隨機(jī)森林回歸模型的最佳參數(shù)進(jìn)行自動(dòng)搜索,提出一種基于進(jìn)化人工蜂群算法優(yōu)化的隨機(jī)森林回歸預(yù)測(cè)模型,旨在實(shí)現(xiàn)電力行業(yè)碳排放量未來(lái)發(fā)展趨勢(shì)的準(zhǔn)確預(yù)測(cè),為節(jié)能減排政策制定提供有力支撐。
作為研究能源經(jīng)濟(jì)與碳排放量的重要工具,環(huán)境影響評(píng)估模型建立環(huán)境影響、人均財(cái)富、人口規(guī)模以及環(huán)境毀壞等因素與碳排放量間的映射關(guān)系[9],表達(dá)式為
式中:C為碳排放量;R為人口總量;A為人均國(guó)內(nèi)生產(chǎn)總值;T為能源強(qiáng)度;e為隨機(jī)誤差;a為常數(shù)項(xiàng);b、c、m為驅(qū)動(dòng)參數(shù)。
為準(zhǔn)確預(yù)測(cè)電力行業(yè)碳排放量發(fā)展趨勢(shì),在前期研究中利用對(duì)數(shù)平均迪式指數(shù)法對(duì)電力行業(yè)碳排放量關(guān)聯(lián)影響因素進(jìn)行分析,發(fā)現(xiàn)供電人口、國(guó)內(nèi)生產(chǎn)總值單耗、電力供需結(jié)構(gòu)、人均用電量4 項(xiàng)因素與電力行業(yè)碳排放量間的相關(guān)系數(shù)均大于0.9,呈現(xiàn)較高的相關(guān)性。因此,在環(huán)境影響評(píng)估模型基礎(chǔ)上,對(duì)模型中的人口數(shù)量、人均國(guó)內(nèi)生產(chǎn)總值和能源強(qiáng)度因素所帶來(lái)的影響進(jìn)行擴(kuò)充改進(jìn),進(jìn)一步將供電人口數(shù)、國(guó)內(nèi)生產(chǎn)總值單耗、電力供需結(jié)構(gòu)和人均用電量4 項(xiàng)關(guān)鍵影響因素作為電力行業(yè)碳排放量預(yù)測(cè)的限定自變量。
由于獨(dú)立預(yù)測(cè)器在數(shù)據(jù)結(jié)構(gòu)單一、數(shù)據(jù)質(zhì)量參差不齊條件下的應(yīng)用存在局限性,集成學(xué)習(xí)逐漸成為小樣本數(shù)據(jù)預(yù)測(cè)的有力補(bǔ)充。作為集成學(xué)習(xí)理論的代表,隨機(jī)森林回歸(random forest regression,RFR)模型借鑒“民主投票”原理集合多個(gè)決策樹(shù)構(gòu)造出強(qiáng)化預(yù)測(cè)器,解決單一預(yù)測(cè)器精度不高的問(wèn)題,已被廣泛應(yīng)用于數(shù)據(jù)回歸預(yù)測(cè)中[10-11]。
利用RFR 模型進(jìn)行數(shù)據(jù)回歸預(yù)測(cè)時(shí),首先通過(guò)自助法對(duì)原始樣本集進(jìn)行有放回抽樣,隨機(jī)生成若干組訓(xùn)練樣本,并基于每組新樣本構(gòu)建決策樹(shù)。在定義決策樹(shù)內(nèi)部各節(jié)點(diǎn)屬性時(shí),從決策樹(shù)根部節(jié)點(diǎn)開(kāi)始,在訓(xùn)練樣本所有屬性中隨機(jī)抽取若干屬性作為節(jié)點(diǎn)屬性集,并根據(jù)基尼指數(shù)最小化評(píng)價(jià)規(guī)則篩選出最優(yōu)屬性,然后采用二分遞歸策略進(jìn)行屬性分裂和節(jié)點(diǎn)構(gòu)造,在決策樹(shù)生長(zhǎng)過(guò)程中不進(jìn)行剪枝處理,直到滿足條件停止分裂并形成完整的葉節(jié)點(diǎn)。整個(gè)預(yù)測(cè)過(guò)程建立在決策樹(shù)根節(jié)點(diǎn)至葉節(jié)點(diǎn)的路徑上,每個(gè)決策樹(shù)生成1 個(gè)輸出值后,最終將所有決策樹(shù)輸出值的加權(quán)平均值視為預(yù)測(cè)結(jié)果,RFR 模型預(yù)測(cè)原理如圖1 所示。
圖1 RFR模型預(yù)測(cè)原理Fig.1 Prediction principle of RFR model
相對(duì)于其他回歸預(yù)測(cè)模型,RFR 模型能夠有效避免單一預(yù)測(cè)器存在的過(guò)擬合問(wèn)題,預(yù)測(cè)規(guī)則更簡(jiǎn)單,計(jì)算速度更快,泛化能力更強(qiáng),穩(wěn)定性更佳。
受蜂群尋找優(yōu)質(zhì)蜜源行為的啟發(fā),人工峰群(artificial bee colony,ABC)算法通過(guò)人工蜂個(gè)體對(duì)蜜源質(zhì)量?jī)?yōu)劣的比對(duì)來(lái)求解非線性多目標(biāo)、多約束問(wèn)題[12]。相比于其他類(lèi)型的群?jiǎn)l(fā)式智能尋優(yōu)算法,ABC 算法具有結(jié)構(gòu)簡(jiǎn)單、探索速度快、魯棒性強(qiáng)、關(guān)聯(lián)參數(shù)少等優(yōu)點(diǎn)。但是,由于該算法的雇傭蜂尋蜜階段和偵察蜂尋蜜階段搜索策略相同,容易陷入局部最優(yōu)困境[13]。為解決這一問(wèn)題,借鑒生物種類(lèi)的遺傳進(jìn)化過(guò)程,在傳統(tǒng)ABC 算法基礎(chǔ)上引入遺傳學(xué)習(xí)策略,提出一種新穎的進(jìn)化人工蜂群(evolve artificial bee colony,EABC)算法。在偵察蜂尋蜜階段對(duì)每個(gè)符合試探次數(shù)的蜜源都進(jìn)行交叉、變異和選擇操作,每個(gè)蜜源Xi=[xi,1,xi,2,…,xi,D]代表優(yōu)化問(wèn)題的可能解,其中i∈{1,2,…,S}表示人工蜂個(gè)數(shù),S為人工蜂個(gè)數(shù)的最大值,D表示優(yōu)化問(wèn)題維度。EABC 算法在保留傳統(tǒng)ABC 算法良好全局搜索能力的前提下,有效提升局部搜索能力及收斂速度,其流程如圖2 所示,具體步驟如下:
圖2 EABC算法流程Fig.2 Process of EABC algorithm
1)隨機(jī)生成含有S個(gè)初始解的人工蜂種群,即
式中:xmax,j和xmin,j分別為j維變量的上限和下限;r為[0,1]之間的隨機(jī)數(shù);i∈{1,2,…,S},j∈{1,2,…,D} 。
2)計(jì)算每個(gè)蜜源Xi對(duì)應(yīng)的適應(yīng)度值f(Xi)。
3)利用雇傭蜂對(duì)蜜源進(jìn)行搜尋,若搜尋到的蜜源適應(yīng)度值優(yōu)于原始蜜源,則更新為
式中:?i,j為[-1~1]之間的隨機(jī)數(shù);k為雇傭蜂隨機(jī)搜尋到的蜜源,k∈{1,2,…,S}。
4)跟隨蜂利用式(4)計(jì)算出的選擇概率對(duì)雇傭蜂搜尋到的蜜源做進(jìn)一步開(kāi)采,即
5)若雇傭蜂和跟隨蜂搜尋完整個(gè)空間后,若某些蜜源的適應(yīng)度值在迭代過(guò)程中未得到改善,則對(duì)應(yīng)的雇傭蜂成為偵察蜂,通過(guò)式(3)重新初始化一個(gè)新的蜜源進(jìn)行代替,并記錄保存當(dāng)前階段的全局最佳蜜源Xgbest。
6)對(duì)于每個(gè)被拋棄的蜜源Xi,通過(guò)遺傳學(xué)習(xí)中的交叉操作生成子代Xsol=[xsol1,xsol2,…,xsolD],隨機(jī)抽取當(dāng)前蜂群里的兩個(gè)蜜源XQ和XG,令
式中:h為子代備選蜜源序號(hào);Q、G均為隨機(jī)抽取蜜源序號(hào);Xsold為生成的d代子蜜源。
7)根據(jù)隨機(jī)變異概率pm∈[0,1]對(duì)蜜源子代的每一維度進(jìn)行遺傳學(xué)習(xí)中的變異操作,若ra<pm,則根據(jù)式(7)初始生成Xsold,即
式中:Xmax,d和Xmin,d分別為子代蜜源的上限和下限。
8)根據(jù)遺傳學(xué)習(xí)策略中的選擇操作過(guò)程,比較隨機(jī)初始生成的子代蜜源及被拋棄的蜜源,若優(yōu)于被拋棄蜜源,則結(jié)束遺傳學(xué)習(xí)過(guò)程,反之則不斷重復(fù)偵察蜂尋蜜過(guò)程,直到找到更優(yōu)蜜源。
9)對(duì)比原始蜜源以及偵察蜂尋蜜階段所得新蜜源的適應(yīng)度值,若優(yōu)于原始蜜源則進(jìn)行替換,否則返回步驟3)重復(fù)操作過(guò)程,達(dá)到最大迭代次數(shù)后輸出最終尋優(yōu)結(jié)果。
針對(duì)電力行業(yè)碳排放預(yù)測(cè)問(wèn)題,利用RFR 模型進(jìn)行預(yù)測(cè)時(shí),須設(shè)定決策樹(shù)個(gè)數(shù)和分裂變量數(shù),這兩個(gè)參數(shù)會(huì)直接影響模型的學(xué)習(xí)速率和泛化能力,參數(shù)選取的不合理將降低RFR 模型的預(yù)測(cè)精度。為保障電力行業(yè)碳排放量預(yù)測(cè)結(jié)果的穩(wěn)定性及可靠性,對(duì)傳統(tǒng)ABC 算法進(jìn)行改進(jìn),提出EABC 算法,并充分發(fā)揮該算法卓越的全局尋優(yōu)能力,利用其對(duì)RFR 模型中的關(guān)鍵影響參數(shù)進(jìn)行自動(dòng)搜尋,提出基于EABC 算法優(yōu)化的RFR 預(yù)測(cè)模型,從而克服模型參數(shù)人為主觀設(shè)定造成的弊端,整個(gè)預(yù)測(cè)流程如圖3所示,具體步驟如下:
圖3 碳排放預(yù)測(cè)流程Fig.3 Process of carbon emission prediction
1)首先采用可拓展隨機(jī)性環(huán)境影響評(píng)估模型(stochastic impactsby regression on population affluence and technology,STIRPAT)模型對(duì)電力行業(yè)碳排放影響因素進(jìn)行分析,得到碳排放量及影響因素?cái)?shù)據(jù)。由于碳排放影響因素的單位不同,數(shù)據(jù)之間存在較大的數(shù)量級(jí)差異,為避免RFR 模型輸入數(shù)據(jù)數(shù)量級(jí)差異而引發(fā)的較大預(yù)測(cè)誤差,需要對(duì)數(shù)據(jù)進(jìn)行歸一化預(yù)處理,將其轉(zhuǎn)化為[0~1]之間的數(shù)值。
2)設(shè)置EABC 算法相關(guān)參數(shù)并對(duì)人工蜂種群進(jìn)行初始化操作,本文設(shè)置人工蜂種群規(guī)模為100、最大迭代次數(shù)為50。由于要對(duì)RFR 模型中的決策樹(shù)個(gè)數(shù)和分裂變量數(shù)進(jìn)行搜索,因此搜索空間維度為2。為防止盲目搜索,需要對(duì)各搜索維度的上下限進(jìn)行設(shè)定,本文選取決策樹(shù)個(gè)數(shù)的搜索范圍為[10~500]、分裂變量數(shù)的搜尋范圍為[1~10]。
3)對(duì)EABC 算法中蜜源的適應(yīng)度函數(shù)進(jìn)行設(shè)置,定義RFR 模型預(yù)測(cè)結(jié)果的均方根誤差為適應(yīng)度函數(shù),將蜜源位置代入適應(yīng)度函數(shù)即可計(jì)算出對(duì)應(yīng)的適應(yīng)度值,適應(yīng)度值越小則表明蜜源位置越好,從而可以引導(dǎo)整個(gè)人工蜂群的尋優(yōu)進(jìn)程。
4)將電力行業(yè)碳排放量及影響因素?cái)?shù)據(jù)歸一化預(yù)處理后拆分為訓(xùn)練樣本和測(cè)試樣本,將訓(xùn)練樣本輸入至RFR 模型對(duì)其進(jìn)行訓(xùn)練,在訓(xùn)練過(guò)程中通過(guò)圖2 中給出的EABC 算法流程自動(dòng)搜尋最佳決策樹(shù)個(gè)數(shù)及分裂變量數(shù),從而得出RFR 模型的最優(yōu)參數(shù)組合。
5)將測(cè)試樣本輸入?yún)?shù)優(yōu)化后的RFR 模型,得到最終預(yù)測(cè)結(jié)果。結(jié)合實(shí)際碳排放量數(shù)據(jù)及RFR模型預(yù)測(cè)結(jié)果,利用相關(guān)誤差評(píng)價(jià)指標(biāo)對(duì)提出的EABC-RFR 模型的預(yù)測(cè)精度進(jìn)行檢驗(yàn)。
為驗(yàn)證本文提出的預(yù)測(cè)模型,對(duì)我國(guó)近些年電力行業(yè)碳排放量進(jìn)行測(cè)算。文獻(xiàn)[14-16]中指出,利用限定區(qū)域內(nèi)各類(lèi)化石能源消耗量乘以其碳排放系數(shù),累積相加即可得到電力行業(yè)能源消耗所引起的碳排放總量,根據(jù)這一準(zhǔn)則進(jìn)行測(cè)算,即
式中:C為碳排放量;N為能源種類(lèi);En為第n種能源消耗量;Pn為第n種能源碳排放系數(shù)。主要化石能源的碳排放系數(shù)如表1 所示。
表1 各類(lèi)化石能源碳排放系數(shù)Table 1 Carbon emission coefficients of various fossil energies
根據(jù)國(guó)家統(tǒng)計(jì)局公布的《中國(guó)能源統(tǒng)計(jì)年鑒》中各類(lèi)化石能源的消耗量[17],測(cè)算獲得我國(guó)1996—2021 年間電力行業(yè)的碳排放量,如表2 和圖4 所示。
表2 1996—2021年電力行業(yè)碳排放量Table 2 Power industry carbon emissions of 1996—2021 years
圖4 1996—2021年電力行業(yè)碳排放量曲線Fig.4 Power industry carbon emission curve of 1996—2021 years
由于相關(guān)文獻(xiàn)統(tǒng)計(jì)公布的客觀數(shù)據(jù)有限,無(wú)法全面反映我國(guó)電力行業(yè)碳排放發(fā)展趨勢(shì),但是總體來(lái)看目前碳排放量增長(zhǎng)勢(shì)頭十分迅猛,想要順利實(shí)現(xiàn)“雙碳”目標(biāo)任務(wù)仍具有一定難度。根據(jù)近幾年我國(guó)電力行業(yè)的發(fā)展規(guī)模,節(jié)能減排任務(wù)仍舊艱巨,圍繞碳排放問(wèn)題的整治和管理需要給予更多關(guān)注。由此看來(lái),如果通過(guò)構(gòu)建的理論模型能夠準(zhǔn)確預(yù)測(cè)碳排放未來(lái)增長(zhǎng)趨勢(shì),則可以根據(jù)預(yù)測(cè)結(jié)果進(jìn)行具體分析,從而制定符合當(dāng)前情形的節(jié)能減排政策。
在此利用測(cè)算數(shù)據(jù)對(duì)所提出的EABC-RFRR 模型的穩(wěn)定性及可靠性進(jìn)行驗(yàn)證。通過(guò)《中國(guó)能源統(tǒng)計(jì)年鑒》公布數(shù)據(jù)可以獲取1996—2021 年間供電人口數(shù)、國(guó)內(nèi)生產(chǎn)總值單耗、電力供需結(jié)構(gòu)、人均用電量數(shù)據(jù),并將4 種影響因素?cái)?shù)據(jù)作為預(yù)測(cè)模型的輸入自變量,而表1 中1996—2021 年間我國(guó)電力行業(yè)碳排放測(cè)算數(shù)據(jù)則為預(yù)測(cè)模型的輸出因變量。將匯總后的碳排放量及4 種影響因素歷年數(shù)據(jù)分割為訓(xùn)練樣本和測(cè)試樣本,即可對(duì)EABC-RFR 模型進(jìn)行訓(xùn)練及驗(yàn)證。在預(yù)測(cè)模型訓(xùn)練過(guò)程中,為消除影響因素?cái)?shù)據(jù)之間數(shù)量級(jí)差異對(duì)預(yù)測(cè)結(jié)果造成的不利影響,進(jìn)行歸一化預(yù)處理為
式中:xu和分別為第u種影響因素原始數(shù)據(jù)和歸一化處理后的數(shù)據(jù);xmin和xmax分別為原始數(shù)據(jù)中的最大值和最小值。
選取1996—2015 年的數(shù)據(jù)作為訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練,由于電力行業(yè)碳排放量逐年波動(dòng),供電人口數(shù)、國(guó)內(nèi)生產(chǎn)總值單耗、電力供需結(jié)構(gòu)、人均用電量的歷史數(shù)據(jù)仍會(huì)對(duì)未來(lái)碳排放量預(yù)測(cè)形成影響,因此需要將新獲取的影響因素?cái)?shù)據(jù)及RFR 模型預(yù)測(cè)輸出結(jié)果添加至訓(xùn)練樣本中進(jìn)行逐年遞進(jìn)預(yù)測(cè)。利用EABC 算法對(duì)RFR 模型進(jìn)行參數(shù)自動(dòng)尋優(yōu)時(shí),蜜源適應(yīng)度值隨著蜂群迭代過(guò)程逐漸收斂曲線如圖5 所示,搜尋結(jié)束后確定的RFR 模型最佳決策樹(shù)個(gè)數(shù)為137,最佳分裂變量數(shù)為8。設(shè)置好模型相關(guān)參數(shù)后,利用參數(shù)優(yōu)化后的模型對(duì)2016—2021 年的碳排放量進(jìn)行預(yù)測(cè),最終結(jié)果如圖6所示。
圖5 EABC算法迭代收斂曲線Fig.5 Iterative convergence curve of EABC algorithm
圖6 EABC-RFR模型預(yù)測(cè)結(jié)果Fig.6 Prediction result of EABC-RFR model
為進(jìn)一步驗(yàn)證EABC-RFRR 模型的優(yōu)越性,利用數(shù)據(jù)回歸預(yù)測(cè)領(lǐng)域應(yīng)用較為廣泛的反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)[18]、支持向量機(jī)(support vector machine,SVM)[19]和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)[20]模型分別進(jìn)行碳排放量預(yù)測(cè)對(duì)比。
在BPNN 模型設(shè)置時(shí),輸入自變量為4 個(gè)、輸出因變量為1 個(gè),因此設(shè)置神經(jīng)網(wǎng)絡(luò)輸入層、隱含層和輸出層節(jié)點(diǎn)的拓?fù)浣Y(jié)構(gòu)為4-10-1,選取tansig 函數(shù)作為傳遞函數(shù)并設(shè)置訓(xùn)練次數(shù)為200、精度目標(biāo)為0.000 1。在SVM 模型設(shè)置過(guò)程中,選取的核函數(shù)為高斯核函數(shù),設(shè)置核函數(shù)參數(shù)和懲罰因子分別為1和10。而ELM 模型的設(shè)置與BPNN 模型類(lèi)似,輸入層、隱含層和輸出層節(jié)點(diǎn)的拓?fù)浣Y(jié)構(gòu)也為4-10-1。完成上述3 種對(duì)比模型參數(shù)設(shè)置后,在訓(xùn)練樣本完全相同的條件下分別進(jìn)行訓(xùn)練,并利用訓(xùn)練后的模型分別預(yù)測(cè)2016—2021 年間電力行業(yè)的碳排放量,所得結(jié)果如圖7 所示。
圖7 各對(duì)比模型預(yù)測(cè)結(jié)果Fig.7 Prediction results of different comparison models
為更直觀地呈現(xiàn)EABC-RFR 模型與其他對(duì)比模型的預(yù)測(cè)精度,通過(guò)平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)以及均方根誤差(root mean square error,RMSE)3 項(xiàng)指標(biāo)對(duì)不同模型的預(yù)測(cè)結(jié)果進(jìn)行量化評(píng)價(jià),各誤差評(píng)價(jià)指標(biāo)為:
式中:zw′為通過(guò)模型得到樣本w的碳排放量預(yù)測(cè)值;zw為樣本w碳排放量實(shí)際值;W為樣本個(gè)數(shù)。
給定碳排放量實(shí)際值和預(yù)測(cè)值,通過(guò)各誤差評(píng)價(jià)指標(biāo)計(jì)算表達(dá)式可得到不同模型預(yù)測(cè)誤差的量化值,如圖8 所示,預(yù)測(cè)誤差對(duì)比數(shù)據(jù)匯總結(jié)果如表3所示。
表3 不同模型預(yù)測(cè)誤差對(duì)比結(jié)果Table 3 Prediction error comparison results of different models
圖8 不同模型預(yù)測(cè)誤差評(píng)價(jià)指標(biāo)Fig.8 Evaluation indexes of different model prediction errors
綜合圖8 及表3 可知,在測(cè)試樣本檢驗(yàn)過(guò)程中BPNN 模型各項(xiàng)誤差指標(biāo)均最大,SVM 模型和ELM誤差指標(biāo)居中,EABC-RFR 模型各項(xiàng)誤差最小。由此表明,BPNN 模型預(yù)測(cè)精度最差,SVM 模型和ELM模型預(yù)測(cè)精度一般,而本文提出的模型精度最高,明顯優(yōu)于其他3 種對(duì)比模型。究其因由,主要是其他3種對(duì)比模型對(duì)訓(xùn)練樣本數(shù)量和質(zhì)量具有一定要求,而本文提供的歷年碳排放量及影響因素?cái)?shù)據(jù)相對(duì)較少,在這種小樣本訓(xùn)練條件下3 種對(duì)比模型的預(yù)測(cè)能力將受到不同程度的干擾影響。本文提出的EABC-RFR 模型發(fā)揮集成學(xué)習(xí)的優(yōu)勢(shì),滿足結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,有效避免過(guò)擬合問(wèn)題,可以準(zhǔn)確反映預(yù)測(cè)對(duì)象的非線性動(dòng)態(tài)特性,在小樣本訓(xùn)練條件下仍具有較強(qiáng)的泛化能力,因此可以在碳排放量回歸預(yù)測(cè)中獲得更好的精度。
對(duì)經(jīng)典STIRPAT 模型進(jìn)行擴(kuò)充改進(jìn),將供電人口數(shù)、國(guó)內(nèi)生產(chǎn)總值單耗、電力供需結(jié)構(gòu)、人均用電量4 項(xiàng)影響因素定義為碳排放影響因素。為提高電力行業(yè)碳排放量的預(yù)測(cè)精度,在傳統(tǒng)人工蜂群算法基礎(chǔ)上引入遺傳學(xué)習(xí)策略,并利用進(jìn)化人工蜂群算法對(duì)隨機(jī)森林回歸模型中的決策樹(shù)個(gè)數(shù)和分裂變量數(shù)進(jìn)行自動(dòng)尋優(yōu),提出基于EABC 算法優(yōu)化的RFR預(yù)測(cè)模型。驗(yàn)證結(jié)果表明,該模型可以準(zhǔn)確預(yù)測(cè)電力行業(yè)碳排放量的發(fā)展趨勢(shì),具有良好的穩(wěn)定性和可靠性,與其他應(yīng)用較為廣泛的預(yù)測(cè)模型相比優(yōu)勢(shì)明顯,能夠?yàn)槿珖?guó)以及各省市電力行業(yè)節(jié)能減排政策的制定提供有力支撐,為類(lèi)似數(shù)據(jù)回歸預(yù)測(cè)問(wèn)題的解決提供一定參考借鑒。