陽建中,陳慧蓉,劉志先,趙榮陽
(1 北部灣大學(xué) 電子與信息工程學(xué)院,欽州 535011;2 北部灣大學(xué) 資源與環(huán)境學(xué)院,欽州 535011)
如今,氣候變化已儼然成為了世界性的問題,其中全球變暖正是目前面臨的重要變化之一.根據(jù)《巴黎協(xié)定》要求21世紀末全球氣溫升高控制在不超過工業(yè)化前2℃的目標(biāo),同時也要求各締約方每5年提交一次“國家資助減排貢獻”[1].即使每個國家都按協(xié)定來控制國家的排放量,但是也很難達到協(xié)議中的目標(biāo),全球升溫可能達到3℃左右,無法真正實現(xiàn)不超過2℃的目標(biāo)[2].而碳排放是引起全球變暖的重要因素之一,影響碳排放的因素有很多,包括產(chǎn)業(yè)結(jié)構(gòu)、人口數(shù)量、生產(chǎn)生活方式、能源結(jié)構(gòu)、GDP等[3].中國也頒發(fā)了一系列促進控制溫室氣體排放的法律法規(guī).為了實現(xiàn)中國在2030年國內(nèi)二氧化碳排放量盡量達到峰值,單位GDP溫室氣體排放比2005年下降60%~65%[4].國家采取了一系列的措施,包括調(diào)整產(chǎn)業(yè)結(jié)構(gòu)、優(yōu)化能源結(jié)構(gòu)、能源效率提高、碳市場建設(shè)、生態(tài)碳匯增加等一些列措施,使得中國能源減排取得了一定的成績[1].
目前很多學(xué)者對于碳排放分析和預(yù)測研究也取得了很多的成果,主要是集中在影響碳排的因素分析及碳排放的預(yù)測兩個方面.對于碳排放的因素分析主要采用TOPSIS[5]、STIRPAT模型[6-7]、LMDI方法及其擴展[8-9],例如LEI等[10]利用了支持向量機方法分析了影響CO2的排放量的因素并給出預(yù)測.碳排放的預(yù)測也使用了很多現(xiàn)代的智能模型進行分析預(yù)測.近年來隨著機器學(xué)習(xí)的興起,機器學(xué)習(xí)也被用到了碳排放預(yù)測中,例如長短記憶方法(LSTM)[11],神經(jīng)網(wǎng)絡(luò)[12]等方法.王珂珂等[12]先使用STIPRAT模型將影響碳排放的重要因素篩選出,然后再利用極限學(xué)習(xí)機(ELM)及BP神經(jīng)網(wǎng)絡(luò)(BPNN)對碳排放量進行預(yù)測.還有包括面板回歸模型、邏輯回歸模型[13]、STIRPAT模型[7,14]、非線性灰色伯努利模型(NGBM)[15].SUN[16]將粒子群優(yōu)化極限學(xué)習(xí)機應(yīng)用到了河北省的碳排放的預(yù)測中.FANG等[17]改進了粒子群算法并優(yōu)化高斯過程回歸方法(PSOGPR),對不同國家的CO2排放量進行了預(yù)測.
上述方法都取得了較好的效果.但是因素分析部分只是對很影響碳排放的因素進行了分類,沒有給出具體的影響程度,無法直觀的給出數(shù)據(jù)化的結(jié)果.預(yù)測部分的很多方法比較復(fù)雜,不容易實現(xiàn).碳排放量官方統(tǒng)計往往只有近20年來的數(shù)據(jù),樣本量小,導(dǎo)致某些要求樣本量大的智能方法預(yù)測的精度偏低.本文利用信息熵和灰色系統(tǒng)理論方法分別分析了影響碳排放因素程度的大小并預(yù)測.
根據(jù)研究需要及數(shù)據(jù)可得性,選取廣西能源消費、地區(qū)生產(chǎn)總值、人口、工業(yè)生產(chǎn)總值等數(shù)據(jù),其中能源消費數(shù)據(jù)來源于1997-2018年的《中國能源統(tǒng)計年鑒》,地區(qū)生產(chǎn)總值、人口、產(chǎn)業(yè)結(jié)構(gòu)等數(shù)據(jù)來自1996-2018年的《廣西統(tǒng)計年鑒》;R&D人員、研究與試驗發(fā)展經(jīng)費支出、公共財政支出等數(shù)據(jù)來源于《廣西科技統(tǒng)計數(shù)據(jù)》.為了保證數(shù)據(jù)的準確性,選取數(shù)據(jù)盡可能完整的年份,本文選擇2006年到2016年的數(shù)據(jù).需要說明的是,部分缺失的能源消費數(shù)據(jù)經(jīng)分段三次埃爾米特插值法后獲得.
廣西能源消費碳排放量,采用國際公認的IPCC碳排放計算模型獲得,在研究時間段內(nèi)廣西的化石能源消費主要為原煤、原油、汽油、柴油,因此,碳排放計算時僅包括幾種因素.關(guān)于碳排放影響因子選取,宋旭等人[18]的研究中采用能源碳排放系數(shù)、能源結(jié)構(gòu)、能源強度、經(jīng)濟發(fā)展水平、人口、科技發(fā)展水平等作為影響因素.其中,能源碳排放系數(shù)為各種能源碳排放量與該能源消耗量的比值之和,一般情況下能源碳排放系數(shù)保持不變;能源結(jié)構(gòu)為各種能源消費量分別與總能源消費量的比值之和;能源強度為能源消費總量與地區(qū)生產(chǎn)總值之比;經(jīng)濟發(fā)展水平的主要衡量指標(biāo)為人均地區(qū)生產(chǎn)總值;技術(shù)進步主要指R&D人員與總?cè)丝诘谋戎兀芯颗c試驗發(fā)展經(jīng)費支出占公共財政支出的比重.但根據(jù)數(shù)據(jù)相關(guān)系分析結(jié)果顯示,R&D人員與總?cè)丝诘谋戎?,研究與試驗發(fā)展經(jīng)費支出占公共財政支出的比重與廣西碳排放量僅存在較小關(guān)聯(lián)性.因此,丟棄該指標(biāo).標(biāo)準化后的數(shù)據(jù)如表1所示.
表1 廣西能源消費碳排放量及影響因子值Tab.1 Carbon emission and influencing factor values of energy consumption in Guangxi
信息熵是由數(shù)學(xué)家香農(nóng)提出來的,它是衡量集合離散度的指標(biāo)之一,也可以反映不同數(shù)據(jù)序列的所含的信息量[19],其應(yīng)用也非常廣泛,例如圖像分類[20]、水資源管理[21]等.為了分析人口、能源結(jié)構(gòu)、能源強度、GDP與碳排放的關(guān)系,將前四個因素設(shè)為xi(i=1,2,3,4),每個因素中包含了n個數(shù)據(jù).因此,每個因素構(gòu)成了一個序列,利用信息熵方法計算出每個因素包含的信息量,即權(quán)重.pij(j=1,2,…,n)為每個因素里數(shù)據(jù)對應(yīng)的概率:
假設(shè)將影響碳排放的因素序列xi,構(gòu)建對應(yīng)的函數(shù)I(xi),利用信息論中計算方法,可以利用下面公式得到信息熵:
H(X)表示的是樣本數(shù)據(jù)X的信息熵值.
灰色系統(tǒng)的狀態(tài)模型揭示出灰色系統(tǒng)內(nèi)部變量相互作用并連續(xù)發(fā)展的過程,所以可以用內(nèi)部變量的相互作用的表征數(shù)據(jù),即用離散的時間序列數(shù)據(jù)根據(jù)收斂原理建立近似連續(xù)的微分方程模型,記為GM(m,n),其中,m為階數(shù),n為變量的數(shù)量[22].
根據(jù)需要處理的因素或者特征數(shù)為單個或者多個設(shè)置模型.當(dāng)m=1,n=1時,GM(m,n)為G(1,1),為一階單變量因素預(yù)測模型.若n>1時,則為多變量/因素預(yù)測模型.本文利用人口、能源結(jié)構(gòu)、能源強度、GDP四個因素預(yù)測碳排放量.因此,本文采用了多因素模型,且用碳排放的序列作為特征數(shù)據(jù)序列,記為:
設(shè)人口、能源、GDP、第二產(chǎn)業(yè)產(chǎn)值因素為相關(guān)因素序列:
令(i=1,2,…,N)的(1-AGO)序列為Xi(1),Z其中
則,GM(1,n)模型為:
其中,系數(shù)a稱為發(fā)展系數(shù),bi為驅(qū)動系數(shù),bix(1)i(k)為驅(qū)動項.
再 設(shè)b=(a,b1,b2,…,bn)T,由 最 小 二 乘 參 數(shù) 估 計可得
當(dāng)(i=1,2,…,n)變化幅度較小時,GM(1,n)可以近似為:
累減還原式為:
差分模擬式為:
當(dāng)k=1,2,3,…,n-1時,計算得到的是灰色系統(tǒng)擬合的值;當(dāng)k≥n時,可計算得到灰色系統(tǒng)預(yù)測的值.
為了對模型擬合的效果進行檢驗與評價,需要把預(yù)測數(shù)據(jù)和真實數(shù)據(jù)進行對比分析,檢驗的方法主要是有殘差檢驗、關(guān)聯(lián)度檢驗和后驗差檢驗等方法.其中后驗差檢驗是比較常用的方法.其檢測過程如下:
殘差序列為:
原始數(shù)據(jù)的均值:
殘差序列的平均值:
原始序列的方差:
殘差方差:
后驗差的檢驗為:
使用后驗差來檢驗?zāi)P?,通??紤]后驗差值的比值C和小誤差概率P,這兩個指標(biāo)可有式(17)計算得出,預(yù)測精度等級劃分如表2所示.
表2 后驗差預(yù)測精度等級劃分表Tab.2 A posteriori error prediction accuracy classification table
為了更好地分析不同因子與碳排放的關(guān)系,從時間序列和因子兩個維度分別計算相應(yīng)的信息熵.第一種是使用年份作為時間序列,計算每年的信息熵.利用每個年份不同的因素作代入到公式(2)中,然后可以計算出不同年份信息熵的值.第二種是計算某一個要素所有從2007年到2016年,該要素對應(yīng)的值代入公式(2)中計算得出該要素的信息熵.
通過圖1(a)可以看出碳排放量整體上是呈現(xiàn)上升趨勢.但是在2012年到2014年之間存在了較大的波動,其中2012年碳排放大幅減少,2013年出現(xiàn)了大幅的回升狀態(tài).信息熵越大,說明信息量越大,反之,信息量越?。恍畔㈧厍€斜率越大,說明系統(tǒng)信息突變的可能性越大,反之,系統(tǒng)信息的有序性越大.圖1(b)呈現(xiàn)了對應(yīng)的年份信息熵的值,從2007年到2016年的十年期間廣西碳排放信息熵整體上呈現(xiàn)穩(wěn)定下降的趨勢,其中2013年的信息熵值出現(xiàn)了小幅度的增加,表明廣西能源消費碳排放系統(tǒng)朝有序方向發(fā)展,可預(yù)測性增強.其中由于12年、13年碳排放量出現(xiàn)了波動,表明了廣西碳排放正在得到有效的控制.為了進一步分析廣西能源消費碳排放系統(tǒng)中不同因子對碳排放的影響程度,本文進一步分析各因子與碳排放關(guān)聯(lián)程度(如圖2所示).
圖1 2007年到2016年的碳排放量和對應(yīng)的信息熵Fig.1 The carbon emission from 2007 to 2016 and the corresponding the information entropy
利用灰色系統(tǒng)分別計算了能源結(jié)構(gòu)、能源強度、GDP、人口與碳排放的相關(guān)程度.從計算的結(jié)果(圖2)可以看出GDP對碳排放的影響最大,達到75.98%;其次是人口因素,其對碳排放的貢獻程度超過70%;能源結(jié)構(gòu)對碳排放的貢獻程度最小,但是也超過了50%.
圖2 各因素與碳排放的關(guān)聯(lián)度Fig.2 The correlation of different factors with carbon emission
從圖3中分析可知,廣西能源消費碳排放系統(tǒng)各要素的信息熵從高到低依次是人口、能源結(jié)構(gòu)、能源強度、碳排放、人均GDP,都介于0.322到0.332之間,相差比較小,表明了五個因素在10年間對碳排放的影響都比較穩(wěn)定,只有人口和能源結(jié)構(gòu)相對于其他要素存在一些小幅度的波動.表明二者對廣西能源消費碳排放系統(tǒng)的影響相較于其他因子具有較高的不確定性.
圖3 不同因素的信息熵Fig.3 The information entropy of difference factors
通過從2007年到2016年的廣西碳排放的真實值可知,碳排放量整體上呈現(xiàn)增長的趨勢,其中2013年到2014年出現(xiàn)了一些波動值.因此,在2012年后的真實值出現(xiàn)了一些波動.利用Matlab 2017a實現(xiàn)了模型得出預(yù)測結(jié)果,并繪制出了實際值與預(yù)測值的對比折線圖,如圖4所示.
圖4 預(yù)測值與真實值比較Fig.4 The comparison of the true value and the prediction
利用灰色系統(tǒng)計算出的碳排放的真實值與預(yù)測值的偏差都小于1000,相對誤差都控制在5%以內(nèi).預(yù)測精度P=0.98,C=0.14,可見模型預(yù)測精度較好.
信息熵方法可以實現(xiàn)任意變量之間的空間相關(guān)的定量分析.由于數(shù)據(jù)量小,分析不同要素的在時間上的穩(wěn)定性.應(yīng)用灰色系統(tǒng)理論建立了多因素的預(yù)測模型,通過分析殘差檢驗,得到灰色系統(tǒng)預(yù)測模型.實驗結(jié)果表明,預(yù)測模型的精度好.利用灰色系統(tǒng)進行預(yù)測分析具有數(shù)學(xué)模型簡單、易建立、數(shù)據(jù)樣本少等優(yōu)點.