宋杰鯤
(中國石油大學(xué)經(jīng)濟管理學(xué)院,山東青島 266555)
基于支持向量回歸機的中國碳排放預(yù)測模型
宋杰鯤
(中國石油大學(xué)經(jīng)濟管理學(xué)院,山東青島 266555)
選取人口、城鎮(zhèn)化率、人均GDP、服務(wù)業(yè)增加值比重、單位GDP能耗、煤炭消費比例等6項影響因素作為自變量,運用支持向量回歸機方法構(gòu)建中國碳排放預(yù)測模型。以1980—2009年碳排放及影響因素數(shù)據(jù)為樣本,通過訓(xùn)練、測試得到具有良好學(xué)習(xí)與推廣能力的支持向量回歸機模型。結(jié)合“十二五”規(guī)劃,設(shè)置不同情境下影響因素預(yù)測值,對2010—2015年中國碳排放進行預(yù)測。預(yù)測結(jié)果表明,中國可適當(dāng)降低GDP增速,不斷優(yōu)化能源結(jié)構(gòu),以確保碳減排目標(biāo)的有效實現(xiàn)。
碳排放;支持向量回歸機;預(yù)測模型
中國是世界上能源生產(chǎn)與消費大國。中國非常重視碳排放問題,在“十二五”規(guī)劃中明確提出要“節(jié)約能源,降低溫室氣體排放強度”。要實現(xiàn)這一目標(biāo),需要對碳排放的影響因素進行深入分析,構(gòu)建科學(xué)的預(yù)測模型對未來碳排放進行預(yù)測,為制定有效的碳減排路徑提供決策依據(jù)。目前,碳排放預(yù)測模型研究大致可以分為兩種模式:一是直接構(gòu)建模式,即基于碳排放與其影響因素之間的相互關(guān)系,構(gòu)建Kaya等式、IPAT或STIRPAT模型對碳排放進行預(yù)測[1-3];二是混合構(gòu)建模式,即基于環(huán)境(碳排放)與宏觀經(jīng)濟、能源消費、部門技術(shù)等因素之間的關(guān)聯(lián)關(guān)系構(gòu)建投入產(chǎn)出、MARKAL-MACRO、CGE等混合能源經(jīng)濟模型對碳排放進行預(yù)測[4-6]?;旌蠘?gòu)建模式具有多元化的研究目的,碳排放通常是在能源消費預(yù)測基礎(chǔ)上應(yīng)用碳排放系數(shù)法計算獲得,需要大量的各部門技術(shù)數(shù)據(jù)。本文中選用直接構(gòu)建模式對中國碳排放進行預(yù)測。為克服偏最小二乘回歸和嶺回歸方法穩(wěn)定性和可解釋性較弱、參數(shù)難以確定等不足[7-8],筆者借鑒STIRPAT的相關(guān)因素,構(gòu)建支持向量回歸機(support vector regression,SVR)模型對中國碳排放進行預(yù)測,以期為碳排放預(yù)測提供新的科學(xué)工具。
STIRPAT模型即基于回歸方法考察人口、財富和技術(shù)對環(huán)境隨機影響的模型,其中人口、財富、技術(shù)等因素均可擴展[9]。借鑒該模型的相關(guān)因素,選取人口、城鎮(zhèn)化率、人均GDP、服務(wù)業(yè)增加值比重、單位GDP能耗、煤炭消費比例這6項影響因素作為碳排放預(yù)測的自變量。其中,人口和城鎮(zhèn)化率分別反映了人口總量和城鎮(zhèn)人口(或城鎮(zhèn)化水平)的影響,人均GDP和服務(wù)業(yè)增加值比重分別反映了人均財富和服務(wù)業(yè)財富(或經(jīng)濟服務(wù)化)的影響,單位GDP能耗和煤炭消費比例則反映了能源節(jié)約與清潔化利用技術(shù)的影響。
支持向量回歸機是一種基于統(tǒng)計學(xué)習(xí)理論的機器學(xué)習(xí)方法,由于其特別適合有限樣本,理論上可獲得全局最優(yōu)點,具有良好的推廣能力,且計算復(fù)雜度與樣本維數(shù)無關(guān),在函數(shù)逼近、回歸估計等方面獲得較好的應(yīng)用[10-14]。給定訓(xùn)練集T={(x1,y1),…,(xn,yn)},xi∈Rm,yi∈R,i=1,…,n,如果能夠用Rm上的一個線性函數(shù)y=f(x)=(w·x)+b推斷任一模式x所對應(yīng)的y值,稱之為線性回歸問題。線性回歸問題可以轉(zhuǎn)換為求如下的最優(yōu)化問題:
式中,C為懲罰參數(shù);ξi、為松弛變量;ε為不敏感損失函數(shù)閾值。
通常并不直接求解模型(1),而是引入它的對偶問題:
不難看出,對偶問題(2)和回歸函數(shù)(4)均只涉及樣本輸入間的內(nèi)積運算(xi·xj),因此可以引入核函數(shù)K(xi,xj),將線性回歸問題轉(zhuǎn)化為高維空間(Hilbert空間)中的非線性回歸問題,構(gòu)建ε-支持向量回歸機模型(ε-SVR):
已知n年碳排放影響因素和碳排放數(shù)據(jù)組成樣本集(),i=1,…,n,構(gòu)建碳排放SVR模型。
(1)對所有樣本的自變量和因變量分別按照下式進行歸一化處理:
使所有數(shù)據(jù)均處于[0,1]之間。
(2)從中選取m個樣本為訓(xùn)練樣本,其余n-m個樣本為測試樣本。對于訓(xùn)練樣本,選擇徑向基核函數(shù):K(xi,x)=exp(-γ xi-x2),構(gòu)建式(5)所示的ε-SVR模型。設(shè)置參數(shù)ε較小的初始值,對于參數(shù)C和γ,應(yīng)用格搜索和交叉驗證的方法確定[11]:將lbC和lbγ的取值范圍均分為若干個網(wǎng)格;將所有樣本均分為v組即應(yīng)用v折交叉驗證;固定網(wǎng)格上的一個參數(shù)對(C,γ),依次取其中的v-1組樣本作為訓(xùn)練樣本,代入模型得到最優(yōu)解和回歸函數(shù),將剩下的一組樣本代入回歸函數(shù)輸出擬合值,計算其與實際值的誤差,得到所有v組n個樣本的均方誤差;在網(wǎng)格內(nèi)遍歷所有參數(shù)對(C,γ),尋求均方誤差最小的參數(shù)對。如果誤差較小,則輸出參數(shù)最優(yōu)值ε*、C*和γ*;否則逐步提高參數(shù)ε值,一直到滿意為止。
(3)運用獲得的最佳參數(shù)值ε*、C*和γ*對所有訓(xùn)練樣本構(gòu)建ε-SVR模型,得到模型最優(yōu)解與回歸函數(shù)f(x)。分別將訓(xùn)練樣本和測試樣本代入f(x)輸出擬合值,并對擬合值與實際值進行線性回歸,計算相關(guān)系數(shù)以檢驗?zāi)P偷膶W(xué)習(xí)和推廣能力。如果模型具有良好的學(xué)習(xí)和推廣能力,則回歸函數(shù)f(x)即為碳排放預(yù)測模型;否則,調(diào)整訓(xùn)練樣本數(shù)m,返回步驟(2)繼續(xù)求解,一直到滿意為止。
即得未來碳排放預(yù)測值。
CDIAC、EIA、IEA、WRI等國際能源機構(gòu)均給出中國歷年碳排放數(shù)據(jù),其相差在5%的范圍之內(nèi),本文中選取目前更新最快的EIA碳排放數(shù)據(jù),樣本區(qū)間為1980—2009年。影響因素數(shù)據(jù)均來自2010年中國統(tǒng)計年鑒,為消除價格因素的影響,對GDP按照1980年可比價格進行重新計算,并據(jù)此測算人均GDP、單位GDP能耗。碳排放及其影響因素數(shù)據(jù)如表1所示,其中序號1到30分別表示1980年到2009年各年度。
表1 碳排放及其影響因素數(shù)據(jù)Table 1 Data of carbon emissions and influence factors
按照碳排放SVR模型構(gòu)建步驟,首先對30個樣本數(shù)據(jù)進行歸一化預(yù)處理。隨機選取20個樣本作為訓(xùn)練樣本,其余10個為測試樣本。設(shè)置參數(shù)ε=0.01,lbC和lbγ的取值范圍均為[-10,10],網(wǎng)格寬度為0.5,對訓(xùn)練樣本進行5折交叉驗證,得到C和γ最佳參數(shù)值分別為5.6569和0.35355,交叉驗證均方誤差為0.001235,得到的回歸函數(shù)為
運用該函數(shù)分別對訓(xùn)練樣本和測試樣本進行擬合,得到擬合值與實際值線性回歸結(jié)果如圖1和圖2所示。其中,訓(xùn)練結(jié)果線性回歸方程為R=0.9797A+0.0059,相關(guān)系數(shù)為0.993 8;測試結(jié)果線性回歸方程為R=0.9753A+0.0081,相關(guān)系數(shù)為0.9683??梢?,模型具有良好的學(xué)習(xí)和推廣能力,因而回歸函數(shù)(11)可作為碳排放預(yù)測模型。
圖1 訓(xùn)練結(jié)果線性回歸Fig.1 Linear regression of training result
圖2 測試結(jié)果線性回歸Fig.2 Linear regression of testing result
根據(jù)中國“十二五”規(guī)劃和國家統(tǒng)計局、發(fā)改委、能源局等部門公開發(fā)布的相關(guān)數(shù)據(jù),對2010—2015年碳排放的6項影響因素值進行整理或預(yù)測。
(1)人口。2010年中國人口為13.41億,規(guī)劃到2015年人口低于13.9億,年均增長低于7.2‰。取年均增長率上限7.2‰,預(yù)測2011—2015年中國人口分別為13.51、13.6、13.7、13.8和13.9億。
(2)城鎮(zhèn)化率。2010年城鎮(zhèn)化率為47.5%,預(yù)期到2015年為51.5%。按照年均提高0.8%計算,預(yù)測2011—2015年中國城鎮(zhèn)化率分別為48.3%、49.1%、49.9%、50.7%和51.5%。
(3)人均GDP。按可比價格計算,2010年GDP比上年增長10.3%,人均GDP增長9.8%。根據(jù)2009年GDP和人均GDP數(shù)據(jù),測算2010年GDP和人均GDP按1980年價格分別為81600億元和6085元。預(yù)期“十二五”期間GDP年均增長7%,考慮到當(dāng)前中國GDP仍然保持較快的增長趨勢,設(shè)置“十二五”GDP年均增長率分別為7%、7.5%、8%、8.5%、9%,結(jié)合GDP預(yù)測值和人口預(yù)測值測算2011—2015年人均GDP如表2所示。
表2 不同GDP增速下人均GDP預(yù)測值Table 2 Prediction value of per capital GDP under different GDP growth speed 元
(4)服務(wù)業(yè)增加值比重。2010年服務(wù)業(yè)增加值比重為43%,預(yù)期到2015年為47%。按照年均提高0.8%計算,預(yù)測2011—2015年服務(wù)業(yè)增加值比重分別為43.8%、44.6%、45.4%、46.2%和47%。
(5)單位GDP能耗。“十一五”期間全國單位GDP能耗下降19.1%,則2010年單位GDP能耗按1980年價格測算為3.98 t標(biāo)準(zhǔn)煤 /萬元。規(guī)劃到2015年單位 GDP能耗降低16%,按年降低率為3.42%計算,2011—2015年的單位GDP能耗按1980年價格分別為3.84、3.71、3.59、3.46和3.34 t標(biāo)準(zhǔn)煤/萬元。
(6)煤炭消費比例。2010年中國能源消費總量為3.25×109t標(biāo)準(zhǔn)煤,比2009年增長5.9%,其中煤炭增長5.3%。按照2009年能源消費總量及煤炭消費比例,測算2010年煤炭消費比例為70%。根據(jù)能源“十二五”初步規(guī)劃,2015年煤炭消費量控制在3.8×109t,石油5×108t,天然氣2.3×1011m3,非化石能源占比11.4%,折合為4.8×108t標(biāo)準(zhǔn)煤。結(jié)合煤炭、石油、天然氣標(biāo)準(zhǔn)煤參考系數(shù)即0.714 3 kg標(biāo)準(zhǔn)煤/kg、1.4286 kg標(biāo)準(zhǔn)煤/kg和1.33 kg標(biāo)準(zhǔn)煤/m3,測算2015年煤炭消費比例約為64.4%,年均降低1.12%??紤]到能源產(chǎn)業(yè)發(fā)展特別是能源結(jié)構(gòu)調(diào)整、引入可替代清潔能源的不確定性,同時設(shè)置2015年煤炭消費比例為63%和66%兩種情景,相應(yīng)的年均降低1.4%和0.8%。3種情景下“十二五”期間煤炭消費比例如表3所示。
表3 不同降速下“十二五”煤炭消費比例Table 3 Coal consumption ratio under different reduction speed %
將2010年碳排放影響因素值以及2011—2015年不同GDP增速和不同煤炭消費比例降速下影響因素預(yù)測值歸一化后代入碳排放預(yù)測模型,并對輸出結(jié)果進行反歸一化,得到2010年中國碳排放預(yù)測值為8.062×107t。不同GDP增速、不同煤炭消費比例降速下“十二五”期間的碳排放預(yù)測值見表4。
表4 不同情境下2011—2015年碳排放預(yù)測值Table 4 Prediction value of carbon emissions in the year 2011—2015 under different situations 104t
可見,在相同GDP增速下,煤炭消費比例降速越大,碳排放越少,而且隨著時間推移碳排放增長趨緩,這表明能源結(jié)構(gòu)優(yōu)化特別是低碳能源的開發(fā)利用將有利于降低煤炭在能源消費中的比例,從而減緩碳排放增長趨勢。在相同煤炭消費比例降速下,GDP增速越大,碳排放越多,而且隨著時間推移碳排放增長越快,這表明若過于追求GDP快速增長將使中國碳排放快速增加。因此,未來中國可適當(dāng)降低GDP增速目標(biāo),持續(xù)推進能源結(jié)構(gòu)優(yōu)化,以確保碳減排目標(biāo)的有效實現(xiàn)。
[1]聶銳,張濤,王迪.基于IPAT模型的江蘇省能源消費與碳排放情景研究[J].自然資源學(xué)報,2010,25(9): 1557-1564.
NIE Rui,ZHANG Tao,WANG Di.The scenario analysis on energy consumption and carbon emissions based on environmental loads model[J].Journal of Natural Resources,2010,25(9):1557-1564.
[2]魏一鳴,劉蘭翠,范英,等.中國能源報告(2008):碳排放研究[M].北京:科學(xué)出版社,2008.
[3]朱勤,彭希哲,陸志明,等.人口與消費對碳排放影響的分析模型與實證[J].中國人口·資源與環(huán)境,2010,20(2):98-102.
ZHU Qin,PENG Xi-zhe,LU Zhi-ming,et al.Analysis model and empirical study of impacts from population and consumption on carbon emissions[J].China Population,Resources and Environment,2010,20(2):98-102.
[4]王海建.中國能源消費與溫室氣體排放預(yù)測分析[J].上海環(huán)境科學(xué),1999,18(2):67-69.
WANG Hai-jian.Energy consumption and prediction of greenhouse gas emission in China[J].Shanghai Environmental Sciences,1999,18(2):67-69.
[5]陳文穎,高鵬飛,何建坤.用MARKAL-MACRO模型研究碳減排對中國能源系統(tǒng)的影響[J].清華大學(xué)學(xué)報:自然科學(xué)版,2004,44(3):342-346.
CHENWen-ying,GAO Peng-fei,HE Jian-kun.Impact of carbon mitigation on China's energy system using China MARKAL-MACRO model[J].Journal of Tsinghua University(Science and Technology),2004,44(3):342-346.
[6]王燦,陳吉寧,鄒驥.基于CGE模型的CO2減排對中國經(jīng)濟的影響[J].清華大學(xué)學(xué)報:自然科學(xué)版,2005,45(12):1621-1624.
WANG Can,CHENJi-ning,ZOU Ji.Impact assessment of CO2mitigation on China economy based on a CGE model[J].Journal of Tsinghua University(Science and Technology),2005,45(12):1621-1624.
[7]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國防工業(yè)出版社,1999.
[8]朱平芳.現(xiàn)代計量經(jīng)濟學(xué)[M].上海:上海財經(jīng)大學(xué)出版社,2004.
[9]YORK R,ROSA E A,DIETZ T.STIRPAT,IPAT and impact:analytic tools for unpacking the driving forces of environmental impacts[J].Ecological Economics,2003,46:351-365.
[10]鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機[M].北京:科學(xué)出版社,2004.
[11]張在旭,宋杰鯤,張宇.一種基于支持向量機的企業(yè)財務(wù)危機預(yù)警新模型[J].中國石油大學(xué)學(xué)報:自然科學(xué)版,2006,30(4):132-136.
ZHANG Zai-xu,SONG Jie-kun,ZHANG Yu.A novel model for pre-warning of enterprise financial crisis based on support vector machine[J].Journal of China University of Petroleum(Edition of Natural Science),2006,30 (4):132-136.
[12]蘭浩,張國忠,劉剛,等.應(yīng)用支持向量回歸預(yù)測膠凝原油啟動屈服應(yīng)力[J].中國石油大學(xué)學(xué)報:自然科學(xué)版,2008,32(3):119-121,127.
LANHao,ZHANG Guo-zhong,LIU Gang,et al.Prediction of start-up yield stress of gelled crude oil by support vector regression[J].Journal of China University of Petroleum(Edition of Natural Science),2008,32(3): 119-121,127.
[13]鄧九英,王欽若,毛宗源,等.基于粗糙集的支持向量回歸機混合算法[J].中國石油大學(xué)學(xué)報:自然科學(xué)版,2009,33(5):159-163.
DENG Jiu-ying,WANG Qin-ruo,MAO Zong-yuan,et al.Support vector regression hybrid algorithm based on rough set[J].Journal of China University of Petroleum (Edition of Natural Science),2009,33(5):159-163.
[14]周延軍,賈江鴻,李榮華.基于粗糙集理論和支持向量機的套管損壞動態(tài)預(yù)報方法[J].中國石油大學(xué)學(xué)報:自然科學(xué)版,2010,34(6):71-75.
ZHOU Yan-jun,JIA Jiang-hong,LI Rong-hua.Dynamic prediction method of casing damage based on rough set theory and support vector machine[J].Journal of China University of Petroleum(Edition of Natural Science),2010,34(6):71-75.
China's carbon emissions prediction model based on support vector regression
SONG Jie-kun
(School of Economics&Management in China University of Petroleum,Qingdao266555,China)
Six influnce factors including population,urbanization rate,per capita GDP,added value proportion of service industry,per GDP energy consumption and coal consumption ratio were seleted as independent variables,and a model based on support vector regression(SVR)was established for predicting carbon emissions of China.Using the data of carbon emissions and influence factors from the year 1980 to 2009 as samples,the SVRmodel with good learning and generalization ability was established through training and testing.According to the 12th five-year program,prediction values of influence facors under different situations were set,and the carbon emissions of China from the year 2010 to 2015 were predicted.The results show that China can appropriately reduce GDP growth speed and constantly optimize energy structure so as to achieve carbon reduction target efficiently.
carbon emissions;support vector regression;prediction model
X 192
A
10.3969/j.issn.1673-5005.2012.01.033
1673-5005(2012)01-0182-06
2011-08-15
山東省自然科學(xué)基金項目(ZR2011GQ004);山東省高??蒲邪l(fā)展計劃項目(J10WG94);中央高校基本科研業(yè)務(wù)費專項資金資助項目(11CX04034B,10CX04012B);教育部人文社科一般項目(10YJC630207)
宋杰鯤(1979-),男(漢族),山東萊陽人,副教授,博士,從事能源經(jīng)濟管理方面的研究。
(編輯 修榮榮)