常思遠
(江蘇大學 財經(jīng)學院,江蘇 鎮(zhèn)江 212013)
近幾年來,空氣污染已經(jīng)成為一個全球化問題,受到全世界各個國家的關注。同樣在我國,隨著經(jīng)濟的迅猛發(fā)展,各地區(qū)尤其是我國中原地區(qū)都在飽受長時間、大范圍霧霾問題的困擾。自“十三五”召開以來,各級政府越來越關注于“綠色發(fā)展”,持續(xù)加強各行各業(yè)的污染減排和末端治理,解決存量污染物治理和生態(tài)環(huán)境修復等問題。2019年兩會同樣要求在經(jīng)濟下行壓力較大的情況下,環(huán)境監(jiān)管亦不能松懈,需要繼續(xù)強化生態(tài)環(huán)境剛性約束。在這樣的要求下,中原地區(qū)在加快發(fā)展的同時如何控制空氣污染就成為了需要考慮的問題。基于此,發(fā)現(xiàn)對空氣污染有顯著影響的指標并預測,以求對未來的空氣污染狀況進行評估與調(diào)控就是我們需要解決的問題。為此,本文采用文獻分析法和偏最小二乘法,構(gòu)建出空氣污染影響因素的回歸模型,確定具有顯著影響的指標并預測未來的空氣污染狀況。
空氣污染影響因素的研究并不是一個新的課題,國內(nèi)外已有豐富的研究結(jié)果,大致將影響因素分為五個方面。經(jīng)濟增長方面,Soumyananda(2004)、李斌和李拓(2014)都通過環(huán)境庫茲涅茨曲線假說來說明空氣污染和經(jīng)濟增長之間的關系是一種倒“U”型關系,前者認為經(jīng)濟發(fā)展一開始會加劇空氣污染狀況,但在到達一個節(jié)點后便會減緩空氣污染狀況。后者借用前者的觀點,得出我國正處于“U”型曲線的拐點,即經(jīng)濟增長導致空氣污染加劇的時期這樣的結(jié)論[1-2]。李茜等(2013)認為第二產(chǎn)業(yè)結(jié)構(gòu)比例與空氣污染物濃度具有明顯的正向關系[3]。同時韓楠、于維洋(2015)和吳振信等(2016)也認為第二產(chǎn)業(yè)占比對空氣污染有著重要影響[4-5]。能源消費方面,F(xiàn)aamd(2001)對歐盟200多個城市和地區(qū)進行研究,發(fā)現(xiàn)在城市化的過程中,能源消費已經(jīng)成為影響空氣污染的主導因素[6]。王敏和黃瀅(2015)對此結(jié)論進行概括,說明在高收入地區(qū),隨著經(jīng)濟的進一步增長,會導致空氣污染的進一步惡化[7]。機動車尾氣排放方面,Ghose等(2004)通過對印度大型城市的研究指出,空氣污染所產(chǎn)生的空氣質(zhì)量危機主要來源于交通運輸過程中產(chǎn)生的尾氣排放[8]。高紋(2019)的研究結(jié)果同樣表明在北上廣等超大型城市,機動車所產(chǎn)生的交通尾氣排放是當?shù)乜諝馕廴镜闹饕騕9]。技術進步方面,Hixson M等(2010)利用四種不同的技術和手段對地區(qū)的空氣污染狀況進行分析,發(fā)現(xiàn)技術會明顯影響空氣污染的狀況[10]。陳平等(2012)、牛海鵬等(2012)認為在治理空氣污染的過程中需要考慮到技術進步對空氣污染的影響,并且技術創(chuàng)新會對廢氣排放強度帶來比較強的影響[11-12]。政府治污投資方面,徐業(yè)傲(2014)的研究結(jié)果指出,當治理廢氣投資增加時,工業(yè)廢氣排放量有下降趨勢[13]。而Feinerman E等(2001)用以色列的例子來說明“政府治污投資”的這樣一種政策雖然與空氣污染有關,但不是人們所想的限制性關系[14]。
在空氣污染的研究方法上,Smith R I(1999)利用空氣污染統(tǒng)計的方法,確定了英國在不同歷史背景下對當時二氧化硫排放量的控制水平[15]。Mei-Li You、Chi-Min Shu、Wei-Ting等(2016)采用灰關聯(lián)度和灰熵的方法計算日本五大空氣污染物所帶來的空氣質(zhì)量的下降,以此來說明當?shù)乜諝馕廴緮U散的趨勢,并用這種方法建立各種空氣污染的容許限度[16]。姜磊、周海峰、柏玲等(2018)運用自然正交函數(shù)分析城市空氣質(zhì)量指數(shù)的時空演變特征,并采用基于衰減效應的矩陣指數(shù)空間設定模型探討了空氣污染的影響因素[17]。張麗峰(2017)的研究中運用了脫鉤理論和VAR模型,分析了北京三類主要空氣污染物與經(jīng)濟增長狀況之間的脫鉤狀態(tài)、相互間的動態(tài)影響和程度[18]。張志威(2017)將因子分析法和聚類分析法結(jié)合,對由經(jīng)濟和污染物排放所組成的指標進行綜合研究,發(fā)現(xiàn)了制約空氣質(zhì)量的關鍵因素[19]。
本文的研究以我國中原五省的省際面板數(shù)據(jù)為研究對象,選擇偏最小二乘回歸方法構(gòu)建模型,并通過實證分析來得出不同影響因素的影響力大小,最終對未來情況進行預測。與現(xiàn)有研究空氣污染影響因素的文獻相比,本文的差異有以下兩點:一、選用的數(shù)據(jù)量大且具有針對性,可以較為科學的得出影響該地區(qū)空氣質(zhì)量的因素;二、可以通過最后得出的模型進行預測,以幫助人們更好地應對未來的空氣污染狀況,起到一定的評估和預警作用。
偏最小二乘回歸模型是一種相對較新的多元統(tǒng)計分析方法,自從1983年它首次被提出后就受到了廣泛的應用。偏最小二乘回歸模型是結(jié)合了多元線性回歸、主成分分析和典型相關分析三種方法的優(yōu)點而得到的模型方法,它不僅可以解決變量間的多重線性相關問題,也可以解決在回歸分析中樣本數(shù)量少于變量數(shù)量的問題。同時在回歸建模中,可以做到簡化數(shù)據(jù)結(jié)構(gòu)、使變量間的相關分析變得簡單和進行預測。
偏最小二乘回歸首先在X和Y中提取成分t1和u1。在提取這兩個主成分時,要求t1和u1要盡可能攜帶它們各自數(shù)據(jù)矩陣中的變量信息并且t1和u1的相關程度能夠達到最大。只有這樣,t1和u1才能既最大化代表數(shù)據(jù)表X與Y,同時又保證自變量成分t1對因變量成分u1有最好的解釋能力。
在第一個成分t1和u1被提取后,分別實施X對t1的回歸以及Y對t1的回歸。因為此時數(shù)據(jù)已經(jīng)做到各成分之間不存在完全的共線性,可以進行回歸。如果變量間的回歸方程已經(jīng)達到了滿意的程度,計算就會停止;否則,將利用X被t1解釋后的剩余信息以及Y被t1解釋后的剩余信息進行第二次的成分提取。如此循環(huán)下去,直到能達到一個比較滿意的精度為止。
選用多少個成分通過交叉有效性來判斷。定義預測誤差平方和為PRESS,交叉有效性為
當Qh2≥(1-0.952)=0.0975時,th成分的邊際貢獻是顯著的,該th就需要被使用。
如果最終對X提取了m個成分t1,…,tm,偏最小二乘回歸將通過yk對成分t1,…,tm的回歸,再表達成yk關于原變量x1,…,xp的回歸方程,k=1,2…,q。最后得到的方程結(jié)果應為如下形式
yk=β0k+β1kx1+β2kx2+……+βpkxp+εk,k=1,2,…,q
在構(gòu)建模型的準備階段,我們需要對變量指標進行選取。在能夠表示空氣污染狀況的因變量的選取上,我們選取了二氧化硫排放量、氮氧化物排放量和煙(粉)塵排放量作為因變量進行模型構(gòu)建。
在自變量的選取上,本文選取了地區(qū)國民生產(chǎn)總值、固定資產(chǎn)投資和第二產(chǎn)業(yè)占比作為表示經(jīng)濟增長的指標,選取了煤炭消費量和原油消費量作為能源消耗指標,以公路里程、民用汽車擁有量和私人汽車擁有量作為反映機動車尾氣排放的指標,以經(jīng)費投入強度、技術市場成交額和規(guī)模以上工業(yè)企業(yè)有效發(fā)明專利數(shù)作為技術進步的指標,最后以治理廢氣項目完成投資作為政府治污投資指標。
在選取變量的過程中,由于各個省份的人口數(shù)量不同,地區(qū)國民生產(chǎn)總值總量的不同,單純地比較各個變量的絕對值容易產(chǎn)生誤差,故所選取的變量都進行了初步的處理。其中治理廢氣投資強度是采用治理廢氣投資額與地區(qū)國民生產(chǎn)總值的比值,民用車數(shù)、私人車數(shù)和有效專利件數(shù)若采用人均值則數(shù)值太小,不方便模型計算,故采用萬人平均處理,其他的變量均采用人均數(shù)值。另外在模型的計算中,為了避免量綱和數(shù)量級的不同,我們對數(shù)據(jù)都進行了標準化處理。
本文的研究對象為中原五省的空氣污染影響因素,故在選取指標時以中原五省為基礎,選擇了2011年—2017年七年的面板數(shù)據(jù)為樣本進行模型構(gòu)建。表1為最終采用的空氣污染狀況指標體系。
表1 空氣污染狀況指標體系
(一)偏最小二乘回歸模型的檢驗
在最終構(gòu)建模型方程之前,我們需要對偏最小二乘回歸模型的結(jié)果進行檢驗,來判斷模型的擬合效果是否良好。首先是線性相關性檢驗,利用的是t1/u1平面圖,其中t1是自變量組的第一偏最小二乘成分,u1是因變量組的偏最小二乘成分,如圖1所示:
圖1 平面圖
從圖中我們可以看出u1和t1之間呈現(xiàn)較為明顯的線性關系,說明在模型中所選取的兩組變量存在較強的相關關系。這樣我們可以認為模型中所選取的變量是合理的。
接著進行的是回歸模型的精度檢驗,通過累計解釋能力來判斷。當交叉有效性大于0.0975時成分提取終止,再通過所選取的成分的累計解釋能力來判斷模型的精度。表2為模型的精度分析
表2 空氣污染影響因素的偏最小二乘回歸的精度分析
表2中,符號R2X表示成分th對X的解釋能力,R2X(cum)表示成分t對X的累計解釋能力;符號R2Y表示成分th對Y的解釋能力,R2Y(cum)表示成分t對Y的累計解釋能力。Q2值則為交叉有效性,臨界值取0.0975。當成分的交叉有效性小于0.0975時成分選取終止,所以最后選擇了三個成分。從表2數(shù)據(jù)來看,三個成分對X組自變量的信息利用率為77.5%,并且能夠解釋76.1%的Y組因變量,二者的解釋能力都大于了75%,說明模型提取的成分結(jié)果很好。
再次進行的th是的成分解釋。通過t1、t2、t3與原變量xj與yk的相關系數(shù)平方表來解釋,如表3所示:
表3 空氣污染影響因素的t1、t2、t3與原變量的相關系數(shù)平方表
從表中可以看出,t1與人均固定資產(chǎn)投資、人均煤炭消費量、經(jīng)費投入強度和人均技術市場成交額呈強相關,t2與人均國民生產(chǎn)總值、人均原油消費量、每萬人擁有民用車數(shù)量、每萬人擁有私人車數(shù)量和治理廢氣投資強度呈強相關,t3則與第二產(chǎn)業(yè)占比呈強相關。
(二)預測模型
通過上述對模型的檢驗和初步分析可以發(fā)現(xiàn)我們模型的建立是合理,接下來便可以通過計算得出模型的最終結(jié)果并進行預測。最終的回歸模型系數(shù)表如表4所示:
表4 空氣污染影響因素的回歸模型系數(shù)表
通過回歸模型系數(shù)表我們可以得到最后需要的模型方程
y1=1.6665-0.0873x1+0.3961x2
+0.4337x3+0.8811x4-0.3081x5-0.1584x6
+0.1041x7-0.3652x8-0.0583x9+0.1794x10
-0.1384x11-0.0150x12
y2=2.4775-0.1510x1+0.5049x2
+0.5093x3+0.9378x4-0.3075x5-0.0079x6
+0.1344x7-0.5243x8-0.0895x9+0.2200x10
-0.0925x11-0.0301x12
y3=1.3861-0.2358x1+0.7682x2
+0.3738x3+1.0369x4-0.1983x5-0.0420x6
+0.2874x7-0.5523x8-0.1755x9+0.2477x10
-0.0899x11-0.0723x12
通過我們最后得到的回歸模型,我們就可以對未來進行預測,如當我們擁有自變量未來的數(shù)據(jù)時就可以預測未來的空氣污染情況。為了檢驗我們模型的預測效果,我們通過對已有數(shù)據(jù)的觀測值和預測值的比值畫出觀測值/預測值圖來判斷,如圖2(a)、圖2(b)和圖2(c)所示
圖2(a) 二氧化硫排放量的觀測值/預測值圖
圖2(b) 氮氧化物排放量的觀測值/預測值圖
圖2(c) 煙(粉)塵排放量的觀測值/預測值圖
圖中的直線為坐標系的對角線,當預測結(jié)果好時,則所有點都會靠近這條線。如此,從三張圖中可以看出我們的預測結(jié)果很好,可以進行較為準確的預測。
根據(jù)偏最小二乘回歸模型的結(jié)果可以看到,對于二氧化硫排放量來說,從系數(shù)絕對值來看,煤炭消費量的影響最大。緊接著固定資產(chǎn)投資、第二產(chǎn)業(yè)占比和原油消費量這些指標也有較大的影響。對于氮氧化物排放量來說,同樣從系數(shù)絕對值來看,煤炭消費量的影響最大。緊接著固定資產(chǎn)投資、第二產(chǎn)業(yè)占比和原油消費量這些指標同樣也有較大的影響。對于煙(粉)塵排放量來說,人均國民生產(chǎn)總值、每萬人民用車擁有量和人均技術市場成交額的系數(shù)絕對值較大,說明這些指標對煙(粉)塵的影響顯著。同時也說明,原油的消費主要造成的是二氧化硫和氮氧化物的排放,對煙(粉)塵的影響較小。
從相關系數(shù)平方表中我們可以看到,對空氣污染影響最大的因素應該是固定資產(chǎn)投資、煤炭消費量、經(jīng)費投入強度和技術市場成交額。若想對空氣污染狀況進行控制,那么就需要從影響最大的幾項因素指標入手來達成目的。
綜上分析,中原五省在發(fā)展經(jīng)濟過程中要控制空氣污染的程度,需要對上文提到的有較大影響的變量指標進行綜合調(diào)控。如在固定資產(chǎn)投資加速的情況下,需盡可能減少煤炭消費量,加大治污經(jīng)費投入,特別是發(fā)展治污技術,并促進技術市場發(fā)展,使得技術在經(jīng)濟發(fā)展中起到主導作用。本模型也可用于對空氣污染狀況進行預測。