張 紅, 董小剛 , 李 群
(長(zhǎng)春工業(yè)大學(xué) 基礎(chǔ)科學(xué)學(xué)院, 吉林 長(zhǎng)春 130012)
?
PM2.5濃度影響因素的主成分回歸分析
張 紅, 董小剛*, 李 群
(長(zhǎng)春工業(yè)大學(xué) 基礎(chǔ)科學(xué)學(xué)院, 吉林 長(zhǎng)春 130012)
選取全國(guó)31個(gè)城市,對(duì)空氣中細(xì)顆粒物(PM 2.5)濃度的影響因素進(jìn)行分析。為處理自變量之間存在的共線性,選用主成分回歸。確定主成分的個(gè)數(shù),將原自變量的主成分代替原自變量進(jìn)行回歸分析??偨Y(jié)出造成空氣中細(xì)顆粒物(PM 2.5)濃度上升的因素分為兩方面,直接因素中二氧化氮濃度和間接因素中汽車數(shù)量。
PM 2.5; 主成分分析法; 回歸分析
近年來(lái)霧霾天氣越來(lái)越嚴(yán)重,尤其是人口聚居的城市地區(qū),霧霾中混雜著有害物質(zhì),對(duì)健康產(chǎn)生直接危害。細(xì)顆粒物(PM2.5)是構(gòu)成霾的主要成分,與較粗的大氣顆粒物相比,細(xì)顆粒物(PM2.5)粒徑小,面積大,活性強(qiáng),易附帶有毒、有害物質(zhì)(例如重金屬、細(xì)菌等),且在大氣中的停留時(shí)間長(zhǎng),輸送距離遠(yuǎn)。人體的鼻腔、咽喉?yè)醪蛔?,它們可以一路下行,進(jìn)入細(xì)支氣管、肺泡,再通過(guò)肺泡壁進(jìn)入毛細(xì)血管,再進(jìn)入整個(gè)血液循環(huán)系統(tǒng)。對(duì)人體的呼吸系統(tǒng)和心血管系統(tǒng)造成傷害。所以,治理霧霾的關(guān)鍵就是解決細(xì)顆粒物(PM2.5)問(wèn)題[1]。
城市空氣中有毒顆粒物的來(lái)源如下:
1)汽車尾氣。使用柴油的大型車大量排放PM10,使用汽油的小型車雖然排放的是氣態(tài)污染物,比如氮氧化物等,但碰上霧天,也很容易轉(zhuǎn)化為二次顆粒污染物。
2)北方冬季燒煤供暖所產(chǎn)生的廢氣。
3)工業(yè)生產(chǎn)排放的廢氣。比如冶金、窯爐與鍋爐、機(jī)電制造業(yè),還有大量汽修噴漆、建材生產(chǎn)、窯爐燃燒排放的廢氣。
4)建筑工地和道路交通產(chǎn)生的揚(yáng)塵。
5)可生長(zhǎng)顆粒,細(xì)菌和病毒的粒徑相當(dāng)于PM0.1~PM 2.5,空氣中的濕度和溫度適宜時(shí),微生物會(huì)附著在顆粒物上,特別是油煙的顆粒物上,微生物吸收油滴后轉(zhuǎn)化成更多的微生物,使得空氣中的生物有毒物質(zhì)生長(zhǎng)增多。
6)家庭裝修中產(chǎn)生的粉塵?,F(xiàn)在很多城市的空氣污染物排放水平已處于臨界點(diǎn),對(duì)氣象條件非常敏感,空氣質(zhì)量在擴(kuò)散條件較好時(shí)能達(dá)標(biāo),一旦遭遇不利天氣條件,空氣質(zhì)量和能見度就會(huì)立刻下滑。
不同城市空氣中細(xì)顆粒物(PM2.5)濃度有很大的差異,這與每個(gè)城市所處的地理位置、氣候以及人們的行為活動(dòng)有很大的關(guān)系。選取全國(guó)31個(gè)主要城市,分別為北京、天津、石家莊、太原、呼和浩特、沈陽(yáng)、長(zhǎng)春、哈爾濱、上海、南京、杭州、合肥、福州、南昌、濟(jì)南、鄭州、武漢、長(zhǎng)沙、廣州、南寧、海口、重慶、成都、貴陽(yáng)、昆明、拉薩、西安、蘭州、西寧、銀川、烏魯木齊,分析不同因素對(duì)空氣中細(xì)顆粒物(PM2.5)濃度的影響。
造成細(xì)顆粒物(PM2.5)濃度上升的原因很多,有直接的因素,也有間接的因素。根據(jù)現(xiàn)有理論和檢測(cè)結(jié)果,文中將細(xì)顆粒物(PM2.5)濃度的影響因素概括為17個(gè)方面。間接的因素有:平均溫度、平均濕度、降水量、日照時(shí)長(zhǎng)、工業(yè)二氧化硫排放量、工業(yè)氮氧化物排放量、工業(yè)煙(粉)塵排放量、生活二氧化硫排放量、生活氮氧化物排放量、生活煙塵排放量、汽車總量。直接的因素有:二氧化硫年平均濃度、二氧化氮年平均濃度、可吸入顆粒物(PM10)年平均濃度、一氧化碳日均值第95百分位濃度、臭氧(O3)日最大8 h第90百分位濃度、空氣質(zhì)量達(dá)到及好于二級(jí)的天數(shù)。
確定了造成細(xì)顆粒物(PM2.5)濃度上升的因素后,可以建立多元線性回歸模型[2]:
y=α0+α1x1+α2x2+α3x3+α4x4+α5x5+α6x6+α7x7+α8x8+α9x9+
式中:y----因變量,細(xì)顆粒物(PM2.5)年平均濃度;
x1----平均溫度,℃;
x2----平均濕度;
x3----降水量;
x4----日照時(shí)長(zhǎng);
x5----工業(yè)二氧化硫排放量,t;
x6----工業(yè)氮氧化物排放量,t;
x7----工業(yè)煙(粉)塵排放量,t;
x8----生活二氧化硫排放量,t;
x9----生活氮氧化物排放量,t;
x10----生活煙塵排放量,t;
x11----二氧化硫年平均濃度,μg/m3;
x12----二氧化氮年平均濃度,μg/m3;
x13----可吸入顆粒物(PM10)年平均濃度,μg/m3;
x14----一氧化碳日均值第95百分位濃度,μg/m3;
x15----臭氧(O3)日最大8 h第90百分位濃度,μg/m3;
x16----空氣質(zhì)量達(dá)到及好于二級(jí)的天數(shù);
x17----汽車總量,萬(wàn)輛。
文中數(shù)據(jù)來(lái)源于文獻(xiàn)[3]。
對(duì)因變量與所有自變量做相關(guān)分析,相關(guān)系數(shù)矩陣說(shuō)明自變量與因變量之間有較大的相關(guān)關(guān)系,分析結(jié)果見表1。
表1 相關(guān)分析結(jié)果
直接做最小二乘回歸,得到結(jié)果見表2。
表2 最小二乘回歸
對(duì)回歸模型的檢驗(yàn)中P值小于0.01,說(shuō)明該回歸模型適合該數(shù)據(jù)的分析,結(jié)果見表3。
表3 回歸模型檢驗(yàn)
對(duì)數(shù)據(jù)做共線性診斷,結(jié)果見表4。
表4 共線性診斷
從表4中可以看出,很多條件指數(shù)都超過(guò)10,說(shuō)明變量之間共線性很大[4]。
主成分回歸的基本思想是將線性相關(guān)的一類變量轉(zhuǎn)化為線性無(wú)關(guān)的一類新的綜合變量,這些綜合變量反映原來(lái)多個(gè)變量的信息,主成分回歸是選取其中較少的幾個(gè)新的綜合變量建立模型回歸方程。主成分回歸的方法步驟如下:
1)對(duì)自變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換;
2)計(jì)算相關(guān)系數(shù)矩陣;
3)計(jì)算相關(guān)矩陣的特征值及對(duì)應(yīng)的特征向量;
4)計(jì)算主成分貢獻(xiàn)率并選擇合適的主成分;
5)計(jì)算主成分載荷與得分;
6)利用所選主成分進(jìn)行回歸分析[5-6]。
運(yùn)用統(tǒng)計(jì)軟件SAS9.4對(duì)影響PM2.5濃度的各因素進(jìn)行主成分分析,結(jié)果見表5。
表5 主成分分析結(jié)果
從表5中可知,第1主成分的特征根為5.573,解釋了總變異的32.78%;第2主成分的特征根為3.395,解釋了總變異的19.97%;第3主成分的特征根為2.814,解釋了總變異的16.55%;第4主成分的特征根為1.685,解釋了總變異的9.92%。前4個(gè)特征根的累計(jì)貢獻(xiàn)率達(dá)到79.23%,說(shuō)明前4個(gè)主成分已經(jīng)反映原來(lái)17個(gè)指標(biāo)79.23%的信息,因此確定選擇前4個(gè)主成分建立模型。提取的前4個(gè)主成分F1,F(xiàn)2,F(xiàn)3,F(xiàn)4見表6。
以4個(gè)主成分F1,F(xiàn)2,F(xiàn)3,F(xiàn)4為自變量進(jìn)行多元線性回歸分析,建立回歸模型:
表6 主成分表
注:表中各變量同模型(1)。
方差分析結(jié)果見表7。
表7 方差分析結(jié)果
R2為0.841 2,調(diào)整R2為0.816 8,說(shuō)明模型擬合較好。最后,將4個(gè)主成分表達(dá)式代入,得到最終的主成分回歸方程:
從主成分回歸方程可以看出,直接影響因素對(duì)細(xì)顆粒物(PM2.5)濃度影響比較大??諝庵形廴疚餄舛鹊纳仙苯訉?dǎo)致細(xì)顆粒物(PM2.5)濃度上升,其中二氧化氮的濃度(x12)對(duì)細(xì)顆粒物(PM2.5)濃度影響最大,可吸入顆粒物(PM10)的濃度(x13)對(duì)細(xì)顆粒物(PM 2.5)濃度影響次之,而二氧化硫年平均濃度(x11)、一氧化碳日均值第95百分位濃度(x14)、臭氧(O3)日最大8 h第90百分位濃度(x15)對(duì)細(xì)顆粒物(PM 2.5)濃度影響較小。空氣質(zhì)量達(dá)到及好于二級(jí)的天數(shù)與對(duì)細(xì)顆粒物(PM2.5)濃度是負(fù)相關(guān)的。
間接影響因素對(duì)細(xì)顆粒物(PM2.5)濃度影響比較小。但是汽車總量(x17)作為間接影響因素對(duì)細(xì)顆粒物(PM2.5)濃度影響非常大,廢氣的排放中,生活氮氧化物排放量(x9)和生活煙塵排放量(x10)對(duì)細(xì)顆粒物(PM2.5)濃度影響比較大,工業(yè)二氧化硫排放量(x5)、工業(yè)氮氧化物排放量(x6)和生活二氧化硫排放量(x8)對(duì)細(xì)顆粒物(PM2.5)濃度影響較小,工業(yè)煙(粉)塵排放量(x7)對(duì)細(xì)顆粒物(PM2.5)濃度影響很小,甚至有了負(fù)相關(guān)。天氣因素中溫度(x1)、濕度(x2)、降水量(x3)、日照時(shí)長(zhǎng)(x4)對(duì)細(xì)顆粒物(PM2.5)濃度影響都很小。溫度(x1)越高,濕度(x2)越大,細(xì)顆粒物(PM2.5)濃度越大,降水量(x3)越小,日照時(shí)長(zhǎng)(x4)越短,細(xì)顆粒物(PM2.5)濃度越小。
根據(jù)實(shí)證分析結(jié)果,溫度、濕度對(duì)細(xì)顆粒物(PM2.5)有一定的影響,溫度越高,濕度越大,越有利于空氣中顆粒物的形成。但這個(gè)因素是人為無(wú)法控制的。降低細(xì)顆粒物(PM2.5)濃度應(yīng)該降低空氣中二氧化氮、可吸入顆粒物(PM10)、二氧化硫、一氧化碳、臭氧的濃度。措施如下:
1)控制汽車尾氣對(duì)空氣的污染,應(yīng)該減少汽車的數(shù)量或者改善汽車的尾氣排放系統(tǒng),將尾氣進(jìn)行處理再排放,這是減少?gòu)U氣排放的主要措施。
2)生活氮氧化物來(lái)源主要是居民生活燃煤燃油和生物質(zhì)的燃燒,應(yīng)該提高天然氣的普及程度,減少小型煤炭炊事或者蜂窩煤的使用,避免秸稈的焚燒處理。
3)交通工具的排氣,垃圾焚燒、取暖鍋爐和家庭爐灶排出的煙氣都是生活煙塵污染的主要來(lái)源。應(yīng)該加強(qiáng)城市綠化,集中供暖,改造鍋爐,改進(jìn)燃料的燃燒方法,安裝凈化除塵設(shè)備[7-9]。
4)工業(yè)二氧化硫、工業(yè)氮氧化物主要來(lái)源于鋼鐵、有色金屬冶煉、火力發(fā)電、水泥和石油化工企業(yè)的生產(chǎn)過(guò)程。應(yīng)該加強(qiáng)管理,使工廠排放的廢氣在標(biāo)準(zhǔn)控制范圍內(nèi)。把排放煙塵的企業(yè)安排在居住區(qū)常年風(fēng)向頻率最小的上風(fēng)側(cè),以減少煙塵對(duì)居住區(qū)的污染。
通過(guò)以上分析,可以知道影響空氣中細(xì)顆粒物(PM 2.5)濃度的主要原因,并根據(jù)各種原因給出相應(yīng)的解決方案,希望可以為各城市空氣質(zhì)量的改善提供一些參考。
[1] 顧昊,張亞男,劉欣,等.哈爾濱市春季PM(2.5)污染狀況及來(lái)源調(diào)查研究[J].環(huán)境科學(xué)與技術(shù),2013(S2):94-98.
[2] 李毛俠.安徽省消費(fèi)需求影響因素的主成分回歸分析[J].現(xiàn)代經(jīng)濟(jì):現(xiàn)代物業(yè)中旬刊,2010,9(2):48-51.
[3] 國(guó)家統(tǒng)計(jì)局城市社會(huì)經(jīng)濟(jì)調(diào)查司.中國(guó)城市統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,2014.
[4] Mcdonald G C, Schwing R C. Instabilities of regression estimates relating air pollution to mortality [J]. Technometrics,1973,15(3):463-481.
[5] 何曉群.應(yīng)用回歸分析[M].北京:中國(guó)人民大學(xué)出版社,2001.
[6] 哈德勒.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:北京大學(xué)出版社,2011.
[7] 楊天智.長(zhǎng)沙市大氣顆粒物PM2.5化學(xué)組分特征及來(lái)源解析[D].長(zhǎng)沙:中南大學(xué),2010.
[8] 李東海,何彩霞.淺談霧霾天氣的識(shí)別及預(yù)警策略[J].安徽農(nóng)學(xué)通報(bào),2011,17(18):165-166.
[9] 董小剛,王淑影,王純杰.基于動(dòng)態(tài)因子的經(jīng)濟(jì)水平差異分析[J].長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào),2015,36(2):125-129.
Principal component regression analysis of influencing factors of PM 2.5 concentration
ZHANG Hong, DONG Xiaogang*, LI Qun
(School of Basic Sciences, Changchun University of Technology, Changchun 130012, China)
For 31 cities across the country, the influential factors to concentration of air fine particulate matter (PM 2.5) are analyzed. Principal component regression is selected to process the collinearityamong the independent variables. We choose the number of principal components and replace the original variables with principal component with regression analysis. It comes to a conclusion that the reasons for increase of PM 2.5 are the following: increase of NO2concentrations and the number of cars.
PM 2.5; principal component; regression analysis.
2017-02-15
國(guó)家自然科學(xué)基金資助項(xiàng)目(11571051,11301037)
張 紅(1990-),女,漢族,山東青島人,長(zhǎng)春工業(yè)大學(xué)碩士研究生,主要從事生存分析方向研究,E-mail:253085825@qq.com. *通訊作者:董小剛(1961-),男,漢族,吉林長(zhǎng)春人,長(zhǎng)春工業(yè)大學(xué)教授,博士,主要從事數(shù)理統(tǒng)計(jì)方向研究,E-mail:dongxiaogang@ccut.edu.cn.
10.15923/j.cnki.cn22-1382/t.2017.2.01
O 212
A
1674-1374(2017)02-0105-06