常麗娜,王穎俐,王 瑤
(長(zhǎng)治學(xué)院 數(shù)學(xué)系,山西 長(zhǎng)治046011)
空氣質(zhì)量與人的身體健康密切相關(guān),數(shù)據(jù)顯示,一個(gè)成年人平均每天吸入空氣15.7m3,空氣進(jìn)入身體后,經(jīng)過人體循環(huán)到達(dá)各個(gè)器官[1].隨著全球城市化高速發(fā)展,霧霾、酸雨等空氣污染問題層出不窮,也由此導(dǎo)致了一系列的健康問題.空氣污染已經(jīng)成為不可忽略的重點(diǎn)問題.近幾年,我國(guó)在空氣治理方面做了很多工作,如推動(dòng)可持續(xù)發(fā)展戰(zhàn)略、鼓勵(lì)和支持使用清潔能源、加強(qiáng)城鄉(xiāng)綠化建設(shè)、藍(lán)天保衛(wèi)戰(zhàn)等.
近年來,有不少學(xué)者做了空氣質(zhì)量方面的研究,這些研究多是針對(duì)某個(gè)區(qū)域,如:京津冀地區(qū)、汾渭平原、長(zhǎng)江三角洲地區(qū)或某些重點(diǎn)城市如北京、深圳等地的具體研究[2-6],其啟示意義具有針對(duì)性但是缺乏不同情況具體應(yīng)用的適應(yīng)性.因此本文從我國(guó)的338個(gè)地級(jí)及以上城市中隨機(jī)選取65個(gè)城市為樣本城市,依據(jù)“組內(nèi)盡可能相似,組間盡可能不同”的原則進(jìn)行分類、劃分等級(jí),以分析不同區(qū)域和不同條件下的城市空氣質(zhì)量的異同,進(jìn)而精準(zhǔn)施策、對(duì)癥下藥,針對(duì)不同等級(jí)的城市提出相應(yīng)的治理方法,為我國(guó)城市的具體污染治理提供參考.
根據(jù)《中國(guó)統(tǒng)計(jì)年鑒2019》[7]公布的2018年全國(guó)環(huán)保重點(diǎn)城市空氣質(zhì)量情況數(shù)據(jù),抽取65個(gè)樣本城市作為研究對(duì)象,來研究我國(guó)城市的空氣質(zhì)量情況.為保證樣本數(shù)據(jù)的隨機(jī)性、分布廣泛性,65個(gè)樣本城市主要為4個(gè)直轄市、27個(gè)省會(huì)城市以及隨機(jī)選取的34個(gè)其它重點(diǎn)環(huán)保城市.
本文主要選取二氧化硫SO2年平均濃度(μg/m3)、二氧化氮NO2年平均濃度(μg/m3)、可吸收顆粒物PM10年平均濃度(μg/m3)、一氧化碳CO日均值第95百分位濃度(mg/m3)、臭氧O3日最大8小時(shí)第90百分位濃度(μg/m3)、細(xì)顆粒物PM2.5年平均濃度(μg/m3)等6個(gè)空氣中主要污染物的指標(biāo)作為評(píng)價(jià)空氣質(zhì)量的依據(jù).6個(gè)指標(biāo)值分別用X1,X2,X3,X4,X5,X6表示.
聚類分析是分析“在沒有先驗(yàn)經(jīng)驗(yàn)的情況下,如何對(duì)樣品(或變量)進(jìn)行量化分類”的問題[8].聚類分析的方法有多種,當(dāng)樣本容量較大、考慮元素較多時(shí),我們常采取快速聚類法即K-均值聚類法,這是一種比較優(yōu)良且快速的聚類方法,而且可以對(duì)聚類類別K值進(jìn)行多次測(cè)試,直到得到理想的類別數(shù)量[9-12].該方法的基本思想是將每一個(gè)樣品分配給距離最近均值的類中,基本的算法步驟為:
Step1隨機(jī)將樣品分為K類,計(jì)算各類的質(zhì)心,即初始類中心;
Step2通過計(jì)算某個(gè)樣品到各初始類中心的距離,將樣本分在距離最小的類中,有變動(dòng)則重新計(jì)算各類質(zhì)心;
Step3重復(fù)步驟step2,直到所有樣品都分配到距離最小的類中.
判別分析是在已知所選樣本分成k類情況下,根據(jù)新樣本的觀測(cè)數(shù)據(jù)判定新樣本歸屬類別的多元統(tǒng)計(jì)分析方法.貝葉斯判別法具有可考慮各總體出現(xiàn)的先驗(yàn)概率,還可考慮到錯(cuò)判造成的損失且過程簡(jiǎn)單速度快等優(yōu)點(diǎn).
貝葉斯判別分析的主要思想[8]是:設(shè)有總體Gi(i=1,2,…,k),Gi具有概率密度函數(shù)fi(x).并且根據(jù)以往的統(tǒng)計(jì)分析,知道Gi出現(xiàn)的概率為qi,是R(P)的一個(gè)分劃,判別法則為:當(dāng)樣品X落入Di時(shí),判X∈Di,i=1,2,…,k.所以貝葉斯判別分析的關(guān)鍵問題是尋找D1,D2,…,Dk分劃,使得平均錯(cuò)判率最小.
城市空氣質(zhì)量等級(jí)分類的具體步驟包括樣本城市的選擇、評(píng)價(jià)指標(biāo)及數(shù)據(jù)的收集、K-均值聚類城市空氣質(zhì)量等級(jí)分類、貝葉斯判別確定判別函數(shù)以及結(jié)果分析與建議、流程如圖1所示.
圖1 空氣質(zhì)量等級(jí)分類流程
因變量量綱不同,首先對(duì)樣本城市的指標(biāo)數(shù)據(jù)利用SPSS軟件進(jìn)行標(biāo)準(zhǔn)化處理,然后從2到8依次設(shè)置K值,利用SPSS軟件進(jìn)行聚類分析,可得到不同K值下的聚類成員和質(zhì)心.經(jīng)過多次統(tǒng)計(jì)嘗試發(fā)現(xiàn)分為三類時(shí)類別最為合理且符合實(shí)際.表1為K=3時(shí)的聚類結(jié)果,可將城市按空氣質(zhì)量情況分為三類。
表1 聚類結(jié)果
第一類:大連、長(zhǎng)春、吉林、哈爾濱、福州、廈門、南昌、九江、張家界、深圳、汕頭、南寧、柳州、桂林、???、貴陽(yáng)、遵義、昆明、玉溪、拉薩、金昌.
第二類:北京、天津、上海、南京、無(wú)錫、鎮(zhèn)江、杭州、湖州、紹興、合肥、蕪湖、馬鞍山、青島、日照、武漢、宜昌、荊州、長(zhǎng)沙、廣州、重慶、成都、自貢、南充.
第三類:石家莊、邯鄲、保定、太原、大同、呼和浩特、沈陽(yáng)、鞍山、錦州、濟(jì)南、鄭州、開封、洛陽(yáng)、三門峽、西安、銅川、延安、蘭州、西安、銅川、延安、蘭州、西寧、銀川、烏魯木齊.
根據(jù)生態(tài)環(huán)境部向媒體通報(bào)的2018年169個(gè)環(huán)保重點(diǎn)城市空氣質(zhì)量狀況排名前20位和后20位城市名單(見表2),發(fā)現(xiàn)65個(gè)樣本城市中共有8個(gè)城市(海口、拉薩、深圳、廈門、福州、貴陽(yáng)、大連、昆明)排名在前20位,8個(gè)城市在聚類時(shí)全部劃分在第一類,65個(gè)樣本城市中共有6個(gè)城市(石家莊、邯鄲、太原、保定、西安、鄭州)排名在后20位,6個(gè)城市在聚類時(shí)全部劃分在第三類.結(jié)果表明:
表2 169個(gè)重點(diǎn)城市排名前20位和后20位城市名單
1)聚類結(jié)果可信度高,分類合理.
2)第一類城市空氣質(zhì)量最好,第三類城市空氣質(zhì)量最差,第二類城市空氣質(zhì)量居中.
3)就分布地區(qū)而言,第一類城市主要集中在珠江三角洲地區(qū)、高原地區(qū)、東部沿海地區(qū)和東北地區(qū).沿海城市及高原地區(qū)有著天然的地域優(yōu)勢(shì),沿海城市四面或三面環(huán)海,空氣流動(dòng)性好,而高原地區(qū)地廣人稀,且自然環(huán)境保護(hù)面積大.東北三省均為我國(guó)工業(yè)大省,空氣質(zhì)量也能兼優(yōu),正是因?yàn)槲廴局卫砉ぷ髯龅煤?,在東北污染違法成本很高.由此可說明,打贏藍(lán)天保衛(wèi)戰(zhàn)要有壯士斷腕的勇氣和決心.第二類城市主要集中在長(zhǎng)江三角洲地區(qū),多為經(jīng)濟(jì)較發(fā)達(dá)的城市.經(jīng)濟(jì)發(fā)達(dá)城市人口密集,隨之帶來的還有二氧化碳排放量大、車流量大等問題,嚴(yán)重影響空氣質(zhì)量情況.第三類地區(qū)主要集中在京津冀周邊地區(qū)及汾渭平原地區(qū),這些城市的共同點(diǎn)是煤炭業(yè)、重工業(yè)較為發(fā)達(dá),擁有偏重的產(chǎn)業(yè)結(jié)構(gòu)和以煤為主的能源結(jié)構(gòu),且集中在北方,秋冬季需要采暖的不利氣象因素等都是導(dǎo)致這些地區(qū)污染嚴(yán)重的原因.
確定樣本城市空氣質(zhì)量分類后,將原始數(shù)據(jù)和表1中城市類別輸入SPSS,利用SPSS軟件進(jìn)行貝葉斯判別分析可得到各個(gè)貝葉斯判別分類函數(shù)系數(shù)表(見表3)和65個(gè)樣本城市的實(shí)際類別和判別類別對(duì)比結(jié)果(見表4).
表3 判別函數(shù)分類函數(shù)系數(shù)
由表4可知各類空氣質(zhì)量分級(jí)判別函數(shù)分別為
表4 樣本城市及分類結(jié)果對(duì)比表
F1=-49.359+0.605X1+0.292X2-0.185X3+15.167X4+0.555X5-0.061X6,F(xiàn)2=-75.462+0.630X1+0.520X2-0.305X3+18.067X4+0.658X5+0.105X6,F(xiàn)3=-99.939+1.139X1+0.553X2-0.098X3+23.070X4+0.613X5+0.015X6.
續(xù)表4
對(duì)比貝葉斯判別分析法和K-均值聚類分析結(jié)果來看,65個(gè)樣本城市中僅對(duì)2個(gè)樣本城市青島和南充錯(cuò)判,回判正確率為96.9%,可見貝葉斯判別分析法對(duì)城市空氣質(zhì)量的判別有較高的可信度,可以作為城市空氣質(zhì)量判別分類的依據(jù).從圖2典則判別函數(shù)分類圖來看,65個(gè)樣本城市按照其空氣質(zhì)量分級(jí)都聚集在了對(duì)應(yīng)組質(zhì)心的周圍,且可以按不同等級(jí)區(qū)分開來,達(dá)到了分類的目的.
圖2 典則判別函數(shù)分類圖
若想知道某待判城市的城市空氣質(zhì)量屬哪個(gè)類別,只需將待判城市的六個(gè)指標(biāo)值依次代入三個(gè)判別函數(shù),求得函數(shù)值F1,F(xiàn)2,F(xiàn)3,若則該待判城市判入第k類.
本文選取山西省臨汾市、山東省淄博市、廣東省珠海市、江蘇省連云港市、浙江省溫州市共計(jì)五個(gè)城市作為待判城市,通過查閱《中國(guó)統(tǒng)計(jì)年鑒2019》得到五個(gè)待判城市空氣質(zhì)量的指標(biāo)值,分別將五個(gè)城市的指標(biāo)值代入判別函數(shù),即可判定五個(gè)待判城市的所屬類別,見表5.
表5 待判城市判別函數(shù)值及類別
由表5知廣東省珠海市和浙江省溫州市的空氣質(zhì)量判定為第一類,江蘇省連云港市的空氣質(zhì)量判定為第二類,山西省臨汾市和山東省淄博市的空氣質(zhì)量判定為第三類.同理,對(duì)于其它待判城市,我們也可依此方法實(shí)現(xiàn)科學(xué)分類.
K-均值聚類分析法可根據(jù)指標(biāo)數(shù)據(jù)快捷有效地將樣本城市空氣質(zhì)量分類,且分類結(jié)果符合實(shí)際,可靠性高.但聚類分析法只能達(dá)到分類的目的,若任給一個(gè)非樣本城市指標(biāo)數(shù)據(jù),聚類分析法不能對(duì)樣本外城市等級(jí)進(jìn)行劃類.貝葉斯判別分析法在已知樣本數(shù)據(jù)及其分類的條件下,可建立判別函數(shù),根據(jù)數(shù)據(jù)及判別函數(shù),對(duì)非樣本的分類進(jìn)行判別,且貝葉斯判別法是考慮錯(cuò)誤損失的判別分析法,可將平均錯(cuò)判損失降到最低.K-均值聚類法和貝葉斯判別法結(jié)合對(duì)我國(guó)城市空氣質(zhì)量實(shí)施等級(jí)分類與預(yù)測(cè)是快速、科學(xué)、可靠的.將城市空氣質(zhì)量實(shí)施等級(jí)分類后,可按照類別去分析造成城市空氣污染的原因,對(duì)于共同因素,各地地方政府可協(xié)同治理,而對(duì)于不同因素,政府還應(yīng)因地制宜,這樣既可節(jié)約資源、提高效率又可達(dá)到精準(zhǔn)施策的目的.
由于各類別造成空氣污染的主要原因不同,因此針對(duì)分類結(jié)果提出以下建議:
第三類城市為空氣重度污染城市,此類城市應(yīng)重點(diǎn)針對(duì)重工業(yè)企業(yè)進(jìn)行治理:1)有序調(diào)整重工業(yè)企業(yè)布局;2)建立更為嚴(yán)格的監(jiān)督和管理機(jī)制;3)有序調(diào)整和優(yōu)化產(chǎn)業(yè)結(jié)構(gòu),大力實(shí)施產(chǎn)業(yè)結(jié)構(gòu)調(diào)整戰(zhàn)略,大力發(fā)展綠色農(nóng)業(yè)、新型能源產(chǎn)業(yè)和具有地方特色的旅游業(yè)等新興產(chǎn)業(yè).
第二類城市為空氣中度污染城市,多為經(jīng)濟(jì)較發(fā)達(dá)的城市.因此提出如下措施:1)技術(shù)助力高污染企業(yè)環(huán)保改造;2)調(diào)整機(jī)動(dòng)車能源利用結(jié)構(gòu),激勵(lì)機(jī)動(dòng)車生產(chǎn)企業(yè)提升研發(fā)技術(shù)水平;3)利用多種宣傳手段增強(qiáng)公民環(huán)保意識(shí);4)大力推進(jìn)清潔生產(chǎn)和循環(huán)經(jīng)濟(jì).
第一類城市空氣質(zhì)量較好,針對(duì)這類城市的空氣治理工作應(yīng)以保持和優(yōu)化為主,采取加大污染空氣的違法成本、宣傳引導(dǎo)環(huán)保的生活方式等措施,以保持現(xiàn)有的空氣質(zhì)量;同時(shí)開發(fā)綠色能源、發(fā)展科技硬實(shí)力,將良好的空氣質(zhì)量作為城市名片帶動(dòng)更多城市打贏藍(lán)天保衛(wèi)戰(zhàn).