李 浩,劉 云
(宜賓市農(nóng)業(yè)機(jī)械研究所, 四川 宜賓 644000)
我國(guó)是一個(gè)水資源缺乏的國(guó)家,良好的水生態(tài)是水資源保護(hù)工作的首要任務(wù)[1];社會(huì)的發(fā)展和人口的增長(zhǎng),以及人類(lèi)對(duì)水資源的過(guò)度開(kāi)發(fā)和利用,造成了一系列的問(wèn)題[2-4]。水生態(tài)系統(tǒng)對(duì)水資源管理具有重意義,國(guó)內(nèi)外學(xué)者就水生態(tài)系統(tǒng)研究做了大量的工作,也取得了較好的成果。Ioriya基于化學(xué)和生物方面,對(duì)札幌湖的水質(zhì)進(jìn)行研究,并預(yù)測(cè)了區(qū)域水質(zhì)變化趨勢(shì)[5],Chernyaev利用儀器檢測(cè)了水生態(tài)中人為放射性核素[6],Sharifahmadian將貝葉斯網(wǎng)絡(luò)應(yīng)用于水環(huán)境體系的風(fēng)險(xiǎn)預(yù)測(cè)中,取得較好精度,為水資源的利用提供了決策依據(jù)[7]。王曉峰基于WSUD生態(tài)學(xué)思想,提出以區(qū)域城市水體為中心,向外依次構(gòu)建多帶多功能的污染防控體系,以改善水環(huán)境[8]。焦雯珺構(gòu)建污染足跡模型,對(duì)影響水環(huán)境的人文驅(qū)動(dòng)力進(jìn)行評(píng)估[9]。學(xué)者們對(duì)水生態(tài)方面做了許多的工作,也為下一階段的研究打下了基礎(chǔ)。水生態(tài)系統(tǒng)是一個(gè)涉及多個(gè)學(xué)科,復(fù)雜多變的系統(tǒng)[10-12];水生態(tài)系統(tǒng)評(píng)價(jià)是人類(lèi)防治污染與合理利用水資源的基礎(chǔ);目前對(duì)水生態(tài)系統(tǒng)的評(píng)價(jià)多數(shù)是討論了影響水質(zhì)的具體因子,但在宏觀方面對(duì)影響水生態(tài)系統(tǒng)的驅(qū)動(dòng)因子的研究還顯得不足。
主成分分析法(Principal Component Analysis, PCA)是一種降維的思想,利用數(shù)學(xué)統(tǒng)計(jì)學(xué)的原理處理復(fù)雜的、多維的數(shù)據(jù)序列,去除數(shù)據(jù)相互重疊部分,得到少數(shù)幾個(gè)綜合指標(biāo)(即主成分)[13,14];每個(gè)主成分反映了原數(shù)據(jù)提供的大部分信息,且所包含信息互不重復(fù);同時(shí)得到的數(shù)據(jù)信息更加科學(xué)有效[15,16]。
通過(guò)主成分分析法對(duì)數(shù)據(jù)矩陣的個(gè)指標(biāo)向量做線性組合得綜合指標(biāo)向量為:
(1)
簡(jiǎn)寫(xiě)為:
(2)
(3)
模型的系數(shù)wij應(yīng)滿(mǎn)足下列條件:
(1)Fi和Fj(i≠j,i,j=1,2,…,p)互不相關(guān)。
從幾何的觀點(diǎn)可以看出,主成分分析是對(duì)原坐標(biāo)軸進(jìn)行旋轉(zhuǎn),得到相互正交的坐標(biāo)軸,從而分析出數(shù)據(jù)的特征值。用數(shù)學(xué)語(yǔ)言來(lái)描述:設(shè)數(shù)據(jù)X中含有n個(gè)柵格,p個(gè)單指標(biāo)變量,即:
(4)
在數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理前,必須進(jìn)行指標(biāo)的正向化:
(5)
(6)
正向化處理不改變數(shù)據(jù)的分布規(guī)律,保留了數(shù)據(jù)變異程度的差異。通常,一些數(shù)據(jù)具有不同的量綱,且數(shù)量級(jí)差異較大,在使用主成分分析時(shí)不同的量綱和數(shù)量級(jí)將會(huì)引發(fā)起新的問(wèn)題,故對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將數(shù)據(jù)無(wú)量綱化。無(wú)量綱化的矩陣為:
(7)
將式(4)的數(shù)據(jù)按式(5)或式(6)進(jìn)行數(shù)據(jù)正向化,按式(7)進(jìn)行標(biāo)準(zhǔn)化,的到標(biāo)準(zhǔn)化矩陣:
(8)
主成分的貢獻(xiàn)率和累計(jì)貢獻(xiàn)率是分析F從原始數(shù)據(jù)X中提取出的信息比重,也是衡量具體數(shù)據(jù)與主成分關(guān)系的橋梁。
(1)貢獻(xiàn)率:第k個(gè)主成分對(duì)應(yīng)的特征值在矩陣中全部特征值的比例,所占比例越大,說(shuō)明原始數(shù)據(jù)的影響越大。
(9)
式中:λk為第k個(gè)主成分對(duì)應(yīng)的特征值。
(2)累計(jì)貢獻(xiàn)率:前m個(gè)主成分的特征值之和在全部特征值中的比例,所占比例越大,說(shuō)明前m個(gè)主成分越全面地代表原始數(shù)據(jù)的信息。
(10)
在實(shí)際問(wèn)題中,一般選取前幾個(gè)主成分,當(dāng)累計(jì)方差貢獻(xiàn)率達(dá)到80%以上,即可用它們代替原有p個(gè)變量,實(shí)現(xiàn)降維的目的。
黃河三角洲位于渤海南岸和萊州灣西岸,位于東經(jīng)117°31′~119°18′ 和北緯36°55′~38°16′。地面平坦,在海拔10 m以下。三角洲屬,溫帶季風(fēng)性氣候。四季分明,光照充足,區(qū)內(nèi)自然資源豐富。東營(yíng)市是黃河三角洲代表性地帶,全市實(shí)現(xiàn)地區(qū)生產(chǎn)總值(GDP)3 430.49 億元,第一產(chǎn)業(yè)增加值123.99 億元;第二產(chǎn)業(yè)增加值2 345.08 億元;第三產(chǎn)業(yè)增加值961.42 億元。
本次研究共選取了8 個(gè)指標(biāo)作為水生態(tài)系統(tǒng)的影響因子(或驅(qū)動(dòng)因子),分別為人口密度X1、人均用水量X2、萬(wàn)元GDP用水量X3、重工業(yè)產(chǎn)值比重X4、廢水排放量X5、單公頃化肥施用量X6、植被覆蓋率X7、生態(tài)補(bǔ)水量X8;涵蓋了人類(lèi)活動(dòng)、社會(huì)經(jīng)濟(jì)、自然條件等因素,指標(biāo)較為全面,可作為區(qū)域水生態(tài)系統(tǒng)研究的對(duì)象。
本次研究數(shù)據(jù)來(lái)源于2004-2015 年《山東省統(tǒng)計(jì)年鑒》、《東營(yíng)市統(tǒng)計(jì)年鑒》、《東營(yíng)市水資源公報(bào)》。具體數(shù)據(jù)見(jiàn)表1,其中有少數(shù)數(shù)據(jù)缺失,采用插值法補(bǔ)全數(shù)據(jù)序列。
為了提取數(shù)據(jù)的主成分,并判斷指標(biāo)與其的關(guān)系利用SPSS軟件進(jìn)行分析。
表1 研究指標(biāo)數(shù)據(jù)Tab.1 Research indicator data
表2 特征值與貢獻(xiàn)率Tab.2 Eigenvalues and contribution rates
圖1 主成分碎石圖Fig.1 Principal component lithotripsy map
由表2可以看出第一個(gè)主成分的特征根為4.64 ,包含的信息為58.02% ;第二主成分的特征根為1.32 ,包含的信息為16.44%;第三主成分的特征根為1.24 ,包含的信息為15.47%;第一、第二、第三主成分所包含的信息為89.93% ,超過(guò)80% ,涵蓋了原始數(shù)據(jù)的大部分信息。由圖1 看出,在第三個(gè)主成分特征值是出現(xiàn)了明顯的拐點(diǎn),碎石圖由陡峭變?yōu)槠骄彛C合上述,確定主成分的個(gè)數(shù)為3個(gè)。
根據(jù)表3 主成分矩陣可以看出,第一主成分與指標(biāo)X1、X2、X3、X4、X5相關(guān)程度較高,受影響程度較大;其中X1、X4、X5是與第一主成分正相關(guān),X2、X3與第一主成分負(fù)相關(guān)。第二主成分與指標(biāo)X7相關(guān)程度較高;并與X7正相關(guān)。第三主成分與X6相關(guān)程度較高,受影響程度較大;并與X6負(fù)相關(guān),由此可知,人口密度、人均用水量、萬(wàn)元GDP用水量、重工業(yè)產(chǎn)值比重、廢水排放量與第一主成分相關(guān)性較強(qiáng),所占比重較大,是影響水生態(tài)系統(tǒng)的最主要的因子;單公頃化肥施用量、植被覆蓋率分別與第二、第三主成分相關(guān)度較高,是影響水生態(tài)系統(tǒng)的次要因子。
根據(jù)提取的主成分,結(jié)合SPSS軟件進(jìn)行重新定義,并定義相同的新變量,根據(jù)特征向量矩陣可得到主成分表達(dá)公式:
F1=0.44X1-0.40X2-0.46X3+0.45X4+
0.37X5+0.02X6+0.01X7+0.17X8
(11)
F2=0.21X1-0.07X2-0.05X3+0.05X4+
0.34X5-0.78X6-0.05X7+0.63X8
(12)
F3=0.11X1+0.37X2+0.10X3+0.15X4+
0.33X5+0.10X6+0.87X7+0.05X8
(13)
由于選定指標(biāo)的數(shù)據(jù)具有不同的屬性,各個(gè)數(shù)據(jù)的量綱有所不同且量綱的數(shù)量級(jí)也有差距,為了避免數(shù)據(jù)非因素影響,將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理(見(jiàn)表4)。
表3 主成分矩陣Tab.3 Principal component matrix
表4 數(shù)據(jù)標(biāo)準(zhǔn)化矩陣Tab.4 Data standardization matrix
將表4 中數(shù)據(jù)分別帶入主成分表達(dá)式中,得到各個(gè)主成分在每年的具體得分,根據(jù)得分與貢獻(xiàn)率的關(guān)系可得綜合得分,即可判斷各年水生態(tài)系統(tǒng)的優(yōu)劣程度;根據(jù)所選去的指標(biāo)體系可知,綜合得分越高,表明水生態(tài)系統(tǒng)越惡劣(見(jiàn)表5)。
表5 各年得分情況Tab.5 Scores for each year
圖2 綜合得分圖Fig.2 Comprehensive score
根據(jù)表5 和圖2 可以看出,各年綜合得分呈逐漸增加的趨勢(shì),綜合得分越高,說(shuō)明水生態(tài)系統(tǒng)的質(zhì)量越惡劣,從2011 年后增加的幅度呈現(xiàn)減緩的趨勢(shì);2004-2015年,東營(yíng)市的水環(huán)境情況呈現(xiàn)逐漸變差的趨勢(shì),僅在2011 年后才有緩解的趨勢(shì),但緩解程度仍然不明顯。黃河三角洲的合理利用水資源和水生態(tài)系統(tǒng)保護(hù)仍是政府部門(mén)和水利工作者工作的重心。
(1)主成分分析法可以剔除多個(gè)數(shù)據(jù)間包含的重復(fù)信息,實(shí)現(xiàn)對(duì)數(shù)據(jù)降維的目的,從繁瑣的數(shù)據(jù)中,提取出幾個(gè)主成分來(lái)反應(yīng)數(shù)據(jù)的大部分信息;將主成分分析法應(yīng)用于水生態(tài)系統(tǒng)保護(hù)的研究中,取得較好的研究成果。
(2)基于主成分分析法,結(jié)合黃河三角洲東營(yíng)市2004-2015 年的統(tǒng)計(jì)數(shù)據(jù),利用SPSS軟件分析,可知人口密度、人均用水量、萬(wàn)元GDP用水量、重工業(yè)產(chǎn)值比重、廢水排放量是影響水生態(tài)系統(tǒng)的主要因子;單公頃化肥施用量、植被覆蓋率是影響水生態(tài)系統(tǒng)的次要因子。
(3)根據(jù)主成分對(duì)東營(yíng)市水生態(tài)系統(tǒng)進(jìn)行研究,東營(yíng)市水生態(tài)系統(tǒng)情況呈現(xiàn)逐漸惡化的趨勢(shì);合理利用水資源、制定水生態(tài)系統(tǒng)保護(hù)調(diào)控措施和適當(dāng)?shù)卣{(diào)整當(dāng)?shù)禺a(chǎn)業(yè)結(jié)構(gòu)是相關(guān)部門(mén)工作的當(dāng)務(wù)之急,是可持續(xù)發(fā)展社會(huì)的重要基礎(chǔ)。
□