王晨君,張 莎,王 臣
(上海市虹口區(qū)環(huán)境監(jiān)測站,上海 200083)
模糊聚類是指基于模糊相似矩陣或模糊等價矩陣將所選擇的待分類對象進行分類的過程[1]。當聚類涉及事物之間的模糊界限時,需運用模糊聚類分析方法[2]。通常把被聚類的事物稱為樣本,將被聚類的一組事物稱為樣本集。模糊聚類分析被廣泛地應用于水環(huán)境要素(水質(zhì)或底質(zhì)環(huán)境要素)研究區(qū)域污染程度的分類。由于影響水環(huán)境治理的因素紛繁復雜[3],而且研究對象的影響因素具有不確定性,采用精確關聯(lián)的方法如單污染指數(shù)法[4]、綜合污染指數(shù)法、分級加權評分法、概率統(tǒng)計法[5~9]等,對水環(huán)境質(zhì)量的評價的大都存在一定的片面性,而模糊聚類方法對類似“水污染程度”這類界限不清或者隸屬關系不明的問題具有很大的優(yōu)勢[10]。
監(jiān)測斷面的模糊聚類分析有助于確定不同斷面之間的相互關系,其不僅注意到水質(zhì)分界線的模糊性,也使得信息利用率和精度均有較大幅度的提高[11]。本文采用SPSS模糊聚類法對2019年上海市虹口區(qū)不同水質(zhì)監(jiān)測斷面的監(jiān)測結果進行聚類分析。利用聚類分析方法,根據(jù)斷面水質(zhì)檢測結果,將監(jiān)測斷面進行聚類分類,探究聚類結果與各監(jiān)測斷面分布特征的差異。
虹口區(qū)位于上海市中心城區(qū)東北部,區(qū)內(nèi)河道資源豐富,虹口區(qū)11個水質(zhì)監(jiān)測斷面分布圖,如圖1所示。
圖1 研究區(qū)11個水質(zhì)監(jiān)測斷面分布
數(shù)據(jù)來源于2019年上海市虹口區(qū)環(huán)境生態(tài)局發(fā)布的生態(tài)環(huán)境質(zhì)量報告書[12]。其中,參照《地表水環(huán)境質(zhì)量標準》(GB3838-2002)中的水質(zhì)標準進行考核的多項重點監(jiān)測指標。綜合考慮本市地表水水質(zhì)狀況、計算參數(shù)的完整性、多年數(shù)據(jù)綜合評價的可比性、評價方法的銜接性等原因,選擇溶解氧、高錳酸鹽指數(shù)、化學需氧量、氨氮、總磷五項作為聚類分析參數(shù)。
本研究選用11個斷面監(jiān)測點采集的上述5種參數(shù)的年度平均數(shù)據(jù)。各監(jiān)測點樣品的采集和分析測試均由上海市虹口區(qū)環(huán)境監(jiān)測站完成。
采用SPSS軟件中的模擬聚類分析功能。
查閱生態(tài)環(huán)境質(zhì)量報告書中2019年虹口區(qū)地表水5種參數(shù)的監(jiān)測結果(年均值),如表1所示。
表1 2019虹口區(qū)地表水監(jiān)測結果(年均值)
為了使不同監(jiān)測項指標之間具有可比性,對原數(shù)據(jù)進行標準化預處理[13],轉(zhuǎn)化為無量綱的指數(shù),即使用實測值除以評價標準值。其中,評價標準值采用《地表水環(huán)境質(zhì)量標準》(GB3838-2002)中的三級水質(zhì)標準,此處不做過多贅述。
數(shù)據(jù)經(jīng)標準化后,得到初始化數(shù)據(jù)矩陣,如表2所示。
表2 標準化矩陣
將表2中各監(jiān)測點數(shù)據(jù)進行模糊聚類分析,采用SPSS軟件計算,用歐式距離方法進行樣本區(qū)間的度量標準,并采用組間連接法的聚類方法,進行上述參數(shù)進行聚類分析,計算結果如表3、表4和圖2所示。
表3 案例描述
由表3可知:聚類法分析的有效案例數(shù)為11個,無遺漏值[14]。
由表4可知:經(jīng)過逐步的聚類[15],可將11個監(jiān)測斷面分為4類:Ⅰ類(1,2,3,8,4,7)、Ⅱ類(6,10,9,11)和Ⅲ類(5)。其中,Ⅰ類聚類系數(shù)均小于0.1,表明其具有較強的聚類性。圖2冰柱圖也說明:聚成上述三類斷面比較合適。
圖2 冰柱圖
表4 聚類過程
由圖3聚類分析樹狀圖可知,其聚類結果與聚類過程、冰柱圖結果均保持一致,即Ⅰ類(1,2,3,8,4,7)、Ⅱ類(6,10,9,11)和Ⅲ類(5)。
圖3 聚類分析樹狀圖
根據(jù)聚類分析可知,可將監(jiān)測斷面大致分為三類,即Ⅰ類(1,2,3,8,4,7)、Ⅱ類(6,10,9,11)和Ⅲ類(5)。結合圖1,將上述斷面進行劃分,詳見圖4。由圖4可知,通過聚類分析,可將監(jiān)測斷面劃分為三大類,界限較為清晰,聚類分析結果與實際水系分布情況具有較高的一致性。
圖4 監(jiān)測斷面劃分
(1)通過對虹口區(qū)2019年11個監(jiān)測斷面5項水質(zhì)參數(shù)的模糊聚類分析,可以將區(qū)域斷面明顯分為三類,即Ⅰ類斷面(哈爾濱路1號橋,嘉興路橋,外虹橋,車站北路橋,四明公所橋,大連西路橋)、Ⅱ類斷面(忠烈橋,水電路市河橋,涼城路橋,場中路2號橋)和Ⅲ類斷面(沽西浜小橋)。
(2)聚類分析的結果與實際水系分布情況具有較高的一致性,可將監(jiān)測斷面的界限劃分得較為清晰,此方法在水質(zhì)分類中具有一定的優(yōu)越性。
水環(huán)境質(zhì)量關系著國計民生,利用模糊聚類分析方法對虹口區(qū)水環(huán)境質(zhì)量進行劃分,具有客觀性與科學性,能夠真實地反映虹口區(qū)水環(huán)境質(zhì)量狀況。此外,對水環(huán)境質(zhì)量進行劃分有利于加強社會民眾對環(huán)境質(zhì)量的正確認識,提高保護環(huán)境的自覺性。同時,也為科學治理、制定行之有效的整治環(huán)境的規(guī)劃與策略提供了科學依據(jù)。