趙連玲 ,劉華雪,饒義勇,廖秀麗,戴 明,黃洪輝
1. 中國水產(chǎn)科學研究院南海水產(chǎn)研究所/廣東省漁業(yè)生態(tài)環(huán)境重點實驗室,廣東 廣州 510300
2. 西安電子科技大學 數(shù)學與統(tǒng)計學院,陜西 西安 710071
海洋環(huán)境污染會危害海洋生態(tài)系統(tǒng),影響海洋食物產(chǎn)出,并對人類健康造成影響。海洋環(huán)境質(zhì)量評價是開展海洋環(huán)境管理的依據(jù),而海洋環(huán)境評價的精度取決于海洋環(huán)境的監(jiān)測和評價水平。世界各國學者開展了海洋環(huán)境質(zhì)量綜合評價研究,其中海水水質(zhì)評價方法、海洋沉積物評價方法和海洋環(huán)境綜合評價方法是當前研究的重點。在有限的投入下精準評價海洋環(huán)境質(zhì)量,一直是我國學者努力追求的目標。
自1998 年開始實施的海水水質(zhì)標準 (GB 2097—1997),根據(jù)海域的不同使用功能和保護目標,將我國海水水質(zhì)分為4 類,并將各類水質(zhì)的監(jiān)測項目水質(zhì)標準進行了定量劃分,同時界定了各監(jiān)測項目的海水水質(zhì)分析方法[1]。Paul 等[2]對沿海水質(zhì)的時空分布分析方法進行了總結(jié),包括聚類分析、判別分析、因素分析和主成分分析、變差函數(shù)等方法。聚類分析被用于研究海水水質(zhì)監(jiān)測數(shù)據(jù)的相似性。因素分析和主成分分析主要用于沿岸和海水水質(zhì)數(shù)據(jù)集的研究,通過減少冗余因子,獲取主要的海水環(huán)境影響要素。
為了進一步改進評價方法,國內(nèi)學者就指標體系構建和模型實驗進行了大量嘗試,如林小蘋等[3]利用主成分分析,根據(jù)每個站點的主成分得分進行站點聚類,成功將8 個站點分為4 類。馬麗[4]運用可變模糊評價模型,得到了5 個海灣的評價級別特征值和健康水平,并利用模糊綜合評估模型進行了方法一致性比較。林琳等[5]從水體污染、初級生產(chǎn)力、生物資源等方面對大亞灣海域生態(tài)環(huán)境的質(zhì)量狀況進行了綜合評價,并模擬和分析了環(huán)境質(zhì)量的空間分布趨勢。杜飛雁等[6]、方良等[7]、廖秀麗等[8]研究了大亞灣浮游動物的生物量、優(yōu)勢種等生態(tài)特征。黨耀國等[9]通過構建面板數(shù)據(jù)的灰色關聯(lián)度模型,發(fā)現(xiàn)基于面板數(shù)據(jù)灰色關聯(lián)度模型的聚類方法能夠在數(shù)據(jù)上表現(xiàn)出良好的效果。張燕軍等[10]提出了一種基于灰色關聯(lián)度的人機系統(tǒng)功能聚類方法,詳細闡述了人機系統(tǒng)的分層聚類方法,并通過案例驗證了該方法的可行性和有效性。岑詠霆[11]根據(jù)旅行社顧客滿意度,確定旅行社樣本及評價指標體系,計算灰色關聯(lián)度,最后以離差平方和最小為聚類標準,進行聚類分析。郭三黨等[12]定義了不同類別之間的關聯(lián)度,構造了一種基于最大灰色關聯(lián)度的聚類方法,結(jié)果表明新的聚類方法改進了已有的灰色關聯(lián)聚類中聚類原則存在的缺陷。
大亞灣是我國亞熱帶海域重要的海洋生物種質(zhì)資源庫[13],受周邊地區(qū)工業(yè)和人為影響,大亞灣海域生態(tài)環(huán)境遭到破壞,生態(tài)系統(tǒng)也在快速退化[14-15]。越來越多研究者開始關注陸源性污染物的輸入以及近海人工養(yǎng)殖造成的海灣環(huán)境污染問題[16-18]。海水養(yǎng)殖是大亞灣的重要產(chǎn)業(yè)之一,促進了該海域水體中營養(yǎng)鹽和有機物的富集,局部海域已出現(xiàn)富營養(yǎng)化趨勢[14]。由于大亞灣附近沒有江河湖泊等較大的陸源徑流輸入,灣內(nèi)海水交換條件一般,主要通過灣口與外海水進行交換[19-24],水體交換能力總體為南部優(yōu)于北部、東部優(yōu)于西部,全灣水體更新時間為26 d[25]。大亞灣核電基地是我國目前在運行核電裝機容量最大的核電基地,擁有6 臺百萬千瓦級壓水堆核電機組[26],大亞灣核電站和嶺澳核電站的溫排水也成為了影響研究海域生態(tài)環(huán)境的重要因素之一[27]。
本文通過改進灰色關聯(lián)度聚類,結(jié)合層次聚類,構建涵蓋水環(huán)境和海洋生態(tài)的指標體系,在大亞灣西部海域 (核電附近海域) 開展海水質(zhì)量評價探索研究,將統(tǒng)計學方法引入海域質(zhì)量評價,旨在建立科學有效的指標評價體系,準確分析目前大亞灣西部的海水質(zhì)量狀況,進而為行業(yè)主管部門提供對策和建議。
本文所有數(shù)據(jù)均來自2020 年對大亞灣西南海域的科考調(diào)查結(jié)果,調(diào)查范圍為114°30'E—114°55'E、22°25'N—22°50'N,包含2020 年四季24 個站點的數(shù)據(jù) (圖1),主要包括海水水質(zhì)環(huán)境、海洋生態(tài)(浮游植物、浮游動物) 調(diào)查。
圖1 大亞灣監(jiān)測站點Fig. 1 Monitoring stations in Daya Bay
海水水質(zhì)環(huán)境測量用容積為5 L 的有機玻璃采水器采集表層水樣 (水面下50 cm),各調(diào)查項目按規(guī)范要求現(xiàn)場分裝保存,部分指標于實驗室進行分析測試。水深用船載漁探儀或FISH4200 型便攜式漁探儀現(xiàn)場測量,透明度用薩氏盤法現(xiàn)場測定,海水水溫、鹽度、pH 和溶解氧 (DO) 用YSI Pro Plus型多功能水質(zhì)儀現(xiàn)場測定,化學需氧量 (CODMn)、石油類、活性磷酸鹽、無機氮、懸浮物和葉綠素a參考海洋監(jiān)測規(guī)范第4 部分:海水分析 (GB 17378.4—2007) 進行測定。浮游植物用淺水III 型浮游生物網(wǎng)距海底約2 m 至表層垂直拖網(wǎng)進行采集,網(wǎng)口系流量計,每站垂直拖曳1 網(wǎng),所采樣品用5% (φ)的甲醛溶液固定,帶回實驗室經(jīng)濃縮后,用數(shù)字流式細胞攝像系統(tǒng) (FlowCam 8400) 進行鏡檢分類鑒定與計數(shù),分析浮游植物數(shù)量分布和多樣性。浮游動物用淺水I 型浮游生物網(wǎng)距海底約2 m 至表層垂直拖網(wǎng)進行采集,網(wǎng)口系流量計,每站垂直拖曳1 網(wǎng),所采樣品用5% (φ)的甲醛溶液固定,帶回實驗室挑去雜物后,以濕質(zhì)量法稱取浮游動物生物量,再用解剖鏡進行鏡檢分類鑒定和計數(shù),分析浮游動物數(shù)量分布和多樣性。浮游植物密度單位為105個·m?3,Shannon-Weaver多樣性指數(shù)計算公式為:
式中:Pi=ni/N;ni為單位空間內(nèi)第i種的個體數(shù)量 (個·m?3);N為某站總生物數(shù)量 (個·m?3);S為出現(xiàn)生物總種數(shù)。
首先,收集24 個站點的指標數(shù)據(jù)形成指標體系;其次,對指標體系進行主成分分析,驗證指標體系的合理性;再次,運用改進的灰色關聯(lián)度聚類,根據(jù)指標體系對24 個站點進行聚類,繪制聚類圖;最后,根據(jù)站點聚類結(jié)果,得出結(jié)論,分析原因。
1.3.1 主成分分析
主成分分析是采用數(shù)學上的降維思想,用少數(shù)幾個綜合指標來代替原來指標的一種多元統(tǒng)計方法。轉(zhuǎn)化生成的綜合指標被稱為主成分,其中每個主成分都由原始變量的線性組合生成,能夠盡可能多地反映原來指標的信息,且各個主成分之間互不相關。
假定有n個樣本,每個樣本共有p個指標 (變量) 描述,這樣就構成了一個n×p階的數(shù)據(jù)資料矩陣:
其中:
作X1,X2,···,Xp的線性組合即綜合指標,也就是主成分,記新變量指標為Z1,Z2,···,Zp。則:
在上述方程組中要求:a21i+a22i+···+a2pi=1,i=1,2,···,p,且系數(shù)aij由下列原則來決定:
1)Zi與Zj(i/=j,i,j=1,2,···,p) 不相關;
2)Z1是X1,X2,···,Xp的一切線性組合中方差最大者;Z2是與Z1不相關的X1,X2,···,Xp的所有線性組合中方差最大者;Zp是與Z1,Z2,···,Zp?1都不相關的X1,X2,···,Xp的所有線性組合中方差最大者。
這樣決定的新變量指標Z1,Z2,···,Zp分別稱為原變量指標X1,X2,···,Xp的第一、第二、… 、第p主成分。
1.3.2 灰色關聯(lián)度聚類
以灰色關聯(lián)分析結(jié)果R為基礎,構建基于灰色關聯(lián)度的聚類方法,從而達到對研究對象進行分類的目的。該方法的實質(zhì)就是生成如下二維空間到一維空間的映射f:R2→Rg,其中R為關聯(lián)度集,Rg為評價對象的相似關系集。
1) 確定聚類論域的原始評估矩陣。設待評估海域有m個站點,記為聚類論域S=(S1,S2,···,Sm);評價生態(tài)系統(tǒng)健康的指標集,記為C=(C1,C2,···,Cn),得到原始評估矩陣:
式中:序列Yi=(yi1,yi2,···,yin) 代表海域內(nèi)第i個站點的各項生態(tài)系統(tǒng)健康指標集。
2) 數(shù)據(jù)的標準化處理。由于站點各生態(tài)指標的量綱和界限值不同,保證指標間相同因素的可比性,消除不同指標間的不可公度性影響,需要對原始評估矩陣中的數(shù)據(jù)進行無量綱化處理,采用正態(tài)標準化,按下式作同一化處理:
式中:i為指標代號;j為生態(tài)系統(tǒng)健康指標代號;為第j個指標的均值;Sj為第j個指標的標準差;所有數(shù)據(jù)經(jīng)過同一化處理后,得到評估矩陣X:
式中:序列Xi=(xi1,xi2,···,xin) 代表海域內(nèi)第i個站點經(jīng)過數(shù)據(jù)標準化處理后的各項生態(tài)系統(tǒng)健康指標集。
3) 聚類基礎的構成。根據(jù)分析問題的實際情況,需要設定基準序列X0=(x01,x02,···,x0n),為減小誤差,對于極大型指標:x0j取該指標列的90%分位點處數(shù)據(jù),對于極小型指標,x0j取該指標列的10%分位點處數(shù)據(jù),對于區(qū)間型指標,x0j取該指標列的50%分位點處數(shù)據(jù)或均值。
對于比較序列X1,X2,···,Xm,令Rij=|x0j?xij|,則有:
式中:xij與x0j的相對差值ξ0ij定義為關聯(lián)系數(shù);ρ是分辨系數(shù),在 (0,1) 之間取值,可以人為給定,ρ越小分辨力越大,通常取ρ=0.5。關聯(lián)系數(shù)很多,信息較為分散,它的每一個值表示了比較序列Xi對基準序列X0的關聯(lián)程度強弱。為更加直觀地表現(xiàn)2 個數(shù)列的關聯(lián)度,對所有關聯(lián)系數(shù)取平均值:
式中:ri代表了序列Xi對基準序列X0的關聯(lián)度,稱為絕對關聯(lián)度,ri值越大,說明序列Xi與基準序列X0的相似性越高,即對應站點的生態(tài)系統(tǒng)越健康。因此可以得到聚類論域S的關聯(lián)度集R:R=(r1,r2,···,rm),關聯(lián)度集R是聚類分析的基礎。
4) 建立灰色相似關系矩陣。根據(jù)關聯(lián)度集R,構建聚類論域S中各元素之間的關聯(lián)度差異矩陣ES:
式中:eij(i,j=1,2,···,m) 為Xi相對于Xj的差異系數(shù):
由關聯(lián)度差異矩陣ES得差異距離矩陣DS:
式中:dij為差異距離,dij=eij+eji。
由于矩陣ES的主對角線為零,所以矩陣DS是主對角線為零的對稱矩陣。
根據(jù)差異距離矩陣DS計算可得灰色關聯(lián)度矩陣Rg:
且有:
式中:max(DS) 表示取矩陣DS中的最大值元素。對矩陣Rg,顯然滿足:自反性gii=1,對稱性gij=gji。因此Rg是灰色相似關系矩陣。經(jīng)過上述步驟,便完成了映射f:R2→Rg。
5) 聚類分析?;疑嗨脐P系矩陣Rg反映了分析論域S中各元素相互間的關系親疏程度,可以按照矩陣Rg利用最大樹方法對論域S進行聚類。首先以所有分類的對象為頂點,從大到小依次連接灰色相似關系矩陣Rg中的元素gij,在不產(chǎn)生回路的基礎上將所有頂點連通,生成最大樹并繪制譜系圖。
6) 改進的灰色關聯(lián)度聚類?;诨疑嗨脐P系矩陣Rg的灰色關聯(lián)度聚類形式單一,缺點明顯,類似于單鏈接的層次聚類,為了改進這一缺點,將灰色相似關系矩陣Rg轉(zhuǎn)化為距離矩陣W:
式中:
然后利用層次聚類的最小平方差算法,計算每個簇中每個點到合并后的簇中心的距離差的平方和,得到最終的聚類結(jié)果。
將表層海水水質(zhì)環(huán)境數(shù)據(jù)和浮游生物數(shù)據(jù)、表層葉綠素數(shù)據(jù)進行主成分分析 (表1),其中KMO 值為0.727>0.5,說明所用數(shù)據(jù)適合做主成分分析。Bartlett 球形度檢驗,近似卡方=812.282(P<0.01),說明因子變量之間高度相關,能夠為主成分分析提供合理的基礎。按照特征值大于1 的標準,確定主成分數(shù),前6 個主成分方差累計貢獻率為66.78%。由主成分分析結(jié)果,按照因子載荷絕對值>0.4 可以提取4 個主成分 (表2),第一個主成分PC1 為海洋水文和生物生態(tài)相關指標,第二主成分PC2 為石油類、葉綠素a、無機氮指標,第三主成分PC3 為透明度和活性磷酸鹽指標,第四主成分PC4 為浮游動物生物量和CODMn指標。
表1 KMO 和Bartlett 的檢驗Table 1 KMO and Bartlett tests
表2 海水質(zhì)量評價的因子載荷矩陣Table 2 Factor load matrix for seawater quality assessment
聚類選取的指標體系與主成分分析保持一致。首先需要確定每個指標的類型,指標數(shù)值越大則水質(zhì)越好的確定為極大型指標;指標數(shù)值越小則水質(zhì)越好的確定為極小型指標;指標數(shù)值波動于某個區(qū)間的確定為區(qū)間型指標。pH、DO、CODMn、無機氮、活性磷酸鹽、懸浮物、石油類、水溫參考海水水質(zhì)標準 (GB 3097—1997),浮游植物多樣性、浮游動物多樣性、浮游植物密度、浮游動物生物量參考近岸海域海洋生物多樣性評價技術指南 (HY/T 215—2017),鹽度參考近岸海洋生態(tài)健康評價指南(HY/T 087—2005),葉綠素a、透明度參考廖秀麗等[28]。此外,根據(jù)海水水質(zhì)標準 (GB 3097—1997),一類、二類水質(zhì)是人為造成的海水溫升夏季不超過當?shù)? ℃,其他季節(jié)不超過2 ℃,所以,溫度相對越低越好,故溫度取極小型指標。評價指標及指標類型總結(jié)如表3 所示。
表3 海水質(zhì)量評價指標及指標類型Table 3 Seawater quality assessment index and index type
根據(jù)數(shù)據(jù)可以計算出4 個季節(jié)及年度水環(huán)境評價的絕對關聯(lián)度 (表4),其中絕對關聯(lián)度越大,綜合評價越優(yōu)。
表4 海水質(zhì)量評價的絕對關聯(lián)度Table 4 Absolute correlation degree of seawater quality assessment
海水水質(zhì)標準 (GB 3097—1997) 中,將水質(zhì)分為4 個等級;近岸海域海洋生物多樣性評價技術指南 (HY/T 215—2017) 中,將海洋生物劃分為5 個等級;近岸海洋生態(tài)健康評價指南 (H Y/T 087—2005) 中,將生態(tài)健康劃分為3 個等級;廖秀麗等[28]將海灣養(yǎng)殖環(huán)境劃分為3 個等級。本文將海水質(zhì)量狀況劃分為3 個等級 (良好、中等、較差)。根據(jù)距離矩陣W,進行最小平方差算法的層次聚類,4 個季節(jié)及年度的聚類結(jié)果如圖2 所示。
圖2 海水質(zhì)量評價聚類圖及站點分區(qū)Fig. 2 Cluster map and site partition of seawater quality assessment
根據(jù)春夏秋冬四季和年度水環(huán)境評價的聚類圖,可將站點劃分為3 類 (表5) ,一類 (良好) 站點占比20.83%,二類 (中等) 站點占比66.67%,三類 (較差) 站點占比12.5%,總體結(jié)果表現(xiàn)中等。4 個季節(jié)相比,平均絕對關聯(lián)度為夏季 (0.747 9)>冬季 (0.734 5) >春季 (0.729 0) >秋季 (0.709 7),夏季海水質(zhì)量狀況相對較好,秋季表現(xiàn)相對最差。
表5 海水質(zhì)量評價的分類Table 5 Classification of seawater quality assessment
大亞灣海洋環(huán)境質(zhì)量受近岸人類開發(fā)活動和南海外海水入侵共同影響,其中大亞灣海域潮流基本呈往復流流態(tài)。大亞灣灣口的大辣甲和黃毛山將大亞灣灣口分隔成3 條通道與外海相連。漲潮時,灣外潮流沿3 條通道進入大亞灣內(nèi),然后朝北往大亞灣頂上溯。大辣甲西側(cè)上溯的水流在大坑附近海域輻散,分成兩支潮流分別向西進入大鵬澳和向東北隨主流向北進入澳頭灣。落潮時,大亞灣內(nèi)的水體基本上沿漲潮流相反方向流出灣口。根據(jù)評價結(jié)果,結(jié)合大亞灣水流方向及人類活動影響方式的不同,可將大亞灣24 個站點分成3 個區(qū)域 (A 區(qū)4 站:S9、S10、S19、S20,B 區(qū)12 站:S4、S6、S7、S11—S13、S15—S17、S21—S23,C 區(qū)8 站:S1—S3、S5、S8、S14、S18、S24,圖2),而這3 個區(qū)域的劃分與大亞灣周邊實際生產(chǎn)生活狀況和筆者的實地踏勘情況相符。本文評價指標并未包含重金屬、有機污染物和漁業(yè)資源等成本較高的監(jiān)測指標,說明本方法在基于有限指標的情況下,展現(xiàn)出了一定的操作性。
A 區(qū)臨近大亞灣北部近岸海域,北部沿岸城鎮(zhèn)密集、人口眾多,并建有大亞灣石油化工基地,該基地是我國為數(shù)不多的世界級石化基地,工業(yè)產(chǎn)能較大,對近岸海域環(huán)境有較大影響,因此A 區(qū)可定義為大亞灣北部工業(yè)和城鎮(zhèn)影響區(qū)。大亞灣核電基地附近海域呈現(xiàn)出明顯的輻散、輻合流特征,所以B 區(qū)可定義為輻散、輻合流及溫排水影響區(qū)。C 區(qū)S2 站點附近是大亞灣重要的水產(chǎn)養(yǎng)殖區(qū),主要為網(wǎng)箱養(yǎng)殖與貝類養(yǎng)殖,所以S2 站點主要受到養(yǎng)殖場的影響。其他站點均離岸較近,且S8、S14 站點位于旅游景點楊梅坑附近,在旅游旺季陸源輸入的影響較大。S24 站點位于大亞灣灣口的西側(cè)海域,代表了外海水進入大亞灣的區(qū)域,受外海水影響較大,所以C 區(qū)可定義為人類活動影響區(qū)。
總結(jié)四季各站點質(zhì)量評價的分類結(jié)果見表5。
根據(jù)構建的指標體系,通過改進灰色關聯(lián)度聚類,結(jié)合層次聚類,對大亞灣海域24 個站點進行聚類評價,成功將海域分成3 個區(qū)域,而這3 個區(qū)域的劃分與大亞灣周邊實際生產(chǎn)生活狀況以及筆者的實地踏勘相符,實現(xiàn)了在有限指標情況下的評價可操作性。
在聚類結(jié)果的展示圖方面,層次聚類只能展示出同類站點,不能展示出站點的相對優(yōu)劣順序,而灰色關聯(lián)度聚類可以展現(xiàn)站點的相對優(yōu)劣順序,所以在將灰色關聯(lián)度與層次聚類結(jié)合時,可考慮在改進算法中增加站點相對優(yōu)劣順序,增強聚類結(jié)果的展示性。