周茜涵,吳洽兒,周艷波,謝恩閣,馬勝偉
(1.中國水產(chǎn)科學(xué)研究院南海水產(chǎn)研究所/農(nóng)業(yè)農(nóng)村部南海漁業(yè)資源開發(fā)利用重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510300;2.西安電子科技大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西 西安 710100)
鳶烏賊 (Sthenoteuthis oualaniensis) 隸屬于槍形目、柔魚科、鳶烏賊屬,廣泛分布于印度洋、太平洋的赤道和亞熱帶海域,其中南海和印度洋西北部海域分布數(shù)量較多。巨大的開發(fā)潛力與經(jīng)濟(jì)價(jià)值,使其在我國南海海洋漁業(yè)中的地位日益凸顯,近年已逐漸成為我國南海重要經(jīng)濟(jì)種之一[1]。海洋環(huán)境和氣候均會(huì)對南海鳶烏賊的相對資源豐度產(chǎn)生影響,如海表面溫度 (Sea surface temperature, SST)、海平面高度 (Sea surface height, SSH)、海表葉綠素a濃度 (Sea surface chlorophyllaconcentration, Chla)、海表鹽度 (Sea surface salinity, SSS)、厄爾尼諾現(xiàn)象[2]、月相等[3],掌握南海鳶烏賊單位捕撈努力量漁獲量 (Catch per unit effort, CPUE) 與海洋環(huán)境間的變化規(guī)律,對準(zhǔn)確預(yù)測鳶烏賊的資源豐度有重大意義。但由于鳶烏賊資源開發(fā)較晚,漁獲量統(tǒng)計(jì)數(shù)據(jù)缺少長時(shí)間與大范圍的積累,且漁民自主填報(bào)數(shù)據(jù)質(zhì)量較差,傳統(tǒng)方法難以對其資源豐度進(jìn)行準(zhǔn)確預(yù)測[4]?;疑到y(tǒng)模型由我國鄧聚龍教授首創(chuàng),旨在解決“部分信息已知,部分信息未知”的不確定性系統(tǒng)問題,對時(shí)間序列較短的數(shù)據(jù)和具有不確定因素的復(fù)雜系統(tǒng)的預(yù)測效果較好[5],近年來已被廣泛應(yīng)用于漁業(yè)研究領(lǐng)域[6]。普通GM (1,1) 模型每次僅能觀測1個(gè)變量,無法體現(xiàn)環(huán)境因子的作用;GM (1,N) 模型雖能考慮多個(gè)變量的影響作用,體現(xiàn)出多因素共同作用下的趨勢預(yù)測,但建模精度存在較大偏差,穩(wěn)定性不足[7]。針對上述問題,許多學(xué)者對灰色模型進(jìn)行了優(yōu)化改進(jìn),如構(gòu)建無偏模型[8]、優(yōu)化灰作用量[9]、重構(gòu)背景值[10]、優(yōu)化參數(shù)估計(jì)[11]以及殘差序列修正[12]等。本文以2013—2019年春夏季南海鳶烏賊CPUE為資源相對豐度指標(biāo),構(gòu)建鳶烏賊CPUE與環(huán)境因子間的灰色預(yù)測模型GM (1,N)[13],并對原始預(yù)測模型進(jìn)行優(yōu)化,以提高預(yù)測精度。
南海鳶烏賊生產(chǎn)統(tǒng)計(jì)資料來自于廣西壯族自治區(qū)北海市水產(chǎn)推廣站漁撈日志,數(shù)據(jù)包括船名、主機(jī)功率、日期、作業(yè)水深、經(jīng)度、緯度、漁區(qū)、作業(yè)時(shí)長、漁獲量 (kg) 等,因本文選取的漁船參數(shù)變化較小,故暫未考慮漁船參數(shù)對CPUE的影響[14]。時(shí)間分辨率為天 (d),空間分辨率為經(jīng)緯度0.5°×0.5°。研究區(qū)域?yàn)?106°E—120°E、6°N—20°N,時(shí)間為2013—2019年。根據(jù)鳶烏賊的汛期,本文以每年2—6月汛期為研究對象[15]。
本研究選取SST、SSH、Chl-a、SSS和海表面風(fēng)速 (Sea surface wind, SSW) 5種與鳶烏賊活動(dòng)密切相關(guān)的環(huán)境因子[16],其中SST、SSS、Chl-a和SSW數(shù)據(jù)來源于美國海洋大氣局NOAA氣候觀測網(wǎng)點(diǎn)https://oceandata.sci.gsfc.nasa.gov/,時(shí)間分辨率均為月,SSS和SSW的空間分辨率為0.25°×0.25°,SST和Chl-a的空間分辨率為4 km。SSH數(shù)據(jù)來源于http://marine.copernicus.eu,時(shí)間分辨率為月,空間分辨率為0.083°×0.083°。在ArcGis 10.2中將空間分辨率統(tǒng)一處理為0.5°×0.5°,若存在未記錄的環(huán)境數(shù)據(jù),則采用克里格插值計(jì)算得到相應(yīng)站點(diǎn)的環(huán)境數(shù)據(jù)[17]。
1.2.1 數(shù)據(jù)預(yù)處理 本研究以CPUE作為鳶烏賊資源相對豐度的指標(biāo),計(jì)算歷年各月平均CPUE,計(jì)算公式為:
1.2.2 灰色關(guān)聯(lián)分析 灰色關(guān)聯(lián)分析是根據(jù)灰色系統(tǒng)中各因素間發(fā)展趨勢來確定各因素間關(guān)聯(lián)性,對系統(tǒng)的變化趨勢作量化度量[19]。本文設(shè)序列為2013—2019年各年平均CPUE序列,設(shè)序列為歷年各月環(huán)境因子序列,之間的關(guān)聯(lián)度計(jì)算參考余勝威[20]。
各指標(biāo)對CPUE的影響程度大小與關(guān)聯(lián)度成正比,關(guān)聯(lián)度越大說明影響越大,反之越小。通常關(guān)聯(lián)度大于0.9說明兩者之間具有強(qiáng)相關(guān),大于0.8說明兩者之間顯著相關(guān),大于0.7說明具有相關(guān)性[20]。
1.2.3 GM (1,N) 模型預(yù)測原理 GM (1,N) 模型是多變量情況下考慮觀測點(diǎn)間相關(guān)性的動(dòng)態(tài)關(guān)聯(lián)分析模型,能反映系統(tǒng)參數(shù)間的影響作用,適用于系統(tǒng)整體分析。設(shè)各年平均CPUE序列為,其相關(guān)海洋環(huán)境因素序列為模型的具體構(gòu)建計(jì)算參考文獻(xiàn)[21]。
最終得到G M (1,N) 的響應(yīng)函數(shù)為:
累減還原預(yù)測值:
1.2.4 因子重要性分析 因子重要性分析是通過關(guān)聯(lián)度分析和因子組合共同確定因子重要性的方法,即為比較不同環(huán)境因子對資源相對豐度預(yù)測的效果,模型建立時(shí)考慮不同因子的組合模型,擬構(gòu)建以下6種模型[13]:
模型1:包含所有因子的GM (1,6) 模型;
模型2:不包含SSH的GM (1,5) 模型;
模型3:不包含SST的GM (1,5) 模型;
模型4:不包含SSS的GM (1,5) 模型;
模型5:不包含Chl-a的GM (1,5) 模型;
模型6:不包含SSW的GM (1,5) 模型。
通過相對誤差判斷模型有效性,即比較以上所有模型的相對誤差大小來間接說明該環(huán)境因子的重要性[22]。
1.2.5 基于Simpson公式的背景值優(yōu)化 GM(1,N) 模型的預(yù)測值依賴于原始數(shù)據(jù)序列及其背景值,因此背景值的合理構(gòu)造將對提高模型預(yù)測精度起重要作用。通常使用的兩點(diǎn)間中值誤差較大,且會(huì)造成預(yù)測值數(shù)據(jù)不夠平穩(wěn),故此選用Simpson公式對背景值進(jìn)行改造[21]。
新的背景值寫作[23]:
1.2.6 基于Fourier級數(shù)的殘差修正 灰色GM(1,N) 模型在進(jìn)行中長期預(yù)測時(shí)預(yù)測精度會(huì)衰減,針對這個(gè)問題,可以基于構(gòu)建殘差的GM (1,1) 模型[24]、Markov鏈[25]、自適應(yīng)濾波法[26]等方法修正。本文采用Fourier級數(shù)對預(yù)測誤差做擬合修正。定義灰色GM (1,N) 模型的殘差序列為:
其中模型相應(yīng)參數(shù)可通過Matlab 2017a軟件求解[27]。
南海鳶烏賊年CPUE存在較大的變動(dòng),2013—2015年逐年增加,在2015年達(dá)到最高值(2.66 t·d?1)后下降至 2016 年的 1.93 t·d?1,隨后在 2017—2019年間呈穩(wěn)步增長的趨勢 (圖1)。
圖1 2013—2019年南海鳶烏賊單位捕撈努力量漁獲量變化Figure 1 CPUE of S.oualaniensis in South China Sea from 2013 to 2019
環(huán)境因子中Chl-a、SST和SSW的關(guān)聯(lián)度皆大于0.8,屬于顯著相關(guān);SSS和SSH的關(guān)聯(lián)度大于0.7,具有相關(guān)性 (表1)。其中影響最大的因子是Chl-a,其灰色關(guān)聯(lián)度平均值為0.953 5;其次為SST,平均關(guān)聯(lián)度為0.848 0;第三為SSW,平均關(guān)聯(lián)度為0.833 8。
表1 環(huán)境因子序列與單位捕撈努力量漁獲量的灰色關(guān)聯(lián)度分析結(jié)果Table 1 Grey relational analysis of environmental factor sequence and CPUE
從月份因素分析,3月的Chl-a和SSW、2月的SST、5月的SSH和SSS分別為各因子中關(guān)聯(lián)系數(shù)最大的月份,因此在之后GM (1,N) 模型構(gòu)建中,采用上述5項(xiàng)因子作為南海鳶烏賊資源GM(1,N) 模型建模的備選因子。
GAM模型分析表明 (圖2),鳶烏賊CPUE集中分布在 Chl-a質(zhì)量濃度介于 0.07~0.19 mg·m?3的區(qū)域,最適宜 Chl-a質(zhì)量濃度為 0.09~0.13 mg·m?3;鳶烏賊CPUE集中分布的SST介于24~31 ℃,最適宜SST為27~29 ℃;鳶烏賊CPUE集中分布的SSW介于 2.0~10.0 m·s?1,最適宜風(fēng)速為 4.5~7.0 m·s?1。
圖2 海表面葉綠素質(zhì)量濃度、海表面溫度和海表面風(fēng)速對單位捕撈努力量漁獲量的影響Figure 2 Effects of sea surface Chl-a concentration, sea surface temperature, sea surface wind speed on CPUE
選定指標(biāo)后,用2013—2018年CPUE和環(huán)境因子數(shù)據(jù)建立灰色預(yù)測模型,多種因子組合模型的平均相對誤差見表2。從平均相對誤差上看,模型M6 (不包含SSS) 和模型M3 (不包含SSW) 相對誤差值較大,模型M1 (包含全部因子) 相對誤差最小,即模型M1為最優(yōu)預(yù)測模型,能夠較好地模擬南海春、夏季鳶烏賊的資源豐度。
表2 多因素預(yù)測模型得到的單位捕撈努力量漁獲量擬合值與真實(shí)值的相對誤差Table 2 Relative error between CPUE predictive value and real value obtained by multi-factor prediction model
表3為CPUE真實(shí)值與普通GM (1,6) 模型、基于Simpson優(yōu)化的GM (1,6) 模型和基于Fourier級數(shù)修正的GM (1,6) 模型3種模型擬合結(jié)果的比較。因數(shù)據(jù)列較短,在此只選用2019年的數(shù)據(jù)作驗(yàn)證。
表3 3種模型的擬合結(jié)果與單位捕撈努力量漁獲量真實(shí)值的相對誤差Table 3 Relative error between predictive values of three models and real CPUE value
普通GM (1,6) 模型平均相對誤差為7.78%,預(yù)測的2019年CPUE誤差為4.79%。
根據(jù)公式 (4) 計(jì)算基于Simpson公式的GM(1,N) 模型,平均相對誤差為7.69%,預(yù)測的2019年CPUE誤差為3.46%。
根據(jù)公式 (6) 使用2013—2018年殘差擬合Fourier級數(shù)得到級數(shù)表達(dá)式為:
模型殘差平方和SSE=0.025,擬合優(yōu)度值R2=0.879,均方根誤差RMSE=0.158 2,此時(shí)基于Fourier級數(shù)修正的GM (1,N) 模型的平均相對誤差僅為2.62%,預(yù)測的2019年CPUE相對誤差僅為1.87%。
普通GM (1,6) 模型的結(jié)果不平穩(wěn),在2014和2017年的擬合上出現(xiàn)了較大的誤差;基于Simpson優(yōu)化的GM (1,N) 模型預(yù)測數(shù)據(jù)平穩(wěn)但仍有誤差;而基于Fourier級數(shù)殘差修正的灰色GM (1,N) 模型基本能擬合真實(shí)值 (圖3)。
圖3 3種模型的擬合結(jié)果與單位捕撈努力量漁獲量真實(shí)值的比較Figure 3 Comparison between fitting results of three models and real CPUE value
本研究以CPUE為指標(biāo),結(jié)合海洋環(huán)境因子,采用灰色系統(tǒng)理論預(yù)測春夏季南海鳶烏賊的資源豐度,并用數(shù)值積分中的Simpson公式和Fourier級數(shù)對模型的背景值和殘差進(jìn)行修正,得到較普通灰色模型精確度更高的預(yù)測方法。
灰色關(guān)聯(lián)度結(jié)果表明,Chl-a對鳶烏賊CPUE的影響最大,其灰色關(guān)聯(lián)度平均值為0.953 5。在漁場的變化中,Chl-a濃度決定了海域生產(chǎn)力高低以及攝食環(huán)境優(yōu)劣,而攝食環(huán)境是決定鳶烏賊補(bǔ)充量的重要因素[13]。本研究結(jié)果顯示,鳶烏賊集中分布在 Chl-a質(zhì)量濃度介于 0.07~0.19 mg·m?3的區(qū)域,最適宜 Chl-a質(zhì)量濃度為 0.09~0.13 mg·m?3。這與余景等[16]報(bào)道的中西沙鳶烏賊最適Chl-a質(zhì)量濃度為 0.10~0.13 mg·m?3的結(jié)果一致。
鳶烏賊的生存環(huán)境與溫度密切相關(guān)[14]。徐紅云等[28]報(bào)道南海鳶烏賊中心漁場最適宜SST為26.4~29.6 ℃;晏磊等[29]研究認(rèn)為不同季節(jié)鳶烏賊對溫度的適宜性范圍也有所變化,春季最適SST為25.6~29.6 ℃,秋季為27.6~30 ℃。本研究中SST對CPUE的影響僅次于Chl-a,關(guān)聯(lián)度為0.848,主要分布在27~29 ℃,與上述研究結(jié)果基本一致。
SSW的平均關(guān)聯(lián)度為0.833 8。本研究中鳶烏賊 CPUE分布在 SSW 介于 2.0~10.0 m·s?1的區(qū)域,其中最適宜SSW為4.5~7.0 m·s?1。風(fēng)速對鳶烏賊CPUE的影響與燈光罩網(wǎng)作業(yè)的特點(diǎn)有關(guān),大風(fēng)天氣會(huì)嚴(yán)重影響罩網(wǎng)漁船捕撈作業(yè),在海上風(fēng)速較大時(shí)其捕撈活動(dòng)較少。
此外,有研究表明,SSH也是影響鳶烏賊資源豐度的一個(gè)重要因子,SSH高于平均海面有利于海水的輻散上升,帶來豐富的營養(yǎng)物質(zhì),使浮游生物大量繁殖,充足的餌料可促進(jìn)中上層魚類的生長、繁殖[30]。但本研究將整個(gè)海域SSH進(jìn)行了平均,且研究時(shí)間僅2—6月,弱化了SSH對CPUE的影響[13]。
灰色GM (1,N) 模型結(jié)果顯示,包含所有因子的模型M1對鳶烏賊資源豐度有較好的預(yù)測效果,能較準(zhǔn)確地反映CPUE的變化趨勢?;疑到y(tǒng)模型突破小樣本數(shù)據(jù)的局限,對時(shí)間序列較短的數(shù)據(jù)也有良好的預(yù)測效果,對數(shù)據(jù)缺乏的漁業(yè)科學(xué)具有重要意義。
針對普通灰色模型預(yù)測誤差較大的問題,本文首先使用Newton-Cotes公式改造背景值,用Simpson公式代替梯形公式,降低背景值帶來的誤差。將GM (1,N) 模型的平均相對誤差由7.78%降至7.69%,使預(yù)測數(shù)據(jù)序列更平穩(wěn);且與普通GM(1,N) 模型相比,使2019年CPUE的預(yù)測誤差從4.79%降至3.46%,因此改造背景值對于優(yōu)化預(yù)測結(jié)果有一定意義。此外,用Fourier級數(shù)對GM(1,N) 模型的殘差作擬合,利用其良好的數(shù)據(jù)逼近能力對預(yù)測誤差進(jìn)行修正,將數(shù)據(jù)序列的平均相對誤差由7.78%降至2.54%,將2019年CPUE的預(yù)測誤差從4.79%降至1.87%,說明Fourier級數(shù)修正能夠有效地提高模型精度,減少相對誤差,使結(jié)論更具實(shí)際價(jià)值。
綜上所述,本研究通過灰色關(guān)聯(lián)分析法構(gòu)建鳶烏賊CPUE與環(huán)境因子間的關(guān)聯(lián)度,選取合適因子構(gòu)建灰色預(yù)測模型對南海鳶烏賊資源CPUE進(jìn)行預(yù)測,并對其結(jié)果進(jìn)行修正,使優(yōu)化后的模型較之前的精度有明顯提高,這對更準(zhǔn)確預(yù)測鳶烏賊資源豐度提出了一種新思路。但本文未考慮因子交互項(xiàng)對南海鳶烏賊CPUE的作用,加上灰色系統(tǒng)模型本身的局限性,如快速衰減和遞增的屬性,使長期預(yù)測結(jié)果的準(zhǔn)確性較低。本研究因GM (1,N) 模型對加入的影響因素的限制,在計(jì)算CPUE時(shí)采取了平均的算法,降低了樣本量。因此,今后可嘗試其他預(yù)測模型,如神經(jīng)網(wǎng)絡(luò)模型[31]和回歸樹模型[32],兩者均具有良好的非線性映射能力和學(xué)習(xí)能力,在大樣本量條件下能獲得更高的預(yù)測結(jié)果;此外,支持向量機(jī)模型[33]能根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)性之間尋求最佳解,在小樣本情況下得出較好的預(yù)測結(jié)果,從而獲得更加準(zhǔn)確的南海鳶烏賊CPUE預(yù)測模型。