袁紅春 陳冠奇 張?zhí)祢? 宋利明
摘要:長鰭金槍魚(Thunnus alalunga)為南太平洋延繩釣的主要目標魚種之一,精確預報其漁場對于提高捕撈效率和優(yōu)化漁業(yè)資源管理具有重要意義。本研究依據(jù)2000-2015年南太平洋長鰭金槍魚的延繩釣數(shù)據(jù)、漁場時空數(shù)據(jù)以及海表溫度、葉綠素a濃度和海面高度3種環(huán)境因子,采用全卷積網(wǎng)絡構建了一種以月為單位、空間分辨率為5°×5°的漁場預報模型。本研究提出三維獨熱編碼技術將各月環(huán)境數(shù)據(jù)映射到三維矩陣的不同層上,并設計2種卷積結構和3種全卷積網(wǎng)絡模型,利用2015年數(shù)據(jù)對研究模型進行驗證,最佳模型總精準率達到72.0%。結果表明,全卷積網(wǎng)絡在一定程度上解決了傳統(tǒng)漁場預報方法在處理高維復雜海洋數(shù)據(jù)時準確率偏低的問題,為漁場預報提供了一種新方法。
關鍵詞:全卷積網(wǎng)絡;三維獨熱編碼;漁場預報;長鰭金槍魚
中圖分類號:S934文獻標識碼:A文章編號:1000-4440(2020)02-0423-07
Abstract:Thunnus alalunga is one of main objects of longline fishing in the South Pacific. Accurate prediction of albacore tuna fisheries is of great significance for improving fishing efficiency and optimizing the management of fishery resources. Based on the historical catching data of albacore tuna, spatio-temporal data and three environmental data including sea surface temperature (SST), sea surface height (SSH) and chlorophyll-a concentration (Chla) form 2000 to 2015 in the South Pacific, a fishing ground prediction model with a monthly unit and spatial resolution of 5°×5° in the South Pacific was established using fully convolutional networks. This model mapped the environmental data to 3D array using 3D one-hot encoding, and designed two types of convolution kernel and three types of convolution network models. The prediction accuracy reached 72.0% based on the environmental data in 2015. The results show that the fully convolutional network solves the problem of low accuracy of the traditional prediction methods in processing high-dimensional complex ocean data to a certain extent, and provides a new idea for fishing ground prediction.
Key words:fully convolutional networks;3D one-hot encoding;fishing ground forecasting;albacore tuna
長鰭金槍魚(Thunnus alalunga)作為高度洄游的大洋性魚類,廣泛分布于三大洋,具有較高的經(jīng)濟價值和豐富的資源量。通過分析區(qū)域漁業(yè)管理組織的漁獲量和努力量數(shù)據(jù)庫發(fā)現(xiàn),長鰭金槍魚的種群主要分布于太平洋,并且近二十年來在南太平洋海域長鰭金槍魚產(chǎn)量呈增長趨勢。目前長鰭金槍魚已經(jīng)成為南太平洋金槍魚延繩釣漁業(yè)的主要捕撈對象之一[1],準確預報南太平洋長鰭金槍魚漁場,對于合理安排漁業(yè)生產(chǎn),提高捕撈效益具有重要意義。
目前國內(nèi)外學者將漁場預報看作是一種分類問題或者回歸問題,通過統(tǒng)計學方法和GIS技術對漁場進行分析和預測。但是,由于海洋數(shù)據(jù)的復雜性和多變性,預測過程中需要人為對數(shù)據(jù)進行預處理和樣本組織,整個過程較為復雜,且特征的篩選和預處理會直接影響模型的預測準確率,預測結果受人為因素影響較大。近年來國內(nèi)外有研究者構建多種模型進行漁場預報,如Zagaglia等 [2-3]使用廣義加性模型(GAM)和廣義線性模型(GLM)對長鰭金槍魚漁場進行回歸預測。崔雪森等[4] 使用樸素貝葉斯方法對西北太平洋柔魚漁場建立預報模型,在高產(chǎn)區(qū)取得了69.9%的預報準確率。宋利明等[5]使用支持向量機對不同水層的環(huán)境因子進行分析,得到了庫克群島海域長鰭金槍魚棲息環(huán)境綜合指數(shù)。
隨著技術水平的提高,漁業(yè)數(shù)據(jù)規(guī)模變得更加巨大,而傳統(tǒng)的線性模型在對高維度數(shù)據(jù)進行分析時,數(shù)據(jù)量較大往往導致模型準確率降低[6] ,所以現(xiàn)有漁場預報模型多基于小范圍海域或者短期數(shù)據(jù)進行預測。深度神經(jīng)網(wǎng)絡在復雜動態(tài)場景中可以挖掘出重要的語義特征,對大規(guī)模數(shù)據(jù)有較好的擬合效果,其中深度CNN模型可以通過卷積和池化操作將不同環(huán)境因子進行交互運算,分析漁場等級。目前基于獨熱編碼的神經(jīng)網(wǎng)絡模型已經(jīng)在多個領域應用并取得了較好的結果[7-9] 。基于上述方法,本研究通過獨熱編碼技術將環(huán)境數(shù)據(jù)映射到三維矩陣,構建全卷積網(wǎng)絡的預測模型對南太平洋長鰭金槍魚進行漁場預報,以提高南太平洋長鰭金槍魚漁場預報的精度。
1材料與方法
1.1數(shù)據(jù)來源
根據(jù)南太平洋長鰭金槍魚的作業(yè)范圍,選取135° W~110° E,5° S~40° S為研究海域,采用2000-2015年的數(shù)據(jù)進行分析研究。
本研究的漁業(yè)作業(yè)數(shù)據(jù)來源于中西太平洋漁業(yè)委員會(Western and central pacific fisheries commission, WCPFC)的南太平洋延繩釣數(shù)據(jù)。該數(shù)據(jù)包括作業(yè)時間、作業(yè)空間坐標位置、釣鉤數(shù)、捕獲量(噸數(shù)和尾數(shù))。該捕撈數(shù)據(jù)以月為時間分辨率進行記錄,將產(chǎn)量以5°×5°空間分辨率進行匯總。
長鰭金槍魚分布受海表溫度、葉綠素a濃度、鹽度、渦動能和海流等多種因子影響[10-12] ,因此本研究選取即時性較強、獲取方便的環(huán)境遙感數(shù)據(jù)作為解釋因子,包括海表溫度(SST)、葉綠素a濃度(Chla)、海面高度(SSH)。其中海表溫度、葉綠素a濃度數(shù)據(jù)來源于美國國家海洋和大氣管理局(Nation oceanic and atmospheric administration, NOAA)環(huán)境數(shù)據(jù)庫。海面高度數(shù)據(jù)來源于哥白尼海洋環(huán)境監(jiān)測服務中心(Copernicus marine environment monitoring service,CMEMS)。該環(huán)境數(shù)據(jù)以月為時間分辨率,空間分辨率為1°×1°。由于作業(yè)數(shù)據(jù)和實際環(huán)境因子數(shù)據(jù)的空間分辨率不一致,本研究將環(huán)境因子取在漁區(qū)網(wǎng)格的中心點上,歸并為5°×5°的空間分辨率。
1.2數(shù)據(jù)預處理
1.2.1單位捕撈努力量漁獲量(CPUE)的計算在漁業(yè)作業(yè)生產(chǎn)中通常采用單位捕撈努力量漁獲量來表示漁業(yè)資源的豐度水平[13] 。本研究在5°×5°的空間網(wǎng)格內(nèi)對CPUE進行計算,公式如下:
1.2.2漁場等級劃分研究中常使用三分位數(shù)將漁區(qū)按照CPUE的大小劃分成若干個類別,從而將CPUE有效進行離散化[14],適用于分類模型。由于漁業(yè)作業(yè)中各月產(chǎn)量差異較大,僅以歷史CPUE的三分位點進行分級并不能有效地表示各月漁場的實際豐度水平,甚至會導致某些月份不存在高產(chǎn)區(qū)或者高產(chǎn)區(qū)較少,不利于指導漁業(yè)作業(yè)。因此借鑒文獻[15] 的分類方法,將漁區(qū)以各月CPUE的三分位數(shù)分位點66.7%和33.3%劃分為高產(chǎn)區(qū)、中產(chǎn)區(qū)和低產(chǎn)區(qū)3類。
1.3基于三維獨熱編碼的全卷積網(wǎng)絡方法
1.3.1三維獨熱編碼本研究基于獨熱編碼技術提出一種三維獨熱編碼方法,將2000年至2015年空間因子與環(huán)境因子數(shù)據(jù)映射為n×d×m大小的三維矩陣,其中n=5,為空間因子和環(huán)境因子(經(jīng)度、緯度、海表溫度、葉綠素a濃度、海面高度)數(shù)目,m=12,為總月數(shù),d=320,表示通過獨熱編碼將每種環(huán)境因子由大到小映射到320個等級。三維獨熱編碼技術通過將不同月份的空間因子和環(huán)境因子映射到三維矩陣不同的層上,建立一個12層的三維矩陣,實現(xiàn)特征屬性離散化。對于每一條數(shù)據(jù)的特征值使用獨熱編碼進行轉(zhuǎn)換,即建立一個320維的零向量ei,將特征值i的所有值由小到大劃分為320個等級,若某條記錄的特征值i處于第j個等級,則令向量ei的第j個分量為 1,其他值仍為0。將多個特征按順序組合為二維矩陣N= [e1,e2,…,en],其中n為該條記錄的空間因子和環(huán)境因子數(shù)目,本研究中n為5。若此條數(shù)據(jù)為m月,則令該三維矩陣的m-1層為N,其他11層為零。具體操作如圖1。
1.4算法步驟
基于全卷積網(wǎng)絡的漁情預測算法的步驟如下:
輸入: ?訓練集(D)為2000-2014年環(huán)境因子數(shù)據(jù)和CPUE。
測試集T為2015年環(huán)境因子數(shù)據(jù)和CPUE。
輸出: ?測試集(T)的等級分類
Step1:對訓練集和測試集進行數(shù)據(jù)預處理,并歸一化到0~1。將各條數(shù)據(jù)按月CPUE三分位點將漁場劃分為高、中、低3個等級,并生成D和T的標簽集L1、L2。
Step2:對各條數(shù)據(jù)使用方法1.3的方法進行編碼,將環(huán)境因子數(shù)據(jù)映射到三維矩陣。由訓練集(D)構建三維矩陣集(D1),由測試集T構建三維矩陣集(T1)。
Step3:訓練模型。將step2構造好的訓練集(D1)輸入到網(wǎng)絡模型中作為輸入數(shù)據(jù),將標簽集(L1)使用獨熱編碼轉(zhuǎn)換為輸出向量,訓練全卷積網(wǎng)絡得到分類器(F)。
Step4:將測試集(T1)輸入分類器(F)得到漁場預報結果R。將R與標簽集(L2)進行對比得到模型的預報準確率。
1.5試驗設計
本試驗工作站顯卡型號為NVIDIA GTX 1080Ti,CPU型號為AMD Ryzen Threadripper 1950X,操作系統(tǒng)為Windows10,并搭建了基于Python3.6的TensorFlow 1.3框架與Keras 2.0.8框架。
試驗數(shù)據(jù)集為南太平洋海域2000年到2015年空間因子、環(huán)境因子和長鰭金槍魚漁業(yè)作業(yè)數(shù)據(jù)。其中2000-2014年共有數(shù)據(jù)9 860條,將其按照85%和15%的比例劃分為訓練集和驗證集,另外選擇2015年743條數(shù)據(jù)作為測試集。
由于進行三維獨熱編碼后數(shù)據(jù)維度較高但信息較為稀疏,所以設置初始學習率lr=0.000 5,并采用學習率動態(tài)調(diào)整,當進行了10次迭代循環(huán)后,驗證集損失值仍不下降時,將學習率減半,衰減率(decay)=1.0×e-6,動量參數(shù)(momentum)=0.9。訓練停止方式采取早停策略(Early stopping)防止過擬合[19] ,即15次迭代循環(huán)后驗證集損失值仍不下降時結束訓練,并將最大迭代次數(shù)設置為500。
本研究設計2組試驗分別研究卷積核大小與網(wǎng)絡結構對模型準確率的影響,為了評估模型性能,除了使用方法1.3.4的預報精度檢驗方法作為主要評估標準外,選擇所有漁場的精準率(Precision)和F1分數(shù)作為綜合評估參考。
1.5.1卷積核尺度對模型性能的影響本研究分別使用3×1的一維卷積核和3×3卷積核進行模型構建。特別強調(diào)在測試不同卷積核的效果時,網(wǎng)絡結構與超參數(shù)設置均相同。
1.5.2網(wǎng)絡結構對模型性能的影響對于網(wǎng)絡卷積層數(shù)選擇,本研究分別嘗試了2到5層卷積層,并構建濾波器數(shù)目為64/128/256、128/256/512和256/256/256 3種不同結構的網(wǎng)絡模型。
2結果與分析
2.1卷積核尺度對模型性能的影響
表1為使用不同卷積核時,在測試集上的對比結果。由表1可知,3×1的一維卷積核模型將大量中產(chǎn)區(qū)誤分為其他產(chǎn)區(qū),無法對各等級漁場進行明確劃分,這是由于本研究的矩陣與傳統(tǒng)的特征矩陣相比更為稀疏,不利于一維矩陣的特征提取。而3×3卷積核由于具有更大的感受野,有利于提取特征,因此本研究采用3×3卷積核構建模型進行訓練。
2.2網(wǎng)絡結構對模型性能的影響
通過觀察損失值曲線發(fā)現(xiàn),當網(wǎng)絡層數(shù)增加到4層時,模型在50次迭代循環(huán)后就發(fā)生了嚴重的過擬合現(xiàn)象,因此模型最終設置3層卷積層。本研究數(shù)據(jù)經(jīng)過三維獨熱編碼后矩陣的尺度為5×320×12,矩陣高度較小,所以不進行高度降維,僅用步長為1×2和1×3的卷積層替代池化層(其中1×3大小的步長是對上一卷積層的全部輸出特征值進行卷積運算的最大步長),行與行之間通過卷積核交互運算。通過分析表1,本研究將卷積核的大小設為3×3,激活函數(shù)使用ReLU函數(shù)。本試驗一共設置3種不同結構的全卷積網(wǎng)絡模型,每個模型都為3個卷積層和2個全連接層,整個模型采取全卷積結構,不使用池化層,具體結構見表2。
由表3可以看出,在選擇不同過濾器數(shù)目時,全卷積網(wǎng)絡模型均取得了較高準確率,但是隨著卷積層濾波器層數(shù)的增加,由于深層網(wǎng)絡節(jié)點數(shù)過多,網(wǎng)絡發(fā)生過擬合現(xiàn)象,導致中產(chǎn)區(qū)被誤分為其他產(chǎn)區(qū),整體準確率下降。由于本研究網(wǎng)絡模型采用全卷積結構,不存在池化層造成的信息損失,所以在各層可以采取相同的節(jié)點數(shù)。模型3將各卷積層均設置為256個濾波器,在增加模型參數(shù)量的同時保持了與模型1相同的深層網(wǎng)絡節(jié)點數(shù),不易發(fā)生過擬合現(xiàn)象,并且明顯提高了準確率。因此本研究選用表現(xiàn)最好的模型3結構作為全卷積網(wǎng)絡最終結構并將其命名為F-ACN。
2.3模型擬合分析
由于本研究樣本數(shù)目龐大,傳統(tǒng)漁場預報方法由于參數(shù)數(shù)目等原因預測結果并不理想,而F-ACN模型由于卷積神經(jīng)網(wǎng)絡的多層非線性結構和龐大可訓練參數(shù)可以充分擬合多參數(shù)間的非線性關系,在大規(guī)模數(shù)據(jù)集上能取得更好的結果。如圖2所示,在訓練過程中訓練集與驗證集的準確率曲線和損失值曲線基本重合,F(xiàn)-ACN在驗證集和測試集上的準確率僅略低于訓練集,該模型表現(xiàn)出良好的泛化性。F-ACN模型在訓練初期學習緩慢,這是由于本研究數(shù)據(jù)集劃分沒有明確的邊界,模型在訓練初期無法判明類別,梯度方向不斷變化,當進行了約10次迭代后,損失值開始快速下降。
2.4不同模型預測結果
雖然國內(nèi)外進行了大量漁場預報模型研究,但傳統(tǒng)漁場預報方法多針對小型數(shù)據(jù)集,為了驗證F-ACN模型準確率,本研究使用樸素貝葉斯方法、BP神經(jīng)網(wǎng)絡和深度神經(jīng)網(wǎng)絡(DNN)構建南太平洋長鰭金槍魚預報模型與該模型進行對比。其中樸素貝葉斯模型采用文獻[4] 的基于FastICA方法進行獨立成分分析的樸素貝葉斯方法。BP神經(jīng)網(wǎng)絡采用5-512-3結構。DNN神經(jīng)網(wǎng)絡模型采取與CNN完全相同的節(jié)點數(shù)。
由表4可以看出,相比于其他模型本研究算法總體準確率最高,在高產(chǎn)區(qū)和低產(chǎn)區(qū)的預測準確率上有明顯優(yōu)勢。實際作業(yè)受捕撈效率影響,漁業(yè)作業(yè)位置一般依賴于高產(chǎn)區(qū)預測結果,而F-ACN模型在高產(chǎn)區(qū)和低產(chǎn)區(qū)預測準確率較高,對于作業(yè)漁船尋找最佳漁場有較好的指導意義。由于漁情預報方法的漁場等級劃分界限并不明確,只按照月CPUE的三分位點進行劃分,而受實際天氣、政策等因素的影響,漁場的實際水平可能高于或低于等級標簽,所以處在2個等級邊界部分漁場容易被誤分,出現(xiàn)了中產(chǎn)區(qū)預報準確率明顯低于高產(chǎn)區(qū)和低產(chǎn)區(qū)的現(xiàn)象。
3討論
本研究針對傳統(tǒng)漁情預報方法難以擬合海洋大數(shù)據(jù)的缺陷,提出了一種基于三維獨熱編碼的全卷積網(wǎng)絡南太平洋長鰭金槍魚漁場預報模型F-ACN。本研究發(fā)現(xiàn),F(xiàn)-ACN可以對大規(guī)模海洋數(shù)據(jù)進行特征提取,同時與傳統(tǒng)漁情預報方法相比準確率明顯提升,在一定程度上解決了傳統(tǒng)漁情預報方法在處理高維復雜海洋數(shù)據(jù)時準確率下降的問題,為漁場預報提供了一種新思路。
F-ACN模型由多層卷積神經(jīng)網(wǎng)絡和DNN構成,比傳統(tǒng)漁場預報模型具有更多的可訓練參數(shù),且非線性更強。同時F-ACN模型采用全卷積網(wǎng)絡結構,使用步長為2的卷積層代替了池化操作,模型在卷積層的計算量比普通卷積神經(jīng)網(wǎng)絡減少了1/2,并且省去了所有的池化操作,極大地加速了運算速度。面對海洋數(shù)據(jù)大規(guī)模、多源化和異構性的特點,此模型可以更好地擬合復雜數(shù)據(jù)形式,自動獲取海量高維數(shù)據(jù)中存在的復雜關聯(lián),精準預報漁場。
與回歸模型相比,F(xiàn)-ACN模型得到的預報結果是一個離散值,即漁場等級,不存在一個連續(xù)的概率預測值,因此可以更加明確直觀地表示漁場水平。同為分類模型的樸素貝葉斯方法要求各輸入變量相互獨立,模型進行訓練前要對多種參數(shù)進行獨立成分分析,這不僅增加了模型的復雜度還造成了數(shù)據(jù)信息量損失。而F-ACN模型是一種“黑盒”模型,并不要求漁業(yè)數(shù)據(jù)滿足任何假設,只需要簡單的對數(shù)據(jù)進行三維獨熱編碼,原理和實現(xiàn)更為簡單,不用考慮環(huán)境因子間的相互影響,因此該模型使用方便。同時F-ACN模型具有很好的可擴展性,在環(huán)境因子種類增加時,只需增加訓練集三維矩陣的維度就可以在原模型進行訓練,不需要進行其他預處理操作。但F-ACN模型只考慮到了漁場與環(huán)境因子的關系,獨立地對漁場進行預報,而長鰭金槍魚作為一種高度洄游的大洋性魚類,各個漁區(qū)在連續(xù)時間內(nèi)存在一定的空間關系,下一步需要將漁場的時間序列因素和空間相關性加入到模型中,提高漁場預報準確率。
參考文獻:
[1]NIKOLIC N, MORANDEAU G, HOARAU L, et al. Review of albacore tuna, Thunnus alalunga, biology, fisheries and management[J]. Reviews in Fish Biology and Fisheries, 2017, 27(4): 775-810.
[2]ZAGAGLIA C R, LORENZZETTI J A, STECH J L. Remote sensing data and longline catches of yellowfin tuna (Thunnus albacares) in the equatorial Atlantic[J]. Remote Sensing of Environment, 2004, 93(1/2):267-281.
[3]ZAINUDDIN M, SAITOH K, SAITOH S E I I. Albacore (Thunnus alalunga) fishing ground in relation to oceanographic conditions in the western North Pacific Ocean using remotely sensed satellite data[J]. Fisheries Oceanography, 2008, 17(2): 61-73.
[4]崔雪森,唐峰華,張衡,等.基于樸素貝葉斯的西北太平洋柔魚漁場預報模型的建立[J].中國海洋大學學報(自然科學版),2015,45(2):37-43.
[5]宋利明,周建坤,沈智賓,等.基于支持向量機的庫克群島海域長鰭金槍魚棲息環(huán)境綜合指數(shù)[J].海洋通報,2017,36(2):195-208.
[6]HARRELL F E, LEE K L, MARK D B. Tutorial in biostatistics multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors[J]. Statistics in Medicine,1996,1(15):361-387.
[7]李思琴,林磊,孫承杰.基于卷積神經(jīng)網(wǎng)絡的搜索廣告點擊率預測[J].智能計算機與應用,2015,5(5):22-25,28.
[8]LIU Q, YU F, WU S, et al. A convolutional click prediction model[C]//Association for Computing Machinery. Proceedings of the 24th ACM international on conference on information and knowledge management. New York, USA: ACM, 2015: 1743-1746.
[9]WANG P, XU B, XU J, et al. Semantic expansion using word embedding clustering and convolutional neural network for improving short text classification [J]. Neurocomputing, 2016,174: 806-814.
[10]毛江美,陳新軍,余景.基于神經(jīng)網(wǎng)絡的南太平洋長鰭金槍魚漁場預報[J].海洋學報,2016,38(10):34-43.
[11]宋利明,謝凱,趙海龍,等.庫克群島海域海洋環(huán)境因子對長鰭金槍魚漁獲率的影響[J].海洋通報,2017,36(1):96-106.
[12]范永超,戴小杰,朱江峰,等.南太平洋長鰭金槍魚延繩釣漁業(yè)CPUE標準化[J].海洋湖沼通報,2017(1):122-132.
[13]ZAINUDDIN M, SAITOH S, SAIROH K. Detection of potential fishing ground for albacore tuna using synoptic measurements of ocean color and thermal remote sensing in the northwestern North Pacific[J]. Geophysical Research Letters, 2004, 31(20):183-213.
[14]ISMAIL A I, MORRISION E C, BURT B A, et al. Natural history of periodontal disease in adults: findings from the tecumseh periodontal disease study[J]. Journal of Dental Research, 1990, 69(2): 430-435.
[15]陳雪忠,樊偉,崔雪森,等.基于隨機森林的印度洋長鰭金槍魚漁場預報[J].海洋學報,2013,35(1):158-164.
[16]KRIZHEVSKY A,SUTSKEVER I,HINTON G E. Imagenet classification with deep convolutional neural networks[C]//NIPS. Advances in neural information processing systems. USA: Curran Associates Inc,2012: 1097-1105.
[17]SPTINGENBERG J T, DOSOVITSKIY A, BROX T, et al. Striving for simplicity: The all convolutional net[EB/OL].(2015-4-13)[2019-7-15]. https://arxiv.org/abs/1412.6806.pdf.
[18]張衡,崔雪森,樊偉.基于遙感數(shù)據(jù)的智利竹筴魚漁場預報系統(tǒng)[J].農(nóng)業(yè)工程學報,2012,28(15):140-144.
[19]PRECHELT L. Automatic early stopping using cross validation: quantifying the criteria[J]. Neural Networks, 1998, 11(4): 761-767.
(責任編輯:陳海霞)