鄭友亮
?
基于卷積神經網絡的沿海水質評價技術研究*
鄭友亮
(廣東省科技基礎條件平臺中心)
針對沿海水質評價,利用遙感圖像獲取的實時與大范圍優(yōu)勢,提出基于卷積神經網絡的沿海水質綜合評價方法。該方法應用非線性回歸模型對遙感圖像進行校正;建立基于卷積神經網絡的沿海水質評價模型;引入水質評價先驗知識,結合遙感圖像形成多模態(tài)矩陣輸入數(shù)據(jù);通過多層卷積與池化操作,降低因圖像平移、縮放、傾斜等變換引起的誤差,提高水質評價精度。實驗結果表明,該方法可較準確地評價沿海水質,具有一定的實用價值。
沿海水質評價;遙感圖像;卷積神經網絡
廣東省沿海區(qū)域是我國南方經濟發(fā)展較快速地區(qū)。隨著沿海養(yǎng)殖、工業(yè)、運輸和旅游等行業(yè)的迅速發(fā)展,近岸海域所承受的資源與環(huán)境壓力也日益嚴重,自凈速度往往趕不上生產、生活排污速度,從而導致沿海區(qū)域水質下降和生物資源減少等海洋生態(tài)環(huán)境問題。2015年全省近岸海域水質大部分較清潔,符合Ⅰ、Ⅱ類海水水質標準的面積比例近90%,但近岸海域存在化學成分,如氮、磷超標等水質問題,其中劣于第Ⅳ類海水水質標準的海域面積比例年均值為4.0%[1]。
目前,沿海水質評價數(shù)據(jù)采集手段已多樣化,主要包括衛(wèi)星遙感、船舶、航空、浮標和臺站等方式,而基于遙感圖像的水質評價因具有快速、低成本、即時同步性好等優(yōu)勢,已成為當前沿海水質監(jiān)測與評價的主流方式,可實時快速獲得大面積區(qū)域沿海水質信息。衛(wèi)星遙感的原理是利用衛(wèi)星重現(xiàn)觀測目標電磁輻射特性的空間分布狀況,包含觀測目標的光譜、時空等特征,并通過分析、推理與判斷遙感影像中的目標特征信息來實現(xiàn)觀測目標識別。
目前常用的水質評價方法有經驗與統(tǒng)計分析法、神經網絡法[2]、模糊評價法[3]、支持向量機[4]和人工蜂群優(yōu)化法[5]等,但均基于已采集的水體觀測因子,如PH、DO、無機氮等指標進行評價,僅考慮觀測因子與水質等級之間的關系,而觀測因子的采集存在實時性差、耗費大、覆蓋范圍窄等問題。文獻[6]提出基于遙感圖像的神經網絡水質反演評價模型,但僅針對葉綠素a濃度單因子進行評價。文獻[7]提出基于模糊評價的水質監(jiān)測模型,但實現(xiàn)過程復雜且對Ⅱ類、Ⅲ類海洋水質評價的準確率較低。遙感圖像與水質參數(shù)之間是較復雜的非線性關系,水體水質狀況具有模糊性與隨機性,且海洋遙感圖像還包含海洋深度信息。而傳統(tǒng)水質評價方法僅適用于淺層結構模型[8],即對于原始的輸入信號僅通過較少層次的線性或非線性處理來達到數(shù)據(jù)處理目的,對于基于高分辨率遙感圖像的沿海水質評價存在精度偏低、適用性差等問題。
近年來,人工智能技術飛速發(fā)展,在圖像理解領域以深度學習尤為突出,其中卷積神經網絡極具代表性。它是一種帶有卷積結構的深度神經網絡,卷積結構可減少深層網絡占用的內存量,也可減少網絡參數(shù)個數(shù),緩解模型的過擬合問題[9]。因此,本文針對沿海水體遙感圖像數(shù)據(jù),提出基于卷積神經網絡的水質綜合評價方法。該方法引入沿海水質評價相關先驗知識,并結合遙感圖像數(shù)據(jù)形成多模態(tài)三維矩陣輸入數(shù)據(jù),以進行卷積神經網絡訓練與評價,有效實現(xiàn)沿海水質的分類識別,為相關部門快速提供準確的決策依據(jù),保護海洋環(huán)境,促進社會健康和諧發(fā)展。
沿海水質評價技術框架如圖1所示,在水質評價前,需對卷積神經網絡進行樣本訓練。訓練集由沿海水質評價知識集、沿海衛(wèi)星遙感圖像數(shù)據(jù)和實測的沿海水質數(shù)據(jù)組成。其中以衛(wèi)星遙感圖像數(shù)據(jù)和沿海水質評價知識集為輸入樣本,以實測的沿海水質數(shù)據(jù)為目標樣本。在沿海水質評價過程中,將衛(wèi)星觀測的遙感圖像數(shù)據(jù)和水質評價知識數(shù)據(jù)作為輸入數(shù)據(jù)集,利用訓練好的卷積神經網絡進行分類識別,最終實現(xiàn)沿海水質的評價與分類。根據(jù)《中華人民共和國國家標準海水水質標準》(GB3097-1997),海洋水質分為Ⅰ類、Ⅱ類、Ⅲ類和Ⅳ類[10],對于劣于第Ⅳ類的水質,根據(jù)文獻[1]將其分為劣Ⅳ類。因此在訓練及識別過程中,以上述級別的分類標準作為沿海水質評價標準指標,實現(xiàn)沿海水質的分類處理。
圖1 沿海水質監(jiān)測評價技術框架
2.1沿海水質遙感圖像校正
由于受到遙感器自身特性、大氣折射、地球自轉和成像方式等因素的影響,衛(wèi)星遙感采集的影像存在一定的數(shù)據(jù)失真與幾何畸變現(xiàn)象,這必然影響后期影像處理質量和應用效果。為消除此類幾何差異,必須對遙感圖像進行校正。通常衛(wèi)星遙感圖像已經過大氣校正、幾何校準、輻射定標等預處理[11],如幾何畸變校正、圖像均衡化、空間濾波等,但仍然存在精度低的問題,較難準確反映沿海水質狀況,需進一步進行圖像校正。本文根據(jù)沿海水質觀測圖像的特征以及其與實際測量數(shù)據(jù)間的關系,建立基于遙感圖像變換的非線性回歸模型,確定輸入和輸出的映射關系,以實現(xiàn)衛(wèi)星遙感圖像的校正。
設在原始遙感圖像中任一點表示為,對應像素值為,為圖像中某像素點的值計算函數(shù)。校正過程中,經過映射函數(shù)作用后形成校正后的遙感圖像,其任一點可表示為,對應的像素值為,則
2.2卷積神經網絡
卷積神經網絡是多層感知器的一個變種模型,一般由卷積層、池化層、全連接層和輸出層組成。它通過卷積來模擬特征區(qū)分,并通過卷積的權值共享及池化操作,來降低神經網絡參數(shù)的數(shù)量級,最終通過傳統(tǒng)神經網絡完成識別與分類。
2.2.1 卷積層
卷積層將不同的卷積核分別與上一層的所有特征圖進行卷積求和,加上偏置,再通過修正線性單元激活函數(shù)作用,形成當前層的輸出神經元。運算公式為
2.2.2池化層
池化層即下采樣層,依據(jù)一定的池化規(guī)則對特征圖進行下采樣。主要作用有:1) 對輸出的特征圖降維;2) 在一定程度上保持卷積層輸出特征的不變性(含旋轉、平移、縮放等)。計算式為
2.2.3全連接層
模型的最后一層隱含層即為全連接層,該層將池化后的特征圖轉化為一維特征,其輸出計算式為
2.2.4輸出層
輸出層為soft-max,它是一種多類型分類器,用來預測各類的輸出概率,其表達式為
2.3 卷積神經網絡結構設計與訓練過程
為準確實現(xiàn)沿海水質評價與分類,本文設計一種用于沿海水質評價的卷積神經網絡,由9層組成。輸入層是由D0、D1、TM1、TM2和TM3層疊組成的三維矩陣數(shù)據(jù)(具體參考3.2節(jié));C1、C3、C5三層為卷積層;S2、S4、S6三層為每層對應連接的最大池化層;F7為神經網絡的全連接層;soft-max層用來輸出遙感圖像對應的各類水質等級概率,其結構如圖2所示。
圖2 卷積神經網絡結構
在對衛(wèi)星遙感圖像進行海洋水質評價前,需對卷積神經網絡模型進行訓練。卷積神經網絡屬于監(jiān)督學習方式,訓練前需要進行樣本標記。利用實測樣本結果對對應的遙感圖像進行標記,并隨機初始化所有權重,然后進行前向傳播。即從樣本集中取一個樣本,將輸入至卷積神經網絡,并計算相應實際輸出;再計算實際輸出與相應實際樣本標簽的差異,按極小化誤差的方法反向傳播調整權矩陣。
3.1 樣本數(shù)據(jù)獲取
以廣東省沿海海域為實驗分析區(qū)域,實驗數(shù)據(jù)來自與實際觀測同期(2015年)的具有8個光譜波段LANDSAT 7 ETM+衛(wèi)星的遙感圖像數(shù)據(jù)集,選取對沿海水質特征反應良好的TM1(藍波段)、TM2(綠波段)、TM3(紅波段)3個波段遙感圖像進行水質評價,其中藍、綠波段對葉綠素及色素反應敏感,且有助于提取水體透明度及水深等水下特征信息,紅波段對水中懸浮泥沙反應敏感。采集的樣本數(shù)據(jù)主要分布在珠江口海域、汕頭港和湛江港海域,少數(shù)分布在其他沿海海域,如圖3所示。
圖3 測試樣本分布圖
3.2 實驗過程
實驗過程如圖1所述。首先,采用非線性回歸校正模型對TM1、TM2、TM3波段遙感圖像進行校正;然后,對沿海水質評價先驗知識進行編碼,并結合遙感圖像與實測目標數(shù)據(jù)形成訓練樣本,并對卷積神經網絡進行訓練;最后,基于訓練后的卷積神經網絡,以遙感圖像測試數(shù)據(jù)和沿海水質評價知識作為測試樣本集對測試點水質進行評價。
輸入數(shù)據(jù)主要包含沿海水質評價先驗知識和遙感圖像數(shù)據(jù),其中沿海水質評價先驗知識包含2類數(shù)據(jù):1) 沿海水質的地理分布與海底深度的先驗知識,對其進行編碼(如陸地標記為0,海灣區(qū)標記為1,沿海淺水區(qū)標記為2,沿海深水區(qū)標記為3)形成編碼模板D0(128×128);2) 通過對遙感圖像所對應的假彩色合成圖像進行解譯[6]而獲得的沿海水質分類數(shù)據(jù),如圖4所示,得到廣東沿海的水質類別的預估劃分,如黑色部分代表水質較差區(qū)域(標記為3)、淺黑色部分代表水質一般區(qū)域(標記為2)、灰色區(qū)域代表水質較好區(qū)域(標記為1),對其進行編碼形成編碼模板D1(128×128)。遙感圖像數(shù)據(jù)主要有藍波段遙感數(shù)據(jù)TM1、綠波段遙感數(shù)據(jù)TM2和紅波段遙感數(shù)據(jù)TM3,由于原始圖像覆蓋范圍大且分辨率高,故將其劃分成128×128圖像序列,與采樣點對應進行依次訓練與評價。綜上所述,輸入數(shù)據(jù)是由D0、D1、TM1、TM2和TM3層疊組成的三維矩陣數(shù)據(jù)(128×128×11),涵蓋水質評價的先驗數(shù)據(jù)與水質評價關鍵波段遙感圖像等絕大部分特征信息。通過三維卷積自動提取各模態(tài)數(shù)據(jù)間的特征信息與差異,有助于提升沿海水質評價準確率。訓練過程中的實測目標數(shù)據(jù)為2015年各船舶航次觀測數(shù)據(jù)的處理結果。
圖4 廣東沿海水質等級預估劃分
實驗基于遙感圖像處理軟件ERDAS9.0的c toolkit二次開發(fā)庫,并結合賈揚清的開源快速深度學習框架caffe[14]進行實驗測試,共生成500組訓練樣本,其中Ⅰ類100組、Ⅱ類100組、Ⅲ類100組、Ⅳ類100組和劣Ⅳ類100組,最后隨機挑選16個測試集進行水質評價測試。
3.3 結果分析
由式(5)可知,卷積神經網絡輸出層輸出當前測試樣本在各類水質等級中的概率,取最大值對應等級為沿海水質評價結果,所有測試樣本的預測結果如表1所示。結合圖3可知,實測數(shù)據(jù)與預測數(shù)據(jù)均顯示Ⅳ類與劣Ⅳ類水質主要分布在珠江口海域,Ⅲ類與Ⅳ類水質主要分布在汕頭港、湛江港局部海域,其他沿海海域均為Ⅰ類與Ⅱ類海水水質。以實測數(shù)據(jù)為評價標準,預測結果準確率為93.75%。相比傳統(tǒng)方法,本文方法通過卷積操作較好地處理遙感圖像與水質參數(shù)間的復雜非線性關系,有效修正遙感反演參數(shù)與實測數(shù)據(jù)間的誤差,較準確地實現(xiàn)沿海水質的分類。
表1 廣東沿海水質實驗數(shù)據(jù)分析表
本文針對現(xiàn)有沿海水質評價技術存在實時性差、準確度較低等問題,以衛(wèi)星遙感圖像為原始數(shù)據(jù),提出了一種基于卷積神經網絡的沿海水質評價方法。針對遙感圖像校正建立基于遙感圖像變換的非線性回歸模型,實現(xiàn)遙感圖像的精確校正;將水質相關知識與遙感數(shù)據(jù)作為卷積神經網絡的初始輸入數(shù)據(jù),通過多層卷積與池化操作,保持對遙感圖像平移、縮放、傾斜等變換的高度不變性,且通過共享權值減少訓練參數(shù),在一定程度上簡化了網絡結構,對高分辨率沿海遙感圖像的實時處理與水質分類有較好的適用性。通過試驗驗證,該方法可較準確地實現(xiàn)沿海水質評價,具有一定的實用價值。但仍存在不足,如輸入數(shù)據(jù)維度過大,其訓練過程特征參數(shù)多。后續(xù)可優(yōu)化輸入數(shù)據(jù)或通過采用并行網絡結構來降低訓練復雜度。
[1] 廣東省海洋與漁業(yè)局.2015年廣東省海洋環(huán)境狀況公報[R]. 海洋環(huán)境公報,2016.6.15.
[2] 李雪,劉長發(fā),朱學慧,等.基于BP人工神經網絡的海水水質綜合評價[J].海洋通報,2010,29(2):225-230.
[3] 刁美娜,溫小虎,劉有剛,等.基于模糊神經網絡的海水水質綜合評價[J].海洋通報,2012,31(2):228-232.
[4] 賴清,衷衛(wèi)聲,熊鵬文,等.基于BP神經網絡與多分類支持向量機的水質識別與分類[J].南昌大學學報(理科版),2016,40(6):563-566,574.
[5] 蘇彩紅,向娜,陳廣義,等.基于人工蜂群算法與BP神經網絡的水質評價模型[J].環(huán)境工程學報,2012,6(2):699-704.
[6] 石愛業(yè),徐立中,楊先一,等.基于知識和遙感圖像的神經網絡水質反演模型[J].中國圖象圖形學報,2006,11(4):521-528.
[7] 張春桂,曾銀東,馬治國.基于模糊評價的福建沿海水質衛(wèi)星遙感監(jiān)測模型[J].應用氣象學報,2016,27(1):112-122.
[8] 劉敏,李海濤,顧海燕,等.WorldView-2高分辨率衛(wèi)星影像面向對象分類[C].第十八屆中國遙感大會,2012:123-129.
[9] 常亮,鄧小明,周明全,等.圖像理解中的卷積神經網絡[J].自動化學報,2016,42(9):1300-1312.
[10] 國家環(huán)境保護局. GB 3097-1997 海水水質標準[S].北京:中國環(huán)境科學出版社,2004.
[11] 于小林.環(huán)境遙感監(jiān)測系統(tǒng)的水質監(jiān)測圖校正算法研究[D].長沙:湖南大學,2010.
[12] 楊衛(wèi)鋒,曾芳玲,王強.非線性回歸模型參數(shù)估計的區(qū)間分析方法[J].電子信息對抗技術,2009,24(6):40-44.
[13] Krizhevsky A, Sutskever I, Hinton G E. Image Net classi?cation with deep convolutional neural networks[J]. In: Proceedings of Advances in Neural Information Processing Systems 25. Lake Tahoe, Nevada, USA: Curran Associates, Inc.,2012, 1097?1105.
[14] Caffe, a deep learning framework developed by Berkeley AI Research (BAIR) and by community contributors[DB/OL]. http://caffe.berkeleyvision.org/.
Research of Coastal Water Quality Evaluation Technology Based on Convolutional Neural Network
Zheng Youliang
(Guangdong Science & Technology Infrastructure Center)
Aim Aiming at the evaluation of coastal water quality,using the real-time and large-scale advantage of remote sensing image acquisition, a comprehensive evaluation method of coastal water quality based on convolutional neural network is proposed. The satellite remote sensing image are corrected by applying nonlinear regression model, and the coastal water quality evaluation model based on convolutional neural network is established. The multimode matrix input data is formed by Adding the prior knowledge of water quality evaluation and combining the remote sensing image, and through the multi-layer convolution and pooling operation, it reduce the error caused by the image translation, scaling, tilting and so on, and improve the water quality evaluation accuracy. The experimental results show that the method can accurately evaluate the coastal water quality and has a practical value.
Evaluation of Coastal Water Quality; Remote Sensing Image; Convolutional Neural Network
鄭友亮,男,1985年生,本科,工程師,主要研究方向:計算機技術及應用、科技項目管理。E-mail: ylzheng2008@qq.com
廣東省科技計劃項目(2013B030200002,2016A020222016)