□龔 亮
(河南省巖石礦物測試中心)
深度學習的計算模型由多個處理層組成,通過訓練可學習多個抽象層次上的數據特征,它代表了當前人工智能研究的主流趨勢,在計算機視覺和機器學習等領域帶來技術層面上的革新。
與傳統(tǒng)的機器學習相比,深度學習具有以下優(yōu)勢:模型結構立體縱深,多層的隱層節(jié)點使模型內部的訓練過程更加復雜精密;數據特征抽象提取,經過多層神經網絡的特征變換,將數據的特征表示逐漸抽象到另一個新的特征空間,通過此方法模擬人腦的學習過程。在深度學習的實現過程中,建立多層神經網絡結構,確定合適的計算節(jié)點,通過逐層迭代訓練,即可建立輸入層到輸出層的函數關系。在調整好模型結構及相關參數后,可實現模型對現實數據的有效模擬,從而大大減小工作量與時間成本,對復雜事務實現自動化管理。
基于此,文章綜合國內外相關研究,介紹了深度學習的基本概念與原理,從水文預報、水庫調度以及遙感圖像分類三個方面闡述深度學習在水文中的應用現狀。最后,指出深度學習在水文中的應用中存在數據稀缺性、原理可解釋性以及參數選擇等方面的不足之處,對未來研究趨勢進行分析,以指導深度學習在水文應用中的進一步發(fā)展。
水文預報中采用的模型方法主要有三類:物理模型、概念模型以及黑箱模型,前兩者的建立要求掌握水文過程的原理,但由于水文現象的規(guī)律十分復雜,且許多參數難以獲取,所以很難有較好的模擬效果。此時,基于數據驅動的黑箱模型便顯露其優(yōu)勢,只要建立合適的模型,輸入足夠多的數據,即可得出準確度很高的模擬結果。
作為黑箱模型的一種,深度學習方法近年來才開始運用到水文預報中。目前相關研究不多,主要可總結為降水預測、水庫來水預測以及降雨徑流模擬三個方面。前兩者是對一個水文因素的數據序列進行分析,而后者需要學習兩個水文因素之間的相關關系,輸入長序列的數據后,通過模型內部逐層學習,即可較好地延展水文序列,以實現水文工作的需要。研究表明,多種基于深度學習方法的計算模型均可適用于水文預報領域,如:長短期記憶神經網絡(LSTM)以及深層回聲狀態(tài)網絡(DeepESN)、卷積長短期記憶神經網絡(ConvLSTM)等。同時,也有研究將深度學習方法進行改進,創(chuàng)造出更適合水文預報的獨特方法。2016 年Yun Bai 等提出了一種基于混合模型的多尺度深層特征學習(MDFL)方法來處理水庫日入庫量預測問題。首先提取數據的多尺度(趨勢、周期和隨機)特征,然后分別用三個深信度網絡(DBNs)表示每個DBN的權值,將其應用于初始化神經網絡(D-NN)。最后,對三個尺度的D-NNs的輸出進行重構,采用混合模型對三峽水庫2000—2012 年的歷史日入庫序列進行了研究,證明該模型的效優(yōu)于傳統(tǒng)模型。該方法將深度學習的框架與多尺度、混合觀測相結合,有利于探索水庫入庫預報的復雜性質,為水庫調度提供數據支持。但深度學習方法對水文預報的數據量及連續(xù)性有一定的要求,數據量不足或水文條件改變都會影響水文預報的效果。
水庫調度是受到多個變量、多重約束所影響的復雜問題,涉及時間尺度、降雨、農業(yè)灌溉等自然條件以及洪水調峰等人類需求等多個具有不確定性的因素。因此,基于運行規(guī)則的物理模型難以準確模擬水庫運行過程以及預測水庫出流。隨著大數據挖掘技術的發(fā)展,數據驅動的人工智能模型已成功推廣到水庫調度領域。人工智能模型能夠從大量的水文數據和實時的水庫運行數據中自動學習水庫運行規(guī)律,但傳統(tǒng)模型仍存在著特征提取能力弱、耗時較長等缺點。
近年來,深度學習作為計算機科技前沿,在解決調度問題方面積累了一些成功的經驗。目前,深度學習方法在水庫調度中的應用研究較少,主要有貝葉斯深度學習模型、LSTM模型、卷積LSTM 模型等。關于水庫調度的研究主要集中于深度學習方法與傳統(tǒng)人工智能模型的對比,深入分析深度學習方法的優(yōu)勢所在。例如:Zhang D等將3個人工智能模型進行對比,即反向傳播(BP)神經網絡,支持向量回歸(SVR)技術,長短期記憶(LSTM)模型,基于約30 a 的歷史水庫運行記錄模擬水庫操作,以探討LSTM 模型在水庫運行模擬中的適用性。結果表明,LSTM模型能夠有效地降低其他人工智能模型所需的時間消耗和內存存儲量,并具有良好的模擬低流量工況和高峰運行期流量曲線的能力。深度學習方法在水庫調度方面的優(yōu)勢已經顯現,但入庫水量的不確定性對模型精度的影響亟待驗證。對此,Liu Y Q 等提出了一種同時考慮模型參數不確定性和來水不確定性的貝葉斯深度學習方法。在該模型中,采用蒙特卡羅積分將入流概率的復積分轉化為求和形式,利用變分推理得到模型參數的后驗分布。該方法在長江三峽工程中得到了實際應用,結果表明,此種貝葉斯深度學習方法在水電發(fā)電量和均方根誤差方面均優(yōu)于其他比較方法,在考慮入流不確定性時,該方法具有更強的優(yōu)勢。與傳統(tǒng)方法相比,深度學習方法在水庫調度應用中可以很好地解決不確定性以及條件多變等問題,優(yōu)勢顯著。但目前在水庫調度中的應用并不廣泛,仍需進行更多相關研究,將深度學習方法與水庫調度特點更好地融合。
提取水體信息以及流域下墊面信息是水文流域調查必不可少的一個環(huán)節(jié),可為流域水文模擬、生態(tài)環(huán)境評估等提供基礎資料。為了保證效果最優(yōu),遙感影像的分類需要盡量精確。傳統(tǒng)的遙感影像分類方法有基于貝葉斯的最大似然法、最小距離法等,但這些傳統(tǒng)方法分類精度不高,可能會出現錯分、漏分的現象。隨著技術的發(fā)展,人工智能方法開始得到廣泛應用,如:人工神經網絡分類方法,此類方法的效果雖然較傳統(tǒng)方法有所提升,但仍有較大的改進空間。
近年來,隨著深度學習方法的普及,其在遙感影像分類方法的應用研究也逐漸增多。在水體識別提取方面,深度學習以其在特征提取方面的優(yōu)勢開辟了新的思路,不再受到傳統(tǒng)方法如單波段閾值法及水體指數法等需要通過多次實驗確定閾值的局限。杜敬將深度卷積神經網絡模型運用到無人機遙感影像水體識別中,得到的結果表明識別準確度高達95.36%,優(yōu)于傳統(tǒng)的向量機法、面向對象法。許多基于深度學習的新方法被提出,如:基于堆疊自動編碼器的水體提取模型,基于卷積神經網絡和logistic 回歸分類器的多光譜數據水體提取方法,這些新方法準確性的優(yōu)勢均得到了驗證。在長序列土地利用分類方面,深度學習方法的應用也帶來了突破。Wang HY等將雙向長短期記憶網絡(Bi LSTM)模型與長時間序列的土地利用分類數據相結合,得到了總體精度為84.20%的分類結果,為建立高分辨率長時間序列土地覆蓋分類產品提供了新思路。但基于遙感圖像制作標簽數據的過程較為復雜,而目前的監(jiān)督訓練方法有需要大量的標簽數據,導致工作量較大。此外,影像分類的結果也會受到遙感數據的預處理和標準化處理的方式的影響,更穩(wěn)定高效的分類方法有待研究。
3.1.1 數據稀缺性問題
深度學習屬于數據驅動技術,需要大量數據進行訓練,且足夠的數據量才能保證模型的精度。但基礎的水文資料在很多地區(qū)難以獲得,傳統(tǒng)的人工搜集標簽數據的方法產生較高的人力物力成本。因此,數據的自動采集傳輸是亟待突破的難關,基于部分標簽的無監(jiān)督的深度學習方法有待進一步研究。
3.1.2 原理可解釋性問題
深度學習方法建立基于數據的黑箱模型,缺乏具體的物理原理及過程機理作為支撐。而自然界中的水文過程十分復雜,使用黑箱模型可能會導致模擬精度不夠以及難以使人信服等問題。因此,深度學習方法需要與水文原理進行有機結合,創(chuàng)造出更具有水文色彩的更有效的模型。
3.1.3 參數選擇問題
選擇模型訓練參數也是深度學習方法面臨的一個關鍵問題,比如:隱層層數、卷積核大小、優(yōu)化函數的設定等。由于現階段對于深度學習方法的工作原理認識不夠,只能依靠研究人員的經驗與反復試驗確定訓練參數。因此,探究訓練參數與訓練結果之間的規(guī)律是十分必要的,由此可以針對具體的水文情景創(chuàng)建專屬的參數設置體系。
近年來,深度學習在水文中的應用廣泛,給水文預報、水庫調度以及遙感圖像分類等諸多領域帶來了深刻變革。多年研究逐漸發(fā)展出將LSTM模型、卷積LSTM模型、深度卷積神經網絡模型等深度學習方法運用到水文領域的成功經驗。實踐證明深度學習方法在特征提取和模擬優(yōu)化方面的優(yōu)勢是物理方法及傳統(tǒng)機器學習方法無可比擬的,值得進一步研究與發(fā)展。
基于目前深度學習技術存在的數據稀缺、原理難以解釋以及參數選擇困難等問題,已經逐漸發(fā)展出元學習、小樣本深度學習、神經網絡構架搜索、深度遷移學習等深度學習技術的分支。有理由相信,越來越多的研究將會帶領深度學習方法與水文領域更好的融合互通,創(chuàng)造出更有效的數據分析以及模型建立技術,為水文領域注入新的發(fā)展活力。