姚晨明,姚磊
(長(zhǎng)江重慶航道工程局,重慶 400010)
航道的船舶適航水深的維護(hù)需要對(duì)口門浮泥進(jìn)行清淤,但是這些浮泥受潮波流影響堆積位置是不斷變化的,需要從清淤和適航水深兩個(gè)方面入手,歷史的疏浚數(shù)據(jù)包含了疏浚數(shù)據(jù)的變化特征,預(yù)測(cè)口門段清淤時(shí)機(jī)及清淤部位對(duì)于保證航道的通航能力,以合理調(diào)配清淤船舶和時(shí)段,節(jié)約工程成本有著重要的工程意義。
港口的疏浚數(shù)據(jù)特征具有一定的規(guī)律性,根據(jù)施工日?qǐng)?bào)表的數(shù)據(jù)項(xiàng),及現(xiàn)場(chǎng)施工的經(jīng)驗(yàn)判斷,對(duì)于主航道和回淤嚴(yán)重的口門區(qū)域會(huì)進(jìn)行周期性疏浚,疏浚工作涉及接移管線的操作,船舶在相隔工作日期內(nèi)不會(huì)有較大的位置變化,開挖標(biāo)高也在一定的范圍內(nèi)變動(dòng),本研究的目標(biāo)即根據(jù)歷史清淤記錄進(jìn)行未來的疏浚地點(diǎn)預(yù)測(cè)及提醒。
因疏浚工作的周期性及規(guī)律性,潮汐等水文環(huán)境、泥沙淤積也具有季節(jié)性和周期性,具有時(shí)序特征,因此采用時(shí)間序列模型進(jìn)行數(shù)據(jù)預(yù)測(cè),預(yù)測(cè)目標(biāo)為經(jīng)緯度和開挖標(biāo)高。本研究選擇擅長(zhǎng)提取時(shí)序特征的長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM(Long Short Term Memory)模型進(jìn)行預(yù)測(cè)任務(wù)。本技術(shù)的研究依托于鹽城港濱海港區(qū)中電投煤炭碼頭疏浚工程,以施工日?qǐng)?bào)表提取的數(shù)據(jù)作為數(shù)據(jù)集,利用前一天或幾天的零點(diǎn)坐標(biāo)、開挖標(biāo)高數(shù)據(jù)預(yù)測(cè)下一個(gè)(當(dāng)前)時(shí)刻的對(duì)應(yīng)數(shù)據(jù)。采用時(shí)間序列模型,經(jīng)緯度和開挖標(biāo)高作為輸入項(xiàng),
根據(jù)調(diào)研結(jié)果,本研究可獲得的數(shù)據(jù)主要是施工日?qǐng)?bào)表和相關(guān)CAD 文件,因此本研究分析主要依托施工日?qǐng)?bào)表、施工進(jìn)度圖來獲取原始數(shù)據(jù)??紤]到需要根據(jù)歷史的數(shù)據(jù)來預(yù)測(cè)當(dāng)下時(shí)刻的值,因此可以將這個(gè)任務(wù)視作監(jiān)督學(xué)習(xí)問題并對(duì)輸入變量進(jìn)行歸一化處理。考慮歷史數(shù)據(jù)表示上一個(gè)時(shí)間段的經(jīng)緯度位置和開挖標(biāo)高,所以在數(shù)據(jù)的使用方式上本研究用t-5,t-4,t-3,t-2,t-1,t次的施工數(shù)據(jù)通過模型進(jìn)行特征分析和提取,然后對(duì)輸出的t+1 結(jié)果與其真實(shí)數(shù)據(jù)進(jìn)行對(duì)比來分析誤差。數(shù)據(jù)的分布形式如圖1所示。
圖1 數(shù)據(jù)集樣本示例
由于初始數(shù)據(jù)中存在一些異常數(shù)據(jù)和缺失數(shù)據(jù),因此需要進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行清洗以確保數(shù)據(jù)的合理性。在選取全部施工日?qǐng)?bào)字段后,獲得2018年10月13日-2022年1月31日區(qū)間有效的數(shù)據(jù)共639 條,因部分?jǐn)?shù)據(jù)存在多個(gè)零點(diǎn)坐標(biāo)和開挖標(biāo)高的情況,經(jīng)過分析處理后形成1438 條數(shù)據(jù)。對(duì)于異常值處理,異常值集中在施工時(shí)間、零點(diǎn)坐標(biāo)、浚前標(biāo)高、開挖標(biāo)高字段,當(dāng)出現(xiàn)多個(gè)值的情況,標(biāo)點(diǎn)括號(hào)半角全角混用的問題,全部分割后再做處理。由于數(shù)據(jù)庫端浚前標(biāo)高、開挖標(biāo)高錄入多值情況,所以數(shù)據(jù)拆分為多獨(dú)立值處理。對(duì)于缺失值處理,刪除缺失值較多的數(shù)據(jù),并清理冗余數(shù)據(jù),這里采用KNN 方法和中值插值方法對(duì)數(shù)據(jù)進(jìn)行填充,對(duì)比后發(fā)現(xiàn)中值插值方法進(jìn)行浚前標(biāo)高和開挖標(biāo)高的數(shù)據(jù)填充。剔除異常值以及填充缺失值之后,處理后的數(shù)據(jù)分布如圖2所示,港池區(qū)域數(shù)據(jù)集中度符合預(yù)期,便可進(jìn)行下一步的模型訓(xùn)練。
圖2 數(shù)據(jù)清洗后的分布
在網(wǎng)絡(luò)結(jié)構(gòu)方面,本文設(shè)計(jì)了一個(gè)三層的LSTM 網(wǎng)絡(luò),如圖3所示,其結(jié)構(gòu)基于python 的keras 框架,分別由LSTM 層,dropout 層,dense 層以及activation 層依次構(gòu)成。數(shù)據(jù)維度從初始的時(shí)序的240 維度降維為最終的時(shí)刻的3 維輸出,也就是利用前15 天經(jīng)緯度坐標(biāo)和開挖標(biāo)高數(shù)據(jù)預(yù)測(cè)下一個(gè)(當(dāng)前)時(shí)刻的對(duì)應(yīng)數(shù)據(jù)。
圖3 網(wǎng)絡(luò)模型結(jié)構(gòu)
模型搭建完后,對(duì)于網(wǎng)絡(luò)的訓(xùn)練過程所涉及參數(shù)的調(diào)整,確定網(wǎng)絡(luò)模型的激活函數(shù)為relu 函數(shù)。每一層網(wǎng)絡(luò)節(jié)點(diǎn)的舍棄率默認(rèn)值設(shè)定為0.3。對(duì)于訓(xùn)練的誤差計(jì)算方式使用均方誤差(mean squared error)。網(wǎng)絡(luò)參數(shù)的迭代更新方式采用RMSprop(Root Mean Square propagation)算法。權(quán)衡實(shí)驗(yàn)環(huán)境的內(nèi)存效率和內(nèi)存容量后,本文設(shè)置模型訓(xùn)練的輪次數(shù)為1000,數(shù)據(jù)批次數(shù)為64。
接著進(jìn)一步開始在數(shù)據(jù)集基礎(chǔ)上對(duì)模型進(jìn)行訓(xùn)練,由于訓(xùn)練時(shí)輸入LSTM 網(wǎng)絡(luò)的數(shù)據(jù)維度關(guān)系到LSTM 層的參數(shù),本文以15 個(gè)時(shí)間節(jié)點(diǎn)所對(duì)應(yīng)的特征數(shù)據(jù)作為輸入預(yù)測(cè)后續(xù)1 個(gè)時(shí)間點(diǎn)。訓(xùn)練過程的中的損失函數(shù)值變化曲線如圖4(a)所示,模型驗(yàn)證集的在1000 輪次內(nèi)達(dá)到收斂,訓(xùn)練集的函數(shù)值穩(wěn)定在0.0008 附近,這表明模型訓(xùn)練達(dá)到預(yù)期效果。
當(dāng)模型訓(xùn)練采用經(jīng)度、緯度、開挖標(biāo)高3 個(gè)維度數(shù)據(jù)作為輸入時(shí),對(duì)應(yīng)的模型測(cè)試準(zhǔn)確率為96.13%,這表明本研究提出的方法能夠?qū)崿F(xiàn)在歷史疏浚數(shù)據(jù)上進(jìn)行較高精度的疏浚標(biāo)高參數(shù)的預(yù)測(cè)。在項(xiàng)目實(shí)際應(yīng)用過程中,為達(dá)到更長(zhǎng)時(shí)間的預(yù)測(cè)效果,當(dāng)采用預(yù)測(cè)6 個(gè)后續(xù)時(shí)刻坐標(biāo)和標(biāo)高方式來訓(xùn)練模型時(shí),其預(yù)測(cè)值和真實(shí)值的誤差值在0.0011 附近,如圖4(b)所示,實(shí)現(xiàn)了更長(zhǎng)時(shí)刻的預(yù)測(cè)應(yīng)用效果。此外,本文將預(yù)測(cè)數(shù)值在GIS系統(tǒng)中可視化顯示,其效果如圖5所示,實(shí)現(xiàn)了較好的應(yīng)用效果。
圖4 模型訓(xùn)練過程指標(biāo)曲線
圖5 預(yù)測(cè)位置GIS 平臺(tái)展示
本研究通過對(duì)疏浚數(shù)據(jù)收集和清洗做成數(shù)據(jù)集,構(gòu)建了LSTM 網(wǎng)絡(luò)模型后,模型的訓(xùn)練誤差降到了0.0008,這模型能夠充分提取分析歷史疏浚數(shù)據(jù)的時(shí)序特征,并在此基礎(chǔ)上通過歷史時(shí)刻的數(shù)據(jù)預(yù)測(cè)當(dāng)前時(shí)刻的疏浚位置和標(biāo)高,實(shí)現(xiàn)了96%的預(yù)測(cè)準(zhǔn)確率,這對(duì)于港區(qū)疏浚施工參數(shù)預(yù)測(cè)有著較好的應(yīng)用價(jià)值。