李 娜, 劉 強(qiáng), 張 淼, 張崇進(jìn), 張 帆,2b, 李 昊
(1.國(guó)能黃驊港務(wù)有限責(zé)任公司,河北 滄州 061000;2.中國(guó)礦業(yè)大學(xué)(北京)a.機(jī)電與信息工程學(xué)院;b.智慧礦山與機(jī)器人研究院,北京 100083)
煤堆揚(yáng)塵跟處理粉塵的含煤污水一直是煤炭港口環(huán)保治理的難點(diǎn)。如何做好煤炭港口的粉塵治理和含煤污水處理,提高清潔生產(chǎn)水平,促進(jìn)港口綠色健康發(fā)展,已成為煤炭港口發(fā)展必須解決的問(wèn)題之一。露天堆場(chǎng)的粉塵來(lái)源一般由兩部分組成:一是煤垛處于靜止?fàn)顟B(tài)下由風(fēng)蝕作用而造成的靜態(tài)揚(yáng)塵;二是煤炭處于裝卸、中轉(zhuǎn)等作業(yè)模式下產(chǎn)生的動(dòng)態(tài)起塵[1]。研究表明,由于以上原因引起的煤堆起塵和灑水降塵產(chǎn)生的含煤污水是造成港口污染的主要來(lái)源。為了解決上述問(wèn)題,目前港口在堆場(chǎng)煤塵治理方面采取了一些基本措施,但這些傳統(tǒng)的抑塵方式,無(wú)法從根本上解決揚(yáng)塵污染防治的問(wèn)題。
國(guó)外較早重視港口的綠色發(fā)展,并取得了階段性成果[2]。我國(guó)綠色生態(tài)港口建設(shè)開始較晚[3],國(guó)內(nèi)煤炭港口主要采取堆場(chǎng)噴槍灑水、堆場(chǎng)防風(fēng)網(wǎng)和單機(jī)灑水等措施控制煤塵,采取“哪里起塵哪里灑水”的思路,在翻車、皮帶、堆場(chǎng)等各個(gè)環(huán)節(jié)進(jìn)行灑水除塵。該方式不僅造成灑水除塵設(shè)備多、成本高、管理復(fù)雜等問(wèn)題,而且很難做到水與煤均勻混合,除塵效果一般。為了抑制港口靜置的煤堆揚(yáng)塵,需要對(duì)煤堆進(jìn)行灑水來(lái)抑制起塵。由于傳統(tǒng)的灑水方式是由人工控制,有經(jīng)驗(yàn)的工作人員憑借他們多年的工作經(jīng)驗(yàn)來(lái)判斷是否需要灑水,但是這種人工控制的方法經(jīng)常不夠精準(zhǔn)、智能,如果灑水過(guò)少會(huì)造成煤炭含水率過(guò)低,煤堆揚(yáng)塵;灑水過(guò)多會(huì)造成水資源浪費(fèi),而且會(huì)產(chǎn)生大量的含煤污水,造成二次污染,灑水過(guò)多或過(guò)少都會(huì)對(duì)環(huán)境造成污染,很難掌握一個(gè)度來(lái)使灑水既不會(huì)使煤堆起塵又不會(huì)產(chǎn)生過(guò)量含煤廢水。
本文以神華黃驊港為例,研究煤炭含水率變化的規(guī)律和智能灑水降塵的方法,旨在提高污染預(yù)防能力,改善港口環(huán)境質(zhì)量。
黃驊港智能灑水抑塵主要通過(guò)建立堆場(chǎng)含水率預(yù)測(cè)模型、堆場(chǎng)起塵預(yù)測(cè)模型和智能灑水模型,利用實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)智能灑水抑塵。其灑水抑塵分為三步:①通過(guò)從黃驊港露天堆場(chǎng)的粉塵監(jiān)測(cè)儀的數(shù)據(jù)庫(kù)中獲取露天堆場(chǎng)周圍的實(shí)時(shí)氣象數(shù)據(jù),然后測(cè)得堆場(chǎng)中煤堆表層初始的含水率,將氣象數(shù)據(jù)和初始含水率數(shù)據(jù)傳入建立好的數(shù)據(jù)模型中,預(yù)測(cè)出下一時(shí)刻煤堆的含水率。②將預(yù)測(cè)的下一時(shí)刻含水率的起動(dòng)風(fēng)速[4]與實(shí)時(shí)風(fēng)速對(duì)比,如果此時(shí)的實(shí)時(shí)風(fēng)速≥當(dāng)前含水率的起動(dòng)風(fēng)速,說(shuō)明當(dāng)前風(fēng)速會(huì)導(dǎo)致煤堆起塵,需要灑水,將數(shù)據(jù)反饋給現(xiàn)場(chǎng)的灑水系統(tǒng),灑水系統(tǒng)開始灑水抑塵。③通過(guò)灑水量計(jì)算出煤炭含水率變化,將變化后的含水率再當(dāng)作此時(shí)的含水率跟氣象數(shù)據(jù)一起輸入到模型中繼續(xù)預(yù)測(cè)下一時(shí)刻含水率。如此循環(huán),便可以自動(dòng)調(diào)節(jié)煤炭含水率,降低煤堆揚(yáng)塵量和污水量,達(dá)到智能灑水降塵的目的。堆場(chǎng)含水率預(yù)測(cè)與智能灑水抑塵的流程如圖1 所示。
圖1 含水率預(yù)測(cè)與智能灑水抑塵流程圖
智能灑水方案的制定關(guān)鍵在于煤炭含水率變化模型。露天堆場(chǎng)煤炭的含水率變化主要與氣象條件有關(guān),包括風(fēng)速、溫度、濕度、風(fēng)向等。這些氣象數(shù)據(jù)可以在粉塵監(jiān)測(cè)儀中直接獲取,所以研究的重點(diǎn)就是建立煤炭含水率和風(fēng)速、溫度、濕度、風(fēng)向之間的關(guān)系的模型,從而根據(jù)氣象數(shù)據(jù)來(lái)通過(guò)模型預(yù)測(cè)煤炭的含水率變化。由于煤炭含水率隨溫度、濕度、風(fēng)速、風(fēng)向等氣象歷史數(shù)據(jù)量的增加而不斷變化,傳統(tǒng)的預(yù)測(cè)方法復(fù)雜且計(jì)算耗時(shí),難以預(yù)測(cè)和推斷過(guò)去值和未來(lái)值之間的隨機(jī)依賴關(guān)系。但由于用來(lái)測(cè)量煤炭含水率而采取的煤炭樣本是固定時(shí)間間隔的,所以適合采用時(shí)間序列預(yù)測(cè)模型來(lái)對(duì)煤炭的含水率進(jìn)行預(yù)測(cè)處理。
時(shí)間序列預(yù)測(cè)(Time Series Forecasting,TSF)[5]是一種利用歷史數(shù)據(jù)預(yù)測(cè)給定序列的未來(lái)值的方法[6]。本文使用了一種LSTM 模型的深度學(xué)習(xí)方法,可以克服傳統(tǒng)預(yù)測(cè)模型的局限性,做出準(zhǔn)確的預(yù)測(cè)[7]。LSTM是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型[8]。圖2 為基于LSTM 狀態(tài)的計(jì)算模型[9]。
圖2 基于LSTM狀態(tài)的計(jì)算模型
LSTM有兩種傳遞狀態(tài),一種是ct(單元狀態(tài));另一種是ht(隱藏狀態(tài))。利用LSTM 的當(dāng)前輸入xt和前一狀態(tài)傳遞下來(lái)的輸入ht-1進(jìn)行拼接訓(xùn)練,得到狀態(tài)時(shí)步t的輸入門it、遺忘門ft、輸出門ot和候選記憶單元分別計(jì)算如下:
式中:W為權(quán)重參數(shù);b為偏差參數(shù)。
隱藏狀態(tài)下的信息流動(dòng)可由輸入門、遺忘門和輸出門控制,其元素范圍為[0,1]。當(dāng)前時(shí)間步長(zhǎng)t將前一個(gè)時(shí)間步長(zhǎng)記憶細(xì)胞的信息與當(dāng)前時(shí)間步長(zhǎng)候選記憶細(xì)胞的信息結(jié)合,通過(guò)遺忘門和輸入門控制信息流動(dòng):
遺忘門控制上一時(shí)間步長(zhǎng)的記憶單元ct-1中的信息是否被傳輸?shù)疆?dāng)前時(shí)間步長(zhǎng)ct的記憶單元,而輸入門控制當(dāng)前時(shí)間步長(zhǎng)的輸入xt通過(guò)候選記憶單元流入當(dāng)前時(shí)間步長(zhǎng)的記憶單元如果遺忘門總是約為1,而輸入門總是約為0,那么過(guò)去的記憶單元將總是存儲(chǔ)在時(shí)間中,并傳遞到當(dāng)前的時(shí)間步長(zhǎng)。因此,LSTM在設(shè)計(jì)架構(gòu)上解決了循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度衰減問(wèn)題,更好地捕捉了時(shí)間序列中時(shí)間步距的依賴性。
建立模型需要的數(shù)據(jù)包括氣象數(shù)據(jù)和煤炭含水率數(shù)據(jù)。黃驊港在每個(gè)堆場(chǎng)周圍都會(huì)有對(duì)應(yīng)的粉塵監(jiān)測(cè)儀,實(shí)時(shí)監(jiān)測(cè)天氣狀況和空氣質(zhì)量等數(shù)據(jù),并將數(shù)據(jù)存到數(shù)據(jù)庫(kù)中,所以溫度、濕度、風(fēng)速、風(fēng)向等氣象數(shù)據(jù)可以在數(shù)據(jù)庫(kù)中實(shí)時(shí)調(diào)用。煤炭含水率數(shù)據(jù)是通過(guò)堆場(chǎng)現(xiàn)場(chǎng)采樣,然后取定量的樣本放進(jìn)干燥機(jī)中干燥,直至煤炭恒重,然后通過(guò)干燥前后的重量變化計(jì)算出煤炭含水率,其含水率公式為
式中:M為煤炭含水率;m1為煤炭干燥前的質(zhì)量;m2為煤炭干燥后的質(zhì)量。
數(shù)據(jù)采樣以天為單位,每天從8:00 ~20:00 每小時(shí)采樣一次,每次采樣5 個(gè)不同的煤種,每天共65 個(gè)數(shù)據(jù)樣本。
根據(jù)上文中的LSTM 模型,本文構(gòu)建了一個(gè)預(yù)測(cè)煤炭含水率的深度學(xué)習(xí)算法框架。此深度學(xué)習(xí)模型的算法工作流程如下:
鋅是植物、動(dòng)物和人體必需的微量元素。植物缺鋅就表現(xiàn)為植株矮小、生長(zhǎng)受到抑制;人體缺鋅會(huì)引起許多疾病,如侏儒癥、糖尿病、高血壓等,但攝入過(guò)量的鋅也會(huì)有不利的影響[21]。
(1)數(shù)據(jù)預(yù)處理。獲取數(shù)據(jù)之后,由于含水率數(shù)據(jù)有可能測(cè)量錯(cuò)誤,所以畫出含水率數(shù)據(jù)的箱線圖,把箱線圖中的離群值當(dāng)作異常值剔除。然后由于煤堆作業(yè)等其他因素,會(huì)暫停采樣一次,這樣就會(huì)使數(shù)據(jù)缺少一個(gè)數(shù)據(jù)樣本,失去連續(xù)性,但是為了保證模型的準(zhǔn)確性,需要每天的數(shù)據(jù)盡可能的連續(xù),時(shí)間間隔相同,所以需要填充缺失值,本文使用的方法為插值法,取前后兩個(gè)時(shí)刻的含水率平均值作為缺失數(shù)據(jù)當(dāng)前時(shí)刻的含水率數(shù)據(jù)。預(yù)處理之后的部分?jǐn)?shù)據(jù)如表1 所示。
(2)數(shù)據(jù)標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化之后數(shù)據(jù)的分布趨向于正態(tài)分布,就不會(huì)因?yàn)楦鱾€(gè)數(shù)據(jù)不同的值域分布而對(duì)模型訓(xùn)練造成影響。這種方法基于原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化,
式中:μ為數(shù)據(jù)的均值;σ為數(shù)據(jù)的標(biāo)準(zhǔn)差。
表1 預(yù)處理后的數(shù)據(jù)
標(biāo)準(zhǔn)化后的部分?jǐn)?shù)據(jù)如表2 所示。
表2 標(biāo)準(zhǔn)化后的數(shù)據(jù)
(3)劃分?jǐn)?shù)據(jù)集。由于獲取的數(shù)據(jù)集是按天采樣的,所以把數(shù)據(jù)集以天為單位劃分為若干個(gè)序列,以天為單位隨機(jī)取出其中80%的數(shù)據(jù)作為訓(xùn)練集,剩下的20%作為測(cè)試集。
(1)本文使用均方誤差(Mean-Square Error,MSE)作為損失函數(shù),MSE 是衡量“平均誤差”的一種較方便的方法,MSE 可以評(píng)價(jià)數(shù)據(jù)的變化程度。均方誤差MSE:
式中:L為MSE 損失值;yt為樣本期望值為樣本預(yù)測(cè)值。
(2)優(yōu)化算法使用Adam (Adaptive moment estimation)[10]優(yōu)化算法,此優(yōu)化算法可以代替?zhèn)鹘y(tǒng)的隨機(jī)梯度下降法更有效的更新網(wǎng)絡(luò)權(quán)重。Adam 優(yōu)化算法公式:
式中:gt為梯度;β1為一階矩衰減系數(shù),一般取0.9;β2為二階矩衰減系數(shù),一般取0.999;mt為梯度gt的一階矩;vt為梯度gt的二階矩。
為了參數(shù)的正常更新,需要做如下的偏置矯正:
更新網(wǎng)絡(luò)權(quán)重參數(shù)的公式:
式中:θt為要更新的參數(shù);α 為學(xué)習(xí)率,默認(rèn)為0.001;ε為通常取10-8,防止分母為0。
(3)訓(xùn)練模型。經(jīng)過(guò)(1)~(4)步的準(zhǔn)備,可以開始訓(xùn)練模型。把處理好的訓(xùn)練集數(shù)據(jù)輸入到模型中,對(duì)模型進(jìn)行訓(xùn)練,通過(guò)不斷修改和調(diào)整學(xué)習(xí)率和隱含層神經(jīng)元個(gè)數(shù)使loss值收斂到一個(gè)較低的值。
(4)測(cè)試模型。神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的效果需要通過(guò)誤差大小來(lái)衡量,本文中采用平均絕對(duì)誤差MAE(Mean Absolute Deviation)、平均絕對(duì)誤差百分比MAPE(Mean Absolute Percentage Error)和決定系數(shù)R2(Coefficient of Determination)來(lái)對(duì)模型訓(xùn)練的效果做出定量的評(píng)價(jià):
模型訓(xùn)練完成之后,把測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的模型中進(jìn)行測(cè)試,通過(guò)模型輸出的預(yù)測(cè)值與真實(shí)值的比較,判斷模型訓(xùn)練的效果,預(yù)測(cè)值與真實(shí)值之間相差越小模型精確度越高。
(5)優(yōu)化模型。為了提高模型的準(zhǔn)確性,需要對(duì)模型的學(xué)習(xí)率和權(quán)重等各個(gè)參數(shù)進(jìn)行不斷地調(diào)整,并可以使用L1正則化、L2正則化[11]、Dropout 等來(lái)防止過(guò)擬合。深層神經(jīng)網(wǎng)絡(luò)的參數(shù)量大,模型比較復(fù)雜,容易出現(xiàn)過(guò)擬合現(xiàn)象,而Dropout 方法就是一種用來(lái)防止過(guò)擬合的技術(shù),在2012 年由Hinton 提出[12],即在訓(xùn)練時(shí)以一定的比例隨機(jī)使部分神經(jīng)元失去活性,不會(huì)向前傳遞任何信息。本文使用的就是Dropout 方法來(lái)防止過(guò)擬合。應(yīng)用Dropout 方法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖3 所示。建立模型的工作流程圖如圖4所示。
圖3 應(yīng)用Dropout方法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖4 建立LSTM模型的工作流程
神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的效果需要通過(guò)誤差大小來(lái)衡量,通過(guò)對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,模型的均方誤差(MSE)的收斂曲線如圖5 所示。
圖5 LSTM模型的MSE收斂曲線
由圖5 可以看出,經(jīng)過(guò)大量訓(xùn)練之后模型的均方誤差逐漸降低并穩(wěn)定到較低值。模型訓(xùn)練完成之后,需要對(duì)模型進(jìn)行測(cè)試,把測(cè)試集輸入到模型中,通過(guò)模型計(jì)算出預(yù)測(cè)值,比較預(yù)測(cè)值和真實(shí)值之間的誤差,來(lái)判斷模型的準(zhǔn)確率。通過(guò)測(cè)試,得到的模型預(yù)測(cè)值和真實(shí)值之間的MAE 為1.03,MAPE 為15%,R2為0.83。
表3列出了LSTM模型得到的預(yù)測(cè)值與真實(shí)值的部分?jǐn)?shù)據(jù),以及它們之間的AE(絕對(duì)誤差)和APE(絕對(duì)百分比誤差),圖6 進(jìn)一步給出了LSTM模型的含水率預(yù)測(cè)值與真實(shí)值的比較。
表3 LSTM模型的預(yù)測(cè)值、真實(shí)值和誤差
圖6 LSTM模型的預(yù)測(cè)值與真實(shí)值的比較
由圖6 可以看出,LSTM 模型對(duì)煤炭含水率的預(yù)測(cè)較為準(zhǔn)確,對(duì)含水率變化趨勢(shì)的預(yù)測(cè)與實(shí)際相符,沒(méi)有出現(xiàn)位移偏差,預(yù)測(cè)值與真實(shí)值的誤差較小,絕對(duì)誤差的最大值與最小值分別為4.68 和0.01,絕對(duì)百分比誤差的最大值與最小值分別為107%和0.1%,而且沒(méi)有出現(xiàn)波谷過(guò)低和波峰過(guò)高,對(duì)波峰和波谷的預(yù)測(cè)較為準(zhǔn)確。
為了進(jìn)一步驗(yàn)證使用LSTM模型在煤炭含水率預(yù)測(cè)的廣泛性,將本文建立的LSTM 煤炭含水率預(yù)測(cè)模型和其他方法建立的煤炭含水率預(yù)測(cè)模型進(jìn)行了對(duì)比,LSTM、RNN、MLR[13]、SVM[14]模型的預(yù)測(cè)值和真實(shí)值的對(duì)比如圖7 所示。
圖7 LSTM、RNN、MLR和SVM模型對(duì)煤含水率預(yù)測(cè)結(jié)果的比較
由圖7 可以看出,MLR 和SVM 模型對(duì)煤炭含水率變化的預(yù)測(cè)出現(xiàn)了向后位移偏差;RNN 和LSTM 模型的預(yù)測(cè)結(jié)果較好,總體趨勢(shì)符合實(shí)際,且沒(méi)有位移偏差。而RNN絕對(duì)誤差的最大值和最小值分別為5.37和0.03,絕對(duì)百分比誤差的最大值和最小值分別為192%和0.2%,誤差與LSTM 模型相比較大,由此可見,4 種模型中LSTM模型預(yù)測(cè)精度更高。
4 種預(yù)測(cè)模型預(yù)測(cè)煤炭含水率的精確度統(tǒng)計(jì)結(jié)果如表4 所示。根據(jù)表4,預(yù)測(cè)精確度由高到低為:LSTM、RNN、SVM、MLR。其中,LSTM 模型的MAE 為1.03,分別比RNN、SVM、MLR 低了0.42、0.79、1.3;MAPE為15%,分別比RNN、SVM、MLR低了5%,8%,15%;R2 為0.83,分別比RNN、SVM、MLR 提高了0.09、0.21、0.37[15]。根據(jù)統(tǒng)計(jì)結(jié)果表明,LSTM 模型對(duì)煤炭含水率的預(yù)測(cè)效果最佳。
表4 不同預(yù)測(cè)模型預(yù)測(cè)煤炭含水率的精確度統(tǒng)計(jì)
通過(guò)上文建立的LSTM 模型,根據(jù)當(dāng)前煤炭含水率和氣象數(shù)據(jù)可以預(yù)測(cè)出下一時(shí)刻煤炭的含水率,通過(guò)下一時(shí)刻含水率對(duì)應(yīng)的起動(dòng)風(fēng)速和實(shí)際風(fēng)速進(jìn)行對(duì)比,如果實(shí)際風(fēng)速大于當(dāng)前風(fēng)速,那么控制灑水設(shè)備進(jìn)行灑水抑塵,灑水之后,通過(guò)灑水量可以計(jì)算出煤炭含水率變化后的值為多少,把此含水率當(dāng)作當(dāng)前含水率跟氣象數(shù)據(jù)一起繼續(xù)使用模型進(jìn)行預(yù)測(cè),就可實(shí)現(xiàn)自動(dòng)灑水調(diào)節(jié)煤炭含水率,抑制煤炭起塵,實(shí)現(xiàn)智能灑水降塵。
本文通過(guò)建立基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的煤炭含水率變化模型,提出了制定露天煤場(chǎng)智能灑水的方法,據(jù)此方法實(shí)現(xiàn)了煤堆含水率根據(jù)溫度、濕度、風(fēng)速、風(fēng)向變化的自動(dòng)調(diào)整,從而實(shí)現(xiàn)智能灑水降塵。研究表明,與傳統(tǒng)的人工控制灑水相比,本文提出的方法預(yù)測(cè)模型精準(zhǔn),對(duì)露天堆場(chǎng)實(shí)現(xiàn)智能灑水抑塵,自動(dòng)調(diào)節(jié)煤炭含水率,降低露天堆場(chǎng)的揚(yáng)塵量,具有實(shí)用意義,為建設(shè)綠色生態(tài)港口提供了理論方法借鑒。