陳 沖,閆珠,趙繼軒,何為,2,梁華慶
(1.中國(guó)石油大學(xué)(北京)信息科學(xué)與工程學(xué)院,北京 102249;2.中國(guó)石油集團(tuán)安全環(huán)保技術(shù)研究院有限公司HSE檢測(cè)中心,北京 102206)
氮氧化物(Nitrogen Oxide,NOx)是一種常規(guī)大氣污染物質(zhì),依據(jù)GB31570—2015《石油煉制工業(yè)污染物排放標(biāo)準(zhǔn)》中要求,現(xiàn)有企業(yè)自2017 年7 月1 日起執(zhí)行其標(biāo)準(zhǔn)排放限值,NOx 的排放濃度限值應(yīng)小于或等于100 mg/m3[1],這使得很多煉化企業(yè)在NOx 減排問(wèn)題上面臨著巨大的挑戰(zhàn);然而,由于催化裂化(Fluid Catalytic Cracking,F(xiàn)CC)工藝過(guò)程的復(fù)雜性,其建模分析一直是領(lǐng)域研究的熱點(diǎn)和難點(diǎn)[2]。FCC 過(guò)程建模方法可以分為機(jī)理建模法[3]和統(tǒng)計(jì)建模法[4]。FCC 是一個(gè)高度非線(xiàn)性和相互強(qiáng)關(guān)聯(lián)的系統(tǒng),原料油性質(zhì)、反應(yīng)再生催化劑性質(zhì)以及反應(yīng)操作工況條件等因素都會(huì)影響到反應(yīng)過(guò)程和產(chǎn)物收率,建立基于機(jī)理的反應(yīng)動(dòng)力學(xué)模型十分困難[5]。
針對(duì)工業(yè)生產(chǎn)活動(dòng)中污染物排放數(shù)據(jù)的非線(xiàn)性和異質(zhì)性,基于數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)建模方法可以捕捉機(jī)理建模的復(fù)雜性,并表現(xiàn)出良好的性能[4]。隨著第三撥人工智能熱潮的開(kāi)始,以深度學(xué)習(xí)為代表的神經(jīng)網(wǎng)絡(luò)方法在實(shí)際生產(chǎn)活動(dòng)領(lǐng)域的應(yīng)用越來(lái)越廣泛,如文獻(xiàn)[6]中提出了一種基于改進(jìn)的動(dòng)態(tài)主成分分析(Dynamic Principal Component Analysis,DPCA)和多層神經(jīng)網(wǎng)絡(luò)(Multilayer Neural Network,MNN)的神經(jīng)估計(jì)模型,研究了FCC 裝置生產(chǎn)質(zhì)量控制中碳3(C3)濃度參數(shù)的預(yù)測(cè),從實(shí)際過(guò)程變量中推斷C3濃度。研究結(jié)果表明,該方法預(yù)測(cè)具有較好的可靠性和準(zhǔn)確性。
長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)能夠更好地刻畫(huà)時(shí)間序列所蘊(yùn)含的數(shù)據(jù)關(guān)系,廣泛應(yīng)用于文本分析[7]、金融時(shí)間序列預(yù)測(cè)[8-9]以及圖像識(shí)別領(lǐng)域(如步態(tài)識(shí)別等)[10],在時(shí)間序列數(shù)據(jù)上獲得了良好效果。在多維度時(shí)空數(shù)據(jù)處理上,將其他方法與LSTM 結(jié)合分別從空間、時(shí)間上提取數(shù)據(jù)特征,成為一種研究趨勢(shì)。比如文獻(xiàn)[11]中提出了一種混合模型,引入了3D 卷積神經(jīng)網(wǎng)絡(luò)和2D 卷積神經(jīng)網(wǎng)絡(luò)以更好地了解臺(tái)風(fēng)形成特征的空間關(guān)系。實(shí)驗(yàn)結(jié)果表明,混合模型CNN-LSTM(Convolutional Neural Network-Long Short-Term Memory)的效果優(yōu)于數(shù)值預(yù)測(cè)模型。
雖然FCC 裝置的NOx 排放濃度是單一維度的時(shí)間序列數(shù)據(jù),但其具有非平穩(wěn)、強(qiáng)非線(xiàn)性等特征,直接采用LSTM 方法進(jìn)行預(yù)測(cè)難以達(dá)到令人滿(mǎn)意的結(jié)果,需先對(duì)信號(hào)進(jìn)行分解預(yù)處理,再應(yīng)用LSTM 方法。集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)[12]是一種噪聲輔助數(shù)據(jù)分析方法,其分解原理是將增加的白噪聲與不同尺度的組成成分均勻地填充整個(gè)時(shí)頻空間;文獻(xiàn)[13]中提出了自回歸綜合移動(dòng)平均(Autoregressive Integrated Moving Average,ARIMA)模型結(jié)合EEMD 深入提取數(shù)據(jù)特征,來(lái)預(yù)測(cè)年徑流時(shí)間序列,實(shí)驗(yàn)表明EEMD-ARIMA 融合模型性能優(yōu)于ARIMA;文獻(xiàn)[14]中利用EEMD 原始振動(dòng)信號(hào),結(jié)合小波包變換(Wavelet Packet Transform,WPT),有效提取了故障早期敏感特征,驗(yàn)證了模型在故障診斷問(wèn)題上的有效性;文獻(xiàn)[15]中基于EEMD 和LSTM 提出了一種電力負(fù)荷序列預(yù)測(cè)方法,以避免數(shù)據(jù)的高非線(xiàn)性與非平穩(wěn)性對(duì)預(yù)測(cè)精度的影響,但對(duì)于不同階次的IMF 分量均輸入到同等深度的LSTM 網(wǎng)絡(luò)中,容易造成低階IMF 序列對(duì)應(yīng)模型訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合的問(wèn)題。
為了挖掘NOx 排放序列內(nèi)部蘊(yùn)含的數(shù)據(jù)規(guī)律,提高預(yù)測(cè)精度,本文提出了基于EEMD和LSTM的耦合模型。首先采用EEMD 對(duì)信號(hào)進(jìn)行分解預(yù)處理,將信號(hào)分解為若干固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF),將原始數(shù)據(jù)的非平穩(wěn)性與非線(xiàn)性特征分解到子序列中;接著采用相關(guān)性分析子序列,將子序列分成高頻與低頻兩個(gè)類(lèi)別,分別輸入結(jié)構(gòu)不同的LSTM 網(wǎng)絡(luò)中,最后重構(gòu)各分量的預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文模型能為非平穩(wěn)、非線(xiàn)性數(shù)據(jù)預(yù)測(cè)方法提供有益參考。
希爾伯特-黃變換(Hilbert-Huang Transform,HHT)方法[16]是一種分析非線(xiàn)性和非平穩(wěn)信號(hào)的有力工具,其包含經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)和希爾伯特變換(Hilbert Transform,HT)兩部分。EMD 可以將原始信號(hào)分解成為一系列IMF 分量,從高頻到低頻依次排列,將復(fù)雜的原信號(hào)視為這一系列IMF 疊加之和,IMF 子序列之間互相獨(dú)立,可以是線(xiàn)性或非線(xiàn)性序列。EMD 不同于傅里葉變換,不需要基函數(shù),而是基于信號(hào)本身進(jìn)行分解,因此適用于任何數(shù)據(jù)信號(hào),擺脫了傅里葉變化的局限性;但是EMD 得到的IMF 分量往往存在模態(tài)混疊現(xiàn)象。Wu 等[12]在進(jìn)行實(shí)驗(yàn)時(shí),利用白噪聲頻譜均勻分布的特性,在待分析信號(hào)中加入白噪聲,使不同時(shí)間尺度的信號(hào)自動(dòng)分離到與其相適應(yīng)的參考尺度上。
EEMD 的分解原理基于零均值噪聲的特性,認(rèn)為噪聲經(jīng)過(guò)多次平均計(jì)算后會(huì)相互抵消,集成均值可以直接視作最終結(jié)果。分解步驟主要分為四點(diǎn):
1)在目標(biāo)數(shù)據(jù)s(t) 中添加白噪聲序列noise(t),x(t)=s(t) +noise(t)。
2)將添加白噪聲的數(shù)據(jù)x(t)進(jìn)行EMD 為IMF 分量。
3)重復(fù)步驟1)和步驟2),每次分解之前都添加不同的白噪聲序列。
4)將每次得到的IMF 分量做集成平均處理后作為最終結(jié)果。
步驟2)中x(t)進(jìn)行EMD 表示如下:
其中:rn(t)是分解提取n個(gè)IMF 后的信號(hào)殘余分量,通常是信號(hào)的直流分量;imfi(t)是EMD 得到的第i個(gè)固有模態(tài)函數(shù)。得到的子序列若要成為IMF 分量需要滿(mǎn)足下面兩個(gè)條件。
1)該子序列中極值點(diǎn)的個(gè)數(shù)Nz和過(guò)零點(diǎn)的個(gè)數(shù)Ne需要滿(mǎn)足以下關(guān)系:
2)在任意時(shí)間點(diǎn),該序列f(t)由局部極大值和局部極小值確定的上、下包絡(luò)線(xiàn)的均值為0,即:
由于上述兩個(gè)條件的嚴(yán)苛,在實(shí)際分解過(guò)程中,判斷成為IMF 的條件往往根據(jù)標(biāo)準(zhǔn)差Sd來(lái)決定:
EMD 的具體分解步驟如下:
1)尋找x(t)全部的極值點(diǎn),分為局部極大值和局部極小值組。
2)通過(guò)三次樣條插值法,分別獲得光滑的波峰、波谷擬合曲線(xiàn),即為x(t)的上包絡(luò)線(xiàn)和下包絡(luò)線(xiàn)。
3)取兩條極值擬合曲線(xiàn)均值得到平均包絡(luò)線(xiàn)m(t)。
4)將原始信號(hào)減去均值包絡(luò)線(xiàn),得到疑似IMF 分量h(t)=x(t)-m(t)。
5)判斷h(t)是否符合IMF 條件:如果符合將作為第一個(gè)IMF 分量;否則作為新的原始信號(hào),返回步驟1),再次篩選分析,直到滿(mǎn)足條件得到IMF 分量。
6)將步驟5)中IMF 分量從原信號(hào)中分離出去,得到ri(t)=x(t)-imfi(t),檢查是否滿(mǎn)足分解停止條件,即是否存在兩個(gè)以上的極值點(diǎn):如果是則加入新的正態(tài)分布白噪聲序列,返回步驟1)繼續(xù)分解,進(jìn)而得到所有的IMF 分量;否則,EMD 結(jié)束。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)由于其特殊的網(wǎng)絡(luò)模型結(jié)構(gòu)解決了信息保存的問(wèn)題,在處理時(shí)間序列時(shí)具有獨(dú)特的優(yōu)勢(shì)。然而,RNN 在實(shí)際訓(xùn)練過(guò)程中存在較多問(wèn)題[17]。在使用反向傳播算法學(xué)習(xí)模型參數(shù)的時(shí)候,RNN 需要展開(kāi)成參數(shù)共享的多層前饋神經(jīng)網(wǎng)絡(luò),歷史信息的長(zhǎng)度就反映了展開(kāi)的層數(shù)。過(guò)多的層數(shù)不僅使得訓(xùn)練速度變得極慢,還會(huì)出現(xiàn)梯度消失和梯度爆炸問(wèn)題,這樣一來(lái),RNN 也就失去了提取長(zhǎng)序列歷史信息的能力。為了解決上述問(wèn)題,文獻(xiàn)[18]中提出了LSTM,隱藏層節(jié)點(diǎn)結(jié)構(gòu)采用門(mén)控機(jī)制,通過(guò)遺忘門(mén)、輸入門(mén)、輸出門(mén)的組合,達(dá)到控制每個(gè)節(jié)點(diǎn)信息通過(guò)量的作用,結(jié)構(gòu)如圖1 所示。
圖1 LSTM結(jié)構(gòu)Fig.1 Structure of LSTM
遺忘門(mén)決定上一個(gè)時(shí)刻的單元狀態(tài)ct-1有多少保留到當(dāng)前時(shí)刻ct。
其中:Wf是遺忘門(mén)的權(quán)重矩陣;[ht-1,xt]表示矩陣拼接;bf是遺忘門(mén)的偏置項(xiàng),σ是sigmoid 激活函數(shù)。
輸入門(mén)決定當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入有多少保存到單元狀態(tài)ct。
其中:Wi是遺忘門(mén)的權(quán)重矩陣;bi是輸入門(mén)的偏置;計(jì)算當(dāng)前輸入的單元狀態(tài),根據(jù)上一次的輸出和本次輸入計(jì)算。
當(dāng)前時(shí)刻的單元狀態(tài)ct由上一次的單元狀態(tài)ct-1按元素乘以遺忘門(mén)ft,再以當(dāng)前輸入的單元狀態(tài)按元素乘以輸入門(mén)it,將兩個(gè)積加和產(chǎn)生:
當(dāng)前的記憶和長(zhǎng)期的記憶ct-1組合在一起,形成了新的單元狀態(tài)ct,由于遺忘門(mén)的控制,LSTM 可以保存很久之前的信息,由于輸入門(mén)的控制,它又可以避免當(dāng)前無(wú)關(guān)緊要的內(nèi)容進(jìn)入記憶,輸出門(mén)用來(lái)控制單元狀態(tài)ct有多少輸出到LSTM 的當(dāng)前輸出值ht,即控制長(zhǎng)期記憶對(duì)當(dāng)前輸出的影響。
LSTM 的最終輸出由輸出門(mén)和單元狀態(tài)共同決定。
FCC 裝置中NOx 的排放數(shù)據(jù)受外界原料量等干擾,是典型的非線(xiàn)性、非平穩(wěn)信號(hào)。本文提出基于EEMD 與LSTM 的耦合模型,將NOx 的排放濃度序列通過(guò)EEMD 為一系列IMF分量,有選擇地將強(qiáng)相關(guān)的子序列根據(jù)頻率高低分別送入不同深度LSTM 神經(jīng)網(wǎng)絡(luò),最后將子序列預(yù)測(cè)結(jié)果重構(gòu)得到最終預(yù)測(cè)結(jié)果,模型結(jié)構(gòu)如圖2 所示。
圖2 EEMD-LSTM模型結(jié)構(gòu)Fig.2 Structure of EEMD-LSTM model
根據(jù)圖2,EEMD-LSTM 耦合模型主要分為以下3 個(gè)模塊:
1)EEMD。
原信號(hào)x(t)經(jīng)過(guò)EEMD 之后,等于n個(gè)IMF 分量之和,如式(11)所示,其中IMF 分量與原序列等長(zhǎng)。
2)IMF 分量提取。
計(jì)算每個(gè)imfi(t)(i=1,2,…,n)與x(t)的Pearson 相關(guān)系數(shù),記為P={p1,p2,…,pn}。
pi定義為兩個(gè)連續(xù)變量(X,Y)的Pearson 相關(guān)性系數(shù),等于它們之間的協(xié)方差除以它們各自標(biāo)準(zhǔn)差的乘積。
pi取值總是在-1~1,接近0 的變量被成為無(wú)相關(guān)性,接近1 或者-1 被稱(chēng)為具有強(qiáng)相關(guān)性。根據(jù)p0篩選出相關(guān)性較大的IMF 分量集,其他分量將被舍棄。
3)LSTM 網(wǎng)絡(luò)預(yù)測(cè)。
針對(duì)每一個(gè)符合篩選條件的imf(t) ∈IMFpi≥p0,經(jīng)過(guò)處理為對(duì)應(yīng)網(wǎng)絡(luò)的監(jiān)督數(shù)據(jù)集,樣本xi輸入到LSTM 單元中。假設(shè)預(yù)測(cè)未來(lái)第s步的數(shù)據(jù)信息,則通過(guò)隱藏層LSTM 單元的計(jì)算,各個(gè)時(shí)期輸出hi如式(14)所示,對(duì)應(yīng)的長(zhǎng)期記憶ci如式(15)所示:
第s步隱藏層單元輸出為Hi+s,送入到一層全連接網(wǎng)絡(luò),激活函數(shù)采用ReLU,最后輸出s步的預(yù)測(cè)結(jié)果。
將模型預(yù)測(cè)輸出與理論預(yù)測(cè)結(jié)果基于均方根誤差(Root Mean Squared Error,RMSE)進(jìn)行損失計(jì)算,利用適應(yīng)性動(dòng)量估計(jì)(Adaptive momentum estimation,Adam)算法基于訓(xùn)練樣本數(shù)據(jù)迭代更新神經(jīng)網(wǎng)絡(luò)權(quán)重,減小Loss值,優(yōu)化模型。
實(shí)驗(yàn)所采用數(shù)據(jù)集來(lái)源于我國(guó)某煉廠2016 年3 月至2017 年3 月FCC 裝置NOx 的排放數(shù)據(jù),每相鄰兩條記錄時(shí)間間隔為40 min,共獲得10 000 條數(shù)據(jù)記錄。對(duì)于原始數(shù)據(jù)首先進(jìn)行異常值的剔除,本文將用數(shù)據(jù)均值代替明顯的異常值,經(jīng)統(tǒng)計(jì)可知,異常數(shù)據(jù)個(gè)數(shù)小于數(shù)據(jù)長(zhǎng)度的0.5%。經(jīng)過(guò)去除異常值后的信號(hào)序列如圖3 所示,對(duì)上述信號(hào)進(jìn)行EEMD,獲得12 個(gè)IMF 分量,如圖4 所示。
圖3 預(yù)處理之后的數(shù)據(jù)Fig.3 Preprocessed data
圖4 IMF分量數(shù)據(jù)集Fig.4 Dataset of IMF subsequences
根據(jù)式(13)計(jì)算12 個(gè)IMF 分量與原信號(hào)的相關(guān)系數(shù),結(jié)果如表1 所示。根據(jù)式(12),設(shè)置相關(guān)系數(shù)閾值p0=0.106 5,因此剔除IMF 分量1、2。
表1 IMF分量相關(guān)系數(shù)Tab.1 Pearson correlation coefficients of IMF subsequences
結(jié)合FCC 生產(chǎn)活動(dòng)中的實(shí)際意義,本文選定預(yù)測(cè)步長(zhǎng)為未來(lái)24 h 的數(shù)據(jù)信息,對(duì)應(yīng)在實(shí)際數(shù)據(jù)中,為未來(lái)36 組的數(shù)據(jù)。為了評(píng)估本文EEMD-LSTM 耦合模型的性能,實(shí)驗(yàn)選用LSTM 作為對(duì)照組,通過(guò)多次實(shí)驗(yàn)給出兩種模型的最優(yōu)實(shí)驗(yàn)結(jié)果。
實(shí)驗(yàn)中,兩層隱藏層分別設(shè)計(jì)為32、64 個(gè)神經(jīng)元,單層隱藏層設(shè)計(jì)20 個(gè)神經(jīng)元,分別作為EEMD-LSTM 耦合模型中不同深度的LSTM 網(wǎng)絡(luò)結(jié)構(gòu)。為減小建模誤差,在進(jìn)行網(wǎng)絡(luò)訓(xùn)練之前進(jìn)行數(shù)據(jù)歸一化處理;采用48 組連續(xù)NOx 排放數(shù)據(jù)作為L(zhǎng)STM 的輸入數(shù)據(jù),對(duì)應(yīng)得到36 組預(yù)測(cè)結(jié)果,反歸一化之后得到預(yù)測(cè)的真實(shí)值,便得到一個(gè)數(shù)據(jù)樣本的訓(xùn)練結(jié)果。為了不減少樣本量,生成樣本時(shí)滑動(dòng)窗口每次前進(jìn)一個(gè)數(shù)據(jù)記錄,因此整個(gè)測(cè)試集得到的預(yù)測(cè)結(jié)果在中間時(shí)間點(diǎn)上是重復(fù)的,最后統(tǒng)一取均值作為該時(shí)間點(diǎn)的預(yù)測(cè)值。
本文按6∶2∶2 的比例劃分測(cè)試集、驗(yàn)證集、測(cè)試集,經(jīng)過(guò)300 次迭代,LSTM 模型以及EEMD-LSTM 耦合模型中的各個(gè)分量的網(wǎng)絡(luò)訓(xùn)練均能達(dá)到收斂。為了更好地觀察模型的對(duì)比結(jié)果,采用RMSE、平均絕對(duì)誤差(Mean Absolute Error,MAE)以及決定系數(shù)(R2)三個(gè)指標(biāo)進(jìn)行評(píng)估模型性能,計(jì)算公式分別如下:
圖5 展示了EEMD-LSTM、LSTM 模型測(cè)試集預(yù)測(cè)結(jié)果與真實(shí)值的對(duì)比,其中EEMD-LSTM 耦合模型的預(yù)測(cè)值是由EEMD 的關(guān)鍵IMF 分量的子預(yù)測(cè)結(jié)果疊加得到的。整體來(lái)看,相較于LSTM,EEMD-LSTM 模型的預(yù)測(cè)結(jié)果與真實(shí)值大致吻合,從圖中局部放大區(qū)域(1)、(2)能夠更清晰看到這一點(diǎn)。LSTM 預(yù)測(cè)輸出相對(duì)平滑,缺少局部波動(dòng)細(xì)節(jié),與真實(shí)值對(duì)比上下波動(dòng)幅度略??;而EEMD-LSTM 模型的預(yù)測(cè)結(jié)果與真實(shí)值曲線(xiàn)有較多重疊,體現(xiàn)了更多的局部波動(dòng)細(xì)節(jié)。這說(shuō)明EEMD-LSTM 對(duì)于數(shù)據(jù)特征的學(xué)習(xí)更精細(xì),在局部極值點(diǎn)上表現(xiàn)了較好的預(yù)測(cè)能力。
圖5 模型預(yù)測(cè)值與真實(shí)值對(duì)比Fig.5 Comparison of predicted value and observed value of models
為了量化兩種模型的預(yù)測(cè)能力,從RMSE、MAE、R2三個(gè)評(píng)價(jià)指標(biāo)上評(píng)估模型性能,結(jié)果如表2 所示。由表2 看出,實(shí)驗(yàn)結(jié)果符合理論預(yù)期,EEMD-LSTM 耦合模型在RMSE、MAE指標(biāo)上的誤差值均小于LSTM,前者相對(duì)于后者在這兩項(xiàng)上分別減小了46.7%、45.9%;在決定系數(shù)R2上,EEMD-LSTM耦合模型比LSTM 模型增大了43%。
表2 模型性能對(duì)比Tab.2 Comparison of model performance
LSTM 憑借其獨(dú)特的遺忘門(mén)、輸入門(mén)、輸出門(mén)設(shè)計(jì),可以學(xué)習(xí)時(shí)間序列以往序列特征,保留當(dāng)下時(shí)刻之前較長(zhǎng)時(shí)期的記憶,在時(shí)間序列預(yù)測(cè)上比其他神經(jīng)網(wǎng)絡(luò)有著不可比擬的優(yōu)勢(shì)。但針對(duì)像FCC 裝置的污染排放數(shù)據(jù)而言,實(shí)際生產(chǎn)中受多項(xiàng)生產(chǎn)要素含量的影響,很難挖掘的深層數(shù)據(jù)特征,因此針對(duì)這樣的數(shù)據(jù),LSTM 表現(xiàn)良好但仍有可優(yōu)化的空間。而EEMD-LSTM 耦合模型將單一的原始序列分解為一系列固有模態(tài)函數(shù),并且有選擇地保留IMF 分量,將包含高頻隨機(jī)噪聲多的分量舍棄,多角度、多層次地提取原始數(shù)據(jù)特征,能更好地學(xué)習(xí)數(shù)據(jù)的深層規(guī)律,進(jìn)一步提升預(yù)測(cè)精度。
FCC 裝置中NOx 的排放數(shù)據(jù)受生產(chǎn)過(guò)程中的溫度、原料量、通風(fēng)量等各項(xiàng)要素影響,傳統(tǒng)機(jī)理建模方法很難刻畫(huà)數(shù)據(jù)特征。本文提出一種基于EEMD 算法和LSTM 神經(jīng)網(wǎng)絡(luò)的耦合模型EEMD-LSTM,將信號(hào)分解為不同特征尺度的平穩(wěn)序列,經(jīng)過(guò)皮爾遜相關(guān)性分析舍棄弱相關(guān)分量,有效減少高頻隨機(jī)噪聲的引入,將提取出的相關(guān)分量分別輸入LSTM 模型,重構(gòu)模型輸出得到最終預(yù)測(cè)結(jié)果。經(jīng)過(guò)實(shí)驗(yàn)證明,EEMD-LSTM 與LSTM 模型均表現(xiàn)了良好的性能,但EEMDLSTM 耦合模型比LSTM 具有更高的預(yù)測(cè)精度,對(duì)原數(shù)據(jù)的擬合程度也更高。