郭小萍,馬美卉,李 元
(沈陽化工大學(xué) 信息工程學(xué)院,沈陽 110142)
科學(xué)技術(shù)的飛速發(fā)展對(duì)化工過程提出了更為嚴(yán)格的要求。保證過程安全、提高產(chǎn)品質(zhì)量也逐漸成為化工工業(yè)過程追求的目標(biāo)。在化工過程中,對(duì)產(chǎn)品質(zhì)量進(jìn)行監(jiān)測(cè)和控制對(duì)于安全穩(wěn)定生產(chǎn)至關(guān)重要[1-2]。快速有效地預(yù)測(cè)產(chǎn)品質(zhì)量,做出準(zhǔn)確及時(shí)的判斷,對(duì)于提高生產(chǎn)質(zhì)量有決定性作用[3]。然而,由于環(huán)境惡劣、儀器成本昂貴、測(cè)量延遲大等原因,大多數(shù)關(guān)鍵質(zhì)量變量難以在線測(cè)量,無法為過程控制提供實(shí)時(shí)反饋消息[4]。不同的是,有許多易于測(cè)量的常規(guī)過程變量,可以通過傳感器輕松測(cè)量。因此,為了解決質(zhì)量變量難以在線獲得的問題,建立預(yù)測(cè)模型,用各種易于測(cè)量的過程變量來估計(jì)難以測(cè)量的質(zhì)量變量[5]。近些年來,這逐漸成為解決上述問題最有效的方法之一,并且已成為研究熱點(diǎn)[6]。
然而,化工過程具有非線性、多變量等特征。針對(duì)這些特征,X.Yuan等人提出核主成分回歸預(yù)測(cè)模型(KPCR),之后其基礎(chǔ)上又提出一種局部加權(quán)核主成分[7]回歸模型(LWKPCR)。相比之下,該方法對(duì)非線性過程的質(zhì)量預(yù)測(cè)更加有效。Kaneko曾提出一種基于在線支持向量回歸(SVR)的方法[8],建立了工業(yè)過程變量間關(guān)系快速變化的預(yù)測(cè)模型。Chen Lu等人提出一種混合核偏最小二乘(KPLS)方法[9],對(duì)參數(shù)及權(quán)重進(jìn)行優(yōu)化選取從而提高質(zhì)量預(yù)測(cè)精度。
Shang et al.等人首次利用深度信念網(wǎng)絡(luò)構(gòu)建原油蒸餾裝置的回歸模型[10],討論了深度學(xué)習(xí)在工業(yè)過程中的獨(dú)特優(yōu)勢(shì)。He Yuliang等人建立了具有多個(gè)輸入、單個(gè)輸出的BP神經(jīng)網(wǎng)絡(luò)[11]的預(yù)測(cè)模型。
化工過程多個(gè)變量之間不僅呈現(xiàn)復(fù)雜的非線性相關(guān),也避免不了干擾影響,通常伴有噪聲。Liu linyue曾提出基于PCA-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型[12],基于主成分分析(PCA)去除影響因素間的線性相關(guān),將主成分分析結(jié)果作為 BP 神經(jīng)網(wǎng)絡(luò)的輸入。Chen Yan也曾提出SAE-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法[13],其嘗試使用稀疏自編碼器(SAE)進(jìn)行非線性特征提取,提取到的特征輸入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。Wan Liang提出的已有的DAE-BP結(jié)構(gòu)[14],其利用深度自編碼器降低數(shù)據(jù)維度,然后基于BP神經(jīng)網(wǎng)絡(luò)建立了低維編碼序列與預(yù)測(cè)變量之間的回歸模型。在股票預(yù)測(cè)領(lǐng)域驗(yàn)證了該方法的有效性。
基于上述討論,本文提出一種改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)質(zhì)量預(yù)測(cè)方法。通過降噪自編碼器提取原始數(shù)據(jù)有效特征,降低其存在的噪聲,保證了數(shù)據(jù)的真實(shí)度并提高魯棒性。將提取的有效特征構(gòu)成新的輸入樣本,BP神經(jīng)網(wǎng)絡(luò)可映射任意非線性關(guān)系,用其建立質(zhì)量預(yù)測(cè)模型。經(jīng)過不斷訓(xùn)練,對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)優(yōu),直至獲得期望效果。將本文方法用于脫丁烷塔過程丁烷濃度預(yù)測(cè)。更進(jìn)一步地,為了驗(yàn)證本文方法的優(yōu)勢(shì)與有效性,本文引入BP、PCA-BP、AE-BP進(jìn)行對(duì)比分析。實(shí)證分析顯示:本文所使用的DAE-BP神經(jīng)網(wǎng)絡(luò)能夠較好地提取非線性特征并進(jìn)行預(yù)測(cè),其預(yù)測(cè)精度優(yōu)于其他方法。
自編碼器(autoencoder, AE)是一種神經(jīng)網(wǎng)絡(luò),具有相同的輸入和輸出。其借助稀疏編碼的思想,目標(biāo)是使用稀疏的一些高階特征重新組合完成樣本重構(gòu)。 AE是一種數(shù)據(jù)的壓縮算法,屬于無監(jiān)督學(xué)習(xí)。
圖1為自編碼器的結(jié)構(gòu)圖,可見,它分為編碼器和解碼器兩部分。編碼器部分將原始數(shù)據(jù)輸入x映射為隱藏表示h,通常,隱式表示h可以通過非線性映射函數(shù)f獲得。
h=fθ(x)=s(Wx+b)
(1)
圖1 自編碼器結(jié)構(gòu)圖
(2)
降噪自編碼器(denoising autoencoder, DAE)是自編碼器的一個(gè)變體。在自編碼器基礎(chǔ)上,將噪聲注入輸入信息,然后利用含有噪聲的“腐壞”樣本重構(gòu)無噪聲的“干凈”輸入。這就是降噪自編碼器(denoising autoencoder, DAE)的原理。降噪編碼器經(jīng)過人為破壞輸入信號(hào)實(shí)現(xiàn)兩個(gè)目的。首先,避免隱藏單元在傳統(tǒng)編碼器中學(xué)習(xí)到?jīng)]有具體意義的恒等函數(shù)。其次,加入噪聲又降低噪聲干擾,迫使網(wǎng)絡(luò)學(xué)習(xí)更具魯棒的不變性特征,以獲得更為有效的輸入表達(dá)。
傳統(tǒng)自動(dòng)編碼器單純依靠最小化輸入與重構(gòu)信號(hào)之間的誤差來得到輸入的隱含層特征表示,但這種訓(xùn)練策略并不能保證數(shù)據(jù)的本質(zhì)特征被提取出來,可能導(dǎo)致編碼器學(xué)習(xí)到的特征僅僅是原始輸入的復(fù)制。而DAE就是通過對(duì)比和進(jìn)行學(xué)習(xí),嘗試著去填充缺失的信息,進(jìn)而學(xué)習(xí)到的數(shù)據(jù)結(jié)構(gòu),使得提取到的特征更能反映原始輸入的特點(diǎn)。
圖2 降噪自編碼結(jié)構(gòu)圖
DAE由編碼器和解碼器兩部分構(gòu)成,主要原理如下。
對(duì)原始輸入數(shù)據(jù)加入噪聲:
(3)
(4)
(5)
對(duì)比圖1與圖2可發(fā)現(xiàn)降噪自編碼器與自編碼器對(duì)輸入層的處理不同。自編碼器直接將初始信號(hào)輸入編碼解碼框架,而降噪自編碼器在原始輸入信息上添加噪聲,將加噪后的數(shù)據(jù)集當(dāng)成輸入信息,訓(xùn)練整個(gè)網(wǎng)絡(luò),在模型訓(xùn)練過程中學(xué)習(xí)存在噪聲數(shù)據(jù)的規(guī)律,從而把噪聲去掉。
降噪編碼器的目標(biāo)是使損失函數(shù)最小化。
(6)
DAE依據(jù)輸入信號(hào)和重構(gòu)信號(hào)之間的誤差來調(diào)整網(wǎng)絡(luò)參數(shù),以最小化誤差。訓(xùn)練過程不需要額外的標(biāo)簽信息,使用傳統(tǒng)的基于梯度的方式進(jìn)行訓(xùn)練,求得損失函數(shù)的最小值得到網(wǎng)絡(luò)的最佳參數(shù)。由于典型的激活函數(shù)是光滑且連續(xù)可微的,因此實(shí)現(xiàn)起來較容易。
BP神經(jīng)網(wǎng)絡(luò)是一種成熟的、有組織和學(xué)習(xí)能力的非線性映射方法,可大規(guī)模并行處理數(shù)據(jù),系統(tǒng)地解決多層神經(jīng)網(wǎng)絡(luò)隱含層連接及權(quán)值學(xué)習(xí)的問題。適用于解決傳統(tǒng)算法或是計(jì)算方法難以解決的問題,成為處理復(fù)雜問題的有效工具[15]。它能從案例中學(xué)習(xí)知識(shí),將各種定量或定性的因素盡可能地作為變量加以輸出,建立變量與輸出間的非線性映射[16]?;み^程數(shù)據(jù)通常表現(xiàn)出為復(fù)雜的非線性,并且過程變量較多,線性模型已無法達(dá)到預(yù)期效果。因此,基于神經(jīng)網(wǎng)絡(luò)的模型開辟了新道路。
BP 神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑サ亩鄬忧跋蛐途W(wǎng)絡(luò),學(xué)習(xí)過程由信號(hào)的正向傳播和誤差的反向傳播兩個(gè)過程組成。結(jié)構(gòu)由輸入層、隱含層以及輸出層構(gòu)成,每一層都有N個(gè)神經(jīng)元。每一層與層之間通過權(quán)值相互連接,同一層的神經(jīng)元相互之間并無連接[17]。其權(quán)值的調(diào)整取決于預(yù)期輸出與實(shí)際輸出之間的差異。正向傳播時(shí),樣本特征從輸入層輸入,信號(hào)由每個(gè)隱藏層處理,最后樣本特征從輸出層輸出。針對(duì)網(wǎng)絡(luò)的實(shí)際的輸出與期望輸出之間的誤差,從最后一層逐層傳遞誤差信號(hào),獲得各層的誤差學(xué)習(xí)信號(hào),然后再根據(jù)誤差學(xué)習(xí)信號(hào)來修正各層神經(jīng)元的權(quán)值,各層調(diào)整權(quán)值的過程是周而復(fù)始地進(jìn)行。
BP神經(jīng)網(wǎng)絡(luò)算法首先對(duì)網(wǎng)絡(luò)進(jìn)行初始化設(shè)置,然后依據(jù)給定的輸入向量與期望的輸出值[18]??色@得初始預(yù)測(cè)結(jié)果。若輸出與期望值之間誤差較大,無法實(shí)現(xiàn)功能,便不斷進(jìn)行權(quán)值修正,網(wǎng)絡(luò)不斷學(xué)習(xí)訓(xùn)練,達(dá)到預(yù)期結(jié)果,此時(shí)便認(rèn)為模型搭建完成[19-20]。使用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建回歸模型,對(duì)質(zhì)量變量進(jìn)行預(yù)測(cè)。模型包括三層:輸入層,隱含層,輸出層,結(jié)構(gòu)圖如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
輸入層神經(jīng)網(wǎng)絡(luò)接收到歸一化的變量后,向隱含層的方向傳遞,然后經(jīng)過加權(quán)求和并使用激活函數(shù)將得到的值傳遞給輸出層,輸出層重復(fù)加權(quán)求和及激活函數(shù)的步驟,最終輸出一個(gè)結(jié)果。設(shè)輸入層、隱含層及輸出層的神經(jīng)元個(gè)數(shù)分別為n、m和q則:
輸入層:Xi=xi
(7)
(8)
(9)
由于各個(gè)變量的數(shù)據(jù)范圍在實(shí)驗(yàn)過程中差異較大,取值都不屬于同一個(gè)數(shù)量級(jí),在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練的過程中,可能會(huì)引起數(shù)據(jù)收斂過慢或根本無法收斂等問題。數(shù)據(jù)歸一化的目的就是通過轉(zhuǎn)換將不同數(shù)量級(jí)的數(shù)據(jù)統(tǒng)一到同一數(shù)量級(jí),這樣使得比較起來更有意義,能更好地反映數(shù)據(jù)本身的特點(diǎn)。
Min-max歸一化通過對(duì)原始數(shù)據(jù)進(jìn)行線性變換,使變換結(jié)果落到[0,1]區(qū)間,函數(shù)為:
(10)
數(shù)據(jù)歸一化有兩大優(yōu)點(diǎn):(1)歸一化可以加快迭代過程中,梯度下降求最優(yōu)解的速度;(2)歸一化可以提高精度。
均方根誤差(root mean square error,RMSE)和決定系數(shù)(R-Square,R2)一般用來評(píng)估預(yù)測(cè)性能,分別描述為:
(11)
(12)
DAE-BP質(zhì)量預(yù)測(cè)算法包括離線建模和在線預(yù)測(cè)兩部分,流程圖如圖4所示。
圖4 DAE-BP神經(jīng)網(wǎng)絡(luò)流程圖
離線建模主要步驟:
1)獲取樣本,按一定比例分割為訓(xùn)練集與測(cè)試集兩部分,為了減少泛化誤差,通過訓(xùn)練集不斷訓(xùn)練模型,測(cè)試集用來測(cè)試模型準(zhǔn)確性。分別對(duì)數(shù)據(jù)歸一化處理并添加噪聲。
2)向DAE網(wǎng)絡(luò)輸入數(shù)據(jù),輸入信號(hào)會(huì)根據(jù)其原理,采用非監(jiān)督的逐層訓(xùn)練方法,預(yù)訓(xùn)練各層神經(jīng)網(wǎng)絡(luò),對(duì)網(wǎng)絡(luò)的隱藏層逐步訓(xùn)練,獲取DAE網(wǎng)絡(luò)中的權(quán)值w和偏置值b,作為初始網(wǎng)絡(luò)參數(shù)。添加噪聲后的數(shù)據(jù)作為訓(xùn)練樣本對(duì)整體的網(wǎng)絡(luò)進(jìn)行微調(diào),利用反向傳播算法得到最優(yōu)網(wǎng)絡(luò)參數(shù)完成網(wǎng)絡(luò)訓(xùn)練。訓(xùn)練完成后,便得到去噪后的訓(xùn)練數(shù)據(jù)集并將其輸出。
3)構(gòu)建BP神經(jīng)網(wǎng)絡(luò),將從DAE輸出的訓(xùn)練集樣本作為新的輸入,微調(diào)網(wǎng)絡(luò)參數(shù),訓(xùn)練模型。利用訓(xùn)練樣本反復(fù)訓(xùn)練,建立輸入?yún)?shù)與目標(biāo)輸出之間的非線性關(guān)系。若滿足精度要求,將網(wǎng)絡(luò)中參數(shù)傳輸給測(cè)試集;若不滿足,依據(jù)真實(shí)和期望之間誤差情況修改參數(shù),重新訓(xùn)練,直到滿足要求。
在線預(yù)測(cè)主要步驟:
1)對(duì)測(cè)試集進(jìn)行歸一化處理,并人為添加噪聲,將最優(yōu)網(wǎng)絡(luò)參數(shù)傳輸給測(cè)試集,處理后的數(shù)據(jù)輸入訓(xùn)練好的DAE模型以獲得去噪后的干凈數(shù)據(jù)信息,將其輸出。
2)根據(jù)離線建模部分確定的預(yù)測(cè)模型,將測(cè)試樣本導(dǎo)入訓(xùn)練好的網(wǎng)絡(luò)模型中,測(cè)試神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能。計(jì)算新獲取的測(cè)試數(shù)據(jù)的質(zhì)量預(yù)測(cè)值及評(píng)價(jià)指標(biāo),對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
本文以化工過程案例為基準(zhǔn),使用采集的脫丁烷塔數(shù)據(jù)來驗(yàn)證模型的有效性。脫丁烷塔是煉油過程中脫硫和石腦油分離裝置的重要組成部分。其主要任務(wù)之一是降低脫丁烷塔底部的丁烷(C4)濃度。然而,C4濃度是通過安裝在順序脫異戊烷塔頂部的氣相色譜儀測(cè)量的,該塔與脫丁烷塔相距較遠(yuǎn)[21-22]。這樣,C4濃度的測(cè)量會(huì)有很大的延遲。為了解決這個(gè)問題,使用預(yù)測(cè)模型實(shí)時(shí)估計(jì)脫丁烷塔底部的丁烷濃度。
整個(gè)實(shí)驗(yàn)過程共采集到原始數(shù)據(jù)2 393組,且所有的輸入樣本都有相應(yīng)的輸出。為了準(zhǔn)確預(yù)測(cè)丁烷濃度,選擇7個(gè)與其關(guān)系最密切、易于測(cè)量的輔助變量完成預(yù)測(cè)。表1為過程變量的詳細(xì)描述:
表1 脫丁烷塔7個(gè)過程變量描述
整個(gè)模型使用的過程變量的樣本個(gè)數(shù)和輸出變量的樣本個(gè)數(shù)都為2 393,即所有的輸入樣本都有相應(yīng)的輸出。考慮到對(duì)多維數(shù)據(jù)展開實(shí)證研究,故將所有的樣本數(shù)據(jù)按照7:3的權(quán)重分為訓(xùn)練集和測(cè)試集。整個(gè)數(shù)據(jù)集分為1 675組和718組,前一部分為訓(xùn)練數(shù)據(jù)集,后一部分為測(cè)試數(shù)據(jù)集。
在神經(jīng)網(wǎng)絡(luò)模型中,隱層節(jié)點(diǎn)的選擇應(yīng)考慮兩個(gè)要求。選擇的節(jié)點(diǎn)太少,網(wǎng)絡(luò)傳輸?shù)男畔⒘刻?,學(xué)習(xí)訓(xùn)練效果達(dá)不到要求。節(jié)點(diǎn)過多會(huì)造成訓(xùn)練時(shí)間的浪費(fèi),可能無法提高準(zhǔn)確性。
在模型訓(xùn)練過程中,由于其損失函數(shù)中含有正則項(xiàng),往往需要選取合適的參數(shù)進(jìn)行調(diào)整。降噪自編碼器作為一種典型的無監(jiān)督學(xué)習(xí)模型,通過引入噪聲來增加編碼的魯棒性。首先對(duì)原始數(shù)據(jù)進(jìn)行一定程度的破壞,添加噪聲,然后將損壞后的數(shù)據(jù)輸送到編、解碼框架。編碼框架負(fù)責(zé)捕捉數(shù)據(jù)波形特征,據(jù)此消除噪聲;解碼框架能夠擴(kuò)展特征圖,提取數(shù)據(jù)細(xì)節(jié)信息,得到重構(gòu)后的數(shù)據(jù)。原始數(shù)據(jù)集總共8個(gè)維度,前七列為過程變量,最后一列為質(zhì)量變量。訓(xùn)練樣本集為1 675×8的數(shù)據(jù)矩陣,測(cè)試樣本集為718×8的數(shù)據(jù)矩陣。對(duì)其歸一化處理后添加大小相同的噪聲張量,將其范圍限制在0和1之間。一個(gè)輸入層,一個(gè)隱藏層和一個(gè)輸出層構(gòu)成了整個(gè)DAE模型。其中,隱藏層神經(jīng)元個(gè)數(shù)設(shè)置為六時(shí),誤差最小,因此確定DAE網(wǎng)絡(luò)結(jié)構(gòu)為8-6-8,分別為各層的神經(jīng)元個(gè)數(shù)。輸入層與隱藏層、隱藏層與輸層之間的傳遞函數(shù)選取tanh激活函數(shù),網(wǎng)絡(luò)訓(xùn)練次數(shù)及學(xué)習(xí)率分別設(shè)為 600及 0.1。
圖5 方法預(yù)測(cè)效果
為全面考慮可控參數(shù)對(duì)丁烷濃度的影響,將塔頂塔底溫度、壓力等7個(gè)參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的輸入,以丁烷濃度為BP神經(jīng)網(wǎng)絡(luò)的輸出。由于多層神經(jīng)網(wǎng)絡(luò)是一種無需預(yù)訓(xùn)練的有監(jiān)督學(xué)習(xí)算法,因此只需使用標(biāo)記樣本進(jìn)行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)同樣包括輸入層、隱含層、輸出層,層數(shù)都為一。通過校正各層神經(jīng)元的權(quán)值,達(dá)到誤差信號(hào)最小化。訓(xùn)練樣本集為1 675×7的數(shù)據(jù)矩陣,測(cè)試樣本集為718×7的數(shù)據(jù)矩陣。利用訓(xùn)練樣本反復(fù)訓(xùn)練,建立輸入?yún)?shù)與目標(biāo)輸出之間的非線性關(guān)系,輸入層與隱藏層、隱藏層與輸出層之間的傳遞函數(shù)均采用選取relu激活函數(shù)。最終確定模型結(jié)構(gòu)為7-10-1,分別為各層結(jié)點(diǎn)個(gè)數(shù)。網(wǎng)絡(luò)訓(xùn)練次數(shù)及學(xué)習(xí)率分別設(shè)為 400及0.2。整個(gè)模型通過RMSE及R2的值評(píng)判預(yù)測(cè)結(jié)果。
為了進(jìn)行性能比較,設(shè)置了四組對(duì)比實(shí)驗(yàn)。預(yù)測(cè)結(jié)果如圖5所示。
基于BP、PCA-BP、AE-BP及DAE-BP方法的預(yù)測(cè)結(jié)果如圖5所示。預(yù)測(cè)結(jié)果主要觀察真實(shí)值與預(yù)測(cè)值兩條曲線之間的差距,差距越小即兩條曲線越吻合,表示預(yù)測(cè)效果越好。為了公平比較不同的網(wǎng)絡(luò)預(yù)測(cè)性能,所有構(gòu)建的網(wǎng)絡(luò)都具有相同的結(jié)構(gòu),這可以消除不同網(wǎng)絡(luò)結(jié)構(gòu)造成的性能差異。從圖(a)可以看出,采用BP方法時(shí),由于單一的BP網(wǎng)絡(luò)沒有考慮數(shù)據(jù)本身的含噪問題,僅考慮非線性特征,導(dǎo)致真實(shí)值與預(yù)測(cè)值存在一定的差距,沒有很好地捕捉到樣本實(shí)際質(zhì)量變量的總體趨勢(shì),預(yù)測(cè)效果不佳。結(jié)合圖(b)(c)分析得,數(shù)據(jù)樣本利用PCA或者AE提取有效數(shù)據(jù)信息,PCA通過將初始變量降低維度又升高維度的原理完成數(shù)據(jù)重建,尋找新的基坐標(biāo)減少自由度,也保留了原有數(shù)據(jù)維度。AE通過將初始變量輸入編碼解碼框架,對(duì)原始數(shù)據(jù)進(jìn)行重構(gòu),學(xué)習(xí)數(shù)據(jù)規(guī)律,完成基本數(shù)據(jù)去噪。再將其作為結(jié)構(gòu)相同的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的輸入,從圖中可看出實(shí)際值與預(yù)測(cè)值大部分吻合,也可以較準(zhǔn)確地預(yù)測(cè)丁烷含量的值,一定程度上也改善了基本的BP存在的問題。綜合分析,圖(d)DAE在AE的基礎(chǔ)上改進(jìn)了性能,避免了數(shù)據(jù)簡(jiǎn)單重構(gòu)的問題,使其模仿加噪數(shù)據(jù)的規(guī)律并進(jìn)行訓(xùn)練學(xué)習(xí)將噪聲去除,使用DAE-BP后質(zhì)量變量即丁烷含量的預(yù)測(cè)值基本上跟隨實(shí)際值的變化而變化,預(yù)測(cè)性能有顯著提高。綜合所有的結(jié)果圖,不難看出,DAE-BP預(yù)測(cè)更穩(wěn)定,沒有大的波動(dòng),具有比上述3種模型更好的魯棒性。
為了更清晰地衡量預(yù)測(cè)效果,記錄了每種方法的RMSE和R2的值,如表2所示。越小的RMSE和越接近于1的R2代表預(yù)測(cè)效果越好的模型。由于BP未經(jīng)過數(shù)據(jù)特征提取,4種方法中表現(xiàn)最差。PCA-BP和AE-BP經(jīng)過了網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)處理獲得了合適的初始網(wǎng)絡(luò)參數(shù),能夠?qū)?fù)雜數(shù)據(jù)獲得更好的預(yù)測(cè)精度。相比之下,明顯優(yōu)于原來的BP預(yù)測(cè)模型, 預(yù)測(cè)精度有了提高,不論在訓(xùn)練集還是測(cè)試集RMSE的值變小了,R2也越來越向1靠攏。DAE-BP通過利用數(shù)據(jù)信息克服無監(jiān)督預(yù)訓(xùn)練的限制,可以進(jìn)一步降低預(yù)測(cè)RMSE。可以看出,PCA-BP和AE-BP對(duì)單一BP模型的預(yù)測(cè)性能改善低于DAE-BP,三者預(yù)測(cè)性能顯著優(yōu)于BP。DAE-BP預(yù)測(cè)模型的RMSE值是最小的,R2非常接近于1。經(jīng)過DAE改進(jìn)后的BP算法預(yù)測(cè)誤差為1.2%,RMSE相比單一的BP算法提高了3.2%精度,較PCA-BP及AE-BP預(yù)測(cè)誤差精度分別提高了2.3%、1.9%;決定系數(shù)R2為99.5%,相比單一的BP算法提高了8.7%精度,較PCA-BP及AE-BP預(yù)測(cè)精度分別提高了5.1%、3.9%。相比其他模型預(yù)測(cè)精度有更好的表現(xiàn),性能優(yōu)于其他方法,表現(xiàn)出最好的預(yù)測(cè)性能。說明該方法在化工過程質(zhì)量預(yù)測(cè)的優(yōu)越性。
表2 不同方法結(jié)果比較
鑒于化工過程數(shù)據(jù)多變量非線性、存在噪聲干擾從而影響預(yù)測(cè)精度的問題,提出了基于降噪自編碼器和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合模型。首先,DAE通過不斷訓(xùn)練和學(xué)習(xí),嘗試著去改善受損的信息,使得提取到的特征更能反映原始輸入的特點(diǎn),有效地利用數(shù)據(jù)樣本進(jìn)行網(wǎng)絡(luò)預(yù)訓(xùn)練。不僅提高模型的抗干擾能力,增加噪聲魯棒性約束,而且可以保持輸入數(shù)據(jù)的保真度。將獲取的干凈信息輸入BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行有監(jiān)督學(xué)習(xí),建立過程變量與輸出質(zhì)量變量的非線性關(guān)系,克服了單一網(wǎng)絡(luò)的局限性,提升了質(zhì)量預(yù)測(cè)的準(zhǔn)確率。為了驗(yàn)證其效果,引入了主成分分析和自編碼器對(duì)數(shù)據(jù)進(jìn)行有效信息提取,并將獲取的數(shù)據(jù)樣本輸入相同的BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)質(zhì)量預(yù)測(cè),構(gòu)建相同網(wǎng)絡(luò)是為了公平比較每種方法的預(yù)測(cè)性能。同時(shí)引入了均方根誤差、決定系數(shù)預(yù)測(cè)評(píng)價(jià)指標(biāo)評(píng)價(jià)預(yù)測(cè)效果。實(shí)驗(yàn)表明,降噪自編碼器結(jié)合BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型具有相對(duì)穩(wěn)定的預(yù)測(cè)誤差波動(dòng),表現(xiàn)出較小的均方根誤差及接近于1的決定系數(shù),因此,本文提出的方法更能滿足質(zhì)量預(yù)測(cè)的需求。
本文實(shí)驗(yàn)應(yīng)用的數(shù)據(jù)來源實(shí)際化工工業(yè)過程,對(duì)相似工業(yè)情況的研究具有借鑒意義,同時(shí)也存在一定的局限性,因此在今后的研究中,將繼續(xù)收集具有代表性的樣本數(shù)據(jù),采用更多的新案例驗(yàn)證所建立模型。