黃 穎
(上海漢中諾軟件科技有限公司,上?!?00120)
探索性數(shù)據(jù)分析在乙二醇生產(chǎn)監(jiān)控中的應(yīng)用
黃穎
(上海漢中諾軟件科技有限公司,上海200120)
摘要:化工生產(chǎn)數(shù)據(jù)具有多變量之間關(guān)聯(lián)、非線性、非正態(tài)分布、高噪聲等特點(diǎn)。由于數(shù)理統(tǒng)計(jì)的局限性,為擺脫假設(shè)束縛,采用探索性數(shù)據(jù)分析“問題—數(shù)據(jù)—分析—模型—結(jié)構(gòu)”的邏輯,基于BMOS工業(yè)優(yōu)化軟件,利用聚類分析方法探索乙二醇氧化反應(yīng)生產(chǎn)監(jiān)控中采集的數(shù)據(jù)結(jié)構(gòu)特點(diǎn);通過主成分分析(PCA)算法提取特征參數(shù),對(duì)乙二醇生產(chǎn)數(shù)據(jù)進(jìn)行挖掘分析,得出優(yōu)化方案。該方案為生產(chǎn)運(yùn)行優(yōu)化創(chuàng)造了條件。
關(guān)鍵詞:生產(chǎn)監(jiān)控聚類分析數(shù)據(jù)分析優(yōu)化數(shù)據(jù)評(píng)價(jià)樣本統(tǒng)計(jì)
0引言
EO/EG生產(chǎn)采用美國SD公司專利技術(shù),主原料為乙烯,產(chǎn)品為高純度的環(huán)氧乙烷(EO)和乙二醇(EG)。裝置工程采用了先進(jìn)過程控制技術(shù),該技術(shù)的特點(diǎn)在于利用模型預(yù)測功能,通過多變量控制手段提高裝置操作平穩(wěn)性,實(shí)現(xiàn)工藝控制目標(biāo);同時(shí),利用線性規(guī)劃功能,將操作點(diǎn)推向優(yōu)化點(diǎn),在滿足所有質(zhì)量和安全約束條件的前提下實(shí)現(xiàn)卡邊操作,以達(dá)到提高產(chǎn)品反應(yīng)收率、產(chǎn)能和降低能耗的目的。
但是先進(jìn)過程控制器在長周期運(yùn)行后,由于裝置工藝狀況改變,控制器模型與實(shí)際工況不能很好地匹配,使控制性能明顯下降。依靠傳統(tǒng)控制器的維護(hù)方法,通過人工現(xiàn)場收集數(shù)據(jù)、辨識(shí)模型、修改模型參數(shù),不但需要花費(fèi)很多的人力和時(shí)間成本,而且若非由原建模技術(shù)人員進(jìn)行校正,還會(huì)因不熟悉變量之間的耦合性而將初始模型越調(diào)越亂,從而造成控制器停用。
如能在控制器運(yùn)行過程中小幅度調(diào)整操作變量,完成用于“校準(zhǔn)模式”的裝置自動(dòng)階躍測試,并對(duì)數(shù)據(jù)進(jìn)行探索性分析,明確參數(shù)調(diào)整范圍、指導(dǎo)模型校正,可降低先進(jìn)過程控制器的維護(hù)成本、提高控制精度。
1探索性數(shù)據(jù)分析
根據(jù)優(yōu)化目標(biāo),首先初步分析收集的數(shù)據(jù),并根據(jù)數(shù)據(jù)特點(diǎn)指導(dǎo)建模和校正模型[1]。
1.1乙二醇裝置氧化反應(yīng)工藝
乙烯和氧氣以一定的組分比例進(jìn)入反應(yīng)器進(jìn)行氧化反應(yīng),在甲烷及銀催化劑的作用下乙烯轉(zhuǎn)化為環(huán)氧乙烷(EO),同時(shí)生成副產(chǎn)物二氧化碳和水。甲烷經(jīng)壓縮機(jī)增壓后進(jìn)入反應(yīng)氣回路,以維持反應(yīng)氣體平衡,使乙烯和氧氣濃度保持在較高的安全范圍內(nèi)。為了控制氧化反應(yīng)在最優(yōu)條件下進(jìn)行,并抑制副反應(yīng),在反應(yīng)氣中加入少量抑制劑(氯乙烷,EC)[2]。
1.2選擇性計(jì)算方法和優(yōu)化目標(biāo)
選擇性S指消耗每摩爾乙烯所生成的環(huán)氧乙烷摩爾數(shù),是由反應(yīng)溫度的變化和添加到反應(yīng)混合物的抑制劑控制的。選擇性計(jì)算舉例參數(shù)[3]如表1所示。
S1=ΔEO/ΔC2H4=1.79/2.26=79.20%
S2=2ΔEO/(2ΔEO+ΔCO2)= 2×1.79/
(2×1.79+0.92)=79.56%
S3=6ΔEO/(5ΔEO+2ΔO2)= 6×1.79/
(5×1.79+2×2.28)=79.50%
S1是選擇性的原始定義式,S2、S3是常用的修正式。在此采用修正式:S=(S2+S3)/2=79.53%。
表1 選擇性計(jì)算舉例參數(shù)表
選擇性S的影響因素和優(yōu)化目標(biāo)如表2所示。
表2 S的影響因素和優(yōu)化目標(biāo)
1.3樣本數(shù)據(jù)的評(píng)價(jià)
原始數(shù)據(jù)采樣周期為1min,共收集64 000組數(shù)據(jù),約44d。為提高數(shù)據(jù)的可靠性和可分析性,對(duì)原始樣本中的離群點(diǎn)和噪聲進(jìn)行處理,以便剔除假數(shù)據(jù)[4]。在數(shù)據(jù)采集的44d中,采集了用于壓力補(bǔ)償?shù)募淄榱髁繑?shù)據(jù),甲烷實(shí)際流量始終在小信號(hào)切除的范圍內(nèi),基本無補(bǔ)償壓力。刪除數(shù)據(jù)中因工藝調(diào)整時(shí)間段產(chǎn)生的異常樣本,最終保留2 104個(gè)樣本構(gòu)成訓(xùn)練集。
分別對(duì)全體訓(xùn)練集進(jìn)行描述性統(tǒng)計(jì)分析,求出基本統(tǒng)計(jì)量,如表3所示。根據(jù)選擇性S的數(shù)值,將數(shù)據(jù)集分為兩類:S≥82.2%為優(yōu)類,S<82.2%為劣類。
表3 訓(xùn)練集全體樣本
為了探索訓(xùn)練集數(shù)據(jù)結(jié)構(gòu)的特點(diǎn),采用“物以類聚”的聚類分析方法。該方法直接根據(jù)數(shù)據(jù)本身的結(jié)構(gòu)特點(diǎn)來挖掘結(jié)構(gòu)性方面的知識(shí)和規(guī)律。采用全體樣本在DMOS軟件上構(gòu)建高維空間,通過主成分分析(principalcomponentanalysis,PCA)算法提取特征,從中選擇包含信息量最多的前兩個(gè)特征,降維后得到如圖1所示的兩維圖形[5]。該圖形在DMOS軟件中稱為“特征圖”,灰點(diǎn)為優(yōu)類樣本,黑色點(diǎn)為劣類樣本。DMOS軟件利用自身所帶的最小二乘擬合算法求出S與P1、P2之間的二元二次回歸方程中的系數(shù),然后繪制出二維等高線,如圖1中橢圓和圓弧所示,這些等高線上的點(diǎn)由P1和P2形成,每一根等高線代表一個(gè)目標(biāo)值,即選擇性S。
圖1 訓(xùn)練集全體樣本聚類分析特征圖
由圖1可見,訓(xùn)練集的數(shù)據(jù)云明顯分為右上方和左下方兩個(gè)板塊。經(jīng)進(jìn)一步分析發(fā)現(xiàn),訓(xùn)練集數(shù)據(jù)云的總體結(jié)構(gòu)分布與反應(yīng)溫度有關(guān),右上方的數(shù)據(jù)云板塊對(duì)應(yīng)的反應(yīng)溫度低(243.9 ℃),左下方的數(shù)據(jù)云板塊對(duì)應(yīng)的反應(yīng)溫度高(244.7 ℃)。
為深入分析數(shù)據(jù)規(guī)律,將訓(xùn)練集分兩個(gè)子集研究,即“反應(yīng)溫度低子集1”(簡稱“訓(xùn)練子集1”)和“反應(yīng)溫度高子集2”(簡稱“訓(xùn)練子集2”),見表4和表5。
由表3~表5可見:在目前的生產(chǎn)情況下,選擇性S的平均值為82.2%,無論反應(yīng)溫度高或低,S均維持此水平。在訓(xùn)練集數(shù)據(jù)中,抑制劑的數(shù)據(jù)波動(dòng)最大。
表4 訓(xùn)練子集1統(tǒng)計(jì)量(1)
表5 訓(xùn)練子集2統(tǒng)計(jì)量(1)
1.4數(shù)據(jù)分析
對(duì)于“訓(xùn)練子集1”和“訓(xùn)練子集2”,運(yùn)用數(shù)理統(tǒng)計(jì)和模式識(shí)別相結(jié)合的方法進(jìn)行分析,根據(jù)特征圖上“優(yōu)”、“劣”兩類樣本分布,區(qū)分界限,并確定決策區(qū)域,逆映射后得出生產(chǎn)優(yōu)化方案[6]。
1.4.1“反應(yīng)溫度低子集1”的數(shù)據(jù)分析
“訓(xùn)練子集1”的反應(yīng)溫度約為243.9 ℃,有樣本點(diǎn)1 062個(gè)、優(yōu)類樣本437個(gè),占總樣本數(shù)的41.15%,差類樣本625個(gè)。訓(xùn)練子集1的統(tǒng)計(jì)結(jié)果見表6。
表6 訓(xùn)練子集1統(tǒng)計(jì)量(2)
從表6可見,兩類樣本在S平均值上僅相差0.136%。用訓(xùn)練子集1樣本在DMOS軟件上構(gòu)建一個(gè)高維空間,由PCA算法提取包含信息量最多的前兩個(gè)特征P11、P12構(gòu)建特征空間,將訓(xùn)練集數(shù)據(jù)向特征空間投影得圖2。
圖2 訓(xùn)練子集1樣本特征圖
由圖2可以看到,優(yōu)類樣本大多分布在特征圖的右側(cè),劣類樣本分布在特征圖的左側(cè)。特征圖中橫軸為第一特征向量P11,縱軸為第二特征向量P12,分別為五個(gè)影響因素的兩個(gè)不同線性組合并互為正交,被稱為特征方程(1)和特征方程(2)。
P11=-0.271 6×[反應(yīng)溫度]+0.322 6×[反應(yīng)壓力]-0.537 7×[抑制劑]+0.528 9×[乙烯進(jìn)]+
0.503 3×[O2進(jìn)]
(1)
P12=0.565 4×[反應(yīng)溫度]+0.643 6×[反應(yīng)壓力]+0.279 8×[抑制劑]-0.188 9×[乙烯進(jìn)]+
0.39×[O2進(jìn)]
(2)
根據(jù)特征方程繪制的載荷圖如圖3所示,圖3中各個(gè)變量所在的位置對(duì)應(yīng)特征方程中的系數(shù)。
圖3 訓(xùn)練子集1樣本載荷圖
由圖2可見,優(yōu)化規(guī)律較為明顯,如果將生產(chǎn)控制在特征圖的右邊,則能大大增加優(yōu)類樣本點(diǎn)的概率,有效提高選擇性S。由圖3可見,反應(yīng)壓力所處的位置離原點(diǎn)的距離最遠(yuǎn),說明它對(duì)選擇性S影響最大[7]。由于采集的用于壓力補(bǔ)償?shù)募淄榱髁繑?shù)據(jù)始終在小信號(hào)切除的范圍內(nèi),基本沒有補(bǔ)償壓力,所以認(rèn)為反應(yīng)壓力是穩(wěn)定的,不作為重點(diǎn)考慮;其次,依次考慮反應(yīng)溫度、進(jìn)料中的氧氣含量、抑制劑進(jìn)料量、進(jìn)料中乙烯的含量。但由表4和表5可見,目前生產(chǎn)情況下,無論反應(yīng)溫度高和低,選擇性S的平均值均維持在82.2%的水平上。目前對(duì)生產(chǎn)參數(shù)產(chǎn)生影響的依次是進(jìn)料中的氧氣含量、抑制劑進(jìn)料量、進(jìn)料中的乙烯含量。
在圖2上選擇了三個(gè)典型區(qū)域,分別為1、2、3號(hào)區(qū),其中兩個(gè)位于優(yōu)化區(qū)、一個(gè)位于劣類樣本區(qū)。根據(jù)載荷圖分析方法的方向規(guī)則,當(dāng)位于載荷圖橫坐標(biāo)軸上(下)方的變量數(shù)值增加時(shí),樣本點(diǎn)會(huì)在對(duì)應(yīng)特征圖上向上(下)移動(dòng)。同理,可推廣到左、右以及任何方向。將圖2和圖3對(duì)應(yīng)分析,在反應(yīng)溫度合理低的時(shí)候,應(yīng)減少抑制劑進(jìn)料量、增加進(jìn)料中的氧氣含量和乙烯含量,使反應(yīng)點(diǎn)向1、2號(hào)區(qū)移動(dòng),而遠(yuǎn)離3號(hào)區(qū)。為了求出可供操作的優(yōu)化生產(chǎn)方案,需在DMOS軟件上分別對(duì)這些區(qū)域進(jìn)行100萬次Monte-Carlo模擬。
Monte-Carlo模擬的目的是實(shí)現(xiàn)特征空間與測量空間的逆映射。為將優(yōu)化區(qū)(即決策區(qū)域)逆映射到測量空間,以求得生產(chǎn)優(yōu)化操作參數(shù)范圍,軟件利用Monte-Carlo算法模擬對(duì)象的隨機(jī)環(huán)境。根據(jù)概率論中的大數(shù)定律,試驗(yàn)次數(shù)越多,試驗(yàn)結(jié)果的頻數(shù)就越接近其概率。因此,利用大量隨機(jī)試驗(yàn)所得的結(jié)果,即可逼近逆映射的真實(shí)解[8]。Monte-Carlo模擬得出的生產(chǎn)操作參數(shù)范圍如表7所示。樣品統(tǒng)計(jì)結(jié)果如表8所示。
表7 生產(chǎn)操作范圍
表8 樣本統(tǒng)計(jì)結(jié)果
“反應(yīng)溫度低子集1”數(shù)據(jù)分析小結(jié)如下。
①當(dāng)反應(yīng)溫度控制在243.9 ℃低位運(yùn)行時(shí),存在較為明顯的優(yōu)化區(qū),如生產(chǎn)操作參數(shù)調(diào)控得當(dāng),可以提高選擇性S。
②就目前收集的五個(gè)變量而言,反應(yīng)溫度已基本固定,影響選擇性S的主要因素是抑制劑、乙烯進(jìn)料量和O2進(jìn)料量,反應(yīng)壓力影響較小。適當(dāng)增加乙烯進(jìn)料量和O2進(jìn)料量、減少抑制劑量,有利于提高選擇性S。
③以上三個(gè)典型區(qū)域中,反應(yīng)溫度均在243.8~243.9 ℃,但抑制劑的差別比較大,相應(yīng)的選擇性S分別為82.6%、82.3%、82.0%。可見,當(dāng)反應(yīng)溫度處于低位(243.9 ℃)運(yùn)行時(shí),抑制劑宜少不宜多。
④分析1號(hào)區(qū)可知,在進(jìn)料乙烯濃度和進(jìn)料氧氣濃度高的時(shí)候,如30.16mol%、7.92mol%,抑制劑為0.53kg·h-1,可使選擇性S達(dá)到82.6%。與所收集的訓(xùn)練集數(shù)據(jù)平均水平(82.2%)相比,選擇性S提高了0.4%。
⑤根據(jù)對(duì)3號(hào)區(qū)的分析,進(jìn)料乙烯濃度和進(jìn)料氧氣濃度均較低,如29.42mol%和7.72mol%,如果抑制劑量太高(如0.63mol%),則選擇性S明顯降低至82.0%。與平均水平(82.2%)相比,選擇性S降低了0.2%,在生產(chǎn)中應(yīng)盡量避免。
建議:當(dāng)反應(yīng)溫度低位運(yùn)行(243.9 ℃)時(shí),其他參數(shù)應(yīng)調(diào)控在如表9所示的范圍內(nèi)。
表9 參數(shù)調(diào)控范圍
1.4.2“反應(yīng)溫度高子集2”的數(shù)據(jù)分析
“訓(xùn)練子集2”對(duì)應(yīng)的反應(yīng)溫度為244.7 ℃,共有樣本1 042個(gè)。其中,優(yōu)類樣本523個(gè),占訓(xùn)練集總樣本數(shù)的50.19%,劣類樣本519個(gè)。參照“訓(xùn)練子集1”對(duì)“訓(xùn)練子集2”進(jìn)行三個(gè)典型區(qū)域分析,小結(jié)如下。
①當(dāng)反應(yīng)溫度處于高位運(yùn)行(244.7 ℃)時(shí),如果乙烯進(jìn)料量為30~31mol%、O2進(jìn)料量為7.8~8.1mol%,抑制劑量應(yīng)控制在0.65~0.70kg·h-1。該方法可提高選擇性S至82.4%;反之則降低選擇性。
②為確保選擇性S不下降,需減少抑制劑量,如當(dāng)乙烯進(jìn)料和O2進(jìn)料分別為28.3kg·h-1和7.4kg·h-1時(shí),抑制劑量調(diào)節(jié)到0.58kg·h-1,選擇性可達(dá)82.5%。
③經(jīng)過對(duì)采集數(shù)據(jù)運(yùn)用數(shù)理統(tǒng)計(jì)和模式識(shí)別相結(jié)合的方法進(jìn)行的結(jié)構(gòu)特征分析,根據(jù)特征圖上“優(yōu)”、“劣”兩類樣本分布來區(qū)分界限確定決策區(qū)域,逆映射到測量空間,得出生產(chǎn)優(yōu)化方案,如表10所示。
表10 生產(chǎn)優(yōu)化方案調(diào)控范圍
2結(jié)束語
化工生產(chǎn)過程是一個(gè)復(fù)雜的物理和化學(xué)過程。采用探求性數(shù)據(jù)分析“問題—數(shù)據(jù)—分析—模型—結(jié)論”的邏輯,擺脫假設(shè)束縛,利用聚類分析方法,通過主成分分析得到優(yōu)化方案。該方案運(yùn)用于先進(jìn)控制自適應(yīng)配置,可以提高模型校正的精確度,起到事半功倍的效果,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)決策。
參考文獻(xiàn)
[1] 竺建敏.AspenTech流程工業(yè)自動(dòng)化解決方案[J].自動(dòng)化博覽,2012(12):43-47.
[2] 中國石化上海石油化工股份有限公司.Q/HG12-46-2006 乙二醇裝置工藝技術(shù)規(guī)程(暫行稿)[S].2006:11-15.
[3] 中國石化上海石油化工股份有限公司.Q/HG12-45-2006 乙二醇裝置崗位操作法(暫行稿)[S].2006:34-35.
[4] 陸治榮,陳念貽,陸文聰.DMOS-基于多種數(shù)據(jù)挖掘算法的工業(yè)優(yōu)化軟件系列[J].計(jì)算機(jī)與應(yīng)用化學(xué),2002,19(6):683-690.
[5] 陸治榮.探索性數(shù)據(jù)分析及其在流程業(yè)的應(yīng)用[M].北京: 中國石化出版社, 2013.
[6] 陳念貽, 陸文聰,陸治榮.優(yōu)化建模和機(jī)器學(xué)習(xí)理論的新發(fā)展[J].計(jì)算機(jī)與應(yīng)用化學(xué),2002,19(6):677-682.
[7] 顧逸鑫,唐振華,朱以斌.DMOS優(yōu)化軟件在芳烴抽提裝置的工業(yè)應(yīng)用[C]//第九屆MES開發(fā)與應(yīng)用專題研討會(huì)論文集,上海:中國自動(dòng)化學(xué)會(huì)儀表與裝置專業(yè)委員會(huì),2010:36-46.
[8] 陸治榮.數(shù)據(jù)挖掘與MES中的數(shù)據(jù)智能處理[C]//第九屆MES開發(fā)與應(yīng)用專題研討會(huì)論文集.上海:中國自動(dòng)化學(xué)會(huì)儀表與裝置專業(yè)委員會(huì),2010:14-26.
ApplicationofExploratoryDataAnalysisinProductionMonitoringofGlycolOxidation
Abstract:Chemical product data have characteristics of correlation among multiple variables , non-linear, abnormal distribution, high noise, etc. Due to the limitations of mathematical statistics , and in order to get rid of the hypothesis, exploratory data are used to analyzed the logic of “problem-data-analysis-model-structure”. Based on DMOS industrial optimization software, the clustering analysis method is used to explore the features of structure of data collected in production monitoring of glycol oxidation. Through using principal component analysis (PCA) algorithm, the characteristics of data are extracted. The production data of Glycol oxidation are mining analyzed,and the optimization scheme is obtained. The scheme creates the conditions for optimizing productive operation.
Keywords:Produce process monitorClustering analysisData analysisOptimizationData evaluationSample statistics
中圖分類號(hào):TH86;TP182
文獻(xiàn)標(biāo)志碼:A
DOI:10.16086/j.cnki.issn 1000-0380.201606010
修改稿收到日期:2015-10-14。
作者黃穎(1967-),女,2006年獲畢業(yè)于華東理工大學(xué)控制工程專業(yè),獲碩士學(xué)位,高級(jí)工程師;主要從事MES項(xiàng)目實(shí)施和管理工作。