姜麗敏 ,劉誠程 ,劉 洋 ,祝英杰*
(1.長春大學(xué)網(wǎng)絡(luò)安全學(xué)院,吉林 長春 130022;2.長春大學(xué)理學(xué)院,吉林 長春 130022)
隨著社會與經(jīng)濟(jì)的快速發(fā)展,汽車成為主要出行方式,為人們的生活帶來了極大便利,但與此同時也帶來了嚴(yán)重的環(huán)境污染。汽油在燃燒過程中產(chǎn)生的有害物質(zhì)成為污染大氣環(huán)境的元兇之一。因此,提高汽油的品質(zhì)已成為各國著重解決的課題,世界各國為此制定了嚴(yán)格的汽油質(zhì)量標(biāo)準(zhǔn),試圖通過減少辛烷值的損失來降低對環(huán)境的污染程度。由于各國發(fā)展水平差異,因而制定的汽油質(zhì)量標(biāo)準(zhǔn)有所區(qū)別,但都將降低汽油的硫和烯烴含量以及保持辛烷作為發(fā)展清潔汽油的入手點(diǎn)。汽油的各項(xiàng)燃燒指標(biāo)中,辛烷值是最重要的指標(biāo)。如果可以減低辛烷值的損失,那么將會帶來巨大收益,如降低損失0.3 個單位便可以提高經(jīng)濟(jì)效益4500 萬元。
由于影響汽油辛烷值的因素眾多,且各因素相互之間存在著非線性的耦合關(guān)系,其催化裂解汽油的設(shè)備也是多種多樣,每一種因數(shù)的改變都會影響汽油裂解催化過程。本文選擇“華為杯”第十七屆中國研究生數(shù)學(xué)建模競賽E 題數(shù)據(jù)集,對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,主要包括刪除整列數(shù)據(jù)某個變量缺失值缺失比例大于50%,以及根據(jù)拉依達(dá)準(zhǔn)則對原始數(shù)據(jù)中的異常值進(jìn)行剔除工作等方法。本文采取4 種不同的方法對數(shù)據(jù)進(jìn)行降維處理,以期實(shí)現(xiàn)良好模型的建立。這四種方法各有優(yōu)點(diǎn)和缺點(diǎn)。隨機(jī)森林沒有對原始數(shù)據(jù)進(jìn)行改變,直接選取原始的重要特征,這樣做可解釋性較高。其余三種方法是對原始數(shù)據(jù)進(jìn)行轉(zhuǎn)化組合生成了新的數(shù)據(jù),這樣做可能對特征解釋性沒有隨機(jī)森林高,但是對因變量產(chǎn)品中辛烷值的貢獻(xiàn)可能會比隨機(jī)森林高。因?yàn)殡S機(jī)森林篩選出的變量可解釋并且隨機(jī)森林對原始的樣本擬合度也較高,所以對于后邊的建模過程主要采用隨機(jī)森林的降維結(jié)果。最后篩選出的特征為x22、x76、x132、x159、x199、x209、x225、x245、x251、x263、x266、x268、x270、x274、x275、x276、x277、x290、x314、x355、x356、x360、x364。
選取隨機(jī)森林挑選出的16 個主要影響因素作為模型的輸入,利用隨機(jī)森林降維后的特征相關(guān)系數(shù)圖來檢驗(yàn)變量的相關(guān)性和正態(tài)Q-Q 圖和P-P 圖來檢驗(yàn)變量的正態(tài)性。R 語言中逐步回歸是依據(jù)AIC 準(zhǔn)則和使殘差平方和盡量小來選定最優(yōu)模型的,主要依據(jù)的是AIC 準(zhǔn)則。根據(jù)AIC 準(zhǔn)則,AIC 越小模型就越有效,逐步回歸的過程就是選取最小的AIC,有向前法(逐個增加變量)和向后法(逐個減少變量)。經(jīng)過逐步回歸剩余的變量有x356、x209、x159、x236。對回歸系數(shù)的顯著性進(jìn)行檢驗(yàn)?zāi)P偷暮侠硇?。模型算法如公式?):
其中Y 是辛烷損失值,a、b、c 和d 取值在[0,0.1]。
表1 逐步回歸結(jié)果1
表2 逐步回歸結(jié)果2
建立的模型需要對回歸系數(shù)的顯著性進(jìn)行檢驗(yàn),原假設(shè)H0:βi=0,自變量的無論怎么變化乘上0 之后一直都是0,也就無法引起因變量的變化,于是兩者沒有關(guān)系。系數(shù)的顯著性檢驗(yàn)都是用tfalse 統(tǒng)計量,其中,
同樣的對于系數(shù)的顯著性檢驗(yàn)也與F 檢驗(yàn)是一樣的道理,可以用t 統(tǒng)計量判斷結(jié)果,也可以用p 值判斷出結(jié)果。利用p值檢驗(yàn)的好處是檢驗(yàn)結(jié)論對任何統(tǒng)計量都適用不需要改變,所以本文F 檢驗(yàn)和t 檢驗(yàn)都采用p 值來判斷。這里選擇的顯著性水平是0.1。
優(yōu)化的過程要保證產(chǎn)品中硫含量不大于5μg/g,對辛烷值損失降幅大于30%的樣本進(jìn)行優(yōu)化,根據(jù)歷史數(shù)據(jù),汽油的產(chǎn)品辛烷值損失平均1.37 個單位,但是同類裝置只有0.6,所以我們想要盡可能地使辛烷值損失降低,根據(jù)上述信息,列出方程式:
解出損失需要小于0.959,這里近似取1,也就是要優(yōu)化損失值大于1 的樣本,接下來開始篩選出辛烷值損失降幅大于30%的樣本,一共有256個樣本需要優(yōu)化。優(yōu)化需滿足下列條件:
因?yàn)閮?yōu)化過程中原料、待生吸附劑、再生吸附劑的性質(zhì)是保持不變的,所以在方程中x356 是不能改變的,要保證x362<5,所以要改變的操作變量只有x159、x209、x236 這三個變量分別是D-109 松動風(fēng)流量、冷氮?dú)膺^濾器ME-114 差壓、R-102 床層吸附劑料位密度。在原料中辛烷值不變和控制硫含量的情況下,要想降低損失在每個變量限制的范圍內(nèi)和每次能改變的最大值的要求下盡量減小D-109 松動風(fēng)流量和冷氮?dú)膺^濾器ME-114 差壓以及增大R-102 床層吸附劑料位密度。下圖是在控制硫含量的前提下,減小D-109 松動風(fēng)流量10 個單位,增大R-102 床層吸附劑料位密度5 個單位后的優(yōu)化結(jié)果。
從圖1 中可以看出,用本文提出的模型進(jìn)行優(yōu)化后辛烷的損失值有著顯著的降低。我國幅員遼闊,資源儲備量大。由于汽車已經(jīng)成為人們?nèi)粘I畹墓ぞ?,已?jīng)離不開人們的生活,由此導(dǎo)致原油的需求量巨大,我國對外的依存度超過了 70%。因此降低辛烷損失值,可以提高巨額的經(jīng)濟(jì)效益。所以該運(yùn)用該方法進(jìn)行優(yōu)化模型,不僅在學(xué)術(shù)上對辛烷損失值的研究提供了一定的參考價值,還會對我國經(jīng)濟(jì)效益產(chǎn)生巨大反饋。
圖1 損失改變值
我國的原油進(jìn)口主要來源于原油豐富的中東地區(qū),但中東地區(qū)的原油由于地質(zhì)和其他一些因素,其中含有硫以及高硫原油。而在原油的組成中,重油又占了大部分,這部分的重油(以硫?yàn)榇淼碾s質(zhì)含量也高)是很難被直接利用,需要深度加工轉(zhuǎn)變后,才能供人們?nèi)粘I钍褂?。對化工過程進(jìn)行數(shù)學(xué)建模是通過數(shù)據(jù)的聯(lián)系以及相關(guān)的設(shè)備機(jī)理來進(jìn)行生產(chǎn)優(yōu)化,但由于催化裂化過程復(fù)雜,且存在多種功能不同的設(shè)備,它們之間的操作變量也變得復(fù)雜,且存在線性或非線性以及相關(guān)關(guān)聯(lián)的耦合。同時,在化工中的數(shù)學(xué)關(guān)聯(lián)模型也不多,因此,建模時對原料的分析要求得非常高,一旦在優(yōu)化中不及時,將造成效果的不理想。