王 佳,郝 鑫,徐 硯
(1.中國軟件評測中心,北京 100048;2.中國電子科技網(wǎng)絡(luò)信息安全有限公司,四川 成都 610000)
對于工業(yè)報(bào)警系統(tǒng),報(bào)警閾值的合理設(shè)置直接影響報(bào)警系統(tǒng)的運(yùn)行效率。由于過渡階段與穩(wěn)定階段不同,如果將過渡階段和穩(wěn)定階段一起處理,會(huì)降低報(bào)警的準(zhǔn)確性,易產(chǎn)生誤報(bào)警和漏報(bào)警。在設(shè)定值切換過程或過渡過程中,如果報(bào)警閾值不進(jìn)行相應(yīng)改變,會(huì)發(fā)生大量的誤報(bào)率;而較為寬松的報(bào)警閾值也會(huì)造成對過程的擾動(dòng)不敏感,由此出現(xiàn)漏報(bào)警[1-2]。
針對報(bào)警閾值優(yōu)化問題,Izadi[3]提出以誤報(bào)率、漏報(bào)率和檢測延遲為目標(biāo)的基于操作特性曲線報(bào)警閾值的設(shè)計(jì)方法。文獻(xiàn)[4-9]介紹了基于報(bào)警濾波、報(bào)警死區(qū)、報(bào)警延時(shí)3種優(yōu)化方法中與報(bào)警閾值設(shè)計(jì)之間的關(guān)系,使得報(bào)警閾值能夠處在一個(gè)最佳狀態(tài)。Yang[10]提出基于報(bào)警數(shù)據(jù)和過程數(shù)據(jù)的一致相關(guān)性分析實(shí)現(xiàn)報(bào)警閾值優(yōu)化設(shè)計(jì)。目前,大多數(shù)相關(guān)文獻(xiàn)都是針對固定閾值的設(shè)計(jì),由于閾值的選擇隨著系統(tǒng)的狀態(tài)、噪聲的變化而變化,而固定閾值的設(shè)計(jì)方法不能適應(yīng)這些變化,因此需要使報(bào)警閾值能夠適應(yīng)這些變化。Beebe[11]提出了基于狀態(tài)改變的報(bào)警泛濫合理化方法,但是需要過程知識來確定模式的改變。Zhu[12]提出的動(dòng)態(tài)閾值方法沒有考慮帶寬系數(shù)的變化。
本文提出了一種基于閾值監(jiān)測的優(yōu)化改進(jìn)思路,即采用滑動(dòng)窗口算法訓(xùn)練歷史數(shù)據(jù),得到帶寬系數(shù)和過渡過程的先驗(yàn)信息。由于過渡過程是一個(gè)動(dòng)態(tài)變化過程,基于貝葉斯估計(jì)理論,結(jié)合歷史數(shù)據(jù)和新數(shù)據(jù)來推測下一時(shí)刻的數(shù)據(jù)得到報(bào)警閾值;在穩(wěn)態(tài)過程中,采用改進(jìn)的遞推公式實(shí)時(shí)估計(jì)的均值、方差得到報(bào)警閾值,建立閾值監(jiān)測與運(yùn)行工況或運(yùn)行瞬態(tài)的映射關(guān)系,使報(bào)警閾值能夠根據(jù)歷史數(shù)據(jù)和工況自動(dòng)調(diào)整。
Y為工業(yè)過程參數(shù)的測量值,假設(shè)數(shù)學(xué)均值E(y)=μ,方差D(y)=σ2,根據(jù)切比雪夫不等式,對于任意y,可得:
測量數(shù)據(jù)的均值為:
其中yi為實(shí)際測量數(shù)據(jù),m為測量數(shù)據(jù)的均值。對于N時(shí)刻方差估計(jì)為S,計(jì)算公式為:
式(6)中確定的空間范圍對于任意的隨機(jī)變量都是成立的,且為最大的正常區(qū)間。報(bào)警自適應(yīng)閾值根據(jù)式(3)中的檢測區(qū)間的均值μ、方差σ和帶寬系數(shù)n的變化而改變。對于帶寬系數(shù)n難以實(shí)現(xiàn)自適應(yīng)計(jì)算,一般利用離線數(shù)據(jù)進(jìn)行訓(xùn)練,在線監(jiān)控過程中取定值。對于均值μ、方差σ,可用在線計(jì)算實(shí)時(shí)數(shù)據(jù)來代替。
正常情況下,根據(jù)切比雪夫不等式,對于任意ε>0,可得:
RFAR、RMAR為誤報(bào)警率(False Alarm Rate,F(xiàn)AR)和漏報(bào)警率(Missing Alarm Rate,MAR)的最大上限值,m和S為實(shí)時(shí)數(shù)據(jù)估計(jì)的均值和方差。
初始系數(shù)在訓(xùn)練過程中不斷進(jìn)行調(diào)整,采用最速下降法對系數(shù)n進(jìn)行修正,有:
式中:eN為N時(shí)刻的修正量,η為調(diào)整系數(shù),滿足 0<η<1/yN,且有:
對于整個(gè)工程來說,分成過渡過程和穩(wěn)態(tài)過程兩種情況進(jìn)行均值和方差的計(jì)算。帶寬系數(shù)確定后,報(bào)警閾值的上下限估計(jì)和均值、方差有關(guān),需要在線實(shí)時(shí)更新均值和方差的量進(jìn)行閾值的不斷調(diào)整。
1.2.1 過渡過程自適應(yīng)閾值計(jì)算
由于工業(yè)過程在狀態(tài)切換或者過渡過程方面的復(fù)雜特性,為了更好地對過程變量進(jìn)行動(dòng)態(tài)報(bào)警閾值設(shè)計(jì),采用滑動(dòng)窗口(Sliding Window,SW)算法對連續(xù)數(shù)據(jù)進(jìn)行分割,在建立的回歸模型基礎(chǔ)上用新的數(shù)據(jù)擴(kuò)大現(xiàn)有的數(shù)據(jù)段建立新的回歸模型。若該模型的擬合誤差大于預(yù)先設(shè)定的分割點(diǎn)誤差,則將新的數(shù)據(jù)歸入新的數(shù)據(jù)段,用新的模型進(jìn)行分析;若上述分割點(diǎn)誤差小于設(shè)定誤差值,則繼續(xù)分析下一個(gè)數(shù)據(jù)[13-14]。
對過渡過程[t1,tn]的時(shí)間序列基于數(shù)據(jù)擬合建立測量變量回歸模型:
因此,把對變量的估計(jì)轉(zhuǎn)化為對斜率b和截?cái)嗾`差a的估計(jì)??紤]到測量變量受到噪聲的影響,假設(shè)每個(gè)測量變量的噪聲服從獨(dú)立同分布,因此得到測量變量的模型為[15-18]:
其中ε是隨機(jī)誤差,服從均值為0、方差為δ2的正態(tài)分布,記為ε~N(0,δ2),因此可以把報(bào)警閾值的概率模型描述為均值為a+bti,方差為δ2,記為yi~N(a+bti,δ2)。
為了更好地利用歷史數(shù)據(jù)估計(jì)參數(shù),提出了基于貝葉斯的線性方程估計(jì)對參數(shù)a和b進(jìn)行預(yù)測。考慮到tn+1時(shí)刻的數(shù)據(jù),能夠預(yù)測yn+1的分布函數(shù)。
根據(jù)貝葉斯估計(jì)理論,計(jì)算參數(shù)a和b的后驗(yàn)概率分布函數(shù)為:
根據(jù)后驗(yàn)分布函數(shù)的推導(dǎo),可得預(yù)測值的均值和方差為:
由此,可得到殘差平方和公式為:
如果Qe大于最大容許誤差β,擬合的數(shù)據(jù)(t1,tn)不符合要求,需要重新進(jìn)行分段線性化處理;如果Qe小于最大容許誤差β,可立刻得到動(dòng)態(tài)報(bào)警閾值。
1.2.2 穩(wěn)態(tài)過程自適應(yīng)閾值計(jì)算
對于穩(wěn)態(tài)過程如果按照式中的均值和方差計(jì)算公式,隨著數(shù)據(jù)量的增大,計(jì)算量將加大。為了滿足實(shí)時(shí)對均值和方差的估計(jì)要求,采用迭代遞推公式[19]:
對于N+1時(shí)刻的均值估計(jì),只需要計(jì)算N時(shí)刻的均值和N+1時(shí)刻的數(shù)據(jù),大大減小了計(jì)算量。
其中,方差的迭代遞推公式為:
由此可知,N+1時(shí)刻的方差可由N時(shí)刻的方差、均值和N+1時(shí)刻的數(shù)據(jù)求得。
可以推導(dǎo)出N+1時(shí)刻的閾值范圍為:
為了提高報(bào)警系統(tǒng)的性能,建立的動(dòng)態(tài)閾值應(yīng)該同時(shí)重視均值和方差的變化,使得到的閾值具有更好的適用性。因此,對于當(dāng)方差大于均值的情況sy2≥my,為了更加合理化選取閾值,應(yīng)該取sy2=my,得到自適應(yīng)閾值為:
綜合兩種情況,新的自適應(yīng)閾值為:
my±n*sy2能夠消除過渡過程的誤報(bào)警,my±(1+n)能夠減小方差的影響,減小故障信號造成的漏報(bào)警。
自適應(yīng)報(bào)警閾值的算法流程如圖1所示。
圖1 算法流程
離線數(shù)據(jù)訓(xùn)練步驟如下:
(1)系統(tǒng)初始化,利用滑動(dòng)窗口算法對提取過渡過程知識,以便進(jìn)行貝葉斯估計(jì);
(2)利用整個(gè)過程的數(shù)據(jù)離線訓(xùn)練帶寬系數(shù)n。
在線閾值計(jì)算步驟如下:
(1)輸入一系列數(shù)據(jù)集(x(k),y(k)),選擇數(shù)據(jù)的初始點(diǎn)x(0)、y(0);
(2)判斷過程是否處在過渡過程,如果是,通過貝葉斯估計(jì)方法估計(jì)參數(shù)a和b;如果不是,轉(zhuǎn)到步驟(5);
(3)對于建立的模型,通過式(31)和式(32)不斷更新參數(shù)b,通過式(33)和式(34)不斷更新參數(shù)a;
(4)判斷通過殘差平方計(jì)算得到的回歸模型是否符合要求,如果大于最大容許誤差大于β,轉(zhuǎn)到步驟(2),如果達(dá)到要求繼續(xù)轉(zhuǎn)到步驟(6);
1.進(jìn)一步完善金融制度,加強(qiáng)金融支持力度。金融業(yè)的發(fā)展能夠促進(jìn)現(xiàn)代化經(jīng)濟(jì)建設(shè),政府應(yīng)該制定相關(guān)法規(guī),通過法律法規(guī)規(guī)范金融市場交易制度,保證交易透明、公正、公平,降低風(fēng)險(xiǎn)成本和交易成本,防止不正當(dāng)交易和競爭;強(qiáng)化中央銀行的宏觀調(diào)控職能加大金融對經(jīng)濟(jì)發(fā)展的支持力度,靈活運(yùn)用各種貨幣工具,對經(jīng)濟(jì)運(yùn)行實(shí)行微調(diào),通過信貸指引和窗口指導(dǎo)繼續(xù)優(yōu)化信貸結(jié)構(gòu),從而使金融業(yè)在深圳地區(qū)持續(xù)健康發(fā)展。
(5)處于穩(wěn)態(tài)過程,利用均值和方差的遞推公式實(shí)時(shí)更新數(shù)據(jù),確定新的均值和方差;
(6)比較均值和方差的大小,確定x(k+1)的自適應(yīng)閾值;
(7)k=k+1,轉(zhuǎn)到步驟(1)。
針對固定報(bào)警閾值與設(shè)備狀態(tài)變化無關(guān)、缺乏與運(yùn)行工況和運(yùn)行瞬態(tài)的相關(guān)性、閾值監(jiān)測缺乏時(shí)間相關(guān)性的缺點(diǎn),提出的動(dòng)態(tài)報(bào)警閾值能夠處理不同操作模式之間的過渡。使用貝葉斯檢測的新方法,它不僅使用樣本信息,而且可以充分利用先驗(yàn)信息,從大量的過程數(shù)據(jù)中提取更有意義的信息。
在濕法聚氨酯合成革制造過程中,在排放的廢水中含有一種危害性很大的化工原料——二甲基甲酰胺(Dimethyl Formamide,DMF)。為了提高生產(chǎn)廠家的經(jīng)濟(jì)效益,同時(shí)減小對環(huán)境的污染,需要對DMF進(jìn)行回收利用。在DMF回收裝置上,為了驗(yàn)證動(dòng)態(tài)報(bào)警閾值的有效性,變量的選擇非常重要,要選擇相互獨(dú)立的兩個(gè)變量。因此,這里選擇了變量精餾塔液位LI102和精餾塔回流流量FI106作為研究對象,通過對過程中的暫態(tài)和穩(wěn)定狀態(tài)分別進(jìn)行仿真來說明方法的有效性。
在第一個(gè)仿真過程中,選擇變量LI102工作在開車階段的數(shù)據(jù)進(jìn)行分析。過渡工作過程的分析和開車階段的分析是一致的。由于在開車和過程過渡中產(chǎn)生的錯(cuò)誤報(bào)警過多,操作員對這些報(bào)警無需采取措施。對于固定的報(bào)警閾值來說,在這一階段很難及時(shí)反映過程的異常狀況。變量LI102的過渡過程原始數(shù)據(jù)如圖2所示,經(jīng)過255 s達(dá)到穩(wěn)定。
圖2 過程變量LI102曲線
首先,在過渡過程中采用滑動(dòng)窗算法進(jìn)行線性回歸模型擬合對過程進(jìn)行預(yù)測,選擇最大誤差β=0.01。通過設(shè)計(jì)的算法估計(jì)斜率b和截?cái)嘀礱,通過回歸分析得到分段線性一元回歸模型的表達(dá)式如表1所示。整個(gè)過程被分為3個(gè)階段,通過規(guī)定的95%的置信區(qū)間范圍,可以得到整個(gè)過程的預(yù)測曲線,如圖3所示。通過離線階段建模后,在對新的數(shù)據(jù)值到來時(shí),就可以利用貝葉斯原理推斷和計(jì)算整個(gè)過程的報(bào)警閾值,以防止產(chǎn)生誤報(bào)警。
表1 LI102過渡階段分段線性信息
當(dāng)設(shè)備運(yùn)行處于子穩(wěn)定工作狀態(tài)時(shí),由于干擾的影響,會(huì)使過程變量超過報(bào)警閾值。選擇變量FI106作為仿真對象,采集3 500組原始數(shù)據(jù)。
通過歷史數(shù)據(jù)選擇3σ計(jì)算方法計(jì)算固定的報(bào)警閾值,如圖4所示。由于采用了固定的閾值設(shè)置方法,會(huì)導(dǎo)致在開車階段產(chǎn)生很多的誤報(bào)警,使得報(bào)警數(shù)量增多,影響操作員的操作。
圖3 LI102過渡階段趨勢
圖4 固定報(bào)警閾值
在如圖5所示的仿真圖中采用動(dòng)態(tài)報(bào)警閾值的方法,使得仿真結(jié)果能夠消除在開車階段的誤報(bào)警。
圖5 動(dòng)態(tài)報(bào)警閾值
但是,在穩(wěn)定階段時(shí),當(dāng)來的噪聲方差很大時(shí),會(huì)導(dǎo)致產(chǎn)生很多的漏報(bào)警,因此提出應(yīng)用方差敏感的自適應(yīng)報(bào)警閾值計(jì)算方法,如圖6所示。它充分考慮了方差和均值的雙重影響作用,使得能夠在整個(gè)工作過程中都適用,能夠消除在穩(wěn)定階段由于方差作用導(dǎo)致的漏報(bào)警,也能應(yīng)對開車或者是過渡過程產(chǎn)生的誤報(bào)警,都能達(dá)到理想的效果。從表2可以看出,報(bào)警數(shù)量進(jìn)一步減少。從表3可以看出,報(bào)警性能指標(biāo)得到明顯改善。
圖6 方差敏感自適應(yīng)閾值
表2 報(bào)警次數(shù)對比
表3 報(bào)警性能指標(biāo)對比
傳統(tǒng)方法主要集中在穩(wěn)態(tài)過程優(yōu)化和用固定閾值的方法處理多模式轉(zhuǎn)變過程,因此產(chǎn)生了大量誤報(bào)警和漏報(bào)警,大大影響了報(bào)警系統(tǒng)的可靠性。本文提出的動(dòng)態(tài)報(bào)警閾值策略不是簡單設(shè)定靜態(tài)變量的上界值和下界值,在過渡過程中利用貝葉斯估計(jì),充分考慮樣本數(shù)據(jù)和先驗(yàn)數(shù)據(jù)的不確定性,在穩(wěn)定過程中隨著數(shù)據(jù)的增加采用遞推公式計(jì)算均值和方差,滿足實(shí)時(shí)估計(jì)的要求。此外,方差敏感的自適應(yīng)閾值算法考慮方差的影響,所以會(huì)消除一些漏報(bào)警。最后,通過實(shí)驗(yàn)證明了方法在穩(wěn)態(tài)和狀態(tài)轉(zhuǎn)變過程中的有效性,并且能夠進(jìn)一步減少報(bào)警數(shù)量。