• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于稀疏D-vine Copula 的建模方法及其在過程監(jiān)測中的應(yīng)用

      2023-07-07 10:20:54邱穗慶李紹軍
      關(guān)鍵詞:建模變量節(jié)點

      邱穗慶,李紹軍

      (華東理工大學(xué)能源化工過程智能制造教育部重點實驗室, 上海 200237)

      現(xiàn)代工業(yè)過程規(guī)模日趨擴大,生產(chǎn)系統(tǒng)也日趨智能化和復(fù)雜化,這大大提升了生產(chǎn)效率,但也增加了系統(tǒng)的不確定性和潛在的安全隱患。過程監(jiān)測技術(shù)在保證系統(tǒng)安全生產(chǎn)方面扮演著關(guān)鍵角色[1-2]。隨著大規(guī)模數(shù)據(jù)采集和處理技術(shù)的不斷發(fā)展,基于數(shù)據(jù)驅(qū)動的過程監(jiān)測方法有著巨大的應(yīng)用前景[3],其中多元統(tǒng)計過程監(jiān)測[4](Multivariate Statistical Process Monitoring, MSPM)方法通過挖掘潛在變量信息建模,在工業(yè)過程監(jiān)測領(lǐng)域得到了廣泛應(yīng)用。主成分分析(PCA)[5]和偏最小二乘(PLS)[6]方法先將數(shù)據(jù)投影到較低維的子空間,再計算T2和SPE 指標來區(qū)分正常和異常狀態(tài),是MSPM 的典型代表。PCA 和PLS 這兩種方法都默認過程變量線性相關(guān)且服從高斯分布,但在實際過程中,這兩個條件往往難以滿足。針對這個問題,一系列改進和新方法逐漸被提出。為應(yīng)對非線性問題,核主元分析(KPCA)[7]、核偏最小二乘法(KPLS)[8]等方法陸續(xù)被提出。另外,Kano等[9]將獨立主元分析(ICA)引入到過程監(jiān)控領(lǐng)域處理數(shù)據(jù)的非高斯信息。Yu 等[10]提出有限高斯混合模型(FGMM),從分布的角度解決了非高斯問題。然而,大多數(shù)現(xiàn)有MSPM 方法都是以降維解耦或高斯假設(shè)思想為基礎(chǔ)。因此,從描述數(shù)據(jù)間相關(guān)性角度出發(fā),通過直接刻畫復(fù)雜過程變量之間的相關(guān)性行為來建立過程監(jiān)測模型,具有極高的研究前景。

      近年來,作為一種相關(guān)性建模工具,Copula 函數(shù)在金融和氣象等領(lǐng)域[11-12]得到了廣泛應(yīng)用。Copula函數(shù)將聯(lián)合分布函數(shù)與邊緣分布及其相關(guān)性結(jié)構(gòu)聯(lián)系起來,直接根據(jù)數(shù)據(jù)間的復(fù)雜相關(guān)性信息建立數(shù)據(jù)分布模型,能夠有效處理數(shù)據(jù)間的非線性非高斯信息[13]。然而,利用傳統(tǒng)多元Copula 函數(shù)建立高維數(shù)據(jù)相關(guān)性模型時,其參數(shù)優(yōu)化過程繁瑣且低效,缺乏靈活性。為避免復(fù)雜的優(yōu)化過程,Joe[14]提出Vine Copula 分解方法。借助Vine 結(jié)構(gòu),多元Copula函數(shù)可以分解為一系列二元Copula 函數(shù)的組合形式,實現(xiàn)了將復(fù)雜多元相關(guān)性建模問題轉(zhuǎn)變?yōu)槎狢opula函數(shù)的優(yōu)化問題。Vine Copula 理論的改進與發(fā)展促進了它在工業(yè)制造領(lǐng)域的應(yīng)用。Ren 等[15]將C-vine模型引入到過程監(jiān)控領(lǐng)域,構(gòu)建廣義貝葉斯推斷概率檢測指標,實現(xiàn)了對非線性非高斯工業(yè)過程的實時故障監(jiān)測。周南等[16]通過核密度估計選擇最優(yōu)的Copula 函數(shù)參數(shù)。崔群等[17]借助伯恩斯坦多項式優(yōu)化了D-vine Copula 參數(shù)估計過程,并應(yīng)用到過程監(jiān)測領(lǐng)域。二元Copula 種類繁多,可以針對不同的相關(guān)性結(jié)構(gòu)靈活選擇,重點在于如何估計和優(yōu)化二元Copula 的結(jié)構(gòu)和參數(shù)。目前最常用的優(yōu)化準則是基于最大偽似然估計的BIC(Bayesian Information Criterion)和Akaike 信息準則。然而,由于Vine 結(jié)構(gòu)優(yōu)化是從第1 棵結(jié)構(gòu)樹開始依次估計二元Copula,按照常規(guī)的優(yōu)化準則,估計誤差容易在樹中累積,導(dǎo)致較高層次樹中的估計結(jié)果可靠性較差,進而影響整個Vine Copula 模型的性能。實際上,在較高層次的樹中往往只含有少量的相關(guān)性信息[18]。此外,雖然Vine Copula 分解可以使得每個二元Copula需優(yōu)化的參數(shù)個數(shù)不超過兩個,但整個Vine 模型需優(yōu)化的參數(shù)數(shù)量隨著數(shù)據(jù)維數(shù)的增加呈現(xiàn)二次增長。這會大幅增加高維數(shù)據(jù)的計算負擔,很難保證模型的實時性。

      C-vine 和D-vine 是最常用的兩種Vine 結(jié)構(gòu)。1 個m元變量的Vine 結(jié)構(gòu)包括m-1 棵結(jié)構(gòu)樹和m(m-1)/2 條邊(二元Copula),每條邊連接2 個節(jié)點(變量)。相較于C-vine 的星型分解結(jié)構(gòu),水平結(jié)構(gòu)的D-vine 有著簡單、穩(wěn)定且易于建模的優(yōu)勢[19]。為減少模型的計算時間和估計誤差在Vine 結(jié)構(gòu)中的累積,本文通過改進的BIC(mBIC)[18]優(yōu)化準則對D-vine結(jié)構(gòu)和參數(shù)進行估計和優(yōu)化,建立一種稀疏D-vine Copula(SDVC)過程監(jiān)測模型。該模型修正了每個二元Copula 的先驗概率,對不同層次結(jié)構(gòu)樹分配不同參數(shù)的伯努利分布先驗,使得高層次樹中有更大概率優(yōu)化為獨立二元Copula,大大減少了需優(yōu)化參數(shù)的Copula 個數(shù)。另外,在現(xiàn)有基于Vine Copula 的過程監(jiān)測模型中,Vine 結(jié)構(gòu)的節(jié)點次序都是根據(jù)與根節(jié)點的相關(guān)性程度決定的,該方法更適合于存在根節(jié)點的C-vine 星型結(jié)構(gòu)[15]。本文Vine 結(jié)構(gòu)的節(jié)點次序只與各節(jié)點間的相關(guān)性總和大小有關(guān),不受制于根節(jié)點,更適用于水平結(jié)構(gòu)的D-vine。在建模階段,首先根據(jù)mBIC 準則對第1 棵樹中二元Copula 進行擬合優(yōu)化,后一棵樹的二元Copula 根據(jù)前一棵樹的優(yōu)化結(jié)果逐級優(yōu)化。通過mBIC 不僅可以對高層次樹進行一定程度的稀疏,還可以達到降低計算量和避免過擬合的效果。核密度估計方法被用于估計各變量的邊緣概率密度函數(shù)(Probability Density Function,PDF)。針對工業(yè)生產(chǎn)過程,利用SDVC 模型并結(jié)合高密度區(qū)域(HDR)和分位數(shù)理論構(gòu)建非線性非高斯態(tài)廣義局部概率(GLP)監(jiān)測指標。SDVC 模型在田納西-伊斯曼(Tennessee-Eastman,TE)和醋酸脫水過程中的應(yīng)用,驗證了該模型能夠取得良好的監(jiān)測效果。

      1 D-Vine Copula 理論及其建模方法

      Copula 是以服從均勻分布U(0,1)的分布函數(shù)為自變量而構(gòu)成的多元分布函數(shù),它實現(xiàn)了用邊緣分布及其相關(guān)性結(jié)構(gòu)(Copula 函數(shù))替代聯(lián)合分布。Skalr[20]提出,m維隨機變量X=(X1,X2,···,Xm)T的聯(lián)合概率分布可以用對應(yīng)維數(shù)的Copula 函數(shù)表示:

      其中C(·)表示Copula 函數(shù),ui=Fi(xi) (i=1,2, ···,m)為對應(yīng)變量的邊緣分布函數(shù),其滿足:

      其中fi(xi)表示xi的邊緣PDF。對式(1)兩邊同時求導(dǎo),得到式(3):

      由式(3)可見,多元隨機變量的聯(lián)合分布由各變量的邊緣分布及其相關(guān)性結(jié)構(gòu)共同決定。邊緣分布易于求取,多元Copula 密度函數(shù)通常由極大似然法估計獲得。然而,一個m元Copula 函數(shù)需要優(yōu)化的參數(shù)個數(shù)遠遠大于m,當數(shù)據(jù)維數(shù)過高時,容易出現(xiàn)“維數(shù)災(zāi)難”。Joe[14]提出Vine Copula 分解結(jié)構(gòu),將多元Copula 函數(shù)分解為一系列二元Copula 函數(shù)的組合形式。

      1.1 D-vine Copula

      Vine Copula 的基本思想是將一個m元Copula函數(shù)分解成m(m-1)/2 個二元Copula 函數(shù)的組合形式。由此高維變量間相關(guān)性結(jié)構(gòu)的優(yōu)化問題轉(zhuǎn)化為一系列二元Copula 的參數(shù)估計問題(每次需優(yōu)化的參數(shù)為1~2 個)[21],這對處理高維非線性非高斯數(shù)據(jù)提供了極好的解決思路。D-vine 憑借其簡單穩(wěn)定的結(jié)構(gòu)特點,廣泛運用于各個研究領(lǐng)域。對于m元隨機變量,采用D-vine Copula 分解形式可將聯(lián)合概率密度分布模型表示為:

      其中,θj,j+i|j+1:j+i-1表示對應(yīng)二元Copula 函數(shù)的參數(shù)。需要注意的是,式(4)是按照從低到高層次樹的順序依次優(yōu)化估計,其中條件分布項的計算方式為:

      其中,xD表示條件向量集,v是屬于xD的一個向量,xD-v為除v之外的向量集。為便于理解,圖1 展示了五元變量的D-vine 圖解模型。D-vine 圖解模型是由若干個節(jié)點和邊組成的一系列水平無環(huán)連接圖,每個連接圖稱為D-vine 的一棵樹。一個五元D-vine 結(jié)構(gòu)包含4 棵樹、10 條邊,Copula 密度函數(shù)由各條邊依次累乘獲得。因此,只要優(yōu)化出所有二元Copula 函數(shù)就能快速獲得聯(lián)合概率密度分布模型。

      圖1 五元D-vine 圖解模型Fig.1 Graphical model of five-dimension D-vine

      1.2 D-vine 模型構(gòu)建

      D-vine 是水平結(jié)構(gòu),節(jié)點次序決定了整個Vine結(jié)構(gòu)框架。根據(jù)Ren 等[15]的相關(guān)研究,首先將與其他節(jié)點秩相關(guān)系數(shù)總和最大的節(jié)點視為根節(jié)點排在首位,再根據(jù)其他節(jié)點與根節(jié)點的秩相關(guān)系數(shù)大小按降序依次編號。

      二元Copula 種類繁多,初步確定D-vine 結(jié)構(gòu)后需要對二元Copula 具體類型和參數(shù)進行估計優(yōu)化,基于極大偽似然估計的BIC 準則是常用的一種。

      式(6)右邊第1 項表示每個二元Copula 包含相關(guān)性信息量的對數(shù)似然函數(shù),第2 項表示每個二元Copula的復(fù)雜度,n和m分別為樣本數(shù)量和維數(shù),是每個二元Copula中的非零參數(shù)個數(shù),cpair是二元Copula 密度函數(shù),θj,j+i|j+1:j+i-1為待優(yōu)化參數(shù)。最終優(yōu)化出的BIC值越小,說明模型越精確。

      在估計D-vine 模型時,首先估計低層次樹中的二元Copula,在此基礎(chǔ)上逐級估計高層次樹,最終確定完整的D-vine Copula 模型。這一優(yōu)化過程決定了在低層次樹中的估計誤差很容易累積到高層次樹中,導(dǎo)致較高樹中的二元Copula 模型可靠性較差,整個優(yōu)化過程計算量也很高。并且,通常都是在低層次樹中捕獲強依賴關(guān)系,而在較高層次的樹中描述的條件相關(guān)性逐漸減弱,包含的信息量減少[22]。

      針對以上問題,Kovács 等[22]提出了對Vine 結(jié)構(gòu)的截斷,直接移除Vine 結(jié)構(gòu)中的高層次樹,避免了估計誤差的累計,降低了計算量。在工業(yè)過程中,變量間的相關(guān)性復(fù)雜度高,有的變量間為弱相關(guān)或不相關(guān),截去這一部分對模型整體影響不大;但有的變量則呈現(xiàn)強相關(guān),直接截斷高層次樹可能會導(dǎo)致一部分重要信息丟失。通過mBIC 對D-vine 進行優(yōu)化,可以讓高層次的樹變得更加稀疏(包含更多獨立二元Copula)。即在更高層次的樹中,二元Copula更傾向于優(yōu)化成獨立狀態(tài)。這一方面能在一定程度上減少估計誤差,提高模型可靠性;另一方面,由于獨立二元Copula 函數(shù)不需要優(yōu)化參數(shù),還可以降低建模計算量。

      2 SDVC 過程監(jiān)測模型

      2.1 稀疏D-vine Copula 模型估計

      為確定更適合于D-vine 結(jié)構(gòu)的節(jié)點次序,采用如式(7)方式(第1 棵樹)計算:

      BIC 是Vine 估計和優(yōu)化的常用指標,它是在假設(shè)所有二元Copula 選擇都是等概率先驗的情況下導(dǎo)出。當過程數(shù)據(jù)維數(shù)較高時,為減少估計誤差在高層次樹中的累積,可以適當對高層次樹的Vine 結(jié)構(gòu)進行稀疏。mBIC 優(yōu)化準則可以有效地完成這一任務(wù),它在BIC 準則的基礎(chǔ)上改進了先驗概率,具體是給每個二元Copula 分配一個非獨立的先驗概率。這里讓該先驗概率服從伯努利分布(參數(shù)為 ψe),其中第t棵樹中的參數(shù) ψe=(0 <ψ0<1) 。由此整個Dvine Copula 模型的先驗概率為:

      其中,qt表示在第t棵樹中非獨立二元Copula 的數(shù)量。根據(jù)先驗概率,可以得出mBIC 準則的定義:

      其中,等式右邊新添的第3 項由先驗概率決定。根據(jù)ψ0的取值范圍可知,是一個遞減序列。這意味著在更高的樹中,mBIC 準則對非獨立二元Copula 的懲罰比BIC 準則更嚴重,更傾向于將二元Copula 優(yōu)化成獨立狀態(tài)(待優(yōu)化參數(shù)個數(shù)為0,Copula 密度默認為1)。這種估計方式可以使Vine 結(jié)構(gòu)變得稀疏,方便處理高維問題。

      在服從伯努利分布的先驗概率條件下,隨機變量qt服從參數(shù)為(m-t)和的二項分布。因此,在第t棵樹中,非獨立二元Copula 數(shù)量的期望值為

      則稀疏D-vine 結(jié)構(gòu)中非獨立二元Copula 總數(shù)量q的期望值為

      其中O(·) 表示求極大值。在常規(guī)的D-vine 結(jié)構(gòu)中,qmax與m2有關(guān),因此,通過設(shè)置合理的 ψ0,很容易獲得稀疏的D-vine 結(jié)構(gòu),尤其是在數(shù)據(jù)維度m較大的情況下。

      由于估計誤差容易在Vine 結(jié)構(gòu)樹上累積,在越高層次的樹中估計結(jié)果越不可靠,因此,應(yīng)該越保守地選擇模型,通過mBIC 讓高層次的樹變得稀疏,在一定程度上能減少估計誤差。不同的 ψ0可以構(gòu)建不同稀疏度的Vine Copula 結(jié)構(gòu),通常,設(shè)置 ψ0=0.9 是較為普遍適用的情況[18]。

      2.2 邊緣概率密度分布模型

      由式(4)可知,多元變量的聯(lián)合PDF 模型與Copula密度函數(shù)和各變量的邊緣PDF 相關(guān)。對于已知分布類型的變量,其邊緣PDF 參數(shù)可以根據(jù)數(shù)據(jù)輕易估計得出。否則,可以借助核密度估計此非參數(shù)估計方法。單變量核密度函數(shù)[24]表示為式(12):

      其中,K(·) 為核函數(shù),滿足K(u)du=1 ;z和zi分別表示單變量和估計樣本;h為窗寬。

      2.3 構(gòu)建監(jiān)測指標

      通過稀疏 D-vine Copula 和核密度估計器獲得訓(xùn)練樣本的概率密度分布模型后,需要確定一個控制界限,若監(jiān)測數(shù)據(jù)的概率密度值在界限內(nèi)則將其視為正常,反之判定為異常。如果過程數(shù)據(jù)服從高斯分布,正常區(qū)域可通過馬氏距離方便得出。然而,對于多元非高斯分布的情況,馬氏距離不再適用。高密度區(qū)域(High Density Region , HDR)[25]是一種適用于任意分布的概率性度量區(qū)域。它能在給定概率δ的情況下,以盡可能精確的體積覆蓋某一區(qū)域,該區(qū)域內(nèi)每個點的概率密度值都大于或等于區(qū)域外的點。假設(shè)多元變量X的聯(lián)合PDF 為f(x),則HDR 代表了最小的1-δ區(qū)域,用數(shù)學(xué)公式表示為:

      其中HDR(fδ)表示處于置信水平為1-δ的HDR 中的點集,fδ是f(x)的δ分位數(shù)。

      利用HDR 計算控制界限關(guān)鍵在于獲得fδ。因此,HDR 的概率估計問題等價為搜尋一維隨機向量f(x)對應(yīng)的分位數(shù)。引入密度分位數(shù)法(Density Quantile Approach, DQA)[25]估計HDR 的邊界。定義計算得出的聯(lián)合PDF 模型為Y=f(x),HDR(fδ)=[α,β],且f(α)=f(β),則由式(13)可知fδ應(yīng)滿足如下關(guān)系:

      其中P表示求取符合括號內(nèi)條件的概率值。

      可以利用樣本數(shù)據(jù)Yi=f(xi) (i=1,2,···,n,其中n為樣本數(shù)量)估計出fδ,實際上這里是利用樣本分位數(shù)去估計隨機變量Y的δ分位數(shù)fδ。

      基于HDR 和DQA 提出適用于非線性非高斯過程數(shù)據(jù)的GLP 指標完成工業(yè)過程實時監(jiān)測:

      則求得GLP 指標為

      DQA 方法所得結(jié)果是區(qū)間估計,首先對訓(xùn)練樣本的聯(lián)合PDF 值進行離散化處理,離散化步長為l,生成一張包含l個區(qū)間的密度分位數(shù)表(包含l+1 個置信水平和對應(yīng)的l+1 個密度分位數(shù)值)。根據(jù)給定的控制限(CL∈(0,1)),l= [1/(1-CL)],其中[]表示取整,求取GLP 的過程就是搜尋到其所在概率估計區(qū)間的問題,并將其設(shè)置為該區(qū)間上下界的均值。理論上只要l足夠大,采用DQA 方法就可以實現(xiàn)對GLP指標任意精度的估計。對于控制限CL,若GLP <CL,則認為過程是正常狀態(tài),反之判定為出現(xiàn)異常。

      2.4 基于SDVC 過程監(jiān)測方法的建模流程

      本文提出的SDCV 過程監(jiān)測方法流程圖如圖2所示,整個過程包括離線建模和在線監(jiān)測兩個部分。

      圖2 SDVC 過程監(jiān)控方法算法流程圖Fig.2 Algorithm flowchart of SDVC monitoring approach

      離線建模具體流程細節(jié)如下:

      (1) 收集正常狀態(tài)下的歷史數(shù)據(jù),通過式(12)計算隨機變量xi(i=1,2,…,m)的m個邊緣PDF,即fi(xi);

      (2) 利用樣本數(shù)據(jù)計算各隨機變量的邊緣累積分布函數(shù)(ECDF)值和各變量間的Kendall 秩相關(guān)系數(shù)矩陣 τ ∈Rm×m;

      (3) 根據(jù)式(7)與矩陣 τ 確定D-vine 模型中第1 棵樹的節(jié)點順序,得到第1 棵樹結(jié)構(gòu)框架;

      (4) 給連接節(jié)點的邊(二元Copula)分配服從參數(shù)為 ψ0的伯努利分布的先驗概率,并利用第1 棵樹中各節(jié)點對應(yīng)的邊緣累積分布函數(shù)優(yōu)化各邊對應(yīng)的二元Copula 類型及其參數(shù),計算每條邊對應(yīng)的mBIC值,選擇使mBIC 為最小的二元Copula 及其參數(shù);

      (5) 對于第1 棵以外的樹t,結(jié)合第t-1 棵樹中已優(yōu)化好的二元Copula 及條件分布函數(shù),根據(jù)式(5)計算出第t層中所需要的條件分布函數(shù)作為新的節(jié)點(參考圖1);

      (6) 給第t棵樹中的邊分配服從參數(shù)為的伯努利分布的先驗概率,對第t棵樹中的二元Copula進行估計,估計方法和流程與步驟(4)一致;

      (7) 令t=t+1,流程返回至步驟(5);當完整的稀疏D-vine 結(jié)構(gòu)模型優(yōu)化完畢,進入步驟(8);

      (8) 結(jié)合步驟(1)計算出的fi(xi)以及優(yōu)化出的稀疏D-vine 結(jié)構(gòu),通過式(4)得出最終的SDVC 模型;

      (9) 利用SDVC 模型計算出訓(xùn)練樣本的聯(lián)合PDF模型f(x),并確定CL,建立對應(yīng)的密度分位數(shù)表。

      在線監(jiān)測具體流程細節(jié)如下:

      (1) 利用SDVC 模型計算出實時監(jiān)測數(shù)據(jù)的聯(lián)合概率密度值,結(jié)合式(16)和式(17),用DQA 計算出GLP 指標;

      (2) 判斷GLP 是否超限,若GLP < CL,則是正常狀態(tài),反之判定為出現(xiàn)異常。

      3 應(yīng)用實例

      為評估所提出方法的監(jiān)測性能,以TE 和醋酸脫水過程作為實例,將SDVC 方法監(jiān)測結(jié)果與PCA、KPCA 和D-vine 方法進行對比和討論。

      3.1 TE 過程

      TE 過程是由美國Eastman 公司根據(jù)實際的化工反應(yīng)過程開發(fā)的測試仿真系統(tǒng),在工業(yè)過程監(jiān)測領(lǐng)域是一個常用的應(yīng)用實例。TE 過程是一個高度復(fù)雜的非線性非高斯系統(tǒng),主要包含5 個操作單元:反應(yīng)器、冷凝器、壓縮機、分離器和汽提塔,其過程數(shù)據(jù)集包含22 個過程變量、19 個成分變量和11 個操縱變量以及21 類故障信息。每類故障數(shù)據(jù)均為960 組,且故障都是從第161 個樣本點引入并維持到最后時刻。

      本文利用正常狀態(tài)下的960 組數(shù)據(jù),通過22 個過程變量,建立PCA、KPCA、D-vine 和SDVC過程監(jiān)測模型。為了保證實驗的公平性和有效性,置信水平均設(shè)置為0.99。設(shè)置SDVC 模型中伯努利分布參數(shù) ψ0=0.9,主成分的方差貢獻率為85%。圖3 所示為TE 過程的稀疏D-vine 和D-vine 結(jié)構(gòu)信息矩陣。右上角為稀疏D-vine 結(jié)構(gòu)的信息矩陣,第1 行對應(yīng)第1 棵樹的節(jié)點順序,剩余行中的數(shù)字分別對應(yīng)各Vine 結(jié)構(gòu)樹中的二元Copula 種類,如0 代表獨立Copula,1 代表高斯Copula[26];Ti表示第i棵Copula結(jié)構(gòu)樹。左下角為D-vine 結(jié)構(gòu)信息矩陣,各位置信息與右上角斜對稱,如第2 列中的數(shù)字表示D-vine第1 棵樹的優(yōu)化結(jié)果。

      圖3 TE 過程的稀疏D-vine 和D-vine 的結(jié)構(gòu)信息矩陣Fig.3 Structure information matrix of sparse D-vine and D-vine for TE process

      由圖3 可知,稀疏D-vine 結(jié)構(gòu)中獨立二元Copula數(shù)量為101 個,明顯高于D-vine 中的61 個,尤其在高層次樹中,獨立Copula 的比例增加更明顯。這意味著稀疏D-vine 中需優(yōu)化的二元Copula 個數(shù)比Dvine 中少40 個,而且主要集中在高層次樹中,可有效減少高層次樹中的累積誤差,提高模型性能。

      表1 示出了針對TE 過程D-vine 和SDVC 方法的離線建模和在線監(jiān)測過程的CPU 耗時(CPU 2.2 GHz,RAM 8 GB)。由表1 可知,SDVC 建模計算的負擔(離線建模的耗時)和實時性(在線監(jiān)測)都要優(yōu)于Dvine 模型。表2 示出了PCA、KPCA、D-vine 和SDVC方法在 TE 過程中的故障監(jiān)測結(jié)果,粗體表示每個故障的最優(yōu)檢測率。

      表1 D-vine 和SDVC 方法的CPU 耗時Table 1 CPU time consuming of D-vine and SDVC methods

      表2 TE 過程21 個故障的檢測率(CL=0.99)Table 2 Fault detection rates for 21 faults of TE process(CL=0.99)

      表2 結(jié)果顯示,在PCA、KPCA、D-Vine 和SDVC4 種方法中,總體上本文提出的SDVC 模型監(jiān)測性能最好,對于絕大多數(shù)故障類型都能夠取得最好的檢測效果。對于故障1、12、17 和19,SDVC 方法雖未能取得最佳檢測結(jié)果,但是相應(yīng)的故障檢測率差別不大。對于故障3、4、5、9 和15,故障信息不容易被捕捉到,所以4 種方法都無法達到較好的效果,不過,相比較而言,SDVC 模型的檢測效果要優(yōu)于其他3 種方法。而對于故障2、6、8 等較易檢測的故障,SDVC模型性能也優(yōu)于其他3 種方法,這表明對于較易檢測的故障,SDVC 依然取得好的檢測效果。為更直觀地展現(xiàn)4 種方法監(jiān)測效果的不同之處,4 種方法對TE過程中故障13 的監(jiān)測結(jié)果如圖4 所示。

      TE 過程具有高度的非線性和非高斯態(tài),其過程數(shù)據(jù)必然具備非線性和非高斯性。PCA 在建模時默認過程數(shù)據(jù)線性相關(guān)且服從高斯分布,無法有效處理非線性非高斯問題。KPCA 擅長處理數(shù)據(jù)間的非線性信息,但難以捕捉非高斯信息,甚至可能會被作為噪聲排除掉。而且這兩種方法的建模過程采用了降維思想,難免會造成部分原始數(shù)據(jù)信息的丟失。D-vine 方法從相關(guān)性建模角度出發(fā)建立相關(guān)性樹結(jié)構(gòu),可以較好地描述數(shù)據(jù)間的非線性和非高斯信息。然而,由于Vine Copula 建模過程的特殊性,誤差容易在樹結(jié)構(gòu)種類中累積,導(dǎo)致高層次樹部分結(jié)構(gòu)模型不可靠。采用mBIC 優(yōu)化準則對高層次樹結(jié)構(gòu)進行了適當?shù)南∈?,有效地解決了這個問題,顯著提高了模型的整體性能。

      3.2 醋酸脫水過程

      精對苯二甲酸(PTA)是工業(yè)生產(chǎn)聚酯、工程聚酯塑料、增塑劑等的重要原料。PTA 是以對二甲苯為生產(chǎn)原料,經(jīng)過液相氧化生成的粗對二甲苯酸間接得到的。在液相氧化過程中,醋酸是重要的溶劑。通常,獲得純度較高的醋酸需要有效地完成醋酸脫水過程。由于普通精餾分離經(jīng)常無法滿足醋酸純度要求,因此工業(yè)中采用共沸精餾法完成醋酸和水的分離[27]。經(jīng)過共沸精餾分離操作后,正常狀態(tài)下反應(yīng)器頂部混合物中的醋酸含量一般低于1.15%。

      共沸精餾法的醋酸脫水工業(yè)過程反應(yīng)塔中包含90 級塔板和4 個進料口,整個系統(tǒng)還包括產(chǎn)生乙酸和水的混合物的氧化反應(yīng)器等,采用包括溫度、壓力、流量和電導(dǎo)率等21 個過程變量建立模型對醋酸脫水精餾過程狀態(tài)進行實時監(jiān)控。離線建模階段采用500 組正常的數(shù)據(jù)訓(xùn)練模型,在線監(jiān)控階段采用300 組測試數(shù)據(jù)模擬仿真,其中前100 組為正常運行狀態(tài),從101 組開始反應(yīng)器頂部的醋酸質(zhì)量分數(shù)上升到1.5%,并維持至第200 組,最后100 組數(shù)據(jù)的醋酸質(zhì)量分數(shù)又回到1.15%以下。

      表3 示出了當控制限CL=0.98、SDVC 模型中伯努利分布參數(shù) ψ0=0.9、主成分方差貢獻率為85%時,PCA、KPCA、D-vine 和SDVC 4 種方法的故障檢測率(Fault Detection Rate, FDR)和誤報率(False Alarm Rate, FAR),對應(yīng)的醋酸脫水過程監(jiān)測圖如圖5 所示。由表3 可得,4 種方法都能有效地監(jiān)測出異常的發(fā)生,但相對來說,SDVC 方法有著更低的誤報率。這表明本文提出的SDVC 過程監(jiān)測方法在醋酸脫水工業(yè)過程中有著良好的應(yīng)用。

      表3 醋酸脫水過程的檢測率和誤報率(CL=0.98)Table 3 FAR and FDR of the acetic acid dehydration process(CL=0.98)

      圖5 醋酸脫水過程監(jiān)測圖Fig.5 Monitoring charts of acetic acid dehydration

      4 結(jié) 論

      本文提出了一種基于SDVC 模型的過程監(jiān)測方法,通過兩個工業(yè)實例論證了該方法在過程監(jiān)測領(lǐng)域的優(yōu)越性能。通過給不同D-vine 結(jié)構(gòu)樹上的二元Copula 分配符合伯努利分布的先驗概率,讓高層次樹中的二元Copula 有更大的概率被優(yōu)化為獨立狀態(tài),實現(xiàn)了對高層次樹的結(jié)構(gòu)稀疏,有效減少了估計誤差在結(jié)構(gòu)樹中的累積,提高了模型的可靠性和實時性。引入HDR 與密度分位數(shù)理論構(gòu)建GLP 指標實現(xiàn)對工業(yè)過程的實時監(jiān)測。為評估SDVC 方法的故障監(jiān)測性能,應(yīng)用TE 以及醋酸脫水過程作為實例進行測試實驗,通過與PCA、KPCA 和D-vine 方法比較,驗證了SDVC 監(jiān)測模型具備良好的監(jiān)測性能。

      猜你喜歡
      建模變量節(jié)點
      CM節(jié)點控制在船舶上的應(yīng)用
      Analysis of the characteristics of electronic equipment usage distance for common users
      抓住不變量解題
      聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
      基于AutoCAD的門窗節(jié)點圖快速構(gòu)建
      也談分離變量
      基于PSS/E的風(fēng)電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      抓住人才培養(yǎng)的關(guān)鍵節(jié)點
      SL(3,3n)和SU(3,3n)的第一Cartan不變量
      嘉兴市| 河北区| 遂昌县| 阿图什市| 海林市| 兴隆县| 岳阳市| 沁源县| 隆安县| 铜山县| 蒲城县| 安远县| 汕头市| 深圳市| 体育| 乌拉特中旗| 长子县| 礼泉县| 二连浩特市| 河南省| 静宁县| 颍上县| 九龙坡区| 永年县| 丹东市| 安义县| 丽江市| 古田县| 秀山| 铜梁县| 榆树市| 临夏市| 绥宁县| 广河县| 丰原市| 保定市| 信宜市| 铜川市| 霸州市| 淄博市| 永仁县|