王建林,馬琳鈺,劉偉旻,邱科鵬,于濤
?
基于核相似度支持向量數(shù)據(jù)描述的間歇過程監(jiān)測(cè)
王建林,馬琳鈺,劉偉旻,邱科鵬,于濤
(北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100029)
基于支持向量數(shù)據(jù)描述的間歇過程監(jiān)測(cè)方法選擇歷史過程數(shù)據(jù)中最大的核距離作為控制限,忽略了高維空間中超球體的不規(guī)則性,導(dǎo)致基于該方法的過程監(jiān)測(cè)精度不高。針對(duì)上述問題,提出了一種基于核相似度支持向量數(shù)據(jù)描述的間歇過程監(jiān)測(cè)方法,將間歇過程數(shù)據(jù)待監(jiān)測(cè)樣本與支持向量之間的核函數(shù)值作為相似度權(quán)重,利用該相似度對(duì)不同時(shí)刻的支持向量球心距加權(quán)求和,得到待監(jiān)測(cè)間歇過程數(shù)據(jù)樣本的動(dòng)態(tài)控制限,通過判斷待監(jiān)測(cè)樣本的球心距是否超過其動(dòng)態(tài)控制限,實(shí)現(xiàn)間歇過程監(jiān)測(cè)。所提方法綜合考慮了超球體的不規(guī)則性和過程數(shù)據(jù)在高維空間分布的局部特性,以及間歇過程數(shù)據(jù)待監(jiān)測(cè)樣本的時(shí)變性,提高了間歇過程監(jiān)測(cè)的準(zhǔn)確性。利用數(shù)值仿真實(shí)驗(yàn)和半導(dǎo)體金屬刻蝕實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
核相似度;支持向量數(shù)據(jù)描述;動(dòng)態(tài)監(jiān)測(cè);間歇過程
間歇過程作為工業(yè)生產(chǎn)中的一種重要生產(chǎn)方式,具有生產(chǎn)靈活、產(chǎn)品附加值高等特點(diǎn),廣泛應(yīng)用于食品、精細(xì)化工、生物制藥、金屬加工等領(lǐng)域[1-3]。間歇過程生產(chǎn)中出現(xiàn)異常,會(huì)直接降低產(chǎn)品質(zhì)量,造成經(jīng)濟(jì)損失,甚至?xí)l(fā)安全事故,因此,對(duì)間歇過程實(shí)施過程監(jiān)測(cè),能夠有效保障間歇過程安全生產(chǎn)、可靠運(yùn)行,提高產(chǎn)品質(zhì)量[4-5]。
數(shù)據(jù)驅(qū)動(dòng)的多元統(tǒng)計(jì)間歇過程監(jiān)測(cè)方法通過獲取單一或多個(gè)監(jiān)測(cè)量在時(shí)間維度上的變化,并設(shè)定控制限,監(jiān)測(cè)量超過控制限則認(rèn)為過程發(fā)生了異常[6-11]。MPCA[12](multiway principal component analysis)、MPLS[13](multiway partial least squares)、MICA[14](multiway independent component analysis)等方法均側(cè)重間歇過程數(shù)據(jù)的多批次特性,基于變量投影分解原理實(shí)現(xiàn)過程監(jiān)測(cè);針對(duì)大多數(shù)間歇過程具有的多時(shí)段特性,相繼出現(xiàn)了sub-PCA[15]、基于時(shí)段的PLS[16]等方法。然而,這些基于PCA與PLS的間歇過程監(jiān)測(cè)方法需假設(shè)過程變量為正態(tài)分布且變量間線性相關(guān),若過程數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜,不滿足上述假設(shè),這些方法的有效性及過程監(jiān)測(cè)精度會(huì)受到影響[17-19]。對(duì)于間歇過程數(shù)據(jù)的非線性特性,核函數(shù)被引入到過程監(jiān)測(cè)方法中,如MKPCA[20](multiway kernel PCA)與MKPLS[21](multiway kernel PLS)方法,利用核函數(shù)將非線性過程數(shù)據(jù)嵌入特征空間,使其在特征空間中呈現(xiàn)線性關(guān)系,然而這類方法的控制限設(shè)定仍需假設(shè)變量服從高斯分布,制約了間歇過程監(jiān)測(cè)精度的提升。
支持向量數(shù)據(jù)描述(support vector data description,SVDD)是一種有效的數(shù)據(jù)描述和處理方法,通過非線性變換將正常數(shù)據(jù)樣本空間映射到高維樣本空間,實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類,已在間歇過程監(jiān)測(cè)中得到應(yīng)用。Sun等[22]提出了一種基于核距離多變量控制圖的過程監(jiān)測(cè)方法(kernel-distance- based multivariate control chart, K chart),該方法對(duì)過程數(shù)據(jù)分布不作假設(shè),且不要求變量間線性相關(guān),克服了傳統(tǒng)過程監(jiān)測(cè)方法的缺陷。但是該方法選擇了歷史過程數(shù)據(jù)中最大的核距離作為異常判定閥值,未考慮高維空間中超球體的不規(guī)則性以及過程數(shù)據(jù)在高維空間分布的局部特性,因此降低了間歇過程監(jiān)測(cè)精度。Camci等[23]提出一種啟發(fā)式參數(shù)選擇方法,通過優(yōu)化核函數(shù)的超參數(shù)來調(diào)節(jié)K chart方法的控制限;Ning等[24]在此基礎(chǔ)上,同時(shí)考慮多個(gè)參數(shù)對(duì)控制限的影響,實(shí)現(xiàn)對(duì)控制限的優(yōu)化設(shè)置。然而,上述基于參數(shù)優(yōu)化方法的控制限沿用了支持向量的最大球心距,未考慮局部數(shù)據(jù)對(duì)超球結(jié)構(gòu)的影響,忽略了超球體的不規(guī)整性。針對(duì)該問題,Sukchotrat等[25]提出基于支持向量球心距排序的控制限設(shè)計(jì)方法,通過權(quán)衡樣本誤分率與超球半徑大小,選擇滿足給定排序比例的超球半徑均值作為異??刂葡?,獲得了更為合理的監(jiān)測(cè)控制限;Khediri等[26]在確定控制限時(shí)引入了可接受性參數(shù),用以涵蓋訓(xùn)練樣本未能表達(dá)的部分?jǐn)?shù)據(jù),實(shí)現(xiàn)控制限的有效性修正。但這兩種方法均引入了新的設(shè)定參數(shù),對(duì)監(jiān)測(cè)效果影響較大,也未給出參數(shù)選擇方法,使其應(yīng)用受到限制。
提出了一種基于核相似度SVDD的間歇過程監(jiān)測(cè)方法,使用正常工況下獲取的間歇過程數(shù)據(jù)作為訓(xùn)練樣本,采用SVDD構(gòu)造包含訓(xùn)練樣本的最小超球體,將待監(jiān)測(cè)樣本與支持向量之間的核函數(shù)值作為相似度權(quán)重,利用該相似度對(duì)不同時(shí)刻的支持向量球心距加權(quán)求和,得到待監(jiān)測(cè)間歇過程數(shù)據(jù)樣本的動(dòng)態(tài)控制限,通過判斷待監(jiān)測(cè)樣本的球心距是否超過其動(dòng)態(tài)控制限,實(shí)現(xiàn)間歇過程監(jiān)測(cè)。
1.1 支持向量數(shù)據(jù)描述(SVDD)
SVDD是由Tax和Duin[27]提出的一種數(shù)據(jù)描述與處理方法,其核心是在高維空間中構(gòu)造包含被描述對(duì)象的最小體積封閉超球。
給定訓(xùn)練數(shù)據(jù)集∈R,=1,2,…,,構(gòu)造包含的超球體轉(zhuǎn)化為如式(1)的最優(yōu)化問題。
其中,與分別是超球體的球心和半徑;和ξ分別為懲罰系數(shù)和松弛因子,是針對(duì)訓(xùn)練樣本中可能含有的離群點(diǎn)而引入的參數(shù)。
式(2)為式(1)最優(yōu)化問題的對(duì)偶形式;引入式(3)所示的高斯核函數(shù)能夠簡(jiǎn)化內(nèi)積運(yùn)算,完成特征空間映射;懲罰系數(shù)的參考值如式(4)所示,其中為訓(xùn)練樣本處于超球體外部的百分比,為訓(xùn)練樣本總數(shù),通過參數(shù)可以協(xié)調(diào)球體體積與訓(xùn)練樣本誤分率。式(2)~式(4)中,α為L(zhǎng)agrange乘子,為核函數(shù),為高斯核函數(shù)寬度參數(shù)。
(3)
(4)
對(duì)應(yīng)的Lagrange乘子滿足0<α<的為處于球體表面的支持向量,對(duì)滿足該條件的支持向量索引進(jìn)行篩選,組成整數(shù)集合;由式(5)計(jì)算支持向量超球球心距,即超球體的半徑,其中為任一支持向量,∈。
利用式(6)計(jì)算測(cè)試樣本到球體中心的距離,當(dāng)該距離小于或等于球體半徑時(shí)認(rèn)為測(cè)試樣本與訓(xùn)練樣本為同一類數(shù)據(jù)。
(6)
SVDD對(duì)數(shù)據(jù)沒有高斯分布、相互獨(dú)立或呈線性關(guān)系的要求,適用范圍較廣[28-29];其球形分類邊界能夠?qū)崿F(xiàn)更高階的數(shù)據(jù)邊界描述。同時(shí),SVDD中測(cè)試樣本與中心的距離是一種有效的監(jiān)控量,距離越大說明點(diǎn)發(fā)生異常的可能性越大。
1.2 基于SVDD的過程監(jiān)測(cè)
基于SVDD的過程監(jiān)測(cè)方法利用正常過程數(shù)據(jù)構(gòu)造訓(xùn)練樣本,讀入待監(jiān)測(cè)過程數(shù)據(jù)作為測(cè)試樣本;使用支持向量∈s替代訓(xùn)練樣本簡(jiǎn)化原算式,簡(jiǎn)化后的測(cè)試樣本核距離kd計(jì)算式如(7),若該距離小于最大的支持向量球心距m,則認(rèn)為該過程點(diǎn)正常,判別條件如式(8)。
(8)
基于SVDD的過程監(jiān)測(cè)方法能夠處理高維、非線性過程數(shù)據(jù),不要求過程數(shù)據(jù)服從高斯分布,相比傳統(tǒng)方法能夠提高過程監(jiān)測(cè)水平。但是,對(duì)于不同支持向量計(jì)算所得的不同球心距,該方法選擇了最大的支持向量球心距作為控制限,沒有考慮高維空間中超球體的不規(guī)則性,以及過程數(shù)據(jù)在高維空間分布的局部特性和待監(jiān)測(cè)過程數(shù)據(jù)樣本的時(shí)變性,限制了該方法的應(yīng)用范圍。
2.1 核相似度SVDD
由于高維空間中超球形狀的不規(guī)則性,各支持向量對(duì)應(yīng)的超球半徑各不相同,現(xiàn)有的基于SVDD的控制限設(shè)置方法忽略了這種不規(guī)則性,將所有支持向量對(duì)應(yīng)的超球半徑取均值或最大值,作為類別劃分邊界。對(duì)于不同子集之間數(shù)據(jù)特性差異較大的數(shù)據(jù)集,這類固定的控制限無法兼顧到不同局部的特性,因此導(dǎo)致較多的誤判;另外,當(dāng)數(shù)據(jù)集具有時(shí)變特性,固定的控制限無法適應(yīng)其數(shù)值特征隨時(shí)間的變化,同樣會(huì)出現(xiàn)較多誤判。因此,本研究提出核相似度SVDD方法,根據(jù)測(cè)試樣本在高維空間中與支持向量的位置相似性,設(shè)定針對(duì)于該測(cè)試樣本的判別控制限。
過程數(shù)據(jù)到特征空間的投影是通過核函數(shù)完成的,向量之間的核函數(shù)值能夠度量?jī)蓚€(gè)向量間的相似性。選擇測(cè)試樣本與支持向量∈s間的核函數(shù)值作為相似性的度量量,核相似度權(quán)重kel的定義式如(9)所示,由式(10)對(duì)核相似度權(quán)重進(jìn)行標(biāo)準(zhǔn)化處理,獲得核相似度權(quán)值kel,為控制限的選擇提供依據(jù),其中為支持向量個(gè)數(shù)。
(10)
由式(11)計(jì)算得到測(cè)試樣本對(duì)應(yīng)的判別限,即每個(gè)支持向量的球心距與測(cè)試樣本的核相似度加權(quán)求和,得到的動(dòng)態(tài)監(jiān)測(cè)邊界R,式中T表示的轉(zhuǎn)秩,為支持向量球心距集合,如式(12)所示,R為∈s中第個(gè)支持向量的球心距,計(jì)算如式(13)所示。
(12)
(13)
對(duì)比式(7)獲得的測(cè)試樣本球心距kd和上述計(jì)算所得的動(dòng)態(tài)監(jiān)測(cè)邊界R,由式(14)判斷該樣本點(diǎn)的核距離是否超出了該點(diǎn)對(duì)應(yīng)的動(dòng)態(tài)判別限。當(dāng)滿足式(14)時(shí),則判斷樣本點(diǎn)的數(shù)據(jù)類型不同于訓(xùn)練數(shù)據(jù)集。
kd>z(14)
核相似度SVDD改進(jìn)了控制限的計(jì)算方式,其訓(xùn)練樣本計(jì)算量與SVDD相同,獲取動(dòng)態(tài)監(jiān)測(cè)邊界R時(shí)不增加訓(xùn)練樣本的計(jì)算量;對(duì)過程數(shù)據(jù)在高維空間分布的局部特性和支持向量球心距造成的不規(guī)則性,通過核函數(shù)量化測(cè)試樣本與支持向量間的比鄰關(guān)系,動(dòng)態(tài)調(diào)整各支持向量球心距的權(quán)重作為局部控制限的計(jì)算依據(jù);采用測(cè)試樣本參與自身控制限計(jì)算,使得控制限能夠反映測(cè)試樣本的時(shí)變性。
2.2 基于核相似度SVDD的間歇過程監(jiān)測(cè)
核相似度SVDD同時(shí)考慮了超球模型的局部特征和測(cè)試樣本的特性,建立的動(dòng)態(tài)異常判別閾值能夠自動(dòng)適應(yīng)數(shù)據(jù)特性的變化,實(shí)現(xiàn)間歇過程監(jiān)測(cè)。圖1為基于核相似度SVDD的間歇過程監(jiān)測(cè)流程圖。
基于核相似度SVDD的間歇過程監(jiān)測(cè)實(shí)現(xiàn)步驟如下:
(1)在正常工況的間歇過程中,采集多批次過程數(shù)據(jù)X(××),為批次數(shù),為每批次采樣長(zhǎng)度,為監(jiān)測(cè)變量個(gè)數(shù)。將多個(gè)批次的過程數(shù)據(jù)沿變量方向展開,得到新的二維數(shù)據(jù)矩陣(×) = {1×,=1,2,…,},并將作為訓(xùn)練樣本。求解包含訓(xùn)練樣本的最小體積超球,得到支持向量集合及其對(duì)應(yīng)的Lagrange乘子α,進(jìn)而計(jì)算每個(gè)支持向量所對(duì)應(yīng)的超球球心距R。
(2)讀入待監(jiān)測(cè)間歇過程數(shù)據(jù),構(gòu)造測(cè)試樣本,與單個(gè)訓(xùn)練數(shù)據(jù)樣本具有相同的監(jiān)測(cè)變量個(gè)數(shù)。由式(6)計(jì)算的球心距kd。
(3)計(jì)算測(cè)試樣本與各支持向量∈之間的核函數(shù)值kel,作為控制限的權(quán)重,并進(jìn)行標(biāo)準(zhǔn)化處理,得到核相似度權(quán)重kel。將標(biāo)準(zhǔn)化的權(quán)重與支持向量球心距加權(quán)求和,得到待監(jiān)測(cè)樣本所對(duì)應(yīng)的監(jiān)測(cè)動(dòng)態(tài)邊界閥值R。
(4)對(duì)比待監(jiān)測(cè)樣本球心距kd與動(dòng)態(tài)監(jiān)測(cè)閥值R,若待監(jiān)測(cè)樣本球心距超過閥值,即判定該過程點(diǎn)存在異常。
3.1 數(shù)值仿真
采用如下人工數(shù)據(jù)集[30]對(duì)具有時(shí)段特性的批次過程進(jìn)行異常監(jiān)測(cè),該過程如式(15)所示,分P1、P2兩個(gè)階段。式中,為批次編號(hào),為樣本點(diǎn)數(shù),3個(gè)過程變量1、2、3由服從均值分布的隨機(jī)變量生成,在第1、2階段的分布區(qū)間分別為[0.01, 2]和[1.5, 4],1、2、3是均值為零、方差為0.01的高斯噪聲變量。訓(xùn)練樣本均使用正常過程數(shù)據(jù)。
在上述過程中引入異常點(diǎn)生成測(cè)試樣本如式(16),其中為單批次樣本點(diǎn)總數(shù),設(shè)定均為偶數(shù)。
(16)
隨機(jī)生成5組數(shù)據(jù),每組的訓(xùn)練樣本含10個(gè)正常批次、每批次200個(gè)樣本點(diǎn);每組的測(cè)試樣本為單批次、長(zhǎng)度2000點(diǎn)。表1給出監(jiān)測(cè)結(jié)果,其中Avg、Max和Dyn分別代表支持向量球心距均值、K chart和本文方法的誤分率(error rate),其計(jì)算公式如式(17),代表錯(cuò)誤分類的測(cè)試實(shí)例個(gè)數(shù)占測(cè)試實(shí)例總數(shù)的比例,其中FN(false negative)為被錯(cuò)誤分類的負(fù)例個(gè)數(shù),即故障樣本漏報(bào)個(gè)數(shù);FP(false positive)為被錯(cuò)誤分類的正例個(gè)數(shù),即正常樣本的誤報(bào)個(gè)數(shù),為樣本總數(shù)。表1最后兩列為誤分率均值與標(biāo)準(zhǔn)差。本文方法在不同的參數(shù)設(shè)定下有更小的誤分率均值與標(biāo)準(zhǔn)差,監(jiān)測(cè)精度得到明顯提升,且監(jiān)測(cè)效果受參數(shù)選擇情況的波動(dòng)較小,性能更穩(wěn)定。
error rate = (FN+FP)/(17)
圖2給出了參數(shù)設(shè)定=2、=0.4下,第1組數(shù)據(jù)data1的監(jiān)測(cè)結(jié)果圖,其中DIS為測(cè)試樣本球心距,-dynamic、-average和-max分別為本文方法、支持向量球心距均值和K chart方法的控制限??梢悦黠@看出球心距均值與K chart方法在一定程度上對(duì)異常敏感,但無法兼顧每個(gè)階段的數(shù)據(jù)特性,產(chǎn)生較多漏報(bào)或者誤報(bào),而本文方法定義的動(dòng)態(tài)邊界能夠很好地描述不同階段訓(xùn)練樣本的局部特征,并結(jié)合被測(cè)樣本的時(shí)變性,做到自動(dòng)判別測(cè)試樣本的階段屬性,進(jìn)而給出更加合理的動(dòng)態(tài)控制限,監(jiān)測(cè)效果更佳。
表1 不同樣本在不同實(shí)驗(yàn)條件下的誤分率與誤分率標(biāo)準(zhǔn)差
3.2 半導(dǎo)體金屬刻蝕工業(yè)過程
蝕刻過程是半導(dǎo)體制造工藝的重要環(huán)節(jié)之一,是一個(gè)典型的非線性多時(shí)段和多工況的間歇過程。Lam9600TCP金屬蝕刻機(jī)[31]的過程數(shù)據(jù)由108個(gè)正常晶片和21個(gè)故障晶片構(gòu)成,一個(gè)晶片制作過程為一個(gè)批次,共129批次數(shù)據(jù)。該數(shù)據(jù)集來自不同的3個(gè)實(shí)驗(yàn),分為系列L29、L31、L33,數(shù)據(jù)有著不同均值和一定差異的協(xié)方差結(jié)構(gòu)。數(shù)據(jù)集每個(gè)點(diǎn)記錄了21個(gè)變量,變量含義見表2。在同樣的實(shí)驗(yàn)條件下引入人為故障,共生成21個(gè)故障批次,故障描述見表3。由于該數(shù)據(jù)集正常批次第56批次和故障批次的第12批次明顯存在數(shù)據(jù)缺失,故剔除不用。
表2 半導(dǎo)體金屬刻蝕過程變量編號(hào)及名稱
表3 金屬刻蝕過程故障批次編號(hào)及故障設(shè)定
隨機(jī)選擇30個(gè)正常批次作為訓(xùn)練樣本,選擇19個(gè)監(jiān)控變量作為單個(gè)樣本點(diǎn)輸入,對(duì)20個(gè)故障批次進(jìn)行監(jiān)測(cè)。設(shè)定誤分率=0.1,根據(jù)所選的訓(xùn)練樣本長(zhǎng)度=3037,由式(4)得到=0.0033。選擇核函數(shù)參數(shù)=0.005。在上述固定參數(shù)設(shè)定下進(jìn)行監(jiān)測(cè),表4給出了3種方法對(duì)20個(gè)故障批次的檢測(cè)率,圖3、圖4分別給出了故障批次5和故障批次19的監(jiān)測(cè)結(jié)果圖。
由于半導(dǎo)體金屬刻蝕過程單批次數(shù)據(jù)在不同時(shí)段的特性差異較大,支持向量球心距均值與核距離控制圖難以在整個(gè)批次長(zhǎng)度上都取得良好的監(jiān)測(cè)效果,這兩種方法均在過程后半程出現(xiàn)較多的漏報(bào),同時(shí),這兩種控制限為不同批次提供數(shù)值相等的控制限,無法感知批次間的差異,因此監(jiān)測(cè)精度較低。相比之下,本文方法獲得的動(dòng)態(tài)控制限能夠很好地適應(yīng)待監(jiān)測(cè)樣本的特性,無論是批次間還是批次內(nèi),都能對(duì)待監(jiān)測(cè)樣本點(diǎn)的球心距進(jìn)行跟蹤,在整個(gè)批次過程中都能保持較好的監(jiān)測(cè)結(jié)果。
表4 金屬刻蝕過程故障批次檢測(cè)率
提出了一種基于核相似度SVDD的間歇過程監(jiān)測(cè)方法。根據(jù)待監(jiān)測(cè)過程數(shù)據(jù)的特性設(shè)定權(quán)重,靈活選擇不同支持向量對(duì)應(yīng)的球心距作為該監(jiān)測(cè)點(diǎn)的控制限,無需新增人為設(shè)定參數(shù),對(duì)不同時(shí)段特性差異較大的過程數(shù)據(jù)具有較好的適應(yīng)性,并且能夠很好地適應(yīng)監(jiān)測(cè)數(shù)據(jù)所具有的時(shí)變性,過程監(jiān)測(cè)結(jié)果穩(wěn)定。與現(xiàn)有基于SVDD的間歇過程監(jiān)測(cè)方法相比,本文所提方法在不增加訓(xùn)練樣本計(jì)算量的同時(shí)對(duì)正常過程數(shù)據(jù)的描述更準(zhǔn)確,為間歇過程監(jiān)測(cè)提供了更合理的控制限,有效地提高了過程監(jiān)測(cè)的準(zhǔn)確性。
[1] Jiang Q c, Yan X f. Just-in-time reorganized PCA integrated with SVDD for chemical process monitoring[J]. AIChE Journal, 2014, 60(3): 949-965.
[2] Hu Y, Ma H h, Shi H b. Enhanced batch process monitoring using just-in-time-learning based kernel partial least squares[J]. Chemometrics and Intelligent Laboratory Systems, 2013, 123(3): 15-27.
[3] Rashid M M, Yu J. Nonlinear and non-Gaussian dynamic batch process monitoring using a new multiway kernel independent component analysis and multidimensional mutual information based dissimilarity approach[J]. Industrial & Engineering Chemistry Research, 2012, 51(33): 10910-10920.
[4] Zhao C H, Sun Y X. Step-wise sequential phase partition (SSPP) algorithm based statistical modeling and online process monitoring[J]. Chemometrics and Intelligent Laboratory Systems, 2013, 125(5): 109-120.
[5] 趙春暉, 王福利, 姚遠(yuǎn), 等. 基于時(shí)段的間歇過程統(tǒng)計(jì)建模、在線監(jiān)測(cè)及質(zhì)量預(yù)報(bào)[J]. 自動(dòng)化學(xué)報(bào), 2010, 36(3): 366-374.Zhao C H, Wang F L, Yao Y,. Phase-based statistical modeling, online monitoring and quality prediction for batch processes[J]. Acta Automatica Sinica, 2010, 36(3): 366-374.
[6] 張建明, 葛志強(qiáng), 謝磊, 等. 基于支持向量數(shù)據(jù)描述的非高斯過程故障重構(gòu)與診斷[J]. 化工學(xué)報(bào), 2009, 60(1): 168-171. ZHANG J M, GE Z Q, XIE L,. Non-Gaussian process monitoring and fault reconstruction and diagnosis based on SVDD[J]. CIESC Journal, 2009, 60(1): 169-171.
[7] 王培良, 葛志強(qiáng), 宋執(zhí)環(huán). 基于迭代多模型ICA-SVDD的間歇過程故障在線監(jiān)測(cè)[J]. 儀器儀表學(xué)報(bào), 2009, 30(7): 1347-1352.Wang P L, Ge Z Q, Song Z H. Online fault monitoring for batch processes based on adaptive multi-model ICA-SVDD[J]. Chinese Journal of Scientific Instrument, 2009, 30(7): 1347-1352.
[8] MacGregor J F, Kourti T. Statistical process control of multivariate processes[J]. Control Engineering Practice, 1995, 3(3): 403-414.
[9] Kittiwachana S, Ferreira D L S, Lloyd G R,. One class classifiers for process monitoring illustrated by the application to online HPLC of a continuous process[J]. Journal of Chemometrics, 2010, 24(3/4): 96-110.
[10] Kittiwachana S, Ferreira D L S, Fido L A,. Self-organizing map quality control index[J]. Analytical Chemistry, 2010, 82(14): 5972-5982.
[11] Ning X H, Tsung F G. A density-based statistical process control scheme for high-dimensional and mixed-type observations[J]. IIE Transactions, 2012, 44(4): 301-311.
[12] NOMIKOS P, MACGREGOR J F. Monitoring batch processes using multiway principal component analysis[J]. AIChE Journal, 1994, 40(8): 1361-1375.
[13] NOMIKOS P, MACGREGOR J F. Multi-way partial least squares in monitoring batch processes[J]. Chemometrics & Intelligent Laboratory Systems, 1995, 30(1): 97-108.
[14] Chang K Y, Lee J M, Vanrolleghem P A,. On-line monitoring of batch processes using multiway independent component analysis[J]. Chemometrics and Intelligent Laboratory Systems, 2004, 71(2): 151-163.
[15] Lu N Y, Gao F R, Wang F L. Sub-PCA modeling and on-line monitoring strategy for batch processes[J]. AIChE Journal, 2004, 50(1): 255-259.
[16] Yao Y, Gao F R. A survey on multistage/multiphase statistical modeling methods for batch processes[J]. Annual Reviews in Control, 2009, 33(2): 172-183.
[17] Kang J H, Yu J, Kim S B. Adaptive nonparametric control chart for time-varying and multimodal processes[J]. Journal of Process Control, 2016, 37: 34-45.
[18] Gani W, Taleb H, Limam M. An assessment of the kernel-distance-based multivariate control chart through an industrial application[J]. Quality and Reliability Engineering International, 2011, 27(4): 391-401.
[19] Ge Z Q, Song Z H. Bagging support vector data description model for batch process monitoring[J]. Journal of Process Control, 2013, 23: 1090-1096.
[20] LEE J M, YOO C K, LEE I B. Fault detection of batch processes using multiway kernel principal component analysis[J]. Computers & Chemical Engineering, 2004, 28(9): 1837-1847.
[21] ZHANG Y W, HU Z Y. On-line batch process monitoring using hierarchical kernel partial least squares[J]. Chemical Engineering Research and Design, 2011, 89(10): 2078-2084
[22] Sun R X, Tsung F G. A kernel-distance-based multivariate control chart using support vector methods[J]. International Journal of Production Research, 2003, 41(13): 2975-2989.
[23] Camci F, Chinnam R B, Ellis R D. Robust kernel distance multivariate control chart using support vector principles[J]. International Journal of Production Research, 2008, 46(18): 5075-5095.
[24] Ning X H, Tsung F G. Improved design of kernel distance-based charts using support vector methods[J]. IIE Transactions, 2013, 45(4): 464-476.
[25] Sukchotrat T, Kim S B, Tsung F G. One-class classification-based control charts for multivariate process monitoring[J]. IIE transactions, 2009, 42(2): 107-120.
[26] Khediri I B, Weihs C, Limam M. Kernel k-means clustering based local support vector domain description fault detection of multimodal processes[J]. Expert Systems with Applications, 2012, 39(2): 2166-2171.
[27] Tax D M J, Duin R P W. Support vector domain description[J]. Pattern recognition letters, 1999, 20(11): 1191-1199.
[28] Tax D M J, Duin R P W. Support vector data description[J]. Machine Learning, 2004, 54(1): 45-66.
[29] Sakla W, Chan A, Ji J,. An SVDD-based algorithm for target detection in hyperspectral imagery[J]. Geoscience and Remote Sensing Letters, IEEE, 2011, 8(2): 384-388.
[30] Ge Z Q, Gao F R, Song Z H. Batch process monitoring based on support vector data description method[J]. Journal of Process Control, 2011, 21(6): 949-959.
[31] Yao M, Wang H G, Xu W L. Batch process monitoring based on functional data analysis and support vector data description[J]. Journal of Process Control, 2014, 24(7): 1085-1097.
Batch processmonitoring by kernel similarity-based support vector data description
WANG Jianlin, MA Linyu, LIU Weimin, QIU Kepeng, YU Tao
(College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 100029, China)
Kernel distance-based support vector data description (SVDD) for batch process monitoring exhibited poor monitoring precision by setting control limit from the largest kernel distance in historical process dataset but ignoring hyperspherical irregularity in high dimensional space. A kernel similarity based SVDD monitoring method was proposed for batch process monitoring. Kernel similarity was taken as kernel function value between support vectors and data samples for testing. The weighted summation of kernel similarity and distance of support vectors at various time points was utilized to set dynamic control limit for data samples of batch process to be monitored. Batch process monitoring was achieved by judging if kernel distance of test sample exceeded the dynamic control limit. This monitoring method considered irregularity of hypersphere, local distribution characteristics of process dataset in high dimensional space, and spontaneity of data samples, so that it could improve accuracy in batch process monitoring. Method effectiveness was demonstrated by numerical simulation and metal etching process in semiconductor manufacturing.
kernel similarity; support vector data description; dynamic monitoring; batch process
10.11949/j.issn.0438-1157.20170428
TQ 277
A
0438—1157(2017)09—3494—07
2017-04-19收到初稿,2017-05-27收到修改稿。
王建林(1965—),男,教授。
國(guó)家自然科學(xué)基金項(xiàng)目(61240047);北京市自然科學(xué)基金項(xiàng)目(4152041)。
2017-04-19.
Prof. WANG Jianlin, wangjl@ mail.buct.edu.cn
supported by the National Natural Science Foundationof China (61240047) and the Beijing Natural Science Foundation (4152041).