王 娜,胡超芳,師五喜
(1.天津工業(yè)大學(xué) a.電氣工程與自動化學(xué)院;b.電工電能新技術(shù)天津市重點(diǎn)實驗室,天津 300387; 2.天津大學(xué) a.微光機(jī)電系統(tǒng)技術(shù)教育部重點(diǎn)實驗室;b.電氣與自動化工程學(xué)院,天津 300072)
pH中和過程是具有嚴(yán)重非線性和大滯后的復(fù)雜工業(yè)過程[1-2],獲得性能滿意、能夠反映其本質(zhì)特征的模型是對其進(jìn)行有效控制的重要前提。通常的解決方案有全局建模策略,包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,但在處理pH中和這類數(shù)據(jù)分布離散、幅值變化較大的較強(qiáng)非線性對象時,會因為結(jié)構(gòu)的單一性而難以充分逼近其非線性特性,導(dǎo)致模型的擬合精度和泛化能力較差[3]。
為此,基于分解-合成思想的T-S模糊建模方法[3-5],通過在子空間建立起若干局部線性函數(shù)關(guān)系的組合來描述全局系統(tǒng),使規(guī)則庫得以有效約簡,計算復(fù)雜性大大降低。
T-S模型的構(gòu)建通常采用模糊辨識,即模糊子空間的劃分來獲取規(guī)則數(shù)、前提參數(shù)和后件參數(shù)。而規(guī)則數(shù)對應(yīng)著模糊子空間的劃分,一般采用模糊聚類的方法實現(xiàn)[6-7]。但在實際應(yīng)用中,模糊聚類的初始參數(shù),即聚類個數(shù)和聚類中心通常是事先未知的,一般通過經(jīng)驗或者人為試湊的方式給定,有2類途徑:比較法[3,8]或者融合法[3,9-10]。比較法通常采用若干聚類有效性指標(biāo)的比較確定聚類數(shù),易于受到人為決策的影響;而融合法中不重要聚類的判別和刪減過程不僅增加了計算的復(fù)雜性,并且容易導(dǎo)致聚類空間出現(xiàn)空洞,使模型的泛化能力變差[9]。此外,由于聚類過程中易受到數(shù)據(jù)中噪聲的影響,可能導(dǎo)致生成的聚類個數(shù)過少或者出現(xiàn)冗余,也會直接影響到模糊規(guī)則數(shù)的確定[11]。
為此,本文提出一種基于客觀滿意聚類的pH中和過程建模方法。首先改進(jìn)原始客觀聚類分析算法[12-14],其具有對數(shù)據(jù)中噪聲的較強(qiáng)魯棒性,從而克服噪聲對于聚類結(jié)果,即聚類個數(shù)和聚類中心的影響,可以直接確定一個比較適宜的初始規(guī)則數(shù)和初始聚類中心,并將其與Gustafson-Kessel(GK)模糊聚類[15-16]相結(jié)合,利用GK聚類進(jìn)一步優(yōu)化原有的聚類中心及對應(yīng)的模糊劃分。此外,針對建模者對于模型的滿意度,在初始模糊劃分的基礎(chǔ)上,再利用模型的滿意度指標(biāo)進(jìn)行模糊聚類的迭代,以確定滿意的模糊規(guī)則數(shù)和前提參數(shù),使模型結(jié)構(gòu)更加靈活有效,最后再利用穩(wěn)態(tài)卡爾曼濾波算法[5]估計模型的后件參數(shù),以克服傳統(tǒng)最小二乘算法在求解病態(tài)矩陣時易導(dǎo)致非數(shù)值解的問題,提高計算的穩(wěn)定性。
從系統(tǒng)建模的角度而言,pH中和過程是一個多入多出過程,輸入量為酸液流量Fa及所含成分濃度Ca,堿液流量Fb及所含成分濃度Cb,輸出量為酸液濃度ωa和堿液的濃度ωb。CSTR的動態(tài)模型為:
(1)
(2)
其中,V為反應(yīng)器的容積。
不失一般性,考慮弱酸強(qiáng)堿過程,其中和滴定方程為:
(3)
其中,wa=[Cl-],wb=[Na+] ,Ka=1.76×10-5為弱酸的電離常數(shù),且pKa=-lgKa。中和滴定曲線如圖1所示,可見pH中和值在中和點(diǎn)附近靈敏度很高,而在遠(yuǎn)離中和點(diǎn)處靈敏度很低。
圖1 弱酸強(qiáng)堿及強(qiáng)酸強(qiáng)堿中和滴定曲線
在非線性系統(tǒng)建模中,T-S模糊模型是一種常用的有效模型結(jié)構(gòu),規(guī)則形式如下[5]:
(4)
采用加權(quán)平均法,T-S模型的推理可簡化如下:
(5)
客觀滿意聚類首先引入原始的客觀聚類算法[12-14]對其進(jìn)行改進(jìn),并將其引入Gustafson-Kessel(GK)聚類[15-16]來提供比較合適的初始聚類個數(shù)和聚類中心,以此作為原始輸入-輸出數(shù)據(jù)空間的初始模糊劃分,并依據(jù)用戶提供的建模滿意度準(zhǔn)則,進(jìn)行后續(xù)新的聚類個數(shù)生成和聚類中心的更新,以確定最終的模糊劃分,其原理如圖2所示。
圖2 客觀滿意聚類原理
3.1.1 GK聚類
與傳統(tǒng)模糊聚類算法相比,GK聚類利用自適應(yīng)距離度量取代固定的歐式距離,進(jìn)行類內(nèi)距離的計算,從而有效克服了模糊C均值算法易受初始值影響而陷入局部極值的缺點(diǎn),因而更加適合模糊辨識。
給定數(shù)據(jù)集Z,GK通過求取目標(biāo)函數(shù)J的極小值來獲取給定聚類個數(shù)c下的模糊隸屬度矩陣U和對應(yīng)的聚類中心V:
(6)
其中,d(zj,vi)表示樣本zj與聚類中心vi之間的距離,受實際的聚類形狀影響,并由聚類協(xié)方差矩陣Fi決定。
(7)
d2(zj,vi)=(zj-vi)TMi(zj-vi)
(8)
(9)
但GK聚類的初始參數(shù),即聚類個數(shù)c和聚類中心V難以確定,常見有比較[3,8]和融合法[3,9-10]。但在如何確定聚類的初始個數(shù)上,比較法依賴于聚類有效性指標(biāo)的相互比較,而融合法采用最大聚類個數(shù)開始,依次逐步合并的方式確定最終聚類個數(shù)。兩者均比較依賴于經(jīng)驗,或者某些假定的數(shù)據(jù)條件,比如必須滿足高斯正態(tài)分布等。而對于缺乏先驗知識,或者不滿足外在假設(shè)條件的數(shù)據(jù)集則缺少有效的提煉聚類個數(shù)的方法。并且,還容易受到數(shù)據(jù)中噪聲、數(shù)據(jù)分布等因素的影響,從而給模型前件參數(shù)的確定帶來較多的不確定性,進(jìn)而導(dǎo)致不準(zhǔn)確的辨識結(jié)果,影響整個模型的精度。為此,提出改進(jìn)客觀聚類算法,并與GK聚類相結(jié)合,形成客觀滿意聚類方法,以改善這一狀況。
3.1.2 客觀聚類原理
客觀聚類的基本原理如圖3所示。主要采用相似性數(shù)據(jù)分級和自組織聚類實現(xiàn)對相似數(shù)據(jù)子集的共同聚類和比較,其中相似性數(shù)據(jù)分級利用兩兩距離最近的數(shù)據(jù)對排序,以將整個數(shù)據(jù)集劃分為訓(xùn)練集A、B或者測試集C、D,即Z={A,B}or{C,D},并分別在這4個子集上進(jìn)行自組織聚類, 將各自的聚類結(jié)果兩兩比較以決定最終的聚類結(jié)果。
圖3 客觀聚類的基本原理
為克服原有算法的最近鄰聚類效應(yīng),導(dǎo)致難于形成較小聚類,以及原有一致性計算中出現(xiàn)的多值解問題,本文采用改進(jìn)客觀聚類算法[14],即引入相對不相似性測度(Relative Dissimilarity Measure,RDM)[17]來確定待融合的聚類,以降低最近鄰引起聚類過程的滾雪球問題,提高算法的準(zhǔn)確性,并提出改進(jìn)一致性準(zhǔn)則來克服多值解的收斂問題,提高求解的穩(wěn)定性。
與傳統(tǒng)硬聚類相比,改進(jìn)客觀聚類的特點(diǎn)主要為:
1)相似性數(shù)據(jù)分級
通過相似性分級,原始的數(shù)據(jù)集Z被重新劃分為2組數(shù)據(jù)子集{A,B}或者{C,D}。相比之下,子集A與B的相似度最高,而C與D亦然。并且,{A,B}的相似度高于{C,D},因此將{A,B}作為內(nèi)部訓(xùn)練集進(jìn)行聚類,來獲得原始數(shù)據(jù)集Z的一種可能的聚類結(jié)果,而{C,D}作為測試集來校驗{A,B}結(jié)果的準(zhǔn)確性,為最終的聚類結(jié)果的確定提供外部依據(jù),因此,在內(nèi)外2種準(zhǔn)則的共同檢驗下,最終聚類結(jié)果的有效性得以保證。
圖4 訓(xùn)練子集A、B的偶極子構(gòu)成
2)啟發(fā)式自組織聚類
不同于傳統(tǒng)的層次聚類,啟發(fā)式自組織聚類利用一種新定義的距離測度-相對不相似性測度(RDM)來衡量[17]每次聚類中待融合的2個聚類i和j之間的相似性,并且還考慮了未被合并的聚類k對于本次聚類合并的影響,對于數(shù)據(jù)的分布更具有較強(qiáng)魯棒性。
(10)
(11)
改進(jìn)一致性準(zhǔn)則定義如下:
(12)
與原始的一致性準(zhǔn)則相比,改進(jìn)的一致性計算采用同一位置下不同子集的聚類中心之間的差異來代替數(shù)據(jù)點(diǎn)之間的差值,從而降低了數(shù)據(jù)中噪聲點(diǎn)對一致性計算的影響,確保了聚類結(jié)果的準(zhǔn)確性。
如2.3節(jié)所述,利用所提的客觀滿意聚類算法的聚類結(jié)果可以確定T-S模型的初始結(jié)構(gòu),規(guī)則數(shù)即為聚類個數(shù),模糊劃分矩陣中的隸屬度元素即為所對應(yīng)規(guī)則的前提參數(shù),但這一結(jié)果并非模糊模型的最優(yōu)結(jié)構(gòu)。其主要原因在于聚類算法在使用數(shù)據(jù)建模時,主要利用聚類的相似性原理,以尋找最優(yōu)的聚類為目的,而建模對象之間的輸入-輸出關(guān)系的某些非線性特性就可能被忽視,造成欠擬合,所以最終的聚類結(jié)果可能并不能滿足建模精度要求。
如圖5所示,在非線性曲線中,曲線l1和l2段的動態(tài)特性僅用聚類C1來表示,l4和l5段僅用聚類C3所覆蓋,顯然建模的擬合精度不足。VS表示非常小,S表示小,M表示中,L表示大,VL表示非常大。為此,在客觀滿意聚類基礎(chǔ)上,引入一種誤差反饋機(jī)制,利用聚類后模型與實際數(shù)據(jù)輸出之間的最大誤差來反饋所建模型的擬合效果,并以此為聚類是否繼續(xù)迭代的依據(jù),直至模型與數(shù)據(jù)輸出之間的誤差降低至某一允許的精度范圍內(nèi)終止。在此前提參數(shù)的辨識基礎(chǔ)上,利用穩(wěn)態(tài)卡爾曼濾波算法[5]估計規(guī)則的后件參數(shù),完成整個T-S模糊模型的結(jié)構(gòu)和參數(shù)辨識。
圖5 模糊聚類劃分的欠擬合
算法步驟歸納如下:
步驟1采用EOCA 算法確定一個初始聚類結(jié)果{c0,V0},c0為聚類個數(shù),V0為初始聚類中心集。
考慮式(1)~式(3)描述的弱酸強(qiáng)堿中和過程,給定酸液流量Fa,則系統(tǒng)輸入輸出分別為堿液流量Fb和流出物的pH值。樣本集(Fb,ypH)可通過機(jī)理模型式(1)~式(3)得到。在Fb中加入[-51.5,+51.5]范圍內(nèi)的變化量,由此產(chǎn)生300組樣本。假設(shè)T-S模型包含2個輸入量,其表達(dá)式為:
(13)
圖6 一致性準(zhǔn)則與聚類個數(shù)關(guān)系曲線
給定初始規(guī)則數(shù)n=c=2 ,初始聚類中心Vi,采用GK和穩(wěn)態(tài)卡爾曼濾波法分別辨識前提參數(shù)和結(jié)論參數(shù)之后,得到第i條規(guī)則Ri為:
(14)
圖7 無噪聲下實際系統(tǒng)輸出與模型估計的誤差曲面
最終產(chǎn)生的5個聚類中心在整個數(shù)據(jù)集中的分布如圖8所示。
圖8 無噪聲下c=5時的聚類子集與聚類中心分布
由圖8可見,整個數(shù)據(jù)集被均勻劃分為5個聚類,每個聚類中心即為模糊規(guī)則的中心,數(shù)據(jù)與聚類中心之間的模糊隸屬度矩陣決定了其前提參數(shù)。以第1個數(shù)據(jù)為例,其在模糊矩陣中表示為:U_c5(1,:)=[0.03 0.79 0.06 0.09 0.02],以其最大的隸屬度值0.79應(yīng)該歸為第2類,其余數(shù)據(jù)以此類推,形成上述5個聚類子集{c1,c2,c3,c4,c5},對應(yīng)聚類中心{v1,v2,v3,v4,v5}。系統(tǒng)輸出與模型輸出的比較曲線如圖9所示。
圖9 無噪聲下系統(tǒng)實際輸出與模型輸出的誤差比較曲線
上述結(jié)果為未添加噪聲下的模型,為驗證所建模型的魯棒性,對上述數(shù)據(jù)的輸入和輸出同時添加信噪比為5 dB的白高斯噪聲,采用同樣方法訓(xùn)練,結(jié)果得到(itaCD=0.003 3)c=2∠(itaAB=1.183 2)c=6,故選取初始聚類個數(shù)為2。經(jīng)過GK模糊聚類和迭代,以及穩(wěn)態(tài)卡爾曼濾波后,得到聚類個數(shù)為4時MSE為0.64,而聚類個數(shù)為5時MSE為0.65,誤差精度變化不大,故確定最終規(guī)則數(shù)為4,MSE為0.64,如圖10所示。
圖10 有噪聲下系統(tǒng)實際輸出與模型輸出的誤差比較曲線
無噪聲環(huán)境下,采用上述訓(xùn)練數(shù)據(jù)集,所提方法與其他模糊聚類建模效果比較如表1所示。由表1可見,與USOCPN相比,本文方法規(guī)則數(shù)較少,并且訓(xùn)練精度處于同一量綱內(nèi),因此具有更加精簡的模型結(jié)構(gòu),其結(jié)構(gòu)和參數(shù)辨識的計算效率相應(yīng)就得以大大降低。與GK模糊聚類相比,本文方法取規(guī)則數(shù)為5時,其建模精度處于同一量綱范圍內(nèi),但其初始聚類個數(shù)和初始聚類中心均可由客觀聚類方法直接一次給定,避免了GK模糊聚類中初始聚類參數(shù)難以確定,采用試湊而帶來的不確定性,更加直接有效。并且,在添加噪聲之后,與GK模糊聚類相比,模型的擬合精度處于同一量級范圍內(nèi),但卻避免了GK模糊聚類難以確定模糊規(guī)則數(shù)的缺點(diǎn),使得初始結(jié)構(gòu)的確定更加準(zhǔn)確。同時,能夠以較少的規(guī)則數(shù)獲得較為滿意的建模精度。
表1 客觀滿意聚類與其他模糊聚類的建模性能比較
本文利用客觀模糊聚類辨識pH中和過程,提供了一種新型的T-S模糊建模方法。該方法能從系統(tǒng)的實際輸入輸出數(shù)據(jù)出發(fā),自適應(yīng)地快速確定系統(tǒng)的模糊規(guī)則數(shù)、前提參數(shù)和后件參數(shù)。對pH過程的仿真研究驗證了所建模型對系統(tǒng)具有較強(qiáng)的擬合能力,并且對于噪聲數(shù)據(jù)的擬合有較強(qiáng)的魯棒性,結(jié)構(gòu)簡單,易于實現(xiàn)。
[1] BUCHHOLT F,KUMMEL M.Self-tuning Control of a pH Neutralization Process[J].Automatica,1979,15(6):665-671.
[2] NIE Junhong,LOH A P,HANG C C.Modeling pH Neutralization Processes Using Fuzzy-neural Approaches[J].Fuzzy Sets and Systems,1996,78(1):5-22.
[3] 李 檸,李少遠(yuǎn),席裕庚.利用模糊滿意聚類建立pH中和過程模型[J].控制與決策,2002,17(2):143-147.
[4] 李香娜.基于T-S模糊模型的酸堿中和過程的系統(tǒng)辨識[J].華北科技學(xué)院學(xué)報,2010,7(3):56-60.
[5] TAKAGI T,SUGENO M.Fuzzy Identification of Systems and Applications to Modeling and Control[J].IEEE Transactions on Systems,Man,and Cybernetics,1985,15(1):116-132.
[6] YI Yang,FAN Xiangxiang,ZHANG Tianping.Anti-disturbance Tracking Control for Systems with Nonlinear Disturbances Using T-S Fuzzy Modeling[J].Neurocomputing,2016,171(3):1027-1037.
[7] 宋 俐,謝 剛,楊云云.基于模糊聚類的社團(tuán)劃分算法[J].計算機(jī)工程,2016,42(8):126-133.
[8] QIAO Junfei,LI Wei,ZENG Xiaojun.Identification of Fuzzy Neural Networks by Forward Recursive Input-output Clustering and Accurate Similarity Analysis[J].Applied Soft Computing,2016,49:524-543.
[9] KRISHNAPURAM R,FREG C P.Fitting an Unknown Number of Lines and Planes to Image Data Through Compatible Cluster Merging[J].Pattern Recognition,1992,25(4):385-400.
[10] KAYMAK U,BABUSKA R.Compatible Cluster Merging for Fuzzy Modeling[C]//Proceedings of IEEE International Conference on Fuzzy System.Washington D.C.,USA:IEEE Press,1995:897-904.
[11] 劉士榮,余建軍,林衛(wèi)星,等.啟發(fā)式模糊聚類學(xué)習(xí)在函數(shù)逼近和非線性系統(tǒng)建模中的應(yīng)用[J].模式識別與人工智能,2003,16(2):230-235.
[12] 王 娜.基于客觀聚類的模糊建模方法研究[D].上海:上海交通大學(xué),2009.
[13] 賀昌政.自組織數(shù)據(jù)挖掘與經(jīng)濟(jì)預(yù)測[M].北京:科學(xué)出版社,2005.
[14] 王 娜,楊煜普.一種基于改進(jìn)客觀聚類分析的模糊辨識方法[J].控制與決策,2009,24(1):13-17,22.
[15] QIU Haobo,XU Yanjiao,GAO Liang,et al.Multi-stage Design Space Reduction and Metamodeling Optimization Method Based on Self-organizing Maps and Fuzzy Clustering[J].Expert Systems with Applications,2016,46(3):180-195.
[16] GUSTAFSON D,KESSEL W C.Fuzzy Clustering with a Fuzzy Covariance Matrix[C]//Proceedings of IEEE Conference on Decision & Control.Washington D.C.,USA:IEEE Press,1979:761-766.
[17] MOLLINEDA R A,ENRIQUE V.A Relative Approach to Hierarchical Clustering[M].Amsterdam,the Netherlands:IOS Press,2000:19-28.
[18] 李 檸.多模型建模與控制的若干問題研究[D].上海:上海交通大學(xué),2002.