• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種改進(jìn)的SOM神經(jīng)網(wǎng)絡(luò)在污水處理故障診斷中的應(yīng)用

      2017-07-01 22:37:30岳宇飛羅健旭
      關(guān)鍵詞:殖民地帝國(guó)權(quán)值

      岳宇飛, 羅健旭

      (華東理工大學(xué)自動(dòng)化研究所,上海 200237)

      ?

      一種改進(jìn)的SOM神經(jīng)網(wǎng)絡(luò)在污水處理故障診斷中的應(yīng)用

      岳宇飛, 羅健旭

      (華東理工大學(xué)自動(dòng)化研究所,上海 200237)

      自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)初始權(quán)值的選取對(duì)神經(jīng)網(wǎng)絡(luò)的性能有重要的影響。采用改進(jìn)的帝國(guó)競(jìng)爭(zhēng)算法(IICA)優(yōu)化局部權(quán)重失真指數(shù)(LWDI)尋優(yōu)SOM神經(jīng)網(wǎng)絡(luò)的初始權(quán)值;利用改進(jìn)后的SOM神經(jīng)網(wǎng)絡(luò)(IICA-SOM)對(duì)污水處理過(guò)程數(shù)據(jù)進(jìn)行聚類和故障診斷。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的SOM算法相比,IICA-SOM算法取得了更好的聚類效果,且故障診斷的誤診率更低。

      故障診斷; 聚類; 自組織映射; 帝國(guó)競(jìng)爭(zhēng)算法

      污水處理過(guò)程是一個(gè)變量繁多、具有大時(shí)變、大時(shí)滯特點(diǎn)的動(dòng)態(tài)非線性反應(yīng)過(guò)程,實(shí)際運(yùn)行過(guò)程中易出現(xiàn)各類故障。例如受用水量、天氣等外部因素影響,污水處理過(guò)程的進(jìn)水水質(zhì)、水量會(huì)產(chǎn)生波動(dòng),從而對(duì)活性污泥造成沖擊;反應(yīng)池的pH異常、供氧不足、有毒物質(zhì)的流入等,會(huì)引起污泥上漲、老化、中毒、膨脹等故障。另外污水處理過(guò)程的運(yùn)行環(huán)境惡劣,會(huì)導(dǎo)致某些傳感器或執(zhí)行器腐蝕、損壞嚴(yán)重,致使輸出信號(hào)產(chǎn)生偏差、沖擊、漂移或輸出恒定值等。并且,污水處理廠一些關(guān)鍵設(shè)備(如鼓風(fēng)機(jī)、水泵等)長(zhǎng)期運(yùn)行也會(huì)產(chǎn)生機(jī)械故障。在污水處理過(guò)程中,對(duì)上述各種故障進(jìn)行及時(shí)準(zhǔn)確的發(fā)現(xiàn)及診斷,對(duì)污水處理廠的安全、穩(wěn)定、長(zhǎng)期運(yùn)行有重要意義。

      近年來(lái),自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)在污水處理故障診斷中得到了許多應(yīng)用。Mika等[1]提出了一種基于SOM神經(jīng)網(wǎng)絡(luò)的自適應(yīng)多變量監(jiān)測(cè)方法,通過(guò)對(duì)污水處理數(shù)據(jù)各項(xiàng)指標(biāo)的檢測(cè)來(lái)預(yù)判故障的發(fā)生,從而避免工業(yè)事故的出現(xiàn)。Heikkinen等[2]介紹了一種基于SOM神經(jīng)網(wǎng)絡(luò)的分析方法,通過(guò)SOM對(duì)污水處理數(shù)據(jù)進(jìn)行建模,并運(yùn)用K-means方法對(duì)訓(xùn)練好的SOM神經(jīng)網(wǎng)絡(luò)權(quán)值進(jìn)行聚類,每一類代表一種狀態(tài)。在實(shí)際的污水處理應(yīng)用中,該方法可以有效地對(duì)污水處理過(guò)程中的數(shù)據(jù)進(jìn)行分析,確定它們分別屬于哪個(gè)狀態(tài)以及各個(gè)變量對(duì)狀態(tài)的影響程度。Yu等[3]提出了一種基于多元回歸、主成分分析和冗余分析的SOM預(yù)測(cè)模型,并運(yùn)用該模型對(duì)受污染人工濕地中的溶解氧濃度和氨氮濃度進(jìn)行預(yù)測(cè),實(shí)驗(yàn)表明該模型能夠很好地檢測(cè)人工濕地中的污染物去除情況。SOM神經(jīng)網(wǎng)絡(luò)是一種自監(jiān)督、自學(xué)習(xí)能力很強(qiáng)的神經(jīng)網(wǎng)絡(luò),它能夠從樣本數(shù)據(jù)中提取到數(shù)據(jù)特征且所需的樣本量較少,同時(shí)能對(duì)數(shù)據(jù)進(jìn)行很好的聚類,因此在污水處理故障診斷領(lǐng)域有很好的應(yīng)用前景,然而,SOM神經(jīng)網(wǎng)絡(luò)的性能對(duì)網(wǎng)絡(luò)初始權(quán)值有較大的依賴。本文采用改進(jìn)后的帝國(guó)競(jìng)爭(zhēng)算法(IICA)來(lái)獲取最優(yōu)的初始權(quán)值,應(yīng)用改進(jìn)后的SOM神經(jīng)網(wǎng)絡(luò)(IICA-SOM)對(duì)污水處理過(guò)程數(shù)據(jù)進(jìn)行故障診斷,實(shí)驗(yàn)結(jié)果顯示IICA-SOM的聚類效果和診斷正確率都優(yōu)于傳統(tǒng)的SOM。

      1 SOM原理及性能指標(biāo)

      1.1 SOM原理

      SOM由芬蘭學(xué)者Kohonen[4]于1982年提出,它是由一個(gè)全連接的神經(jīng)元陣列組成的無(wú)監(jiān)督、自組織、自學(xué)習(xí)的網(wǎng)絡(luò)。該網(wǎng)絡(luò)與其他神經(jīng)網(wǎng)絡(luò)的區(qū)別在于它既可以學(xué)習(xí)數(shù)據(jù)本身的特征,也可以學(xué)習(xí)數(shù)據(jù)之間的拓?fù)潢P(guān)系,因此神經(jīng)網(wǎng)絡(luò)在完成學(xué)習(xí)之后可以得到輸入空間中存在的拓?fù)浣Y(jié)構(gòu)[5]。此外,SOM在學(xué)習(xí)輸入數(shù)據(jù)拓?fù)浣Y(jié)構(gòu)的同時(shí),也可以將輸入空間的高維結(jié)構(gòu)特性映射到低維空間中(一般為1維或者2維)[6]。SOM神經(jīng)網(wǎng)絡(luò)由輸入層和輸出層組成,兩層之間實(shí)現(xiàn)全連接。在SOM網(wǎng)絡(luò)對(duì)一個(gè)輸入向量進(jìn)行學(xué)習(xí)時(shí),將產(chǎn)生一個(gè)獲勝神經(jīng)元,在進(jìn)行權(quán)值更新時(shí),獲勝神經(jīng)元及其周圍神經(jīng)元的權(quán)值都將得到更新。這樣不斷地學(xué)習(xí)下去,就可以使得輸入空間中存在關(guān)聯(lián)的數(shù)據(jù)在輸出空間中也能夠聚集在一處,形成具有關(guān)聯(lián)性的神經(jīng)元的集合,這就是SOM神經(jīng)網(wǎng)絡(luò)能在無(wú)先驗(yàn)知識(shí)的情況下對(duì)輸入數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)聚類的原因。另外SOM網(wǎng)絡(luò)還具有將聚類結(jié)果可視化的功能。

      SOM的學(xué)習(xí)原理[7]:假設(shè)某一神經(jīng)元k的權(quán)值向量有n維,即ωk={wk1,wk2,…,wkn},n是輸入空間的維數(shù),其初始值一般設(shè)為[0,1]之間的隨機(jī)值。在每一次的訓(xùn)練過(guò)程中,對(duì)于輸入空間中的每一個(gè)輸入數(shù)據(jù)x,根據(jù)式(1)計(jì)算輸入數(shù)據(jù)與網(wǎng)絡(luò)中每個(gè)神經(jīng)元之間的歐式距離,獲得與該輸入數(shù)據(jù)距離最小的神經(jīng)元ωc,并稱之為獲勝神經(jīng)元(BMU)[8]。然后運(yùn)用式(2)調(diào)整BMU及其相鄰神經(jīng)元的權(quán)值向量,使它們更加接近于輸入數(shù)據(jù)x。不斷重復(fù)上述過(guò)程,直到神經(jīng)元的權(quán)值向量達(dá)到全局收斂。

      ‖x(t)-ωc(t)‖≤‖x(t)-ωi(t)‖

      (1)

      ωi(t+1)=ωi(t)+η(t)hc(x),i(x(t)-ωi(t))

      (2)

      其中:η(t)為t時(shí)刻的學(xué)習(xí)速率,隨著訓(xùn)練的進(jìn)行逐漸減小;hc(x),i為鄰域調(diào)整函數(shù)。

      由式(2)可以看出,SOM的每一次訓(xùn)練都是在不停地縮小神經(jīng)元與輸入數(shù)據(jù)之間的距離??梢缘玫绞?3):

      (3)

      其中,Xmean為映射到神經(jīng)元k上的所有輸入數(shù)據(jù)的均值。

      因此,當(dāng)SOM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)足夠大時(shí),每個(gè)神經(jīng)元的權(quán)值向量與映射到該神經(jīng)元上所有輸入樣本的均值將近似相等,即每個(gè)神經(jīng)元都近似表示為映射到該神經(jīng)元上的數(shù)據(jù)樣本的中心。

      1.2 SOM的大小確定

      SOM輸出層中的神經(jīng)元個(gè)數(shù)及排列方式?jīng)Q定了SOM分類結(jié)果的精度及其泛化性,同時(shí)神經(jīng)元個(gè)數(shù)越多SOM的性能越好,但是計(jì)算代價(jià)也越大。因此,怎樣確定神經(jīng)元的個(gè)數(shù)就顯得十分關(guān)鍵。根據(jù)文獻(xiàn)[9]的介紹,SOM輸出層神經(jīng)元個(gè)數(shù)及大小的確定一般按以下公式進(jìn)行(近似相等):

      (4)

      (5)

      其中:N為輸入空間的樣本數(shù);M為神經(jīng)元的個(gè)數(shù);e1、e2為輸入空間樣本矩陣最大的兩個(gè)特征值;n1、n2分別表示輸出層神經(jīng)元的行數(shù)和列數(shù)。

      1.3 性能指標(biāo)

      文獻(xiàn)[4]為SOM網(wǎng)絡(luò)的性能評(píng)價(jià)定義了一個(gè)指標(biāo)——局部失真指數(shù)(LWDI),即

      D=E[p(x)]

      (6)

      (7)

      其中:E表示數(shù)學(xué)期望;x表示輸入向量;ω(k1,k2)表示坐標(biāo)為(k1,k2)的神經(jīng)元的權(quán)值;(c1,c2)是輸入向量x的獲勝神經(jīng)元的坐標(biāo);hx(?)為鄰域函數(shù)。本文采用的領(lǐng)域函數(shù)是Moore函數(shù),形式為

      其他值都為0,即只有圍繞獲勝神經(jīng)元的神經(jīng)元才會(huì)被激活。

      局部權(quán)值失真指數(shù)可以較為全面地衡量一個(gè)SOM神經(jīng)網(wǎng)絡(luò)的質(zhì)量,該指數(shù)越小則表明網(wǎng)絡(luò)的質(zhì)量越好。從該指數(shù)的定義上看,如果把鄰域函數(shù)去除則與K-means算法的數(shù)學(xué)表達(dá)式很相似[10],因此可以通過(guò)最小化LWDI來(lái)不斷修正SOM網(wǎng)絡(luò)的聚類中心。由于初始權(quán)值對(duì)SOM網(wǎng)絡(luò)性能的影響非常顯著,所以本文通過(guò)帝國(guó)競(jìng)爭(zhēng)算法尋找使LWDI最小的網(wǎng)絡(luò)初始權(quán)值,以改善網(wǎng)絡(luò)的性能。

      2 帝國(guó)競(jìng)爭(zhēng)算法的原理及改進(jìn)

      2.1 帝國(guó)競(jìng)爭(zhēng)算法的原理

      帝國(guó)競(jìng)爭(zhēng)算法(ICA)[11]是一種進(jìn)化類算法,一般包含初始帝國(guó)的產(chǎn)生、同化機(jī)制、競(jìng)爭(zhēng)機(jī)制、帝國(guó)滅亡4個(gè)部分。理想情況下,同化機(jī)制使得所有殖民地都和帝國(guó)處于同一位置,而帝國(guó)競(jìng)爭(zhēng)使得最后只剩一個(gè)帝國(guó),即全局最優(yōu)解。

      (1) 初始帝國(guó)的產(chǎn)生。在ICA中個(gè)體稱為“國(guó)家”,類似于遺傳算法中的染色體,對(duì)于某一個(gè)Nvar維的優(yōu)化問(wèn)題,國(guó)家表示如下:

      country=[p1,p2,…,pNvar]

      (8)

      通過(guò)代價(jià)函數(shù)來(lái)衡量每個(gè)國(guó)家的實(shí)力:

      cost=f(country)

      (9)

      初始帝國(guó)的產(chǎn)生主要由以下幾步完成:

      Step1 隨機(jī)產(chǎn)生Npop個(gè)國(guó)家,選擇其中實(shí)力較強(qiáng)的前Nimp個(gè)國(guó)家作為帝國(guó),剩下的Ncol(Ncol=Npop-Nimp)個(gè)國(guó)家作為殖民地;

      Step2 根據(jù)帝國(guó)實(shí)力的強(qiáng)弱劃分殖民地。每個(gè)帝國(guó)獲得的殖民地個(gè)數(shù)按式(10)~式(12)確定:

      (10)

      (11)

      (12)

      其中:cn表示第n個(gè)帝國(guó)的代價(jià)函數(shù)值;i的取值范圍為[1,Nimp];Cn表示標(biāo)準(zhǔn)代價(jià);pn表示第n個(gè)帝國(guó)的標(biāo)準(zhǔn)實(shí)力;N.C.n為第n個(gè)帝國(guó)初始時(shí)獲得的殖民地個(gè)數(shù)。

      Step3 每個(gè)帝國(guó)從Ncol個(gè)殖民地中隨機(jī)獲取相應(yīng)個(gè)數(shù)的殖民地,形成Nimp個(gè)帝國(guó)主義國(guó)家。

      (2) 同化機(jī)制。同化是指每個(gè)帝國(guó)主義國(guó)家的所有殖民地都向其帝國(guó)移動(dòng)。每個(gè)殖民地向帝國(guó)移動(dòng)的距離設(shè)為x且服從均勻分布,定義如下:

      x~U(0,β×d)

      (13)

      其中:β>1;d是帝國(guó)與其殖民地之間的最遠(yuǎn)距離。另外,為了擴(kuò)大搜索區(qū)域,增加了一個(gè)偏移角θ,且服從均勻分布,定義如下:

      θ~U(-γ,γ)

      (14)

      其中,0<γ<π,表示最大的偏移角度。

      在殖民地移動(dòng)的過(guò)程中,當(dāng)殖民地的實(shí)力強(qiáng)于帝國(guó)時(shí),交換帝國(guó)與殖民地的位置。此時(shí),該殖民地成為帝國(guó),而帝國(guó)則淪為殖民地。

      (3) 競(jìng)爭(zhēng)機(jī)制。競(jìng)爭(zhēng)是指帝國(guó)主義國(guó)家與帝國(guó)主義國(guó)家之間的競(jìng)爭(zhēng),實(shí)力強(qiáng)的吞并實(shí)力弱的。在帝國(guó)競(jìng)爭(zhēng)過(guò)程中,選擇綜合實(shí)力最弱帝國(guó)主義國(guó)家的殖民地作為各個(gè)帝國(guó)競(jìng)爭(zhēng)的對(duì)象,且實(shí)力越強(qiáng)的帝國(guó)獲得該殖民地的幾率越大,最終獲得勝利的帝國(guó)將獲得所有的殖民地。

      每個(gè)帝國(guó)主義國(guó)家的實(shí)力由兩部分組成:帝國(guó)自身的實(shí)力以及其殖民地的實(shí)力,即帝國(guó)的代價(jià)函數(shù)以及殖民地的代價(jià)函數(shù)。帝國(guó)的綜合實(shí)力定義如下:

      (15)

      (16)

      (17)

      其中:T.C.n表示第n個(gè)帝國(guó)的綜合實(shí)力;f(?)表示代價(jià)函數(shù);impn表示第n個(gè)帝國(guó);coli表示第i個(gè)殖民地,變化范圍為[1,N.C.n];0<ξ<1,ξ表示殖民地對(duì)帝國(guó)總體實(shí)力的影響程度;N.T.C.n表示第n個(gè)帝國(guó)的標(biāo)準(zhǔn)綜合國(guó)力,i的取值范圍為[1,Nimp];PPn表示第n個(gè)帝國(guó)獲得競(jìng)爭(zhēng)勝利的概率。

      (4) 帝國(guó)滅亡。帝國(guó)競(jìng)爭(zhēng)使得實(shí)力弱的帝國(guó)主義國(guó)家的實(shí)力越來(lái)越弱,直至該帝國(guó)的所有殖民地都失去后,該帝國(guó)則滅亡。

      2.2 基于帝國(guó)合并的改進(jìn)ICA

      ICA算法的核心在于帝國(guó)內(nèi)部的同化機(jī)制以及帝國(guó)與帝國(guó)之間的競(jìng)爭(zhēng)機(jī)制,同化機(jī)制確保了該算法的局部搜索能力,而競(jìng)爭(zhēng)機(jī)制則確保了算法的全局搜索能力。而當(dāng)ICA算法應(yīng)用于高維問(wèn)題尋優(yōu)時(shí)很容易陷入局部最優(yōu),從而出現(xiàn)算法的收斂速度變慢等問(wèn)題。對(duì)于收斂速度慢的問(wèn)題,本文引入了帝國(guó)合并機(jī)制。帝國(guó)進(jìn)行合并發(fā)生在帝國(guó)競(jìng)爭(zhēng)階段,若兩個(gè)帝國(guó)需要進(jìn)行合并,則必須滿足以下兩個(gè)條件:

      (1) 兩個(gè)帝國(guó)所在的位置比較靠近,即兩者間的距離比較短;

      (2) 兩個(gè)帝國(guó)的實(shí)力比較接近,即兩者代價(jià)函數(shù)值近似相等。

      即滿足式(18)、式(19):

      dist(impi,impj)

      (18)

      (19)

      其中:0

      圖1 IICA流程Fig.1 Flowchart of IICA

      限制兩個(gè)帝國(guó)的距離較近是為了確保其殖民地的尋優(yōu)方向近似相同;限制代價(jià)函數(shù)值近似相等是為了確保其殖民地的尋優(yōu)目標(biāo)近似相同。提出這兩個(gè)條件的原因是當(dāng)兩個(gè)帝國(guó)的位置和實(shí)力相近時(shí),它們的殖民地的移動(dòng)方向和目標(biāo)都大致相同,但是算法仍需要執(zhí)行兩次,顯然這是沒(méi)有意義的,因此有必要進(jìn)行合并。當(dāng)兩個(gè)帝國(guó)合并為一個(gè)帝國(guó)時(shí),新帝國(guó)的實(shí)力為原來(lái)兩個(gè)帝國(guó)實(shí)力的均值,其殖民地為原來(lái)兩個(gè)帝國(guó)所擁有的殖民地的總和。

      由于帝國(guó)合并機(jī)制的存在,IICA與ICA相比迭代次數(shù)減少、尋優(yōu)速度加快,但算法的復(fù)雜度在一定程度上有所提高。這是由于帝國(guó)合并的存在(即式(18)、(19)),因此算法中會(huì)增加2個(gè)參數(shù)t1和t2。

      2.3 算法的性能及評(píng)價(jià)

      為了驗(yàn)證IICA算法的實(shí)際性能,選用4個(gè)常用的測(cè)試函數(shù)進(jìn)行實(shí)驗(yàn)。測(cè)試函數(shù)見表1。

      若待優(yōu)化函數(shù)的維數(shù)大、取值范圍大、且需要的目標(biāo)精度高,那么優(yōu)化的難度也高。為了便于比較和突出算法的性能,算法的最大迭代次數(shù)設(shè)為1 200,并通過(guò)重復(fù)多次實(shí)驗(yàn)取其平均值,實(shí)驗(yàn)結(jié)果如表2所示。

      從表2可以發(fā)現(xiàn),IICA算法的各個(gè)測(cè)試函數(shù)的均值都優(yōu)于ICA算法。值得注意的是Griewank和Rosenbrock函數(shù),Griewank是一個(gè)多峰值函數(shù),有很多極小值點(diǎn),因此很容易使算法陷入局部最優(yōu),而IICA算法依然能快速地找到全局最優(yōu)值;Rosenbrock函數(shù)雖然是一個(gè)單峰函數(shù),但在函數(shù)的最優(yōu)值附近呈香蕉狀,變量之間的相關(guān)性很強(qiáng),梯度信息極易誤導(dǎo)算法,而IICA依然能夠?qū)さ幂^優(yōu)的值。因此,可以認(rèn)為IICA算法在處理多維數(shù)、多峰值函數(shù)問(wèn)題上擁有比較強(qiáng)的性能。

      2.4 基于IICA算法的SOM神經(jīng)網(wǎng)絡(luò)

      根據(jù)帝國(guó)競(jìng)爭(zhēng)算法的優(yōu)化思想,為了獲得最優(yōu)值,需要計(jì)算每個(gè)國(guó)家的代價(jià)函數(shù)。由于LWDI能夠?qū)OM神經(jīng)網(wǎng)絡(luò)性能做出比較全面的評(píng)價(jià),因此IICA將對(duì)LWDI進(jìn)行優(yōu)化,算法中代價(jià)函數(shù)如式(20)所示。

      cost=1/(1+D)

      D=E[p(x)]

      (20)

      基于改進(jìn)后帝國(guó)競(jìng)爭(zhēng)算法的SOM神經(jīng)網(wǎng)絡(luò)算法(IICA-SOM)的基本步驟如下:

      Step1 初始化國(guó)家,從樣本數(shù)據(jù)集中隨機(jī)選取c個(gè)(c等于神經(jīng)元的個(gè)數(shù))樣本數(shù)據(jù)組成一個(gè)國(guó)家,反復(fù)執(zhí)行該步直到國(guó)家數(shù)量達(dá)到設(shè)定值;

      表1 測(cè)試函數(shù)表

      表2 兩種算法實(shí)驗(yàn)結(jié)果比較

      Step2 根據(jù)式(20)計(jì)算每個(gè)國(guó)家的代價(jià)函數(shù)值;

      Step3 根據(jù)代價(jià)函數(shù)值的大小形成若干個(gè)帝國(guó)主義國(guó)家;

      Step4 在帝國(guó)主義國(guó)家內(nèi)部進(jìn)行同化機(jī)制、帝國(guó)主義國(guó)家之間進(jìn)行競(jìng)爭(zhēng)機(jī)制和帝國(guó)合并機(jī)制后,形成新的帝國(guó)主義國(guó)家;

      Step5 計(jì)算新一代帝國(guó)主義國(guó)家的綜合實(shí)力;

      Step6 檢查終止條件,如果達(dá)到最大的迭代次數(shù)或者只剩下一個(gè)帝國(guó)主義國(guó)家,則終止迭代;否則

      回到Step4;

      Step7 將IICA算法得到的最優(yōu)解作為SOM網(wǎng)絡(luò)神經(jīng)元的初始權(quán)值。

      3 改進(jìn)的SOM神經(jīng)網(wǎng)絡(luò)在污水處理故障診斷中的應(yīng)用

      3.1 BSM1模型

      污水處理過(guò)程“1號(hào)基準(zhǔn)仿真模型”(BSM1)是評(píng)價(jià)污水控制、優(yōu)化策略廣為采用的一個(gè)平臺(tái),其生化反應(yīng)池采用“1號(hào)活性污泥模型”(ASM1)[12]來(lái)模擬生化反應(yīng)過(guò)程,該反應(yīng)過(guò)程涉及13種組分;二沉池采用的是Takacs等開發(fā)的二次指數(shù)沉淀速率模型[13]。BSM1的模型結(jié)構(gòu)如圖2所示,有2個(gè)PI控制器,一個(gè)控制的是內(nèi)回流量,其輸入是2號(hào)池出水中的硝態(tài)氮的測(cè)量值;另一個(gè)控制的是5號(hào)池的氧轉(zhuǎn)化系數(shù)(kla5),其輸入變量為5號(hào)池出水中溶解氧的測(cè)量值。

      圖2 BSM1結(jié)構(gòu)Fig.2 Structure of BSM1 model

      模型運(yùn)行14 d,每隔15 min采樣一次得到實(shí)驗(yàn)數(shù)據(jù),數(shù)據(jù)集大小為1 345×13。故障數(shù)據(jù)主要有兩類:傳感器故障和過(guò)程故障。實(shí)驗(yàn)中共使用了5種故障數(shù)據(jù),故障類型如表3所示。由于兩個(gè)傳感器同時(shí)發(fā)生故障的概率比較小,故將2個(gè)傳感器同時(shí)發(fā)生故障的情況單獨(dú)作為一類故障。

      表3 故障類型表

      3.2 仿真實(shí)驗(yàn)及結(jié)果分析

      3.2.1 實(shí)驗(yàn)設(shè)置 實(shí)驗(yàn)輸入數(shù)據(jù)集大小為1 345×13,根據(jù)式(4)和式(5)計(jì)算可得SOM的神經(jīng)元數(shù)目應(yīng)設(shè)為169,輸出層的大小設(shè)為13×13。實(shí)驗(yàn)采用傳統(tǒng)的SOM神經(jīng)網(wǎng)絡(luò)和IICA-SOM兩種方法對(duì)故障數(shù)據(jù)進(jìn)行聚類和故障診斷,并在輸入數(shù)據(jù)前對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理。在實(shí)驗(yàn)中被故障數(shù)據(jù)激活的神經(jīng)元稱為“故障神經(jīng)元”,此外,實(shí)驗(yàn)得到的數(shù)值結(jié)果均是多次實(shí)驗(yàn)的平均值。

      3.2.2 單個(gè)故障 因?yàn)槿芙庋鮽鞲衅鞴收献畛R?所以選取故障F2進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)包括故障數(shù)據(jù)(F2)和正常數(shù)據(jù)(Normal),從正常數(shù)據(jù)中隨機(jī)選取1 245個(gè)數(shù)據(jù)并從故障數(shù)據(jù)集F2中隨機(jī)選取100個(gè)數(shù)據(jù)組成輸入樣本數(shù)據(jù)集。其中70%用作訓(xùn)練數(shù)據(jù)集(正常數(shù)據(jù)872個(gè),故障數(shù)據(jù)70個(gè)),30%用作測(cè)試數(shù)據(jù)集(正常數(shù)據(jù)373個(gè),故障數(shù)據(jù)30個(gè)),實(shí)驗(yàn)結(jié)果如表4和圖3所示。

      從表4中可以看出,SOM和IICA-SOM兩種算法在樣本數(shù)據(jù)集中只含有一類故障數(shù)據(jù)時(shí),能夠很好地進(jìn)行診斷,誤判率都在5%以內(nèi),且IICA-SOM算法的誤判率相對(duì)于傳統(tǒng)的SOM算法略低一些。從圖3可以看出,IICA-SOM和傳統(tǒng)的SOM算法都可以將樣本數(shù)據(jù)聚成兩類,分別是故障數(shù)據(jù)集和正常數(shù)據(jù)集。

      表4 故障F2診斷測(cè)試結(jié)果

      圖3 SOM和IICA-SOM訓(xùn)練聚類結(jié)果(單個(gè)故障)Fig.3 Clustering results of SOM and IICA-SOM (Single)

      3.2.3 多個(gè)故障 實(shí)驗(yàn)中樣本數(shù)據(jù)集包含正常數(shù)據(jù)集和5類故障數(shù)據(jù)集共1 345個(gè),從正常數(shù)據(jù)集(Normal)中隨機(jī)選取1 000個(gè),從每類故障數(shù)據(jù)集中隨機(jī)取69個(gè)。其中70%作為訓(xùn)練數(shù)據(jù)(正常數(shù)據(jù)700個(gè),故障數(shù)據(jù)每類48個(gè)),剩余30%作為測(cè)試數(shù)據(jù)(正常數(shù)據(jù)300個(gè),故障數(shù)據(jù)每類21個(gè)),實(shí)驗(yàn)結(jié)果如圖4和表5所示。

      從圖4中可以看出,兩種算法總體上都對(duì)數(shù)據(jù)進(jìn)行了正確的聚類。傳統(tǒng)的SOM神經(jīng)網(wǎng)絡(luò)完成訓(xùn)練后,雖然可以對(duì)故障數(shù)據(jù)進(jìn)行聚類,但是聚類效果并不理想。5類故障數(shù)據(jù)集中,每類都被聚成了兩部分,而且故障F1和F5的兩部分之間相距也比較遠(yuǎn),此結(jié)果表明SOM神經(jīng)網(wǎng)絡(luò)在完成訓(xùn)練后,其神經(jīng)元的權(quán)值并沒(méi)有很好地獲得輸入數(shù)據(jù)的特征。該結(jié)果的產(chǎn)生是由于SOM采用啟發(fā)式的訓(xùn)練算法,神經(jīng)元的初始權(quán)值是隨機(jī)產(chǎn)生的,因此受輸入數(shù)據(jù)的順序及樣本數(shù)據(jù)集大小的影響比較大,很容易產(chǎn)生“死神經(jīng)元”(在算法迭代的過(guò)程中始終得不到激活)。而此類神經(jīng)元在訓(xùn)練過(guò)程中將一直不能獲取到輸入數(shù)據(jù)的特征,所以這將導(dǎo)致所聚成的類不集中。反觀IICA-SOM神經(jīng)網(wǎng)絡(luò),聚類效果要比傳統(tǒng)的SOM優(yōu)秀,只有F1和F3的故障數(shù)據(jù)沒(méi)有聚在一起。這是因?yàn)橥ㄟ^(guò)IICA算法對(duì)網(wǎng)絡(luò)性能評(píng)價(jià)指標(biāo)LWDI的優(yōu)化能獲取最優(yōu)的網(wǎng)絡(luò)初始權(quán)值,使得SOM神經(jīng)網(wǎng)絡(luò)中盡可能少地出現(xiàn)“死神經(jīng)元”,從而使神經(jīng)元盡可能獲取輸入數(shù)據(jù)的特征信息。從表5故障診斷測(cè)試結(jié)果可以看出,IICA-SOM對(duì)每一類型故障的誤判率都要低于SOM的誤判率,尤其是F1故障的誤判率只有SOM的一半。從整體誤判率來(lái)看,SOM算法的誤判率比IICA-SOM算法高出41%左右,而且IICA-SOM的誤判率低于20%。因此,IICA-SOM相較于傳統(tǒng)的SOM在聚類結(jié)果和診斷誤判率方面都有了大幅改善。

      圖4 SOM和IICA-SOM訓(xùn)練聚類結(jié)果(多個(gè)故障)Fig.4 Clustering of result of SOM and IICA-SOM (Multiple)

      故障類型激活故障神經(jīng)元次數(shù)激活非故障神經(jīng)元次數(shù)誤判率/%平均誤判率/%F113.47.636.2F215.75.325.2F314.96.129.0F417.43.416.2F520.30.73.322.0

      表6 IICA-SOM故障診斷測(cè)試結(jié)果

      由上述兩組實(shí)驗(yàn)可以發(fā)現(xiàn),多個(gè)故障的誤判率比單個(gè)故障的誤判率高很多。這是因?yàn)槎鄠€(gè)故障實(shí)驗(yàn)中的故障種類比較多,當(dāng)故障數(shù)據(jù)的種類增加時(shí),SOM神經(jīng)網(wǎng)絡(luò)所要記錄的數(shù)據(jù)特征就會(huì)增加,所以診斷的誤判率會(huì)有所增加。

      4 結(jié) 論

      本文采用改進(jìn)后的帝國(guó)競(jìng)爭(zhēng)算法對(duì)權(quán)重失真指數(shù)進(jìn)行優(yōu)化,并將算法優(yōu)化后的最優(yōu)解作為SOM神經(jīng)網(wǎng)絡(luò)的初始權(quán)值,以提高網(wǎng)絡(luò)的質(zhì)量。SOM作為一種自監(jiān)督、自學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),能夠從樣本數(shù)據(jù)集中提取到輸入數(shù)據(jù)的特征,并根據(jù)這些特征進(jìn)行聚類。IICA-SOM除秉承了傳統(tǒng)SOM算法的優(yōu)點(diǎn)外,在聚類效果和故障診斷的正確率上都有了很大的提高,且從實(shí)驗(yàn)結(jié)果來(lái)看,改進(jìn)后的算法可以將誤診率維持在一個(gè)較低的水平,所以IICA-SOM算法對(duì)于實(shí)際污水處理過(guò)程中的故障診斷具有一定的參考價(jià)值。

      [1] MIKA L,ILKKA L.Advanced monitoring platform for industrial wastewater treatment:Multivariable approach using the self-organizing map[J].Environment Modelling & Software,2013,48(7):193-201.

      [2] HEIKKINEN M,POUTIAINEN H.Subtraction analysis based on self-organizing maps for an industrial wastewater treatment process[J].Mathematics and Computers in Simulation,2011,82(3):450-459.

      [3] YU Dong,MIKLAS S.Statistical modeling of contaminants removal in mature integrated constructed wetland sediments [J].Journal of Environment Engineering,2012,138(10):1009-1017.

      [4] KOHONEN T.Self-organizing formation of topologically correct feature maps [J].Biological Cybernetics,1982,43(1):59-69.

      [5] CAI Qiao,HE Haibo,MAN Hong.Imbalanced evolving self-organizing learning [J].Neurocomputing,2014,133(10):258-270.

      [6] SOLEDAD D,CONSUELO G,ESTIBALIZ M,etal.A combined measure for quantifying and qualifying the topology preservation of growing self-organizing maps[J].Neurocomputing,2011,74 (16):2624-2632.

      [7] HAYKIN S.Neural Networks:A Comprehensive Foundation[M].2nd Edition.Beijing:Tsinghua University Press,2011.

      [8] GHASEMINEZHAD M H,KARAMI A.A novel self-organizing map(SOM) neural network for discrete groups of data clustering[J].Applied Soft Computing,2011,46(11):3771-3778.

      [9] HILARIO L.Self-organizing map and clustering for wastewater treatment monitoring[J].Engineering Applications of Artificial Intelligence,2004,17(3):215-225.

      [10] DEMARTINES P,HERAULT J.Curvilinear component analysis:A self-organizing neural network for nonlinear mapping of data sets [J].IEEE Transaction on Neural Networks,1997,8(1):145-154.

      [11] ATASHPAZ-GARGARI E,LUCAS C.Imperialist competitive algorithm:An algorithm for optimization inspired by imperialistic competition[C]//Proceedings of the 2007 IEEE Congress on Evolutionary Computation.Piscataway:IEEE,2007:4661-4667.

      [12] BAHAR S,CIGGIN A S.A simple kinetic modeling approach for aerobic stabilization of real waste activated sludge[J].Chemical Engineering Journal,2016,303(1):194-201.

      [13] TAKACS I,PATRY G,NOLASCO D.A dynamic model of the clarilication thickening process[J].Water Research,1991,25(10):1263-1271.

      An Application of Improved SOM Neural Network in Fault Diagnosis of Wastewater Treatment

      YUE Yu-fei, LUO Jian-xu

      (Institute of Automation,East China University of Science and Technology,Shanghai 200237,China)

      The selecting of the initial weights of the self-organizing map (SOM) neural network has an important impact on the performance of the network.In this paper,by means of an improved imperialists competitive algorithm (IICA) to minimize the locally weight distortion index,the initial weights of the SOM neural network can be obtained optimally.Besides,the improved SOM neural network (IICA-SOM) is applied in the clustering and fault diagnosis of the wastewater treatment process data.The experiment result demonstrates that,compared with the traditional SOM neural network,IICA-SOM can attain better performance in clustering and lower misdiagnosis rate in the fault diagnosis.

      fault diagnosis; cluster; SOM; ICA

      1006-3080(2017)03-0389-08

      10.14135/j.cnki.1006-3080.2017.03.015

      2016-10-12

      國(guó)家自然科學(xué)基金(61304071)

      岳宇飛(1991-),男,碩士生,主要研究方向?yàn)楣I(yè)過(guò)程建模與優(yōu)化。

      羅健旭,E-mail:jxluo@ecust.edu.cn

      TP183

      A

      猜你喜歡
      殖民地帝國(guó)權(quán)值
      恐龍帝國(guó)(6)
      一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
      恐龍帝國(guó)(5)
      恐龍帝國(guó)(4)
      新加坡殖民地自由港政策的形成(1819—1867)
      英屬北美殖民地共同文化的形成
      CONTENTS
      狗邪韓國(guó)是倭人之地——兼論任那非日本殖民地
      基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
      十二、什么是“殖民地近代化”論
      南城县| 岫岩| 宿迁市| 宜宾县| 塔城市| 莒南县| 视频| 谢通门县| 上虞市| 鹰潭市| 宁南县| 乌海市| 咸丰县| 遂川县| 休宁县| 江口县| 喀喇| 准格尔旗| 慈溪市| 崇仁县| 鄯善县| 石渠县| 丹凤县| 微山县| 综艺| 武清区| 大冶市| 普兰县| 安吉县| 陈巴尔虎旗| 革吉县| 长汀县| 平山县| 班戈县| 连平县| 独山县| 商丘市| 轮台县| 黄浦区| 平江县| 扶风县|