王中鋒
摘要:水華風(fēng)險(xiǎn)不僅是水利工程規(guī)劃時(shí)需要考慮的環(huán)境問(wèn)題,也是水利設(shè)施運(yùn)營(yíng)時(shí)不能忽視的監(jiān)測(cè)項(xiàng)目。為了提高明渠水化風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)的準(zhǔn)確率,針對(duì)水華成因的不確定性和發(fā)展的時(shí)序性,基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器提出一種應(yīng)用于明渠的水華風(fēng)險(xiǎn)評(píng)估模型。模型用水華風(fēng)險(xiǎn)等級(jí)結(jié)點(diǎn)對(duì)應(yīng)藻葉綠素a(Chla)的濃度,并考慮了9項(xiàng)影響水藻生長(zhǎng)的因素。采用主成分分析法,處理專(zhuān)家咨詢(xún)結(jié)果,進(jìn)行參數(shù)的設(shè)計(jì)。在蘇州河道北門(mén)橋2011年6月初至9月初觀測(cè)的53例連續(xù)監(jiān)測(cè)數(shù)據(jù)上,與基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型進(jìn)行比較實(shí)驗(yàn)?;煜仃囷@示對(duì)中等風(fēng)險(xiǎn)情況的預(yù)測(cè)識(shí)別率提高了15.625%,單尾配對(duì)t檢驗(yàn)表明在顯著性水平0.05時(shí),兩模型預(yù)測(cè)識(shí)別率差異顯著??紤]了時(shí)序特征的基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型對(duì)明渠中等水化風(fēng)險(xiǎn)的預(yù)測(cè)識(shí)別率提高顯著。
關(guān)鍵詞:明渠;水華;動(dòng)態(tài)貝葉斯網(wǎng)絡(luò);富營(yíng)養(yǎng)化
中圖分類(lèi)號(hào):TV213 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-1683(2017)02-0089-06
1研究背景
南水北調(diào)中線工程正式通水以來(lái),由于水藻超標(biāo),已經(jīng)給部分沿線水廠造成了經(jīng)濟(jì)損失。亟待研究明渠水藻預(yù)警技術(shù),提前處理,降低損失?,F(xiàn)有的相關(guān)研究成果主要集中在海洋湖泊的水華成因分析、水華識(shí)別模型、預(yù)警模型,以及這些模型在水利工程規(guī)劃運(yùn)營(yíng)過(guò)程中的應(yīng)用4個(gè)方面。水華的成因分析開(kāi)展了多年,研究人員對(duì)影響水華的因素和它們之間的關(guān)系已經(jīng)有了較為全面的認(rèn)識(shí)。水華識(shí)別模型的研究通常采用圖像識(shí)別方法、神經(jīng)網(wǎng)絡(luò)方法、貝葉斯方法和支持向量機(jī)方法等。這些方法適用于識(shí)別已經(jīng)爆發(fā)了水華的水體。水華預(yù)測(cè)方法可以分為確定性方法和不確定性方法,確定性方法較為成熟,多是利用各種水動(dòng)力學(xué)模型和水質(zhì)模型來(lái)進(jìn)行分析,例如美國(guó)環(huán)保局研發(fā)的HYNHYD和WAsP模型、美國(guó)水利資源工程公司提出的CE-QUAL模型和美國(guó)陸軍工程兵團(tuán)使用的RMA4模型等。由于這些模型忽略了復(fù)雜水環(huán)境的不確定性,雖然應(yīng)用簡(jiǎn)單,但描述與預(yù)測(cè)能力有限。因此,近年來(lái)研究人員開(kāi)始著手研究不確定性方法,Song等基于模糊方法預(yù)測(cè)水質(zhì),劉悅憶等提出了基于蒙特卡洛模擬的水質(zhì)概率預(yù)報(bào)模型,Karamouz等采用隨機(jī)遺傳方法分析。這些模型在處理水質(zhì)影響因素的不確定性方面,提高了模型的表現(xiàn)能力。同時(shí),各種水華識(shí)別和預(yù)測(cè)模型的具體應(yīng)用研究也在不斷進(jìn)行著。本文在這些工作的基礎(chǔ)上,考慮水質(zhì)變化時(shí)序特征的不確定性,基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器提出一種水華風(fēng)險(xiǎn)評(píng)估模型。樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器能夠通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)對(duì)不確定性知識(shí)進(jìn)行描述,并進(jìn)行不確定性推理實(shí)現(xiàn)分類(lèi)。水華發(fā)生的風(fēng)險(xiǎn)因素具有不確定性,適合采用貝葉斯網(wǎng)絡(luò)進(jìn)行描述;水華發(fā)生的風(fēng)險(xiǎn)因素與水華風(fēng)險(xiǎn)之間的關(guān)系具有不確定性,可以應(yīng)用貝葉斯網(wǎng)絡(luò)分類(lèi)器在各個(gè)風(fēng)險(xiǎn)因素的基礎(chǔ)上推理出水華風(fēng)險(xiǎn)強(qiáng)度。動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器是考慮了時(shí)序特征的樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器,用來(lái)預(yù)測(cè)水華風(fēng)險(xiǎn)時(shí)不僅能夠考慮到當(dāng)前的風(fēng)險(xiǎn)因素情況,還能結(jié)合到前一時(shí)段的水華風(fēng)險(xiǎn)情況。
2動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型
動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Net-works,DBN)是貝葉斯網(wǎng)絡(luò)的時(shí)序擴(kuò)展,可將不同時(shí)間片間時(shí)序依賴(lài)關(guān)系與時(shí)間片內(nèi)依賴(lài)關(guān)系融為一體,并通過(guò)量化推理進(jìn)行動(dòng)態(tài)分析、預(yù)測(cè)。若用X[0],X[1],…,X[T],表示隨機(jī)向量序列,X[t]={X1[t],…,XN[t]},0≤t≤T,x[t]={x1[t],…,xn[t]},為其值向量序列。則對(duì)網(wǎng)絡(luò)結(jié)構(gòu)GDB的聯(lián)合概率分解情況為
由于在一般的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)中,一個(gè)結(jié)點(diǎn)在所屬時(shí)間片和時(shí)序前面的時(shí)間片中都可能有父結(jié)點(diǎn),網(wǎng)絡(luò)結(jié)構(gòu)異常復(fù)雜,推理計(jì)算非常困難,所以,通常在實(shí)際應(yīng)用中附加一些約束條件來(lái)簡(jiǎn)化動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)。以下研究假設(shè)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)滿(mǎn)足一階Markov假設(shè)和平穩(wěn)性假設(shè),這兩個(gè)約束條件能夠使動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)轉(zhuǎn)換為先驗(yàn)網(wǎng)G0和轉(zhuǎn)換網(wǎng)G→,方便使用。
一階Markov假設(shè)在時(shí)間片段t的變量的狀態(tài)僅與時(shí)間片段t-1的變量狀態(tài)有關(guān),而與t-1以前的時(shí)間片段內(nèi)變量的狀態(tài)無(wú)關(guān)。即:[t]的配置。
先驗(yàn)網(wǎng)描述同一時(shí)間片內(nèi)的依賴(lài)關(guān)系,轉(zhuǎn)移網(wǎng)描述不同時(shí)間片內(nèi)的依賴(lài)關(guān)系,它們都是靜態(tài)貝葉斯網(wǎng)絡(luò),靜態(tài)貝葉斯網(wǎng)絡(luò)是個(gè)有向無(wú)環(huán)圖(Directe-dAcyclic Graph),由網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)兩部分構(gòu)成。在網(wǎng)絡(luò)結(jié)構(gòu)中,節(jié)點(diǎn)表示模型變量,邊表示變量間的依賴(lài)關(guān)系。代表變量的節(jié)點(diǎn)通常用大寫(xiě)字母表示,其對(duì)應(yīng)的變量值用相應(yīng)的小寫(xiě)字母表示。若變量A通過(guò)一條弧指向另一個(gè)變量B,則表明變量A與變量B有依賴(lài)關(guān)系,且變量4的取值會(huì)對(duì)變量B的取值產(chǎn)生影響。在這對(duì)依賴(lài)關(guān)系中,A叫做B的父結(jié)點(diǎn),B叫做A的子結(jié)點(diǎn)。網(wǎng)絡(luò)參數(shù)是指每一個(gè)變量對(duì)應(yīng)的條件概率表(Conditional ProbabilityTables,CPT)。CPT為每個(gè)實(shí)例變量都指定了條件概率。通過(guò)每個(gè)節(jié)點(diǎn)的條件概率分布可以得到各個(gè)節(jié)點(diǎn)的聯(lián)合概率傳播網(wǎng)。
給定動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)后,就可以在只有一個(gè)變量取值不定,而其它變量取值確定的情況下推理出此不確定取值變量的不同取值情況概率大小。若假定出現(xiàn)概率最大的取值為該變量的值,便可以依照此過(guò)程,對(duì)該變量進(jìn)行分類(lèi)。
3水華風(fēng)險(xiǎn)評(píng)估模型
動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器是一種結(jié)構(gòu)簡(jiǎn)單的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類(lèi)器。本文基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器設(shè)計(jì)水華風(fēng)險(xiǎn)評(píng)估模型。分網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)兩部分進(jìn)行。
3.1基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的水華風(fēng)險(xiǎn)評(píng)估模型結(jié)構(gòu)
由于水華是水體藻類(lèi)大量生長(zhǎng)繁殖或聚集并達(dá)到一定濃度的現(xiàn)象,所以在水華實(shí)驗(yàn)研究中通常以水體中葉綠素a(Chla)含量間接代表水體中藻類(lèi)的數(shù)目。在這個(gè)模型中,本文采用藻葉綠素a濃度來(lái)評(píng)估水華風(fēng)險(xiǎn)等級(jí)。影響藻類(lèi)生長(zhǎng)的因素很多,諸如物理因素、化學(xué)因素和生物因素,水體富營(yíng)養(yǎng)化與水華的爆發(fā)正是由這些因素影響著。本文參考文獻(xiàn)的監(jiān)測(cè)項(xiàng)目,考慮了水溫,日降雨量,濁度,透明度,藻類(lèi)光合活性(Fv/Fm),總氮含量(TN),氨氮(NH+4-N)含量,總磷含量(TP),氮磷比9項(xiàng)對(duì)Chla有影響的因素。由于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器是樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器與時(shí)間序列的結(jié)合,是一種簡(jiǎn)單的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類(lèi)器,其中類(lèi)變量形成馬爾科夫鏈,時(shí)間片屬性變量形成局部星型結(jié)構(gòu)?;趧?dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器設(shè)計(jì)水華風(fēng)險(xiǎn)評(píng)估模型,沒(méi)有考慮各個(gè)水華風(fēng)險(xiǎn)因素相互之間的影響作用。
圖1為本文采用動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器設(shè)計(jì)的水華風(fēng)險(xiǎn)評(píng)估模型的網(wǎng)絡(luò)結(jié)構(gòu)圖。其中,A1表示水溫,A2表示日降雨量,A3表示濁度,A4表示透明度,A5表示Fv/Fm,A6表示TN,A7表示NH+4-N含量,A8表示TP,A9表示氮磷比,C表示Chla濃度。整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)由先驗(yàn)網(wǎng)絡(luò)和轉(zhuǎn)移網(wǎng)絡(luò)展開(kāi)得到。
虛線包含的部分為先驗(yàn)網(wǎng)絡(luò)結(jié)構(gòu)。由于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器只考慮了類(lèi)變量對(duì)屬性變量之間的依賴(lài)關(guān)系,沒(méi)有考慮屬性變量之間的相互依賴(lài)關(guān)系。圖中只有從類(lèi)結(jié)點(diǎn)指向各個(gè)屬性結(jié)點(diǎn),各個(gè)屬性結(jié)點(diǎn)之間不存在邊。
屬性結(jié)點(diǎn)和類(lèi)結(jié)點(diǎn)的上標(biāo)表示該結(jié)點(diǎn)所對(duì)應(yīng)的時(shí)間片。連接相鄰時(shí)間片之間類(lèi)結(jié)點(diǎn)的邊構(gòu)成了模型的轉(zhuǎn)移網(wǎng)絡(luò)結(jié)構(gòu),在轉(zhuǎn)移網(wǎng)絡(luò)中,時(shí)間片t+1中代表水華風(fēng)險(xiǎn)等級(jí)的類(lèi)變量除了受該時(shí)間片中影響因素的作用外,還受到上一時(shí)刻t中水華風(fēng)險(xiǎn)等級(jí)情況的影響。
在這個(gè)基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的水華風(fēng)險(xiǎn)評(píng)估模型中,每一個(gè)時(shí)刻的風(fēng)險(xiǎn)等級(jí)情況除了與當(dāng)前的影響因素有關(guān)外,還受到歷史時(shí)刻風(fēng)險(xiǎn)等級(jí)情況的影響,而不受歷史時(shí)刻的影響因素的影響。在這個(gè)過(guò)程中歷史時(shí)刻風(fēng)險(xiǎn)等級(jí)對(duì)當(dāng)前時(shí)刻風(fēng)險(xiǎn)等級(jí)的有一定程度的影響。依據(jù)貝葉斯網(wǎng)絡(luò)條件獨(dú)立性關(guān)系,圖1可以描述為
以上是對(duì)基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的水華風(fēng)險(xiǎn)評(píng)估模型網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì),但這個(gè)網(wǎng)絡(luò)結(jié)構(gòu)只是粗略的描述了各個(gè)影響因素之間的關(guān)系,還要設(shè)置依賴(lài)參數(shù)來(lái)詳細(xì)描述它們之間的依賴(lài)強(qiáng)度。
3.2基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的水
華風(fēng)險(xiǎn)評(píng)估模型參數(shù)
本文通過(guò)分析參考文獻(xiàn)觀測(cè)的各個(gè)風(fēng)險(xiǎn)因素與葉綠素a的關(guān)系,咨詢(xún)多個(gè)專(zhuān)家,經(jīng)過(guò)加權(quán)平均來(lái)確定貝葉斯網(wǎng)絡(luò)參數(shù),包括先驗(yàn)概率和轉(zhuǎn)移概率參數(shù)。在計(jì)算各專(zhuān)家所占權(quán)重時(shí)采用主成分分析法,消除信息的重疊性,降低個(gè)人因素的影響。對(duì)于水華風(fēng)險(xiǎn)先驗(yàn)概率,為了提高模型的靈敏度,本文設(shè)置高風(fēng)險(xiǎn)為0.4,中等風(fēng)險(xiǎn)為0.3,低風(fēng)險(xiǎn)為0.3。對(duì)于轉(zhuǎn)移概率參數(shù),本文同時(shí)根據(jù)文獻(xiàn)針對(duì)河流水體對(duì)部分參數(shù)做了調(diào)整。如在流動(dòng)水體中,優(yōu)勢(shì)藻種多為漢斯冠盤(pán)藻(硅藻),本文調(diào)整為河流優(yōu)勢(shì)藻種適宜的條件。文獻(xiàn)研究城市景觀河道中綠藻和藍(lán)藻時(shí),17次共76日水華對(duì)應(yīng)的水溫做的一個(gè)從高到低的排序圖。觀察到的可見(jiàn)水華發(fā)生時(shí)水溫主要集中在23.4℃~34.4℃之間,且表現(xiàn)出良好的連續(xù)性,觀察期間,在水溫27.8℃時(shí)有一個(gè)間斷,水溫在27.8℃~34.4℃期間發(fā)生水華的次數(shù)為14次,占所有次數(shù)的82.4%,持續(xù)的天數(shù)為64 d,占發(fā)生水華的天數(shù)的84.2%。文獻(xiàn)[25]研究河流水體中冠盤(pán)藻水溫為2℃左右生長(zhǎng)繁殖良好,與15℃條件下無(wú)顯著差別。本文根據(jù)冠盤(pán)藻的特點(diǎn)調(diào)整水溫在1℃~15℃,葉綠素a具有較高的概率取值。
表1為概率p(ct|ct-1)參數(shù)表,表示當(dāng)前水華風(fēng)險(xiǎn)等級(jí)對(duì)最近觀測(cè)到的風(fēng)險(xiǎn)狀態(tài)的依賴(lài)強(qiáng)度,為了在模型中適當(dāng)體現(xiàn)出風(fēng)險(xiǎn)情況的時(shí)序依賴(lài)性,ct中與ct-1相同的取值設(shè)置了較高的發(fā)生概率。
表2為概率p(atx|ct)的參數(shù)表其中x表示a1-a9中的任一變量。當(dāng)Chla濃度分別為H(高)、M(中)和L(低)時(shí),參數(shù)值分別表示水溫,日降雨量,濁度,透明度,F(xiàn)v/Fm,TN,NH+4-N含量,TP,氮磷比各種情況發(fā)生概率的大小。
當(dāng)設(shè)定了水華風(fēng)險(xiǎn)評(píng)估模型的網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)后,對(duì)于符合模型要求的水體,輸入當(dāng)時(shí)的監(jiān)測(cè)值,就能預(yù)測(cè)下一時(shí)刻Chla的濃度,評(píng)估當(dāng)前的風(fēng)險(xiǎn)等級(jí)。
4實(shí)例分析
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于文獻(xiàn)在2011年4月14日到2012年1月10日之間監(jiān)測(cè)蘇州河道北門(mén)橋的數(shù)據(jù)??紤]到實(shí)際應(yīng)用時(shí),對(duì)高風(fēng)險(xiǎn)情況和中等風(fēng)險(xiǎn)的預(yù)測(cè)情況,更能體現(xiàn)模型的價(jià)值,本文選取了6月初到9月初的53例連續(xù)監(jiān)測(cè)數(shù)據(jù),將這段時(shí)間分為52個(gè)時(shí)間片,其中包括1例低風(fēng)險(xiǎn)數(shù)據(jù),32例中等風(fēng)險(xiǎn)數(shù)據(jù)和20例高風(fēng)險(xiǎn)數(shù)據(jù)。在本文的研究中,依據(jù)文獻(xiàn),采用藻葉綠素a(Chla)的濃度區(qū)分不同的水華風(fēng)險(xiǎn)狀態(tài)。當(dāng)藻葉綠素a(Chla)濃度小于10μg/L時(shí),設(shè)置水華風(fēng)險(xiǎn)狀態(tài)等級(jí)為“較低”;當(dāng)Chla濃度大于等于10μg/L且小于50時(shí)μg/L,設(shè)置水華風(fēng)險(xiǎn)狀態(tài)等級(jí)為“中等”;當(dāng)Chla濃度大于大于50時(shí)μg/L,設(shè)置水華風(fēng)險(xiǎn)狀態(tài)等級(jí)為“較高”。
實(shí)驗(yàn)分兩步進(jìn)行,首先,只考慮同一時(shí)間片中的依賴(lài)關(guān)系,用基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型進(jìn)行預(yù)測(cè);然后用基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的評(píng)估模型進(jìn)行預(yù)測(cè),在考慮同一時(shí)間片中的依賴(lài)關(guān)系的同時(shí),還考慮上一時(shí)間片時(shí)間觀察到的Chla濃度。實(shí)驗(yàn)過(guò)程中,第一次的監(jiān)測(cè)值用于評(píng)估第二次監(jiān)測(cè)時(shí)刻的風(fēng)險(xiǎn)等級(jí),依次類(lèi)推,最后一次的監(jiān)測(cè)值不參與實(shí)驗(yàn),因此,每步共預(yù)測(cè)52次。第一步實(shí)驗(yàn)結(jié)果顯示33次預(yù)測(cè)正確,預(yù)測(cè)準(zhǔn)確率為63.46%;第二步實(shí)驗(yàn)結(jié)果顯示38次預(yù)測(cè)正確,預(yù)測(cè)準(zhǔn)確率為73.08%。預(yù)測(cè)準(zhǔn)確率提高了0.63%。圖2(a)和圖2(b)分別是基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型和基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的評(píng)估模型的預(yù)測(cè)值與實(shí)際觀測(cè)值的折線比較圖。在這兩張圖中,實(shí)線表示實(shí)際值,虛線分別表示兩個(gè)預(yù)測(cè)模型的預(yù)測(cè)值。圖中,若兩條線重合,表示預(yù)測(cè)值與實(shí)際觀測(cè)值一致,若不重合,表示預(yù)測(cè)有誤。顯然,圖2(b)比圖2(a)中兩線的重合度高,表明基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器展開(kāi)后的評(píng)估模型比基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的評(píng)估模型預(yù)測(cè)精度高。
進(jìn)一步分析,表3是基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型和基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的評(píng)估模型的預(yù)測(cè)結(jié)果的混淆矩陣。每一列代表了預(yù)測(cè)類(lèi)別,每一列的總數(shù)表示預(yù)測(cè)為該類(lèi)別的數(shù)據(jù)的數(shù)目;每一行代表了數(shù)據(jù)的真實(shí)歸屬類(lèi)別,每一行的數(shù)據(jù)總數(shù)表示該類(lèi)別的數(shù)據(jù)實(shí)例的數(shù)目。每一列中的數(shù)值表示真實(shí)數(shù)據(jù)被預(yù)測(cè)為該類(lèi)的數(shù)目。通過(guò)兩個(gè)表的對(duì)比,可以看出,兩個(gè)矩陣中,對(duì)高風(fēng)險(xiǎn)等級(jí)和低風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)結(jié)果沒(méi)有變化,對(duì)中等風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)正確數(shù)目從21例提高到26例,識(shí)別率從65.625%提高到81.26%,提高了15.625%。
對(duì)于中等風(fēng)險(xiǎn)等級(jí)的樣例,僅有32個(gè)樣本,屬于小樣本,所以選擇t檢驗(yàn)。實(shí)驗(yàn)是在同一樣本集合上比較基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型和基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的評(píng)估模型的識(shí)別率,具有方向性,所以采用單尾配對(duì)樣本t檢驗(yàn)進(jìn)行分析。計(jì)算結(jié)果顯示中等風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)結(jié)果t檢驗(yàn)概率為0.048 014顯著性水平在0.05之下,拒絕原假設(shè)H0,表明兩種模型的識(shí)別率相互比較有顯著變化。結(jié)合混淆矩陣顯示的中等風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)識(shí)別率提高了15.625%,說(shuō)明本文所提算法識(shí)別率顯著提高。
5結(jié)論
本文基于動(dòng)態(tài)樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器提出了一種水華風(fēng)險(xiǎn)評(píng)估模型,并采用主成分分析法處理專(zhuān)家知識(shí),設(shè)計(jì)模型網(wǎng)絡(luò)參數(shù)。利用蘇州河道北門(mén)橋河段監(jiān)測(cè)的數(shù)據(jù),與基于樸素貝葉斯網(wǎng)絡(luò)分類(lèi)器的評(píng)估模型進(jìn)行比較實(shí)驗(yàn)。結(jié)果顯示在顯著性水平0.05的單尾配對(duì)t檢驗(yàn)時(shí),對(duì)中等風(fēng)險(xiǎn)等級(jí)的水華預(yù)測(cè)識(shí)別率提高顯著,提高了15.625%。表明本文所提的考慮了風(fēng)險(xiǎn)因素的不確定性和風(fēng)險(xiǎn)狀態(tài)時(shí)序發(fā)展特征的模型適用于明渠的水華風(fēng)險(xiǎn)評(píng)估。另外,考慮更多水華影響因素和水華影響因素之間的相互作用,對(duì)提高評(píng)估模型的識(shí)別率和適用范圍是必要的,這將是下一步的研究任務(wù)。