劉朔孺,楊 敏,張方輝,張 晟**
(1:重慶市環(huán)境科學(xué)研究院,重慶 401147)(2:重慶大學(xué)城市建設(shè)與環(huán)境工程學(xué)院,重慶 400045)
基于支持向量機(jī)分類的嘉陵江草街水庫(kù)甲藻水華預(yù)警*
劉朔孺1,2,楊 敏1,張方輝1,張 晟1**
(1:重慶市環(huán)境科學(xué)研究院,重慶 401147)(2:重慶大學(xué)城市建設(shè)與環(huán)境工程學(xué)院,重慶 400045)
嘉陵江草街水庫(kù)自建成后2011-2013年連續(xù)3年發(fā)生甲藻水華現(xiàn)象,給當(dāng)?shù)亟?jīng)濟(jì)發(fā)展和生態(tài)安全帶來(lái)影響.根據(jù)2011年5月至2013年7月草街水庫(kù)大壩上、下游8個(gè)斷面的逐月調(diào)查數(shù)據(jù),利用支持向量機(jī)在處理小樣本問(wèn)題、非線性分類問(wèn)題和泛化推廣方面的優(yōu)勢(shì),構(gòu)建了基于支持向量機(jī)分類的草街水庫(kù)甲藻水華預(yù)警模型.結(jié)果表明,利用本月理化數(shù)據(jù)和本月倪氏擬多甲藻(Peridiniopsisniei)密度數(shù)據(jù)建立的模型,對(duì)測(cè)試樣本取得了80%以上的判別正確率,且對(duì)甲藻水華樣本的判別正確率為100%.因此,支持向量機(jī)作為新興的機(jī)器學(xué)習(xí)方法,可以為環(huán)境管理部門(mén)發(fā)布水華預(yù)警信息提供科學(xué)依據(jù),并在環(huán)境保護(hù)領(lǐng)域具有廣闊的應(yīng)用前景.
支持向量機(jī);甲藻水華;草街水庫(kù);倪氏擬多甲藻
近年來(lái),隨著我國(guó)經(jīng)濟(jì)的高速增長(zhǎng),環(huán)境生態(tài)問(wèn)題日益突出.而湖泊水庫(kù)作為居民飲用水重要的水源地,其富營(yíng)養(yǎng)化已成為影響我國(guó)居民生活質(zhì)量的一個(gè)普遍性問(wèn)題.目前,我國(guó)有66%的湖泊、水庫(kù)處于富營(yíng)養(yǎng)化水平[1],并且近年來(lái)全國(guó)不同地區(qū)水華的頻發(fā)更是令人擔(dān)憂,太湖、巢湖、滇池的藍(lán)藻水華[2-4],三峽水庫(kù)上游各支流甲藻水華均對(duì)當(dāng)?shù)厝嗣裼盟踩斐蓢?yán)重影響[5-6],因此采取有效措施防治水華已成為當(dāng)?shù)丨h(huán)境管理部門(mén)的當(dāng)務(wù)之急.
目前國(guó)內(nèi)外對(duì)于淡水水華監(jiān)測(cè)預(yù)警研究多集中在藍(lán)藻方面,提出了藍(lán)藻水華形成的“四階段理論”[7],并利用衛(wèi)星遙感和數(shù)學(xué)模型成功對(duì)藍(lán)藻水華的運(yùn)動(dòng)趨勢(shì)和發(fā)生時(shí)間進(jìn)行預(yù)測(cè)預(yù)警[8-11].與大多數(shù)藍(lán)藻水華種類不同,甲藻具有垂直遷移特性,其白天趨于在水體表層聚集分布,晚上趨于在水體中隨機(jī)分布,因此其水華形成和消亡機(jī)制與藍(lán)藻具有明顯差別[12].雖然近些年國(guó)內(nèi)已有關(guān)于淡水甲藻水華的報(bào)道,但均為水華暴發(fā)原因和暴發(fā)后的調(diào)查研究[5-6,13-16],對(duì)于甲藻水華的預(yù)警研究還鮮有報(bào)道.
Vapnik等于1995年提出的支持向量機(jī)(SVM)機(jī)器學(xué)習(xí)方法屬于數(shù)據(jù)驅(qū)動(dòng)模型[17],它不僅克服了水質(zhì)生態(tài)模型對(duì)于大量數(shù)據(jù)樣本的需要,還解決了多元統(tǒng)計(jì)回歸簡(jiǎn)單線性化的問(wèn)題.而與神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,也不必考慮參數(shù)與網(wǎng)絡(luò)結(jié)構(gòu)的調(diào)整,并且模型輸出結(jié)果易于解釋[18].目前國(guó)內(nèi)外利用支持向量機(jī)進(jìn)行水華預(yù)警也取得了一定進(jìn)展[18-19],本文利用支持向量機(jī)分類方法對(duì)嘉陵江草街水庫(kù)甲藻水華進(jìn)行預(yù)測(cè),以期補(bǔ)充國(guó)內(nèi)淡水甲藻水華預(yù)警研究方面的空白,并為及時(shí)有效地控制草街水庫(kù)甲藻水華提供科學(xué)依據(jù).
1.1 研究區(qū)域概況
嘉陵江(29°20′~34°25′N(xiāo),103°45′~109°0′E)是長(zhǎng)江支流中流域面積最大的河流,全長(zhǎng)1119km.其中合川市以下至河口段為下游段,大部流經(jīng)盆地東部平形嶺谷地帶,屬亞熱帶季風(fēng)性濕潤(rùn)氣候,冬、夏季較長(zhǎng),春、秋季較短,年平均溫度18.2℃,平均降雨量1126mm,降雨主要集中在5-10月.草街水庫(kù)位于嘉陵江江口以上68km處的合川區(qū)草街鎮(zhèn),總面積72.4km2,以發(fā)電、供水、攔沙為主要功能,該水庫(kù)于2010年建成.伴隨著水庫(kù)蓄水,大壩下游嘉陵江水位顯著下降,而上游水位隨之升高,水流減緩,水環(huán)境由典型的河流水體轉(zhuǎn)變?yōu)轭愃坪吹木徚魉w.在水體營(yíng)養(yǎng)物質(zhì)濃度不變的條件下,水體流速降低導(dǎo)致泥沙和營(yíng)養(yǎng)物質(zhì)的沉淀,為藻類的生長(zhǎng)繁殖提供了有利條件,在水庫(kù)建成后的2011-2013年,連續(xù)3年發(fā)生了由倪氏擬多甲藻(Peridiniopsisniei)引起的水華,不僅破壞了嘉陵江生態(tài)環(huán)境,而且威脅著當(dāng)?shù)鼐用裆铒嬘盟踩?
圖1 草街水庫(kù)采樣斷面Fig.1 Sampling transects in Caojie Reservoir
1.2 樣品采集與分析
本次研究共設(shè)置8個(gè)采樣斷面,其中金子、玉溪、碼頭、三江匯合和壩上斷面分布在草街水庫(kù)大壩上游,壩下、梁沱水廠和大溪溝水廠斷面分布在草街水庫(kù)大壩下游,并且每個(gè)斷面包括左、中、右3個(gè)采樣點(diǎn)(圖1).
從2011年5月至2013年7月逐月對(duì)所有樣點(diǎn)進(jìn)行水樣與浮游植物樣品的采集,其中流速、水溫、溶解氧、濁度、透明度、電導(dǎo)率在野外直接測(cè)定.總氮、硝酸鹽離子、亞硝酸鹽離子、銨氮離子、總磷、磷酸鹽離子、高錳酸鹽指數(shù)、光照強(qiáng)度和水體葉綠素a于實(shí)驗(yàn)室根據(jù)國(guó)家環(huán)境保護(hù)總局《水和廢水監(jiān)測(cè)分析方法》進(jìn)行測(cè)定[20].于水面下0.5m處采集1L浮游植物定量樣品沉淀濃縮計(jì)數(shù)得到倪氏擬多甲藻密度.
1.3 模型方法
支持向量機(jī)作為一種廣泛應(yīng)用的機(jī)器學(xué)習(xí)工具,它既克服了傳統(tǒng)方法的大樣本要求,還有效地克服了維數(shù)災(zāi)難及局部極少問(wèn)題.模型泛化能力強(qiáng). 計(jì)算簡(jiǎn)單以及在處理非線性問(wèn)題時(shí)顯示的優(yōu)越性都為其在水質(zhì)評(píng)價(jià)與預(yù)警研究方面提供了巨大的應(yīng)用前景.
支持向量機(jī)從功能上分為分類與回歸兩類,本研究中甲藻水華預(yù)警模型以其分類功能為基礎(chǔ).支持向量機(jī)分類的基本思想是在樣本空間或特征空間構(gòu)造出最優(yōu)超平面,使得超平面與不同類樣本集之間的距離最大,從而達(dá)到最大的泛化能力.設(shè)線性可分樣本集為T(mén)={(X1,Y1),…,(Xn,Yn)},Xi∈Rm,Yi∈{-1,1},i=1,2,…,n,分類面方程為(ω·X)+b=0,分類判別如下:
Yi[(ω·Xi)+b]-1≥0
(1)
式中,使等號(hào)成立的向量稱為支持向量.在2類樣本線性可分的狀況下,求解基于最優(yōu)超平面的決策函數(shù),可以看成求解二次規(guī)劃問(wèn)題.由解析幾何可知類間間隔為D=2/‖ω‖,問(wèn)題可轉(zhuǎn)化為使函數(shù)Φ(ω)=‖ω‖2/2最小化,引入Lagrange函數(shù)求解這一最優(yōu)化問(wèn)題:
(2)
其中αi>0為L(zhǎng)agrange乘子,根據(jù)Kuhn-Tucker條件,這一問(wèn)題的解必須滿足:
αi{[(Xi·ω)+b]Yi-1}=0
(3)
一般情況下,大多數(shù)樣本αi將為0,取值不為0的αi所對(duì)應(yīng)的樣本就是支持向量.求解上述問(wèn)題后所得到判別函數(shù)為:
(4)
考慮到一些樣本不能被超平面正確分類,通過(guò)引入懲罰參數(shù)(C)和松弛變量(ξ)修正函數(shù),確保模型具有良好的容錯(cuò)性[21].
(5)
對(duì)于線性不可分樣本,支持向量機(jī)借助核函數(shù)K進(jìn)行非線性變換,將樣本數(shù)據(jù)映射到高維特征空間中,變?yōu)榫€性問(wèn)題,再求取最優(yōu)超平面,然后映射回原空間的非線性分類.核函數(shù)是支持向量機(jī)實(shí)現(xiàn)空間內(nèi)積轉(zhuǎn)換運(yùn)算的函數(shù)形式,它不但解決了低維空間的線性不可分,還克服了高維空間的維數(shù)災(zāi)難,核技巧的應(yīng)用更使我們避免了因維數(shù)增大而導(dǎo)致的巨量計(jì)算[22].常用的核函數(shù)有多項(xiàng)式函數(shù)、徑向基函數(shù)(Radial Basis Function,RBF)、sigmoid函數(shù)等[23].
2.1 模型參數(shù)構(gòu)建
從空間尺度上考慮到草街水庫(kù)大壩上下游生境變化較大,所以對(duì)于大壩上游5個(gè)斷面和下游3個(gè)斷面分別建模. 從時(shí)間尺度上考慮分為2個(gè)類型,一個(gè)類型為使用本月水體理化數(shù)據(jù)預(yù)測(cè)本月甲藻水華,另一類型為使用本月水體理化數(shù)據(jù)預(yù)測(cè)下月甲藻水華,這樣共建立4個(gè)甲藻水華預(yù)警模型(表1).
表1 預(yù)測(cè)模型類型
通常認(rèn)為甲藻水華的發(fā)生是多種因素共同作用的結(jié)果,它們間的作用機(jī)制十分復(fù)雜[24],因此只能在眾多的環(huán)境變量中提取主要的環(huán)境因子來(lái)建立模型.本次研究使用Spearman相關(guān)性分析,將與倪氏擬多甲藻密度顯著相關(guān),并且相關(guān)系數(shù)大于0.3的理化變量篩選出來(lái)(表2),然后對(duì)篩選出的理化數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,再進(jìn)行PCA分析,其累積方差貢獻(xiàn)率達(dá)到90%的主成分最終進(jìn)入模型(表3).
有關(guān)研究表明,當(dāng)水體中甲藻密度達(dá)到1×105cells/L時(shí),水面開(kāi)始明顯出現(xiàn)塊狀褐色分布,到1×106cells/L時(shí),用肉眼就能觀察到明顯的水華現(xiàn)象[15].過(guò)去3年對(duì)草街水庫(kù)浮游植物例行監(jiān)測(cè)發(fā)現(xiàn),主要的甲藻水華優(yōu)勢(shì)種為倪氏擬多甲藻,所以本次研究將倪氏擬多甲藻密度1×105cells/L設(shè)為水華預(yù)警的警戒值,即當(dāng)水體中倪氏擬多甲藻密度達(dá)到1×105cells/L時(shí)就認(rèn)為有發(fā)生甲藻水華的風(fēng)險(xiǎn),當(dāng)?shù)丨h(huán)境管理部門(mén)需要采取相應(yīng)的預(yù)防措施以減少水華可能帶來(lái)的問(wèn)題,此時(shí)為甲藻水華樣本組,標(biāo)簽為“1”,反之為非甲藻水華樣本組,標(biāo)簽為“0”.
在建立模型前,將樣本分為2組,2011年與2012年的數(shù)據(jù)作為訓(xùn)練組,2013年的數(shù)據(jù)作為檢驗(yàn)組,用訓(xùn)練組樣本進(jìn)行模型建立,用檢驗(yàn)組樣本檢驗(yàn)?zāi)P偷臏?zhǔn)確率.通過(guò)MATLAB軟件對(duì)使用不同核函數(shù)的判別模型進(jìn)行比較,最終確定采用誤差最小、分類準(zhǔn)確率最高的徑向基函數(shù)作為核函數(shù).為了確定最優(yōu)參數(shù),本研究分別使用了網(wǎng)格法、遺傳算法和粒子群算法進(jìn)行參數(shù)尋優(yōu),并從中選取判別誤差最小的參數(shù)組合建立甲藻水華預(yù)警模型(表4).
表2 Spearman秩相關(guān)性分析結(jié)果*
*黑體表示相關(guān)系數(shù)大于0.3.
表3 各模型主成分貢獻(xiàn)率(%)
表4 模型參數(shù)尋優(yōu)結(jié)果
2.2 預(yù)測(cè)結(jié)果
4個(gè)模型對(duì)于測(cè)試樣本總體判別正確率均達(dá)到80%,使用本月理化數(shù)據(jù)和本月倪氏擬多甲藻密度建立的模型,甲藻水華樣本的判別正確率在大壩上、下游斷面均為100%,非甲藻水華樣本的判別正準(zhǔn)確率在大壩上、下游分別為75.86%和82.00%(表5).使用本月理化數(shù)據(jù)和下月倪氏擬多甲藻密度建立的模型,甲藻水華樣本的判別正確率在大壩上、下游斷面分別為43.75%和11.11%,非甲藻水華樣本的判別正確率在大壩上、下游分別為97.67%和100%.
從評(píng)價(jià)結(jié)果來(lái)看,模型3、4相比模型1、2對(duì)于甲藻水華樣本的判別正確率大幅下降.一方面,適宜的水文條件、氣象條件和營(yíng)養(yǎng)條件是水華暴發(fā)的必要因子[5],通過(guò)Spearman相關(guān)性分析可以看出,相對(duì)于模型1、2,模型3、4中水溫與倪氏似多甲藻密度的相關(guān)系數(shù)明顯增大,由于嘉陵江甲藻水華多發(fā)生于春季的3-4月,而重慶地區(qū)春季溫度變化較大,因此較長(zhǎng)的預(yù)測(cè)周期增加了其不確定性,從而導(dǎo)致預(yù)測(cè)結(jié)果正確率的明顯下降.另一方面,多數(shù)淡水甲藻可在不利條件下形成孢囊,因此根據(jù)孢囊的形成和釋放周期選擇適當(dāng)?shù)念A(yù)測(cè)周期也是提高模型準(zhǔn)確率的必要條件[24],但由于目前缺乏詳細(xì)的倪氏擬多甲藻生理學(xué)知識(shí),無(wú)法選擇恰當(dāng)?shù)念A(yù)測(cè)周期也可能是導(dǎo)致模型3、4判別正確率下降的重要原因.模型3、4相比模型1、2對(duì)非甲藻水華樣本的判別正確率雖然有所下降,但通過(guò)分析判斷錯(cuò)誤的樣本,發(fā)現(xiàn)它們大多集中在警戒值附近,所以從實(shí)際應(yīng)用角度來(lái)看模型1、2對(duì)于判斷草街水庫(kù)大壩上、下游當(dāng)月甲藻水華具有較強(qiáng)的預(yù)警能力.
2.3 與BP人工神經(jīng)網(wǎng)絡(luò)方法比較
為驗(yàn)證支持向量機(jī)在機(jī)器學(xué)習(xí)方法中的優(yōu)越性,本文利用BP人工神經(jīng)網(wǎng)絡(luò)法同樣建立4個(gè)預(yù)測(cè)模型,預(yù)測(cè)分類結(jié)果見(jiàn)表5.通過(guò)比較兩種不同方法的結(jié)果可以看出,使用BP人工神經(jīng)網(wǎng)絡(luò)法時(shí),除了模型2,其余3個(gè)模型的總樣本判別正確率相比支持向量機(jī)法均明顯下降,并且模型2和模型4的甲藻水華樣本判別正確率均為0%,而非甲藻水華樣本判別正確率為100%,說(shuō)明模型訓(xùn)練后不具有很好的泛化能力,最終將檢驗(yàn)組樣本全部分為一類.由于模型2和模型4的訓(xùn)練樣本數(shù)僅有143組和135組,并且甲藻水華樣本數(shù)占總訓(xùn)練樣本數(shù)的比例均不到5%,所以較少的訓(xùn)練樣本以及某一類樣本所占比例較低可能是導(dǎo)致這一結(jié)果的主要原因,熊秋芬等在進(jìn)行支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)方法比較研究中同樣也發(fā)現(xiàn),在樣本數(shù)較少,并且某一樣本數(shù)所占比例較低的情況下,SVM方法優(yōu)勢(shì)更明顯[25].
表5 支持向量機(jī)分類模型預(yù)測(cè)結(jié)果
1) 通過(guò)相關(guān)性分析和PCA分析,篩選出影響甲藻水華最主要的環(huán)境變量建立甲藻水華預(yù)警模型,不僅大大縮短了構(gòu)建模型所需的計(jì)算時(shí)間,還減少了水華預(yù)警所需要的理化因子,節(jié)約了環(huán)境管理部門(mén)監(jiān)測(cè)成本.
2) 使用當(dāng)月理化數(shù)據(jù)預(yù)測(cè)下月甲藻水華正確率過(guò)低,所以進(jìn)一步深入研究倪氏擬多甲藻的生理過(guò)程以及孢囊的形成萌發(fā)周期,可為選擇甲藻水華的預(yù)測(cè)周期提供科學(xué)依據(jù).
3) 經(jīng)實(shí)例應(yīng)用表明運(yùn)用支持向量機(jī)分類模型進(jìn)行甲藻水華預(yù)警是可行的,該方法僅需將相應(yīng)的理化數(shù)據(jù)提供給軟件,利用計(jì)算機(jī)分析計(jì)算就可獲得預(yù)測(cè)結(jié)果,而在BP人工神經(jīng)網(wǎng)絡(luò)模型中,除了網(wǎng)絡(luò)結(jié)構(gòu)、各層次節(jié)點(diǎn)、初始權(quán)重等選擇很大方面要依靠研究者的個(gè)人經(jīng)驗(yàn),人為干預(yù)較多,并且訓(xùn)練模型對(duì)數(shù)據(jù)的要求更加嚴(yán)格,所以與其相比SVM方法更加簡(jiǎn)便、快捷,適于推廣.
[1] 徐恒省,洪維民,王亞超等.太湖藍(lán)藻水華預(yù)警監(jiān)測(cè)技術(shù)體系的探討.中國(guó)環(huán)境監(jiān)測(cè),2008,24(2):62-65.
[2] 王長(zhǎng)友,于 洋,孫運(yùn)坤等.基于ELCOM-CAEDYM模型的太湖藍(lán)藻水華早期預(yù)測(cè)探討.中國(guó)環(huán)境科學(xué),2013,33(3):491-502.
[3] 朱 利,王 橋,吳傳慶等.巢湖水華遙感監(jiān)測(cè)與年度統(tǒng)計(jì)分析研究.中國(guó)環(huán)境監(jiān)測(cè),2013,29(2):162-166.
[4] 周火艷,王崇云,彭明春等.滇池水華分形結(jié)構(gòu)動(dòng)態(tài)研究.環(huán)境科學(xué)與技術(shù),2011,34(2):32-35.
[5] 朱愛(ài)民,喬 曄,梁友光等.三峽水庫(kù)支流童莊河擬多甲藻水華的監(jiān)測(cè).水生態(tài)學(xué)雜志,2012,33(4):49-53.
[6] 姚緒姣,劉德富,楊正健等.三峽水庫(kù)香溪河庫(kù)灣冬季甲藻水華生消機(jī)理初探.環(huán)境科學(xué)研究,2012,25(6):645-651.
[7] 孔繁翔,馬榮華,高俊峰等.太湖藍(lán)藻水華的預(yù)防、預(yù)測(cè)和預(yù)警的理論與實(shí)踐.湖泊科學(xué),2009,21(3):314-328.
[8] 周立國(guó),馮學(xué)智,王春紅等.太湖藍(lán)藻水華的MODIS衛(wèi)星監(jiān)測(cè).湖泊科學(xué),2008,20(2):203-207.
[9] 尚琳琳,馬榮華,段洪濤等.利用MODIS影像提取太湖藍(lán)藻水華的尺度差異性分析.湖泊科學(xué),2011,23(6):847-854.
[10] Cha Y, Park SS, Kim Ketal. Probabilistic prediction of cyanobacteria abundance in a Korean reservoir using a Bayesian Poisson model.WaterResourcesResearch, 2014,50(3):2518-2532.
[11] Cho S, Lim B, Jung Jetal. Factors affecting algal blooms in a man-made lake and prediction using an artificial neural network.Measurement, 2014,53:224-233.
[12] 楊 敏,畢永紅,胡建林等.三峽水庫(kù)香溪河庫(kù)灣春季水華期間浮游植物晝夜垂直分布與遷移.湖泊科學(xué),2011,23(3):375-382.
[13] 湯宏波,胡 圣,胡征宇等.武漢東湖甲藻水華與環(huán)境因子的關(guān)系.湖泊科學(xué),2007,19(6):632-636.
[14] 楊正健,劉德富,易仲?gòu)?qiáng)等.三峽水庫(kù)香溪河庫(kù)灣擬多甲藻的晝夜垂直遷移特性.環(huán)境科學(xué)研究,2010,23(1):26-32.
[15] 邊歸國(guó).九龍江北溪擬多甲藻水華防治與應(yīng)急處置.中國(guó)環(huán)境管理,2012,(1):45-49.
[16] 龍勝興,陳 椽,俞振興等.貴州黔東南州三板溪水庫(kù)春季擬多甲藻水華特征.中國(guó)環(huán)境監(jiān)測(cè),2012,28(6):27-31.
[17] Vapnik V. The nature of statistical learning theory. New York: Springer, 1995.
[18] Xie Z, Lou I, Ung WKetal. Freshwater algal bloom prediction by support vector machine in Macau Storage Reservoirs.MathematicalProblemsinEngineering, 2012, 2012:1-12.
[19] Gokaraju B, Durbha SS, King RLetal. A machine learning based spatio-temporal data mining approach for detection of harmful algal blooms in the Gulf of Mexico.IEEEJournalofSelectedTopicsinAppliedEarthObservationsandRemoteSensing, 2011,4(3):710-720.
[20] 國(guó)家環(huán)境保護(hù)總局《水和廢水監(jiān)測(cè)分析方法》編委會(huì). 水和廢水監(jiān)測(cè)分析方法:第4版. 北京:中國(guó)環(huán)境科學(xué)出版社, 2002.
[21] 李正最,謝悅波.洞庭湖富營(yíng)養(yǎng)化支持向量機(jī)評(píng)價(jià)模型研究.人民長(zhǎng)江,2010,41(10):75-78.
[22] 周 鵬,曾 暉,周 原等.支持向量機(jī)用于芳烴類化合物對(duì)芳烴受體親和性QSAR研究.環(huán)境科學(xué)學(xué)報(bào),2006,26(1):124-129.
[23] 高 雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例.北京:機(jī)械工業(yè)出版社,2003.
[24] 張 琪,繆榮麗,劉國(guó)祥等.淡水甲藻水華研究綜述.水生生物學(xué)報(bào),2012,36(2):352-360.
[25] 熊秋芬,胡江林,陳永義.天空云量預(yù)報(bào)及支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)方法比較研究.熱帶氣象學(xué)報(bào),2007,23(3):255-260.
Research on early warning of dinoflagellate bloom in Caojie Reservoir base on support vector machine classification
LIU Shuoru1,2, YANG Min1, ZHANG Fanghui1& ZHANG Sheng1
(1:ChongqingAcademyofEnvironmentalScience,Chongqing401147,P.R.China) (2:FacultyofUrbanConstructionandEnvironmentalEngineering,ChongqingUniversity,Chongqing400045,P.R.China)
Dinoflagellate bloom consecutively occurred in Caojie Reservoir from 2011 to 2013 and threatened the local economy and ecology.Recently, support vector machine(SVM) was reported to have advantages of only requiring a small amount of samples, high degree of prediction accuracy, and generalization to solve the nonlinear classification problems. In this study, the SVM-based prediction model for dinoflagellate bloom was established by monthly field date collected from May 2011 to July 2013 at 8 transects in Caojie Reservoir. The maximum accuracy excessed 80% by choosing environmental variables data andPeridiniopsisnieiabundance of current month, and accuracy arrived at 100% for dinoflagellate bloom samples. The results showed that the SVM classification is an effective new way that can be used in monitoring dinoflagellate bloom in Caojie Reservoir and have a promising application prospect for environmental protection.
Support vector machine; dinoflagellate bloom; Caojie Reservoir;Peridiniopsisniei
*重慶市環(huán)境保護(hù)局環(huán)??萍柬?xiàng)目(環(huán)科字2012第02號(hào))和重慶市基本科研業(yè)務(wù)費(fèi)計(jì)劃項(xiàng)目(2013cstc-jbky-01604)聯(lián)合資助.2014-01-02收稿;2014-05-27收修改稿.劉朔孺(1985~),男,博士研究生;E-mail:lsrzggod@163.com.
**通信作者;E-mail: shengzsts@126.com.