• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    數(shù)據(jù)挖掘回歸樹(shù)算法預(yù)測(cè)河流海藻富氧化的分析與比較

    2015-06-27 01:23:10段俊陽(yáng)佘春華
    城市地理 2015年12期
    關(guān)鍵詞:藻類(lèi)海藻數(shù)據(jù)挖掘

    段俊陽(yáng) 佘春華

    (銅仁學(xué)院,貴州 銅仁 554300)

    一、引言

    某些高濃度的有害藻類(lèi)嚴(yán)重破壞著河流的生態(tài)環(huán)境,因此,能夠監(jiān)測(cè)并及早對(duì)海藻的繁殖進(jìn)行預(yù)測(cè)對(duì)提高河流的質(zhì)量是很有必要的。在約一年時(shí)間內(nèi),在不同的時(shí)間收集了多條不同河流的水樣。每個(gè)水樣測(cè)定了它們不同的化學(xué)性質(zhì)和7種有害藻類(lèi)的存在頻率。還記錄了如收集的季節(jié)、河流大小和水流速度。

    案例研究動(dòng)機(jī):化學(xué)監(jiān)測(cè)相對(duì)人工檢測(cè)價(jià)格便宜,且易于自動(dòng)化更好地了解藻類(lèi)的頻率和水樣的某些化學(xué)性質(zhì)以及其他特性 (如季節(jié)、河流類(lèi)型等)是如何相關(guān)的。

    二、R軟件

    R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲(chǔ)和處理系統(tǒng);數(shù)組運(yùn)算工具 (其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大)[2];完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡(jiǎn)便而強(qiáng)大的編程語(yǔ)言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。R在語(yǔ)義上是函數(shù)設(shè)計(jì)語(yǔ)言。它允許在“語(yǔ)言上計(jì)算”。這使得它可以把表達(dá)式作為函數(shù)的輸入?yún)?shù),而這種做法對(duì)統(tǒng)計(jì)模擬和繪圖非常有用。R是一個(gè)免費(fèi)的自由軟件。本案例使用的是R的3.0版。

    三、回歸樹(shù)模型

    我們考慮使用回歸樹(shù)預(yù)測(cè)。建立回歸樹(shù):

    library(rpart)

    data(algae)

    algae< -algae[-manyNAs(algae),]

    rt.a1< -rpart(a1~.,data=algae [,1:12])

    我們第一步讀入數(shù)據(jù):說(shuō)明我們的數(shù)據(jù)集中首行并不是變量的名稱(chēng),col.names是給這些變量一個(gè)名稱(chēng),na.strings=c("XXXXXXX")是說(shuō)數(shù)據(jù)中缺失的變量是用XXXXXXX表示的。

    數(shù)據(jù)集中的season表示采集樣本所在的季節(jié),size表示河流的規(guī)模,speed是流速,mxPH之類(lèi)的是河流的一些化學(xué)屬性,后面的a1,a2,……,a7是我們需要預(yù)測(cè)的一些變量。是對(duì)于水藻生長(zhǎng)集中程度的一種度量。algae[1:5,]##這個(gè)表示顯示數(shù)據(jù)集的前五行,結(jié)果如下圖1:

    函數(shù)的形式是用數(shù)據(jù)中其他所有變量來(lái)預(yù)測(cè)a1,data是用來(lái)設(shè)定建模所用的數(shù)據(jù)集。

    回歸樹(shù) rt.a1 的圖形表示的兩種方法:[1]plot(rt.a1),text(rt.a1)或 prettyTree(rt.a1)

    建立回歸樹(shù)通常分兩步。最初,生成一棵較大的樹(shù),然后通過(guò)統(tǒng)計(jì)估計(jì)刪除底部的一些結(jié)點(diǎn)來(lái)對(duì)樹(shù)進(jìn)行修剪。這樣是為了防止過(guò)度擬合。[4]用已有的訓(xùn)練數(shù)據(jù)獲得模型的性能指標(biāo)是不可靠的,因?yàn)檫@些計(jì)算是有偏的。實(shí)際上,有的模型可以很容易獲得訓(xùn)練數(shù)據(jù)的零誤差預(yù)測(cè)。然而,這一優(yōu)秀性能很難推廣到目標(biāo)變量值未知的新樣本上。這種現(xiàn)象我們通常稱(chēng)為過(guò)度擬合訓(xùn)練數(shù)據(jù)。我們需要一個(gè)模型,使它在未知數(shù)據(jù)上有可靠的預(yù)測(cè)性能。

    1、查看比較結(jié)果的摘要:summary(res),首先我們得到這個(gè)數(shù)據(jù)集的一個(gè)描述性統(tǒng)計(jì):我們用的函數(shù)是summary截圖是從R的工作臺(tái)中直接復(fù)制過(guò)來(lái)的,給出了所有變量的基本的描述統(tǒng)計(jì)量,對(duì)于控制變量 (季節(jié)之類(lèi)的),給出的是頻數(shù)統(tǒng)計(jì),對(duì)于數(shù)值變量,給出的是最小值,均值,中位數(shù),最大值,25%分位數(shù),75%分位數(shù)這些最常用的統(tǒng)計(jì)量。

    2、可通過(guò)以下代碼查看模型所對(duì)應(yīng)的參數(shù):得到一棵完整的回歸樹(shù)如下圖生成回歸樹(shù):

    四、模型的應(yīng)用過(guò)程分析

    1、函數(shù)來(lái)證實(shí)組合方法的優(yōu)勢(shì)

    bestScores(res.all)

    對(duì)于某些問(wèn)題,隨機(jī)森林給出很好的結(jié)果。但像海藻7,結(jié)果還不能令人滿意。

    2、為每種藻類(lèi)選擇最優(yōu)的預(yù)測(cè)模型。funcs保存最優(yōu)模型的函數(shù)名;函數(shù)strsplit()提取模型名稱(chēng);parSetts接受每個(gè)最優(yōu)模型的參數(shù);getVariant()返回模型類(lèi)對(duì)象;"@"操作符用來(lái)訪問(wèn)對(duì)象的屬性;最后,調(diào)用do.call()得到相應(yīng)的7個(gè)最優(yōu)模型,并賦給bestModels。

    3、填補(bǔ)測(cè)試集中的缺失值。遵守預(yù)測(cè)模型的黃金法則“不要應(yīng)用測(cè)試集中的任何信息來(lái)建立預(yù)測(cè)模型”,[4]應(yīng)該使用訓(xùn)練集數(shù)據(jù)的關(guān)系來(lái)填補(bǔ)測(cè)試集中的缺失值。

    4、獲取預(yù)測(cè)值矩陣

    5、預(yù)測(cè)值與真實(shí)值的比

    五、總結(jié)

    這里以目標(biāo)變量的均值作為基準(zhǔn)模型的預(yù)測(cè)值,然后通過(guò)計(jì)算NMSE值評(píng)估預(yù)測(cè)結(jié)果的質(zhì)量。最終得到的結(jié)果與前面交叉驗(yàn)證的估計(jì)結(jié)果相一致。它再次確認(rèn)很難得到海藻7的較好的預(yù)測(cè),而其他海藻的估計(jì)結(jié)果相對(duì)較好,海藻1的估計(jì)結(jié)果為最佳。

    [1]朱迪茨.實(shí)用教據(jù)挖掘 [M].北京:電子工業(yè)出版社,2004.

    [2]魏萍萍,王翠茹,王保義,張振興.數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)工程,2003(7).

    [3](英)漢德 (Hand,D.)著.數(shù)據(jù)挖掘原理 [M].張銀奎,等譯.北京:機(jī)械工業(yè)出版社,2003.

    [4]于承敏.數(shù)據(jù)挖掘技術(shù)運(yùn)用ff-4t育領(lǐng)域之探討[J].聊城大學(xué)學(xué)報(bào),2005(6).

    猜你喜歡
    藻類(lèi)海藻數(shù)據(jù)挖掘
    海藻保鮮膜:來(lái)自海洋的天然“塑料”
    軍事文摘(2023年18期)2023-10-31 08:10:50
    海藻球
    藻類(lèi)水華控制技術(shù)及應(yīng)用
    探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
    細(xì)菌和藻類(lèi)先移民火星
    軍事文摘(2020年20期)2020-11-16 00:31:40
    海藻與巖石之間
    吃蔬菜有個(gè)“321模式” 三兩葉菜類(lèi),二兩其他類(lèi),一兩菌藻類(lèi)
    歐盟:海藻酸、海藻酸鹽作為食品添加劑無(wú)安全風(fēng)險(xiǎn)
    基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
    電力與能源(2017年6期)2017-05-14 06:19:37
    浮游藻類(lèi)在水體PAHs富集與降解中的研究
    苍南县| 读书| 保康县| 灵川县| 扎兰屯市| 集贤县| 项城市| 大宁县| 隆回县| 扶余县| 三明市| 昌邑市| 长丰县| 湖州市| 新乡县| 会宁县| 团风县| 嘉峪关市| 天柱县| 延津县| 湾仔区| 拜泉县| 宝丰县| 阿尔山市| 上杭县| 玛沁县| 蓬溪县| 沐川县| 海盐县| 宁安市| 象山县| 沾益县| 博爱县| 屯门区| 治多县| 台东市| 西和县| 河东区| 涿州市| 保靖县| 安龙县|