劉雙印,黃建德,徐龍琴,趙學(xué)華,李祥銅,曹 亮,溫寶琴,黃運茂
(1. 廣州市農(nóng)產(chǎn)品質(zhì)量安全溯源信息技術(shù)重點實驗室,廣州 510225;2. 石河子大學(xué)機械電氣工程學(xué)院,石河子 832000;3. 仲愷農(nóng)業(yè)工程學(xué)院智慧農(nóng)業(yè)創(chuàng)新研究院,廣州 510225;4. 廣東省高校智慧農(nóng)業(yè)工程技術(shù)研究中心,廣州 510225;5. 深圳信息職業(yè)技術(shù)學(xué)院數(shù)字媒體學(xué)院,深圳 518172;6. 廣東省水禽健康養(yǎng)殖重點實驗室,廣州 510225;7.廣東省農(nóng)產(chǎn)品安全大數(shù)據(jù)工程技術(shù)研究中心,廣州 510225)
中國飼養(yǎng)了世界75%以上的鴨,90%以上的鵝,是世界最大的水禽生產(chǎn)與消費國[1]。為滿足巨大的供需市場和國家環(huán)保管控政策要求,水禽養(yǎng)殖由傳統(tǒng)養(yǎng)殖模式向規(guī)?;?、集約化、專業(yè)化、無害化的現(xiàn)代養(yǎng)殖模式轉(zhuǎn)型升級是水禽健康養(yǎng)殖的必然趨勢[2-3]。然而水禽集約化養(yǎng)殖環(huán)境調(diào)控不及時,易脅迫水禽正常生長與繁育、誘導(dǎo)水禽疾病爆發(fā)甚至大批量死亡。而氣溫是水禽養(yǎng)殖環(huán)境重要因素之一,氣溫過低或過高、會直接影響到水禽的健康和生產(chǎn)能力,傳統(tǒng)的經(jīng)驗型養(yǎng)殖方法缺乏科學(xué)的理論支撐,容易錯過調(diào)控的關(guān)鍵時機,易對水禽養(yǎng)殖造成危害[2,4]。因此,對養(yǎng)殖環(huán)境氣溫預(yù)測方法研究,準確把握禽舍氣溫變化趨勢,進行養(yǎng)殖環(huán)境精準調(diào)控,對減少水禽生長與繁殖的環(huán)境脅迫影響、預(yù)防禽病害發(fā)生,優(yōu)質(zhì)水禽種質(zhì)培育與開發(fā)具有重要的研究價值。
國內(nèi)外對溫度預(yù)測模型已進行了大量的研究,并在水產(chǎn)養(yǎng)殖、海洋環(huán)境、河流等領(lǐng)域取得了一些研究成果[5-11]。如Xu 等[6]提出了改進人工蜂群優(yōu)化熱力機理模型對對蝦養(yǎng)殖水溫進行預(yù)測;陳英義等[7]采用遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)對河蟹養(yǎng)殖池塘水溫進行短期預(yù)測;徐龍琴等[8]提出了基于經(jīng)驗?zāi)B(tài)分解和極限學(xué)習(xí)機的水溫組合預(yù)測方法對工廠化對蝦育苗水溫預(yù)測分析;Xiao 等[9]構(gòu)建了基于卷積長短時記憶神經(jīng)網(wǎng)絡(luò)方法預(yù)測了海洋表面溫度變化趨勢;Graf 等[10]將小波變換與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了基于小波神經(jīng)網(wǎng)絡(luò)的河水溫度預(yù)測模型;Sahoo 等[11]將回歸分析、人工神經(jīng)網(wǎng)絡(luò)和混沌非線性動態(tài)模型相結(jié)合,構(gòu)建了河流水溫預(yù)測模型分析,預(yù)測河流水溫。上述的溫度預(yù)測機理模型雖然能夠表達溫度內(nèi)部變化機制,但需要大量的精確數(shù)據(jù)作為支撐,且一些相關(guān)數(shù)據(jù)難以在線獲取,工作量繁重;基于人工神經(jīng)網(wǎng)絡(luò)則需要大量的數(shù)據(jù)集進行訓(xùn)練學(xué)習(xí),存在過學(xué)習(xí)或欠學(xué)習(xí),已陷入局部極值等不足,難以滿足水禽養(yǎng)殖實際生產(chǎn)中溫度精準調(diào)控的需要[12]。
支持向量回歸機是以結(jié)構(gòu)風(fēng)險最小化的統(tǒng)計學(xué)習(xí)理論為基礎(chǔ)的機器學(xué)習(xí)方法,在小樣本、高維數(shù)應(yīng)用場景下不僅能克服傳統(tǒng)預(yù)測方法存在的問題,還具有更好的泛化性能和非線性擬合能力,使得支持向量回歸機在很多領(lǐng)域得到了廣泛應(yīng)用[12-17]。如皮駿等[13]采用基于改進量子粒子群優(yōu)化支持向量回歸機的預(yù)測方法,實現(xiàn)了航空發(fā)動機排氣溫度精準預(yù)測;Mathew 等[14]利用支持向量回歸機構(gòu)建了地表溫度預(yù)測模型,為城市地表熱島評價提供良好的決策支持;郭霖等[15]構(gòu)建了基于支持向量機的滴灌灌水器流量預(yù)測模型,實現(xiàn)了灌水器流量的高精度預(yù)測。目前將人工智能算法引入到水禽集約化養(yǎng)殖環(huán)境溫度預(yù)測的研究較少。
水禽養(yǎng)殖環(huán)境復(fù)雜,其關(guān)鍵因子溫度受多種外界環(huán)境因子交叉影響,若直接將所有因子直接輸入溫度預(yù)測模型中,不僅造成預(yù)測網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,還因環(huán)境因子可能存在冗余或信息重疊,則易導(dǎo)致養(yǎng)殖環(huán)境參數(shù)溫度預(yù)測精度低、可靠性差和計算復(fù)雜度高,計算進一步影響溫度的精準調(diào)控[18]。為此有必要在預(yù)測前對溫度進行關(guān)鍵影響因子篩選。
為解決傳統(tǒng)溫度預(yù)測方法對小樣本和非線性數(shù)據(jù)預(yù)測性能低、泛化能力差等不足,本研究在借鑒前人研究的基礎(chǔ)上,將主成分分析法(Principal Components Analysis,PCA)、支持向量回歸機(Support Vector Regression Machine,SVR)和自回歸滑動平均模型(Auto Regressive Moving Average,ARMA)相結(jié)合,提出基于PCA-SVR-ARMA 的獅頭鵝養(yǎng)殖禽舍氣溫組合預(yù)測模型。利用主成分分析法篩選獅頭鵝養(yǎng)殖禽舍氣溫關(guān)鍵影響因子,約簡預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu),通過支持向量回歸機和ARMA 方法構(gòu)建獅頭鵝養(yǎng)殖禽舍氣溫非線性組合預(yù)測模型。將本模型應(yīng)用于廣東省汕尾獅頭鵝養(yǎng)殖某基地養(yǎng)殖禽舍氣溫預(yù)測中,試證結(jié)果表明本模型預(yù)測結(jié)果能夠為獅頭鵝集約化養(yǎng)殖環(huán)境精準管控提供技術(shù)支撐。
本研究試驗數(shù)據(jù)區(qū)域為汕尾市海豐縣公平鎮(zhèn)獅頭鵝養(yǎng)殖某基地(23°15′N ,115°19′E),面積約 53.3 hm2,該基地是一個集獅頭鵝育種、種苗繁育、集約化養(yǎng)殖等多功能一體化的獅頭鵝綜合養(yǎng)殖基地。本試驗選取的半封閉式獅頭鵝養(yǎng)殖場按《畜禽養(yǎng)殖小區(qū)建設(shè)管理規(guī)范》進行設(shè)計,采用巖棉夾芯彩鋼板建造半封閉鵝舍(長25 m 寬16 m),使用水泥硬化的運動場(長25 m 寬45 m),洗浴池(長20 m 寬3 m 水深1 m),鵝舍采用自然通風(fēng),夏季輔以濕簾和風(fēng)機進行降溫。該養(yǎng)殖場反季節(jié)養(yǎng)殖了1 000 只約200日齡處于產(chǎn)蛋期的成年獅頭鵝,參照《獅頭鵝健康養(yǎng)殖技術(shù)規(guī)程,DB440500/T167—2008》進行飼養(yǎng)管理。將多種傳感器在鵝舍中部呈“十字型”部署,以在線監(jiān)測鵝舍養(yǎng)殖環(huán)境參數(shù);在鵝舍兩端外墻上分別安裝風(fēng)機和濕簾等溫度調(diào)控設(shè)備,通過調(diào)節(jié)鵝舍溫度,減少獅頭鵝對溫度的應(yīng)激反應(yīng),確保獅頭鵝在適宜的環(huán)境下健康生長。此外,在鵝舍內(nèi)還安裝了補光燈設(shè)備,通過調(diào)節(jié)光照時長來改進產(chǎn)蛋性能。其基于物聯(lián)網(wǎng)的獅頭鵝養(yǎng)殖環(huán)境監(jiān)測平面示意圖(圖1)。
圖1 基于物聯(lián)網(wǎng)的獅頭鵝養(yǎng)殖環(huán)境監(jiān)測平面示意圖 Fig.1 Schematic diagram of the lion-head goose breeding environment monitoring based on the Internet of Things
以汕尾市海豐縣獅頭鵝養(yǎng)殖某基地禽舍環(huán)境指標為研究對象,采用仲愷農(nóng)業(yè)工程學(xué)院研制的水禽養(yǎng)殖環(huán)境監(jiān)控物聯(lián)網(wǎng)云服務(wù)平臺每間隔60 min 在線采集禽舍的溫度、總懸浮顆粒物(Total Suspended Particulates,TSP)、二氧化碳、光照強度、相對濕度、硫化氫、氨氣等環(huán)境參數(shù)數(shù)據(jù),其所使用的物聯(lián)網(wǎng)平臺拓撲架構(gòu)如圖2 所示,其水禽養(yǎng)殖禽舍環(huán)境監(jiān)控多參數(shù)傳感器性能指標如下:溫度傳感器測量范圍-10~70 ℃,測量精度±0.1 ℃;TSP 傳感器最小粒子檢測1 μm;二氧化碳傳感器測量范圍0~1 500 mg/m3,測量精度±5%;光照強度傳感器測量范圍0~200 000 lx,測量精度±5%;相對濕度傳感器測量范圍0~100%,測量精度±3%;硫化氫傳感器測量范圍0~20×10-6、測量精度±1%;氨氣傳感器測量范圍0~10×10-6,測量精度±1%。采集的獅頭鵝養(yǎng)殖禽舍環(huán)境部分原始數(shù)據(jù)如表1 所示。
表1 獅頭鵝養(yǎng)殖禽舍環(huán)境部分原始數(shù)據(jù) Table 1 Part of experimental original data for lion-head goose breeding environment
在獅頭鵝養(yǎng)殖禽舍環(huán)境數(shù)據(jù)在線采集過程中,可能存在物聯(lián)網(wǎng)采集裝置電氣特性受外界電磁干擾、傳感器性能老化、線路故障等引起環(huán)境數(shù)據(jù)部分丟失、失真或奇異值等問題,為減少上述“不良數(shù)據(jù)”對預(yù)測性能的影響,本研究采用插值法、均值平滑法對數(shù)據(jù)進行修復(fù)預(yù)處理,得到高質(zhì)量的數(shù)據(jù)集[18]。由于各數(shù)據(jù)單位、量綱有差異,為便于研究獅頭鵝養(yǎng)殖環(huán)境數(shù)據(jù)間的相關(guān)性,有必要對各數(shù)據(jù)項進行標準化處理,其標準化處理方法如式(1)所示
式中 yi'和ys分別為標準化后的數(shù)據(jù)和標準差,℃;yi和y 分別為獅頭鵝養(yǎng)殖禽舍氣溫真實值及其均值,℃。
圖2 平臺拓撲架構(gòu)圖 Fig.2 Topology structure diagram of platform
獅頭鵝養(yǎng)殖禽舍內(nèi)環(huán)境參數(shù)氣溫受多種因素影響,作用機理復(fù)雜,若把所有參數(shù)直接輸入到預(yù)測模型中,易造成模型網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,計算復(fù)雜高,執(zhí)行效率低。為此,有必要消除獅頭鵝養(yǎng)殖環(huán)境參數(shù)數(shù)據(jù)間多重共線性,提取獅頭鵝養(yǎng)殖環(huán)境參數(shù)氣溫的關(guān)鍵影響因子,優(yōu)化預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu),提高模型預(yù)測性能[19-20]。鑒于主成分分析法(Principal Component Analysis,PCA)在篩選關(guān)鍵影響因子方面的良好性能,本研究采用主成分分析法(PCA)和SPSS 統(tǒng)計分析軟件對溫度關(guān)鍵影響因子進行篩選,得到各主成分特征值及貢獻率示,解釋的總方差如表2 所示。其中,前2 個影響因子累計方差貢獻率88.973%,符合提取主成分的原則,故從多個特征中提取2 個主成分代替原變量。采用Kaiser 標準化正交旋轉(zhuǎn)法得到獅頭鵝養(yǎng)殖舍內(nèi)環(huán)境因子對不同主成分的因子載荷,得到成分矩陣如表3 所示,對第1 主成分貢獻較大的有氣溫和相對濕度;對第2 主成分貢獻較大的有光照強度和總懸浮顆粒物(Total Suspended Particulates,TSP)。故研究篩選出關(guān)鍵影響因子有氣溫、相對濕度、光照強度和總懸浮顆粒物(TSP),也獲得水禽養(yǎng)殖領(lǐng)域?qū)<业囊恢抡J可,以此構(gòu)建獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測模型的訓(xùn)練集和測試集。
表2 特征值及主成分貢獻率 Table 2 Eigenvalues and principle component contribution rates
表3 成分矩陣 Table 3 Component matrix
支持向量回歸機(Support Vector Regression,SVR)是以VC 維和結(jié)構(gòu)風(fēng)險最小化原則為基礎(chǔ)的新型機器學(xué)習(xí)方法,其目標是構(gòu)建一個最優(yōu)的超平面,使訓(xùn)練樣本距離最優(yōu)超平面誤差最小,以達到對未知樣本具有更好的擬合性能和泛化能力[19]。對于給定獅頭鵝養(yǎng)殖環(huán)境數(shù)據(jù)訓(xùn)練樣本D={(x1,y1),(x2,y2),…,(xm,ym)},xi∈ Rm為輸入向量,yi∈R 為溫度預(yù)測目標輸出值,其SVR 對應(yīng)的優(yōu)化問題表示如式(2)和式(3)所示
式中w 和b 為分別為權(quán)重和偏置量,懲罰因子C >0,非負松弛變量ξi、?、ε 為不敏感損失函數(shù)參數(shù),s.t.為約束條件。根據(jù)卡魯什·庫恩·塔克(Karush-Kuhn-Tucker,KKT)條件和引入Lagrangian 函數(shù),可得到回歸表達式如式(4)所示
式中δ 為RBF 核函數(shù)的寬度參數(shù),xi為任意一個輸入樣本向量,xj為高斯RBF 核函數(shù)中心。
通過SVR 建立獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測模型,雖然能夠利用歷史時間序列數(shù)據(jù)訓(xùn)練SVR 預(yù)測模型得到較好的預(yù)測結(jié)果,但仍得到一系列誤差時間序列數(shù)據(jù)。該誤差時序數(shù)據(jù)具有一定的非純隨機性和自相關(guān)性,仍隱藏了有價值的信息有待進一步挖掘分析。因此需要采用適宜的算法構(gòu)建殘差信息提取模型,以對SVR 預(yù)測結(jié)果進行修正,進一步提高整個模型的預(yù)測精度。
常用的殘差信息提取和修正方法有局部模擬近似值、向量誤差修正、周期外推法、貝葉斯向量法、自回歸滑動平均(Autoregressive Moving Average,ARMA)模型[21]。與其他方法相比,研究表明ARMA 時間序列法不僅能夠較好的描述隨機時間序列數(shù)據(jù)和進一步挖掘出有價值的信息,還具有結(jié)構(gòu)有簡單、高效的優(yōu)點。為此,針對SVR 未能有效提取的殘差時序數(shù)據(jù)有價值的信息,本研究首先對殘差時序進行平穩(wěn)性和純隨機性檢驗,然后通過ARMA 模型提取殘差有價值的信息,再修正SVR模型預(yù)測值來提高預(yù)測精度。
ARMA 模型其表達式ARMA(p,q)如式(6)所示
式中p 和q 為ARMA 模型的階數(shù);Ut(t=1,2,…)為白噪聲時間序列,滿足EUtyt-1=0,φi(i=1,2,…,p)和ψi(i=1,2,…,q)分別為自回歸參數(shù)和滑動平均參數(shù)?;贏RMA(p,q)模型殘差修正具體步驟如下:
步驟 1 :通過增廣迪基- 福勒( Augmented Dickey-Fuller,ADF)對獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測殘差時序數(shù)據(jù)進行時序圖和單位根檢驗,判斷殘差時序變化是否平穩(wěn)。若平穩(wěn)則轉(zhuǎn)向步驟3,否則轉(zhuǎn)向步驟2。
步驟2:根據(jù)獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測殘差時序數(shù)據(jù)非平穩(wěn)特征,選擇對數(shù)變換法、分解法、平滑法和差分法等方法進行平穩(wěn)化處理。
步驟3:計算獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測殘差時序數(shù)據(jù)的自相關(guān)函數(shù)(Auto Correlation Function,ACF)和偏自相關(guān)函數(shù)(Partial Auto Correlation Function,PACF),確定對殘差預(yù)測模型為ARMA(p,q)模型。
步驟4:根據(jù)最小赤池信息準則(Akaike Information Criterion,AIC)值和貝葉斯信息準則(Bayesian Information Criterion,BIC)值,確定最優(yōu)ARMA 模型階數(shù)p 和q。
步驟5:采用最小二乘法對模型的自回歸參數(shù)、滑動平均參數(shù)和待估參數(shù)進行估計,并使殘差和最小。
步驟6:分別進行模型顯著性和參數(shù)顯著性檢驗,判斷殘差時序是否為白噪聲序列,若不是,則轉(zhuǎn)向步驟2 循環(huán)執(zhí)行,直到得到最優(yōu)的ARMA(p,q)模型為止。
步驟7:采用構(gòu)建的最優(yōu)ARMA(p,q)模型進行殘差值預(yù)測。
為了提高氣溫預(yù)測模型性能,將PCA、SVR 和ARMA模型有機結(jié)合,構(gòu)建基于PCA-SVR-ARMA 的獅頭鵝養(yǎng)殖禽舍氣溫非線性組合預(yù)測模型,其基本思想為首先對獅頭鵝養(yǎng)殖環(huán)境數(shù)據(jù)進行修復(fù)和標準化處理,其次采用PCA 作為支持向量回歸機的前置預(yù)處理系統(tǒng),篩選出獅頭鵝養(yǎng)殖禽舍氣溫的關(guān)鍵影響因子,簡化支持向量回歸機SVR 預(yù)測模型結(jié)構(gòu),隨后對PCA-SVR 的預(yù)測模型進行訓(xùn)練和預(yù)測,最后再利用ARMA 殘差修正模型對PCA-SVR 預(yù)測誤差序列進行預(yù)測,以深度挖掘隱含在殘差中的重要信息,將ARMA 對殘差預(yù)測結(jié)果與PCA-SVR預(yù)測結(jié)果進行幾何求和,獲得最終預(yù)測結(jié)果,有效提高了組合模型預(yù)測精度。其氣溫非線性組合預(yù)測模型如圖3所示。
獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測具體步驟如下:
步驟1:通過水禽養(yǎng)殖物聯(lián)網(wǎng)云平臺在線采集獅頭鵝養(yǎng)殖禽舍環(huán)境時間序列數(shù)據(jù),并進行修復(fù)和標準化處理,劃分樣本訓(xùn)練集和測試集。
步驟2:采用主成分分析法對獅頭鵝養(yǎng)殖禽舍氣溫關(guān)鍵影響因子篩選,消除多變量冗余信息,精簡預(yù)測模型結(jié)構(gòu)。
步驟3:初始化PCA-SVR 預(yù)測模型參數(shù),以樣本訓(xùn)練集為基礎(chǔ),通過試湊法和交叉驗證法訓(xùn)練和優(yōu)化PCA-SVR 模型,獲得最佳的SVR 預(yù)測模型。
步驟4:將測試集對PCA-SVR 模型性能進行預(yù)測測試,并通過ARM 殘差修正模型對預(yù)測殘差時序數(shù)據(jù)進行預(yù)測,將殘差預(yù)測結(jié)果和PAC-SVR 預(yù)測結(jié)果進行幾何求和,得到最終預(yù)測結(jié)果,將優(yōu)化獲得PCA-SVR-ARMA模型應(yīng)用于獅頭鵝養(yǎng)殖環(huán)境預(yù)測領(lǐng)域,實現(xiàn)對未來獅頭鵝養(yǎng)殖禽舍氣溫進行精準預(yù)測。
圖3 基于PCA-SVR-ARM 的氣溫預(yù)測模型流程圖 Fig.3 Air temperature prediction flow chart based on PCA-SVR-ARMA
為評價獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測模型性能,選用均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)[19]。具體計算表達式分別如式(7)、式(8)和式(9)所示
式中yi和i分別為在線采集的獅頭鵝養(yǎng)殖禽舍氣溫真實值和預(yù)測值,℃;N 為測試樣本數(shù)量。
以汕尾市海豐縣獅頭鵝養(yǎng)殖某基地禽舍氣溫為研究對象,采用1.2 節(jié)的水禽養(yǎng)殖環(huán)境監(jiān)控物聯(lián)網(wǎng)云服務(wù)平臺,采樣時間為2018 年7 月21 日至7 月30 日,每間隔60 min 在線采集禽舍氣溫、總懸浮顆粒物(TSP)、二氧化碳、光照強度、相對濕度等禽舍環(huán)境參數(shù)數(shù)據(jù),共240個樣本,選取前6 d 的144 個樣本作為訓(xùn)練集,后4 d 的96 個樣本作為測試集,對未來60 min 的獅頭鵝養(yǎng)殖禽舍氣溫進行組合預(yù)測。其獅頭鵝養(yǎng)殖禽舍氣溫原始數(shù)據(jù)如圖4 所示。其中,每天的養(yǎng)殖環(huán)境氣溫數(shù)據(jù)呈現(xiàn)周期性變化,具有非線性、周期性特征。
圖4 氣溫原始數(shù)據(jù)變化曲線圖 Fig.4 Variation curve of the original air temperature data
本試驗環(huán)境為:處理器Intel I5-5200U ,CPU 頻率2.2 GHz,內(nèi)存8 GB,操作系統(tǒng)Window7(64-bit),程序設(shè)計語言python3.7(64-bit),集成開發(fā)環(huán)境Anaconda3、ARMA 和SVR 基于Anaconda 的Sklearn 程序包實現(xiàn),BP 神經(jīng)網(wǎng)絡(luò)基于Anaconda 的PyTorch 開發(fā)包完成編寫。采 用 留 一 法 交 叉 驗 證 網(wǎng) 格 搜 索 法(Leave-One-Out-Cross-Validation,LOOCV)優(yōu)化SVR 模型參數(shù),獲得最優(yōu)參數(shù)對(C=1,δ=0.5),以此構(gòu)建基于SVR 的獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測模型。
采用最優(yōu)的PCA-SVR 模型對獅頭鵝養(yǎng)殖禽舍氣溫進行預(yù)測,其氣溫擬合結(jié)果如圖5 所示,殘差變化曲線如圖6 所示。其中,氣溫真實值與預(yù)測值變化曲線雖然有較高的擬合度,但在氣溫急劇上升和下降時刻誤差較大,最大誤差為-2.89 ℃,因此有必要通過對殘差修正來進一步提高SVR 預(yù)測精度。
圖5 氣溫預(yù)測值與實測值比較 Fig.5 Comparison of temperature forecasting values and actual air temperature values
根據(jù)2.2 節(jié)的ARMA 殘差修正模型的步驟,以PCA-SVR 模型預(yù)測殘差時序數(shù)據(jù)為基礎(chǔ),通過觀察自相關(guān)函數(shù)(Auto Correlation Function,ACF)和偏相關(guān)函數(shù)(Partial Correlation Function,PACF)對自回歸(Auto Regressive,AR)模型AR(p)和滑動平均(Moving Average,MA)模型MA(q)的平穩(wěn)性進行分析。采用單位根檢驗法對殘差序列進行單位根檢驗,使用Eviews 10 軟件的檢驗結(jié)果如表4、表5 和表6 所示,可以看出增廣迪基-福勒(Augmented Dickey-Fuller test,ADF)值為-0.482 152,小于各顯著水平的臨界值,且P=0 遠>0.05 置信區(qū)間,殘差時序沒有通過平穩(wěn)性檢驗。因此,需要對殘差時序數(shù)據(jù)進行一階差分的平穩(wěn)性處理,對處理結(jié)果再進行平穩(wěn)性檢驗,由表5 可知各項統(tǒng)計量均能推翻單位根假設(shè),平穩(wěn)性處理后的殘差時序數(shù)據(jù)可以建立ARMA 模型。
圖6 殘差變化曲線 Fig.6 Variation curve of the error data
由ACF 和PACF 函數(shù)確定p、q 的取值區(qū)間,再通過赤池信息準則(Akaike Information Criterion,AIC)和貝葉斯信息準則(Bayesian Information Criterions,BIC)比較,其對比結(jié)果如表7 所示。根據(jù)最小信息準則,取AIC 和BIC 值同時較小者,確定ARMA 模型階數(shù)p=2,q=2,殘差時序數(shù)據(jù)修正模型為ARMA(2,2)。
利用最小二乘法對ARMA 模型參數(shù)估計,得到基于ARMA 殘差修正表達式如式(10)所示
式中yt、yt-1和yt-2分別為t 時刻殘差值、t-1 時刻殘差值和t-2 時刻殘差值,Ut為t-1 和t-2 時刻的平均值,Ut-1為t-2和t-3 時刻的平均值。
以最優(yōu)的ARMA 模型對PCA-SVR 預(yù)測殘差進行預(yù)測,并將殘差預(yù)測結(jié)果與PCA-SVR 預(yù)測結(jié)果進行幾何相加,得到獅頭鵝養(yǎng)殖禽舍氣溫最終的預(yù)測結(jié)果。采用ARMA 模型修正前后的殘差時序變化曲線如圖7 所示。其中,修正后的殘差更加趨向于0,說明ARMA殘差修正模型能夠進一步提高PCA-SVR-ARMA 模型預(yù)測精度。
為了進一步檢驗PAC-SVR-ARMA 模型的預(yù)測性能,以相同原始樣本為基礎(chǔ),分別選擇標準的SVR 模型、BP神經(jīng)網(wǎng)絡(luò)、 PCA-BPNN 模型、 PCA-SVR 和PCA-BPNN-ARMA 進行對比分析。其6 種模型預(yù)測結(jié)果擬合曲線對比圖和預(yù)測性能對比統(tǒng)計結(jié)果分別如圖8 和表8 所示。
表4 殘差相關(guān)性檢驗 Table 4 Correlation test of error data
表5 增廣迪基-福勒(ADF)單位根檢驗結(jié)果 Table 5 Results of the Augmented Dickey-Fuller (ADF) unit root test
表6 平穩(wěn)性處理后的單位根檢驗結(jié)果 Table 6 Results of unit root test after stationary treatment
表7 不同p 和q 值的赤池信息準則(AIC)和貝葉斯信息準則(BIC)結(jié)果 Table 7 Akaike Information Criterion (AIC) and Bayesian Information Criterions (BIC) results with different p and q values
圖7 預(yù)測殘差比較 Fig.7 Comparison of error forecasting values
圖8 不同模型的預(yù)測結(jié)果對比 Fig.8 Comparison of forecasting results with different models
表8 6 種模型預(yù)測結(jié)果精度分析 Table 8 Precision analysis of forecast results for six models
由圖8 可以看出,與標準BPNN、標準SVR、PCA-BPNN、PCA-SVR 和PCA-BPNN-ARMA 模型相比,本研究提出的基于PCA-SVR-ARMA 的非線性組合預(yù)測模型能更好的擬合獅頭鵝養(yǎng)殖禽舍氣溫非線性變化,預(yù)測效果較好。
由表8 模型性能評價統(tǒng)計結(jié)果可知,本研究提出的PCA-SVR-ARMA 組合預(yù)測模型的各項評價指標都優(yōu)于其他預(yù)測模型,本模型預(yù)測性都有較大的提高。同種條件下PCA-SVR 與標準SVR 相比,評價指標 MAPE、RMSE 和MAE 分別降低了31.78%、15.89% 和29.45%;PCA-BPNN 與標準BPNN 相比,評價指標MAPE、RMSE和MAE 分別降低了10.34%、4.80%和7.98%,從而說明通過PCA 能夠提取溫度關(guān)鍵影響因子,實現(xiàn)了對獅頭鵝養(yǎng)殖環(huán)境數(shù)據(jù)降維,消除變量之間冗余信息的干擾,一定程度上提高預(yù)測精度。同種條件下PCA-SVR-ARMA 與PCA-SVR 相比,評價指標 MAPE、RMSE 和MAE 分別降低了29.59%、40.37%和60.75%;PCA-BPNN-ARMA 與 PCA-BPNN 相比,評價指標MAPE、RMSE 和MAE 分別降低了43.16%、30.63%和44.16%,從而說明通過ARMA 殘差修正模型能夠進一步提取隱藏在預(yù)測殘差序列中的有價值的信息,進一步優(yōu)化模型預(yù)測性能。同種條件下PCA-SVR-ARMA 與PCA-BPNN-ARMA 相比,評價指標MAPE、RMSE 和MAE 分別降低了55.64%、35.66%和55.26%,說明在小樣本條件下,SVR 比BPNN 能更好的挖掘和擬合獅頭鵝養(yǎng)殖禽舍氣溫非線性變化規(guī)律。綜上所述,本研究提出的PCA-SVR-ARMA 模型不僅預(yù)測精度高、魯棒性強,較準確地刻畫獅頭鵝養(yǎng)殖禽舍氣溫未來變化趨勢,能夠為獅頭鵝養(yǎng)殖環(huán)境預(yù)警和適時調(diào)控提供技術(shù)支撐。
針對傳統(tǒng)溫度預(yù)測方法直接對非線性和非平穩(wěn)的獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測精度低和泛化能力差等不足,提出了基于主成分分析法-支持向量回歸機-自回歸滑動平均模型(PCA-SVR-ARMA)的氣溫組合預(yù)測模型,并在廣東汕尾市獅頭鵝養(yǎng)殖禽舍氣溫預(yù)測中應(yīng)用,與其他模型進行對比分析,結(jié)果表明,1)主成分分析法(Principal Components Analysis,PCA)方法能夠篩選氣溫關(guān)鍵影響因子,不僅消除多變量間的信息冗余,精簡預(yù)測模型結(jié)構(gòu),促進提高SVR-ARMA 模型預(yù)測效果。2)在獅頭鵝養(yǎng)殖禽舍環(huán)境小樣本的條件下,支持向量回歸機(Support Vector Regression,SVR)較反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)模型表現(xiàn)出較好的預(yù)測性能。3)自回歸滑動平均(Auto Regression Moving Average,ARMA)模型殘差修正模型能夠挖掘和提取隱藏在預(yù)測殘差時序數(shù)據(jù)中有價值的信息,與SVR 模型結(jié)合,進一步提高組合模型預(yù)測精度。本研究構(gòu)建的氣溫組合預(yù)測模型不僅具有良好的預(yù)測精度和泛化性能,還可以為獅頭鵝養(yǎng)殖精準管控和種苗繁育提供重要的決策依據(jù)。