溫昌凱 謝 斌 李若晨 宋正河 韓建剛 劉江輝
(1.中國農(nóng)業(yè)大學(xué)工學(xué)院, 北京 100083; 2.中國農(nóng)業(yè)大學(xué)現(xiàn)代農(nóng)業(yè)裝備優(yōu)化設(shè)計(jì)北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100083;3.洛陽西苑車輛與動(dòng)力檢驗(yàn)所有限公司, 洛陽 471000)
農(nóng)業(yè)與大數(shù)據(jù)良好結(jié)合是未來農(nóng)業(yè)發(fā)展的必然趨勢。農(nóng)業(yè)大數(shù)據(jù)涉及地區(qū)范圍廣、地形差別大、作物品種多、作業(yè)工況多,并且受限于各地區(qū)農(nóng)業(yè)結(jié)構(gòu)復(fù)雜、農(nóng)耕環(huán)境以及氣候多樣等因素,因此,農(nóng)業(yè)領(lǐng)域大數(shù)據(jù)具有高實(shí)時(shí)、多維度、離散化、難綜合分析等特點(diǎn)[1-3]。
隨著全球農(nóng)業(yè)現(xiàn)代化、智能化、信息化的不斷推進(jìn),畜牧業(yè)、漁業(yè)、農(nóng)產(chǎn)品加工、氣象等農(nóng)業(yè)相關(guān)領(lǐng)域數(shù)據(jù)呈指數(shù)規(guī)律不斷積累[4-8]。但在農(nóng)業(yè)機(jī)械領(lǐng)域,由于農(nóng)業(yè)機(jī)械載荷復(fù)雜、測試成本較高以及數(shù)據(jù)平臺架構(gòu)不易統(tǒng)一等問題,數(shù)據(jù)系統(tǒng)性積累與平臺規(guī)范化構(gòu)建難以實(shí)現(xiàn),農(nóng)業(yè)數(shù)據(jù)測試以及積累研究相對滯后,基于大數(shù)據(jù)的農(nóng)業(yè)機(jī)械數(shù)據(jù)融合與分析預(yù)測相對缺乏。
本文研究拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺系統(tǒng)構(gòu)建和基于大數(shù)據(jù)的拖拉機(jī)田間旋耕作業(yè)質(zhì)量評價(jià)與預(yù)測。探索拖拉機(jī)多傳感器車載測試終端分布格局、作業(yè)參數(shù)與結(jié)構(gòu)體系;研究基于全國范圍田間作業(yè)試驗(yàn)的拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺系統(tǒng),并構(gòu)建相應(yīng)的數(shù)據(jù)庫結(jié)構(gòu);基于農(nóng)機(jī)農(nóng)藝要求,采用遺傳算法與BP神經(jīng)網(wǎng)絡(luò)相融合的方法對數(shù)據(jù)平臺基礎(chǔ)作業(yè)載荷進(jìn)行分類融合處理,預(yù)測評價(jià)拖拉機(jī)田間旋耕作業(yè)質(zhì)量,以驗(yàn)證平臺系統(tǒng)的可行性。
此次全國范圍的測試樣機(jī)布置以涵蓋水稻、小麥、玉米等優(yōu)勢作物的全國農(nóng)業(yè)戰(zhàn)略格局為出發(fā)點(diǎn),主要考慮優(yōu)勢主產(chǎn)區(qū)的作物差異性、地理環(huán)境差異性以及作業(yè)載荷差異性,在一定程度上兼顧其他具有代表性的地塊地域[9-11]。
因此,綜合考慮測試終端地區(qū)分配合理,兼顧各地區(qū)作物、地理、氣候等多個(gè)因素,測試樣機(jī)車載終端布置選擇主要集中在東北平原、黃淮海平原、長江流域、汾渭平原以及新疆地區(qū),總計(jì)6輛測試樣機(jī)。
測試樣機(jī)車載終端硬件以基于 ARM335x 微處理器的 ARM 硬件開發(fā)平臺作為主控制器,使用分布式布置的傳感器,對拖拉機(jī)多地區(qū)、多工況、多載荷進(jìn)行數(shù)據(jù)采集。田間作業(yè)載荷采集測試終端采用OK3355xD工業(yè)級開發(fā)板和FET335xD工業(yè)級核心板,配置LCD觸摸液晶屏、WiFi模塊、SD卡、USB鍵盤鼠標(biāo)接口、多接口模塊,測試終端硬件結(jié)構(gòu)設(shè)計(jì)如圖1所示。
圖1 測試終端硬件結(jié)構(gòu)框圖Fig.1 Hardware structure design of test terminal
測試樣機(jī)車載終端的測試工況包括拖拉機(jī)犁耕作業(yè)、旋耕作業(yè)、深松作業(yè)以及聯(lián)合耕整作業(yè),待測關(guān)鍵零部件包括發(fā)動(dòng)機(jī)、實(shí)時(shí)地理位置、電液懸掛下拉桿、動(dòng)力輸出軸、前萬向傳動(dòng)軸、前轉(zhuǎn)向驅(qū)動(dòng)橋、變速箱、后驅(qū)動(dòng)橋、駕駛室等,測試參數(shù)以及配套傳感器如表1所示,傳感器布置位置如圖2所示。
表1 測試終端測試參數(shù)與傳感器Tab.1 Testing terminal test parameters and sensors
圖2 測試終端傳感器布置圖Fig.2 Sensor layout of test terminal
各測試樣機(jī)正常田間作業(yè),測試終端開啟后可自動(dòng)采集作業(yè)載荷,按照拖拉機(jī)作業(yè)載荷傳輸協(xié)議實(shí)時(shí)或分段工作數(shù)據(jù)打包等多種形式發(fā)送傳輸至作業(yè)載荷數(shù)據(jù)庫,實(shí)現(xiàn)拖拉機(jī)多樣工況、惡劣環(huán)境條件下的田間作業(yè)載荷數(shù)據(jù)的自動(dòng)采集與傳輸。
參考國內(nèi)外現(xiàn)有機(jī)械行業(yè)數(shù)據(jù)平臺,結(jié)合農(nóng)業(yè)機(jī)械田間作業(yè)多工況、變環(huán)境、高載荷的特點(diǎn),設(shè)計(jì)基于B/S網(wǎng)絡(luò)結(jié)構(gòu)模式的拖拉機(jī)作業(yè)載荷數(shù)據(jù)庫系統(tǒng)。本系統(tǒng)包括系統(tǒng)管理機(jī)制、載荷數(shù)據(jù)庫基礎(chǔ)平臺、載荷數(shù)據(jù)實(shí)時(shí)采集系統(tǒng)以及拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量評價(jià)與預(yù)測模塊等部分,在此基礎(chǔ)上,形成的系統(tǒng)總體方案如圖3所示。
圖3 作業(yè)載荷數(shù)據(jù)平臺總體結(jié)構(gòu)與方案Fig.3 Overall structure and scheme of work load data platform
系統(tǒng)管理機(jī)制包括用戶權(quán)限管理、試驗(yàn)地信息管理、拖拉機(jī)信息管理、測試終端信息管理、作業(yè)信息管理以及平臺信息管理等功能。用戶權(quán)限管理包括對用戶的基本信息、登錄密碼、訪問權(quán)限級別進(jìn)行管理。試驗(yàn)地信息管理包括對作業(yè)試驗(yàn)田的所屬地區(qū)、基本環(huán)境的管理。拖拉機(jī)信息管理包括對拖拉機(jī)基本參數(shù)、配套作業(yè)機(jī)具的管理。測試終端信息管理包括對采集設(shè)備以及工作狀態(tài)的管理。系統(tǒng)管理機(jī)制的有效運(yùn)行可保證拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺的正常運(yùn)行。
該數(shù)據(jù)平臺作業(yè)載荷實(shí)時(shí)采集系統(tǒng)主要由全國范圍內(nèi)各主產(chǎn)區(qū)負(fù)責(zé)單位統(tǒng)籌管理,由主產(chǎn)區(qū)各試驗(yàn)測試站分別負(fù)責(zé)執(zhí)行試驗(yàn)田以及測試樣機(jī)的管理以及作業(yè)運(yùn)行,考慮到我國農(nóng)業(yè)主產(chǎn)區(qū)地域差別大、農(nóng)業(yè)機(jī)械作業(yè)載荷復(fù)雜,有必要全面監(jiān)控從試驗(yàn)地到測試終端的內(nèi)在聯(lián)系,以獲得全國范圍內(nèi)拖拉機(jī)田間作業(yè)載荷的全面基礎(chǔ)數(shù)據(jù)[12-15]。
作業(yè)載荷實(shí)時(shí)采集系統(tǒng)由各農(nóng)業(yè)主產(chǎn)區(qū)管理單位、分布的各級試驗(yàn)站(省、市、縣/區(qū))和測試環(huán)節(jié)的基層測試站點(diǎn)構(gòu)成。具體分層結(jié)構(gòu)如圖4所示。
圖4 作業(yè)載荷實(shí)時(shí)采集系統(tǒng)分層結(jié)構(gòu)Fig.4 Hierarchical structure of real-time load acquisition system
圖5 作業(yè)載荷數(shù)據(jù)庫系統(tǒng)功能結(jié)構(gòu)Fig.5 Functional structure of work load database system
基于用戶群體需求導(dǎo)向,進(jìn)一步完善拖拉機(jī)作業(yè)載荷數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu),明確數(shù)據(jù)庫系統(tǒng)各模塊部分的功能以及結(jié)構(gòu),如圖5所示。平臺系統(tǒng)管理包括測試樣機(jī)管理、用戶權(quán)限管理以及作業(yè)資料管理。基礎(chǔ)載荷數(shù)據(jù)管理包括地區(qū)信息、環(huán)境信息、機(jī)具信息、試驗(yàn)標(biāo)準(zhǔn)、測試方法、采集步驟、測試對象以及測試種類。實(shí)時(shí)載荷數(shù)據(jù)采集包括試驗(yàn)地設(shè)置、樣機(jī)設(shè)置、實(shí)時(shí)載荷采集、載荷數(shù)據(jù)打包、載荷數(shù)據(jù)校驗(yàn)以及載荷數(shù)據(jù)上傳。作業(yè)農(nóng)藝預(yù)測評價(jià)包括所在地區(qū)檢索、作業(yè)種類檢索、工作狀態(tài)檢索以及牽引預(yù)測檢索。
基于數(shù)據(jù)平臺多樣性、包容性、全面性以及系統(tǒng)性特點(diǎn)需求,結(jié)合E-R概念設(shè)計(jì)的實(shí)體、屬性和聯(lián)系三要素,構(gòu)建全國范圍拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺的概念模型。該數(shù)據(jù)庫包括4個(gè)實(shí)體、若干屬性以及各項(xiàng)必要的聯(lián)系。各實(shí)體環(huán)環(huán)相扣,構(gòu)建了數(shù)據(jù)平臺的基本框架,各實(shí)體屬性以及聯(lián)系建立數(shù)據(jù)平臺潛在邏輯,進(jìn)一步豐富數(shù)據(jù)平臺功能、提高可用性。E-R結(jié)構(gòu)框圖如圖6所示。
根據(jù)作業(yè)載荷數(shù)據(jù)平臺系統(tǒng)需求,剖析拖拉機(jī)田間作業(yè)載荷測試、采集、傳輸以及入網(wǎng)的全過程?;谧鳂I(yè)載荷數(shù)據(jù)庫E-R概念結(jié)構(gòu)設(shè)計(jì)的數(shù)據(jù)字典,進(jìn)行數(shù)據(jù)庫邏輯架構(gòu)設(shè)計(jì),數(shù)據(jù)庫系統(tǒng)主要由終端表、農(nóng)機(jī)表、傳感器表、作業(yè)表、數(shù)據(jù)表等11個(gè)數(shù)據(jù)組成,其中主數(shù)據(jù)表與基礎(chǔ)數(shù)據(jù)表相關(guān)聯(lián),以測試終端為主鍵,實(shí)時(shí)采集、傳輸、存儲測試基礎(chǔ)數(shù)據(jù)以及結(jié)果。形成的數(shù)據(jù)表關(guān)系如圖7所示。
圖6 作業(yè)載荷數(shù)據(jù)庫E-R概念結(jié)構(gòu)框圖Fig.6 Design of E-R conceptual structure of work load database
基于作業(yè)載荷數(shù)據(jù)庫概念結(jié)構(gòu)與邏輯結(jié)構(gòu),結(jié)合使用人員多樣性、操作級別多層次、終端節(jié)點(diǎn)分布廣以及作業(yè)環(huán)境復(fù)雜性等系統(tǒng)特點(diǎn),進(jìn)行數(shù)據(jù)平臺基本框架設(shè)計(jì)以及服務(wù)器軟件系統(tǒng)開發(fā)。
作業(yè)載荷數(shù)據(jù)庫系統(tǒng)基于Web2.0架構(gòu),采用微服務(wù)技術(shù)結(jié)構(gòu)體系開發(fā),前端部分采用HTML5/CSS3/JavaScript等技術(shù)開發(fā),數(shù)據(jù)庫采用MY SQL 5.7.27.0版本,并且采用RESTful API架構(gòu)作為方便前、后端通信的統(tǒng)一機(jī)制。
數(shù)據(jù)采集服務(wù)基于C#.NET技術(shù)開發(fā),測試樣機(jī)車載終端與平臺服務(wù)器之間基于TCP傳輸方式,采用私有二進(jìn)制協(xié)議即拖拉機(jī)機(jī)組作業(yè)載荷傳輸協(xié)議進(jìn)行數(shù)據(jù)傳輸,關(guān)鍵數(shù)據(jù)采用RSA加密驗(yàn)證機(jī)制保護(hù),可確保高吞吐量和高安全性。
關(guān)聯(lián)數(shù)據(jù)庫結(jié)構(gòu)設(shè)計(jì)采用基礎(chǔ)數(shù)據(jù)與不易變化數(shù)據(jù)結(jié)構(gòu)化處理、易變化數(shù)據(jù)非結(jié)構(gòu)化處理相結(jié)合的方式,可確保數(shù)據(jù)庫的穩(wěn)定性、靈活性以及兼容性;針對系統(tǒng)傳感器多、數(shù)據(jù)量大以及采樣頻率范圍廣的特點(diǎn)采用分庫分表方式處理數(shù)據(jù),即按照需求業(yè)務(wù)不同將數(shù)據(jù)分庫儲存,按照時(shí)間維度不同將低頻、高頻數(shù)據(jù)分表儲存。此外,通過數(shù)據(jù)庫約束機(jī)制保證數(shù)據(jù)完整性,通過數(shù)據(jù)校驗(yàn)機(jī)制確保邏輯正確性,通過數(shù)據(jù)庫備份確保數(shù)據(jù)高可用性。
基于以上內(nèi)容,完成拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺的設(shè)計(jì)與構(gòu)建,田間試驗(yàn)以及試驗(yàn)數(shù)據(jù)等部分界面效果如圖8所示。
基于拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺以及農(nóng)業(yè)大數(shù)據(jù)融合技術(shù),結(jié)合農(nóng)機(jī)農(nóng)藝要求,篩選部分實(shí)測數(shù)據(jù)研究拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量評價(jià)與預(yù)測的智能算法,并驗(yàn)證其可行性。
針對BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型連接權(quán)重隨機(jī)賦值導(dǎo)致收斂速度過慢和結(jié)構(gòu)模式不確定導(dǎo)致訓(xùn)練過擬合及學(xué)習(xí)能力不足的問題,本文提出基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法,利用遺傳算法全局搜索最優(yōu)特性對 BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,降低神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu)解而無法穩(wěn)定準(zhǔn)確預(yù)測的風(fēng)險(xiǎn),提升網(wǎng)絡(luò)的收斂速度和系統(tǒng)預(yù)測精度,進(jìn)一步提高BP神經(jīng)網(wǎng)絡(luò)的可行性[16-19]。遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)方法主要由BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定、遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)權(quán)閾值權(quán)重矩陣、 BP 神經(jīng)網(wǎng)絡(luò)預(yù)測3部分組成[20-22]。其核心是采用遺傳算法將神經(jīng)網(wǎng)絡(luò)函數(shù)計(jì)算的損失誤差作為個(gè)體適應(yīng)度,對權(quán)值、閾值進(jìn)行選擇、交叉和變異操作,使個(gè)體適應(yīng)度盡可能地小,從而得到最佳的神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值權(quán)重矩陣?;谶z傳算法的BP神經(jīng)網(wǎng)絡(luò)算法流程如圖9所示。
圖7 作業(yè)載荷數(shù)據(jù)庫主要數(shù)據(jù)表關(guān)系Fig.7 Maindata table relations of job load database
圖8 拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺界面Fig.8 Interfaces of tractor working load data platform
圖9 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法流程圖Fig.9 Flow chart of BP neural network algorithm based on genetic algorithm
4.2.1BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)即誤差反向傳播神經(jīng)網(wǎng)絡(luò),一般由輸入層、隱含層和輸出層構(gòu)成,可以有效地解決各個(gè)輸入指標(biāo)之間的非線性關(guān)系,步驟如下:
(1)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)選擇
拖拉機(jī)工作在土壤-機(jī)器-植物復(fù)雜系統(tǒng),考慮其田間旋耕工況作業(yè)質(zhì)量受到多因素耦合作用以及3層神經(jīng)網(wǎng)絡(luò)可以完成任意n維到m維的映射,本文選擇3層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
(2)輸入、輸出層參數(shù)確定
為了建立簡潔有效的BP神經(jīng)網(wǎng)絡(luò)模型,基于農(nóng)機(jī)農(nóng)藝要求,本文所采用的BP神經(jīng)網(wǎng)絡(luò)輸入層參數(shù)為拖拉機(jī)電液懸掛左、右下拉桿銷軸力,電液懸掛左、右下拉桿角度,動(dòng)力輸出軸扭矩以及行駛速度,輸出層參數(shù)為優(yōu)、中、差3種拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量水平。
本文神經(jīng)網(wǎng)絡(luò)模型的輸入層參數(shù)存在量綱難以統(tǒng)一的問題,為減少拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量評價(jià)與預(yù)測的誤判概率,對輸入輸出層參數(shù)進(jìn)行歸一化處理,即
(1)
pi——第i個(gè)原始特征值數(shù)據(jù)
pmax——原始特征值數(shù)據(jù)的最大值
pmin——原始特征值數(shù)據(jù)的最小值
(3)隱含層節(jié)點(diǎn)數(shù)確定
隱含層節(jié)點(diǎn)數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的重要組成部分,直接影響網(wǎng)絡(luò)的非線性映射能力。隱含層節(jié)點(diǎn)數(shù)計(jì)算公式為
(2)
式中n——輸入層節(jié)點(diǎn)數(shù)
m——輸出層節(jié)點(diǎn)數(shù)
計(jì)算可得該神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)范圍為[3,13],對比多次試驗(yàn)以及神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差,當(dāng)隱含層節(jié)點(diǎn)數(shù)為10時(shí),神經(jīng)網(wǎng)絡(luò)預(yù)測性能最佳。
構(gòu)建具有1個(gè)隱含層的3層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),隱含層節(jié)點(diǎn)數(shù)為10,具體BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型結(jié)構(gòu)如圖10所示。
圖10 拖拉機(jī)旋耕作業(yè)性能預(yù)測的BP神經(jīng)網(wǎng)絡(luò)模型Fig.10 BP neural network model for performance prediction of tractor rotary tillage
(4)網(wǎng)絡(luò)函數(shù)選擇
考慮到預(yù)測模型非線性特征明顯以及預(yù)測收斂快、誤差小等要求,BP神經(jīng)網(wǎng)絡(luò)的隱含層傳遞函數(shù)選擇sigmoid函數(shù),訓(xùn)練函數(shù)選擇trainlm函數(shù),學(xué)習(xí)函數(shù)選擇learngdm函數(shù),網(wǎng)絡(luò)性能函數(shù)選擇mse函數(shù),仿真函數(shù)選擇sim函數(shù)。
(5)權(quán)值閾值更新確定
權(quán)值閾值更新確定是BP神經(jīng)網(wǎng)絡(luò)采用的誤差反向傳播算法的核心部分,其主要工作是依次計(jì)算隱含層輸出和輸出層輸出,進(jìn)一步求得神經(jīng)網(wǎng)絡(luò)輸出值與實(shí)際作業(yè)真實(shí)值之間的預(yù)測誤差,最后根據(jù)公式實(shí)時(shí)更新神經(jīng)網(wǎng)絡(luò)隱含層與輸出層的權(quán)值閾值。神經(jīng)網(wǎng)絡(luò)權(quán)值閾值更新確定過程包括隱含層輸出、輸出層輸出、誤差計(jì)算以及權(quán)閾值更新4個(gè)步驟,計(jì)算公式為
(3)
式中f(x)——隱含層激勵(lì)傳遞函數(shù)
x——輸入變量
Hj——隱含層輸出變量
wij——隱含層權(quán)值
aj——隱含層閾值
Ok——輸出層輸出變量,即預(yù)測值
bk——輸出層閾值
i——輸入層節(jié)點(diǎn)數(shù)
j——隱含層節(jié)點(diǎn)數(shù)
k——輸出層節(jié)點(diǎn)數(shù)
Yk——實(shí)際值
ek——神經(jīng)網(wǎng)絡(luò)預(yù)測誤差
η——神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率
wjk——輸出層權(quán)值
4.2.2預(yù)測網(wǎng)絡(luò)模型的遺傳算法優(yōu)化
基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模思想是:通過遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值閾值,對初始值進(jìn)行編碼和選擇、交叉和變異等操作,獲取最優(yōu)參數(shù)并對神經(jīng)網(wǎng)絡(luò)進(jìn)行賦值與訓(xùn)練,使優(yōu)化后的神經(jīng)網(wǎng)絡(luò)能提高網(wǎng)絡(luò)收斂速度以及預(yù)測準(zhǔn)確性。基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)過程主要包括種群初始化,適應(yīng)度函數(shù)選擇以及選擇、交叉、變異操作[23-25]。
種群初始化主要采用浮點(diǎn)數(shù)編碼方式,編碼長度為神經(jīng)網(wǎng)絡(luò)所有權(quán)值個(gè)數(shù)(nm+lm)和閾值個(gè)數(shù)(l+m)之和,計(jì)算可得此種群初始化編碼長度為61。
適應(yīng)度函數(shù)選擇與計(jì)算是遺傳算法的核心部分,將BP神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出值與真實(shí)作業(yè)值之間的誤差平方和作為個(gè)體適應(yīng)度,因此適應(yīng)度函數(shù)為
(4)
式中n0——訓(xùn)練樣本總數(shù)
yi——作業(yè)真實(shí)值
f(xi)——神經(jīng)網(wǎng)絡(luò)預(yù)測值
選擇操作采用最優(yōu)個(gè)體最優(yōu)保存和其余個(gè)體輪盤賭法選擇的并存策略。交叉操作采用實(shí)數(shù)交叉法,變異操作采用實(shí)值變異法。其中因?yàn)樯婕吧窠?jīng)網(wǎng)絡(luò)收斂速度,基于適應(yīng)度需求選取交叉概率與變異概率遺傳算子,計(jì)算公式為
(5)
(6)
式中pc——遺傳算法交叉概率
pch——遺傳算法交叉概率上限
pcl——遺傳算法交叉概率下限
pm——遺傳算法變異概率
pmh——遺傳算法變異概率上限
pml——遺傳算法變異概率下限
f′——交叉染色體較大適應(yīng)度
favg——染色體平均適應(yīng)度
fbest——染色體最佳適應(yīng)度
因此,本文構(gòu)建了基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,計(jì)算并設(shè)置遺傳算法參數(shù):進(jìn)化代數(shù)為200,種群規(guī)模為20,交叉概率為0.5,變異概率為0.1。并選取均方根誤差(RMSE)作為模型評價(jià)與預(yù)測性能的評價(jià)標(biāo)準(zhǔn)。
4.3.1田間作業(yè)試驗(yàn)數(shù)據(jù)
作業(yè)載荷數(shù)據(jù)平臺可實(shí)時(shí)獲取多拖拉機(jī)、多工況、多地區(qū)的作業(yè)數(shù)據(jù),但若考慮整個(gè)時(shí)間段、整個(gè)覆蓋范圍,數(shù)據(jù)總量會過大、不利于建模與分析。因此,基于2019年3月東北某區(qū)域某拖拉機(jī)某時(shí)間段內(nèi)數(shù)據(jù)平臺的田間作業(yè)數(shù)據(jù),平均隨機(jī)選取旋耕工況作業(yè)質(zhì)量優(yōu)、中、差3種情況,每種情況3 000組數(shù)據(jù),總計(jì)9 000組數(shù)據(jù)作為訓(xùn)練集,其他任意一段時(shí)間總計(jì)4 000組旋耕工況作業(yè)數(shù)據(jù)作為測試集。根據(jù)訓(xùn)練集與測試集數(shù)據(jù),對拖拉機(jī)旋耕工況作業(yè)質(zhì)量性能進(jìn)行評價(jià)與預(yù)測。
4.3.2評價(jià)預(yù)測結(jié)果分析
應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值閾值,其中適應(yīng)度函數(shù)變化曲線如圖11所示。由圖11可知,當(dāng)?shù)螖?shù)不足20次時(shí),即迭代前期平均適應(yīng)度和最佳適應(yīng)度均呈快速下降趨勢,隨著迭代次數(shù)的不斷增加至60次時(shí),迭代后期整體趨于平緩,其中雖然略有波動(dòng),但整體起伏不大。表明遺傳算法迭代次數(shù)選擇合理,遺傳算法可以快速準(zhǔn)確有效地優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值閾值。
圖11 遺傳算法適應(yīng)度曲線Fig.11 Fitness curves of genetic algorithm
均方根誤差(RMSE)是衡量神經(jīng)網(wǎng)絡(luò)性能的最常用參考標(biāo)準(zhǔn),RMSE越小,表示此神經(jīng)網(wǎng)絡(luò)預(yù)測性能越好。由圖12可知,隨著樣本訓(xùn)練次數(shù)的不斷增加,均方根誤差由初始值0.6不斷減少,在樣本訓(xùn)練次數(shù)達(dá)到10次時(shí),均方根誤差已減至0.01,表明基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型能夠準(zhǔn)確快速擬合輸入數(shù)據(jù),預(yù)測結(jié)果接近真實(shí)情況。
圖12 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線Fig.12 BP neural network training error curve based on genetic algorithms
利用9 000組數(shù)據(jù)訓(xùn)練的基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型在預(yù)測4 000組測試數(shù)據(jù)時(shí),正確組數(shù)為3 871,正確率為96.77%。由此可見,基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果與實(shí)際作業(yè)情況基本一致,錯(cuò)誤率為3.23%,可準(zhǔn)確有效評價(jià)拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量。
(1)基于我國“七區(qū)二十三帶”農(nóng)業(yè)戰(zhàn)略格局,建立了全國范圍的拖拉機(jī)測試終端布局,完成了測試終端硬件、測試工況以及測試系統(tǒng)功能架構(gòu)。
(2)分析了拖拉機(jī)作業(yè)載荷數(shù)據(jù)庫系統(tǒng)需求、管理機(jī)制、網(wǎng)絡(luò)架構(gòu)以及功能結(jié)構(gòu),設(shè)計(jì)并搭建了拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺系統(tǒng),可實(shí)時(shí)獲取、存儲拖拉機(jī)各關(guān)鍵零部件的田間作業(yè)載荷數(shù)據(jù)。
(3)研究了神經(jīng)網(wǎng)絡(luò)與遺傳算法的融合算法,并基于拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺對拖拉機(jī)田間旋耕作業(yè)質(zhì)量進(jìn)行實(shí)時(shí)預(yù)測與評價(jià),預(yù)測精度達(dá)96.77%,均方根誤差(RMSE)小于0.01,說明采用基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法的拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺預(yù)測評價(jià)拖拉機(jī)田間旋耕作業(yè)質(zhì)量可行。