蒲 強(qiáng) 陳苗苗 陶 濤 龔大剛 杜 鴻 鮮躍榮
(1成都大學(xué)信息科學(xué)與工程學(xué)院,四川成都 610106;2四川省閬中蠶種場(chǎng),四川閬中 637400)
傳統(tǒng)手工蠶桑生產(chǎn)效率低,在實(shí)際生產(chǎn)中蠶桑產(chǎn)業(yè)的歷史數(shù)據(jù)未能得到充分利用并用來(lái)指導(dǎo)現(xiàn)有的工作和研究。如何利用信息化技術(shù)提高蠶桑產(chǎn)業(yè)的智能化、自動(dòng)化生產(chǎn)及科研水平,是目前傳統(tǒng)蠶桑產(chǎn)業(yè)面臨的主要問(wèn)題。雖有研究提出了利用信息化手段改良傳統(tǒng)蠶桑產(chǎn)業(yè)的思路和舉措[1-2],也有研究將互聯(lián)網(wǎng)和物聯(lián)網(wǎng)應(yīng)用在蠶桑作業(yè)中[3-4],并利用信息化技術(shù)優(yōu)化家蠶育種中的某些關(guān)鍵問(wèn)題[5],但都沒(méi)有形成一個(gè)在蠶桑生產(chǎn)中系統(tǒng)利用信息化技術(shù)的整體解決方案,對(duì)蠶桑信息化系統(tǒng)的智能性和數(shù)據(jù)分析重視不夠。本文在傳統(tǒng)蠶桑生產(chǎn)中引入信息技術(shù),利用互聯(lián)網(wǎng)、大數(shù)據(jù)智能處理與分析,設(shè)計(jì)了一種基于數(shù)據(jù)分析的蠶桑智能系統(tǒng),可實(shí)現(xiàn)蠶桑數(shù)據(jù)的自動(dòng)采集、科學(xué)分析,用數(shù)據(jù)引導(dǎo)推動(dòng)蠶桑作業(yè)的精準(zhǔn)、高效、科學(xué)生產(chǎn)?,F(xiàn)將有關(guān)情況報(bào)告如下,供同仁參考。
蠶桑智能系統(tǒng)總體結(jié)構(gòu)由下向上分為基礎(chǔ)層、數(shù)據(jù)層、業(yè)務(wù)層和表示層等4層,系統(tǒng)總體結(jié)構(gòu)如圖1所示。蠶桑智能系統(tǒng)設(shè)計(jì)的原則如下:底層為上層提供網(wǎng)絡(luò)運(yùn)行支撐和蠶桑數(shù)據(jù)支撐;上層利用底層提供的網(wǎng)絡(luò)和數(shù)據(jù)服務(wù),進(jìn)行蠶桑業(yè)務(wù)管理和數(shù)據(jù)分析,并向用戶提供業(yè)務(wù)邏輯密切關(guān)聯(lián)的人機(jī)交互界面和蠶桑業(yè)務(wù)所需的智能計(jì)算、分析結(jié)果和決策建議,如作業(yè)報(bào)表、譜系圖和數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果和建議等。
圖1 蠶桑智能系統(tǒng)總體結(jié)構(gòu)
基礎(chǔ)層包括網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì),分為互聯(lián)網(wǎng)和物聯(lián)網(wǎng)2大部分,是蠶桑智能系統(tǒng)運(yùn)行的網(wǎng)絡(luò)基礎(chǔ)。服務(wù)器位于網(wǎng)絡(luò)中心,是蠶桑智能系統(tǒng)的中樞,提供數(shù)據(jù)庫(kù)、通訊、控制、數(shù)據(jù)分析等服務(wù);另外,基礎(chǔ)層還設(shè)計(jì)了數(shù)據(jù)自動(dòng)采集系統(tǒng),負(fù)責(zé)有關(guān)蠶桑作業(yè)數(shù)據(jù)的自動(dòng)采集任務(wù),與之相關(guān)的是各種客戶工位計(jì)算機(jī)、電子秤和傳感器?;A(chǔ)層負(fù)責(zé)數(shù)據(jù)采集、傳輸,為上層提供網(wǎng)絡(luò)運(yùn)行、通訊服務(wù)和數(shù)據(jù)自動(dòng)采集服務(wù)。
數(shù)據(jù)層包括數(shù)據(jù)庫(kù)管理系統(tǒng)和文件系統(tǒng),存儲(chǔ)蠶桑作業(yè)產(chǎn)生的數(shù)據(jù)和文檔,形成數(shù)據(jù)倉(cāng)庫(kù),是蠶桑業(yè)務(wù)工作和數(shù)據(jù)處理與分析的基礎(chǔ)。
業(yè)務(wù)層為蠶桑智能系統(tǒng)的核心平臺(tái),設(shè)計(jì)包括家蠶選種、品種保存、雜交鑒定、原種繁育等4大業(yè)務(wù)系統(tǒng)。在此基礎(chǔ)上,還設(shè)計(jì)了基于業(yè)務(wù)和底層數(shù)據(jù)上的各種智能系統(tǒng),如智能指標(biāo)系統(tǒng)、信息檢索系統(tǒng)、報(bào)表生成系統(tǒng)、大數(shù)據(jù)分析系統(tǒng)、物聯(lián)控制系統(tǒng)和滴灌系統(tǒng)。智能指標(biāo)系統(tǒng)從多個(gè)統(tǒng)計(jì)角度分析各類蠶桑數(shù)據(jù),有利于蠶桑工作人員合理選擇蠶桑指標(biāo)科學(xué)開(kāi)展蠶桑業(yè)務(wù),為蠶桑業(yè)務(wù)提供增值數(shù)據(jù)和智能決策;信息檢索系統(tǒng)可輔助蠶桑工作人員從海量數(shù)據(jù)中搜索對(duì)生產(chǎn)有用的數(shù)據(jù)資料指導(dǎo)蠶桑業(yè)務(wù);報(bào)表生成系統(tǒng)可靈活生成各類報(bào)表,將人從繁瑣易錯(cuò)的報(bào)表整理工作中解放出來(lái)。整個(gè)業(yè)務(wù)層核心平臺(tái)中,大數(shù)據(jù)分析系統(tǒng)是蠶桑智能系統(tǒng)的核心,物聯(lián)控制系統(tǒng)和滴灌系統(tǒng)可實(shí)現(xiàn)蠶室和桑園的自動(dòng)管理和環(huán)境控制。由于篇幅原因,以下僅以家蠶選種系統(tǒng)和大數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)為例進(jìn)行具體闡述。
2.3.1 家蠶選種系統(tǒng) 家蠶選種系統(tǒng)是蠶桑智能系統(tǒng)的核心業(yè)務(wù),內(nèi)容較多,其設(shè)計(jì)也成為業(yè)務(wù)層中的關(guān)鍵。家蠶選種系統(tǒng)包括選種管理子系統(tǒng)、智能選育子系統(tǒng)和選種譜系子系統(tǒng)(圖2)。(1)選種管理子系統(tǒng)。包括年季作業(yè)計(jì)劃和選種數(shù)據(jù)輸入2大模塊。年季作業(yè)計(jì)劃是每個(gè)年季整個(gè)家蠶選種系統(tǒng)的起始工作,后續(xù)工作的開(kāi)展和數(shù)據(jù)衍生都源于作業(yè)計(jì)劃,因此本模塊功能非常重要,設(shè)計(jì)時(shí)要充分考慮到作業(yè)計(jì)劃數(shù)據(jù)的加鎖功能,以防刪除計(jì)劃對(duì)后續(xù)管理工作造成嚴(yán)重不良影響。選種數(shù)據(jù)輸入模塊是選種原始數(shù)據(jù)輸入的主要模塊,包括出庫(kù)催青、飼育管理、繭質(zhì)調(diào)查、個(gè)體繭調(diào)查、母種交配型式、母種制種數(shù)據(jù)、原原種制種數(shù)據(jù)、卵質(zhì)調(diào)查、生物學(xué)性狀、區(qū)內(nèi)一??壗z、區(qū)間多??壗z等數(shù)據(jù)的輸入。設(shè)計(jì)時(shí)需要注意,業(yè)務(wù)數(shù)據(jù)根據(jù)其特點(diǎn)和需求彼此間在邏輯上關(guān)聯(lián)性很強(qiáng)。為了保證數(shù)據(jù)的真實(shí)性、正確性,本模塊需要設(shè)置大量的數(shù)據(jù)自動(dòng)檢查功能和關(guān)聯(lián)檢查功能,并且要做到一處數(shù)據(jù)的變動(dòng),多處數(shù)據(jù)都要隨之發(fā)生聯(lián)動(dòng)。這種數(shù)據(jù)邏輯上的關(guān)聯(lián)表示也保證了后續(xù)譜系的生成,智能選育工作、大數(shù)據(jù)分析和報(bào)表的數(shù)據(jù)能夠準(zhǔn)確引自本模塊的輸入數(shù)據(jù)。(2)智能選育子系統(tǒng)。包括選卵、蛾區(qū)選擇、品質(zhì)排隊(duì)、交配蛾區(qū)選配、個(gè)體繭選擇等模塊,各個(gè)模塊按照一定的規(guī)則和算法,由計(jì)算機(jī)自動(dòng)進(jìn)行智能選育工作,大大提高了家蠶選育工作的效率和準(zhǔn)確率。比如,蛾區(qū)選擇模塊按照蛾區(qū)選擇智能算法,自動(dòng)選擇母種當(dāng)選蛾區(qū)和原原種當(dāng)選蛾區(qū),并給出淘汰意見(jiàn)。品質(zhì)排隊(duì)模塊借助當(dāng)季系統(tǒng)自動(dòng)生成的當(dāng)選母種主要性狀成績(jī),對(duì)4齡結(jié)繭率、4齡健蛹率、普繭率、全繭量、繭層率、蔟中病死蠶率等指標(biāo),按照一定的算法規(guī)則進(jìn)行打分排隊(duì)。交配蛾區(qū)選配模塊在母種小系內(nèi),以品質(zhì)排隊(duì)結(jié)果為依據(jù),按照強(qiáng)強(qiáng)結(jié)合和異親異蛾交配的原則,采用成績(jī)優(yōu)良者優(yōu)先互交組合,智能選擇合理的交配型式,充分確保選育蠶種的雜種優(yōu)勢(shì)。(3)選種譜系子系統(tǒng)。自動(dòng)理清蠶種上下代親緣關(guān)系,借助各季系統(tǒng)生成的當(dāng)選母種及相交親本,生成能夠反映蠶種上下代親緣關(guān)系的譜系圖,并標(biāo)明母本及父本的主要性狀成績(jī),確保選育蠶種譜系清晰。
圖2 家蠶選種系統(tǒng)
2.3.2 大數(shù)據(jù)分析系統(tǒng) 大數(shù)據(jù)分析系統(tǒng)可以根據(jù)需要進(jìn)行數(shù)據(jù)分析,為蠶桑業(yè)務(wù)提供增值數(shù)據(jù)和智能決策,在蠶桑智能系統(tǒng)設(shè)計(jì)中占據(jù)絕對(duì)重要地位。大數(shù)據(jù)分析系統(tǒng)包含五大子系統(tǒng),即回歸建模子系統(tǒng)、數(shù)據(jù)統(tǒng)計(jì)子系統(tǒng)、方差分析子系統(tǒng)、相關(guān)分析子系統(tǒng)和品種性狀自動(dòng)評(píng)價(jià)子系統(tǒng)等(圖3)。(1)回歸建模子系統(tǒng)??梢詫?duì)選定年季范圍的某品種,設(shè)定任意一個(gè)性狀指標(biāo)作為因變量Y,然后根據(jù)選定的n個(gè)自變量性狀指標(biāo)[X=(x1,x2,…,xi…,xn),xi為第i個(gè)自變量性狀指標(biāo)]進(jìn)行回歸建模。對(duì)建立的回歸模型,可以進(jìn)行擬合分析,也可以用自變量性狀指標(biāo)預(yù)測(cè)未來(lái)年季的因變量指標(biāo)值。(2)數(shù)據(jù)統(tǒng)計(jì)子系統(tǒng)。對(duì)某個(gè)品種按年季跨度或某些年季區(qū)間,對(duì)所選性狀指標(biāo)進(jìn)行縱向或橫向的統(tǒng)計(jì)比較,明確選種和工作目標(biāo)。(3)方差分析子系統(tǒng)??梢詫?duì)多個(gè)品種,按不同(單個(gè))年季分析某個(gè)(多個(gè))生物學(xué)性狀指標(biāo)的差異顯著性;或?qū)δ硞€(gè)品種,分析多個(gè)生物學(xué)性狀指標(biāo)在不同年季下的差異顯著性。另外,在研究工作中對(duì)蠶桑獨(dú)立實(shí)驗(yàn)的數(shù)據(jù),也可以靈活進(jìn)行單因素、雙因素和多因素方差分析,分析實(shí)驗(yàn)結(jié)果,提高選種效率。(4)相關(guān)分析子系統(tǒng)。分析選定年季范圍內(nèi)的某一品種的多個(gè)生物學(xué)性狀指標(biāo)間的相關(guān)性,揭示性狀指標(biāo)間的強(qiáng)弱關(guān)系。(5)品種性狀自動(dòng)評(píng)價(jià)子系統(tǒng)。能智能靈活評(píng)價(jià)某一品種與其它品種在設(shè)定年季范圍內(nèi)的性狀指標(biāo),并自動(dòng)給出性狀趨勢(shì)的比較結(jié)果和品種間最終的性狀評(píng)價(jià)結(jié)論。
圖3 大數(shù)據(jù)分析系統(tǒng)
表示層提供了蠶桑業(yè)務(wù)操作和數(shù)據(jù)分析的人機(jī)交互功能,提供了蠶桑數(shù)據(jù)來(lái)源的操作界面和數(shù)據(jù)分析結(jié)果的顯示界面。包括業(yè)務(wù)操作界面、報(bào)表顯示打印系統(tǒng)、統(tǒng)計(jì)圖形系統(tǒng)、譜系系統(tǒng)和性狀評(píng)價(jià)系統(tǒng)。報(bào)表顯示打印系統(tǒng)顯示和打印蠶桑作業(yè)上報(bào)報(bào)表和存檔報(bào)表等。統(tǒng)計(jì)圖形系統(tǒng)提供數(shù)據(jù)統(tǒng)計(jì)結(jié)果的圖形顯示,包括柱狀圖、折線圖、回歸模型擬合診斷圖、回歸模型預(yù)測(cè)圖、性狀指標(biāo)散點(diǎn)圖矩陣、相關(guān)矩陣圖、相關(guān)系數(shù)表和性狀比較圖等。譜系系統(tǒng)和性狀評(píng)價(jià)系統(tǒng)分別給出具體的譜系圖和性狀評(píng)價(jià)結(jié)論。
蠶桑智能系統(tǒng)已在四川省閬中蠶種場(chǎng)使用了6季,據(jù)我們調(diào)查,蠶桑作業(yè)中的數(shù)據(jù)關(guān)聯(lián)檢查和自動(dòng)采集功能,減少了員工錄入數(shù)據(jù)的工作量,提高了數(shù)據(jù)的準(zhǔn)確性和生產(chǎn)效率,規(guī)范了操作程序,有效地保證了數(shù)據(jù)的及時(shí)性和真實(shí)性;使用物聯(lián)網(wǎng)滴灌技術(shù)的桑園單位面積桑葉增產(chǎn)17%左右;蠶桑數(shù)據(jù)處理、大數(shù)據(jù)分析和報(bào)表生成,大大提高了生產(chǎn)效率,完成了傳統(tǒng)紙質(zhì)數(shù)據(jù)無(wú)法完成的工作。隨著存檔歷史數(shù)據(jù)的不斷豐富,大數(shù)據(jù)統(tǒng)計(jì)分析和譜系生成已顯示了重要作用,為蠶桑作業(yè)和研究提供了數(shù)據(jù)指導(dǎo)、數(shù)據(jù)支撐和決策建議。由于篇幅原因,下面選擇蠶桑智能系統(tǒng)中6個(gè)有代表性的模塊,從數(shù)據(jù)自動(dòng)采集/輸入、個(gè)體繭智能選擇、蛾區(qū)智能選擇、選種譜系、數(shù)據(jù)統(tǒng)計(jì)和回歸建模等模塊的使用情況,簡(jiǎn)要說(shuō)明系統(tǒng)的典型應(yīng)用效果以及蠶桑智能系統(tǒng)的典型模塊的工作情況。
圖4為家蠶選種系統(tǒng)的選種管理子系統(tǒng)的數(shù)據(jù)輸入模塊的使用情況,具體為區(qū)內(nèi)一??壗z數(shù)據(jù)自動(dòng)采集/輸入情況。從圖4可以看出,輸入工作可以根據(jù)需要,選擇人工輸入或者自動(dòng)從電子秤采集數(shù)據(jù)(電子秤精度可根據(jù)需要設(shè)置)。對(duì)于一粒繅絲業(yè)務(wù)而言,還可以設(shè)置疵點(diǎn)系數(shù)并計(jì)算年季所有品種的凈度。
圖4 2019年春季“芳”的一??壗z數(shù)據(jù)自動(dòng)采集/輸入圖
圖5為家蠶選種系統(tǒng)的智能選育子系統(tǒng)的個(gè)體繭智能選擇模塊的使用情況。從圖5可以看出,選繭時(shí)可分別設(shè)置雌雄個(gè)體繭選擇指標(biāo),按照智能淘汰算法自動(dòng)選擇后,將給出品種飼育區(qū)淘汰的雌雄繭號(hào),淘汰數(shù)量和淘汰比率,方便工作人員快速剔除對(duì)應(yīng)淘汰繭號(hào)的蠶繭。
圖5 2019年春季“7532A”的個(gè)體繭智能選擇圖
圖6為家蠶選種系統(tǒng)的智能選育子系統(tǒng)的蛾區(qū)智能選擇模塊的使用情況。從圖6可以看出,選擇蛾區(qū)時(shí)可根據(jù)需要設(shè)置各小系蛾區(qū)的當(dāng)選數(shù)量、指標(biāo)比例和指標(biāo)權(quán)重,然后按照蛾區(qū)智能選擇算法從供選蛾區(qū)中自動(dòng)選擇規(guī)定數(shù)量的母種蛾區(qū)和原原種蛾區(qū),并以不同顏色標(biāo)注,同時(shí)給出蛾區(qū)淘汰意見(jiàn)。蛾區(qū)智能選擇克服了手動(dòng)選擇慢,靠經(jīng)驗(yàn)選擇導(dǎo)致的不科學(xué)、不準(zhǔn)確問(wèn)題。
圖6 2018年春季“7532A”的蛾區(qū)智能選擇圖
圖7為家蠶選種系統(tǒng)的選種譜系子系統(tǒng)的使用情況。從圖7可以看出,設(shè)置品種和起始年季后,系統(tǒng)能按照小系查找選擇年季間所有的上下代親緣關(guān)系,并用譜系圖形的方式繪制出來(lái)。由于譜系圖對(duì)家蠶繁育具有重要的意義,如果沒(méi)有計(jì)算機(jī)自動(dòng)繪制譜系圖,僅靠人工畫(huà)譜系圖,在蠶種譜系年季跨度很大的情況下,則難以理清蠶種譜系正確的上下代親緣關(guān)系。計(jì)算機(jī)自動(dòng)繪制的樹(shù)狀譜系圖,能夠清晰、正確地反映蠶種的上下代親緣關(guān)系。
圖7 2016年早秋至2017年早秋“白”的C小系譜系圖
圖8為大數(shù)據(jù)分析系統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)模塊使用情況,是對(duì)品種“781B”的3個(gè)年季(即2017年早秋蠶期、2018年春蠶期、2018年早秋蠶期)的蔟中病死蠶率、半病態(tài)繭率和同宮繭率等3個(gè)統(tǒng)計(jì)指標(biāo)平均成績(jī)的統(tǒng)計(jì)調(diào)查比較結(jié)果。從圖8可以看出,模塊按照選擇的統(tǒng)計(jì)年季,統(tǒng)計(jì)比較選擇的指標(biāo)并以選定的某種圖形方式顯示比較結(jié)果,據(jù)此分析品種某個(gè)性狀指標(biāo)的發(fā)展趨勢(shì),以便做出科學(xué)決策,加快蠶品種的選育進(jìn)程。
圖8 2017—2018年3個(gè)年季“781B”的蔟中病死蠶率、半病態(tài)繭率和同宮繭率平均成績(jī)比較圖
圖9為大數(shù)據(jù)分析系統(tǒng)的回歸建模模塊使用情況。從圖9可以看出,可以選擇某個(gè)指標(biāo)作為預(yù)測(cè)分析的因變量指標(biāo),再根據(jù)實(shí)際業(yè)務(wù)選擇自變量指標(biāo),進(jìn)行回歸建模,發(fā)現(xiàn)因變量和自變量間的某種線性關(guān)系。模型可以進(jìn)行擬合分析,檢查回歸建模的合理性。更重要的是系統(tǒng)可以根據(jù)建立的回歸模型對(duì)因變量指標(biāo)值進(jìn)行預(yù)測(cè)。
圖9 “734”的回歸建模與預(yù)測(cè)圖
本文在傳統(tǒng)蠶桑作業(yè)中引入信息技術(shù),利用互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)處理與分析等技術(shù),設(shè)計(jì)了基于數(shù)據(jù)分析的蠶桑智能系統(tǒng),該系統(tǒng)以蠶桑業(yè)務(wù)為主要內(nèi)容,提供了業(yè)務(wù)邏輯上密切聯(lián)系的數(shù)據(jù)表示方式,設(shè)計(jì)了蠶桑業(yè)務(wù)智能算法對(duì)蠶桑數(shù)據(jù)進(jìn)行處理和分析,并產(chǎn)生圖形和文字等分析結(jié)果。實(shí)際應(yīng)用表明,蠶桑智能系統(tǒng)有效地實(shí)現(xiàn)和指導(dǎo)了蠶桑精準(zhǔn)、高效、科學(xué)生產(chǎn),有助于推動(dòng)現(xiàn)代蠶桑產(chǎn)業(yè)的發(fā)展。