于春花 王玉璽 邱 軍 曾 波 楊 鋒 王曉鋒 閆寶岐 楊 碩 丁歡歡 葛 曉 王開義
(1 北京市農(nóng)林科學(xué)院信息技術(shù)研究中心,北京 100097;2 全國農(nóng)業(yè)技術(shù)推廣服務(wù)中心,北京 100125)
國家品種審定制度是保障我國種源自主可控的重要支撐,也是農(nóng)作物育種產(chǎn)業(yè)化應(yīng)用的關(guān)鍵環(huán)節(jié)。品種試驗(yàn)作為國家品種審定的重要組成部分,是新品種審定與推廣的基礎(chǔ)和依據(jù),有利于生產(chǎn)用種的安全[1]。品種試驗(yàn)包括區(qū)域試驗(yàn)、生產(chǎn)試驗(yàn)及品種特異性、一致性、穩(wěn)定性測試(《主要農(nóng)作物品種審定辦法》)。每年度五大農(nóng)作物大約有800 多個(gè)試驗(yàn)站承擔(dān)公益性田間試驗(yàn),從業(yè)人員包括數(shù)據(jù)采集人員、試驗(yàn)主持人等,流程上包括田間采集、數(shù)據(jù)保存、數(shù)據(jù)監(jiān)管、數(shù)據(jù)匯總等環(huán)節(jié),形成了復(fù)雜的數(shù)據(jù)收集體系。在數(shù)據(jù)采集層面,試驗(yàn)點(diǎn)對標(biāo)準(zhǔn)的理解及記載方法有差異,相同性狀的單位或者分級不一致,導(dǎo)致底層數(shù)據(jù)不統(tǒng)一。在電子化保存方面,試驗(yàn)點(diǎn)數(shù)據(jù)的錄入容易出錯(cuò),Excel 也不能對數(shù)據(jù)正確性進(jìn)行主動(dòng)檢驗(yàn);在數(shù)據(jù)匯總時(shí),要花費(fèi)大量的時(shí)間核查試驗(yàn)點(diǎn)數(shù)據(jù),重新整理數(shù)據(jù),并在Excel 表中編寫不同公式對多個(gè)試驗(yàn)點(diǎn)填報(bào)的性狀數(shù)據(jù)進(jìn)行計(jì)算、匯總,整個(gè)過程繁瑣、效率低。在數(shù)據(jù)監(jiān)管層面,數(shù)據(jù)分級報(bào)送方式,導(dǎo)致試驗(yàn)管理部門、試驗(yàn)執(zhí)行部門很難查看即時(shí)數(shù)據(jù),不利于品種試驗(yàn)過程的監(jiān)管。因此針對以上問題,農(nóng)作物品種試驗(yàn)數(shù)據(jù)管理平臺(以下簡稱平臺)的開發(fā)和應(yīng)用,能夠較好地推動(dòng)品種試驗(yàn)信息化技術(shù)標(biāo)準(zhǔn),提高品種試驗(yàn)質(zhì)量,保障底層數(shù)據(jù)質(zhì)量。
信息技術(shù)已經(jīng)應(yīng)用到農(nóng)業(yè)很多方面。在育種方面,Han 等[2-3]基于云體系結(jié)構(gòu),研發(fā)了作物育種信息管理系統(tǒng),可以高效地管理育種材料并進(jìn)行家譜跟蹤,進(jìn)一步計(jì)算親本的一般配合力和特殊配合力,為親本選擇和組合選擇提供了依據(jù)。李建新等[4]基于LNMP(Linux 平臺+Nginx 服務(wù)器軟件+MySQL數(shù)據(jù)庫管理系統(tǒng)+PHP 超文本預(yù)處理軟件),創(chuàng)建了玉米品種及其親本系譜數(shù)據(jù)庫。在主要農(nóng)作物品種審定、非主要農(nóng)作物品種登記以及品種權(quán)保護(hù)方面,分別有品種審定數(shù)據(jù)管理系統(tǒng)、非主要農(nóng)作物品種登記管理系統(tǒng)和植物新品種保護(hù)管理系統(tǒng),實(shí)現(xiàn)了農(nóng)作物品種保護(hù)、審定、登記的信息化管理。
但在品種試驗(yàn)方面,大部分的研究還集中在試驗(yàn)結(jié)果分析、試驗(yàn)設(shè)計(jì)優(yōu)化等方面,利用信息技術(shù)實(shí)現(xiàn)品種試驗(yàn)全流程的管理很少。如劉太國等[5]、胡學(xué)旭等[6]、宋曉霞等[7]利用參試品種,在抗病性、品質(zhì)變化、品種的主要系譜和生產(chǎn)潛力方面進(jìn)行了分析研究。高輝明等[8]、姚金保等[9]利用多年區(qū)試中對照品種和參試品種的資料,研究了品種表現(xiàn)與環(huán)境之間的關(guān)系。許乃銀等[10-11]采用GGE 雙標(biāo)圖方法對皮棉產(chǎn)量、綜合評價(jià)品種選擇指數(shù)的鑒別力、代表性、理想指數(shù)等進(jìn)行了分析和綜合評價(jià)。張毅等[12]提出了北部冬麥區(qū)農(nóng)作物品種區(qū)域試驗(yàn)的重復(fù)次數(shù)和試點(diǎn)數(shù)量的優(yōu)化設(shè)計(jì)方案。劉哲等[13]利用區(qū)試數(shù)據(jù)和調(diào)查數(shù)據(jù),在縣域精細(xì)尺度下,研究作物品種種植適宜性精細(xì)區(qū)劃方法。許乃銀等[14]、馮勇等[15]利用Excel 自帶的數(shù)據(jù)功能實(shí)現(xiàn)了試驗(yàn)點(diǎn)數(shù)據(jù)的規(guī)范以及匯總報(bào)告中“品種評述”的自動(dòng)生成。王虎等[16]、葉思菁等[17]利用移動(dòng)端、GIS 技術(shù)實(shí)現(xiàn)了作物大田測試數(shù)據(jù)、環(huán)境數(shù)據(jù)的采集。也有少部分學(xué)者利用信息技術(shù)研發(fā)了專門的系統(tǒng),分別用于“品種評述”、試驗(yàn)數(shù)據(jù)預(yù)處理以及數(shù)據(jù)分析等環(huán)節(jié)[18-19],但是未涉及品種試驗(yàn)全流程的管理,普及度也不夠高。
農(nóng)作物品種試驗(yàn)數(shù)據(jù)管理平臺將信息技術(shù)、數(shù)據(jù)庫技術(shù)等運(yùn)用到品種試驗(yàn)過程,構(gòu)建品種試驗(yàn)信息化管理流程,實(shí)現(xiàn)品種試驗(yàn)的全流程可跟蹤、數(shù)據(jù)可追溯、性狀可重現(xiàn),實(shí)時(shí)上報(bào)、實(shí)時(shí)監(jiān)督,提升數(shù)據(jù)上報(bào)及時(shí)性和準(zhǔn)確性,規(guī)范了試驗(yàn)數(shù)據(jù)。
1.1 品種試驗(yàn)管理模式品種試驗(yàn)由試驗(yàn)管理部門組織實(shí)施,試驗(yàn)點(diǎn)管理部門協(xié)助開展品種試驗(yàn)監(jiān)督管理相關(guān)工作。試驗(yàn)方案執(zhí)行部門負(fù)責(zé)協(xié)助制定試驗(yàn)實(shí)施方案、開展試驗(yàn)監(jiān)督檢查和技術(shù)培訓(xùn),監(jiān)督指導(dǎo)各試點(diǎn)品種試驗(yàn),起草試驗(yàn)總結(jié)報(bào)告。試驗(yàn)點(diǎn)按照試驗(yàn)實(shí)施方案開展品種試驗(yàn),接受試驗(yàn)管理部門、試驗(yàn)點(diǎn)管理部門和試驗(yàn)方案執(zhí)行部門的監(jiān)督指導(dǎo),及時(shí)提交客觀、準(zhǔn)確的試驗(yàn)數(shù)據(jù)和總結(jié)報(bào)告,做好品種試驗(yàn)資料留檔。
1.2 品種試驗(yàn)信息化流程分析根據(jù)品種試驗(yàn)管理模式,平臺設(shè)置4 個(gè)角色類型,明確各角色職責(zé)范圍的業(yè)務(wù)及業(yè)務(wù)流程:(1)試驗(yàn)管理部門:審核初試品種,制定試驗(yàn)實(shí)施方案,對品種試驗(yàn)過程、數(shù)據(jù)及匯總數(shù)據(jù)進(jìn)行監(jiān)督。(2)試驗(yàn)執(zhí)行部門:評級已參試品種,制定生態(tài)區(qū)組方案,生成試驗(yàn)任務(wù)下發(fā)試驗(yàn)點(diǎn)人員進(jìn)行數(shù)據(jù)錄入,監(jiān)管試驗(yàn)過程、數(shù)據(jù)并進(jìn)行試驗(yàn)數(shù)據(jù)匯總,形成匯總報(bào)告。(3)試驗(yàn)點(diǎn)管理部門:監(jiān)管權(quán)限內(nèi)試驗(yàn)點(diǎn)。(4)試驗(yàn)點(diǎn):根據(jù)下發(fā)的試驗(yàn)任務(wù)種植品種,采集性狀數(shù)據(jù)、圖片后上傳,遇到試驗(yàn)異常情況報(bào)備給試驗(yàn)方案執(zhí)行部門,試驗(yàn)結(jié)束后編寫年終報(bào)告并提交。
平臺采用B/S 架構(gòu),以O(shè)racle 關(guān)系型數(shù)據(jù)庫、Java 語言為開發(fā)工具。平臺不同角色的權(quán)限不同,登錄平臺后,不同角色看到的功能以及數(shù)據(jù)由權(quán)限決定。平臺整體架構(gòu)見圖1,分4 層:(1)數(shù)據(jù)采集層,包括通過平臺上傳數(shù)據(jù)及田間采集設(shè)備(簡稱PDA)、考種設(shè)備等外接設(shè)備采集數(shù)據(jù);(2)數(shù)據(jù)存儲層:根據(jù)不同數(shù)據(jù)的特性分為參試品種數(shù)據(jù)、試驗(yàn)方案數(shù)據(jù)、品種性狀數(shù)據(jù)、異常報(bào)備數(shù)據(jù)以及圖片數(shù)據(jù)。(3)數(shù)據(jù)處理層:用戶權(quán)限驗(yàn)證用于過濾不同角色的用戶登錄平臺后使用的功能及數(shù)據(jù);品種參試驗(yàn)證用于品種申報(bào)時(shí)品種信息的驗(yàn)證;試驗(yàn)方案制定、試驗(yàn)任務(wù)生成用于分配試驗(yàn)任務(wù)到具體試驗(yàn)點(diǎn);試驗(yàn)數(shù)據(jù)上報(bào)用于試驗(yàn)點(diǎn)將性狀數(shù)據(jù)、圖片數(shù)據(jù)上傳到平臺;試驗(yàn)數(shù)據(jù)匯總用于多點(diǎn)數(shù)據(jù)的處理與分析。(4)數(shù)據(jù)應(yīng)用層:包括試驗(yàn)性狀和圖片數(shù)據(jù)查詢、試驗(yàn)過程監(jiān)督、試驗(yàn)點(diǎn)年終報(bào)告和匯總報(bào)告的生成、試驗(yàn)數(shù)據(jù)的總體分析。
圖1 平臺架構(gòu)
3.1 平臺功能在平臺架構(gòu)設(shè)計(jì)基礎(chǔ)上開發(fā)了一級功能模塊8 個(gè):(1)品種管理:管理參試品種的基本信息、評級信息,并實(shí)現(xiàn)品種查詢。(2)方案管理:制定品種試驗(yàn)實(shí)施方案,包括各生態(tài)區(qū)組試驗(yàn)品種分組、大田試驗(yàn)的試驗(yàn)點(diǎn)、需要鑒定的抗性品質(zhì)項(xiàng)目和鑒定單位以及試驗(yàn)任務(wù)生成。(3)數(shù)據(jù)管理:主要用于試驗(yàn)過程中品種性狀數(shù)據(jù)和圖片錄入、查看、編輯;異常情況的報(bào)備與審核,試點(diǎn)報(bào)告提交與審核。(4)數(shù)據(jù)匯總:由試驗(yàn)執(zhí)行部門對所管轄生態(tài)區(qū)組所有試驗(yàn)進(jìn)行試點(diǎn)/品種剔除、數(shù)據(jù)處理、分析、匯總,最終生成匯總報(bào)告。(5)統(tǒng)計(jì)監(jiān)督:用于品種試驗(yàn)過程進(jìn)度把握及運(yùn)行數(shù)據(jù)統(tǒng)計(jì)。(6)基礎(chǔ)數(shù)據(jù):用于支撐整個(gè)平臺運(yùn)行的基礎(chǔ)類數(shù)據(jù),包括性狀、生態(tài)區(qū)組、試驗(yàn)點(diǎn)、性狀單位、報(bào)告模板管理等。(7)系統(tǒng)管理:用于角色權(quán)限配置、用戶信息管理。(8)培訓(xùn)資料:用于各角色操作手冊上傳、下載。
3.2 實(shí)現(xiàn)了品種試驗(yàn)標(biāo)準(zhǔn)的數(shù)字化品種試驗(yàn)的核心目標(biāo)是獲得多年多點(diǎn)品種的性狀數(shù)據(jù),以此數(shù)據(jù)來評價(jià)品種的產(chǎn)量、抗性、適應(yīng)性等內(nèi)容,因此高質(zhì)量的數(shù)據(jù)是評價(jià)的保證。首先,對各作物品種試驗(yàn)技術(shù)規(guī)范、歷史數(shù)據(jù)進(jìn)行研究,梳理了各作物需要采集的性狀以及不同生態(tài)區(qū)組間的操作差異,在作物范圍內(nèi)對相同性狀進(jìn)行名稱、采集標(biāo)準(zhǔn)的規(guī)范統(tǒng)一,并對性狀的數(shù)據(jù)類型、采集階段、多點(diǎn)間性狀處理等屬性做了詳細(xì)規(guī)定。其次,統(tǒng)一了多年數(shù)據(jù)處理、數(shù)據(jù)匯總的方法以及試驗(yàn)點(diǎn)、品種數(shù)據(jù)的質(zhì)量指標(biāo)。最后,統(tǒng)一了年終報(bào)告以及匯總報(bào)告的體例、展示內(nèi)容。以上內(nèi)容的統(tǒng)一,大幅度提高了數(shù)據(jù)的科學(xué)性、準(zhǔn)確性,實(shí)現(xiàn)了不同生態(tài)區(qū)組間、不同年份間、不同試驗(yàn)點(diǎn)間在空間、時(shí)間維度上數(shù)據(jù)的統(tǒng)一。
3.3 實(shí)現(xiàn)了試驗(yàn)進(jìn)度的監(jiān)督管理在試驗(yàn)過程中,數(shù)據(jù)的及時(shí)上報(bào)與監(jiān)督有助于管理層實(shí)時(shí)掌握試驗(yàn)情況,按照以往管理方式,方案執(zhí)行部門和管理部門只有在試驗(yàn)點(diǎn)提交年終報(bào)告后才能看到試驗(yàn)數(shù)據(jù)。平臺根據(jù)各區(qū)性狀設(shè)置預(yù)警時(shí)間,在數(shù)據(jù)最佳上報(bào)時(shí)間跟蹤提醒,促進(jìn)試驗(yàn)點(diǎn)在各生育期采集數(shù)據(jù)后及時(shí)上報(bào)性狀數(shù)據(jù)、圖片以及田間施肥等栽培信息,管理層可在平臺查詢各生育期數(shù)據(jù),實(shí)時(shí)掌握試驗(yàn)品種田間生長情況、各試驗(yàn)點(diǎn)數(shù)據(jù)的上報(bào)情況,及時(shí)給予相應(yīng)指導(dǎo),保證試驗(yàn)順利實(shí)施。圖2 為數(shù)據(jù)監(jiān)督查看相關(guān)功能。
圖2 數(shù)據(jù)監(jiān)督查看
3.4 構(gòu)建了品種試驗(yàn)全流程信息化管理體系在業(yè)務(wù)上,平臺構(gòu)建了從試驗(yàn)品種申請、品種審核、試驗(yàn)方案制定、田間數(shù)據(jù)填報(bào)、田間數(shù)據(jù)審核、數(shù)據(jù)處理分析、數(shù)據(jù)匯總的信息化全流程管理(圖3),明確在各業(yè)務(wù)階段不同角色的職責(zé)范疇,并根據(jù)不同角色職責(zé)分配相應(yīng)功能權(quán)限以及數(shù)據(jù)權(quán)限。在品種試驗(yàn)周期上,構(gòu)建了試驗(yàn)第1 年到完成試驗(yàn)程序多年試驗(yàn)流程以及各年度品種全生育期周期的性狀數(shù)據(jù)、參試信息的信息化,實(shí)現(xiàn)了品種試驗(yàn)的全流程可跟蹤、數(shù)據(jù)可追溯、性狀可重現(xiàn)。
圖3 信息化業(yè)務(wù)流程
4.1 平臺運(yùn)行數(shù)據(jù)農(nóng)作物品種試驗(yàn)數(shù)據(jù)管理平臺實(shí)現(xiàn)了從品種到試驗(yàn)方案,到數(shù)據(jù)填報(bào)匯總分析,再到數(shù)據(jù)監(jiān)督的規(guī)范化、標(biāo)準(zhǔn)化、信息化管理。平臺從2017 年開始示范實(shí)施,截止到2021 年,覆蓋五大農(nóng)作物全部生態(tài)區(qū)組,累計(jì)管理公益性試驗(yàn)參試品種5000 多個(gè)、試驗(yàn)點(diǎn)1000 多個(gè),生成試驗(yàn)12224 條、試驗(yàn)點(diǎn)年終報(bào)告6422 份、匯總報(bào)告407 份,采集圖片數(shù)超35 萬張,采集性狀數(shù)(包括公益性試驗(yàn)、聯(lián)合體、綠色通道3 個(gè)渠道)約2000 多萬條,構(gòu)建了國內(nèi)渠道權(quán)威、數(shù)據(jù)標(biāo)準(zhǔn)、管理規(guī)范的農(nóng)作物品種表型數(shù)據(jù)庫,為種業(yè)大數(shù)據(jù)的建設(shè)提供了重要支撐。
4.2 信息化流程的建立促進(jìn)了業(yè)務(wù)流、數(shù)據(jù)流的優(yōu)化農(nóng)作物品種試驗(yàn)信息化的關(guān)鍵是構(gòu)建業(yè)務(wù)流程和數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一。首先,研究試驗(yàn)的業(yè)務(wù)過程及關(guān)鍵階段、角色劃分、各角色功能和數(shù)據(jù)權(quán)限、應(yīng)用場景,建立科學(xué)合理的階段與角色職責(zé),實(shí)現(xiàn)線下業(yè)務(wù)向線上業(yè)務(wù)的轉(zhuǎn)變。其次,本平臺在性狀采集、圖片采集、報(bào)告格式及報(bào)告內(nèi)容、數(shù)據(jù)處理、數(shù)據(jù)分析方面建立了作物內(nèi)統(tǒng)一的標(biāo)準(zhǔn),性狀標(biāo)準(zhǔn)、數(shù)據(jù)處理標(biāo)準(zhǔn)、數(shù)據(jù)分析標(biāo)準(zhǔn)使得性狀數(shù)據(jù)在試驗(yàn)點(diǎn)間、年度間、不同區(qū)組間都具有可比性以及更好的分析性,顯著提高了數(shù)據(jù)質(zhì)量。通過平臺的使用,把品種試驗(yàn)各環(huán)節(jié)對業(yè)務(wù)及角色的要求固化到平臺,促進(jìn)各角色理解各自的職責(zé)范疇,使得品種試驗(yàn)業(yè)務(wù)更為規(guī)范流暢,形成優(yōu)質(zhì)的業(yè)務(wù)流,進(jìn)一步產(chǎn)生優(yōu)質(zhì)數(shù)據(jù)流,試驗(yàn)數(shù)據(jù)更加準(zhǔn)確規(guī)范。
4.3 作為表型數(shù)據(jù)庫參與種業(yè)大數(shù)據(jù)聯(lián)合分析植物表型組學(xué)是在基因組水平上系統(tǒng)研究植物或細(xì)胞在不同環(huán)境條件下所有表型的學(xué)科,包括空間尺度以及整個(gè)生育期的時(shí)間維度上的信息[20]。品種試驗(yàn)采用多年多點(diǎn)方式,在多個(gè)年度間、多個(gè)地理環(huán)境下種植,可收集到品種在不同年度、不同環(huán)境下的品種個(gè)體、群體以及整個(gè)生育期的多維度的數(shù)據(jù),加上平臺對數(shù)據(jù)規(guī)范的硬約束,保證了數(shù)據(jù)的準(zhǔn)確性、高質(zhì)量,可作為表型數(shù)據(jù)庫,具有很強(qiáng)的可利用價(jià)值。
在數(shù)據(jù)利用上,通過平臺中品種在產(chǎn)量、抗性、品質(zhì)等性狀上的變化,研究品種審定的發(fā)展趨勢,為育種家制定育種目標(biāo)提供參考。此外,聯(lián)合試驗(yàn)過程中氣象試驗(yàn)站采集的環(huán)境氣象數(shù)據(jù),可進(jìn)行品種環(huán)境適應(yīng)性分析,為品種適宜推廣區(qū)域做參考。結(jié)合基因型、環(huán)境數(shù)據(jù)進(jìn)行聯(lián)合分析,對揭示作物生命科學(xué)規(guī)律、提高作物功能基因組學(xué)和分子育種研究水平等具有重大意義[21]。