張 莉,王福建
(中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所,北京 100081)
馬鈴薯(SolanumtuberosumL.)屬茄科,又名土豆、山藥、洋芋、荷蘭薯等,是世界上第4大糧食作物,僅次于水稻、小麥、玉米。我國(guó)是世界上馬鈴薯生產(chǎn)大國(guó),2017年全國(guó)種植面積560萬(wàn)hm2,年總產(chǎn)量達(dá)9 682萬(wàn)t,產(chǎn)量占世界總產(chǎn)量的約1/4[1-2]。馬鈴薯是我國(guó)重要的糧菜兼用和工業(yè)原料作物,對(duì)國(guó)民經(jīng)濟(jì)的發(fā)展起著重要的作用[3]。優(yōu)良的品種是農(nóng)作物獲得優(yōu)質(zhì)高產(chǎn)的最基本生產(chǎn)資料,而優(yōu)異的馬鈴薯種質(zhì)資源是優(yōu)良品種選育和遺傳學(xué)研究的基礎(chǔ),為此世界各國(guó)都非常重視種質(zhì)資源的搜集、保護(hù)和數(shù)據(jù)庫(kù)建設(shè),如國(guó)際馬鈴薯中心(International Potato Center,CIP)、美國(guó)馬鈴薯基因庫(kù)(National Research Support Project-6,NRSP-6)、荷蘭遺傳資源中心(The Centrefor Genetic Resources,the Netherlands,CGN)、德國(guó)馬鈴薯種質(zhì)資源庫(kù)(The IPK Potatocollections at Gross Luesewitz,GLKS)等。近些年我國(guó)各研究單位也加緊了對(duì)馬鈴薯種質(zhì)資源的收集、引進(jìn)和保存,建立了相應(yīng)的數(shù)據(jù)庫(kù)。如貴州馬鈴薯種質(zhì)資源數(shù)據(jù)庫(kù)、克山馬鈴薯種質(zhì)資源庫(kù)管理系統(tǒng)、湖北省馬鈴薯種質(zhì)資源庫(kù)、國(guó)家農(nóng)作物種質(zhì)資源平臺(tái)等。
對(duì)國(guó)內(nèi)種質(zhì)資源數(shù)據(jù)庫(kù)的結(jié)構(gòu)、檢索分類(lèi),描述的規(guī)范性、完整性、準(zhǔn)確性,以及信息共享性等方面進(jìn)行調(diào)查分析,發(fā)現(xiàn)如下一些問(wèn)題。國(guó)內(nèi)馬鈴薯等種質(zhì)資源保存分散,缺乏保存完整的馬鈴薯種質(zhì)資源大庫(kù);國(guó)內(nèi)雖然對(duì)大部分資源進(jìn)行了農(nóng)藝性狀、抗性、品質(zhì)等方面評(píng)價(jià)鑒定,但相對(duì)粗放,缺乏健全完整的種質(zhì)資源大數(shù)據(jù)信息;各地馬鈴薯種質(zhì)資源數(shù)據(jù)庫(kù)因建庫(kù)時(shí)間久遠(yuǎn),造成了信息兼容性較差,不能共享,資源材料的血緣關(guān)系混雜,甚至有些數(shù)據(jù)庫(kù)不能運(yùn)行;種質(zhì)資源信息大部分不完整,使用者對(duì)于每份資源很難得到全面的信息,不斷重復(fù)鑒定評(píng)價(jià),浪費(fèi)大量人力、物力、財(cái)力;大部分種質(zhì)資源信息缺乏整個(gè)作物生育期的完整圖片資料。因此,構(gòu)建國(guó)家馬鈴薯種質(zhì)資源大數(shù)據(jù)庫(kù)系統(tǒng),建立資源統(tǒng)一標(biāo)識(shí)、規(guī)范性描述,對(duì)收集、保存的種質(zhì)資源進(jìn)行有效信息化管理,提供集成查詢(xún)服務(wù)、數(shù)據(jù)分析服務(wù),推動(dòng)國(guó)家馬鈴薯種質(zhì)資源的共享和利用,提高種質(zhì)資源的利用率和效益顯得尤為重要。
以中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所、國(guó)際馬鈴薯中心亞太中心、湖北馬鈴薯種質(zhì)資源庫(kù)、黑龍江克山國(guó)家馬鈴薯試管苗種質(zhì)庫(kù)馬鈴薯種質(zhì)資源庫(kù)數(shù)據(jù)為基礎(chǔ),運(yùn)用現(xiàn)代的信息技術(shù)、計(jì)算機(jī)技術(shù)和編程技術(shù),對(duì)原有服務(wù)模式整合、改進(jìn)、延伸和創(chuàng)新,構(gòu)建國(guó)家薯類(lèi)作物研究中心馬鈴薯種質(zhì)資源數(shù)據(jù)庫(kù),提供集成查詢(xún)服務(wù)、個(gè)性服務(wù)、數(shù)據(jù)分析服務(wù)、追蹤性服務(wù)和合作創(chuàng)新服務(wù)模式,推動(dòng)馬鈴薯種質(zhì)資源的共享和利用,提高種質(zhì)資源的利用率和效益,為實(shí)現(xiàn)馬鈴薯種質(zhì)資源標(biāo)準(zhǔn)化描述、信息化管理提供一種規(guī)范化的強(qiáng)大管理工具。
系統(tǒng)工作原理如圖1所示[4-5]。系統(tǒng)模塊框架如圖2所示[5]。
采用Microsoft VB 6.0中文版編程語(yǔ)言,設(shè)計(jì)可視化易操作的界面,結(jié)合育種家、種質(zhì)資源管理專(zhuān)業(yè)人員的經(jīng)驗(yàn),開(kāi)發(fā)系統(tǒng)。選擇數(shù)據(jù)庫(kù)的原則是該數(shù)據(jù)庫(kù)既要具有良好的安全性、可移植性和較快的數(shù)據(jù)查詢(xún)功能等,還要考慮系統(tǒng)用戶(hù)使用的方便性等。目前,市場(chǎng)上比較流行的數(shù)據(jù)庫(kù)系統(tǒng)有Oracle、SQL Server、Sybase、MySQL、Access等,綜合要完成的數(shù)據(jù)庫(kù)管理存儲(chǔ)功能和系統(tǒng)未來(lái)使用者的實(shí)際情況,選擇SQL Server,其在通用性、安全性、價(jià)格等方面有一定優(yōu)勢(shì),廣泛應(yīng)用于中大型數(shù)據(jù)庫(kù)建設(shè)要求。
圖1 系統(tǒng)工作原理Fig.1 System working principle
圖2 系統(tǒng)模塊框架Fig.2 System module framework
注冊(cè)登錄模塊:用戶(hù)需要注冊(cè)登錄后才能使用前臺(tái)客戶(hù)端全部功能。
主界面模塊:軟件與用戶(hù)交互的最直接層,引導(dǎo)用戶(hù)完成相應(yīng)的操作,起到向?qū)У淖饔?。主要包括?biāo)題欄、工具欄、選擇菜單、軟件版本信息等。
種質(zhì)資源數(shù)據(jù)查詢(xún)模塊:可多組合、跨性狀、準(zhǔn)確地進(jìn)行查詢(xún),用戶(hù)以獲取需要的信息。
種質(zhì)資源照片模塊:按照作物統(tǒng)一編號(hào)瀏覽查詢(xún)某份種質(zhì)資源在各個(gè)生育期的匹配圖片信息。
種質(zhì)資源數(shù)據(jù)統(tǒng)計(jì)分析模塊:包括種質(zhì)資源類(lèi)別分析和種質(zhì)分類(lèi)匯總分析。種質(zhì)資源類(lèi)別分析是針對(duì)作物種質(zhì)資源的某一性狀進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)數(shù)據(jù)以表或圖形式展現(xiàn)。種質(zhì)分類(lèi)匯總是指數(shù)據(jù)庫(kù)中收錄了哪些作物種質(zhì)資源及其份數(shù)[6]。
種質(zhì)資源獲取模塊:注冊(cè)用戶(hù)網(wǎng)上填寫(xiě)種質(zhì)資源獲取申請(qǐng)表,提交申請(qǐng),審核通過(guò)后簽署《農(nóng)作物種質(zhì)資源獲取協(xié)議書(shū)》,通過(guò)農(nóng)作物種質(zhì)資源無(wú)償或有償?shù)姆职l(fā),完成種質(zhì)資源的實(shí)物共享。
種質(zhì)資源引種反饋模塊:用戶(hù)將獲取的種質(zhì)資源使用情況反饋給種質(zhì)資源提供者。反饋信息包括利用獲取資源育成的品種創(chuàng)新資源,以及此種質(zhì)資源在其他研究利用及產(chǎn)生的經(jīng)濟(jì)和社會(huì)效益情況。
用戶(hù)權(quán)限設(shè)置模塊:實(shí)現(xiàn)不同的操作人員權(quán)限級(jí)別不同,分為系統(tǒng)管理員、高級(jí)操作員、普通操作員、普通用戶(hù)。
種質(zhì)資源數(shù)據(jù)和圖片管理模塊:種質(zhì)資源信息管理會(huì)不斷面臨著數(shù)據(jù)修改和更新工作,以保證數(shù)據(jù)的準(zhǔn)確性和完整性[7]。對(duì)于該系統(tǒng)而言,數(shù)據(jù)的錄入、修改和刪除等工作主要依托數(shù)據(jù)庫(kù)后臺(tái)管理平臺(tái)進(jìn)行相關(guān)操作。
數(shù)據(jù)信息補(bǔ)充、修正模塊:對(duì)引種者反饋的種質(zhì)資源信息與資源庫(kù)保存的信息比較,進(jìn)行數(shù)據(jù)修改和更新工作,以保證數(shù)據(jù)的準(zhǔn)確性和完整性。
數(shù)據(jù)備份與恢復(fù):實(shí)現(xiàn)數(shù)據(jù)備份與恢復(fù)。
注冊(cè)登錄模塊主要是對(duì)用戶(hù)相關(guān)信息和訪(fǎng)問(wèn)模塊的權(quán)限進(jìn)行統(tǒng)一管理。首先調(diào)用API函數(shù)判斷程序是否重復(fù)運(yùn)行,然后采用SQL語(yǔ)句判斷權(quán)限表中用戶(hù)信息(姓名、單位、電話(huà)、信箱)是否存在或用戶(hù)名、密碼是否正確,流程如圖3所示。
圖3 登錄流程Fig.3 Login flowchart
將種質(zhì)資源分為基本信息、植物學(xué)特征、生物學(xué)特性、品質(zhì)性狀、抗病性信息共5個(gè)庫(kù)表,檢索采用SQL語(yǔ)句“select統(tǒng)一編號(hào),引種編號(hào),品種名稱(chēng),外文名,親本組合,原產(chǎn)地,資源類(lèi)型,選育單位,選育年份,保存單位from seedjcxx where‘&namerq &’…and統(tǒng)一編號(hào)in(select統(tǒng)一編號(hào)from seedzwx where‘&name1 &’…)and統(tǒng)一編號(hào)in(select統(tǒng)一編號(hào)from seedswx where‘&name16 &’…)… order by統(tǒng)一編號(hào)asc”,以嵌套的形式實(shí)現(xiàn)多組合、跨性狀、準(zhǔn)確快速地檢索,同時(shí)可有效地防止數(shù)據(jù)沉余[8]。如圖4所示,用戶(hù)可選擇單一條件進(jìn)行簡(jiǎn)單查詢(xún),如根據(jù)“種質(zhì)編目號(hào)”“資源類(lèi)型”或“來(lái)源地”等進(jìn)行篩選。當(dāng)簡(jiǎn)單查詢(xún)不能滿(mǎn)足用戶(hù)需求時(shí),用戶(hù)則可選擇多個(gè)查詢(xún)條件進(jìn)行查詢(xún)。窗口中顯示的即為符合條件的目錄項(xiàng),選擇其中一條信息,點(diǎn)擊“查看詳細(xì)信息”按鍵即可了解種質(zhì)資源的詳細(xì)情況。
其基本統(tǒng)計(jì)分析主要是對(duì)不同種質(zhì)資源庫(kù)中保存的不同資源數(shù)量進(jìn)統(tǒng)計(jì)分析,關(guān)鍵技術(shù)采用SQL語(yǔ)句“select保存單位,資源類(lèi)型,count(統(tǒng)一編號(hào))as資源份數(shù)from(select distinct保存單位,統(tǒng)一編號(hào),資源類(lèi)型from seedjcxx)GROUP BY保存單位,資源類(lèi)型”,如圖5所示。一維統(tǒng)計(jì)分析是對(duì)作物種質(zhì)資源的某一性狀分類(lèi)統(tǒng)計(jì)和不同庫(kù)中某一性狀的分類(lèi)統(tǒng)計(jì),關(guān)鍵技術(shù)為“Select seedjcxx.保存單位,‘&opt &’,count(‘&opt &’)as份數(shù)from‘&dtb &’,seedjcxx where‘&opt &’and seedjcxx.統(tǒng)一編號(hào)=‘&dtb &’.統(tǒng)一編號(hào)GROUP BY seedjcxx.保存單位,‘&opt &’”,如圖6所示。二維統(tǒng)計(jì)分析是對(duì)種質(zhì)資源某3個(gè)性狀的交叉統(tǒng)計(jì)分析,關(guān)鍵技術(shù)為“transform count(‘&MyDz &’)select‘&MyDh &’from seedzyk where‘&MyDh &’group by(‘&MyDh &’)pivot‘&MyDl &’”,如圖7所示。結(jié)果以表或圖形式展現(xiàn),使種質(zhì)資源管理人員和用戶(hù)及時(shí)準(zhǔn)確了解利用資源庫(kù)的資源[8]。
圖4 資源檢索模塊Fig.4 Resource retrieval module
圖5 資源庫(kù)保存數(shù)量分析模塊Fig.5 Analysis module of number of resources banks
圖6 性狀分類(lèi)統(tǒng)計(jì)模塊Fig.6 Character classification statistics module
圖7 性狀交叉統(tǒng)計(jì)分析模塊Fig.7 Three cross-character statistical analysis module
注冊(cè)用戶(hù)網(wǎng)上填寫(xiě)種質(zhì)資源獲取申請(qǐng)表,提交申請(qǐng),審核通過(guò)后簽定《農(nóng)作物種質(zhì)資源獲取協(xié)議書(shū)》,通過(guò)農(nóng)作物種質(zhì)資源無(wú)償或有償?shù)姆职l(fā),完成種質(zhì)資源的實(shí)物共享,流程如圖8所示。
圖8 種質(zhì)資源獲取模塊Fig.8 Germplasm resource acquisition module
用戶(hù)將獲取的種質(zhì)資源使用情況反饋給種質(zhì)資源提供者,反饋信息包括利用獲取資源育成的品種,創(chuàng)新資源,以及此種質(zhì)資源在其他研究利用及產(chǎn)生的經(jīng)濟(jì)和社會(huì)效益情況。
種質(zhì)資源數(shù)據(jù)庫(kù)的所有數(shù)據(jù)均可通過(guò)后臺(tái)管理系統(tǒng)界面添加,數(shù)據(jù)根據(jù)《國(guó)家馬鈴薯種質(zhì)資源描述數(shù)據(jù)標(biāo)準(zhǔn)》多采用下拉列表選擇輸入(圖9),包括基本信息、植物學(xué)特征、生物學(xué)特性、品質(zhì)性狀、抗病性信息等[9]。若某一項(xiàng)數(shù)據(jù)出現(xiàn)空值時(shí),可選擇不輸入數(shù)值或者直接不選擇均可。對(duì)于已完成錄入工作的種質(zhì)資源數(shù)據(jù),若發(fā)現(xiàn)輸入的數(shù)據(jù)有誤或者數(shù)據(jù)有變化,要對(duì)數(shù)據(jù)進(jìn)行修改,則可點(diǎn)擊需要修改的數(shù)據(jù)記錄項(xiàng),完成修改工作。在種質(zhì)資源管理平臺(tái)的數(shù)據(jù)列表中,選擇需要?jiǎng)h除的數(shù)據(jù)記錄,刪除即可,為防止誤刪,設(shè)置彈出提示對(duì)話(huà)框,確認(rèn)刪除完成操作。圖片采用Stream對(duì)象可實(shí)現(xiàn)二進(jìn)制圖片的快速存讀。
圖9 系統(tǒng)后臺(tái)維護(hù)模塊Fig.9 System background maintenance module
對(duì)引種者反饋的種質(zhì)資源信息與資源庫(kù)保存的信息比較,進(jìn)行數(shù)據(jù)修改和更新工作,以保證數(shù)據(jù)的準(zhǔn)確性和完整性,如圖10所示。
圖10 信息補(bǔ)充、修正模塊Fig.10 Information supplement and correction module
進(jìn)入系統(tǒng)設(shè)置,選擇操作員級(jí)別,在操作員列表中選擇用戶(hù)名,然后設(shè)置權(quán)限相應(yīng)信息,確定即可完成權(quán)限設(shè)置,如圖11所示。用戶(hù)名不同,權(quán)限不同[10-11]。
圖11 用戶(hù)權(quán)限模塊Fig.11 User module
馬鈴薯種質(zhì)資源共享平臺(tái)系統(tǒng),在后臺(tái)數(shù)據(jù)增加、修改、刪除中調(diào)用自定義函數(shù)判斷標(biāo)識(shí)位數(shù)和序號(hào),讀取所需要的部分字符串,根據(jù)上一序列號(hào)智能生成種質(zhì)資源新標(biāo)識(shí),減少大量、煩瑣、枯燥、易錯(cuò)的標(biāo)識(shí)錄入工作。標(biāo)識(shí)、農(nóng)藝性狀、圖片智能匹配,多圖片同時(shí)每行以2G長(zhǎng)二進(jìn)制形式存讀。種質(zhì)資源數(shù)據(jù)庫(kù)表分為基本信息、植物學(xué)特征、生物學(xué)特性、品質(zhì)性狀、抗病性信息5個(gè)庫(kù)表,以統(tǒng)一標(biāo)識(shí)視為檢索唯一的字段,采用內(nèi)嵌鏈接方法將5個(gè)庫(kù)表關(guān)聯(lián)起來(lái),實(shí)現(xiàn)馬鈴薯種質(zhì)資源數(shù)據(jù)信息的多組合、跨性狀、精確快速集成查詢(xún),減少多次層級(jí)查詢(xún)及數(shù)據(jù)沉余,提高運(yùn)行速度。在統(tǒng)計(jì)分析模塊中引入數(shù)理統(tǒng)計(jì)算法來(lái)實(shí)現(xiàn)資源庫(kù)保存資源、資源某一性狀的分類(lèi)統(tǒng)計(jì)和三性狀交叉統(tǒng)計(jì)分析。模塊代碼采用大量公共變量與變量復(fù)雜的嵌套形式和算法來(lái)縮減大量重復(fù)的源代碼,精簡(jiǎn)代碼,提高速度,減少錯(cuò)誤。系統(tǒng)整體布局和窗體界面設(shè)計(jì)新穎,所有窗體簡(jiǎn)潔、可視化,操作方便。