紀兆華 尹成偉 王春云 高春紅
摘? ? 要:通過以農(nóng)業(yè)生產(chǎn)田間管理實際統(tǒng)計數(shù)據(jù)分析為例,探討生物數(shù)據(jù)可視化,直觀展現(xiàn)生物學數(shù)據(jù),幫助科學分析數(shù)據(jù)結(jié)果,將抽象的信息進行直觀的分析并表示出來,有助于更好地理解數(shù)據(jù),增強認知數(shù)據(jù)。生物大數(shù)據(jù)可視化分析的結(jié)果可視化強、效率高,對生物學大數(shù)據(jù)進行解構(gòu),去除其中的冗余信息和背景噪聲,得到更加具有科學意義的數(shù)據(jù)分析結(jié)果。
關(guān)鍵詞:田間管理;生物數(shù)據(jù);分析
文章編號:1005-2690(2021)17-0036-02? ? ? ?中國圖書分類號:C961? ? ? ?文獻標志碼:B
對生物大數(shù)據(jù)的高效準確解讀事關(guān)糧食安全等重要問題,由于生物大數(shù)據(jù)有類型復雜、結(jié)構(gòu)異質(zhì)、冗余性高和體積龐大等特點,科研人員需要借助數(shù)據(jù)可視化等方法才能理解其組成特征和內(nèi)在聯(lián)系,進而更加快速和有針對性地從中挖掘出相關(guān)知識信息[1]。
1? ?數(shù)據(jù)可視化
數(shù)據(jù)可視化將具有大量數(shù)據(jù)庫中的文本或者二進制數(shù)據(jù)的特征信息,轉(zhuǎn)變?yōu)楦又庇^生動的圖或表。計算機可視化操作能夠?qū)⒊橄蟮男畔⑦M行直觀的分析并表示出來,有助于更好地理解數(shù)據(jù),增強認知數(shù)據(jù),并挖掘出大量數(shù)據(jù)中蘊含的事物之間的規(guī)律或內(nèi)在信息[2]。
實現(xiàn)大數(shù)據(jù)可視化的過程一般需要有數(shù)據(jù)獲取、數(shù)據(jù)變換、數(shù)據(jù)分析與數(shù)據(jù)展現(xiàn)。數(shù)據(jù)分析和數(shù)據(jù)可視化在生物大數(shù)據(jù)可視化分析流程中為計算處理,數(shù)據(jù)分析包括基于表結(jié)構(gòu)和關(guān)系函數(shù)的查詢分析、基于數(shù)據(jù)、事件流的流分析,基于圖、矩陣、迭代計算的復雜分析;可視化通常為對分析結(jié)果的展示,通過交互、提問等形成迭代的分析和可視化[3]。
2? ?農(nóng)業(yè)生產(chǎn)田間管理生物數(shù)據(jù)分析可視化
以田間管理數(shù)據(jù)分析為例,分析生物數(shù)據(jù)可視化。
2.1? ?田間管理
以田間管理數(shù)據(jù)分析為例,在2019年5月20日進行玉米播種,行長5 m,行距0.6 m,每行種植20株,采用壟上直播。玉米3葉期對田間種植的轉(zhuǎn)基因玉米材料進行抗除草劑草銨膦篩選,篩選方式為葉噴施,篩選效果明顯。對于缺株小區(qū)進行移苗。間苗完畢后,采用點播器施肥法,即在3葉期使用點播器將化肥點施于兩株苗之間,其中100%施氮量每穴施肥11.24 g,70%施氮量每穴施肥8.43 g ,0%施氮量不施肥。
2.2? ?數(shù)據(jù)測定
在苗期、拔節(jié)期、大喇叭口期、抽雄開花期分別測定葉綠素相對含量;抽雄吐絲期測定植株株高、穗位高。收獲時測定植株生物產(chǎn)量、果穗產(chǎn)量等;室內(nèi)考種時測定植株干重、果穗產(chǎn)量構(gòu)成因子等。
2.3? ?不同梯度不同時期葉綠素含量
整理不同梯度不同時間葉綠素含量數(shù)據(jù),統(tǒng)計如表1所示。
苗期所有轉(zhuǎn)化體葉綠素含量顯著高于3個對照,p1和sd1轉(zhuǎn)化體在不同氮肥濃度下苗期均高于對照;推測兩個轉(zhuǎn)化體提高了苗期吸氮能力;轉(zhuǎn)化體拔節(jié)期葉綠素含量降低;大喇叭口期含量相比增加;ms1和zm1在棒三葉期葉綠素含量呈現(xiàn)增加趨勢;推測兩個轉(zhuǎn)化體提高氮轉(zhuǎn)運和分配能力。
2.4? ?不同梯度田株高
整理不同梯度田株高數(shù)據(jù),統(tǒng)計如表2所示。
商業(yè)雜交種鄭單958與鄭單958(aa),鄭單958(aa×aa)相比,株高差異較大。
3? ?生物數(shù)據(jù)可視化
3.1? ?生物學大數(shù)據(jù)可視化分析
當數(shù)據(jù)量規(guī)模增加時,需要采用大數(shù)據(jù)技術(shù)進行數(shù)據(jù)分析。生物學大數(shù)據(jù)可視化分析的作用主要包括3個方面:首先,幫助科研人員快速從體積龐大、缺乏組織脈絡的原始數(shù)據(jù)集中抽取出本質(zhì)特征,為研究工作提供理論指引;其次,抽取出生物學大數(shù)據(jù)中某一維度的特征,以圖形化的方式進行直觀展示和強調(diào);最后,可以有效地將生物學大數(shù)據(jù)進行解構(gòu),去除其中的冗余信息和背景噪聲,得到更加具有科學意義的數(shù)據(jù)分析結(jié)果[4]。
研究是根據(jù)一定條件進行設計的田間試驗,分別觀察了玉米生長不同時期的數(shù)據(jù)。因為這些數(shù)據(jù)也是對于有限樣本的觀察得到的測試數(shù)據(jù),通常也具有變隱形、偶然性和局部性,或者說在表面上看來這些原始數(shù)據(jù)是雜亂無章的。因此,必須要對這些原始觀察的數(shù)據(jù)進行整理分析,這樣就能發(fā)現(xiàn)其內(nèi)在的規(guī)律并分析出有科學性的結(jié)論。通常在數(shù)據(jù)分析方面如果比較復雜,也可采用數(shù)據(jù)分組的方法來分析。如運用相關(guān)方法將玉米苗期、拔節(jié)期、大喇叭口期、抽雄開花期的葉綠素相對含量,和抽雄吐絲期的玉米植株株高、穗位高,以及收獲時的植株生物產(chǎn)量、果穗下茬產(chǎn)量,在室內(nèi)考種時測定植株干重、果穗產(chǎn)量構(gòu)成因子等數(shù)據(jù)記錄,研究不同時期的不同狀態(tài)數(shù)據(jù),分析其總體結(jié)構(gòu),并簡化數(shù)據(jù)運算程序[5]得到科學性的結(jié)論。
3.2? ?數(shù)據(jù)可視化特點
同傳統(tǒng)的靜態(tài)數(shù)據(jù)可視化展現(xiàn)方式比,基于HTML5可視化技術(shù),在交互性、界面等方面,具有表現(xiàn)更為直觀、容易和其他軟件工具結(jié)合起來進行數(shù)據(jù)分析,以及方便傳播分享數(shù)據(jù)等優(yōu)勢[6]。采用生物學數(shù)據(jù)可視化平臺,可以更加直觀地展現(xiàn)測試數(shù)據(jù)和分子層面的數(shù)據(jù)結(jié)構(gòu)、關(guān)系網(wǎng)絡數(shù)據(jù)和臨床分析數(shù)據(jù)等,為科研人員提供幫助[7]。
4? ?結(jié)束語
在大數(shù)據(jù)時代,數(shù)據(jù)產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)據(jù)化推動了我國信息化開展進程[8]。注入農(nóng)業(yè)作物生長數(shù)據(jù)等可以實時提供給農(nóng)業(yè)管理技術(shù)人員,就可以精準判別農(nóng)作物施肥、打藥或者灑水時間,從而有效防止天然因素造成的產(chǎn)值降低。經(jīng)過歸納處理的數(shù)據(jù),也可以有效調(diào)控農(nóng)業(yè)生產(chǎn);經(jīng)過對數(shù)據(jù)的剖析,可以擬定一系列調(diào)整和管理農(nóng)業(yè)生產(chǎn)的辦法,促使農(nóng)業(yè)生產(chǎn)高效、高質(zhì)發(fā)展。
參考文獻:
[ 1 ] 趙方慶,周琳,孔雷.生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].科學通報(中文版),2015,60(5):547-557.
[ 2 ] 張廣旭.基于Spark的基因數(shù)據(jù)聚類分析及可視化[D].長沙:湖南大學,2017.
[ 3 ] 傅耀威,賈燕紅,張軍,等.大數(shù)據(jù)可視分析發(fā)展現(xiàn)狀與趨勢[J].中國基礎(chǔ)科學,2019,21(4):53-58.
[ 4 ] 郭平仲.田間試驗數(shù)據(jù)的統(tǒng)計分析——試驗數(shù)據(jù)的整理[J].生物學通報,1989(10):18-21.
[ 5 ] 劉江濤,邢輝.淺析生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].中國新通信,2016,18(2):152.
[ 6 ] 崔曉軍,高子航.基于GIS與云計算的溫州市農(nóng)業(yè)大數(shù)據(jù)可視化平臺研究[J].電腦編程技巧與維護,2020(4):113-115.
[ 7 ] 紀兆華,王春云,高春紅,等.生物數(shù)據(jù)可視化研究[J].中小企業(yè)管理與科技(中旬刊),2021(1):193-194.
[ 8 ] 姜侯,楊雅萍,孫九林.農(nóng)業(yè)大數(shù)據(jù)研究與應用[J].農(nóng)業(yè)大數(shù)據(jù)學報,2019(1):5-15.