胡振幫,高運(yùn)來,齊照明,蔣洪蔚,劉春燕,辛大偉,胡國華,潘校成,陳慶山
(1東北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,哈爾濱150030;2黑龍江省農(nóng)墾科研育種中心,哈爾濱150090;365301部隊副業(yè)基地,黑龍江五大連池164100)
?
作物分子身份證構(gòu)建軟件ID analysis的編制
胡振幫1,高運(yùn)來1,齊照明1,蔣洪蔚2,劉春燕2,辛大偉1,胡國華2,潘校成3,陳慶山1
(1東北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,哈爾濱150030;2黑龍江省農(nóng)墾科研育種中心,哈爾濱150090;365301部隊副業(yè)基地,黑龍江五大連池164100)
摘要:【目的】以作物品種或資源的SSR分子標(biāo)記為基礎(chǔ)數(shù)據(jù),應(yīng)用Visual Basic6.0開發(fā)作物分子身份證構(gòu)建配套軟件ID analysis,快速準(zhǔn)確地篩選引物組合并高效鑒定品種?!痉椒ā孔魑锓肿由矸葑C理論由陳慶山提出,其原理是利用SSR標(biāo)記在材料中的多態(tài)性特點(diǎn),將多個標(biāo)記進(jìn)行排列組合,快速有效地區(qū)分品種資源的算法——逐步擴(kuò)增法。通過對40份黑龍江省大豆品種的40對引物數(shù)據(jù)進(jìn)行分子身份證構(gòu)建,闡述該軟件的詳細(xì)操作過程。【結(jié)果】利用 Visual Basic6.0編程軟件設(shè)計人機(jī)交互界面,通過編程實現(xiàn)核心算法,開發(fā) ID analysis軟件,軟件集成全庫構(gòu)建、部分構(gòu)建、ID判定、數(shù)據(jù)合并等功能。其中,全庫構(gòu)建是軟件的核心功能,通過全庫構(gòu)建可以快速分析區(qū)分材料的最少標(biāo)記;部分構(gòu)建可以選擇部分目標(biāo)材料進(jìn)行區(qū)分;ID判定可以在分子身份證數(shù)據(jù)庫構(gòu)建完成的前提下,對未知材料進(jìn)行SSR分析,根據(jù)獲得的分子身份證數(shù)據(jù)來確定材料是哪個品種或近似品種;數(shù)據(jù)合并功能可以將多次試驗數(shù)據(jù)整合成一個數(shù)據(jù)集。利用軟件全庫構(gòu)建功能對范例數(shù)據(jù)進(jìn)行分析得到以下結(jié)果:①在40對引物對40個大豆品種的分子身份證構(gòu)建中,共有13個引物由于缺失過多,不符合標(biāo)準(zhǔn)被剔除,剔除引物為:Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。②共有6個引物由于與其他引物相似系數(shù)過高,不符合標(biāo)準(zhǔn)被剔除,剔除引物為:Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。③在分析的40個品種中,共有5個品種具有7個特異等位基因,分別為引物Satt516在材料東農(nóng)36中顯示特異條帶3;引物Satt253在材料東農(nóng)36中顯示特異條帶1;引物Sat_229在材料嫩豐17中顯示特異條帶1;引物Satt192在材料東農(nóng)42中顯示特異條帶3;引物Satt206在材料北豐19中顯示特異條帶1;引物Satt244在材料北豐19中顯示特異條帶4;引物Satt363在材料黑河14中顯示特異條帶1,因此,可以通過這些特異等位基因直接確定需要鑒定的品種。④僅需7對引物便可將40份大豆品種完全區(qū)分開,引物組合為:Satt398、Satt380、Satt453、Satt288、Satt244、Sat_092和Satt206?!窘Y(jié)論】編制了用于作物分子身份證構(gòu)建的軟件ID analysis,軟件界面友好、使用簡便、高效、靈活。實現(xiàn)單個軟件完成作物分子身份證的構(gòu)建,達(dá)到了對資源品種鑒定的目的。隨著技術(shù)的發(fā)展和毛細(xì)管電泳的應(yīng)用,開發(fā)全自動分子身份證分析系統(tǒng)甚至開發(fā)基于分子身份證理論的快速資源鑒定儀將成為可能。
關(guān)鍵詞:大豆;作物;SSR標(biāo)記;分子身份證;軟件開發(fā)
聯(lián)系方式:胡振幫,Tel:0451-5519194;E-mail:zbhu@neau.edu.cn。通信作者陳慶山,E-mail:qshchen@sohu.com。通信作者潘校成,E-mail:soybean2007@126.com
【研究意義】黑龍江省是中國優(yōu)質(zhì)大豆主產(chǎn)區(qū),1986—2010年共審定大豆品種275份[1],2011—2015年審定大豆品種113份[2-9]。隨著科研能力的提高,為滿足人們生產(chǎn)、生活需求,越來越多的大豆新品種被育成,但市場監(jiān)管能力不足,許多不良的品種充斥市場,給農(nóng)民生產(chǎn)及品種權(quán)益保護(hù)帶來嚴(yán)峻的考驗,分子身份證軟件的研發(fā)對相關(guān)研究開展、資源鑒定及品種權(quán)益保護(hù)具有重大意義?!厩叭搜芯窟M(jìn)展】指紋圖譜(fingerprinting)的形式多種多樣,但主要分為化學(xué)指紋圖譜和生物指紋圖譜2種類型,其中,近紅外透射光譜分析[10]、深度顏色特征[11]、高光譜圖像處理[12]都屬于化學(xué)指紋圖譜,DNA條形碼[13-15]、ISSR、SNP指紋圖譜[16]都屬于分子生物指紋圖譜。分子指紋圖譜具有數(shù)量多、分布廣、多態(tài)性高、不受環(huán)境影響等優(yōu)點(diǎn)[17]。在眾多技術(shù)中SSR微衛(wèi)星DNA又叫做簡單重復(fù)序列,SSR標(biāo)記屬于共顯性標(biāo)記,并且具有良好的遺傳多樣性[18-19]。目前,整合的大豆SSR標(biāo)記共有1 015對[20-22],豐富的SSR標(biāo)記數(shù)量使基于SSR標(biāo)記應(yīng)用更加廣泛[23-25]。在分子身份證研究方面,由陳慶山提出,高運(yùn)來等[26]構(gòu)建了大豆品種的分子身份證。近幾年,張靖國等[27]以 20個梨栽培品種為例,利用17對SSR標(biāo)記構(gòu)建梨分子身份證體系。陸徐忠等[28]利用12對SSR標(biāo)記對127份水稻品種構(gòu)建了40位的身份證條碼編號。徐雷鋒等[29]以 96份百合種質(zhì)資源為材料,使用20對SSR標(biāo)記進(jìn)行百合種質(zhì)分子身份證構(gòu)建試驗?!颈狙芯壳腥朦c(diǎn)】分子身份證構(gòu)建方法分析樣本材料數(shù)量有限,而使用的標(biāo)記卻很多,生成的字符串超長,記錄繁瑣,往往需要聯(lián)合GeneMapper、MinimalMarket、Data Collection、Genemapper和條碼生成器等多個軟件[27-29],迄今為止,還未發(fā)現(xiàn)能夠直接構(gòu)建分子身份證的軟件。利用SSR技術(shù)區(qū)分品種已成為主流,但SSR結(jié)果分析仍然停留在人工選擇上,一直未找到合適的軟件進(jìn)行綜合判讀?!緮M解決的關(guān)鍵問題】本研究擬開發(fā)一套適用于分析大量材料、具有較高效率的軟件。實現(xiàn)單個軟件完成分子身份證的構(gòu)建。軟件的研發(fā)有助于相關(guān)研究開展,特別是可以解決資源及品種權(quán)益保護(hù)中出現(xiàn)的身份鑒定問題。
1.1 數(shù)據(jù)獲取
參試材料于 2008年播種于黑龍江省農(nóng)墾科研育種中心基地,選擇40對引物對40個大豆品種進(jìn)行分析,參考陳慶山等[30-31]方法進(jìn)行大豆種粒 DNA的提取、PCR擴(kuò)增及電泳試驗,并獲得標(biāo)記數(shù)據(jù)。標(biāo)記試驗在黑龍江省農(nóng)墾科研育種中心實驗室完成。
1.2 名詞及符號定義
其中,行對應(yīng)的是n個材料,列對應(yīng)的是m個標(biāo)記,其中,a11,a12…anm表示使用m個標(biāo)記對n個材料的電泳條帶碼。
定義S1、S2…Sn,其中S1表示第1個材料,n為材料容量。
定義V1、V2…Vm,其中V1表示第1個標(biāo)記,m為標(biāo)記個數(shù)。
標(biāo)記多態(tài)度:在分子標(biāo)記中,單標(biāo)記或標(biāo)記組合的全部類型,叫作標(biāo)記多態(tài)型,標(biāo)記多態(tài)型的個數(shù),叫作標(biāo)記多態(tài)度,用d表示。
1.3 逐步擴(kuò)增法
作物分子身份證理論及逐步擴(kuò)增法的算法由組陳慶山[32]提出并應(yīng)用于計算分子身份證,若標(biāo)記的數(shù)量足夠多,并且標(biāo)記對材料的區(qū)分度好,這種方法就有可能找到分子身份證的可行格式。若有20個標(biāo)記,每個標(biāo)記有2個等位基因,則這些標(biāo)記有220= 1 048 476>106種組合,即這些標(biāo)記可區(qū)分百萬個以上的不同材料。因此,對于一般的1 000以內(nèi)的材料來說,一般20個標(biāo)記足夠了。
圖1 逐步擴(kuò)增法流程圖Fig. 1 Program flow chart of step amplification method
逐步擴(kuò)增法的具體過程(圖 1):首先標(biāo)記按照等位基因多少進(jìn)行排序,計算相鄰標(biāo)記區(qū)分度相關(guān)系數(shù),淘汰相關(guān)系數(shù)過高的引物。然后選擇 V1,計算V1的多態(tài)度dv1看是否與材料容量n相等,若相等,表明V1就可以區(qū)分出所有的材料,V1即為分子身份證的一個可行格式;若不等,則說明V1不能區(qū)分出所有材料,算法繼續(xù)引入V2構(gòu)成V1V2標(biāo)記組合,計算該標(biāo)記組合的多態(tài)度dv1v2,看是否與材料容量n相等;若相等,表明V1V2可以區(qū)分出所有的材料,V1V2即為分子身份證的一個可行格式;若不等,算法繼續(xù)引入新標(biāo)記,直到將材料全部區(qū)分開為止,假設(shè)此時的標(biāo)記組合為V1V2V3…Vm,則它即為該材料分子身份證的一個可行格式。
在實際的執(zhí)行過程中,為了降低運(yùn)算量,每引入一個標(biāo)記,都要計算各材料對應(yīng)標(biāo)記組合的等位基因頻率,若頻率為 1,則對該材料從計算數(shù)組中剔除,加快了計算速度。
1.4 分子身份證構(gòu)建的實現(xiàn)策略
作物分子身份證是針對作物種質(zhì)資源或品種品系,基于作物分子標(biāo)記的多態(tài)性檢測手段,利用最簡引物組合實現(xiàn)作物種質(zhì)資源最大區(qū)分,并以類似于身份證的等位基因編碼,作為標(biāo)識和圖形化的理論和技術(shù)?;诜肿由矸葑C的概念和構(gòu)建算法,結(jié)合實際應(yīng)用的需要,建立分子身份證的實現(xiàn)策略。策略共分 4個部分:全庫構(gòu)建、部分構(gòu)建、選擇分析和分子身份證判定(ID判定)。
1.4.1 全庫構(gòu)建 全庫構(gòu)建是分子身份證構(gòu)建的基礎(chǔ),是基于數(shù)據(jù)庫中的全部材料和標(biāo)記信息,應(yīng)用1.2、1.3算法,對全部材料進(jìn)行分子身份證構(gòu)建的策略。全庫構(gòu)建的基本步驟如下:
步驟 1:不符合標(biāo)記的剔除。剔除標(biāo)準(zhǔn)首先標(biāo)記的缺失太多(默認(rèn)不超過 5%)其次是標(biāo)記間相似系數(shù)太高(默認(rèn)不高于0.8);
步驟 2:有效標(biāo)記數(shù)量判別。若標(biāo)記充足則轉(zhuǎn)入步驟3,否則轉(zhuǎn)入步驟4;
步驟 3:執(zhí)行算法,計算出材料(品種)分子身份證,包括標(biāo)出特異性條帶;
步驟 4:以標(biāo)記集能區(qū)分的材料數(shù)最多為依據(jù),計算出材料的分子身份證。
1.4.2 部分構(gòu)建 在全庫構(gòu)建的基礎(chǔ)上,可選擇性地對部分材料進(jìn)行特異性引物條帶的篩選和分子身份證的構(gòu)建。部分構(gòu)建以全庫構(gòu)建的材料、標(biāo)記集為構(gòu)建背景,選擇部分材料以全部引物為標(biāo)記利用算法進(jìn)行分子身份證計算。部分構(gòu)建的基本步驟如下:
步驟1:從全部材料中選擇部分材料集;
步驟 2:不符合標(biāo)記的剔除。剔除標(biāo)準(zhǔn)首先標(biāo)記的缺失太多(默認(rèn)不超過 5%)其次是標(biāo)記間相似系數(shù)太高(默認(rèn)不高于0.8);
步驟3:執(zhí)行算法,計算出部分材料分子身份證,包括標(biāo)出特異性條帶;
步驟 4:以標(biāo)記集能區(qū)分的材料數(shù)最多為依據(jù),計算出部分材料的分子身份證。
1.4.3 選擇分析 在全庫構(gòu)建的基礎(chǔ)上,可選擇部分標(biāo)記對材料進(jìn)行判別,主要用來考察部分標(biāo)記(受關(guān)注的)在分子多態(tài)水平上區(qū)分材料的能力。由于選定了部分標(biāo)記集,故算法上只需將供試材料的分子身份證編碼標(biāo)出即可。選擇分析的結(jié)果可能會鎖定唯一分子身份證的材料,也可能有多個共享一個分子身份證的材料,還可能由于缺失導(dǎo)致的具有不完全身份證的材料等幾種可能。選擇分析的基本步驟如下:
步驟1:從全部標(biāo)記中選擇部分標(biāo)記集;
步驟2:對供試材料進(jìn)行分子條帶碼標(biāo)識;
步驟 3:將結(jié)果進(jìn)行分類顯示,唯一識別材料、分組識別材料和不確定材料。
1.4.4 分子身份證判定 在全庫構(gòu)建的基礎(chǔ)上,選擇幾個標(biāo)記,對待測材料進(jìn)行基于選定標(biāo)記的電泳試驗,將電泳帶型數(shù)字化,在全庫構(gòu)建的背景下,基于所選定標(biāo)記計算該待測材料與其他材料間的相似度,判別該材料的類別歸屬,從而達(dá)到品種識別和品種鑒定的目的。分子身份證判定分析步驟如下:
步驟1:選定背景標(biāo)記集;
步驟2:測定待測材料的帶型;
步驟 3:在該標(biāo)記集下,計算待測材料與數(shù)據(jù)庫中全材料的相似度,以判別該材料的歸屬。
2.1 分子身份證構(gòu)建軟件模塊
分子身份證軟件依據(jù)分子身份證的實現(xiàn)策略設(shè)計功能及界面(圖 2),軟件功能包括:數(shù)據(jù)庫瀏覽及更新、全庫構(gòu)建、部分構(gòu)建、輸入構(gòu)建、選擇分析和ID判定等功能。
2.1.1 分子身份證軟件簡介 分子身份證軟件應(yīng)用Microsoft公司Visual Basic6.0 進(jìn)行程序開發(fā),軟件在開發(fā)時充分考慮到使用的兼容性問題,軟件可以在Windows9X/me/2000/XP/ win Vista/win7等大部份Windows的32位或64位操作系統(tǒng)下運(yùn)行,軟件的運(yùn)行對計算機(jī)硬件環(huán)境要求不高,Intel奔騰CPU/512M內(nèi)存/1G硬盤空間及以上機(jī)型都可運(yùn)行。如果構(gòu)建的標(biāo)記及材料數(shù)量過多時,運(yùn)算時間會相應(yīng)增加,要想達(dá)到理想的運(yùn)算效率,計算機(jī)的硬件配置不應(yīng)過低。
圖2 分子身份證軟件主界面Fig. 2 Software interface of ID analysis
分子身份證軟件首發(fā)版本為ID Analysis 1.0,軟件登記號:2007SR11870a,通過應(yīng)用完善了軟件的功能及操作界面,目前版本為ID Analysis 4.1,軟件具有功能豐富、界面友好(圖 3)、操作簡單等優(yōu)點(diǎn),一步即可達(dá)到以往需要多個軟件聯(lián)合使用才能完成的任務(wù)。軟件可以獲得方式:發(fā)送索取軟件的郵件給作者qshchen@126.com或訪問“大豆設(shè)計網(wǎng)”站進(jìn)行下載www.designsoybean.com。
圖3 Satt424等位基因特征圖Fig. 3 Alleles feature of Satt424 primer
2.1.2 標(biāo)記獲取及數(shù)據(jù)文件準(zhǔn)備 標(biāo)記統(tǒng)計是將電泳膠圖上的目標(biāo)條帶數(shù)字化的過程,具體原則是根據(jù)擴(kuò)增片段的分子量由大到小依次按1、2、3、4 …… N的順序進(jìn)行記錄。其中,0表示零等位基因(即該泳道由于基因片段丟失而無帶),-1表示該品種數(shù)據(jù)由于試驗操作造成缺失,-2表示該泳道出現(xiàn)雜合帶型。圖3為黑龍江省主栽大豆品種分子身份證構(gòu)建試驗中所獲得的一張比較理想的電泳圖,以此圖為例闡明標(biāo)記統(tǒng)計原則。
利用40對SSR引物對40份大豆品種進(jìn)行電泳分析,共獲得1 600個標(biāo)記數(shù)據(jù),將標(biāo)記整理成軟件可識別的文本文檔(圖4)。數(shù)據(jù)文本的第1行第1個位置表示數(shù)據(jù)矩陣大小,其中“40/40”表示該數(shù)據(jù)文本中的數(shù)據(jù)矩陣為40行40列,第一個40表示有40個材料,第二個40表示有40對引物。向右接著是引物信息,引物需要用加引號,矩陣大小及引物間加一半角空格,以換行符結(jié)尾。例如“40/40”“Satt516”“Satt338”“Satt573”。從第 2行開始每行表示1個材料,從左向右第1個位置表示材料名稱,中英文皆可,但要加用引號,向右接著是該資源使用40對不同引物的電泳標(biāo)記數(shù)據(jù),資源名及帶型標(biāo)記間加一半角空格,以換行符結(jié)尾。例如:“合豐25” 1 1 3 3。
圖4 軟件可識別的數(shù)據(jù)文檔Fig. 4 Data document for software input
2.1.3 數(shù)據(jù)集更新 分子身份證構(gòu)建的基礎(chǔ)是數(shù)據(jù),數(shù)據(jù)是由引物和材料組成的二維標(biāo)記矩陣集。由于數(shù)據(jù)缺失、引物更新和材料的變化而導(dǎo)致標(biāo)記集數(shù)據(jù)的動態(tài)變化,而數(shù)據(jù)的改變進(jìn)一步?jīng)Q定了分子身份證的構(gòu)建也是動態(tài)可變的。因此軟件設(shè)計開始時就考慮到由于對缺失數(shù)據(jù)的補(bǔ)充、新品種材料的更新,高多態(tài)性引物的加入等問題而導(dǎo)致數(shù)據(jù)集更新的麻煩。
為解決數(shù)據(jù)集更新的麻煩,軟件開發(fā)了數(shù)據(jù)庫合并功能(圖 5)。可以根據(jù)引物和材料的列表對多個數(shù)據(jù)集進(jìn)行整合,并可以對其發(fā)生改變的等位基因進(jìn)行校驗和提示,這樣有利于整合最新的研究結(jié)果,開發(fā)全部材料最合適的分子身份證。
合并后的數(shù)據(jù)結(jié)果以文本形式輸出(圖 5),由結(jié)果文件可知,合并后的新數(shù)據(jù)集是由6份材料及4對引物組成,其中合并前二個數(shù)據(jù)集有1個差異數(shù)據(jù),差異數(shù)據(jù)為“東農(nóng)46,Satt516”,在a集中標(biāo)記是1,在b集中標(biāo)記是3,結(jié)果還顯示了合并到新數(shù)據(jù)集中的材料、引物的數(shù)量及名稱。
2.2 軟件驗證
2.2.1 全庫構(gòu)建 將40對引物對40份大豆品種的標(biāo)記數(shù)據(jù)導(dǎo)入軟件,具體如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第三個圖標(biāo)“全庫構(gòu)建”,即可打開全庫構(gòu)建窗口(圖 6)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件,點(diǎn)擊“ID analysis”按鈕即可完成分子身份證構(gòu)建。
構(gòu)建完的數(shù)據(jù)會顯示在窗口的數(shù)據(jù)顯示區(qū),點(diǎn)擊窗口文件下拉菜單-輸出-瀏覽文件保存位置-命名文件名-保存,結(jié)果文件以文本形式保存。文件內(nèi)容共分4部分,第1部分指明分析時的參數(shù);第2部分指明不符合引物信息;第3部分指明特異引物信息;第4部分給出引物組合及每個材料的分子身份證的編號(圖6)。
由分子身份證構(gòu)建結(jié)果可知,在40對引物對40個大豆品種的分子身份證構(gòu)建中:共有13對引物由于缺失過多,不符合標(biāo)準(zhǔn)被剔除,剔除引物為Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。共有7對引物由于與其他引物相似系數(shù)過高,不符合標(biāo)準(zhǔn)被剔除,剔除引物為Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。在分析的40個品種中,共有5個品種具有7個特異等位基因,因此,可以通過這些特異等位基因直接確定需要鑒定的品種,通過計算僅需要7對引物即可區(qū)分40個大豆品種,引物組合為 Satt398、Satt380、Satt453、Satt288、Satt244、 Sat_092和Satt206,例如北豆3號在該引物組合下的分子身份證編號為2411343。
圖5 數(shù)據(jù)合并窗口及結(jié)果Fig. 5 Data merge window and output result
圖6 全庫構(gòu)建窗口及結(jié)果Fig. 6 Full-library construction window and output result
2.2.2 部分構(gòu)建 部分構(gòu)建的具體操作如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第四個圖標(biāo)“部分構(gòu)建”,即可打開部分構(gòu)建窗口(圖 7)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件。從材料欄里選擇一些材料到目標(biāo)材料欄內(nèi),點(diǎn)擊“ID analysis”按鈕即可完成部分材料的分子身份證構(gòu)建。同時為了方便用戶使用,軟件還提供“輸入構(gòu)建”窗口,在該窗口中將材料的選擇方式變?yōu)槿斯ぽ斎?,其他功能相同?/p>
構(gòu)建完的結(jié)果文件內(nèi)容共分3部分,第1部分指明不符合引物信息;第2部分指明特異引物信息;第3部分給出引物組合及被選擇的部分材料的分子身份證的編號(圖7)。
圖7 部分構(gòu)建窗口及結(jié)果Fig. 7 Partial-library construction window and output result
2.2.3 ID判定 ID判定的具體操作如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第七個圖標(biāo)“ID判定”,即可打開ID判定窗口(圖8)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件。在“引物及ID”欄內(nèi)輸入引物名稱及分子身份證編號,其格式為“Satt338,Satt369,Satt453:314”,點(diǎn)擊“Possible GP”按鈕即可計算出由引物組合以及身份證編號所確定的唯一材料名稱。
圖8 ID判定窗口Fig. 8 Molecular ID determination window and output result
有些時候可能需要考察部分受關(guān)注的引物在分子多態(tài)水平上區(qū)分材料的能力。此時可以使用“選擇分析”功能,其結(jié)果可能是被唯一區(qū)分的材料,也可能是多個共享一個分子身份證的材料,或是由于缺失導(dǎo)致的具有不完全身份證的材料等幾種可能。
3.1 軟件算法改進(jìn)
關(guān)于尋找最優(yōu)引物組合,可以采用貪婪算法,窮舉法等多種方法。貪婪算法[33-34]可提高效率,但較易錯過最優(yōu)解。窮舉法[35]比較全面客觀,但計算量大,耗時耗力。而逐步擴(kuò)增法利用引物缺失率和引物相似系數(shù)對引物進(jìn)行了有效的篩選、排序和刪除,在運(yùn)算過程中,逐步淘汰引物的等位基因組合頻率為1的材料,大大提高了運(yùn)算速率,實現(xiàn)了算法的優(yōu)化改進(jìn)。
關(guān)于標(biāo)記多態(tài)度排序,在計算中可以看出,調(diào)整標(biāo)記的順序會直接影響結(jié)果,因此,可根據(jù)單個標(biāo)記等位基因多態(tài)性大小進(jìn)行排序,使區(qū)分能力較強(qiáng)的標(biāo)記更早出現(xiàn),這樣就使標(biāo)記組合的區(qū)分度迅速增加,從而加快算法搜索速度。
關(guān)于材料容量縮減,每次有新標(biāo)記引入都會重新計算當(dāng)前標(biāo)記多態(tài)型下的每個材料條帶碼頻數(shù),而有部分材料在新標(biāo)記入選前等位基因組合頻率已經(jīng)為1,達(dá)到了區(qū)分目的,沒有重新計算的必要。因此,可以將被區(qū)分開的材料從計算的數(shù)據(jù)集中刪除,逐步縮減材料容量,達(dá)到加快算法目的。
3.2 軟件程序改進(jìn)
到目前該軟件已經(jīng)在大豆、水稻、花生、玉米、高粱、真菌、木耳等多種作物上得到廣泛應(yīng)用[36-41],但仍然存在不足,由其是隨著新材料的改良及新標(biāo)記的發(fā)現(xiàn)[1,20-22]以及生物信息學(xué)的發(fā)展,在未來的分析中所要面對的數(shù)據(jù)量將更為龐大[35,42],甚至只能在Linux系統(tǒng)下才能分析。目前,ID analysis軟件的核心算法在軟件程序?qū)崿F(xiàn)過程中仍然需要進(jìn)一步優(yōu)化,VB程序具有操作系統(tǒng)的局限性,以及執(zhí)行效率低的缺點(diǎn)[43-45];另一方面開發(fā)在線的網(wǎng)絡(luò)版分子身份證構(gòu)建系統(tǒng),對于方便更多研究人員使用,提高軟件利用率等方面具有更大的意義。
相比VB程序語言,Java技術(shù)具有簡單、完全面向?qū)ο蟆儆诮忉寛?zhí)行語言、安全性高、可移植性強(qiáng)、執(zhí)行性能高、多線程以及動態(tài)性等優(yōu)點(diǎn)[46-47]。利用Java技術(shù)實現(xiàn)分子身份證軟件的核算法,即可打包成單機(jī)版軟件,又可作為網(wǎng)絡(luò)在線分析的服務(wù)端程序,并且可跨平臺使用,解決了龐大標(biāo)記數(shù)據(jù)的運(yùn)算效率問題,達(dá)到一次開發(fā)多角度利用的目的。
3.3 軟件引物的選取和圖像的獲得
分子身份證軟件構(gòu)建核心目標(biāo)是為了利用最優(yōu)引物對組合完成對目標(biāo)材料群體的唯一性區(qū)分,如果具有較為完善的品種資源數(shù)據(jù)庫系統(tǒng),便可以解決資源的鑒定,育種材料的分析和候選審定材料的創(chuàng)新性判定等很多現(xiàn)實存在的棘手問題。
在軟件數(shù)據(jù)庫開發(fā)方面,可以基于研究對象特性開發(fā)的各類特殊分子標(biāo)記來構(gòu)建分子身份證。在標(biāo)記開發(fā)方面,可以針對研究資源的特性,設(shè)計獨(dú)特的分子身份證,利用在產(chǎn)量、品質(zhì)、抗耐性上具有特殊性狀的分子標(biāo)記[48]對未知材料進(jìn)行基因型分析和等位基因信息獲取,可以直接完成材料對應(yīng)性狀的評價和分子輔助育種研究。
目前,軟件只能對電泳膠圖數(shù)字化后的數(shù)據(jù)進(jìn)行分析,而由于傳統(tǒng)電泳膠圖分辨率低[49-50],在數(shù)字化過程中經(jīng)常會出現(xiàn)識別偏差。為解決問題,軟件應(yīng)該具有圖形分析功能,借助標(biāo)識引物確定等位基因大小,對電泳膠圖進(jìn)行基于條帶分子量大小的數(shù)字化識別。軟件圖形分析功能的開發(fā)必將提高資源、品種鑒定的準(zhǔn)確性。從分析儀器發(fā)展水平來看,毛細(xì)管電泳將為分子身份證軟件提供解決問題之道[51],在此基礎(chǔ)上開發(fā)全自動分子身份證分析技術(shù)乃至基于分子身份證的快速資源鑒定儀都將成為可能。
基于SSR標(biāo)記在材料中的多態(tài)性特點(diǎn),提出了快速有效地區(qū)分品種資源的算法——逐步擴(kuò)增法。利用Visual Basic6.0編制了基于逐步擴(kuò)增法的作物分子身份證構(gòu)建軟件——ID analysis。該軟件可以構(gòu)建作物分子身份證,實現(xiàn)了只需單個軟件即可完成作物分子身份證構(gòu)建的過程,達(dá)到了對資源品種鑒定的目的。
References
[1] 滕衛(wèi)麗, 盧雙勇, 高陽, 孫明明, 韓英鵬, 武小霞, 李文濱. 黑龍江省 1986-2010年大豆審定品種的品質(zhì)性狀分析. 作物雜志, 2011,25(2): 105-108. TENG W L, LU S Y, GAO Y, SUN M M, HAN Y P, WU X X, LI W B. Analysis of yield changes of soybean cultivars authorized in Heilongjiang province. Crops, 2011, 25(2): 105-108. (in Chinese)
[2] 孫明明. 2011年黑龍江省審定推廣的大豆新品種. 大豆科學(xué), 2011,30(4): 713-718. SUN M M. Examination and popularization of soybean varieties at Heilongjiang province in 2011. Soybean Science, 2011, 30(4):713-718. (in Chinese)
[3] 宋顯軍. 2012年黑龍江省審定推廣的大豆新品種. 大豆科學(xué), 2012,31(3): 504-510. SONG X J. Examination and popularization of soybean varieties at Heilongjiang province in 2012. Soybean Science, 2012, 31(3):504-510. (in Chinese)
[4] 王萍. 2013年黑龍江省審定推廣的大豆新品種I. 大豆科學(xué), 2013,32(3): 429-432. WANG P. Examination and popularization of soybean varieties at Heilongjiang province in 2013-I. Soybean Science, 2013, 32(3):429-432. (in Chinese)
[5] 王萍. 2013年黑龍江省審定推廣的大豆新品種II. 大豆科學(xué), 2013,32(4): 576-579. Wang P. Examination and popularization of soybean varieties at Heilongjiang province in 2013-II. Soybean Science, 2013, 32(4):576-579. (in Chinese)
[6] 孫明明, 王萍. 2014年黑龍江省審定推廣的大豆品種I. 大豆科學(xué),2014, 33(3): 463-466. SUN M M, WANG P. Examination and popularization of soybean varieties at Heilongjiang province in 2014-I. Soybean Science, 2014,33(3): 463-466. (in Chinese)
[7] 孫明明, 王萍. 2014年黑龍江省審定推廣的大豆品種II. 大豆科學(xué),2014, 33(4): 626-628. SUN M M, WANG P. Examination and popularization of soybean varieties at Heilongjiang province in 2014-II. Soybean Science, 2014,33(4): 626-628. (in Chinese)
[8] 孫明明, 王萍, 呂世翔. 2015年黑龍江省審定推廣的大豆品種 I.大豆科學(xué), 2015, 34(5): 918-920. SUN M M, WANG P, Lü S X. Examination and popularization of soybean varieties at Heilongjiang province in 2015-I. Soybean Science,2015, 34(5): 918-920. (in Chinese)
[9] 孫明明, 王萍, 呂世翔. 2015年黑龍江省審定推廣的大豆品種 II.大豆科學(xué), 2015, 34(6): 1100-1102. SUN M M, WANG P, Lü S X. Examination and popularization of soybean varieties at Heilongjiang province in 2015-II. Soybean Science, 2015, 34(6): 1100-1102. (in Chinese)
[10] 楊冬風(fēng), 朱洪德. 基于近紅外透射光譜分析和BP神經(jīng)網(wǎng)絡(luò)的大豆品種識別. 大豆科學(xué), 2013, 32(2): 249-253. YANG D F, ZHU H D. Recognition of soybean varieties based on near infrared transmittance spectroscopy and bp neural network. Soybean Science, 2013, 32(2): 249-253. (in Chinese)
[11] 張云麗, 韓憲忠, 王克儉. 基于深度顏色特征的灰度直方圖玉米品種識別研究. 作物雜志, 2015(1): 156-159. ZANG Y L, HANG X Z, WANG K J. Study on corn variety identification based on depth and color features of gray histogram. Crops, 2015(1): 156-159. (in Chinese)
[12] TAN K Z, CHAI Y H, SONG W X, CAO X D. Identification of soybean seed varieties based on hyperspectral image. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(9):235-242.
[13] 任保青, 陳之端. 植物 DNA條形碼技術(shù). 植物學(xué)報, 2010, 45(1):1-12. REN B Q, CHEN Z R. DNA barcoding plant life. Chinese Bulletin of Botany, 2010, 45(1): 1-12. (in Chinese)
[14] SARWAT M, YAMDAGNI M M. DNA barcoding microarrays and next generation sequencing: Recent tools for genetic diversity estimation and authentication of medicinal plants. Critical Reviews in Biotechnology, 2016, 36(2): 191-203.
[15] VERE N D, RICH T C G, TRINDER S A, LONG C. DNA barcoding for plants. Methods in Molecular Biology, 2015, 1245: 101-118.
[16] 殷麗琴, 彭云強(qiáng), 付紹紅, 楊進(jìn), 陳濤, 黃敏, 余勤, 韋獻(xiàn)雅, 牛應(yīng)澤. 基于ISSR標(biāo)記的彩色馬鈴薯遺傳多樣性分析及指紋圖譜構(gòu)建.西南農(nóng)業(yè)學(xué)報, 2016, 29(1):20-25. YIN L Q, PENG Y Q, FU S H, YANG J, CHEN T, HUANG M, YU Q,WEI X Y, NIU Y Z. Genetic diversity and DNA fingerprint of pigmented potato (Solanum tuberosum L.) based on ISSR markers. Southwest China Journal of Agricultural Sciences, 2016, 29(1): 20-25. (in Chinese)
[17] SONG Q J, HYTEN D L, JIA G F, QUIGLEY C V, FICKUS E W,NELSON R L, CREGAN P B. Fingerprinting soybean germplasm and its utility in genomic research. Genes Genomes Genetics, 2015, 5(10):1999-2006.
[18] 黃丹娟, 馬建強(qiáng), 陳亮. 茶樹 DNA分子指紋圖譜研究進(jìn)展. 茶葉科學(xué), 2015, 35(6):513-519. HUANG D J, MA J Q, CHEN L. Research progress on DNA molecular fingerprinting of tea plant (Camellia sinensis). Journal of Tea Science, 2015, 35(6): 513-519. (in Chinese)
[19] TARGO?SKA M, BOLIBOK-BR?GOSZEWSKA H, RAKOCZYTROJANOWSKA M. Assessment of genetic diversity in secale cereale based on SSR markers. Plant Molecular Biology Reporter,2016, 34: 37-51.
[20] SONG Q J, MAREK L F, SHOEMAKER R C, LARK K G,CONCIBIDO V C, DELANNAY X, SPECHT J E, CREGAN P B. A new integrated genetic linkage map of the soybean. Theoretical and Applied Genetics, 2004, 109(1): 122-128.
[21] CHOI I Y, HYTEN D L, MATUKUMALLI L K, SONG Q, CHAKY JM, QUIGLEY C V, CHASE K, LARK K G, REITER R S, YOON M S, HWANG E Y, YI S I, YOUNG N D, SHOEMAKER R C,TASSELL C P, SPECHT J E, CREGAN P B. A soybean transcript map: gene distribution, haplotype and single-nucleotide polymorphism analysis. Genetics Society of America, 2007, 176: 685-696.
[22] 美國農(nóng)業(yè)部大豆基因數(shù)據(jù)庫[EB/OL]. [2008.12.23]. http://www. soybase.org/ dlpages. The USDA Soybean Genetic Database[EB/OL]. [2008.12.23]. http:// www.soybase. org/dlpages. (in Chinese)
[23] 郭數(shù)進(jìn), 楊凱敏, 霍瑾, 周永航, 王宏勇, 李貴全. 山西大豆自然群體產(chǎn)量及品質(zhì)性狀與SSR分子標(biāo)記的關(guān)聯(lián)分析. 山西農(nóng)業(yè)科學(xué),2015, 43(4): 374-377, 387. GUO S J, YANG K M, HUO J, ZHOU Y H, WANG H Y, LI G Q. Association analysis of yield,quality traits and SSR markers of natural soybean population in Shanxi. Journal of Shanxi Agricultural Sciences, 2015, 43(4): 374-377, 387. (in Chinese)
[24] 陳亮, 鄭宇宏, 范旭紅, 孟凡凡, 孫星邈, 張云峰, 王明亮, 王曙明.大豆SSR指紋圖譜身份證的研究進(jìn)展與展望. 大豆科技, 2015, 2:38-43. CHEN L, ZHENG Y H, FAN X H, MENG F F, SUN X M, ZHANG Y F, WANG M L, WANG S M. Progress and perspective on SSR fingerprint identification establishment in soybean. Soybean Science and Technology, 2015, 2: 38-43. (in Chinese)
[25] 王梓鈺, 年海, 宋恩亮, 楊春明, 王新風(fēng), 馬巍, 富健. 華南大豆重要農(nóng)藝性狀與SSR的關(guān)聯(lián)分析. 貴州農(nóng)業(yè)科學(xué), 2015, 43(12): 6-8. WANG Z Y, NIAN H, SONG E L, YANG C M, WANG X F, MA W,F(xiàn)U J. Association analysis on important agronomic traits and SSR markers in South China. Guizhou Agricultural Sciences, 2015, 43(12):6-8. (in Chinese)
[26] 高運(yùn)來, 朱榮勝, 劉春燕, 李文福, 蔣洪蔚, 李燦東, 姚丙晨, 胡國華, 陳慶山. 黑龍江部分大豆品種分子 ID 的構(gòu)建. 作物學(xué)報,2009, 35(2): 211-218. GAO Y L, ZHU R S, LIU C Y, LI W F, JIANG H W, LI C D, YAO B C, HU G H, CHEN Q S. Establishment of molecular id in soybean varieties in Heilongjiang, China. Acta Agronomica Sinica, 2009, 35(2):211-218. (in Chinese)
[27] 張靖國, 田瑞, 陳啟亮, 楊曉平, 胡紅菊. 基于SSR標(biāo)記的梨栽培品種分子身份證的構(gòu)建. 華中農(nóng)業(yè)大學(xué)學(xué)報, 2014, 33(1): 12-17. ZHANG J G, TIAN R, CHEN Q L, YANG X P, HU H J. Establishment of molecular id for pear cultirars based on SSR markers. Journal of Huazhong Agricultural University, 2014, 33(1): 12-17. (in Chinese)
[28] 陸徐忠, 倪金龍, 李莉, 汪秀峰, 馬卉, 張小娟, 楊劍波. 利用SSR分子指紋和商品信息構(gòu)建水稻品種身份證. 作物學(xué)報, 2014, 40(5):823-829. LU X Z, NI J L, LI L, WANG X F, MA H, ZHANG X J, YANG J P. Construction of rice variety indentity using SSR fingerprint and commodity information. Acta Agronomica Sinica, 2014, 40(5):823-829. (in Chinese)
[29] 徐雷鋒, 葛亮, 袁素霞, 任君芳, 袁迎迎, 李雅男, 劉春, 明軍. 利用熒光標(biāo)記SSR構(gòu)建百合種質(zhì)資源分子身份證. 園藝學(xué)報, 2014,41(10): 2055-2064. XU L F, GE L, YUAN S X, REN J F, YUAN Y Y, LI Y N, LIU C,MING J. Using the fluorescent labeled SSR markers to establish molecular identity of lily germplasms. Acta Horticulturae Sinica,2014, 41(10): 2055-2064. (in Chinese)
[30] 陳慶山, 劉春燕, 呂東, 何建勛. 大豆 DNA提取基本原理的探討.東北農(nóng)業(yè)大學(xué)學(xué)報, 2004, 35(2): 129-134. CHEN Q S, LIU C Y, Lü D, HE J X. The basic principle of DNA extraction from soybean. Journal of Northeast Agricultural University,2004, 35(2): 129-134. (in Chinese)
[31] 陳慶山, 劉春燕, 劉迎雪, 劉海燕, 陳立君, 付堯, 單繼勛, 郭強(qiáng),張麗娜. 核酸體外擴(kuò)增技術(shù). 中國生物工程, 2004, 24(5): 10-14. CHEN Q S, LIU C Y, LIU Y X, LIU H Y, CHEN L J, FU R, SHAN J X, GUO Q, ZHANG L N. Progress of nucleic acid amplification technologies. China Biotechnology, 2004, 24(5): 10-14. (in Chinese)
[32] 陳慶山. 作物分子身份證構(gòu)建策略及其在大豆中的應(yīng)用. 哈爾濱:黑龍江人民出版社, 2014. CHEN Q S. Crop Molecular Identity Building Strategy and the Application in the Soybean. Harbin: People Press Heilongjiang, 2014. (in Chinese)
[33] COWELL R G. A simple greedy algorithm for reconstructing pedigrees. Theoretical Population Biology, 2013, 83: 55-63.
[34] CHEN H, ZHOU Y C, TANG Y Y, LI L Q, PAN Z B. Convergence rate of the semi-supervised greedy algorithm. Neural Networks, 2013,44: 44-50.
[35] GUNVANT P, BABU V, RUPESH D, SILVAS P, BJORN N, ZHAO M Z, HUMIRA S, LI S, LI L, JUHI C, LIU Y, TRUPTI J, XU D,NGUYEN H T. Soybean (Glycine max) SWEET gene family: Insights through comparative genomics, transcriptome profiling and whole genome re-sequence analysis. BMC Genomics, 2015, 16: 520-536.
[36] 王黎明, 焦少杰, 姜艷喜, 嚴(yán)洪冬, 蘇德峰, 孫廣全. 142份甜高粱品種的分子身份證構(gòu)建. 作物學(xué)報, 2011, 37(11): 1975-1983. WANG L M, JIAO S J, JIANG Y X, YAN H D, SU D F, SUN G Q. Establishment of molecular identity in 142 sweet sorghum varieties. Acta Agronomica Sinica, 2011, 37(11): 1975-1983. (in Chinese)
[37] 王蕾. 中國花生品種遺傳多樣性研究及分子 ID數(shù)據(jù)庫的構(gòu)建[D].青島: 青島科技大學(xué), 2014: 51-56. WANG L. Analysis of genetic diversity and construction of molecular id in peanut varieties in China[D]. Qingdao: Qingdao University of Science Technology, 2014: 51-56. (in Chinese)
[38] 于瀟, 許修宏, 劉華晶. 黑龍江部分野生黑木耳菌株的分子 ID構(gòu)建. 中國農(nóng)學(xué)通報, 2012, 28(13):171-175. YU X, XU X H, LIU H J. Establishment of molecular id in auricularia auricula in Heilongjiang. Chinese Agricultural Science Bulletin, 2012,28(13): 171-175. (in Chinese)
[39] 丁俊杰, 姜翠蘭, 顧鑫, 楊曉賀, 趙海紅, 申宏波, 仕相林, 劉春燕,胡國華, 陳慶山. 利用與大豆灰斑病抗性基因連鎖的 SSR標(biāo)記構(gòu)建大豆品種(系)的分子身份證. 作物學(xué)報, 2012, 38(12): 2206-2216. DING J J, JIANG C L, GU X, YANG X H, ZHAO H H, SHEN H B,SHI X L, LIU C Y, HU G H, CHEN Q S. Establishment of molecular id of soybean varieties (Lines) using SSR markers linked to resistance genes against Cercospora sojina. Acta Agronomica Sinica, 2012,38(12): 2206-2216. (in Chinese)
[40] 李偉忠, 許崇香, 安英輝, 孫梅, 閔麗, 姜森, 陳慶山, 胡國華. 257份玉米自交系分子ID的構(gòu)建. 玉米科學(xué), 2013, 21(2): 24-30. LI W Z, XU C X, AN Y H, SUN M, MIN L, JIANG S, CHEN Q S,HU G H. Establishment of molecule id in 257 maize inbred lines. Journal of Maize Sciences, 2013, 21(2): 24-30. (in Chinese)
[41] 何琳, 何艷琴, 劉業(yè)麗, 邱強(qiáng), 欒懷海, 韓雪, 胡國華. 2012年北方春大豆國家區(qū)試大豆品種純度鑒定、分子ID構(gòu)建及遺傳多樣性分析. 中國農(nóng)學(xué)通報, 2014, 30(18): 277-282. HE L, HE Y Q, LIU Y L, QIU Q, LUAN H H, HAN X, HU G H. Purity identification, molecular ID establishment and genetic diversity analysis of soybeans attending national regional test of north spring soybean in 2012. Chinese Agricultural Science Bulletin, 2014, 30(18):277-282. (in Chinese)
[42] LEE Y G, JEONG N, KIM J H, LEE K, KIM K H, PIRANI A, HA B K, KANG S T, PARK B S, MOON J K, KIM N, JEONG S C. Development, validation and genetic analysis of a large soybean SNP genotyping array. The Plant Journal, 2015, 81(4): 625-636.
[43] 王良瑩. 主流編程語言的特點(diǎn)與比較. 電腦編程技巧與維護(hù),2009(6): 96-106. WANG L Y. The characteristics and comparisons of certain mainstream programming language wang liangying. Study of Computer Application in Education, 2009(6): 96-106. (in Chinese)
[44] 關(guān)琳琳. 試論 VB編程語言在軟件開發(fā)中的應(yīng)用. 河南科技,2013(1): 1-3, 44. GUAN L L. Discuss VB programming language application in software development. Journal of Henan Science and Technology,2013(1): 1-3, 44. (in Chinese)
[45] 李暢. 編程語言的特點(diǎn)與比較. 華中師范大學(xué)研究生學(xué)報, 2005,12(3): 145-148. LI C. The analysis of singing psychology in singing training and art performance. Huazhong Normal University Journal of Postgraduates,2005, 12(3): 145-148. (in Chinese)
[46] 馬響. 基于java語言在web開發(fā)的知識探討. 信息技術(shù)與信息化,2015(11): 169-171. MA X. Based on Java language knowledge in web development. Information. Technology and Information, 2015(11): 169-171. (in Chinese)
[47] 冀瀟, 李楊. JavaScript 與Java在Web開發(fā)中的應(yīng)用與區(qū)別. 通信技術(shù), 2013, 46(6): 145-151. JI X, LI Y. Applications and differences of between Javascript and Java in web development. Communications Technology, 2013, 46(6):145-151. (in Chinese)
[48] 陳慶山. 大豆分子輔助育種體系構(gòu)建、遺傳—物理圖整合與應(yīng)用及轉(zhuǎn)基因研究[R]. 黑龍江省農(nóng)墾科研育種中心, 2009. CHEN Q S. Construction of Molecular Assisted Breeding System,Integration and Application of Genetic map and Physical map, and Transgenic Research in Soybean[R]. The crop research and breeding center of land-reclamation of Heilongjiang province, 2009. (in Chinese)
[49] 孟菲, 蔡小彥, 崔興雷, 劉方, 王星星, 周忠麗, 王春英, 王玉紅,彭仁海, 王坤波. 聚丙烯酰胺凝膠銀染技術(shù)的優(yōu)化. 中國棉花,2015, 42(4): 12-14. MENG F, CAI X Y, CUI X L, LIU F, WANG X X, ZHOU Z L,WANG C Y, WANG Y H, PENG R H, WANG K B. An optimized protocol for silver staining of polyacrylamide Gel. Journal Chinese Cotton, 2015, 42(4): 12-14. (in Chinese)
[50] 梁宏偉, 王長忠, 李忠, 羅相忠, 鄒桂偉. 聚丙烯酰胺凝膠快速、高效銀染方法的建立. 遺傳, 2008, 30(10): 1379-1382. LIANG H W, WANG C Z, LI Z, LUO X Z, ZOU G W. Improvement of the silver-stained technique of polyacrylamide Gel electrophoresis. Hereditas, 2008, 30(10): 1379-1382. (in Chinese)
[51] SáNCHEZ-PéREZA R, BALLESTERB J, DICENTAA F, ARúSB P,MARTíNEZ-GóMEZA P. Comparison of SSR polymorphisms using automated capillary sequencers, and polyacrylamide and agarose gel electrophoresis: Implications for the assessment of genetic diversity and relatedness in almond. Scientia Horticulturae, 2006, 108:310-316.
(責(zé)任編輯 李莉)
Software Development of -ID Analysis for Crop Molecular Identity Construction
HU Zhen-bang1, GAO Yun-lai1, QI Zhao-ming1, JIANG Hong-wei2, LIU Chun-yan2, XIN Da-wei1, HU Guo-hua2,PAN Xiao-cheng3, CHEN Qing-shan1
(1College of Agriculture in Northeast Agricultural University, Harbin 150030;2Land Reclamation Science & Research Breeding Center of Heilongjiang Province, Harbin 150090;3Sideline Base for 65301 Force, Wudalianchi 164100, Heilongjiang)
Abstract:【Objective】Based on the SSR molecular marker data of crops resources, software ID analysis was developed using visual Basic6.0 for crop molecular identity construction, which could screen primer combinations rapidly and accurately for efficient cultivar identification. 【Method】The crop molecular ID theory was proposed by Mr. Qingshan Chen. SSR markers in crop varieties showed high polymorphism characteristics, and a set of markers was permutated and combined to quickly and effectively divide varieties with step amplification method. Finally, 40 pairs of SSR data of 40 soybean varieties in Heilongjiang province were used for identity construction with the software. 【Result】 ID analysis software was developed with core algorithm by using Visual Basic 6.0 to design man-machine interactive interface. This software has integrated full-library construction, partial-library construction,molecular ID determination, and database merging function. The full-library construction was the core functions together which could quickly obtained the minimum SSR prime combination to distinguish all the varieties. Partial-library construction could be used for some target varieties identification. For an unknown materials, with the already existing molecular identity database and the SSR analysis data, molecular ID determination could be used to determine the variety names or similar varieties. Database merging could be used to integrate several experimental data into a data set. The following results were analyzed by full-library construction with case data. First, among the 40 pairs of SSR data of 40 soybean cultivars, a total of 13 primers were excluded because missing data were too much and did not meet the standards, they were Sat_111, Satt218, Satt231, Satt685, Satt514, Satt551, Satt077, Satt358,Satt424, Satt100, Satt838 ,Satt893, and Satt891. Second, 6 primers were excluded because they showed high similarity coefficient with other primers, and they were Satt253, Satt192, Satt417, Sat_229, Satt127, and Satt496. Third, 5 varieties showed 7 specific alleles among all 40 varieties. They were, allele 3 of Satt516 and allele 1 of Satt253 showed in Dongnong36, allele 1 of Sat_229 showed in Nenfeng 17, allele 3 of Satt192 showed in Dongnong42, allele 1 of Satt206 and allele 4 of Satt244 showed in Beifeng 19,and allele 1 of Satt363 showed in Heihe14. So these specific allelic genes could directly identify the varieties. Forth, only seven pairs of SSR primers could distinguish 40 soybean varieties completely. The primer combinations were Satt398, Satt380, Satt453, Satt288,Satt244, Sat_092, and Satt206. 【Conclusion】 In this research, the software analysis ID was developed to construct crop molecular identity. The software has a friendly interface and easy to be used, high efficiency and flexible. The construction of the crop molecular identity can be realized completely by using a single software, and thus achieving the purpose of variety identification. With the development of technology of the application of capillary electrophoresis and the molecular identity theory, the development of an automatic molecular identity analysis system and even a rapid resource identification system will become possible.
Key words:soybean; crops; SSR markers; molecular identity; software development
收稿日期:2016-02-22;接受日期:2016-04-18
基金項目:國家自然科學(xué)基金青年基金(31401465)、黑龍江省留學(xué)回國人員科技項目擇優(yōu)資助啟動項目、哈爾濱市科技創(chuàng)新人才研究專項資金(杰出青年人才計劃類)(RC2015JQ002004)、國家自然科學(xué)基金(31471516,31271747)