Abstract:[Objective]Transposableelementsareamajordriverof genomeevolution,yetthefunctionsofthegaggenefamilyin uplandcotonremainunclear.Thisstudyaimedtoidentifymembersofthegaggenefamilyinuplandcotonandanalyze their structuralcharacteristics,evolutionaryelationshipsandexpresionpates toexploretheirpotentialolesinottongrowth, development,andstressresponses.[Methods]BasedontheTM-1reference genomeofuplandcotton,gaggenefamilyembers were identified using HMMER software,NCBI-CDDdatabaseandthePfamdatabase.Bioinformaticstoolswereemployed to analyze theirphysicochemical properties,subcellularlocalization,andchromosomaldistribution.Phylogenetictrees were constructed using ClustalXand MEGA X.Cis-acting elements in promoter regions were predicted using PlantCARE website, andLTRtransposon distribution wasanalyzed with RepeatMaskerandLTR_retriever.Transcriptomedata and quantiative real-time polymerase chainreaction were performedtoanalysis theexpressionpaterns and functionsof gag genes.[Results]A total of 166gag genes was identified in uplandcoton with significantly more genes inthe A sub-genome than in the D sub-genome.Phylogeneticanalysisdividedthefamilyintotwomajorsubfamilies(ninesubgroups)withdiversegenestructures, mostofwhich are located inLTR transposons.Promoter analysis revealed abundant cis-acting elements relatedtocoton growth,development,hormoneresponses,and stressadaptation.Expresionprofilingshowedthatcertaingenes,suchas
Ghir_A09Go13490and Ghir_D04G004460,werehighly expressed inspecifictisses(e.g.,ovules,fibers)orunderstre conditions(e.g,hightemperature,saltstress).Conclusion]hegaggenefamilyexhibitssignificantdiversityinuplandcotton with its evolutionclosely linkedtoLTRtransposonactivity.Somemembersmayplayroles inabioticstressresponsesandseed development, offering potential targets for cotton genetic improvement.
Keywords: Gossypium hirsutum L.; gag gene; bioinformatics; expression pattern
轉(zhuǎn)座子活動(dòng)是生物基因組進(jìn)化的重要驅(qū)動(dòng)力,轉(zhuǎn)座子不均等擴(kuò)增調(diào)控同源基因轉(zhuǎn)錄、剪接和翻譯,進(jìn)而影響棉種譜系的特異分化。轉(zhuǎn)座子是首次在玉米中發(fā)現(xiàn)可以在基因組中移動(dòng)的DNA遺傳元件。轉(zhuǎn)座子總共分為2大類,一類是通過RNA轉(zhuǎn)座,采用“復(fù)制和粘貼”機(jī)制進(jìn)行轉(zhuǎn)座,被稱為反轉(zhuǎn)錄轉(zhuǎn)座子,另一類是通過“剪切和粘貼\"的DNA轉(zhuǎn)座子。反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)一步分為長末端重復(fù)(longterminalrepeat,LTR)反轉(zhuǎn)錄轉(zhuǎn)座子和非LTR反轉(zhuǎn)錄轉(zhuǎn)座子。LTR反轉(zhuǎn)錄轉(zhuǎn)座子主要分為Copia 類和Gypsy類,其中某些Gypsy類成員含有編碼包膜蛋白的env基因,被稱為內(nèi)源性逆轉(zhuǎn)錄病毒(endogenousretrovirus,ERV)。LTR在側(cè)翼兩端生成1段 4~6 bp的短重復(fù)序列,稱為靶點(diǎn)重復(fù)位點(diǎn)(target siteduplication,TSD),可作為轉(zhuǎn)座子注釋鑒定的重要特征。LTR中間的編碼區(qū)包含1個(gè)或多個(gè)開放閱讀框,包含gag(groupspecificantigen,編碼結(jié)構(gòu)蛋白)和pol(編碼逆轉(zhuǎn)錄酶等)2個(gè)基因,借助宿主體系進(jìn)行轉(zhuǎn)錄,這種方式與逆轉(zhuǎn)錄病毒相似。逆轉(zhuǎn)錄病毒基因組結(jié)構(gòu)由3部分組成,分別是基因gag(編碼結(jié)構(gòu)蛋白)pol(編碼各種酶,如逆轉(zhuǎn)錄酶和整合酶)和env(編碼包膜蛋白),雖然逆轉(zhuǎn)錄類病毒的基因組結(jié)構(gòu)高度多樣化,但都包含gag基因和pol基因[3]。從進(jìn)化上分析,逆轉(zhuǎn)錄病毒可能是由Gypsy類型的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)化而來的[4]。
目前對動(dòng)物gag基因的研究較多,其中主要涉及ERV。ERV通過逆轉(zhuǎn)錄過程將其序列整合進(jìn)宿主基因組,并具有轉(zhuǎn)錄活性,且在宿主基因組中不斷擴(kuò)張,ERV可以通過孟德爾遺傳在代際之間進(jìn)行垂直傳播。逆轉(zhuǎn)錄病毒在人類和動(dòng)物中的研究比較多[5,例如ERVK伴隨著雀形目鳥類輻射性物種分化而在這些鳥類基因組中積累,其殘留的序列可能作為順式調(diào)控元件影響鳴禽大腦基因表達(dá)。在植物中,逆境脅迫可能激活Gaglike基因的表達(dá),促進(jìn)轉(zhuǎn)座子跳躍以增加基因組可塑性[7-8]。在歐洲赤松(Pinus sylvestrisL.)中,采用非特異性擴(kuò)增方法發(fā)現(xiàn)在熱脅迫、松蚜侵染、水楊酸和脫落酸處理下,轉(zhuǎn)座子及相關(guān)序列存在差異轉(zhuǎn)錄激活情況。在擬南芥中,甲基化有關(guān)基因DDM1突變激活導(dǎo)致gag蛋白包裝的LTR反轉(zhuǎn)錄轉(zhuǎn)座子產(chǎn)生長度為 21~22 個(gè)核苷酸、表觀遺傳激活的siRNA(epigeneticallyactivated siRNA,easiRNA),這些easiRNA能夠?qū)е罗D(zhuǎn)錄沉默[o
在棉花中未見gag基因家族的相關(guān)報(bào)道。本研究基于陸地棉(GossypiumhirsutumL.)遺傳標(biāo)準(zhǔn)系TM-1基因組,利用生物信息學(xué)方法鑒定gag基因家族成員,對其理化性質(zhì)、跨膜結(jié)構(gòu)預(yù)測、信號肽、染色體分布、基因結(jié)構(gòu)、系統(tǒng)進(jìn)化關(guān)系、LTR的鑒定以及表達(dá)模式等進(jìn)行全面分析,為后續(xù)陸地棉中g(shù)ag基因功能的深入研究奠定基礎(chǔ)。
1材料與方法
1.1棉花gag基因家族成員鑒定
在Pfam[1l數(shù)據(jù)庫(http://pfam.xfam.org/)中搜索編號PF03732,下載Retrotrans_gag結(jié)構(gòu)域的隱馬可夫模型,設(shè)置閾值為 1×10-6 ,從棉花功能數(shù)據(jù)庫(https://cottonfgd.org/)中下載陸地棉[12](GossypiumhirsutumL.)、亞洲棉[13](G.arboreumL.)和雷蒙德氏棉[4(G.raimondiiL.)的全基因組數(shù)據(jù),利用HMMER 3.0[15] 中的Hmmsearch 功能比對得到gag基因家族成員。進(jìn)一步通過美國國家生物技術(shù)信息中心的CDD數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)和 pfamscan網(wǎng)站(https://www.ebi.ac.uk/Tools/pfa/pfamscan/)鑒定含有Retrotrans_gag結(jié)構(gòu)域的基因家族成員。
1.2陸地棉gag蛋白的理化性質(zhì)、亞細(xì)胞定位 及保守基序預(yù)測分析
利用在線網(wǎng)站ExPASy[l](https://web.expasy.org/compute_pi/)獲得gag蛋白的理論等電點(diǎn)、分子質(zhì)量和信號肽等信息。利用WoLFPSORT(https://wolfpsort.hgc.jp/)進(jìn)行亞細(xì)胞定位預(yù)測利用在線網(wǎng)站TMHMMServerV.2.0(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測跨膜結(jié)構(gòu)。
1.3系統(tǒng)進(jìn)化樹構(gòu)建和基因結(jié)構(gòu)分析
利用ClustalX1.83軟件對陸地棉、亞洲棉、雷蒙德氏棉中g(shù)ag基因家族成員的蛋白序列進(jìn)行比對分析;利用MEGAX軟件[18](https://www.megasoftware.net/)用鄰接法構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹,Bootstrap值設(shè)置為1000;最后使用R語言軟件中的ggtree包(v2.2.4)[進(jìn)行基因結(jié)構(gòu)可視化。
1.4陸地棉gag基因染色體定位
從陸地棉基因組注釋文件中提取gag基因染色體位置信息,用MapChart 2.32[20] 軟件進(jìn)行基因的染色體定位分析。利用軟件MCScanX2檢測陸地棉全基因組復(fù)制基因?qū)?,參?shù)設(shè)置:蛋白比對E值小于 1×10-10 ,至少 75% 的序列相似度。
1.5陸地棉gag基因啟動(dòng)子區(qū)順式作用元件分析
利用perl腳本提取陸地棉gag基因上游2000bp 序列作為啟動(dòng)子區(qū)域;將獲得的序列在啟動(dòng)子預(yù)測網(wǎng)站PlantCARE[22](http://bioinformat-ics.psb.ugent.be/webtools/plantcare/html/)中檢索,鑒定啟動(dòng)子區(qū)的順式作用元件,整理得到的文件信息,用TBtools軟件進(jìn)行可視化展示。
1.6 陸地棉LTR轉(zhuǎn)座子的分析
利用RepeatMasker(https://www.repeatmasker.org/)和LTR-retirver(https://github.com/oushujun/LTR_retriever)軟件提取陸地棉LTR轉(zhuǎn)座子。
1.7陸地棉gag家族基因表達(dá)模式分析
從美國國家生物技術(shù)信息中心的SRA數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/sra/)下載陸地棉TM-1的根、莖、葉、花、雄蕊、雌蕊、胚珠和纖維等各個(gè)組織以及冷脅迫、熱脅迫干旱脅迫、鹽脅迫下的轉(zhuǎn)錄組數(shù)據(jù)(序列號為PRJNA248163),黃萎病脅迫下的轉(zhuǎn)錄組測序數(shù)據(jù)(序列號為PRJ-NA203021)。利用fastap、hisat和StringTie等軟件包分析轉(zhuǎn)錄組測序數(shù)據(jù)并進(jìn)行表達(dá)量計(jì)算,提取gag的基因表達(dá)數(shù)據(jù),用tpm將表達(dá)數(shù)據(jù)標(biāo)準(zhǔn)化處理后,以tpm大于0.1(各個(gè)組織轉(zhuǎn)錄組數(shù)據(jù))或0.15(逆境脅迫轉(zhuǎn)錄組數(shù)據(jù))的標(biāo)準(zhǔn)篩選表達(dá)基因數(shù)據(jù),利用R軟件的ggplot2包可視化表達(dá)數(shù)據(jù)。
1.8陸地棉gag家族基因的熒光定量分析
使用天根多糖多酚植物總RNA提取試劑盒提取中棉所24號三葉期的根、莖和葉片,以及開花后0d(O day afteranthesis,O dpa)、3d、5d和7d的胚珠和 纖維樣品的總RNA,用全式金反轉(zhuǎn)錄試劑盒合成第1鏈cDNA。實(shí)時(shí)熒光定量聚合酶鏈?zhǔn)椒磻?yīng)(quantia-tivereal-time polymerae chain reaotion,qRT-PCR)引物序列如表1。qRT-PCR反應(yīng)體系為 2μL cDNA,正向和反向引物 (10μmol?L-1) 各 0.8μL 其他按照說明書,用雙蒸水補(bǔ)足 20μL 。擴(kuò)增程序?yàn)椋?95°C 預(yù)變性 30s , 95°C 變性 5s.60°C 退火30s,72°C 延伸20s,共40個(gè)循環(huán), 72°C 延伸 1min ○內(nèi)參為GhActin(基因登錄號:AY305733)。熒光定量數(shù)據(jù)采用 2-ΔΔG 方法計(jì)算,用ggplot2包繪制柱狀圖。
2結(jié)果與分析
2.1陸地棉gag基因家族成員的鑒定
從陸地棉基因組中共鑒定出166個(gè)gag基因(附表1)。這些gag蛋白包含 88~2300 個(gè)氨基酸,分子量為 10.2~263.44kDa ,等電點(diǎn)為 4.2~ 10.8,平均等電點(diǎn)為7.86,表明該家族蛋白偏堿性。166個(gè)gag蛋白均無信號肽;預(yù)測結(jié)果顯示,164個(gè)gag蛋白無跨膜結(jié)構(gòu),Ghir_D04G004460編碼的蛋白有2個(gè)跨膜結(jié)構(gòu),GhirD02G010800編碼的蛋白有1個(gè)跨膜結(jié)構(gòu),但是這2個(gè)蛋白都無信號肽,它們可能屬于非典型膜蛋白,通過非分泌途徑直接整合到細(xì)胞膜或內(nèi)膜系統(tǒng),可能在信號轉(zhuǎn)導(dǎo)、物質(zhì)運(yùn)輸或細(xì)胞器功能中發(fā)揮作用。亞細(xì)胞定位預(yù)測結(jié)果顯示,84個(gè)gag蛋白定位于細(xì)胞核,45個(gè)定位于細(xì)胞質(zhì),25個(gè)定位于葉綠體,其他gag蛋白定位于線粒體等。
陸地棉A亞組的gag基因數(shù)量為101個(gè),D 亞組為45個(gè),定位到Scaffold上的gag基因20 個(gè)。A亞組中A05染色體上gag基因最多達(dá)13 個(gè),其次是A03、A04(各11個(gè));D亞組中D02、 D03、D04和D10各有5個(gè)。
2.2gag基因的系統(tǒng)發(fā)育分析
分別從陸地棉、亞洲棉、雷蒙德氏棉鑒定出166、459和269個(gè)gag基因,根據(jù)這些gag基因編碼的蛋白序列進(jìn)行聚類分析,結(jié)果(附圖1)顯示,陸地棉、亞洲棉、雷蒙德氏棉的gag家族成員都分為2大類,第一類又分為Ia、Ib、Ic、Id、Ie的5個(gè)亞族;第二類分為ⅡIa、Ib、IIc、Ⅱd的4個(gè)亞族(附圖1)。從基因數(shù)量來看,Ⅱ類的gag基因數(shù)量明顯多于I類,I類的5個(gè)亞族共158個(gè)基因,其中Ie的家族基因數(shù)量最少,有6個(gè),其次是Ib亞族包含8個(gè)基因;Ⅱ類家族基因數(shù)量最多的是Ⅱa。
2.3 陸地棉gag基因結(jié)構(gòu)分析
對陸地棉gag基因的內(nèi)含子-外顯子結(jié)構(gòu)分析(附圖2)發(fā)現(xiàn),這些Ghgag基因結(jié)構(gòu)存在明顯的不同,包含 個(gè)外顯子,其中沒有內(nèi)含子的基因有43個(gè);包含2個(gè)外顯子的基因數(shù)量最多,有60個(gè);其次是包含3個(gè)外顯子的基因,有38個(gè)。
2.4陸地棉gag基因順式作用元件分析
Ghgag基因啟動(dòng)子區(qū)含有大量的MYB轉(zhuǎn)錄 因子結(jié)合元件(表2),此外,還有3類重要的順式 作用元件。第一類是植物生長發(fā)育有關(guān)的元件, 包含生長發(fā)育類的啟動(dòng)子元件CAT-box的基因 有66個(gè),包含NON-box元件的基因有2個(gè);含 有胚乳表達(dá)相關(guān)的GCN4motif的基因有43個(gè), 包含胚乳特異性負(fù)調(diào)控相關(guān)特異性的AA CA_motif的基因有3個(gè);含有種子特異調(diào)控的啟 動(dòng)子元件RY-element的基因有25個(gè);含有生物 鐘響應(yīng)的啟動(dòng)子元件的基因有24個(gè)。
第二類是激素響應(yīng)元件,含有赤霉素響應(yīng)元 件的基因有158個(gè);含有脫落酸響應(yīng)的順式作用 元件ABRE的基因有122個(gè);含有茉莉酸甲酯響 應(yīng)元件TGACG-motif和CGTCA-motif的基因分 別有123個(gè);含有生長素響應(yīng)元件的基因有72 個(gè);含有TCA水楊酸響應(yīng)元件的基因有92個(gè)。
第三類是響應(yīng)逆境脅迫的順式作用元件,主 要涉及含有低溫響應(yīng)元件的基因有103個(gè),包含 干旱誘導(dǎo)的MYB轉(zhuǎn)錄因子結(jié)合位點(diǎn)的基因有 83個(gè),包含防御和逆境響應(yīng)元件TC-richrepeat 的基因有57個(gè)。
2.5 陸地棉gag基因?qū)?yīng)的LTR轉(zhuǎn)座子的分析
在143個(gè)gag基因所在區(qū)域檢測到LTR轉(zhuǎn)座子,其中,140個(gè)為Gypsy類型,3個(gè)Copia類型;8個(gè)LTR沒有TSD結(jié)構(gòu),8個(gè)是被TSD包圍的solo-LTR,solo-LTR沒有逆轉(zhuǎn)座子的蛋白質(zhì)編碼區(qū)域,一般認(rèn)為它們是通過逆轉(zhuǎn)座子的不對稱重組形成的[23]。
2.6陸地棉gag基因的表達(dá)模式分析
通過對轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),陸地棉gag基因在棉花根、莖、葉、花瓣、雄蕊、雌蕊、不同時(shí)期的胚珠和纖維以及冷、熱、鹽和黃萎病脅迫下的表達(dá)量均較低,甚至有20個(gè)基因幾乎不表達(dá),但是也存在一些基因的表達(dá)量較高。如,Ghir_A09G013490在幾乎所有組織中普遍高表達(dá)(圖1A),同時(shí)響應(yīng)逆境脅迫,在熱脅迫處理后3h 鹽脅迫處理后6h和PEG處理后6h上調(diào)表達(dá)(圖1B)。Ghir_D04G004460在胚珠中的表達(dá)量較高(圖1A),能夠響應(yīng)黃萎病脅迫(圖1B)。
根據(jù)Ghgag基因在胚珠和纖維發(fā)育不同時(shí)期的差異表達(dá)情況,篩選出6個(gè)基因,利用qRT-PCR分析其在中棉所24三葉期根、莖、葉、胚珠(0 dpa、3 dpa、5dpa和 )以及纖維(10dpa、15dpa
)中的表達(dá)情況。qRT-PCR的結(jié)果(圖2)顯示:6個(gè)基因在 15dpa 纖維中的相對表達(dá)量明顯高于其他組織,其中Ghir_A09G013490相對表達(dá)量最高。Ghir_A03G-020250在莖和葉片中相對表達(dá)量較低,在 0~ 5dpa胚珠中相對表達(dá)量持續(xù)上升,在纖維中的相對表達(dá)量高于其他組織,這與轉(zhuǎn)錄組數(shù)據(jù)的表達(dá)趨勢相似?;騁hirA09G003990在葉片中的相對表達(dá)量較低?;騁hirA09G013490在莖和葉片的相對表達(dá)量高于在根中的表達(dá)量,在0~3dpa 胚珠中的相對表達(dá)量明顯上升,在 3~7 dpa 胚珠中相對表達(dá)量逐漸下降?;騁hir_D02G021680在莖和葉片中的相對表達(dá)量低,在胚珠和纖維(
纖維除外)中的相對表達(dá)量較低?;騁hirD04G004460在葉片中的相對表達(dá)量較低,在纖維中的相對表達(dá)量最高?;騁hir_D07G004250在莖中的相對表達(dá)量較高,在0~7 dpa胚珠中的相對表達(dá)量先升高后降低,在
胚珠中表達(dá)量相對較高。
3討論
目前,關(guān)于陸地棉gag基因家族的研究還未見報(bào)道。本研究利用生物信息學(xué)分析方法,在陸地棉中鑒定到166個(gè)gag基因,其中陸地棉的A亞組的基因數(shù)量明顯多于D亞組,在亞洲棉(459個(gè))和雷蒙德氏棉(269個(gè))中鑒定的gag家族基因數(shù)量均高于陸地棉,亞洲棉的gag家族基因數(shù)量明顯多于雷蒙德氏棉。gag基因的共線性較差(結(jié)果未展示),其中亞洲棉與陸地棉只有3對共線性基因,分別是Gar03G16080/GhirA03G-010010Gar03G20000/Ghir_A02G008220和Gar13G14870/Ghir_A13G011570,雷蒙德氏棉與陸地棉之間的gag基因沒有共線性關(guān)系,這種基因數(shù)量和共線性的差異明顯不同于其他基因家族[2,多數(shù)保守基因家族在 A,D 亞組間表現(xiàn)數(shù)量平衡與高共線性,這可能是gag基因?qū)M裝質(zhì)量更敏感,也可能是因?yàn)槊藁ɑ蚪M加倍過程中LTR轉(zhuǎn)座子活動(dòng)和染色體重排等導(dǎo)致的結(jié)果。
具有g(shù)ag基因的、完整的LTR在陸地棉上的分化存在明顯的差異,其中,陸地棉166個(gè)gag家族基因中有143個(gè)基因存在于LTR轉(zhuǎn)座子,8個(gè)LTR沒有TSD結(jié)構(gòu),有8個(gè)LTR是soloLTR。表明這些LTR可能已發(fā)生結(jié)構(gòu)退化或功能分化,如從活性轉(zhuǎn)座子變?yōu)檎{(diào)控元件或無功能的序列,這需要結(jié)合LTR的序列特征和功能實(shí)驗(yàn)進(jìn)行下一步研究。
Ghgag基因的啟動(dòng)子上不僅存在大量的MYB和MYC轉(zhuǎn)錄因子結(jié)合元件,還存在與植物生長發(fā)育、逆境響應(yīng)和激素調(diào)控相關(guān)的元件。通過對陸地棉不同組織、不同逆境下的轉(zhuǎn)錄組數(shù)據(jù)分析發(fā)現(xiàn),雖然大部分Ghgag基因表達(dá)量較低,但是存在一些表達(dá)量較高的基因,這與前人的研究相一致[7-9]。通過qRT-PCR分析發(fā)現(xiàn),Ghir_A09G013490在莖、葉、胚珠( 3dpa 和5dpa)和纖維( )中的相對表達(dá)量較高。有些基因的啟動(dòng)子存在組織特異性順式作用元件,例如GhirD04G004460基因包含種子特異性表達(dá)元件。還有一些基因的啟動(dòng)子中存在與植物生長發(fā)育有關(guān)的激素響應(yīng)元件如赤霉素響應(yīng)元件等[24],例如Ghir_A09G013490在TM-1和中棉所24中的根、莖和葉片中存在明顯的表達(dá)量差異。綜合順式作用元件、轉(zhuǎn)錄組數(shù)據(jù)和qRT-PCR分析,表明gag基因或者是gag基因所在的LTR可能參與陸地棉纖維發(fā)育、逆境響應(yīng)[25]。推測,gag基因可能經(jīng)過基因組的重排,有些基因在組織和逆境響應(yīng)中發(fā)揮著重要的功能。本研究為棉花 gag基因以及LTR的遺傳進(jìn)化和功能研究提供了初步的參考。
4結(jié)論
在陸地棉中鑒定到166個(gè)gag基因家族成員,聚類分析將其分為2大類(9個(gè)亞族)。gag基因家族成員大部分均存在于LTR轉(zhuǎn)座子中。在gag基因的啟動(dòng)子中存在主要涉及植物生長發(fā)育、逆境響應(yīng)和激素調(diào)控的順式作用元件。表達(dá)分析發(fā)現(xiàn),gag家族基因在不同組織和逆境響應(yīng)中存在明顯的表達(dá)量差異,其中大部分基因表達(dá)量較低,GhirD04G004460基因在黃萎病脅迫下表達(dá)量明顯升高,表達(dá)驗(yàn)證的6個(gè)gag基因在 的纖維中表達(dá)水平普遍較高。
附件:
詳見本刊網(wǎng)站(http://journal.cricaas.com.cn/)本文網(wǎng)
頁版。附表1陸地棉 gag基因的基本信息Table S1 Basic information of gag genesin G. hirsu-
tum附圖1 gag基因的系統(tǒng)進(jìn)化分析Fig. S1 Phylogenetic analysis of gag genes附圖2 Ghgag基因結(jié)構(gòu)Fig. S2 The gene structure of Ghgag genes
參考文獻(xiàn):
[1]LiuS,ChengH,ZhangY,etal.Cotton transposon-related variome revealsrolesof transposon-related variations inmodern cotton cultivation[J/OL]. JournalofAdvancedResearch,2024,71:17- 28[2025-03-05].https://doi.org/10.1016/j.jare.2024.05.019.
[2] TianX,WangR,LiuZ,etal.Widespread impactof transposable elements on the evolution of post-transcriptional regulation in the cotton genus Gossypium[J/OL].Genome Biology,2025, 26(1):60[2025-03-05]. https://doi.0rg/10.1186/s13059-025- 03534-5.
[3]王欽.植物逆轉(zhuǎn)錄病毒起源和進(jìn)化的研究[D].南京:南京師范 大學(xué),2021. Wang Qin.Study on the origin and evolution of plant retroviruses[D].Nanjing:NanjingNormal University,2021.
[4]Lin J, CaiY,HuangG,etal.Analysis of the chromatin binding affinity of retrotransposases reveals novel roles in diploid and tetraploid cotton[J/OL]. Journal of Integrative Plant Biology, 2019,61(1): 32-44[2025-03-05]. https://doi.org/10.1111/jipb. 12740.
[5]安亞龍,陳子璇,遲誠林,等.動(dòng)物反轉(zhuǎn)錄轉(zhuǎn)座子研究進(jìn)展 [J/OL].農(nóng)業(yè)生物技術(shù)學(xué)報(bào),2021,29(1):125-136[2025-03-05]. https://doi.org/10.3969/j.issn.1674-7968. AnYalong,Chen Zixuan, Chi Chenglin,et al. Research progress onanimal retrotransposons[J/OL].Journal of Agricultural Biotechnology,2021,29(1):125-136[2025-03-05].https://doi. org/10.3969/j.issn.1674-7968.
[6]ChenG,YuD,YangY,etal..Adaptive expansionofERVK solo-LTRs is associated with Passeriformes speciation events [J/OL]. Nature Communication,2024,15(1):3151[2025-03-05]. https://doi.0rg/10.1038/s41467-024-47501-3.
[7]Roquis D,Robertson M,Yu L,et al.Genomic impact of stress-induced transposable element mobility in Arabidopsis [J/OL].Nucleic Acids Research,2021,49(18):10431-10447 [2025-03-05]. https://doi.org/10.1093/nar/gkab828.
[8] Grandbastien M A. Activation of plant retrotransposons under stress conditions[J/OL].Trends in Plant Science,1998,3(5):181- 187[2025-03-05]. https://doi.org/10.1016/S1360-1385(98) 01232-1.
[9] Voronova A,Belevich V,JansonsA. etal. Stress-induced transcriptional activation of retrotransposon-like sequences in the Scots pine (Pinus sylvestris L.) genome[J/OL]. Tree Genetics amp; Genomes,2014,10: 937-951[2025-03-05]. htps://doi.org/10. 1007/s11295-014-0733-1.
[10] LeeSC,Ernst E,Berube B,etal.Arabidopsis retrotransposon virus-like particles and their regulation by epigenetically activated smallRNA[J/OL].Genome Research,2020,30(4): 576- 588[2025-03-05]. hps://oi.rg/10.1101/gr.259044.119.
[11] FinnRD,BatemanA,ClementsJ,etal.Pfam: the proteinfamilies database[J/OL].Nucleic Acids Research,2014,42(Database issue):D222-D230[2025-03-05].htps://doi.org/10.1093/nar/ gkt1223.
[12]Hu Y,Chen J,F(xiàn)angL,etal.Gossypium barbadense and Gossypium hirsutum genomes provide insights into the origin and evolution of allotetraploid cotton[J/OL]. Nature Genetics, 2019,51(4): 739-748[2025-03-05]. https://doi.org/10.1038/ s41588-019-0371-5.
[13] Wang M, TuL, Yuan D,et al.Reference genome sequences of two cultivated allotetraploid cottons,Gossypium hirsutum and Gossypium barbadense[J/OL]. Nature Genetics,2019,51(2): 224-229[2025-03-05]. https://doi.org/10.1038/s41588-018- 0282-x.
[14] Huang G,Bao Z,F(xiàn)eng L,et al.A telomere-to-telomere cotton genome assembly reveals centromere evolution and a mutator transposon-linked module regulating embryo development [J/OL]. Nature Genetics,2024, 56(9):1953-1963[2025-03-05]. https://doi.0rg/10.1038/s41588-024-01877-6.
[15]Prakash A,JeffryesM,BatemanA,etal.The hmmer web server for protein sequence similarity search[J/OL]. Current Protocols in Bioinformatics,2017,60(1): 3.15.11-13.15.23[2025-03-05]. https://doi.org/10.1002/cpbi.40.
[16] Gasteiger E,Gattiker A, Hoogland C,et al.ExPASy:the proteomics server for in-depth protein knowledge and analysis [J/OL].Nucleic Acids Research,2003,31(13):3784-3788[2025- 03-05].https://doi.org/10.1093/nar/gkg563.
[17]LarkinMA,BlackshieldsG,BrownNP,etal. Clustal Wand clustal X version 2.0[J/OL].Bioinformatics,2007,23(21):2947- 2948[2025-03-05].https://doi.org/10.1093/bioinformatics/btm404.
[18]Kumar S, Stecher G,Li M,et al. MEGA X: molecular evolutionary genetics analysis across computing platforms[J/OL]. Molecular Biology and Evolution,2018,35(6):1547-1549 [2025-03-05].https://doi.org/10.1093/molbev/msy096.
[19] Yu G.Using ggtree to visualize data on tre-like structures [J/OL].Current Protocols in Bioinformatics,2020,69(1): e96 [2025-03-05]. https://doi.org/10.1002/cpbi.96.
[20] VoorripsRE.MapChart: software for the graphical presentationof linkage maps and QTLs[J/OL]. Journal of Heredity, 2002,93(1):77-78[2025-03-05].htps://doi.org/10.1093/ jhered/93.1.77.
[21]WangY,TangH,DebarryJD, etal.MCScanX:a toolkitfor detection andevolutionary analysis of gene synteny and collinearity[J/OL].Nucleic AcidsResearch,2012,40(7):e49 [2025-03-05]. htps://doi.org/10.1093/nar/gkr1293.
[22]RombautsS,DehaisP,VanMontagu M, etal.PlantCARE,a plant cis-acting regulatory element database[J/OL]. Nucleic Acids Research,1999,27(1):295-296[2025-03-05]. https://doi. org/10.1093/nar/27.1.295.
[23] OuS,JiangN.LTR_retriever:a highly accurate and sensitive program for identification of long terminal repeat retrotransposons[J/OL].Plant Physiology,2018,176(2):1410-1422 [2025-03-05].https://doi.org/10.1104/pp.17.01310.
[24]高秀華,傅向東.赤霉素信號轉(zhuǎn)導(dǎo)及其調(diào)控植物生長發(fā)育的 研究進(jìn)展[J].生物技術(shù)通報(bào),2018,34(7):1-13. Gao Xiuhua,F(xiàn)u Xiangdong.Research progress for the gibberellin signaling and action on plant growth and development[J].Biotechnology Bulletin,2018,34(7):1-13.
[25] Glasauer S M,Neuhauss S C.Whole-genome duplication in teleost fishes and its evolutionary consequences[J/OL]. Molecular Genetics and Genomics,2014,289(6): 1045-1060[2025-03- 05].https://doi.0rg/10.1007/s00438-014-0889-2. (責(zé)任編輯:王國鑫 責(zé)任校對:王小璐)