李祥,劉龍,安世恒,關(guān)若冰
(河南省害蟲綠色防控國際聯(lián)合實驗室/河南農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,河南鄭州,450002)
成熟的microRNA(miRNA)長度約為18~35 nt,不具有開放閱讀框(ORF),因而不能編碼蛋白質(zhì),其序列在不同物種的基因進(jìn)化上高度保守,并且在生物發(fā)育過程中miRNAs的表達(dá)表現(xiàn)出明顯的組織特異性和時間特異性(Jonas and Izaurralde,2015;Lukasik and Zielenkiewicz,2016)。miRBase Sequence Database(http://www.mirbase.org/)作為最大的miRNA信息存儲數(shù)據(jù)庫,目前已收錄了超過48860個miRNA成熟體序列,涵蓋了包括動物、植物和微生物在內(nèi)的271個物種(Kozomara et al.,2019)。
生物體內(nèi)絕大多數(shù)基因可能受到miRNA的調(diào)控,且同一miRNA可能調(diào)控多個功能相似甚至功能完全不相關(guān)基因的表達(dá)(Seitz and Pinzón,2017)。準(zhǔn)確識別miRNA的靶基因是明確其功能必不可少的環(huán)節(jié)。但目前,還沒有十分準(zhǔn)確、有效的預(yù)測手段,已明確了靶基因的miRNA也比較有限,不足以對后續(xù)研究提供充足的參考信息,極大限制了mi-RNA的相關(guān)研究和生產(chǎn)應(yīng)用。本研究概述了miRNA的特征、在細(xì)胞內(nèi)的形成過程、對靶基因的調(diào)控機制及其在生物體內(nèi)的功能,尤其是miRNA在昆蟲生長、發(fā)育以及植物-病原物互作中的關(guān)鍵作用,并討論了miRNA作為生物農(nóng)藥的研發(fā)潛力。在此基礎(chǔ)上,進(jìn)一步從軟件預(yù)測和試驗分析等角度詳細(xì)論述了miRNA靶基因預(yù)測和驗證的方法及其優(yōu)、缺點,并指出當(dāng)前研究的不足和未來的發(fā)展方向,為今后miRNA相關(guān)研究和生產(chǎn)應(yīng)用方面提供一些思路。
生物體內(nèi)的少數(shù)miRNAs轉(zhuǎn)錄于編碼基因的內(nèi)含子區(qū)域,其產(chǎn)生會被所在基因的轉(zhuǎn)錄行為所影響;而大多數(shù)miRNAs來源于基因間的序列,通常擁有獨立的啟動子及調(diào)控元件(Chang et al.,2015)。當(dāng)轉(zhuǎn)錄因子與miRNA轉(zhuǎn)錄序列的調(diào)控位點結(jié)合后,會激活RNA聚合酶II(RNA polymerase II)并在細(xì)胞核內(nèi)生成初級轉(zhuǎn)錄物,即初級miRNA(Primary miRNA,pri-miRNA)(Roden et al.,2017;Creugny et al.,2018)。有研究證實,極少數(shù)pri-miRNA(如pri-mir-634)是在RNA聚合酶III的催化作用下形成(Paraboschi et al.,2017)。
miRNA成熟體的形成通常需要pri-miRNA經(jīng)過2次剪切。在動物細(xì)胞核中,pri-miRNAs在Drosha蛋白的作用下,首先被剪切形成miRNA前體(Precursor miRNA,pre-miRNA)(Lee et al.,2003;Roden et al.,2017)。Drosha蛋白隸屬于核糖核酸酶III(RNase III)家族,通常存在于細(xì)胞核內(nèi),能特異性的識別雙鏈RNA結(jié)構(gòu)并將其剪切成3′端具有2個突出堿基的產(chǎn)物(Lee and Shin,2018)。pre-miRNA的長度一般為60~80 nt,可形成典型的莖—環(huán)結(jié)構(gòu)以維持較低的自由能(Creugny et al.,2018)。核質(zhì)轉(zhuǎn)運蛋白Exportin5(Exp5)是一種Ran-GTP依賴性蛋白,能識別并結(jié)合pre-miRNA的莖—環(huán)末端結(jié)構(gòu),并將剪切好的pre-miRNA運出細(xì)胞核。進(jìn)入細(xì)胞質(zhì)后,GTP發(fā)生去磷酸化反應(yīng)變?yōu)镚DP,同時釋放pre-miRNA(Kim et al.,2016)。在此過程中,Exp5不僅承擔(dān)了運輸功能,還保護(hù)著pre-miRNA不被其他酶類降解(Zeng and Cullen,2006;Wu et al.,2018)。
在細(xì)胞質(zhì)中,RNase III家族的另一個成員Dicer將對pre-miRNA進(jìn)行第二次剪切,形成一個不穩(wěn)定的miRNA:miRNA*復(fù)合體(Sand,2014)。在此過程中,TRBP(Transactivation-response RNA-binding protein)和PACT(Protein kinase R-activating protein)兩類輔助蛋白能大幅提高Dicer對miRNA:miRNA*復(fù)合體的親和力并從中挑選出合適的miRNA成熟體;其中,TRBP負(fù)責(zé)對底物進(jìn)行識別和定位(Komori et al.,2020),PACT則促進(jìn)了Dicer的剪切過程(Wilson et al.,2015)。在miRNA:miRNA*復(fù)合體中,穩(wěn)定性較高的miRNA即成為miRNA成熟體,并將協(xié)同AGO、Dicer等蛋白共同形成miRNA沉默誘導(dǎo)復(fù)合體(miRNA-induced silencing complex,miRISC),另一個miRNA則會在細(xì)胞內(nèi)被迅速降解(Krol et al.,2010;Carthew et al.,2017)。如果這兩個miRNAs的5'末端的穩(wěn)定性相近,則有可能形成2種不同的miRNA成熟體以及相應(yīng)的miRISC(Sheu-Gruttadauria and MacRae,2018)(圖1)。
植物miRNA的形成方式與動物存在明顯的差異,最典型的差異是植物中不存在Drosha或與其同源的蛋白(Chorostecki et al.,2017)。但在擬南芥()中 發(fā) 現(xiàn) 了Dicer的 同 源 物DCL1,并證明了DCL1主要在細(xì)胞核內(nèi)表達(dá),并參與了pre-miRNA和miRNA成熟體的形成過程(Suarez et al.,2015),因而推測DCL1表現(xiàn)出類似Drosha或Dicer的功能。需要注意的是,植物miRNA通常在細(xì)胞核內(nèi)被加工成熟,而動物miRNA的成熟通常發(fā)生在細(xì)胞質(zhì)中,進(jìn)一步佐證了上述推斷。此外,植物中HYL1的功能與動物中的TRBP和PACT相似,均發(fā)揮協(xié)同催化的作用;植物中HST則是Exp5的同源物,被認(rèn)為是miRNA-miRNA*復(fù)合體運出細(xì)胞核的載體蛋白(Mengistu and Tenkegna,2021)。
圖1 miRNA在動物體內(nèi)的生物合成過程(Ameres and Zamore,2013)Fig.1 miRNA biogenesis process in animals(Ameres and Zamore,2013)
成熟的miRNA會協(xié)同AGO、Dicer、TRBP、PACT等元件形成miRISC,并通過對mRNA進(jìn)行降解或翻譯抑制兩種不同的作用機制來實現(xiàn)其沉默效應(yīng)(Tang,2005;Liu et al.,2017)。miRNA與靶基因序列的互補程度則決定了具體的調(diào)控機制。
大多數(shù)植物miRNA與其靶標(biāo)mRNA的序列幾乎完全互補,其作用機制與siRNA形成的RISC相類似(郝大海和龔明,2020),即與mRNA結(jié)合后,miRISC引導(dǎo)其中的外切酶和內(nèi)切酶同時作用,降解所在的mRNA。反應(yīng)完成后,miRISC被完整的釋放出來并參與下一個剪切事件(Samad et al.,2017)。值得注意的是,植物miRNA與靶基因的結(jié)合位點可能存在于整個mRNA序列;而動物miRNA的結(jié)合位點通常定位在mRNA的3'UTR。與植物不同的是,動物miRNA僅在靠近5'端的少數(shù)序列與靶基因完全互補,而其余序列的互補程度則很低,使得miRNA在動物體內(nèi)的主要作用方式為翻譯抑制。目前普遍認(rèn)為在動物體內(nèi)miRISC能在不破壞mRNA結(jié)構(gòu)的前提下,抑制其翻譯過程中的某個階段,導(dǎo)致無法合成或減少合成相應(yīng)的蛋白產(chǎn)物(Ameres and Zamore,2013;Gebert and Macrae,2019)。動物中多數(shù)miRNAs與靶標(biāo)mRNA的結(jié)合位點位于3'UTR,極大降低了靶基因的預(yù)測范圍。但越來越多的研究報道指出,miRNA-mRNA的結(jié)合位點也可能存在于靶基因的編碼區(qū)(CDS)和5'UTR(Baizhigitova et al.,2018),這使得研究者需要重新評估和審視以前的研究。
目前對于miRNA的功能研究主要采用反向遺傳學(xué)的方法。一方面通過突變靶基因的結(jié)合位點來觀察miRNA的結(jié)合情況以及相應(yīng)的表型變化,另一方面通過過表達(dá)或抑制miRNA的表達(dá)水平來觀察所造成的影響(Gebert et al.,2019)。大多數(shù)miRNAs行使調(diào)控作用時,往往是微調(diào)(Fine-tune)靶基因的表達(dá)水平使其維持適宜的表達(dá)豐度,因此,改變miRNA的表達(dá)量并不一定能觀察到十分明顯的表型變化。在探索miRNA的功能時,研究者通常采用高通量測序加生物信息學(xué)分析的方法,明確miRNA的時空表達(dá)特性,并根據(jù)miRNA與mRNA的序列互補程度和結(jié)合穩(wěn)定性預(yù)測其靶基因,然后結(jié)合分子生物學(xué)手段對miRNA與mRNA的互作關(guān)系進(jìn)行驗證,并根據(jù)靶基因的作用判斷miRNA的功能。
植物miRNA與靶基因的結(jié)合序列幾乎完全互補,極大提高了靶基因預(yù)測的準(zhǔn)確性(崔俊霞等,2018)。已知的植物miRNA靶基因中,很多都是在生長發(fā)育中起關(guān)鍵調(diào)控作用的轉(zhuǎn)錄因子基因(Zhang et al.,2006a;Reichel et al.,2015)。Pandey等(2019)指出,植物miRNA可通過抑制細(xì)胞分化過程中的關(guān)鍵基因控制植物細(xì)胞發(fā)育的方向。動物miRNA的功能鑒定相對困難。由于“不完全匹配”的機制,動物miRNA的靶基因預(yù)測會產(chǎn)生大量的假陽性結(jié)果,必須經(jīng)過嚴(yán)格的試驗驗證才能確定。與植物一樣的是,動物miRNA的靶基因中也包含大量轉(zhuǎn)錄因子基因,并在生物體生長發(fā)育過程中發(fā)揮重要功能(Vorozheykin and Titov,2020)。更多的研究表明,miRNA表現(xiàn)出能調(diào)控大多數(shù)生理和病理過程的潛力,包括發(fā)育階段的劃分、干細(xì)胞分化、神經(jīng)發(fā)育、細(xì)胞生長和凋亡、激素分泌、脂類代謝、病變和癌癥等(Llave and Carrington,2002;Vikram et al.,2015)。此外,不同外部因子或內(nèi)部生理變化所導(dǎo)致的表達(dá)差異暗示了miRNA具有更廣泛的作用。近年來,生物信息學(xué)分析結(jié)果表明,miRNA具有多元化的調(diào)控路徑,甚至具備調(diào)控所有生理活動的潛力(Gebert and Macrae,2019)。
作為生物體內(nèi)一類重要的調(diào)控因子,miRNA廣泛參與了昆蟲的生長發(fā)育、生殖、代謝、免疫防御等絕大多數(shù)的生理生化過程。在果蠅中,通過敲除AGO蛋白阻止miRNAs發(fā)揮功能,能顯著抑制其卵母細(xì)胞的形成(Azzam et al.,2012),且構(gòu)建基因缺失的突變品系能阻礙果蠅卵母細(xì)胞的成熟(Nakahara et al.,2005)。在褐飛虱()中抑制基因的表達(dá),獲得了與果蠅相似的表型(Zhang et al.,2013)。、等通過調(diào)節(jié)Notch信號通路和骨形態(tài)發(fā)生蛋白信號通路中關(guān)鍵基因的表達(dá),可阻止果蠅的生殖干細(xì)胞(Germline stem cells)分 化(Poulton et al.,2011;Li et al.,2012),而啟動生殖干細(xì)胞的分化也同樣需要miRNA的調(diào)控(如)(Pek et al.,2009)。昆蟲神經(jīng)系統(tǒng)發(fā)育同樣需要miRNA的參與,如(Li and Carthew,2005)、(Loya et al.,2009)、(Weng and Cohen,2012)等;缺失這些miRNAs的表達(dá)則會導(dǎo)致神經(jīng)退行性功能缺失、神經(jīng)干細(xì)胞分化異常、信號傳導(dǎo)受阻等發(fā)育或功能缺陷。是參與昆蟲邊界形成的關(guān)鍵基因之一,能通過抑制基因的表達(dá)從而阻止果蠅翅芽盤(Wing imaginal discs)的細(xì)胞增殖;基因被抑制后,其靶基因大量表達(dá),該基因又進(jìn)一步促進(jìn)了翅芽盤上背—腹軸向的分化(Becam et al.,2011)?;虻臅r序性表達(dá)從時間維度上控制了翅芽盤上的細(xì)胞增殖,缺失的果蠅翅尺寸會明顯減小(Caygill and Johnston,2008)。
miRNA對昆蟲變態(tài)發(fā)育中的激素代謝、蛻皮行為、組織降解和重建同樣具有重要的調(diào)控作用(Ylla et al.,2016;Belles,2017)。在果蠅的整個發(fā)育過程中,多個miRNAs的表達(dá)水平與蛻皮和變態(tài)過程密切相關(guān)。蛻皮激素功能通路中的關(guān)鍵基因能顯著上調(diào)、、等基因的表達(dá)水平,并抑制基因的表達(dá),共同維護(hù)蛻皮過程的有序進(jìn)行(Sempere et al.,2002,2003)。能靶向果蠅中蛻皮激素的受體基因,從而形成一個反饋調(diào)控環(huán),以維持蛻皮激素的適宜滴度并適時啟動或終止相應(yīng)的蛻皮過程(Varghese and Cohen,2007)。在家蠶()中,同樣能作用于蛻皮激素調(diào)控網(wǎng)絡(luò)的多個基因和步驟,共同維持生長發(fā)育的有序性(He et al.,2019a,2019b)。通過負(fù)調(diào)控轉(zhuǎn)錄因子dLMO來控制果蠅翅發(fā)育過程的細(xì)胞凋亡,塑造適宜的翅形(Epstein et al.,2017);在褐飛虱的長、短翅型分化和發(fā)育中,基因能響應(yīng)寄主營養(yǎng)水平和胰島素受體基因的信號調(diào)控,通過調(diào)節(jié)基因的適宜表達(dá)水平來促進(jìn)種群向長翅化或短翅化發(fā)展(Li et al.,2021)。這也間接說明miRNA對昆蟲生理生化過程的調(diào)控作用存在一定的保守性,在今后的應(yīng)用實踐中,應(yīng)經(jīng)過合理的篩選和驗證,基于miRNA調(diào)控作用的藥劑開發(fā)可兼顧特異性和廣譜性雙重優(yōu)勢。
miRNA不僅通過作用于轉(zhuǎn)錄因子來調(diào)控植物自身的生長發(fā)育,還參與植物與病原物的“斗爭”。這些致病微生物通過表達(dá)或誘導(dǎo)寄主植物表達(dá)某些miRNAs來抑制寄主的免疫防御,協(xié)同致病過程(Umbach and Cullen,2009)。例如丁香假單胞菌()侵染擬南芥時,通過誘導(dǎo)寄主過表達(dá)來抑制自身防御基因和的轉(zhuǎn)錄,關(guān)閉植物的免疫過程(Niu et al.,2016)。黃瓜花葉病毒(Cucumber mosaic virus)通過編碼一種2b蛋白與寄主植物的AGO1蛋白競爭性結(jié)合,從而阻礙植物對自身miRNA的加工和修飾,導(dǎo)致由miRNA介導(dǎo)的寄主防御反應(yīng)受到抑制(Zhang et al.,2006b)。另一方面,植物在抵御致病微生物的侵染時,會有目的地上調(diào)或下調(diào)一些內(nèi)源性miRNAs的表達(dá),用于激活自身免疫系統(tǒng),以提高對病原物的抗性。當(dāng)煙草受到煙草花葉病毒(Tobacco mosaic virus)侵染時,通過降低自身的表達(dá)水平來促進(jìn)免疫基因的表達(dá),以抵御該病毒(Jiang et al.,2019)。
利用基因編輯或轉(zhuǎn)基因技術(shù),可有目的地使植物過表達(dá)某些特定的miRNAs,從而沉默病原物的關(guān)鍵致病基因。該項技術(shù)已應(yīng)用于水稻、番茄、煙草等作物的品種選育(Schwab et al.,2006;Ossowski et al.,2008)。例如,在煙草基因組中插入人工構(gòu)建的miRNA前體序列,使其特異性地過表達(dá)目的miRNA片段,可以沉默馬鈴薯Y病毒(Potato virus Y)的致病基因HC-Pro和馬鈴薯X病毒(Potato virus X)中的致病基因p25,最終削弱這兩種病毒對煙草的致病能力(Ai et al.,2011)。針對田間多種病害混合發(fā)生的現(xiàn)狀,可以針對病原物致病基因的保守序列構(gòu)建miRNA表達(dá)載體,以拓寬農(nóng)作物的抗病譜(Zheng and Qu,2015)。
隨著高通量測序技術(shù)和生物信息學(xué)的發(fā)展,生物中大量miRNA被相繼鑒定出來。一些miRNAs通過作用于昆蟲、植物或病原微生物中的關(guān)鍵基因,從而調(diào)控昆蟲的生長發(fā)育和植物-病原物的互作過程,在農(nóng)業(yè)害蟲防治和植物抗病免疫等方面顯示出非常好的應(yīng)用潛力?;赗NA沉默技術(shù)的生物農(nóng)藥研發(fā)也因此成為可持續(xù)植保發(fā)展的熱點研究領(lǐng)域。但如何從包含成百上千個miRNAs的生物轉(zhuǎn)錄組中準(zhǔn)確篩選和鑒定出對靶標(biāo)基因具有調(diào)控作用的mi-RNA成為限制該領(lǐng)域發(fā)展的一個難題。早在21世紀(jì)初期,Lai(2002)比對了果蠅中調(diào)控基因和基因的11個miRNAs,結(jié)果發(fā)現(xiàn)二者的miRNAs 5'端的前8個堿基(實際為靠近5'端的6個堿基)與靶基因序列能精確互補,稱這些堿基為種子序列(Seed region),并推測種子序列是miRNA發(fā)揮轉(zhuǎn)錄后調(diào)控作用的關(guān)鍵因素。這一發(fā)現(xiàn)確立了以種子序列為依據(jù)進(jìn)行miRNA靶基因預(yù)測的計算機理論基礎(chǔ)。迄今為止,尚未發(fā)現(xiàn)比利用種子序列進(jìn)行預(yù)測更準(zhǔn)確的手段。近十幾年來,逐步確立了以種子序列為核心,miRNA-mRNA復(fù)合體的熱穩(wěn)定性和二級結(jié)構(gòu)為依據(jù)的理論體系,并誕生多種各具特色的預(yù)測軟件(Chen et al.,2018)。
miRanda是首個以miRNA與潛在靶基因之間熱力學(xué)穩(wěn)定性為依據(jù)進(jìn)行預(yù)測的軟件,該軟件不受物種限制,還可在Windows、Linux等多種操作平臺上進(jìn)行不聯(lián)網(wǎng)運行(Ahmadi et al.,2013)。miRanda強調(diào)miRNA與靶基因互補序列在進(jìn)化上的保守性,主要參考miRNA 5'端序列與靶序列之間C:G、A:U、G:U的配對情況進(jìn)行熱穩(wěn)定性評估,并構(gòu)建出相應(yīng)的打分矩陣,同時根據(jù)miRNA 5'端和3'端各自的互補特性進(jìn)行區(qū)別評分。用戶還可根據(jù)實際需要自行定義閾值,從而篩除不穩(wěn)定的復(fù)合體(Ahmadi et al.,2013;程爽等.,2018)。此后,更多基于熱力學(xué)穩(wěn)定性的miRNA靶基因預(yù)測軟件被相繼開發(fā)。例如,RNAhybrid算法強調(diào)根據(jù)結(jié)合能來推算最佳結(jié)合位點,并獲得最穩(wěn)定的配對模式,避免了miRNA和靶基因之間形成無關(guān)的復(fù)合體結(jié)構(gòu)(Krüger and Rehmsmeier,2006;Pio et al.,2014)。PITA算法僅根據(jù)靶基因的3′UTR對已形成穩(wěn)定二級結(jié)構(gòu)的序列進(jìn)行剔除(Beretta et al.,2017;Kertesz et al.,2017),但出現(xiàn)跨度較大的互補配對情況或較大的二級結(jié)構(gòu)時,該算法會產(chǎn)生一部分假陽性結(jié)果。
基于miRNA與靶基因的作用方式,以及不同miRNAs間的序列比對分析,Miranda等(2006)開發(fā)了第二代預(yù)測軟件——RNA22。該軟件是首個不使用同源保守信息進(jìn)行預(yù)測的軟件,具有很強的靈活性,可將靶點的預(yù)測范圍延伸至整個mRNA序列。RNA22以Rfam 3.0數(shù)據(jù)庫中miRNA成熟體為訓(xùn)練集合,采用一種模糊匹配的模式進(jìn)行預(yù)測。該算法將供試序列分割成靶點島(Target island),并依次評估與miRNA的結(jié)合情況來尋找假定結(jié)合位點(Miranda et al.,2006;Plotnikova and Skoblov,2018)。
種子序列通常在物種之間的保守性很高,研究者可根據(jù)靶基因序列的同源性進(jìn)行預(yù)測。TargetScan是目前使用頻率最高的預(yù)測軟件。該算法提出了“假陽性率”的概念,并根據(jù)物種之間的保守性原則對預(yù)測結(jié)果進(jìn)行二次評估(Agarwal et al.,2015)。TargetScan首先搜索并比對不同物種之間的mRNA 3'UTR序列的保守區(qū)域,然后根據(jù)miRNA與潛在靶標(biāo)的3'UTR及其周圍序列的互補程度進(jìn)行綜合評估(Lewis et al.,2005;Wu et al.,2017)。該算法以保守性為主要依據(jù),其局限性在于不能對具有物種特異性的互補情況進(jìn)行有效預(yù)測。TargetScan S則是在TargetScan基礎(chǔ)上進(jìn)行了優(yōu)化,不再對miRNA非種子序列區(qū)域與靶序列匹配的自由能進(jìn)行評估,而是增加對人類、鼠、狗、雞等一些進(jìn)化距離較遠(yuǎn)的物種進(jìn)行保守性分析,進(jìn)一步提高了預(yù)測的準(zhǔn)確性(Huang et al.,2019)。
miRNA不僅可調(diào)控多個mRNAs,也可作用于同一mRNA的多個位點?;诖爽F(xiàn)象,對多個結(jié)合位點進(jìn)行同時預(yù)測時,可通過增加信噪比參數(shù)對預(yù)測結(jié)果進(jìn)行適當(dāng)?shù)睾Y除。盡管這種算法可能會過濾一些真實靶標(biāo),但其優(yōu)勢在于預(yù)測結(jié)果更加準(zhǔn)確(Ritchie et al.,2009a,2009b)。PicTar主要應(yīng)用于脊椎動物和無脊椎動物中的miRNA靶基因預(yù)測,是多靶標(biāo)和多結(jié)合位點預(yù)測的代表算法。該算法不僅能同時評估多個結(jié)合位點,還對miRNA-mRNA結(jié)合能力進(jìn)行綜合評估,甚至允許種子序列出現(xiàn)不完全匹配的情況,并進(jìn)行區(qū)別打分(Sarker et al.,2011)。此外,該算法還考慮了結(jié)合位點的保守性因素,并關(guān)聯(lián)了多個網(wǎng)站的miRNA信息數(shù)據(jù)庫。
一些miRNA通過降解mRNA來阻斷其翻譯過程(Ameres and Zamore,2013;Samad et al.,2017),因此,在miRNA表達(dá)活躍的區(qū)域,相應(yīng)的靶基因表達(dá)水平通常較低。檢測特定組織中miRNA與mRNA表達(dá)量的關(guān)系,也是靶基因篩選的一個重要手段(Jing et al.,2016;Ye et al.,2019)。該方法不同于匹配原則的算法,可以對基于序列互補原則而獲得的結(jié)果進(jìn)行二次篩選,另一個優(yōu)勢在于不單純依賴于3′UTR進(jìn)行預(yù)測。但在動物中,一些miRNAs并不能直接影響mRNA的表達(dá)水平,或者影響十分微弱,導(dǎo)致很多真實的結(jié)果被忽視,此時可用檢測相關(guān)蛋白的表達(dá)水平代替對mRNA的檢測。
miRNA參與了生物體內(nèi)大多數(shù)的生理生化過程(Llave and Carrington,2002;Lim et al.,2005),因此,可根據(jù)其功能分類對無關(guān)的預(yù)測結(jié)果進(jìn)行剔除。mirBridge算法錨定一組或一類已知功能的mRNA,有針對性的對這些潛在靶標(biāo)進(jìn)行排查(Tsang et al.,2010)。此算法適用于一些具有特殊功能的基因或通路研究,但對于尚未進(jìn)行功能劃分的miRNA和mRNA無法預(yù)測。
隨著miRNA-mRNA互作研究成果的不斷積累,一些研究者或機構(gòu)建立了多種miRNA數(shù)據(jù)庫,以整合miRNA及其靶基因的相關(guān)信息。starBase(http://starbase.sysu.edu.cn/)網(wǎng)站較為全面的收錄了由miRNA介導(dǎo)的mRNA降解組和CLIP-Seq等高通量測序數(shù)據(jù),包含了miRNA-mRNA、miRNA-lncRNA、miRNA-ceRNA等多種互作模式下的miRNA靶標(biāo)信息。ChIPBase(http://deepbase.sysu.edu.cn/chipbase/)偏向于探討miRNA的轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控作用,構(gòu)建了比較系統(tǒng)的“轉(zhuǎn)錄因子-miRNA-靶基因”調(diào)控網(wǎng)絡(luò)。Tarbase(http://microrna.gr/tarbase/)側(cè)重于收集已被試驗證實過的miRNA靶基因信息。此外,PMRD主要收錄植物miRNA的數(shù)據(jù)信息,miRGator v2.0則重點整合了疾病相關(guān)miRNA的研究結(jié)果。鑒于miRNA在序列和功能方面的保守性,收錄的研究結(jié)果被廣泛借鑒于當(dāng)前的研究。但受限于miRNA相關(guān)研究的不系統(tǒng)性,這些網(wǎng)站建立的數(shù)據(jù)庫仍不夠全面。
盡管目前已存在大量各具特色的預(yù)測軟件,但這些算法主要依賴于miRNA與靶基因的互補潛力進(jìn)行預(yù)測,并強調(diào)種子序列的重要性。由于miRNAmRNA復(fù)合體允許一定程度的錯配、跳躍、G:U配對的情況出現(xiàn),在很大程度上會出現(xiàn)許多錯誤的預(yù)測結(jié)果。在實際研究中,需要對預(yù)測的結(jié)果進(jìn)行進(jìn)一步分析和驗證。
miRNA的靶基因驗證試驗最初是以線蟲體為研究對象,通過構(gòu)建miRNA缺失的突變體以獲得相反表現(xiàn),從而證明miRNA與mRNA的調(diào)控關(guān)系(Lee et al.,1993)。這種方法受基因編輯技術(shù)等因素的局限,無法在生物中推廣使用。Vatolin等(2006)、Andachi(2008)將一段已知序列的特異性接頭連接至miRNA后進(jìn)行反轉(zhuǎn)錄和擴增,進(jìn)一步通過定量分析或高通量測序的方法成功鑒定出、LIN-14等靶基因。
當(dāng)前驗證miRNA與靶基因的互作關(guān)系時,通常是人為構(gòu)建出一套表達(dá)系統(tǒng)用于模擬相應(yīng)的調(diào)控過程,并檢測mRNA表達(dá)的蛋白產(chǎn)物含量。報告基因檢測系統(tǒng)是驗證miRNA與靶基因互作時最常見的研究手段。當(dāng)miRNA與mRNA上的作用位點結(jié)合后,能有效抑制其翻譯過程,并顯著減少蛋白產(chǎn)物的含量(Huang et al.,2020;Li et al.,2021)。將包含潛在結(jié)合位點的一部分或全部序列連接至報告基因(通常為熒光素酶基因)CDS的下游,并將構(gòu)建好的重組質(zhì)粒導(dǎo)入細(xì)胞系內(nèi)進(jìn)行表達(dá);同時將miRNA的模擬物或表達(dá)載體共同轉(zhuǎn)染至細(xì)胞系中,經(jīng)過一段時間后檢測熒光強度或者熒光素酶的活性。為核實miRNA與靶基因的作用位點,還可將結(jié)合位點序列進(jìn)行突變,從而反向觀察結(jié)合情況,檢測報告基因的表達(dá)水平,用以驗證預(yù)測位點的真?zhèn)危≧itchie et al.,2010;Ye et al.,2019)。當(dāng)細(xì)胞系內(nèi)源表達(dá)的miRNAs包含供試miRNA時,也可通過外源轉(zhuǎn)入miRNA的抑制劑(如Inhibitors或Sponge vectors)對其表達(dá)進(jìn)行抑制(Tang et al.,2017;Zhang et al.,2018)。經(jīng)過miRNA處理后的細(xì)胞系,報告基因表達(dá)的蛋白產(chǎn)物可通過Western雜交、免疫組化、流式細(xì)胞術(shù)等方法進(jìn)行定量分析(任禹珂等,2021)。需要指出的是,報告基因檢測系統(tǒng)中miRNA和結(jié)合序列是在人工干預(yù)的異源系統(tǒng)里進(jìn)行相互作用,而在活體中miRNA和靶基因的表達(dá)均存在時空特異性;克隆到載體上的序列可能會因為二級結(jié)構(gòu)發(fā)生變化而產(chǎn)生假陽性或假陰性的結(jié)果;細(xì)胞系內(nèi)復(fù)雜多樣的生理生化過程也可能會干擾試驗結(jié)果。
病蟲害的頻繁發(fā)生一直是限制農(nóng)業(yè)發(fā)展的重要難題?;瘜W(xué)農(nóng)藥是當(dāng)前防治病蟲害的主要手段,但其不合理的使用造成了嚴(yán)重的環(huán)境問題和人畜安全問題。選育抗病蟲品種往往費時費力,難以滿足生產(chǎn)的迫切需求?;赗NA沉默技術(shù)的RNA生物農(nóng)藥的研發(fā)帶來了新的農(nóng)藥革命,該方法可用于殺蟲劑、殺菌劑、除草劑等多種新型農(nóng)藥的研制,并兼具特異性強、環(huán)境友好等特點,為可持續(xù)植保的發(fā)展提供了新的途徑(Dhandapani et al.,2019;Niehl and Heinlein,2019)。
鑒于miRNA在動物和植物中的重要功能,開發(fā)miRNA生物農(nóng)藥成為未來病蟲害防治的重要選擇。如何使目的miRNA成功作用于靶標(biāo)生物,是利用該技術(shù)進(jìn)行病蟲害防治的關(guān)鍵。目前主要總結(jié)了兩種miRNA遞送方式:一種是利用轉(zhuǎn)基因或基因編輯技術(shù)使植物內(nèi)源表達(dá)目的miRNA片段,待病原物侵染或昆蟲取食時,miRNA進(jìn)入有害生物體內(nèi)發(fā)揮相應(yīng)的功能,該方式被稱為寄主誘導(dǎo)的基因沉默(Hostinduced gene silencing);另一種方式是將體外合成的功能性miRNA經(jīng)過穩(wěn)定性處理制作成相應(yīng)的殺菌劑或殺蟲劑,直接施用在作物上,該方式被稱為噴灑誘導(dǎo)的基因沉默(Spray-induced gene silencing)(Wang and Jin,2017;Zotti et al.,2018)。迄今為止,至少有5項基于RNAi原理的生物農(nóng)藥獲準(zhǔn)在田間投入使用,展現(xiàn)出了良好的應(yīng)用前景。但需要指出的是,并不是所有的植物都能通過轉(zhuǎn)基因技術(shù)培育商業(yè)化的抗病蟲品種,也不可能做到同時防治多種病蟲害。對于外源施用的RNA生物農(nóng)藥,除了較高的生產(chǎn)成本外,在田間的穩(wěn)定性和持效性也一直是研究人員需要解決的難題。此外,為了避免脫靶效應(yīng)和潛在的安全風(fēng)險,miRNA的序列設(shè)計和靶基因的篩選均必須經(jīng)過嚴(yán)密的科學(xué)論證。
經(jīng)過十余年的發(fā)展,miRNA靶基因的預(yù)測和鑒定已發(fā)展成為一門較為系統(tǒng)的學(xué)科,為miRNA的功能鑒定和應(yīng)用研發(fā)提供了便利。本研究對當(dāng)前mi-RNA靶基因預(yù)測和驗證的研究方法進(jìn)行較為系統(tǒng)地概述和比較,不僅指出這些方法的優(yōu)勢和特色,還認(rèn)識到當(dāng)前研究手段的不足。通常,miRNA-mRNA復(fù)合體的形成需要考慮時間和空間上的特異性,因此,基于序列匹配的算法預(yù)測實際上并不能真實反應(yīng)生物體內(nèi)的相互作用模式?,F(xiàn)有的預(yù)測方法是在不丟失真實靶標(biāo)的原則下盡量剔除無關(guān)結(jié)果,但受限于目前的miRNA理論研究的不足,想要兼顧預(yù)測的靈敏度和精確度仍有較大的距離。鑒于各種算法各有其利弊,學(xué)者們通常利用多個算法或手段分別進(jìn)行預(yù)測后,再對結(jié)果集合進(jìn)行比對。
對于今后miRNA靶基因預(yù)測領(lǐng)域的發(fā)展,可著重關(guān)注以下3個方面:(1)miRNA和mRNA的互補配對要考慮表達(dá)時間和空間上的一致性;(2)盡管已有不少算法增加了RNA二級結(jié)構(gòu)分析,但對于較長序列的結(jié)構(gòu)預(yù)測仍缺乏準(zhǔn)確性,預(yù)測時也沒有考慮規(guī)避蛋白結(jié)合位點等功能區(qū)域;(3)miRNA-mRNA復(fù)合體的形成及穩(wěn)定性機制方面的研究仍不夠完善,現(xiàn)有的理論基礎(chǔ)不能很好的支撐新算法的研發(fā)。在驗證預(yù)測結(jié)果時,還應(yīng)注意以下情況:(1)miRNA過表達(dá)時通常能使其表達(dá)水平上調(diào)成百上千倍,可能會引起一些副作用并干擾了其他內(nèi)源基因的表達(dá);(2)人工干預(yù)下的靶基因驗證系統(tǒng)往往忽略了miRNA和mRNA的組織特異性表達(dá)特性;(3)改變miRNA的表達(dá)水平可能導(dǎo)致上千個基因的轉(zhuǎn)錄水平發(fā)生變化,但這種變化可能來自于靶基因變化而引起的間接調(diào)控;(4)不同miRNA在與靶基因結(jié)合過程中可能存在競爭或者協(xié)同作用,單一改變某個miRNA的含量可能無法模擬出真實的情況;(5)miRNA對靶基因的上調(diào)作用在目前的研究中往往被忽視。