張曉華,孫達(dá)鋒,,劉紹雄,,李建英,李雪松,岳萬(wàn)松,高章會(huì),華 蓉**
(1.中華全國(guó)供銷合作總社昆明食用菌研究所,云南 昆明 650221;2.云南省食用菌產(chǎn)業(yè)發(fā)展研究院,云南 昆明 650221)
研究基因表達(dá)差異對(duì)于了解基因功能和調(diào)控機(jī)制具有重要作用[1]。隨著組學(xué)技術(shù)的快速發(fā)展和日益完善,可通過(guò)研究同種食(藥) 用菌不同菌株、同一菌株不同發(fā)育階段或不同培養(yǎng)條件下的基因表達(dá)差異,篩選與生物學(xué)性狀及表型差異相關(guān)的功能基因,最終幫助我們了解食(藥) 用菌生長(zhǎng)發(fā)育過(guò)程中相關(guān)基因的調(diào)控機(jī)制,以便為食(藥) 用菌遺傳育種工作的開(kāi)展提供指導(dǎo)。目前基因表達(dá)量測(cè)定的方法有Northern 印跡法、微陣列法、基因表達(dá)連續(xù)分析法(SAGE)、實(shí)時(shí)熒光定量PCR (RT-qPCR)等[2]。其中RT-qPCR 由于具有操作簡(jiǎn)單、靈敏度高、特異性強(qiáng)、重復(fù)性好、分析結(jié)果準(zhǔn)確等優(yōu)勢(shì),已普遍用于基因表達(dá)分析[1]。
RT-qPCR 的結(jié)果易受RNA 質(zhì)量、逆轉(zhuǎn)錄效率、引物特異性、轉(zhuǎn)錄物標(biāo)準(zhǔn)化等多種技術(shù)因素的影響。為消除這些因素帶來(lái)的試驗(yàn)誤差,通常需要引入合適的內(nèi)參基因,以便對(duì)目的基因的表達(dá)量進(jìn)行校正。QIAN 等[3]的研究結(jié)果顯示,在用RT-qPCR 分析目標(biāo)基因表達(dá)差異時(shí),如果選用了不合適的內(nèi)參基因,可能會(huì)得到不可靠甚至錯(cuò)誤的結(jié)論。因此,合適的內(nèi)參基因?qū)Χ糠治鼋Y(jié)果的準(zhǔn)確性尤其重要。內(nèi)參基因通常是維持細(xì)胞基本功能的組成型表達(dá)基因,理論上,其表達(dá)水平在所有樣品中應(yīng)該是恒定的[4];但事實(shí)上并沒(méi)有適用于所有物種的內(nèi)參基因,同一物種在不同的發(fā)育階段、不同菌株之間以及同一菌株在不同試驗(yàn)條件下,最適內(nèi)參基因也不相同。例如關(guān)于草菇(Volvariella volvacea) 的研究表明,在寒冷和高溫脅迫下,MSF1 基因表達(dá)較穩(wěn)定;在Na-Cl 和CuSO4脅迫下,UBQ 基因表達(dá)最為穩(wěn)定;而在酸脅迫中MAPK 基因的穩(wěn)定性最好[3]。關(guān)于靈芝(Ganoderma lucidum) 的試驗(yàn)結(jié)果也顯示,在短時(shí)間的茉莉酸甲酯、水楊酸和過(guò)氧化氫處理下,Actin 和UCE2 基因的穩(wěn)定性較好;但在長(zhǎng)時(shí)間的茉莉酸甲酯、水楊酸和過(guò)氧化氫處理下,這2 個(gè)基因的穩(wěn)定性卻最差[5]。因此,同一菌株使用相同的培養(yǎng)基,在不同的試驗(yàn)條件下最適內(nèi)參基因也各不相同。此外,在黑木耳(Auricularia heimuer) 中進(jìn)行了最適內(nèi)參基因的研究,結(jié)果顯示18S rRNA、β-TUB、EF1-α和28S rRNA 在不同菌株間表現(xiàn)出較好的穩(wěn)定性,而APRTase、18S rRNA 和28S rRNA 適合作為研究不同發(fā)育階段基因表達(dá)差異的內(nèi)參基因[6]。以上研究表明,在使用RT-qPCR 開(kāi)展食(藥) 用菌基因表達(dá)分析前,根據(jù)不同的試驗(yàn)條件和物種選擇合適的內(nèi)參基因十分必要。
近年來(lái),隨著食(藥) 用菌基因組和轉(zhuǎn)錄組數(shù)據(jù)在各大數(shù)據(jù)庫(kù)的相繼公布,越來(lái)越多的候選功能基因亟需進(jìn)行基因表達(dá)差異分析,這使得RT-qPCR技術(shù)廣受歡迎,各食(藥) 用菌中能穩(wěn)定表達(dá)的內(nèi)參基因的篩選也受到了許多研究者的關(guān)注。食(藥)用菌研究中常見(jiàn)的內(nèi)參基因詳見(jiàn)表1。
表1 食(藥) 用菌中常見(jiàn)的內(nèi)參基因Tab.1 The internal reference gene in common edible and medicinal fungi
如表1 所示,在這些研究中所用的內(nèi)參基因大部分是從植物或動(dòng)物中借鑒,大量證據(jù)表明在動(dòng)植物中穩(wěn)定表達(dá)的18S rRNA、Actin、GAPDH 等傳統(tǒng)內(nèi)參基因在食(藥) 用菌中并不穩(wěn)定[10]。比如在草菇[3]、靈芝[7,16]、毛木耳[12]等食(藥) 用菌中18S rRNA 是最不穩(wěn)定的內(nèi)參基因,但在許多食(藥) 用菌的內(nèi)參基因篩選中還是將這些基因作為研究對(duì)象。
隨著大部分食(藥) 用菌轉(zhuǎn)錄組測(cè)序工作的逐步完成,許多穩(wěn)定性較好的新內(nèi)參基因被篩選,詳見(jiàn)表2。
表2 基于轉(zhuǎn)錄組數(shù)據(jù)篩選的候選內(nèi)參基因Tab.2 Screening candidate reference gene sets based on transcriptome data
如表2 所示,相比于從動(dòng)植物研究中借鑒的傳統(tǒng)內(nèi)參基因,從轉(zhuǎn)錄組數(shù)據(jù)中篩選得到的候選內(nèi)參基因的穩(wěn)定性更高,更適合用于RT-qPCR 數(shù)據(jù)的校正和標(biāo)準(zhǔn)化。
目前食(藥) 用菌內(nèi)參基因篩選的試驗(yàn)方案與動(dòng)植物的研究類似,首先是根據(jù)基因表達(dá)分析的試驗(yàn)設(shè)計(jì)收集樣品,對(duì)樣品進(jìn)行RNA 提取和cDNA 的合成;其次是候選內(nèi)參基因的選擇及引物設(shè)計(jì),然后進(jìn)行RT-qPCR 試驗(yàn);再使用geNorm、NormFinder、BestKeeper、RefFinder 等軟件對(duì)試驗(yàn)結(jié)果進(jìn)行評(píng)價(jià),最終篩選出最合適的內(nèi)參基因。
植物內(nèi)參基因的篩選已經(jīng)有大量的報(bào)道,食(藥) 用菌中相關(guān)的工作也在逐步開(kāi)展[20-21]。隨著靈芝[5]、平菇[17]、草菇[3]、蛹蟲(chóng)草[11]等的研究,表明在食(藥) 用菌中通用的內(nèi)參基因并不存在,都需要在基因表達(dá)分析前先進(jìn)行內(nèi)參基因的篩選。SONG 等[13]在竹黃菌內(nèi)參基因篩選的研究中,選擇了11 個(gè)在其他物種中常用的內(nèi)參基因作為候選基因集,結(jié)果表明UBI、VAC 和TFC 3 個(gè)內(nèi)參基因的穩(wěn)定性較好。ZHANG 等[14]根據(jù)竹黃菌的轉(zhuǎn)錄組數(shù)據(jù),以SONG 等確定的3 個(gè)穩(wěn)定性好的內(nèi)參基因(UBI、VAC 和TFC) 和9 個(gè)新基因組成候選內(nèi)參基因集,對(duì)12 個(gè)候選內(nèi)參基因開(kāi)展了篩選工作,結(jié)果顯示穩(wěn)定性排名前7 的均是基于轉(zhuǎn)錄組數(shù)據(jù)篩選出的候選內(nèi)參基因,而UBI、VAC 和TFC 的排名則相對(duì)靠后。竹黃菌內(nèi)參基因的篩選結(jié)果說(shuō)明,用于篩選的候選內(nèi)參基因集不同,篩選到的最佳內(nèi)參基因也不相同。這就提示我們,合適的候選內(nèi)參基因集是內(nèi)參基因篩選的重要前提,若候選內(nèi)參基因集不合適,可能導(dǎo)致篩選到的內(nèi)參基因并非最優(yōu),甚至需要額外使用更多的內(nèi)參基因進(jìn)行基因表達(dá)分析。以往在食(藥)用菌最適內(nèi)參基因的篩選研究中,候選內(nèi)參基因集通常是選擇在動(dòng)物、植物中具有一定代表性的內(nèi)參基因,遺憾的是這些內(nèi)參基因在食(藥) 用菌中的穩(wěn)定性并不一致。對(duì)目前食(藥) 用菌內(nèi)參篩選工作中常見(jiàn)內(nèi)參基因的研究次數(shù)和研究結(jié)果進(jìn)行了梳理,統(tǒng)計(jì)結(jié)果詳見(jiàn)圖1、圖2。
圖1 研究次數(shù)較多的常見(jiàn)內(nèi)參基因Fig.1 Common internal reference genes that have been studied more frequently
圖2 使用頻率較高的理想內(nèi)參基因Fig.2 Ideal reference gene with higher frequency of use
如圖1、圖2 所示,ACT1、β-TUB、GAPDH、18S rRNA、UBQ、TUB-1a、EF1-α 在食(藥) 用菌內(nèi)參基因篩選中作為候選內(nèi)參基因次數(shù)最多,同時(shí)也是被選擇作為理想內(nèi)參基因頻率最高的常見(jiàn)內(nèi)參基因。
目前,在草菇、平菇、羊肚菌等研究中已經(jīng)成功將轉(zhuǎn)錄組數(shù)據(jù)運(yùn)用到候選內(nèi)參基因集的選擇中[3,17-18]。在這些研究中,候選內(nèi)參基因集通常由數(shù)個(gè)依據(jù)轉(zhuǎn)錄組數(shù)據(jù)得到的穩(wěn)定性較高的新內(nèi)參基因和幾個(gè)傳統(tǒng)的內(nèi)參基因組成。在羊肚菌的研究中發(fā)現(xiàn),雖然候選內(nèi)參基因集中包含轉(zhuǎn)錄組數(shù)據(jù)篩選到的新內(nèi)參基因,但傳統(tǒng)內(nèi)參基因Actin 表現(xiàn)出較好的穩(wěn)定性[18]。ELENA 等[22]在平菇內(nèi)參基因篩選時(shí),選擇了RAUL 等[17,23]在另外2 項(xiàng)研究中認(rèn)為較為穩(wěn)定的內(nèi)參基因作為候選內(nèi)參基因。這說(shuō)明在選擇候選內(nèi)參基因時(shí),若研究的物種已經(jīng)開(kāi)展過(guò)相關(guān)研究,可以將前人篩選出的穩(wěn)定性較好的內(nèi)參基因加入候選基因集中進(jìn)行篩選驗(yàn)證。同時(shí),若研究物種缺乏相關(guān)的轉(zhuǎn)錄組數(shù)據(jù),也可以選擇目前在食(藥) 用菌中研究次數(shù)較多且穩(wěn)定性相對(duì)較好的傳統(tǒng)內(nèi)參基因作為候選基因。綜上所述,候選內(nèi)參基因的選擇最好是基于轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析及挖掘,同時(shí)可以根據(jù)研究物種和特定的試驗(yàn)條件引入部分傳統(tǒng)的內(nèi)參基因。
目前常用的分析軟件有g(shù)eNorm、NormFinder 和BestKeeper。
geNorm 是在實(shí)時(shí)熒光定量PCR 中,用于內(nèi)參基因篩選和最佳內(nèi)參基因數(shù)目分析的軟件。該軟件對(duì)候選內(nèi)參基因的數(shù)目和試驗(yàn)條件無(wú)任何限制,最終從候選內(nèi)參基因集中挑選出至少2 個(gè)最優(yōu)內(nèi)參基因用于數(shù)據(jù)的校準(zhǔn),可使相對(duì)定量的結(jié)果更為準(zhǔn)確[24]。RTqPCR 試驗(yàn)中得到的原始Ct 值要轉(zhuǎn)換為相對(duì)定量數(shù)據(jù)才能輸入到geNorm 軟件中進(jìn)行分析。首先找到每一個(gè)候選內(nèi)參基因在所有樣品中的最小Ct 值,然后用其他樣品的Ct 值減去最低Ct 值,此時(shí)得到的值就是△Ct 值(該值≥0)。最后計(jì)算每個(gè)樣品的2-△Ct值,將該值輸入geNorm 軟件,通過(guò)計(jì)算每個(gè)候選內(nèi)參基因在不同樣品中的平均變異值M (average pairwise variation),最終呈現(xiàn)出候選內(nèi)參基因集穩(wěn)定性排名的折線圖和最佳內(nèi)參基因數(shù)目,從而篩選出穩(wěn)定性較好的內(nèi)參基因組合[24]。判定標(biāo)準(zhǔn)為M 值小于1.5 即可作為內(nèi)參基因,且M 值越低代表內(nèi)參基因的穩(wěn)定性越好;反之,則表明其穩(wěn)定性較差[15]。有報(bào)道認(rèn)為當(dāng)M 值≤0.2 時(shí),代表該候選內(nèi)參基因具有較高的穩(wěn)定性[9]。
NormFinder 也是用于候選內(nèi)參基因穩(wěn)定性篩選的軟件,數(shù)據(jù)處理及判定標(biāo)準(zhǔn)和geNorm 相同。表達(dá)穩(wěn)定值越小的內(nèi)參基因穩(wěn)定性越高,最終根據(jù)表達(dá)穩(wěn)定值的大小單獨(dú)顯示出最穩(wěn)定的內(nèi)參基因。NormFinder 程序既可以比較候選內(nèi)參基因的表達(dá)差異,同時(shí)也能計(jì)算樣品組間的變異,但該程序最終只呈現(xiàn)一個(gè)最佳的內(nèi)參基因[24]。
BestKeeper 是一款基于Excel 分析內(nèi)參基因和靶基因表達(dá)量的分析工具。與geNorm 和NormFinder所不同的是,BestKeeper 是直接使用不同樣本RTqPCR 試驗(yàn)中得到的原始Ct 值進(jìn)行分析,根據(jù)Ct 值得到標(biāo)準(zhǔn)差(SD) 和變異系數(shù)(CV)。SD 值和CV值越小,則該內(nèi)參基因的穩(wěn)定性越好;若SD>1 則表明該內(nèi)參基因不穩(wěn)定,最好不用于基因表達(dá)量分析,據(jù)此對(duì)每個(gè)候選內(nèi)參基因的表達(dá)穩(wěn)定性進(jìn)行評(píng)估[25]。
RefFinder 是一款集成了geNorm、NormFinde 和BestKeeper 3 個(gè)主要內(nèi)參基因篩選軟件的綜合分析工具,根據(jù)每個(gè)軟件對(duì)內(nèi)參基因的排名,給每個(gè)候選內(nèi)參基因的穩(wěn)定性賦予一個(gè)適當(dāng)?shù)臋?quán)重,并計(jì)算出權(quán)重的幾何平均值,最終給出候選內(nèi)參基因集的總排名[15]。以geNorm 軟件進(jìn)行分析,發(fā)現(xiàn)在黑木耳不同菌株間28S rRNA 表達(dá)最穩(wěn)定,但以BestKeeper 和NormFinder 軟件進(jìn)行分析的結(jié)果卻顯示該基因表現(xiàn)一般,這種情況在香菇[8]、靈芝[7]等食(藥) 用菌的研究中均存在。而在草菇[3]和竹黃菌[13]中的研究表明,使用geNorm 和NormFinder 分析內(nèi)參基因穩(wěn)定性時(shí)往往能得出相同的結(jié)論,但BestKeeper 軟件的分析結(jié)果則與這2 個(gè)軟件有一定的出入,在植物內(nèi)參基因篩選研究中也出現(xiàn)過(guò)類似的現(xiàn)象[26-27]。這可能是因?yàn)锽estKeeper 依賴于候選參考基因的標(biāo)準(zhǔn)差來(lái)評(píng)估其穩(wěn)定性,而geNorm 和NormFinder 則根據(jù)基因的累積標(biāo)準(zhǔn)差和成對(duì)穩(wěn)定性來(lái)評(píng)估內(nèi)參基因。由于每種軟件的算法不同,使用不同的軟件進(jìn)行分析時(shí)內(nèi)參基因的穩(wěn)定性排名會(huì)有細(xì)微差異,因此有必要先使用多種分析軟件對(duì)RT-qPCR 結(jié)果進(jìn)行分析,再通過(guò)RefFinder 軟件對(duì)分析結(jié)果進(jìn)行綜合排名,最終篩選出最佳的內(nèi)參基因[3,14]。
在確定內(nèi)參基因時(shí),首先需要使用geNorm 軟件,根據(jù)平均成對(duì)變異值(V) 的比值確定最佳內(nèi)參基因的數(shù)量,當(dāng)Vn/Vn+1值<0.15 時(shí),表明最佳內(nèi)參基因的數(shù)量是n 個(gè),當(dāng)Vn/Vn+1值>0.15 時(shí),則表明最佳內(nèi)參基因的數(shù)量是n+1 個(gè)[24]。在草菇的研究中指出Vn/Vn+1的比值不應(yīng)該是嚴(yán)格的0.15,經(jīng)geNorm軟件分析顯示最佳內(nèi)參基因的數(shù)量是2,研究者分別選擇了SPRYp+UBQ (穩(wěn)定性排名前二)、SPRYp+UBQ+TUBα (穩(wěn)定性排名前三) 和SPRYp+UBQ+TUBα+28S rRNA (穩(wěn)定性排名前三的基因加最不穩(wěn)定的28S rRNA 基因) 作為內(nèi)參基因,對(duì)G6PDH 基因的表達(dá)量進(jìn)行了分析,結(jié)果表明只要按照geNorm軟件分析出的最佳內(nèi)參基因數(shù)量選擇內(nèi)參基因,即使額外的內(nèi)參基因的穩(wěn)定性較差也不會(huì)影響目標(biāo)基因表達(dá)量的分析結(jié)果[3]。在其他研究中也提出使用2個(gè)最優(yōu)的內(nèi)參基因組合對(duì)RT-qPCR 的結(jié)果進(jìn)行校正和標(biāo)準(zhǔn)化是可靠的,但使用geNorm 軟件可能會(huì)給出1 個(gè)較為客觀的最佳內(nèi)參基因數(shù)量,使基因表達(dá)分析的結(jié)果更加精確。此外,許多食(藥) 用菌的研究結(jié)果表明,僅使用1 個(gè)內(nèi)參基因?qū)Π谢虻谋磉_(dá)量進(jìn)行分析是不夠的,需要根據(jù)候選內(nèi)參基因的排名情況,結(jié)合軟件推薦的最佳內(nèi)參基因數(shù)量,選擇2 個(gè)及以上的內(nèi)參基因?qū)T-qPCR 結(jié)果進(jìn)行校正,以保證分析結(jié)果的可靠性。
挑選出特定試驗(yàn)條件下某物種中穩(wěn)定表達(dá)的內(nèi)參基因,可以對(duì)靶基因的RT-qPCR 試驗(yàn)數(shù)據(jù)進(jìn)行校正。在毛木耳內(nèi)參基因篩選的試驗(yàn)中,為了進(jìn)一步驗(yàn)證篩選結(jié)果,研究人員分別以軟件分析得出的最佳基因組合(PP2A+UBQ) 和穩(wěn)定性最差的基因18S rRNA 為內(nèi)參基因,對(duì)靶基因LAC 的相對(duì)表達(dá)量進(jìn)行了分析驗(yàn)證,結(jié)果顯示使用穩(wěn)定性不同的內(nèi)參基因?qū)Π谢蜻M(jìn)行差異分析時(shí),其結(jié)果差異顯著[12]。在香菇[8]、草菇[3]、平菇[9]、靈芝[5]、杏鮑菇(Pleurotus eryngii)[28]、金針菇(Flammulina velutipes)[29]等研究中也出現(xiàn)了類似的現(xiàn)象。通過(guò)對(duì)不同的歸一化策略進(jìn)行測(cè)試,證明使用未驗(yàn)證的內(nèi)參基因?qū)TqPCR 數(shù)據(jù)進(jìn)行歸一化,可能會(huì)得到不準(zhǔn)確的結(jié)論,從而對(duì)基因表達(dá)背后的生物現(xiàn)象造成誤解。因此,在特定的試驗(yàn)條件下,篩選出穩(wěn)定的內(nèi)參基因是獲得可信的基因表達(dá)數(shù)據(jù)的前提。
由于RT-qPCR 技術(shù)在基因表達(dá)分析中的諸多優(yōu)點(diǎn),目前已成為許多研究者開(kāi)展食(藥) 用菌基因表達(dá)分析的主要技術(shù)。其中,根據(jù)試驗(yàn)?zāi)康暮Y選出在特定條件下穩(wěn)定表達(dá)的內(nèi)參基因尤為重要。通過(guò)對(duì)食(藥) 用菌內(nèi)參基因篩選研究進(jìn)展進(jìn)行整理,總結(jié)出以下幾點(diǎn)建議。
1) 建議根據(jù)所研究物種的轉(zhuǎn)錄組或表達(dá)譜數(shù)據(jù)來(lái)選擇候選內(nèi)參基因,以便能粗略估計(jì)候選內(nèi)參基因的表達(dá)量和穩(wěn)定性。
2) 若所研究的物種已經(jīng)有篩選內(nèi)參基因的相關(guān)報(bào)道,可將報(bào)道中穩(wěn)定性較好的內(nèi)參基因作為候選基因,但不建議直接作為內(nèi)參基因用于RT-qPCR數(shù)據(jù)分析,仍然需要根據(jù)即將開(kāi)展的試驗(yàn)對(duì)候選基因進(jìn)行篩選和驗(yàn)證。
3) 若缺乏轉(zhuǎn)錄組數(shù)據(jù),也可選擇目前在食(藥) 用菌中研究次數(shù)較多且穩(wěn)定性相對(duì)較好的傳統(tǒng)內(nèi)參基因作為開(kāi)展內(nèi)參篩選研究的候選基因。
4) 建議選擇多種算法對(duì)候選基因進(jìn)行分析排名。真正穩(wěn)定性好的基因在所有算法中均趨于穩(wěn)定,而穩(wěn)定性較差的基因在不同軟件中的排名會(huì)有很大波動(dòng)。
5) 使用geNorm 軟件分析可以確定最佳內(nèi)參基因的數(shù)量,進(jìn)而使用多個(gè)合適的內(nèi)參基因?qū)TqPCR 的數(shù)據(jù)進(jìn)行歸一化,從而保證靶基因表達(dá)分析的結(jié)果更加可靠。
6) 在即將開(kāi)展的試驗(yàn)條件下,對(duì)候選內(nèi)參基因進(jìn)行驗(yàn)證分析,才能獲得準(zhǔn)確的試驗(yàn)結(jié)果,最終揭示基因差異表達(dá)背后所代表的生物學(xué)意義。