胡世賢,陸佳濤,徐福意,晁天柱,周梁良,李凱,周宇荀,肖君華
(東華大學生物科學與技術研究所,上海 201620)
利用表達譜芯片數據篩選不同表達豐度的內參基因
胡世賢,陸佳濤,徐福意,晁天柱,周梁良,李凱,周宇荀,肖君華*
(東華大學生物科學與技術研究所,上海 201620)
目的 基于表達譜芯片的檢測結果,篩選多個內參基因,用于小家鼠肝臟組織中具有不同表達豐度基因的定量檢測。方法 應用表達譜芯片技術,完成小鼠肝臟組織的表達譜檢測;依據基因表達豐度將基因分為3組,并進一步通過變異系數(coefficient of variation, CV)組內篩選候選內參基因;采用實時熒光定量PCR技術(real-time quantitative polymerase chain reaction, qPCR)和geNorm軟件確定內參基因。結果 表達譜芯片成功采集超過60000個小鼠肝臟組織中轉錄本的表達量數據,并將之分為低、中、高3個組合。最終篩選了低表達Casp2和Lrrc14、中表達Nrd1和Trpc4ap、高表達Atp5a1和Clu,共6個內參基因。結論 基于表達譜芯片數據篩選的6個內參基因,可適用于qPCR技術準確定量小家鼠肝組織轉錄組中不同表達豐度基因的表達量。
內參基因;表達譜芯片;實時熒光定量PCR;geNorm軟件
血脂水平異常是動脈粥樣硬化、心臟病和脂肪肝密切相關的重要危險因素[1]。隨著系統(tǒng)遺傳學的蓬勃發(fā)展,研究者們利用高血脂小鼠模型,結合基因組學、轉錄組學、表型組學等知識,在血脂相關遺傳學研究中取得了豐碩的成果[2]。其中,基因表達分析在轉錄組水平上,是研究血脂等復雜性狀不可或缺的方法[3]。常用的技術如基因表達譜芯片,操作方便,通量高,可準確快速得到完整的全基因組表達豐度數據,但是昂貴的價格限制了其應用。與之相比,具有高靈敏性,高重復性,高特異性的實時熒光定量PCR技術是核酸分子定量的“金標準”[4]。
在qPCR相對定量實驗中,目前被廣泛采用的是2-△△CT法。△Ct表示目標基因和內參基因Ct值的差異,-△△Ct表示兩樣本間△Ct之差。當目標基因和內參基因擴增效率相差不大時,兩樣本間檢測基因相對表達量差異即為2-△△Ct[5]。因此,定量的準確性與內參基因的選擇密切相關。理想的內參屬于維持細胞基本生物學特征的基因,應具備兩個重要特點:1)表達穩(wěn)定,不受實驗環(huán)境的影響[6];2)與待測基因表達水平相近[7]。系統(tǒng)遺傳學研究中,內參基因常被用于qPCR在多樣本中定量數十甚至上百個目標基因,從而挖掘基因共表達網絡[8-10]。1999年Suzuki 等[11]提出的Gapdh、B2m等常用內參基因不具有通用性,一方面是由于其表達水平受到不同實驗條件的影響,另一方面?zhèn)鹘y(tǒng)內參基因的表達豐度較高,難以定量表達豐度較低基因[12]。因此,Radoni等[13]采用qPCR技術,針對13種已知候選內參基因獲取ΔΔCT最穩(wěn)定的2個基因作為內參;Almeida 等[14]采用qPCR array,在51個候選內參基因中篩選內參基因,其表達水平差異達到300倍。但是,從少量已知候選內參中選擇內參基因的方法,很難兼顧到表達穩(wěn)定性和表達豐度。
本研究以不同1號染色體替換系品系[15]的高血脂小鼠模型為樣本,采用表達譜芯片技術獲取小鼠肝臟組織的RNA表達數據,并進一步利用qPCR和geNorm軟件篩選內參基因,以期適用于qPCR定量肝組織轉錄本中不同豐度基因的表達量。
1.1 動物實驗與RNA提取
8周齡SPF級C57BL6/J(B6)小鼠(雄性14只),體重22~25 g,購自上海斯萊克實驗動物有限公司[ SCXK (滬) 2012- 0002]。動物實驗遵守1988年動物管理條例。實驗在東華大學生物科學與技術研究所屏障動物實驗設施進行[ SYXK (滬) 2014- 0022]。取野生小家鼠來源1號染色體替換系品系B6-Chr1KM、B6-Chr1HZ、B6-Chr1SJ和近交系B6的8周齡雄鼠,每個品系各14只,品系內分為2組(每組7只)分別喂食40%高脂飼料和10%對照飼料(上海諾寶生物科技有限公司)至20周齡。頸椎脫頸處死20周齡雄鼠后,即刻摘取肝臟組織,采用RNAiso Plus試劑(上海麥約爾生物技術有限公司)進行RNA抽提。以Nanodrop 2000c超微量分光光度計(Thermo Fisher Scientific,美國)和1% 甲醛變性瓊脂糖凝膠電泳鑒定RNA的質量和完整性,-80℃保存?zhèn)溆谩?/p>
1.2 表達譜芯片檢測和篩選候選內參基因
采用Mouse Transcriptome Assay 1.0(Affymetrix)芯片,對樣本進行表達譜檢測(上海其明信息技術有限公司)。用Expression Console和Transcriptome Analysis Console采集并分析數據,根據芯片信號值完成基因分組,每組篩選CV最低的基因(共21個)作為候選內參基因。用Oligo7跨越內含子設計引物,由上海生工生物工程有限公司合成,引物序列信息見表1。
1.3 qPCR驗證
采用RevertAid First Strand cDNA Synthesis Kit試劑盒(上海麥約爾生物技術有限公司)逆轉錄cDNA,操作步驟依據說明書進行。qPCR采用2 × SYBR Green/Rox qPCR Master Mix(北京百泰克生物科技有限公司)試劑盒,ABI 7900 real-time PCR system和7900 System Software-SDS 2.2 (Applied Biosystems)分析樣本,反應體系和反應條件依據說明書進行。
1.4 篩選內參基因
采用geNorm v3.5 軟件( https://www.biogazelle.com )根據平均變異度(M < 0.5)篩選穩(wěn)定表達的基因,每組選取M值最低的2個基因為內參基因。
2.1 芯片檢測分析
小鼠肝組織表達譜芯片檢測結果如圖1所示:轉錄本的平均信號值在3~20之間,將信號值在3~7的轉錄本定義為低表達組,包括54180個轉錄本;信號值在7~13為中表達組,包括9163個轉錄本;信號值在13~20為高表達組,包括2192個轉錄本。
表1 基因芯片表達分析所篩候選內參
注:a. 低表達水平基因;b. 中表達水平基因;c. 高表達水平基因;d. 傳統(tǒng)內參基因。
Note. a indicates low expression genes; b indicates moderate expression genes; c indicates high expression genes and d indicates traditional reference genes.
2.2 候選內參基因
根據CV越小基因表達水平越穩(wěn)定,在組合內選擇CV最小的轉錄本為候選內參基因。如表1所示,每個組合內初步篩選的候選內參,包括Sgsm3、Lrrc14、Klc1、Madd、Casp2、Ap2b1、Rpn2、Nrd1、Kpna6、Ppil2、Wnk1、Hars、Trpc4ap、Fth1、Mgst1、Ppia、Clu、Atp5a1、Vtn、Acaa2和Gapdh,所有候選內參基因表達量CV均低于1%。
2.3 qPCR驗證
qPCR的檢測結果如圖2所示,21個候選內參基因相對表達量差異達到15 個Ct值(不考慮個別離群值),約105,并可以明顯的分為3個組合,低表達組合為Sgsm3、Lrrc14、Klc1、Madd和Casp2,Ct值范圍25到28;中表達組合為Ap2b1、Rpn2、Nrd1、Kpna6、Ppil2、Wnk1、Hars和Trpc4ap,Ct值范圍21到25;高表達組合為Fth1、Mgst1、Ppia、Clu、Atp5a1、Vtn、Acaa2和Gapdh,Ct值范圍15到20。
注:Y軸表示芯片信號值(log2)。X軸表示區(qū)間內轉錄本頻數。圖1 小鼠肝臟基因表達量分布Note. The Y-axis indicates values (log2) of microarray. The X-axis indicates frequency of transcripts in intervals.Fig.1 Distribution of the mouse liver gene expression abundance
注:X軸表示候選內參基因,Y軸表示Ct值。藍色為低表達內參,橙色為中表達內參,綠色為高表達內參,灰色為對照內參基因。圖2 qPCR檢測小鼠肝臟候選內參表達量。Note. X-axis indicates candidate reference genes and Y-axis implies Ct value. Blue, orange, green and gray colors represent for genes of low abundance, moderate abundance, high abundance and reference, respectively.Fig.2 Candidate reference genes of the mouse liver tested by qPCR.
2.4 內參基因
geNorm軟件分析結果如圖3所示,21個候選內參基因除Ppia和Fth1 M值均大于0.5,其他候選內參M值都在0.5以下,其中Casp2和Lrrc14基因M值最小。在每個表達組合內,我們各選取了2個M值最小的基因作為理想的內參(表2),低表達組合為Casp2和Lrrc14,中表達組合為Nrd1和Trpc4ap,高表達組合為Atp5a1和Clu。
注:Y 軸表示候選內參基因的平均表達穩(wěn)定度 M 值,X 軸表示看家基因表達穩(wěn)定性由左向右逐步提高。圖3 候選內參表達穩(wěn)定性分析Note: Y-axis indicates the average expression stability values ( M) , and X-axis indicates the candidate reference genes according to their increasing expression stability from left to right.Fig.3 Stability analysis of candidate reference genes
表2 優(yōu)選內參基因
模式動物小鼠是血脂相關復雜疾病研究的重要模式動物,且發(fā)現不同的近交系小鼠對動脈粥樣硬化、脂肪肝等疾病的易感性不同。準確定量小鼠肝組織轉錄組中血脂代謝相關基因表達量情況,可構建基因共表達網絡,發(fā)現血脂代謝調控通路中的關鍵基因,從而促進血脂異常相關疾病的遺傳學研究。qPCR是定量技檢測基因表達量的最佳選擇,但qPCR在相對定量過程中需要用內參基因來標化檢測基因的表達量,再用2-△△CT法得到不同樣本間相對表達水平差異,而選擇合適的內參基因是影響qPCR相對定量準確度的重要因素[16]。因此針對小鼠肝組織轉錄組的qPCR定量檢測,需要篩選變異系數小、穩(wěn)定表達的看家基因。
本研究結果揭示,在表達譜芯片檢測結果中,65 536個檢測轉錄本的豐度差異超過105。根據變異系數篩選的21個候選內參基因中,包含傳統(tǒng)常用內參基因Ppia和Gapdh[17],說明其在小鼠肝臟組織中具仍能穩(wěn)定表達。針對常用于小鼠肝臟轉錄組[12]的內參基因B2m,Actb,Tfrc的表達譜數據分析結果發(fā)現,B2m、Actb和Tfrc表達量的CV分別為1.06%,1.77%,6.35%,均高于21個候選內參基因,說明其表達穩(wěn)定性較差,并不適用于本研究。23個基因qPCR檢測結果與表達譜芯片數據一致,除Actb表達水平在2種檢測方法中呈現了較大波動,同樣說明常用內參基因Actb不適用于本研究。geNorm軟件是基于不同條件下2個內參基因相對表達水平比值為定值的原理分析表達穩(wěn)定性,表達水平比值變異度M的增加意味著內參穩(wěn)定性的下降。因此內參基因的M值越小,就表示該基因越穩(wěn)定。此外,單個內參基因標化數據導致定量結果偏差數倍[18],多個內參基因能提高定量準確度[19,20],但內參基因數量過多也有操作不便,經濟成本高的缺點。因此,本研究在每個表達水平組合里,各選取了2個M值最低的內參基因。
總之,基于表達譜芯片數據挖掘內參基因的方法,能快速、精確的優(yōu)選轉錄組中表達水平最穩(wěn)定、表達豐度差異超過1000倍的內參基因。篩選的內參基因適用于qPCR相對定量小鼠肝組織中基因的表達量,對系統(tǒng)遺傳學中qPCR轉錄組表達分析具有重要的意義。
[1] 朱竟赫, 趙金明, 秦文艷,等. 高脂血癥實驗動物模型研究概述[J]. 實驗動物科學, 2012, 29(2):48-52.
[2] Leduc MS, Lyons M, Darvishi K, et al. The mouse QTL map helps interpret human genome-wide association studies for HDL cholesterol[J]. J Lipid Res, 2011, 52(6):1139-1149.
[3] Civelek M, Lusis AJ. Systems genetics approaches to understand complex traits[J]. Nature Rev Genet, 2014, 15(1):34-48.
[4] Yuan J S, Reed A, Feng C, et al. Statistical analysis of real-time PCR data[J]. BMC Bioinformatics, 2006, 7(4):563-569.
[5] Livak KJ, Schmittgen TD. Analysis of relative gene expression data using real-time quantitative PCR and the 2(-Delta DeltaC(T)) method[J]. Methods, 2001, 25(4):402-408.
[6] Lercher M J, Urrutia A O, Hurst L D. Clustering of housekeeping genes provides a unified model of gene order in the human genome[J]. Nature Genet, 2002, 31(2):180-3.
[7] Silver N, Best S, Jiang J, et al. Selection of housekeeping genes for gene expression studies in human reticulocytes using real-time PCR[J]. BMC Mol Biol, 2006, 7(1):1-9.
[8] Punt S, Houwing-Duistermaat JJ, Schulkens IA, et al. Correlations between immune response and vascularization qRT-PCR gene expression clusters in squamous cervical cancer[J]. Mol Cancer, 2015, 14(1):1-12.
[9] Spurgeon SL, Jones RC, Ramakrishnan R. High throughput gene expression measurement with real time PCR in a microfluidic dynamic array[J]. PloS One, 2007, 3(2):1662.
[10] Horst OV, Horst JA, Samudrala R, et al. Caries induced cytokine network in the odontoblast layer of human teeth[J]. BMC Immunol, 2011, 12(1):1-13.
[11] Suzuki T, Higgins PJ, Crawford DR. Control selection for RNA quantitation[J]. Biotechniques, 2000, 29(2):332-337.
[12] Hellemans J, Mortier G, Paepe AD, et al. qBase relative quantification framework and software for management and automated analysis of real-time quantitative PCR data[J]. Genome Biol, 2007, 8(2): R19.
[13] Radoni A, Thulke S, Mackay I M, et al. Guideline to reference gene selection for quantitative real-time PCR[J]. Biochem Biophys Res Comm, 2004, 313(4):856-862.
[14] Almeida TA, Quispe-Ricalde A, Oca FMD, et al. A high-throughput open-array qPCR gene panel to identify housekeeping genes suitable for myometrium and leiomyoma expression analysis[J]. Gynecol Oncol, 2014, 134(1):138-143.
[15] Xiao J, Liang Y, Li K, et al. A novel strategy for genetic dissection of complex traits: the population of specific chromosome substitution strains from laboratory and wild mice[J]. Mamm Genome, 2010, 21(7-8):370-376.
[16] Sellars MJ, Vuocolo T, Leeton LA, et al. Real-time RT-PCR quantification of Kuruma shrimp transcripts: A comparison of relative and absolute quantification procedures[J]. J Biotechnol, 2007, 129(3):391-399.
[17] Kouadjo KE, Nishida Y, Cadringirard JF, et al. Housekeeping and tissue-specific genes in mouse tissues[J]. BMC Genomics, 2007, 8(1): 127.
[18] Olsvik PA, Kai KL, Jordal AEO, et al. Evaluation of potential reference genes in real-time RT-PCR studies of Atlantic salmon[J]. BMC Mol Biol, 2005, 6(22):1-9.
[19] Jain M, Nijhawan A, Tyagi AK, et al. Validation of housekeeping genes as internal control for studying gene expression in rice by quantitative real-time PCR[J]. Biochem Biophys Res Comm, 2006, 345(2):646-651.
[20] Hoerndli F J, Toigo M, Schild A, et al. Reference genes identified in SH-SY5Y cells using custom-made gene arrays with validation by quantitative polymerase chain reaction[J]. Analyt Biochem, 2004, 335(1):30-41.
Screening of reference genes of different abundance using gene expression microarrays
HU Shi-xian, LU Jia-tao, XU Fu-yi, CHAO Tian-zhu, ZHOU Liang-liang, LI Kai, ZHOU Yu-xun,XIAO Jun-hua*
(Institute of Biological Sciences and Biotechnology, Donghua University, Shanghai 201620, China)
Objective Based on the data detected using gene expression microarray, to select multiple reference genes and use them to quantify transcriptome genes of different abundance in the mouse liver tissue. Methods To detect global transcriptome genes in the mouse liver tissues using gene expression microarray. All the genes were sorted into different groups according to their expression level, followed by coefficient of variation (CV) analysis. Real-time quantitative polymerase chain reaction (qPCR) and geNorm software were used to further identify the reference genes. Results The expression levels of over 60,000 genes were obtained from microarray screening, and divided them into low, moderate and high expression groups. Finally six reference genes were screened, i.e. Casp2 and Lrrc14 as low abundance, Nrd1 and Trpc4ap as moderate abundance, and Atp5a1 and Clu as high abundance genes. Conclusions The six reference genes derived from microarray data can be used to accurately quantify the global transcriptome genes with various expression levels.
Reference genes; Gene expression microarrays; Quantitative real-time PCR; geNorm software; Mouse; Liver
XIAO Jun-hua,E-mail: xiaojunhua@dhu.edu.cn
國家自然科學基金面上項目(編號:31371257);上海市科委關鍵項目(編號:12140900404,13140900300,15140900500)。
胡世賢(1991-),男,碩士研究生,研究方向:醫(yī)學分子遺傳學。E-mail: dhu.sxhu@hotmail.com
肖君華(1968-),男,教授,研究方向:醫(yī)學分子遺傳學。E-mail: xiaojunhua@dhu.edu.cn
Q95-33
A
1005-4847(2017) 01-0008-06
10.3969/j.issn.1005-4847.2017.01.002
2016-06-28