丁 潛, 邢光東, 胡肄農(nóng), 紀紅軍, 趙慶順, 徐銀學
(1.南京農(nóng)業(yè)大學動物科技學院,江蘇 南京210095;2.江蘇省農(nóng)業(yè)科學院畜牧研究所,江蘇 南京210014;3.江蘇省農(nóng)業(yè)科學院獸醫(yī)研究所,江蘇 南京210014;4.南京大學模式動物研究所,江蘇 南京210061)
豬個體身份識別在豬場管理、豬肉產(chǎn)品溯源等方面意義重要。技術簡單、成本低廉且操作簡單的耳標等傳統(tǒng)方法仍是豬場的主要個體識別方法,但應用中存在易損、易脫落丟失、易混淆等缺陷?;趥鹘y(tǒng)方法的不足,近年來DNA 個體鑒定方法,包括微衛(wèi)星標記、SNP 標記等在內的個體鑒定方法成為研究熱點[1-3],但仍無法得到實際應用。針對以上情況,我們依據(jù)NCBI 數(shù)據(jù)庫中已登錄的SNP 相關信息[4],設計并篩選可有效且特異進行PCR 擴增的引物對,以獲得高雜合度SNP 位點,用于豬個體身份DNA 條形碼及相應的數(shù)字條形碼編制,實現(xiàn)豬個體身份的DNA 識別。
68 頭杜洛克(Duroc)豬的耳組織樣采自杭州大觀山種豬場,-20 ℃冷凍保存?zhèn)溆??;蚪MDNA模板用DNA Mini Extract 試劑盒(南京潤邦生物技術有限公司產(chǎn)品)制備,具體制備過程如下(單個樣本):小米粒大小(1 mm3左右)耳組織放入裝有17.6 μl DNA Mini Extract (A、B 液混合而成)的PCR 管中,PCR 儀中95 ℃5 min,16 ℃1 min(在此過程中暫停PCR 儀,加入10 mg/ml蛋白酶K 2.4 μl),55 ℃2 h,95 ℃10 min,16 ℃1 min,離心取上清或上清混合成模板作PCR 模板。
根據(jù)NCBI 登錄的豬基因組序列,共設計31 對引物,其中8 對引物的混合樣本PCR 產(chǎn)物電泳條帶單一,直接測序峰圖背景干凈易讀且包含1 個或多個套峰,并獲得H≥0.10 的SNP 位點(表1、表2)。引物擴增的PCR 體系(20 μl)為:樣品基因組DNA模板1 μl,正反引物各1 μl,超純水7 μl,2 × PCR Master Mix 10 μl。反應條件為:95 ℃先變性2 min;95 ℃變性30 s,退火30 s,72 ℃延伸50 s,共35 個循環(huán);72 ℃最后延伸10 min。各引物對的退火溫度和延伸時間見表1。PCR 擴增產(chǎn)物測序結果用Vector NTI Advance 11 軟件比對,并結合分析測序峰圖,以篩選SNP 位點。
表1 篩選的8 對引物相關信息及其退火溫度和延伸時間Table 1 Information of 8 primer pairs and their annealing temperatures and extending times for PCR reactions
基因的同一條染色體或擴增片段SNP 位點之間存在關聯(lián)性,即SNP 位點連鎖不平衡(Linkage disequilibrium,LD)現(xiàn)象。根據(jù)68 個杜洛克個體的擴增片段測序結果,對獲得的39 個SNP 位點的關聯(lián)性進行分析。剔除完全關聯(lián)的SNP 位點,并過濾雜合度小于0.10 的SNP 位點,根據(jù)剩余的16 個SNP 位點,對擴增片段進行基因分型。
雜合度反映一個位點具有2 個以上等位基因的期望值。雜合度小的SNP 位點出現(xiàn)單一純合基因型的概率較大,用于個體識別的意義也相對較小。為了使研發(fā)的DNA 個體身份識別技術更有效,選用雜合度H≥0.10 的SNP 位點。雜合度值的計算公式如下:
式中,H是雜合度值,Pi是每個SNP 的等位基因頻率,n是等位基因的數(shù)目。
8 對引物擴增的有效SNP 位點共計39 個,經(jīng)連鎖不平衡分析及雜合度計算,最終確定16 個SNP位點用于杜洛克豬個體身份識別的條形碼編制。SNP 條形碼中SNP 位點的排列,以引物對1 ~8 的次序依次排列(其中每對引物的SNP 位點以5'-至3'-順序依次排列),組合成SNP 條形碼。其中SNP位點以每對引物擴增產(chǎn)物(正向引物)的第1 個堿基所在位置計為+1 進行標識。每個SNP 位點可形成AA、TT、GG、CC、AT、AG、AC、TG、TC、GC 10 種基因型,當依次分別用數(shù)字0、1、2、3、4、5、6、7、8、9 共10 個數(shù)字替代時,每個個體不同SNP 位點的基因型就轉換為相應的數(shù)字SNP 條形碼。
8 對引物擴增68 頭杜洛克豬基因組DNA 樣并測序,共獲得39 個SNP 位點(表2)。經(jīng)SNP 位點連鎖不平衡分析及雜合度篩選(H≥0.10),最終選留16 個SNP 位點用于杜洛克豬的個體身份識別(表2)。剔除的23 個SNP 位點,或與選留的SNP位點完全連鎖,或其雜合度H<0.10。雖然雜合度H<0.10 的SNP 位點也能夠與其他SNP 位點一起組成數(shù)量極少的基因型,但是因為雜合度過低,在繁育過程中容易產(chǎn)生單一純合子而在后代中丟失多態(tài)性,在個體識別中意義不大。
表2 8 對引物在杜洛克豬中獲得的39 個SNP 位點Table 2 The 39 SNP loci obtained by 8 PCR primer pairs in Duroc pigs
選留的16 個H≥0.10 的SNP 位點用于杜洛克豬個體身份識別條形碼編制。在豬個體識別中,同窩豬樣品的個體識別理論上是最困難的,試驗中能夠完全區(qū)分的68 個樣品來自10 窩豬,而由這16 個SNP 組成的基因型能夠在68 頭杜洛克豬中,完全區(qū)分每個個體,實現(xiàn)個體識別(表3)。
表3 編制的用于個體身份識別的部分杜洛克豬SNP 條形碼及相應的數(shù)字條形碼Table 3 SNP and their corresponding digital barcodes of some of the Duroc pigs used for individual identification
傳統(tǒng)的耳標等豬個體識別技術[5],一旦與肉產(chǎn)品分離就會失去作用,而基因標記技術可以彌補這一缺陷[6]?;驑擞浖夹g將成為新一代的溯源或個體識別標記技術。在基因標記技術中,SNP 標記被公認為最具有潛在的實際應用價值。豬共有18對常染色體,每個SNP 位點存在3 種基因型,如果每對染色體僅篩選、利用1 個雜合度高的SNP 位點,那么理論上18 個SNP 位點就可以組成近4 億(318=387 420 489)種基因型。實際上每條染色體上可利用的SNP 位點很多(1 對引物可同時擴增出多個SNP 位點,且可組成多種可利用的基因型),篩選SNP 位點并用于豬的個體身份識別是可行的。本研究篩選的8 對引物擴增片段中組成的基因型分別有2、10、9、3、3、9、3、3 種,理論上可以用于131 220(2 ×10 ×9 ×3 ×3 ×9 ×3 ×3)頭豬的個體身份識別,試驗中也很好地區(qū)分了所采集的68 頭豬的樣品。
在NCBI 公共數(shù)據(jù)庫中獲得的候選SNP 被用到遺傳學研究中之前,這些SNP 的驗證和其等位基因頻率的估計是必須的[7]。而對這些SNP 的等位基因頻率估算,需要大量且相關度低的樣品,成本很高[8]。通過混合等量個體DNA 樣品形成混樣來檢測等位基因頻率,高效且廉價,能夠大大地減少DNA 的用量及分析費用[7]。這是本試驗選擇使用混合模板的原因。
我們先通過混樣PCR 產(chǎn)物測序,粗略檢測SNP位點存在情況,再由每個個體的SNP 位點檢測,最終確定1 對引物所擴增的片段是否含有多個SNP位點存在?;鞓覲CR 產(chǎn)物測序時會出現(xiàn)套峰,無論是個別優(yōu)勢模板PCR 的結果,或是部分模板PCR產(chǎn)物混合的結果,都能在一定程度上說明套峰出現(xiàn)位置存在SNP 位點。在混樣測序的結果中,有3 處套峰都說明該處存在SNP,+502 處雖然在單個樣品測序中發(fā)現(xiàn)了SNP,但在混合樣品測序中并沒有發(fā)現(xiàn),查找其對應的雜合度可知,+502 處的雜合度為0.13,較其他3 處0.37 低了很多。說明混樣測序中套峰的出現(xiàn),在一定程度上表明該處存在SNP 且雜合度較高。
SNP 位點連鎖不平衡,是指同一條染色體上,2個SNP 位點間的非隨機相關,即位于同一條染色體的2 個SNP 位點同時存在的概率,大于群體中因隨機分布而同時出現(xiàn)的概率。2 個SNP 位點完全連鎖不平衡時,這2 個SNP 位點組成的單體型只有2種,在用作個體身份識別時2 個一起的效果和單獨一個是相同的,這樣的SNP 位點只取其一即可。本試驗中引物對3 共獲得9 個SNP 位點,其中+470、+499 和+530 這3 個SNP 所組成的基因型只有TTTTTT、CCGGCC 和TCTGTC 這3 種,在其余65 個樣品中這3 個SNP 也只能組成該3 種基因型。說明在該群體中,若排除新的SNP 出現(xiàn),則+470、+499 和+530 這3 個SNP 只有TTT 和CGC 這2 種單體型,SNP 完全關聯(lián),所以+470、+499 和+530 這3 個SNP 中取+470 一個用作個體鑒定即可。而+502 位置和+ 470 位置的SNP 共可組成TCCC、TCTC、TTCC、CCCC 4 種基因型,推斷這2 個位置有TC、CC、TT 這3 種單體型,SNP 沒有完全關聯(lián),所以+470 和+502 都可用于個體識別。8 對引物擴增的SNP 位點經(jīng)過連鎖不平衡分析,完全連鎖的SNP位點都只保留一個。其中,雖然引物對2 和引物對3 在同一條染色體上,但這2 對引物所擴增的片段在染色體上相距約9 Mbp,擴增的SNP 位點之間沒有發(fā)現(xiàn)完全的連鎖不平衡。雜合度過低(H<0.10)的SNP 位點對于個體識別的意義不大,編碼SNP 條形碼和對應的數(shù)字條形碼時,予以舍棄。
[1] INAGAKI S,YAMAMOTO Y,DOI Y,et al.A new 39-plex analysis method for SNPs including 15 blood group loci[J].Forensic Sci Int,2004,144(1):45-57.
[2] LEE H Y,PARK M J,YOO J E,et al.Selection of twenty-four highly informative SNP markers for human identification and paternity analysis in Koreans[J].Forensic Sci Int,2005,148(2-3):107-112.
[3] ZENG Z,WANG L,F(xiàn)ENG Q,et al.Evaluation of 96 SNPs in 14 populations for worldwide individual identification[J].Forensic Sci,2012,57(4):1031-1035.
[4] VAN TASSELL C P,SMITH T P,MATUKUMALLI L K,et al.SNP discovery and allele frequency estimation by deep sequencing of reduced representation libraries[J].Nat Methods,2008,5(3):247-252.
[5] MADEC F,GEERS R,VESSEUR P,et al.Traceability in the pig production chain[J].Rev Sci Tech,2001,20(2):523-537.
[6] GOFFAUX F,CHINA B,DAMS L,et al.Development of a genetic traceability test in pig based on single nucleotide polymorphism detection[J].Forensic Sci Int,2005,151(2-3):239-247.
[7] SASAKI T,TAHIRA T,SUZUKI A,et al.Precise estimation of allele frequencies of single-nucleotide polymorphisms by a quantitative SSCP analysis of pooled DNA[J].Hum Genet,2001,68(1):214-218.
[8] RISCH N,TENG J.The relative power of family-based and casecontrol designs for linkage disequilibrium studies of complex human diseases I.DNA pooling[J].Genome Res,1998,8(12):1273-1288.