李 玲,李業(yè)芳,梁奔夢,孫玉江,馬月輝,馬 青,蔣 琳*,劉書琴
(1.青島農(nóng)業(yè)大學(xué)動物科技學(xué)院,青島 266109; 2.中國農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所,北京 100193; 3.寧夏農(nóng)林科學(xué)院動物科學(xué)研究所,銀川 750002; 4.東營職業(yè)學(xué)院,東營 257091)
灘羊是我國優(yōu)良的地方綿羊種質(zhì)資源之一,原屬蒙古羊,具有個體大、增重快、耐干旱、耐熱、耐低營養(yǎng)水平、抗逆性強、抗病力強、適應(yīng)性強等優(yōu)良特性,其肉質(zhì)鮮美,裘皮更是中外聞名。然而,由于存在飼養(yǎng)規(guī)模小且分散等問題,灘羊的生存空間不斷減少。另外,養(yǎng)殖戶對灘羊的資源保護意識非常薄弱,甚至受到某些利益驅(qū)使,對灘羊進(jìn)行盲目雜交,致使純種受到威脅。因此,亟待進(jìn)行準(zhǔn)確遺傳評估和科學(xué)化管理,以提高灘羊的總體生產(chǎn)水平。系譜對動物遺傳及育種研究至關(guān)重要,但在散戶甚至場區(qū)的養(yǎng)殖過程中,難免會出現(xiàn)不可避免的失誤,導(dǎo)致系譜記錄不全或錯誤。家畜育種工作中,親子鑒定能夠補全一部分缺失的親子代關(guān)系,對優(yōu)良種畜的保護和繁衍具有重要意義。
近年來,在動物領(lǐng)域中,分子標(biāo)記已然成為親子鑒定的首選遺傳標(biāo)記,其由來已久。此前出現(xiàn)的傳統(tǒng)標(biāo)記方法,如形態(tài)標(biāo)記、細(xì)胞標(biāo)記和生化標(biāo)記,由于極易受到外界環(huán)境的干擾,準(zhǔn)確率低,無法成功判斷,因此在實際應(yīng)用中受到了諸多限制。而利用DNA多態(tài)性進(jìn)行親子鑒定技術(shù)具有更靈敏、穩(wěn)定、準(zhǔn)確可靠等優(yōu)點,以DNA多態(tài)性為代表的新型分子標(biāo)記有限制性片段長度多態(tài)性(restriction fragment length polymorphism,RFLP)、隨機擴增多態(tài)性DNA(random amplified polymorphic DNA,RAPD)、擴增片段長度多態(tài)性(amplified fragment length polymorphism,AFLP)、簡單重復(fù)序列(simple sequence repeat,SSR)和單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)等。SNP具有二態(tài)性,它包括堿基的替換、顛倒、插入和缺失4種情況,在生物體中數(shù)量龐大,一些常見的哺乳動物全基因組中,SNP的頻率約為每500~1 000個堿基出現(xiàn)一次,在基因組中數(shù)量多、分布廣,具有檢測簡單,變異率低且遺傳穩(wěn)定性高等眾多優(yōu)點。迄今為止,在親緣鑒定領(lǐng)域,盡管基于微衛(wèi)星的研究依然占據(jù)絕大多數(shù),但是隨著下一代測序技術(shù)的興起,微衛(wèi)星標(biāo)記的使用量急劇下降,特別是在群體遺傳學(xué)和局部適應(yīng)的研究中。SNP作為典型的下一代測序標(biāo)記,目前在親緣分析中仍未得到充分利用,但正在獲得動力,是最具發(fā)展?jié)摿Φ姆肿訕?biāo)記。許多研究比較了SNP和微衛(wèi)星在親子關(guān)系中的效力。早在21世紀(jì)初,Hauser等就證明了SNP比STR更加敏捷,之后周磊等模擬了10 000對含微衛(wèi)星或SNP標(biāo)記信息的非親子關(guān)系的個體,發(fā)現(xiàn)當(dāng)SNP和微衛(wèi)星標(biāo)記的平均雜合度分別為0.363和0.566時,需要的SNP標(biāo)記數(shù)約是微衛(wèi)星標(biāo)記的2倍。余國春在豬親子鑒定中發(fā)現(xiàn),30個SNPs就能達(dá)到12個微衛(wèi)星同樣的鑒定效力,并且隨著SNP數(shù)目的增加,親緣概率逐漸達(dá)到了1。由于SNP標(biāo)記在不同品種和群體中具有很高的差異性,因此大量研究在不同動物中開展,例如牛、羊、水產(chǎn)動物等,但對灘羊的研究尚未見報道。鑒于此,本研究特異性針對我國寧夏地區(qū)灘羊進(jìn)行親子鑒定,補充場內(nèi)現(xiàn)有的系譜,尋找適合的部分SNP組合,為親子鑒定提供了便利,對鹽池地區(qū)灘羊的保種與利用具有重要意義。
本研究試驗材料為我國寧夏灘羊場的159只灘羊,包括106個子代個體,以及有系譜記錄的4個父本個體和49個疑似父本個體。頸靜脈采集它們的血液并置于EDTA抗凝管中,過程中為防止凝固,邊采血邊搖勻,最后置于-80 ℃冰箱中長期保存。
對所有血樣均采用Promega試劑盒提取基因組DNA,Nanodrop1000(Thermo Fisher Scientific, DE)進(jìn)行基因組DNA的質(zhì)量和濃度檢測,檢測結(jié)果合格后交由北京康普森生物技術(shù)有限公司采用600K綿羊芯片進(jìn)行SNP基因分型。
根據(jù)全基因重測序數(shù)據(jù),利用PLINK(V1.90)軟件對所獲得的159個灘羊個體的SNPs進(jìn)行嚴(yán)格的質(zhì)量控制,標(biāo)準(zhǔn)為:個體檢出率大于0.9、位點檢出率大于0.9、最小等位基因頻率(MAF)大于 0.05、位點要符合哈代-溫伯格平衡(HWE)。
SNP經(jīng)Prune后(-indep-pairwise 1 000 5 0.5),使用Rstudio(V4.1.2)軟件進(jìn)行主成分分析(principal component analysis,PCA)。PCA是一種降維的分析方法,它把多個變量通過線性變換選出較少個數(shù)重要變量,以得到樣本的聚類情況,從而揭示灘羊樣本的遺傳背景,輔助后續(xù)的分析。
系統(tǒng)進(jìn)化樹是以類似樹狀分支的圖形分析各種(類)生物之間的親緣關(guān)系,基于SNP頻率構(gòu)建遺傳距離矩陣,利用MEGA(V7.0.26)軟件,采用鄰接法(Neighbour Joining,NJ)繪制,依據(jù)樣本的聚類數(shù)目劃分各個家系。
對質(zhì)控后的SNP及個體信息導(dǎo)入Cervus(V3.0.7)軟件進(jìn)行分析,用于親子鑒定研究的SNP篩選標(biāo)準(zhǔn)為:個體檢出率大于0.95、位點檢出率大于0.9、MAF大于 0.48、位點符合哈代-溫伯格平衡、每條染色體上相鄰SNP間距大于10 Mb。
親子鑒定常用的方法有兩種,分別是排除法和似然法。排除法是根據(jù)孟德爾的基因分離和自由組合定律,子代的等位基因須分別來自父本和母本同一位點的基因型,確定子代與候選親本是否存在親子關(guān)系,適用于位點較多的分析,本研究選用似然法進(jìn)行親子關(guān)系推斷。Cervus(V3.0.7)軟件首先通過Allele Frequency Analysis模塊計算各位點的基因頻率、雜合度、多態(tài)信息含量和排除概率,之后在Simulation模擬分析中估計各置信水平下候選親本的LOD與對應(yīng)的Delta臨界值,依據(jù)此值進(jìn)行正式親子鑒定分析,最終找到真實親本。其中,LOD值大于0表示候選親本比無關(guān)親本更可能成為子代的真實親本,且LOD值越大可靠性越高。當(dāng)出現(xiàn)多個LOD>0的候選親本時,再通過Delta值(Δ,候選父母親權(quán)可靠性的統(tǒng)計值)分配最可能的親本(n≥2,Δ=LOD1-LOD2;n=1,Δ=LOD;n=0,Δ無意義)。
2.1.1 154個個體遺傳結(jié)構(gòu)分析 基因型文件經(jīng)質(zhì)控后,剔除5個子代個體,因此剩余154只灘羊和234 337個獨立的SNPs位點用于后續(xù)分析。PCA散點圖(圖1a)中綠色圓點代表父本,紅色圓點代表子代,可以看出,樣本整體分成3部分,在PC1的正值方向,最右邊的家系很明顯的與其他兩個區(qū)分開;除圖上標(biāo)注的系譜記錄的4個父本外,其余疑似父本都集中在左下角部位,表明他們之間的遺傳背景非常接近。NJ樹顯示(圖1b),灘羊群體聚集成3個獨立的大分支,圖中用紅色、藍(lán)色和黃色加以區(qū)分,這與PCA結(jié)果一致;加粗樹枝的個體代表父本,多數(shù)聚集在紅色大分支上,遺傳距離相近,少數(shù)分布在另外幾個分支上,遺傳距離較遠(yuǎn)。
a.綠色圓點代表父本,紅色圓點代表子代,150141、160015、130067、140195為系譜記錄的父本;b.加粗黑色分支為候選父本,加粗紅色分支為系譜記錄的父本a.The green dots represent the male parent, the red dots represent the offspring, and 150141, 160015, 130067, 140195 are the male parents recorded in the pedigree; b. The bold black branch is the candidate male parent, and the bold red branch is the male parent recorded in the pedigree圖1 154個個體PCA與NJ樹Fig.1 154 individuals PCA and NJ tree
2.1.2 100個個體遺傳結(jié)構(gòu)分析 為進(jìn)一步觀察黃色大分支(圖1b)內(nèi)個體的聚類情況,本研究提取了這100個樣本進(jìn)行分析,PCA(圖2a)和NJ樹(圖2b)將它們劃分成3個分支。因此,綜合上述研究結(jié)果,154只灘羊可分為5個大家系。
a. 綠色圓點代表父本,紅色圓點代表子代,150141、160015、140195為系譜記錄的父本;b.加粗黑色分支為候選父本,加粗紅色分支為系譜記錄的父本a. The green dots represent the male parent, the red dots represent the offspring, and 150141, 160015, 140195 are the male parents recorded in the pedigree; b. The bold black branch is the candidate male parent, and the bold red branch is the male parent recorded in the pedigree圖2 100個個體PCA與NJ樹Fig.2 100 individuals PCA and NJ tree
2.2.1 SNP標(biāo)記分布情況 在PLINK的嚴(yán)格質(zhì)控下,篩選得到211個可用于親子鑒定的高質(zhì)量SNPs,在染色體上的具體的分布情況如圖3所示,它們分布于26條染色上,平均間距為10.81 Mb,其中,1號染色體上的標(biāo)記數(shù)最多,有26個,平均間隔是10.75 Mb。Allele Frequency Analysis計算結(jié)果可知(表1),該標(biāo)記組合的平均期望雜合度()是0.502;平均多態(tài)信息含量()為0.375,屬于中度多態(tài)性位點;母本未知時,單親累積父權(quán)排除概率高于99.99%,具有很高的親子鑒定準(zhǔn)確性和可靠性。
圖3 SNPs標(biāo)記在26條染色體上的分布情況Fig.3 Distribution of SNPs markers on 26 chromosomes
表1 SNP標(biāo)記信息Table 1 SNP markers information
2.2.2 父權(quán)鑒定結(jié)果 Simulation模擬分析10 000個子代,結(jié)果見表2。在80%的置信水平下,模擬LOD臨界值為-39,72%的子代被分配了親子關(guān)系,2 779個子代未找到真實親本;95%置信度下,分配率為63%。在此模擬環(huán)境下,導(dǎo)入質(zhì)控后剩余的101個子代個體做父權(quán)鑒定分析,結(jié)果發(fā)現(xiàn)(表3),80%置信度下,有88個子代被分配了親子關(guān)系,13個未找到真實父本;95%置信水平下,觀測鑒定率為79%;與原有系譜對照得知,僅12個子代的父本與系譜記錄一致,其余在疑似父本中找到。
表2 父權(quán)鑒定模擬-LODTable 2 Paternity identification simulation-LOD
表3 父權(quán)鑒定參數(shù)Table 3 Paternity authentication parameters
SNP攜帶著大量的遺傳信息,已經(jīng)應(yīng)用于人類和動物的親子鑒定中,而在灘羊中的研究尚未見報道。Strucken等對3個牛群和2個羊群研究后,發(fā)現(xiàn)僅已知一個親本基因型且基因分型誤差為1%的情況下,至少需要200個SNPs標(biāo)記進(jìn)行親本檢驗。王悅等在新疆綿羊SNP親子鑒定的研究中,發(fā)現(xiàn)不同MAF梯度和不同數(shù)目的SNP對親子鑒定準(zhǔn)確性的影響不同,MAF越大,累積排除概率(CPE)增長速度越快。郭剛等在對北京地區(qū)荷斯坦牛進(jìn)行親子鑒定研究時,采用了最小等位基因頻率(MAF)大于0.45、同一染色體上的標(biāo)記之間大于10 Mb的篩選標(biāo)準(zhǔn),本研究在郭剛等篩選的基礎(chǔ)上,又縮小MAF范圍為大于0.48,故該標(biāo)記組合具有很高的鑒定可靠性。
除以上影響因素外,殷彬在奶牛的系譜分析中發(fā)現(xiàn),親子鑒定的排除概率還與位點的期望雜合度和多態(tài)信息含量呈顯著正相關(guān),根據(jù)Botstein等提出的當(dāng)0.25<<0.5時,標(biāo)記為中度多態(tài)位點,>0.5時為高度多態(tài)位點,<0.25為低多態(tài)位點,本研究篩選出的標(biāo)記平均多態(tài)信息含量為0.375,屬于中度多態(tài)性。郭立平的試驗證明了45個左右平均期望雜合度為0.5的SNP能夠抵消75個平均期望雜合度為0.3的SNP位點。Zhang等在中國西門塔爾牛的SNP開發(fā)中,選出了50個高信息含量的SNP標(biāo)記,它們的平均期望雜合度、平均多態(tài)信息含量分別為0.499 8和0.374 8,MAF在0.440 4~0.496 0之間,累積排除概率為99.89%,而本研究篩選到的SNP數(shù)量遠(yuǎn)高于50個,且標(biāo)記的平均期望雜合度為0.502,累積排除概率超過了99.99%,綜合所有參數(shù),理論上,這211個SNPs標(biāo)記具有很高的親子鑒定準(zhǔn)確效力,能夠滿足灘羊親緣關(guān)系推斷的條件。
經(jīng)推斷,被分配親子關(guān)系的個體中,補充了一部分缺失的親子關(guān)系,同時一部分子代的真實親本也得到了糾正。劉峻宇等研究凡納濱對蝦SNP的親緣關(guān)系驗證分析得到,雙親鑒定,實際鑒定率很高,這可能是由于本試驗采樣的親本均為父本,缺少母本材料,雙親較單親檢測親子鑒定效果更好。此外,PCA和NJ樹表明,采集的疑似父本間遺傳距離很接近,Cervus(V3.0.7)軟件很難判斷親子關(guān)系,所以導(dǎo)致本研究的鑒定率較低。在父權(quán)鑒定模擬中,需要確定抽樣父本所占比例,一般設(shè)置小于1,除非真實親本全部在采樣個體中,本研究設(shè)置為0.6,再加上系譜記錄不完全,這種情況下應(yīng)該增加SNP的數(shù)量,以期達(dá)到更高的鑒定率。但本研究篩選出的標(biāo)記質(zhì)量極高,信息含量豐富,211個完全滿足親子鑒定的要求。另外,在有結(jié)果的子代中,很大部分真實親本在疑似父本中被找到,說明系譜記錄有一定的錯誤,在實際生產(chǎn)中養(yǎng)殖場還應(yīng)該加強對系譜的管理,預(yù)防錯誤的發(fā)生。
本研究將寧夏灘羊場采集的樣本劃分為5個家系,并在灘羊中篩選出可用于親子鑒定的211個高質(zhì)量SNPs,該組合的平均期望雜合度為0.502,平均多態(tài)信息含量為0.375,屬于中度多態(tài)性位點,單親累積排除概率大于99.99%,具有很高的準(zhǔn)確性和可靠性,為灘羊的保護和繁育提供寶貴的參考價值。