梅步俊+王志華
摘 要:數(shù)量遺傳學是遺傳學領域難度較大的課程,掌握數(shù)量遺傳學基本知識,并能將其應用到科研工作中,從事相關研究,需要學生擁有較為扎實的統(tǒng)計學基礎。但是,目前國內的統(tǒng)計學和數(shù)量遺傳學教學尚缺乏聯(lián)系。該文以數(shù)量遺傳學基本概念為主要內容,較為詳細的推導了數(shù)量遺傳學的基本原理和公式,為學生進一步理解該學科的的基本原理提供幫助,也為該學科的進一步研究提供基礎。
關鍵詞:教學改革;統(tǒng)計計算;數(shù)量遺傳學;復雜性狀
中圖分類號 G642.0 文獻標識碼 A 文章編號 1007-7731(2017)20-0018-04
數(shù)量遺傳學是遺傳學的一個特殊分支,該學科的研究對象是個體之間性狀“程度”的差異,而非“類型”的差異。這些個體間的差異被稱為數(shù)量差異或數(shù)量性狀[1],數(shù)量性狀被定義為在一個群體內的各個體間表現(xiàn)為連續(xù)變異的性狀[2]。數(shù)量性狀的表型受到基因和環(huán)境變異的共同影響,單個基因解釋的表型方差的比例通常是很小。然而,無數(shù)微效基因的聯(lián)合貢獻對表型的變異有重要意義。控制數(shù)量性狀變異的基因稱為數(shù)量性狀基因座(QTL)。在數(shù)量遺傳學文獻中,QTL代表單數(shù)形式,QTLs代表復數(shù)形式。但無論一個QTL有多小,它都像單個孟德爾位點一樣分離[3]。目前,常規(guī)的研究手段仍然捕捉不到小效應的QTL的分離現(xiàn)象,依然需要借助統(tǒng)計學方法來推斷基因間的分離現(xiàn)象。大多數(shù)應用于數(shù)量遺傳學的統(tǒng)計方法需要定義特殊的遺傳模型。
1 基因頻率和基因型頻率
動物育種領域只考慮二倍體生物。二倍體生物攜帶同源基因組的2個拷貝,一個來自父本親本,另一個來自母本的親本?;蚪M的每個拷貝稱為單倍體。因此,基因組的每個基因座都含有兩個等位基因,每個基因座均來自每個親本[4]。雖然每個個體最多攜帶2個不同的等位基因,但是整個群體可能有許多不同的等位基因,稱為復等位基因群體[5]。為了簡單起見,我們只考慮一個包含2個不同等位基因的種群,稱為二倍體群體。設特定群體[A]位點有2個等位基因[A1]和[A2]。在二倍體群體中,只可能有3種基因型,分別為[A1A1]、[A1A2]和[A2A2]。不同群體的結構和交配制度決定了其3種基因型比例的的不同,[P11=PrA1A1],[P12=PrA1A2]和[P22=PrA2A2]分別為3種基因型的頻率?;蛐蚚A1A1]、[A1A2]分別包含1個或2個等位基因[A1]。因此,整個群體[A1]的頻率為:
[p1=PrA1=P11+12P12]
[p2=PrA2=P22+12P12]
以上2個公式不考慮群體歷史和結構。但是,基因型頻率和基因頻率之間的函數(shù)關系需要一些假設。在大的隨機交配群體中,存在基因頻率和基因型頻率之間的獨特關系,可以表示為[P11=p21],[P12=2p1p2]和[P22=p22]。這可以解釋為2個獨立等位基因聯(lián)合在一起形成基因型[6]。因為包含2個相同的基因型,所以雜合子的頻率為[2p1p2],即[A1A2]和[A2A1]代表2種不同來源的配子。這個特殊的關系可由以下2項式擴展表示:
[p1+p22=p21+2p1p2+p22] (1)
對應于如下基因(型)分離組合事件:
[A1+A22=A1A1+2A1A2+A2A2] (2)
如果一個群體沒有選擇、突變和遷移,基因頻率和基因型頻率將在代際傳遞中一直保持不變,這樣的群體處于哈代-溫伯格平衡狀態(tài)[7]。如果一個大群體不處于哈代-溫伯格平衡,只要經過一代的隨機交配就足以使群體達到哈代-溫伯格平衡。
對于一個等位基因頻率[kk>2]群體的哈代-溫伯格平衡可表示為[Pij=2pipj],[i≠j];[Pii=p2i],[i=j],此處[Pij=PrAiAj]和[pi=PrAi],[i, j=1, …, k]。
基因頻率和基因型頻率是群體的基本特征。研究的基因通常與適合度有關,從而確定群體對環(huán)境變化的適應性和群體的進化。這些內容是群體遺傳學的研究內容。在數(shù)量遺傳學中,我們的研究對象是的決定數(shù)量性狀表型的基因,所以首先要為基因型和等位基因指派賦值,這些值被稱為遺傳效應。
2 遺傳效應和遺傳差異
群體中每個個體的數(shù)量性狀都有表型值。 假設我們可以觀察到群體中所有個體的基因型?;蛐蚚A1A1]的遺傳效應被定義為群體中攜帶基因型[A1A1]個體的表型平均值,該基因型值定義為[G11],[A1A2]和[A2A2]也可有類似定義。[G11]的效應等于平均表型效應,其原因如下。設[Y11]為攜帶基因型[A1A1]個體的表型值,則其可以表達為:
[Y11=G11+E11] (3)
此處,[E11]為隨機環(huán)境偏差。即使群體中的每個個體都有相同的基因型值,其環(huán)境偏差也各不相同。當對群體中所有個體求平均值時,上式變?yōu)椋?/p>
[Y11=G11+E11] (4)
[G11]個體數(shù)量足夠多時,因正負偏差相互抵消,則[E11≈0],[Y11=G11]。
可以定義3種參數(shù)為基因型值的函數(shù):
[μ=12G11+G22]
[a=G11-12G11+G22]
[=G11-μ] (5)
[d=G12-12G11+G22]
[=G12-μ]
此處,[μ]稱為中值,[a]為加性效應,[d]為顯性效應。因此,3種基因型值可以表示為:
[G11=μ+a]
[G12=μ+d] (6)
[G22=μ-a]
我們也可以將基因型值表示為中值的偏差:
[φ11=G11-μ=a]
[φ12=G12-μ=d] (7)endprint
[φ22=G22-μ=-a]
在溫代-哈伯格平衡下,基因型值的群體平均值可以表示為中值的偏差:
[μG=Eφ=P11φ11+P12φ12+P22φ22]
[=p21a+2p1p2d+p22-a]
[=p1-p2a+2p1p2d] (8)
基因型方差為:
[σ2G=varφ=Eφ2-E2φ] (9)
此處
[Eφ2=P11φ211+P12φ212+P22φ222]
[=p21a2+2p1p2d2+p22-a2]
[=p21+p22a2+2p1p2d2] (10)
經過一些代數(shù)運算,可得
[σ2G=2p1p2a+p2-p1d2+2p1p2d2] (11)
3 平均等位基因替代效應
個體的每個位點由2個等位基因組成,每個等位基因分別來自一個親本。2個等位基因在繁殖過程中將進入不同的配子。親本的配子將在子代重新組合,形成下一代的基因型。因此,基因型不能一代一代的遺傳下去,而是它是等位基因(單倍型)從一個世代傳遞到下一個世代[8]。因此,需要定義等位基因效應。本文用下面2×2表格定義等位基因效應。
等位基因[A1]的效應定義為:
[α1=φ11-μGp21+φ12-μGp2p1p1=p2a+dp2-p1] (12)
等位基因[A2]的效應定義為:
[α2=φ12-μGp1p2+φ22-μGp22p2=-p1a+dp2-p1]
(13)
2個等位基因之間的差值稱為平均等位基因替代效應,表示為[α]:
[α=α1-α2=a+p2-p1d] (14)
不同基因型中2個等位基因的效應和稱為“育種值”,其含義為個體攜帶這種基因型的后代的期望基因型值。因此,基因型[A1A1]的育種值為[A11=2α1=2p2α],另外2個基因型的育種值分別為[A12=α1+α2=p2-p1α]和[A22=2α2=-p1α]。真實基因型值和與育種值的差異稱為顯性偏差[9]。3種顯性偏差分別為:
[δ11=φ11-μG-A11=-2p22d]
[δ12=φ12-μG-A12=2p1p2d] (15)
[δ22=φ22-μG-A22=-2p21d]
3種基因型的基因型值(G)、育種值(A)和顯性偏差(D)列于表2。
4 遺傳方差組分
育種值和顯性偏差的期望為0,證明過程如下:
[EA=P11A11+P12A12+P22A22]
[=p212p2α+2p1p2p2-p1α+p22-2p1α=0] (16)
[ED=P11δ11+P12δ12+P22δ22]
[=p21-2p22d+2p1p22p1p2d+p22-2p21d=0] (17)
類似可以推導出:
[σ2A=EA2=p212p2α2+2p1p2p2-p1α2+p22-2p1α2=2p1p2α2]
(18)
[σ2D=ED2=p21-2p22d2+2p1p22p1p2d2+p22-2p1α2=2p1p2d2]
(19)
由遺傳性知識和公式(11)可得,第一部分(18)為[σ2A],第二部分(19)為[σ2D],因此:
[σ2G=σ2A+σ2D] (20)
即總遺傳方差可以被剖分為加性方差組分和顯性方差組分。
5 遺傳力
表型值[Y]可由如下線性模型表示:
[Y=G+E=A+D+E] (21)
上式中,[E]為環(huán)境誤差,其平均值為0,方差為[σ2E]。表型方差[σ2P=varY]為
[σ2P=σ2G+σ2E=σ2A+σ2D+σ2E] (22)
總遺傳方差和表型方差的比值稱為廣義遺傳力(broad-sense heritability)[10],表示為:
[H2=σ2A+σ2Dσ2A+σ2D+σ2E] (23)
廣義遺傳力經常被用在進化論研究中,而加性方差和表型方差的比值稱為狹義遺傳力(narrow-sense heritability)[11],表示為:
[h2=σ2Aσ2A+σ2D+σ2E] (24)
狹義遺傳力反映了性狀可以被遺傳下去的比例。因此,它在遺傳方案制定和遺傳改良工作中是非常重要的參數(shù)。
6 哈代-溫伯格平衡條件下的[F2]家系
此處,我們只考慮哈代-溫伯格平衡條件下,[A1A1]和[A2A2]純合系雜交形成的[F2]家系。等位基因頻率[p1=p2=12]時,相應基因型頻率[P11=p21=14],[P12=2p1p2=12],[P22=p22=14]。平均等位基因替代效應為[α=a+p2-p1d=a],因此,
[σ2G=2p1p2α2+2p1p2d2=12a2+14d2] (25)
以上結論還可從不同的角度獲得。[F2]個體的基因型值可以表示為:
[G=μ+Za+Wd] (26)
此處
[Z=+1 A1A1, P11=140 A1A2, P12=12-1 A2A2, P22=14] (27)
[W=0 A1A1, P11=141 A1A2, P12=120 A2A2, P22=14] (28)
基因型方差可以被剖分為:
[σ2G=σ2Za2+σ2Wd2=12a2+14d2] (29)endprint
此處
[σ2Z=EZ2-E2Z]
[=14+12+1202+14-12-14+1+120+14-12]
[=12-0=12] (30)
[σ2W=EW2-E2W]
[=1402+1212+1402-140+121+1402]
[=12-14=14] (31)
此處,假設[Z]和[W]的協(xié)方差為0;否則,基因型方差計算時需要增加[2covZ, Wad]項[12]。
以上,我們通過對數(shù)量遺傳學6個方面的基本內容(基因頻率和基因型頻率、遺傳效應和遺傳差異、平均等位基因替代效應、遺傳方差組分、遺傳力和哈代-溫伯格平衡條件下的[F2]家系)進行較為詳細的公式推導,力求為學生理解并彌合統(tǒng)計學和數(shù)量遺傳學理論的鴻溝奠定基礎。
致謝:本研究感謝美國愛荷華州立大學動物科學系Rohan L.Fernando教授、Hao Chen博士和Jian Zeng博士的幫助。
參考文獻
[1]Sherlock J.M.,B.P.Zietsch,J.M.Tybur,et al.The quantitative genetics of disgust sensitivity[J].Emotion,2016,16(1):43-51.
[2]Sherwood R.J.,D.L.Duren,E.W.Demerath,et al.Quantitative genetics of modern human cranial variation[J].Journal of human evolution,2008,54(6):909-914.
[3]Sorensen D..Developments in statistical analysis in quantitative genetics[J].Genetica,2009,136(2):319-332.
[4]Tachida H.C.C.Cockerham.A building block model for quantitative genetics[J].Genetics,1989,121(4):839-844.
[5]Tafti M.,D.Chollet,J.L.Valatx,et al.Quantitative trait loci approach to the genetics of sleep in recombinant inbred mice[J].Journal of sleep research,1999,8 Suppl 1:37-43.
[6]Visscher P.M.,Whole genome approaches to quantitative genetics.Genetica,2009,136(2):351-358.
[7]Walsh B..Quantitative genetics in the age of genomics[J].Theoretical population biology,2001,59(3):175-184.
[8]Walsh B..Quantitative genetics,version 3.0:where have we gone since 1987 and where are we headed? [J].Genetica,2009,136(2):213-223.
[9]Zhivotovskii L.A..Computer models of quantitative characteristics in genetics.Communication II.Dynamics of the frequency of alleles with different types of selection[J].Soviet genetics,1974,8(7):937-941.
[10]Schaffer H.E.L.E.Mettler.Teaching population fitness and adaptive surfaces in population and quantitative genetics[J].The Journal of heredity,1974,65(3):189-192.
[11]Kreitman N..Developments in quantitative genetics in psychiatry.Le Journal medical libanais[J].The Lebanese medical journal,1972,25(4):337-342.
[12]Comstock R.E..Theory of quantitative genetics:synthesis[J].Cold Spring Harbor symposia on quantitative biology,1955,20:93-102.
(責編:張宏民)endprint