查看: 14008|回复: 1

理论群体遗传学之中性检验

[复制链接]
发表于 2010-3-14 01:15:39 | 显示全部楼层 |阅读模式
理论群体遗传学之中性检验

1969 年木村资生提出的“中性理论”假说使经典的达尔文自然选择理论受到了很大的冲击。“中性理论”以其严密的数学理论,在分子演化领域占据了重要地位。近年来的研究发现大量的受自然选择作用的分子水平证据。演化过程中的,选择的作用的大小检测成为分子演化重要的议题。我将在这里介绍中性检验的理论和方法。


    演化论是科学史上的重大发现,在西方思想上占有重要的地位。达尔文因其对自然选择驱动的演化理论深入研究,而推动了自哥白尼以来的西方思想史上的第二次革 命:哥白尼的日心说把地球从宗教的束缚中回归太阳系中;达尔文的把自认为高尚的人类回归到地球生命的队伍(Ayla,2009)。达尔文的自然选择理论以 其“物竞天择,适者生存”的原则改变人们对自然的认识,也因其“没有设计者的设计”而饱受宗教势力的打压和限制。



    上个世纪 60年代,随着分子生物学的兴起和技术的应用,演化理论的也进入了分子时代。1966年,美国芝加哥大学的 Richard Lewontin和Jack Huby开创了分子演化的电泳研究。他们在实验中观测到全新的现象:果蝇个体中的氨基酸突变很高,传统的突变理论无法如此之高的变异,达尔文的自然选择理论似乎在分子水平失效了(Lewontin &Hubby, 1966)。经过多年思索的日本学者木村资生于1968年在Nature上撰文提出中性突变假说,并完美的解释了 Lewontin和Huby的实验结果。木村的中性进化理论因其基本观念的革新和高度的数量化而迅速发展,占据了分子演化的大部分领域(Kimura, 1969,1983)。同时 Linus Pauling和Emile Zuckerkandl的分子钟( molecular clock)理论也为中理论提供了有力的支撑。演化生物学就形成了的分子水平的中性演化理论和宏观水平的自然选择的现代达尔文理论。



    木村资生的中性的理论提出后,也有新的个例在分子水平被检测出受到自然选择的作用。分子水平的自然选择虽然很弱,但不是没有。1983年,美国的 Kreitman将DNA测序技术应用于果蝇的研究,发现了受到自然选择作用的位点(Keitman,1983)。之后, 不断有新的发现来支撑自然选择理论,达尔文理论的正在慢慢地复苏。



    理论群体遗传学的模型中,在DNA水平对检验检测自然选择作用是否存在的方法主要有两类:种内多态性检验和种间分歧度检验。前者以Tajima的D检验为代表,后者的方法大都以选择中性和种内、种间的演化速率一致的假设为前提。这些检测方法基本上都以选择中性为前提,通过随机理论和统计方法和分析DNA数据 来检验自然选择的作用。因此,这些方法也被统称为“中性检验(neutrality test)”。这些检验方法为演化生物学、人类遗传学等提供了数据分析支持和理论预测。下面我将介绍几种常用的中性检验的方法.





1. Tajima的D检验(Tajima D test)


    在随机交配群体中,一个符合中性条件的基因的遗传变异度有θ=4Nμ来决定(N为有效群体大小,μ为每一代的突变率)。有两种常用的方法估计θ,第一种是在n条序列的样本中,多态性位点数K,其期望值为E(K)=Lθa, L是序列中的位点数,a=(1/1+1/2+....+1/n)(Watterson, 1975), 故θ可由θw=S/(L*a)来估计。第二种是对n条序列的任意两条序列比较后得到的核苷酸差异的平均比例之的期望值θ,把θ作为一个估计值,记为θt(Tajima, 1983)。Tajima在1989年得出这两种θ的估计在中性理论模型下是无偏差的(事先假定,群体中没有选择、重组、分化,且群体恒定)。如果模型的 假设不成立,则θ 的两个估计值会有偏差,两个估计值之间的差异为检测严格中性模型失效的因素和机制提供了信息。Tajima(Tajima,1989)构建了D检验


     


这里,SE为标准误差。在失效的中性模型中,mean(D)=0, Var(D)=1。Tajima建议采用标准正态分布和β分布来确定D是否显著不同于0。


    Tajima 的D检验的统计显著性可能与几种不同的解释相容。一个负D值表明存在净化选择(purifying selection)或群体中有轻微分离的有害突变。不过,负D值也可能是由于群体的扩张引起的。正D值可解释为平衡选择将突变保持在平衡频率,不过也有 可能是一个群体收缩导致的。Tajima的方法作为第一个基于种内多态性的检验,而被广泛引用。



2.  Fu-Li检验(Fu-li D test)和Fay-Wu检验(Fay-Wu H test)


    在n条序 列中,一个多态位点上的核苷酸的突变率为r(r= 1, 2, ... , n-1)。样本中的所观测到的突变分布称为位点频谱(site frequency spectrum)。 通常,可采用亲缘很近的外群(outgroup)来追溯祖先的状态及其祖先序列的分化情况 。符云新和李文雄(Fu & Li,1993)把突变分为家系树的内枝(ηE)的突变和外枝的突变(ηL),相应地构建了一下统计量


     


a=(1/1+ 1/2+.....+1/n-1), SE为标准差。Fu和Li认为群体中的有害突变倾向于近期产生,位于树的外枝;内枝上的突变多中性。他们还构建了若干类似的检验,这些检验的效力取决于有选择的情况下,检验中所用的两个θ值的差异度。Fu-Li检验采用溯祖理论(Coalescent theory), 比较了变异在不同演化时间上的分布,因而比Tajima的D检验更灵敏(Fu,1997),是比较常用的检验的方法。



    Fay和Wu提出了一种类似Fu-Li的思路,构建了θ的估计量


         


这里Si 是位点i上的突变数目。他们定义一个统计量H=θt-θH.在严格中性假设下,该统计量的期望值为0。在这里θt用以下公式估算


           


,使得中频的突变对θt贡献最大,而高频的突变对θH贡 献最大。这样,Fay-Wu检验比较了高频和中频的突变。在选择中性的假设下,位点的频谱分布呈L型——低频的突变更具普适性,而高频的则很少见。当中性 突变与某个受正选择作用的基因紧密连锁时,这个突变可能因选择的作用而转变成高频突变,这样“好的”等位基因就被选则固定下来。这个中性突变的过程被称为 “遗传跃迁(genetics hitchhiking)”详见群体遗传学原理(Hartl and Clark, 2007)。Fay和Wu认为,高频突变过剩(显著的负H值)是遗传跃迁效应的独特性质。Fay-Wu检验需要利用外群序列作为参考来推断分离位点的祖先,及祖先的衍生序列位点的多态性。最近,Wu Chung-I的学生Zeng Kai 结合Fu-Li的D检验和Fay-Wu的H的思路,结合基因组数据的特征,做了一些列的推广(Zeng et al,, 2006; Zeng, 2007a,2007b)。



3. McDonald-Kritman检验(MK test)


    中性理论假说认为种内多态性和种间分歧是演化过程的两个阶段,两个演化过程都是由中性突变的随机漂变固定所致。因而,如果同义突变(synonymous substitution)和非同义的突变(nonsynonymous substitution)都是中性的,那么种内的同义突变和非同义突变的多态性之比应该和种间同义突变和非同义突变差异的比例是相同的。McDonald-Kreitman 检验(McDonald & M. Kreitman, 1991)就是针对的这个预测构建的。McDonald-Kritman检验思路简洁,计算也简单,且在检验中性理论假设方面有着重要地位。


    McDonald和Kreitman依据同义突变和非同义突变对近源物种的蛋白质编码基因中的可变位点进行分类。他们定义了固定位点和多态位点风别作为种间分歧和种内差异的标志。固定位点是种间分歧有明显的碱基差异而种内个体间却无碱基差异的位点;多态位点是种内个体间碱基对有差异的位点。在中性假说的条件下,McDonald-Kreitman构建了如下统计检测量


    E(nf)/E(sf)=E(np)/E(sp)


这里nf是非同义突变位点也是固定位点的位点数;sf是同义突变位点也是固定位点的位点数;np是非同义突变位点也是多态位点的位点数;sp是同义突变位点也是多态位点的位点数。当物种间有选择作用时,上式的平衡就被打破了,这种不平衡可用统计学的检验来估算不平衡比例的显著性,而这个显著性可作为群体中选择强度的依据。





4. Hudson-Kreitman-Aquadé检验(HKA test)


    Hudson-Kreitman-Aquadé检验的原理和MK检验很相近,HKA检验对两个以上的近源物种中的多个不连锁基因的序列数据,用此来检验这 些等位基因上的多态性和分歧是否一致。HKA的基本原理是基因的突变率与其多态性和分歧度成正比(Hudson et al, 1987)。



    在L个等位基因中,设有物种A和B的基因i上的分离位点数分别为Sai和Sbi,它们在基因i上的差异数是Di。Sai和Sbi是中多态性的标 度;Di是种间分歧的标度。Hudson等人假定Sai, Sbi和Di是独立的正态变量,并在中性条件下推导这三个变量的期望值和方差,以构建这三个变量的拟合优度的统计检验量Sai,Sbi和Di。




.HKA检验计算了种间和种内差异的卡方平方和,再检验实验结果是否与中性条件下的的期望和方差相一致,它对数据的要求比较高,计算过程也比较复杂。





   关于中性理论的各种检验均以中性理论的零假设为前提来构建统计检验量来检测选择的有无。这些检验方法以严密的数学理论作为工具,在不同的序列数据类别中,各个检验能检测到是否有选择的存在。当然,面对的日新月异生物学序列数据和演化过程中各种不同驱动因子,单一的检验无法完全胜任检测选择的任务,多种检测的结合是必要的,同时新方法发展也是很迫切的。



    趣闻: Fumio Tajima(田 嶋文生,たじま ふみお)是日本群遗传学家,他是根井正利的学生。在随根井正利读研究生期间,Tajima在最初阶段,根井正利给了他一个“习题 ”,1983年,Tajima的完成这个“习题”文章(Tajima, 1983)的成了溯祖理论的开山之作(另外还有美国的Hudson, R. R和英国Kingman,三人独立发现coalescent,Kingmang的贡献最大),1989年的博士毕业论文(Tajima 1989)发展了种内多态性多检测选择,开创了中性检验的新局面。之后他回到日本,现在是东京大学的生物系的教授。他也是很典型的他日本学者,个人主页的 介绍基本不用英文,大都是日语。

Population Genetics 我们大陆译为“群体遗传学”,不知道日本为什么译为“集団遺伝学”,台湾的大都称“种群遗传学“?




参考文献
    * Francisco J. Ayala, (2009),One hundred fifty years without Darwin are enough!, Genome Res. 19: 693-699
    * Fay, J. C. and C.-I Wu,(2000) Hitchhiking under positive Darwinian selection. Genetics 155: 1405-1413
    * Fu, Y. X., (1997) Statistical tests of neutrality of mutations against population growth, hitchhiking and background selection. Genetics 147: 15–925.
    * Fu, Y. X., and W. H. Li, (1993) Statistical tests of neutrality of mutations. Genetics 133: 693–709.
    * Hudson, R. R., M. Kreitman and M. Aguadé, (1987) A test of neutral molecular evolution based on nucleotide data. Genetics 116: 153–159
    * Tajima, F., (1983) Evolutionary relationship of DNA sequenc es in finite populations. Genetics 105: 437–460.
    * Tajima, F., (1989) Statistical method for testing the neutral mutation hypothesis by DNA polymorphism. Genetics 123: 585–595.
    * Kimura, Motoo (1968). Evolutionary rate at the molecular level. Nature 217: 624–626.
    * Kimura, Motoo (1983). The Neutral Theory of Molecular Evolution. Cambridge University Press
    * Lewontin, R. C.; J. L. Hubby (1966). "A molecular approach to the study of genic heterozygosity in natural populations. II. Amount of variation and degree of heterozygosity in natural populations of Drosophila pseudoobscura". Genetics 54: 595-609
    * Kreitman, M., (1983) Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature 304:412-411.
    * McDonald, J. H., and M. Kreitman, 1991 Adaptive protein evolution at the adh locus in Drosophila. Nature 351: 652–654.
    * Watterson, G. A., (1975) On the number of segregating sites in genetical models without recombination. Theor. Popul. Biol. 7:256–276.
    * Zeng, Kai, S.H., Shi, Y.X. Fu, and C.-I Wu. (2006) Statistical Tests for Detecting Positive Selection by Utilizing High Frequency SNPs. Genetics 74:1431-1439.
    * Zeng, K., S. Mano, S. Shi and C.-I Wu. ( 2007a) Comparisons of site- and Haplotype-Frequency methods for detecting positive selection. Molec. Biol. Evol. 24(7): 1562-1574.
    * Zeng, K., S. Shi and C.-I Wu.( 2007b) Compound tests for the detection of hitchhiking under positive selection. Molec. Biol. Evol. 24(8):1898-1908.




    (这笔记我学习理论群体遗传学的一个心得和总结,主要参考了以上的文献,LI WH的“Molecular Evolution”, Hartl and Clark的“Principle of Population Genetics”, Warren Ewens的“Mathematical Population Genetics”。 我在这里的理解可能会有些错误和偏差,请参考最新文献和参考文献以正视听。)

中国畜牧人网站微信公众号

评分

参与人数 1论坛币 +1 收起 理由
立佳 + 1

查看全部评分

版权声明:本文内容来源互联网,仅供畜牧人网友学习,文章及图片版权归原作者所有,如果有侵犯到您的权利,请及时联系我们删除(010-82893169-805)。
发表于 2010-3-14 08:52:26 | 显示全部楼层
比较难懂呀

评分

参与人数 1论坛币 +10 收起 理由
system + 10 第一个回复系统自动奖励

查看全部评分

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

发布主题 快速回复 返回列表 联系我们

关于社区|广告合作|联系我们|帮助中心|小黑屋|手机版| 京公网安备 11010802025824号

北京宏牧伟业网络科技有限公司 版权所有(京ICP备11016518号-1

Powered by Discuz! X3.5  © 2001-2021 Comsenz Inc. GMT+8, 2024-12-22 13:23, 技术支持:温州诸葛云网络科技有限公司