其他分享
首页 > 其他分享> > 进化重测序实验

进化重测序实验

作者:互联网

进化重测序(Evolve and Resequence, E&R)是在实验室条件下来研究种群对新环境的适应过程,通过二代测序技术分析在适应过程中基因的变化情况。能够在基因组层面上对分子进化过程进行实时监测。E&R已经应用在了RNA、细菌、酵母以及果蝇中的研究中。尽管它们的研究不完全相同,但是这些不同在很大程度上能够使用现有的群体遗传学理论进行解释,包括起始群体数量、起始基因变异水平、重组率和适应范畴等因素。

生物对新环境的适应成就了地球上无与伦比的生物多样性。但是在分子层面上这种适应是怎么发生的?面对这样的问题,我们还很难给予一个合理准确的答案。识别出导致物种分化的有利突变位点对我们来说已经是一个很大的挑战,更别说去推测自然选择的作用和动态变化过程了。很多与适应相关的问题依旧存在争议,比如,有利突变的进化速率、效应大小,以及他们之间是怎么相互作用的,环境是怎样影响等位基因频率的。

在过去的一个世纪中,不同领域的生物学家都在尝试在实验室中通过进化来研究适应的过程。他们发现不同的种群对实验室新环境的适应能够很好的反映出生物的适应过程。但是由于实验技术条件的限制,这些研究仅仅是针对表型,而在分子层面上,还很难做到。当然,随着测序技术的进步,尤其是二代测序技术,使得人们在分子层面研究适应的过程成了可能。人们先后对RNA分子、病毒、细菌、酵母和果蝇进行了进化重测序研究(E&R)。通过E&R研究人们可以实时监测进化的过程。通过这种实时监测能够帮助我们了解关于适应过程的一些问题,比如,在适应中是现有变异(standinggenetic variation)发挥的作用大,还是新突变发挥的作用大?在分子层面进化是否是可重复的?在适应过程中,有利变异的自然选择系数是否会随适应过程而改变?在适应过程中,蛋白编码区和调节区的作用是什么?等。


E&R的研究有四种研究体系:

·       体外单核苷酸的研究(RNA或者DNA)

·       单克隆群体的细菌和酵母群体,

·       起源于杂交的酵母种群,

·       起源于杂交的果蝇种群。

image.png


这四种研究体系得到的结果并不完全一致,比如体外实验往往得到很多不同的结果,微生物无性生殖系统通常可以观察到少数有利突变在种群中固定下来,而有性生殖系统通常显示出性状的多基因性。


image.png

E&R:研究系统概况

体外单核苷酸研究系统:通常起源于短的DNA序列,通过DNA转录成RNA,然后将RNA暴露在不同的化学体系中进行选择,然后再进行扩展和反转录。依次循环10-20次。这也可以进行分子筛选。由于体外系统的“基因组”比较小,所以通过Sanger测序就能够识别出最后刷选出的RNA结构域。

无性繁殖的单克隆群体:通常是一个10^6-10^8的细菌或酵母群体通过无性生殖进行进化。由于微生物生长迅速,通常在几周到数月内,可以繁殖成百上千代。有人曾对大肠杆菌进行了长达25的进化实验,累计超多了6万代。相比之下,如果人类进化6万代,那么需要120万年,而这120万年前,智人还没有出现。

起源于杂交的酵母种群系统:该种群既有微生物种群的特征,比如群体数量大,也有很多新的特性,比如有性生殖、起始种群存在基因变异。对于整个进化群体,可以通过池测序(Pool-seq)进行测序,得到群体基因频率。

起源于杂交的有性真核系统:果蝇是该系统的代表,起始种群来源于野外,也就意味着群体中存在很多稀有变异。种群数量可以从100-1000大小。相比如微生物,果蝇世代数有限,通常1-3年的实验也只能繁殖25-75代。

 

image.png

选择过程中位点的动态变化

尽管群体遗传学理论有关于等位基因频率变化的很多种预测和解释,但是很少有真真切切的实验数据支持。E&R实验通过不同时间点对种群基因频率的研究,可以很清楚的了解到适应过程中等位基因频率的变化,包括变化速率、变化幅度等。

在体外实验中,一个起始等位基因频率在10^-16的位点经过10轮选择时候可以在群体中固定下来,这说明有利变异受到了很强的正向选择,选择系数超过50%,群体中的基因多样性迅速丢失,群体的适应性很快升高。

image.png

在体外实验系统中,群体中单倍体类型随着进化刷选过程迅速降低,基因杂合性也迅速降低

对于单克隆群体的细菌和果蝇,其等位基因频率的变化会很复杂。由于缺乏有效的基因重组,突变之间的干扰效应十分明显(clonal interference),有利突变必须和其他单倍体上的有利突变进行激烈的竞争。只有幸运儿,其基因才能在种群中固定。和体外实验相比,无性繁殖位点的选择压力通常很好,在1%-20%之间,可能是受到了基因的多效应限制。

image.png

在单克隆群体中,不同突变位点之间的竞争非常激烈,进化过程总是伴随着新的,更有利突变的出现,每个时间点都有不同的占优势单倍体型,群体整体杂合性水平很低。

对于无性繁殖的杂交的酵母群体,起始群体中存在大量的变异类型,基因多样性很高,因而群体对选择的反应也十分迅速。通过等位基因频率变化推测选择压力只有~1%。等位基因在群体中的变化情况能够反映出适应过程中基因是怎样重新组合的。如果一个数千kb长的序列中含有有害或者有利基因,那么通过这个过程可以很清楚的识别出来这段序列。而且几乎所有的适应过程都是既有基因变异参与的,而非是新突变位点

image.png

杂交酵母群体的起始群体中含有大量现有变异类型,由于近乎中选择的作用,其中一种变异类型的频率在种群中迅速升高;无性繁殖缺乏基因重组,因而该单倍体型在群体中可以长期存在;群体的杂合性也迅速降低。

对于有性生殖的果蝇,起始群体是含有数百种自然单倍体的群体,但是由于存在有性生殖和基因重组,因而位点之间的干扰效应不太可能阻碍进化。两个不同的基因区域可以独立的对自然选择进行响应。基因组的某些区域可能因为受到自然选择而杂合性降低,不过杂合性很难降到0,也意味着选择是发生在既有变异基础上,而不是新的变异(soft selective sweep)。

image.png

顶部图:在适应发生前后,群体中SNP频率变化情况;中图:在进化过程中单倍体变化情况,由于存在有性生殖和基因重组,不同区域的基因进行了重新组合,形成了多种新的单倍体;底部图:在进化过程中,杂合子变异情况,受选择位点附近杂合性降低(黑色箭头标注),杂合性从红色变成了绿色

通过上面几个试验系统的比较,可以看出,不同的实验对象对选择的响应差别很大,进化过程也存在一定的差别。

 

image.png

E&R实验中的突变

对于体外实验系统,分子的多样性通常受限于DNA合成平台,比如一个DNA合成平台通常能够产生10^16种分子,而一个60个碱基长度的序列的分子多样性可以达到4^60,这个理论数量要比实际分子数量多20个数量级。所以选择可以发挥作用的空间很大。

对于无性单克隆系统,尽管基因之间的相互干扰会延长基因固定的时间,但是和其他系统相比,它的基因多样性仍然是偏低的。由于其起源群体遗传背景单一,所以群体中的变异类型多是新突变产生的。而且对于每一种新环境,似乎总有很多有利突变。在细菌和酵母的E&R中,发现了很多不同类型的突变。尽管点突变依旧是多数,但是小的插入缺失突变和较大的重复序列及缺失,以及转座子都对新环境的适应发挥了重要作用。很多受选择的突变都涉及到某些功能缺失,比如提前出现的终止密码子、转座子在基因中插入等。似乎选择压力倾向于某些细胞功能的丢失。

在无性繁殖的单克隆酵母群体中,通过E&R实验发现大量重复序列可以用来应对环境压力。通过增加基因拷贝数,能够补偿有害突变的作用或者提升个体对资源有限的外界环境的适应。但是对于杂交的微生物群体,其适应环境主要是在现有变异基础之上发生的,在E&R实验中,并没有观测到大规模的基因结构突变和拷贝数突变。一个可能的解释是,相对于新的突变,现有基因变异在群体中存在了一定的时间,其对群体带来的负面作用比突变要小很多,所以现有基因变异更容易被选择下来。

关于新突变和现有变异哪一个对适应更重要的争论还有没有结束。在对人类基因组的研究中,显示现有变异对适应的意义更大,不过在对果蝇的研究中,却得到了相反的结论,认为新突变对果蝇适应新的环境更有意义。也就是说,对于一个种群数量较大的群体而言,新突变的进化的意义可能比现有变异的意义更大

目前为止,针对果蝇的E&R的实验还不能精确的识别出是哪一个基因和环境适应有关系,通常只能够识别出数百Kbp的一段序列,该序列中杂合度水平降低,SNP频率改变。此外,果蝇的E&R实验能否识别出适应的发生很大程度上依赖于实验设计,比如实验的重复数、群体数量、经历的世代数等。重复数多、群体大、世代数多能够大大提升对受选择基因的识别能力和在基因组上的定位能力

image.png

平行进化(Parallel evolution

平行进化是指来自同一个群体的两个分支独立进化,但进化过程和结果很相似。与自然条件下的进化不同,E&R能够精确的控制环境条件,能够同时进行多个重复,因而E&R是研究平行进化的最有效的工具。

对于无性繁殖的单克隆的酵母和细菌群体,进化依赖于新出现的突变,但是突变的随机性导致了在突变水平上,很难观测到平行进化现象;不过在更高一级的基因水平和细胞功能水平,是可以看到平行进化现象的,即某些基因或细胞功能是不同分支群体相同的进化靶标,虽然这些基因或细胞功能内有具体不同的突变情况。比如影响细胞代谢的某些基因,或者影响细胞形状的基因,亦或者某些应对外界环境压力的基因。

对于杂交E&R研究系统,起始群体中已经存在了大量的多态性位点,但是可能只有其中的一小部分是进化选择的靶标。要识别出这些靶标,E&R的设计很关键,即增加实验的重复数量能够很有效的提升识别这些靶标的能力。在果蝇的E&R研究中,平行进化是很常见的。首先因为其实群体有很多相同的变异位点,其中的很多变异位点,可能是不同实验重复共同的作用靶标。其次,由于存在有性生殖和基因重组,因而位点之间的相互干扰很微弱,也就意味着不同的有利位点可以同时且相互独立地提升在群体中的频率。

不过也要注意到,在观察平行进化的同时,重复之间可能存在的基因流可能对观察结果造成影响,虽然这些基因流可能是无意中发生的,但哪怕每一代只有一个个体的基因交换,那么这两个重复之间的中性等位基因频率也会被同质化。

image.png

上位效应(Epistasis

上位效应是指基因之间的相互影响。在体外E&R系统(如体外RNA分子刷选实验)中,上位效应是普遍存在的,而且这种上位效应能够在很短的序列内发生,所以二代测序的一个读长通常就足够来了解不同变异之间的相互影响。不过对于杂交E&R系统(果蝇),观察到基因之间的上位效应很困难。这可能是由于杂交系统的有利变异可以存在于多种单倍体上,而自然选择可以直接作用在这些单倍体上。在杂交E&R系统中,最简单识别上位效应的方法就是识别出非关联位点的连锁不平衡(LD),不过如果是用Pool-seq池测序的方法来测序,只能得到等位基因频率,无法得到不同位点的关联性,所以在方法上,也很难识别出杂交E&R系统的上位效应。


image.png

总结

E&R研究可以用于30bp的核酸序列,可以用于像果蝇一样的多细胞真核生物,其中的进化原理都是一样的。最大的不同来自它们对新环境的响应速度和进化的分子基础,起始种群的特点和自然选择的压力是导致上述不同的最主要原因。在无性繁殖种群中,基因之间的相互干扰(clonalinterference)决定了不同类型的单倍体相互竞争,而在有性繁殖种群中,基因之间则可以相对独立的响应选择压力。在起源于现有变异的E&R系统中(杂交系统),适应的过程确定性比较大,所有实验重复都有相似的可供自然选择作用的变异位点;而对于单克隆群体,进化要基于新产生的突变,因而进化过程充满了不确定性和随机性。

最后,虽然E&R研究是以实验室模拟自然选择的过程,给我们的研究带来了很大的便利;但是要看到,实验室模拟和真正的自然选择的过程还是存在一定的差异的。


=====  THE END ====

文献来源:Long, A., Liti, G., Luptak, A., & Tenaillon, O. (2015). Elucidating the molecular architecture of adaptation via evolve and resequence experiments. Nature Reviews Genetics, 16(10), 567.

image.png


标签:进化,变异,测序,基因,实验,突变,位点,群体
来源: https://blog.51cto.com/15069450/2577369