其他分享
首页 > 其他分享> > 叶绿体基因组分析须要注意的地方(注释篇)

叶绿体基因组分析须要注意的地方(注释篇)

作者:互联网

叶绿体基因组分析须要注意的地方(注释篇)

  上期我们讲了组装问题,在组装完成后,就需要对序列进行注释了,叶绿体基因组的注释通常是经过同源比对注释的,同源注释的软件比较多,针对叶绿体基因组注释的软件也有很多,但是目前还没有一款可以得到完美注释结果的软件,所以学会自己检查注释的正确与否很重要。由于基于的是同源比对,那么参考的选择十分的重要,这里要注意一点,不是已经发表的叶绿体基因组就是正确的注释!已有的数据库中也会有很多错误注释的基因组序列,所以针对参考序列的注释,需要自己去辨别好坏。可以根据常见的基因类型,基因数量,拥有内含子的基因(常见的如:atpF clpP ndhA ndhB ndhB petB petD rpl16 rpl2 rpl2 rpoC1 rps12 rps12 rps16 trnA-UGC trnA-UGC trnG-GCC trnI-GAU trnI-GAU trnK-UUU trnL-UAA trnV-UAC ycf3等)等等。比如反式剪接的基因(rps12),在一些已经发表的序列中(参考序列中)容易出现错误,拥有较短的外显子的基因在参考中也容易丢掉那个较短的外显子(最短只有6 bp:petB、petD、rpl16等)。这些问题在选择参考之前都要注意下,如果参考的注释有问题,那么对你的注释会有很大影响,这是软件解决不了的,可以多选择几个物种作为参考来降低错误。
注释完后,根据常见的基因(或者多比较几个参考序列)看看哪些基因有差异,对于有差异的基因,需要自己辨别对错,保留最好的结果。然后还需要进行以下的检查:

标签:叶绿体,参考,基因,基因组,注释,须要,序列
来源: https://blog.csdn.net/weixin_43362619/article/details/120656637