其他分享
首页 > 其他分享> > 叶绿体基因组分析须要注意的地方(组装篇)

叶绿体基因组分析须要注意的地方(组装篇)

作者:互联网

叶绿体基因组组装须要注意的地方

    随着测序技术以及生信技术的发展,越来越多的叶绿体基因组被发表。本人从19年那8月份开始正式接触叶绿体基因组的组装,到今年2月份组装了接近600个叶绿体基因组,包括71+个科,157+属/种(其他的还做了动物线粒体100多个,植物线粒体30多个)。从一开始磕磕绊绊,寻求各种组装软件、流程来完成项目(但是常规叶绿体基因组只有一半左右的软件可以做出来,而且可能会存在一些错误),所以到后来几乎都是用自己写脚本辅助组装。
    叶绿体基因组比较小,组装起来相对会容易些,但是对一般人来讲如果软件组装不出来的话自己去调整还是比较麻烦的。我对组装软件的使用研究不是很多,因为组装软件能够组装出来的序列用我自己的脚本基本都可以轻松组装出来,而且速度更快,可以保证每个位点的准确性,缺点也很明显,自动化程度不高,需要一定的经验和技术。组装软件组装不出来的序列用自己的脚本也大概能拼接出来,这种就更需要经验来操作了…
关于怎么组装,目前很多软件,大家可以自己试试。然后有一篇比较好的博客给大家推荐下,2020.08.18【转载】丨叶绿体基因组二代测序组装经验分享
这篇博客是我目前看到的二代组装叶绿体基因组的最标准的方法了,用到的工具也都是自己可以获取的(如果你用组装软件没组装出来,可以参考这个方法试试看)。我自己写的脚本和该文作者提到的思路类似,但是相比可能更便捷些。其次是他的方法可能比较适用于一些保守的叶绿体,而且需要有近缘物种作为参考的。遇到变异比较大的,或者没有近缘物种的,可能就不好做了,比如藻类的、蕨类的物种研究的可能相对比较少一些,而且变异比较大,又或者仙人掌、豆科等物种变异比较大的。当然,如果你研究的叶绿体如果重复序列特别多而且比较长(长于二代测序读长),这种还是测三代吧~ 比如:杜鹃花科?某些特殊的豆科?蕨类?三代组装起来非常的容易,但是校正是件比较麻烦的事,具体后面说。
    下面说一说叶绿体基因组组装的结果可能会遇到的问题,主要针对具有四分体结构的序列:

标签:重复区,组装,基因组,须要,反向,序列,叶绿体
来源: https://blog.csdn.net/weixin_43362619/article/details/115604283