各种测序基础知识汇总
作者:互联网
1.RNA-Seq名词解释
2.测序名词解释
3.高通量测序常用名词解释
4.转录组测序问题集锦
RNA-Seq名词解释
-
index 测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。
-
碱基质量值 (Quality Score或Q-score)是碱基识别(Base Calling)出错的概率的整数映射。碱基质量值越高表明碱基识别越可靠,碱基测错的可能性越小。
-
Q30 碱基质量值为Q30代表碱基的精确度在99.9%。
-
FPKM(Fragments Per Kilobase of transcript per Millionfragments mapped) 每1百万个map上的reads中map到外显子的每1K个碱基上的fragment个数。计算公式为 公式中,cDNAFragments 表示比对到某一转录本上的片段数目,即双端Reads数目;Mapped Reads(Millions)表示Mapped Reads总数,以10为单位;Transcript Length(kb):转录本长度,以kb个碱基为单位。
-
FC(Fold Change) 即差异表达倍数。
-
FDR(False Discovery Rate) 即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝的原假设个数的比例的期望值。通过控制FDR来决定P值的阈值。
-
P值(P-value) 即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P<0.05为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。
-
可变剪接(Alternative splicing) 有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接,alternative splicing)。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致真核生物基因和蛋白质数量较大差异的重要原因。在生物体内,主要存在7种可变剪接类型:A)Exonskipping;B)Intron retention;C) Alternative 5' splice site;D) Alternative3' splice site;E) Alternative first exon;F) Alternativelast exon;G) Mutuallyexclusive exon。
-
外显子跳跃(Exon skipping) 外显子在前体mRNA剪接形成成熟mRNA过程中被跳过,最终没有出现在某些成熟mRNA上,这种剪接机制被称为外显子跳跃。
-
内含子保留(Intron retention) 前体mRNA在剪接形成成熟mRNA的过程中,部分内含子被保留下来,这种剪接机制被称为内含子保留。
-
5'或3'端可变剪接 前体mRNA在剪接形成成熟mRNA的过程中,5'端或3'端边界发生不同方式的剪接,这种剪接机制被称为5'或3'端可变剪接。12.基因结构优化 由于使用的软件或数据本身的局限性,导致所选参考基因组的注释往往不够精确,需要对原有注释的基因结构进行修正,这一过程称为基因结构优化。
标签:外显子,测序,碱基,汇总,基础知识,mRNA,可变,剪接 来源: https://blog.csdn.net/leroylee7/article/details/112414577