系统相关
首页 > 系统相关> > Linux-vcf文件-如何通过VCF文件鉴别群体的等位基因频率?

Linux-vcf文件-如何通过VCF文件鉴别群体的等位基因频率?

作者:互联网

如何判定化石是祖先型等位基因还是突变型等位基因?

PS:不能挖到化石就说它是祖先。

可以和亲缘关系较近的物种进行序列比对,和近缘物种相同的就是祖先型,更大概率来自于更古老的祖先。

如何通过VCF文件鉴别群体的等位基因频率?

首先确定等位基因频率是一个群体的概念,也就是说不是每一个个体的VCF信息,而是一个群体的VCF文件,才有等位基因频率这一说法,在combine vcf文件中,每一个个体的基因型进行统计,才能得到这个群体的等位基因频率。注意到是一个个体是没有等位基因频率的,只有群体才有。

方法1.使用Vcftools

Vcftools –vcf file.vcf –frq –chr 1 –out filefreq

也可以使用某条染色体

Allele等位基因,一个个体就有一个基因型,但是这里C:0 、和T:1是什么意思呢?答:频率为100%

纯合型CC的频率是0和纯和型TT的频率是1?

--freq输出每个位点的等位基因频率,--freq2 抑制等位基因任何信息。

第二种用plink计算:

/path/to/plink-1.07-x86_64/plink --noweb --bfile file --freq --out filefrquency

frq (basic allele frequency report)

Produced by --freq. Valid input for --read-freq.

A text file with a header line, and then one line per variant with the following six fields:

CHR

Chromosome code

SNP

Variant identifier

A1

Allele 1 (usually minor)

A2

Allele 2 (usually major)

MAF

Allele 1 frequency

NCHROBS

Number of allele observations

原文链接:https://www.cnblogs.com/chenwenyan/p/7565619.html

计算等位基因频率方法

 

vcftools --gzvcf $indir/four_pops_132goats.final.chr.mt.biallel.snp.vcf.gz \

       --freq \

       --out $outdir/four_pops_132goats_snps_freq

#等位基因数目,染色体的数目(染色体的数目×2就应该是总样本的所有染色体数,为什么比后者小呢,是因为有缺失的存在),后面是等位基因以及他的频率

 

后者直接从VCF文件中提取

Vcftools –vcf file.vcf –get-INFO AF –out xx.test

#AF,应该就是等位基因频率

 

标签:文件,vcf,VCF,--,等位基因,频率,freq
来源: https://www.cnblogs.com/2022-1102/p/16335125.html