其他分享
首页 > 其他分享> > maf文件内容简介

maf文件内容简介

作者:互联网

原文章网址:https://mp.weixin.qq.com/s?__biz=MzIwODA1MzI4Mg%3D%3D&chksm=809f90a0b7e819b6e40d2fa0718ee3a022dad989f884c134d374e5a2f4504d85d2f8a408a3ef&idx=1&mid=2456012269&scene=21&sn=a84dd0a5b42c50f897341f0722bb9352#wechat_redirect

 

       Mutation Annotation Format, 简称MAF, 是由TCGA制定的一种文件格式,用来存储突变注释信息。在TCGA中,对于突变数据有以下四种类型

图片

  1. Annotated Somatic Mutation, 体细胞突变的注释文件,格式为VCF, 采用VEP软件进行注释,文件后缀为vep.vcf.gz

  2. Raw Simple Somatic Mutation, 体细胞突变的原始文件,格式为VCF, 文件后缀为vcf.gz

  3. Aggregated Somatic Mutation, protected的突变注释文件,需要账号和权限才可以下载,格式为MAF, 文件后缀为maf.gz

  4. Masked Somatic Mutation, open access的突变注释文件,免费下载的,格式为MAF, 文件后缀为maf.gz

       在TCGA中,VCF通常用于记录单个样本的体细胞突变相关结果,MAF用于整合所有样本的体细胞突变注释结果,所以称MAF格式为project-level, 根据数据的开放性,又分为protected和open access, 其中open access就是我们可以直接下载得到的MAF文件, 以乳腺癌为例,在TCGA中提供了4个MAF文件

图片

       对应4个不同的体细胞突变calling软件,每个文件中包含了1044个样本的体细胞SNV注释结果。

      MAF和VCF类似,也是一个纯文本的格式,由\t分隔的许多列构成,从GDC下载的MAF文件的截图如下

图片

   #开头的为注释行,其他部分为正文,每一列有一个固定的表头, 完整的MAF共有100多列,在实际处理中,我们可能没有这么多列的信息,常用的几列解释如下

  1. column1, Hugo_Symbol, 由HUGO提供的gene  symbol, 表示SNV所在的基因名称

  2. column 2,Entrez_Gene_id, SNV所在基因的entrez  id, 如果没有对应的基因,则用0表示

  3. column 4,NCBI_Build, snv calling时使用的参考基因组版本

  4. column5,Chromsome, SNV所在的染色体

  5. column6,Start_Position, SNV在染色体上的起始位置

  6. column7,End_Position,SNV在染色体上的终止位置

  7. column9,Variant_Classification, SNV位点的分类,Missense_Mutation,Nonsense_Mutation等类别,分类的依据为SNV对翻译的影响

  8. column10,Variant_Type,  SNV位点的类型,比如SNP, INS,DEl等类型

  9. column11,Reference_Allel, 参考基因组上的allel

  10. column12,Tumor_Seq_Allel1, 肿瘤样本中该位点对应的主等位基因

  11. column13,Tumor_Seq_Allel2,肿瘤样本中该位点对应的次等位基因

  12. column16,Tumor_Sample_Barcode, 肿瘤样本的barcode

  13. column17,Tumor_Normal_Barcode,配对的正常样本的barcode

每一列的详细含义见如下链接

https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/

MAF是专门针对human定义的一种文件格式,通过一个文件就可以包含所有样本的SNV和对应的注释信息,对于下游分析而言,非常的方便。在实际使用中, 对于VCF文件,可以通过vcf2maf将其转换为MAF格式,在后续文章中会具体介绍该软件的用法。

 

标签:文件,内容简介,maf,SNV,注释,Mutation,MAF,突变
来源: https://blog.csdn.net/weixin_42630015/article/details/120627041