首页 > TAG信息列表 > tcga

1. Linux下载TCGA数据:(操作简单,我起码可以看懂)

参考:(17条消息) tcga 数据下载 - CSDN 下载过程如图所示 gdc官网上找到了gdc-clinnet,复制链接,wget 下载和unzip解压后 manifest.2022-04-20.txt 是提前在GDC选择好case和files 后下载的,然后上传到linux 的TCGA文件夹

Pandas库----TCGA metadata.json处理

  为获取文件名和TCGA样本名之间的映射关系,需利用Python对TCGA metadata.json数据进行处理时,期间需要对metadata.json进行标准化; 1.JSON数据读取   1 import pandas as pd 2 3 jsonPath = r"E:\IT Development\Data\metadata.cart.2021-11-27.json" 4 json = open(jsonPath).

task6b-哦别做梦了-TP53在TCGA的肝癌的有配对样本病人的转录组数据表达量配对图

作业链接 ​ 0.作业题目 从ucsc的xena浏览器里面下载感兴趣癌症,比如肝癌的表达矩阵(counts值)然后根据样本名字拿到有配对的几十个病人的癌症和正常对照数据(部分癌症数据并没有对照)接着提取感兴趣基因(比如TP53)的表达量最后套用上面的绘图代码即可! 1.数据下载 下载网址​ 然后

CNS级别文章标题画一个词云

作业4-1:https://mp.weixin.qq.com/s/GHaulIJt5ebvu_x3_x6ptQ 相关代码仍然参考:Word-cloud TCGA-2018 文章 2018的TCGA的泛癌项目论文全部发表在Cell及其子刊上,文本文件如下: 词云代码: library("tm") library("SnowballC") library("wordcloud") library("RColorBrewer")

DNN整合基因组谱

论文地址:Predicting drug response of tumors from integrated genomic profiles by deep neural networks 利用深度神经网络预测整合基因组谱的肿瘤药物反应作者信息:Yu-Chiao Chiu1, Hung-I Harry Chen1,2, Tinghe Zhang2, Songyao Zhang2,3, Aparna Gorthi1, Li-Ju Wang1, Yufei

TCGA(三)--采用GDC API进行数据查询和获取

TCGA的数据可以通过API访问, 每个数据都有对应的多个属性,比如文件id(file_id), 病人编号(case_id以及barcode),case_id 和file_id 都是采用的UUID进行标记, barcode即submitter_id. 在GDC的首页选中一些DNA甲基化数据,如下: 可以看到数据包含了一个Cases, 两个Files,这里面选择的项目是TCGA-

TCGA肿瘤基因数据的访问(二)

TCGA(The Cancer Genome Atlas)项目完成后,最终和其它的一些肿瘤医学项目一起归档在 GDC Portal网站,方便人们访问。 网址是  https://portal.gdc.cancer.gov 其中除了TCGA的数据还有其它一些医学项目产生的基因测序数据,以及临床信息数据。 网站首页如下: 左侧可以点击Projects 根据

TCGA肿瘤样本基因信息库(一)

最近开始分析TCGA这个数据库中的一些SNV信息(single nucleotide variation). 先整理出第一篇知识列表,如下: TCGA的全称和目的 TCGA中的样本来源和编号 TCGA中各样本的突变类型 肿瘤的突变频率举例 1. TCGA的全称和目的 全称- The Cancer Genome Atlas, 译作癌症基因组图谱,是美

TCGA筛到了基因,如何继续往下做?

TCGA大名我们都不陌生了,其海量数据便于我们找到有研究价值的基因,再展开后续的研究。万事开头难,筛选基因时就好不容易学了一堆技术,开完头发现后边更迷茫,怎么办?酸菜大大把整个过程给我们整理出了八大问题,说清其中的思路。今天先来看看前四步,怎样获得靶基因,并确定它具有值得研究的表型

TCGA小工具

sangerbox 第三方软件下载TCGA数据 http://sangerbox.com/

TCGA 数据资源

1. cBio数据库 (https://www.cbioportal.org/)    此数据库信息相对较全,日常可用     左侧区域是各种癌症组织的研究,数字表示某肿瘤中研究个数。   中间是所有研究,可根据左侧栏选择,默认显示全部。小书的图标点开可以下载pubmed文献资源及数据;   饼图图标可以看某癌症详细