小鼠肿瘤生物学数据库
作者:互联网
简介
小鼠肿瘤生物学(MTB)数据库(http://tumor.informatics.jax.org)是人类癌症小鼠模型的综合信息资源。该资源的目的是促进实验室小鼠的使用,作为调查人类癌症背后的遗传和基因组因素的模型系统。
MTB数据库目前包含来自近7,000个不同群体的小鼠的超过46,000个小鼠模型(代表> 82,000个个体肿瘤频率记录)的信息。它还包括来自组织病理学研究和细胞遗传学测定的> 6,500个图像。 MTB参考资料收集了近15,000篇癌症小鼠模型的科学论文的数据,每篇文章都以其相关的肿瘤类型为索引。MTB的范围包括基因工程的小鼠模型(GEMM)和传统的近交和混合模型系统。最近对免疫缺陷和“人源化”小鼠的异种移植模型的使用扩大了MTB的范围,包括超过400个患者衍生的异种移植物(PDX)模型。这些模型为研究体内人类癌症提供了一个独特的机会,并且解决了关于治疗反应,癌症异质性以及获得性和从头治疗抗性的临床相关问题.
1 数据的采集和保存
MTB数据的主要来源是科学文献。数据还可以从直接研究人员提交的资料以及各种癌症研究相关的生物信息学资源如PathBase(http://www.pathbase.net)和Gene Expression Omnibus中获得。MTB中的所有数据经过严格审查,以确保与基因,等位基因和小鼠品系名称的官方命名一致。用于解剖学、细胞类型和肿瘤类型的内部开发的受控词汇被用于注释数据库中的记录以确保数据库搜索完整和准确。
1 模型汇总表
MTB主页上的模型总结表列出了最常见类型的人类癌症数据库中的小鼠模型计数。该表显示小鼠模型,其中在≥20只小鼠的集落/研究大小中以≥80%的频率报告肿瘤类型。使用者可以将其搜索集中在高潜力模型上。例如,肺癌研究者可能会从突变小鼠中选择对应于潜在肺癌模型的链接开始。从此链接返回的数据摘要可以缩小或扩大使用适当的方面选择。例如,同样的肺癌研究人员可以通过选择仅仅观察具有Kras突变的模型来缩小搜索范围。随后,他们可能会选择扩大搜索范围,取消“人类肺组织”这一方面,从而打开搜索范围,展示所有可能的具有Kras突变的癌症模型。
除了同系交配和GEMM之外,MTB还包含PDX模型的数据。这些模型的数据也可以从主页上的模型总结表中访问。每个PDX模型都显示其关键特征,包括诊断,癌症分期和分级,癌症类型,总结基因组数据和治疗反应数据。
1 交互式图形数据摘要
综合性可视化有助于加深对大量不同数据集中趋势的理解。肿瘤频率网格呈现了MTB中关于小鼠近交系株系中的自发性肿瘤的所有数据的总结。肿瘤易感性的模式可以在网格的“热图”模式中被识别,并且可以通过点击网格单元来访问基础数据。MTB的癌症QTL查看器提供小鼠癌症图谱。用户可以上传他们自己的未发布的注释,并将其显示在发布的QTL区域的上下文中。
1 其他基于网络的搜索表单
MTB中基于网络的搜索表单允许用户使用非常具体的肿瘤特征标准,小鼠品系名称和类型,基因和等位基因类型以及参考文献进行搜索。研究人员还可以使用人类基因符号来搜索数据库,例如在人类癌症中通常发生突变的基因列表。输入列表映射到相应的小鼠直向同源词,并返回一个带有MTB中相关记录链接的汇总表。 MTB还维护搜索工具,以帮助研究人员在GEO等公共仓库中查找人类癌症小鼠模型的相关基因组数据集。为了使关于小鼠模型的外部基因组数据集可获得,MTB将数据集与用于菌株名称和肿瘤类型的语义一致的元数据相关联。
参考文献:
Krupke, D.M., et al., The Mouse Tumor Biology Database: AComprehensive Resource for Mouse Models of Human Cancer. Cancer Res, 2017. 77(21): p. e67-e70.
往期「精彩内容」,点击回顾
DNA测序历史 | CircRNA数据库 | Epigenie表观综合 | 癌症定位
BWA介绍 | 源码安装R包 | CancerLocator | lme4 | 450K分析
乳腺癌异质性 | BS-Seq | 隐马模型 | Circos安装 | Circos画图
KEGG标记基因 | GDSC | Meta分析 | R线性回归和相关矩阵
精彩会议及课程,点击回顾
标签:癌症,数据库,小鼠,MTB,生物学,肿瘤,数据,模型 来源: https://blog.51cto.com/15127592/2673671