本周最新文献速递20220226
作者:互联网
本周最新文献速递20220226
一、精细解读文献 一
文献题目: Genetic associations of protein-coding variants in human disease
不想看英文题目: 人类疾病中蛋白质编码变异位点的遗传关联
杂志和影响因子: Nature (IF: 42.778; Q1)
研究意义: 全基因组关联研究 (GWAS) 鉴定了数千种与人类疾病风险相关的变异位点。然而,在稀有和低频位点的关联分析方面仍缺乏统计效力。因此,作者整合 392,814 名英国生物银行(UKB)参与者与 260,405 名 FinnGen (FG) 参与者(总共 653,219 名个体)的全外显子组测序数据,对 744 个疾病终点进行关联荟萃分析,填补常见和罕见之间的研究差距。
结论:
- 对 UKB 的 744 个疾病终点进行全基因组编码变异位点的关联分析 (coding-wide association studies,CWAS),随后与 FG 队列进行荟萃分析。总共发现了 975 个关联位点(P < 5 × 10-8 ),717 个关联位点通过多重检验校正(P < 2 × 10-9 );
- 在所有疾病中,低频和罕见变异位点的效应值通常更大;
- 975 个关联位点中,387 个通过 UKB 和 FG 荟萃分析才达到显著水平。13 个变异位点(跨越 11 个基因)的效应值极高(OR>2)。11 个基因包括 BRCA1(乳腺癌)、IDH2(骨髓性白血病)、VWF(冯·维勒布兰德氏病)或 HFE(疾病或铁代谢);
- 将关联位点映射到基因后,发现有 482 个基因与 148 个疾病簇相关;
- 482 个基因中,十三个基因座与至少五个疾病簇相关,包括 MHC、APOE、PTPN22、GCKR、SH2B3和FUT2,说明这些基因存在基因多效性。例如 CHEK2 基因,除了被报道与乳腺癌相关外,在本研究中还发现与结直肠癌、甲状腺癌、子宫平滑肌瘤、良性脑膜肿瘤和卵巢囊肿相关;
- 利用 CWAS 可对基因和疾病产生新的生物学见解,例如 SLC34A1 (rs1460573878; MAF = 2.6% (UKB) and 2.7% (FG); p.Val91_Ala97del) 编码的磷酸钠协同转运蛋白 NPT2a 与肾 (log(OR) = 0.24, P = 4.0 × 10-9 ) 和尿路结石 (log(OR) = 0.21, P = 6.8 × 10-9 ) 相关,同时还与血清钙增加(β = 0.047,P = 5.4 × 10-11)和磷酸盐减少(β = -0.075,P = 3.3 × 10 -26)相关,说明该突变增加尿酸结石风险。此外,该突变携带者的血清肌酐没有升高 ( β = -0.07, P = 3.6 × 10 -33),表明该突变携带者的肾功能不会受到影响,对于携带该突变的肾脏、输尿管结石和泌尿道结石患者来说,有望从 NPT2A 相关的临床干预和治疗中获益;
亮点: 又一个新的可利用的资源
文章链接:
https://www.nature.com/articles/s41586-022-04394-w
公开的资料:
- 关联分析结果:https://doi.org/10.5281/zenodo.5571000
- 代码:https://github.com/cnfoley/Sun-et-al-2021-protein-coding-variants-in-human-disease
二、精细解读文献 二
文献题目: Sequence determinants of human gene regulatory elements
不想看英文题目: 人类基因调控元件的序列决定因素
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
研究意义: DNA 序列可以控制基因的表达起始和位置,但具体哪段序列控制则是未知的。因此,作者使用大规模并行报告基因分析 (MPRA) 评估了 DNA 序列的转录活性,以探究驱动人类增强子和启动子活性以及相互作用的序列决定因素。
结论:
- 为了系统性表征人类基因组调控元件活性的序列决定因素,作者开发了四组 MPRA 文库方案: 1)用于评估增强子活性的转录因子( TF )基序(49bp)、2)用于评估增强子活性的人类基因组片段(500bp)、3)用于评估增强子活性随机合成的 DNA 寡核苷酸(170bp)、4)用于评估增强子和启动子活性的随机合成的 150 bp 序列;
- 将 MPRA 测得的基序与体外特异性结合测定的基序(HT-SELEX)进行比较,发现二者的一致性很高,说明该方法可有效测量细胞中的 TF 活性;
- 大多数转录过程被认为多个 TF 相互作用的结果,为此,作者比较了多个 TF 在不同模式下增强子活性的变化。结果发现对于大多数 TF,增强子活性随着 TF 共有序列数量的增加而增加,但对于可以单独起作用的 TF(例如 p53), 其增强子活性低于加性模型下的活性(图b红色虚线);
- 为了确定增强子是否是细胞类型特异性的,作者使用方案三(用于评估增强子活性随机合成的 DNA 寡核苷酸)识别激活 HepG2 增强子活性的序列特征。通过比较 GP5d 和 HepG2 细胞的增强子基序,发现大多数基序在两种细胞系中具有相似的增强子活性(Pearson R = 0.78),只有少数基序在两个细胞中具有显著差异,说明只有少量的 TF 在细胞中是特异的;
- 为了确定 STARR-seq 测定的序列特征是如何结合增强子,作者以~1.5-bp 的分辨率测定了 GP5d 和 HepG2 细胞的增强子活性,发现 STARR-seq 测定的序列特征对应体内开放染色质相关的特征;
- 利用染色质可及性(ATAC+/-)和经典增强子活性(STARR+/-)的信号差异,作者将基因组调控元件分为六大类:(1)封闭染色质增强子(STARR+和 ATAC-),(2)隐蔽增强子(沉默的 STARR+和 ATAC-区域),(3)启动子(ATAC+和 STARR+/-), (4) 染色质依赖性增强子 (STARR-/low和 ATAC+具有活性组蛋白标记 H3K27ac), (5) 结构染色质元件 (STARR- , ATAC+和 CTCF+) 和 (6) 经典增强子 (STARR+和ATAC+);
- 在上述六大类功能元件中,封闭染色质增强子(1)、染色质依赖性增强子(4)和经典增强子(6)比隐蔽增强子在功能上更为活跃;
- ChIP-seq 和基序的分析表明,经典增强子和封闭染色质增强子均与 TF 结合;
- 经典增强子更容易被有强激活子结构域(例如 FOS 和 JUN)的 TF 结合,而染色质依赖性增强子对 HLF 和 FOXA 基序表现出较弱的偏好,但这两种类型的增强子都与 HNF4A 结合;
- 作者利用方案四(用于评估增强子和启动子活性的随机合成的 150 bp 序列)识别启动子活性的序列决定因素。发现大多数基序在启动子和增强子位置都富集,且启动子处富集的大部分基序在所有细胞类型中都是相似的;
- 随后作者评估了距离 TSS 不同位置的序列特征。发现在 TSS 的 -30 处观察到 AT 富集,在 TSS 的 +10 到 +35 位置,观察到 G 含量逐渐增加;
- 使用 STARR-seq 方法识别启动子和增强子之间的相互作用,发现几乎所有的 TF 基序对都是独立富集的,说明控制转录的过程非常普遍,几乎所有 TF 的活动都可以独立地促进转录活动。
亮点: 开发了一种通过实验测定序列转录活性以及功能元件相互作用的方法;
文章链接:
https://www.nature.com/articles/s41588-021-01009-4
公开的资料:
- 序列数据:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE180158
- 代码:https://doi.org/10.5281/zenodo.5159644
三、其他文献推荐
下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);
文献题目: A unified genealogy of modern and ancient genomes
不想看英文题目: 现代和古代基因组的统一谱系
杂志和影响因子: Science (IF: 41.845; Q1)
文章链接:
https://www.science.org/doi/10.1126/science.abi8264
文献题目: Genome-wide association analyses identify new Brugada syndrome risk loci and highlight a new mechanism of sodium channel regulation in disease susceptibility
不想看英文题目: 全基因组关联分析确定了新的 Brugada 综合征风险位点,并突出了钠通道在调控疾病易感性中的新机制
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
文章链接:
https://www.nature.com/articles/s41588-021-01007-6
文献题目: Analysis of rare genetic variation underlying cardiometabolic diseases and traits among 200,000 individuals in the UK Biobank
不想看英文题目: 200,000 名 UK Biobank 个体的心脏代谢疾病/特征的罕见遗传变异分析
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
文章链接:
https://www.nature.com/articles/s41588-021-01011-w
文献题目: Proteomic profiling reveals CDK6 upregulation as a targetable resistance mechanism for lenalidomide in multiple myeloma
不想看英文题目: 蛋白质组学分析显示 CDK6 上调是来那度胺药物在多发性骨髓瘤中的靶向耐药机制
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-28515-1
文献题目: Randomized controlled trial for time-restricted eating in healthy volunteers without obesity
不想看英文题目: 无肥胖健康志愿者限时饮食的随机对照试验
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-28662-5
四、工具或资源类介绍
文献题目: Characterizing mobile element insertions in 5675 genomes
不想看英文题目: 对 5675 个基因组的移动元件特性插入进行表征
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac128/6536893
文献题目: Single-cell genome-wide concurrent haplotyping and copy-number profiling through genotyping-by-sequencing
不想看英文题目: 通过基因分型测序进行单细胞全基因组单倍体分型和拷贝数分析
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac134/6536884
文献题目: Mechanisms of mitochondrial promoter recognition in humans and other mammalian species
不想看英文题目: 人类和其他哺乳动物的线粒体启动子识别机制
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac103/6534357
文献题目: Genome-wide characterization of i-motifs and their potential roles in the stability and evolution of transposable elements in rice
不想看英文题目: i-motifs 的全基因组特征及其在水稻转座子稳定性和进化中的作用
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac121/6533605
文献题目: Rapid and accurate identification of ribosomal RNA sequences via deep learning
不想看英文题目: 通过深度学习快速准确地识别核糖体 RNA 序列
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac112/6533611
文献题目: BamToCov, an efficient toolkit for sequence coverage calculation
不想看英文题目: BamToCov: 计算序列覆盖度的高效工具包
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac125/6535233
文献题目: SEPA: Signalling entropy-based algorithm to evaluate personalized pathway activation for survival analysis on pan-cancer data
不想看英文题目: SEPA:基于信号熵算法用于泛癌数据的生存分析
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
文献题目: monaLisa: an R/Bioconductor package for identifying regulatory motifs
不想看英文题目: monaLisa:用于识别调控基序的 R/Bioconductor 包
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac102/6535228
文献题目: ASES: Visualising evolutionary conservation of alternative splicing in proteins
不想看英文题目: ASES:蛋白质可变剪接的进化保守性可视化
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
文献题目: Simultaneous test and estimation of total genetic effect in eQTL integrative analysis through mixed models
不想看英文题目: 通过混合模型同时测试和估计 eQTL 的总遗传效应
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
文献题目: Deep learning-based identification of genetic variants: application to Alzheimer’s disease classification
不想看英文题目: 基于深度学习进行遗传变异识别:在阿尔茨海默病分类中的应用
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
文献题目: SVPath: an accurate pipeline for predicting the pathogenicity of human exon structural variants
不想看英文题目: SVPath:预测人类外显子结构变异致病性的准确管道
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~
标签:Q1,题目,20220226,速递,增强子,https,文献,com 来源: https://www.cnblogs.com/chenwenyan/p/15943004.html