关于单细胞批次矫正那些事(二) KBET 用于单细胞批次矫正结果的评估
作者:互联网
之前我们根据GB 那篇文章了解到了对于常见的用于单细胞批次矫正分析的常见的方法Harmony LIGER以及Seurat3 等,那么文章也推荐如果是批次矫正后用于下游的分析的话推荐ComBat,MNN以及ZINB-WaVE以及scMerge这几种方法,但是其实这几种方法获得的批次效应处理和细胞类型聚类效果还不是很好。
A test metric for assessing single-cell RNA-seq batch correction 评估单细胞测序批次矫正的一个指标
今天我们进一步的分析再批次矫正后常用的评估方法之一KEBT,对批次效应处理结果的评估。文章主要来源于2019年的Nature methods,A test metric for assessing single-cell RNA-seq batch correction
相关的代码主要来源于链接github ::https://github.com/theislab/kBET
传统的对于单细胞的批次处理的结果评估,通常采用的就是t-SNE 以及UMAP 可视化,批次处理前后细胞聚类以及批次混合的结果,然而这种基于经验和肉眼评判的方式多少让人觉得有点不靠谱,这种kbet 的评估方式通过零和假设检验,用拒绝率的高低来评估批次处理后的效果。在本文中,作者通过KBET评估了常用的批次回归和标准化的方法,并评估了他们在保留生物学变异和去除批次效应的程度。作者还证明了KBET在来自健康工体的外周血单核细胞PBMC数据中的应用,以区分细胞类型特异性个体变异与细胞群体相对比例的变化。
批次效应通常也可以简单的理解为技术变异,而样本总体变异通常来自两方面(1是技术变异+生物学变异)
而对于数据的前期质控和处理包括数据的归一化和批次效应的处理以及后期的批次矫正后的评估主要见图e。
而对于单细胞数据在细胞和基因过滤之后,进行批次处理时非常重要的一步,而且对于感兴趣基因的后续分析也至关重要。感兴趣的基因能够消除数据中的噪音,定义数据分析的潜在结果。此外,scRNA-seq数据重复项之间的差异可能是由于不同的测序深度引起的,在低测序深度时检测的基因较少。
对于单细胞的批次处理常用的方法包括,线性回归模型如ComBat到非线性模型如Seurat的CAA分析以及 多重互临近MNN分析法,除此之外,差异检测的方法如MAST以及DeSeq2和limma,它们可以将批次效应作为协变量设计到模型里面。批次矫正的差异测试以及批次矫正数据矩阵的产生用于后续下游的分析如聚类,作者在此文中聚焦于后者。
作者主要试图找出哪种方法能够更好的去除批次效应,并且能够更好的保留样本原来的生物学效应。那么经典的经验学检测批次矫正的结果主要是可视化,包括PCA 分析。数据可视化被推荐作为第一步也是重要的一步去展示数据的分布。然而这种方法时主观的而且也缺乏定性的分析用于有效的比较,尤其是在用于多样本或者多技术的偏差估计的时候。因此作者推荐一种定量的方法用于数据的探索。
本文作者主要有KBET来量化批次效应,本算法的主要假设是 如果临近样本的子集标签分布与完整数据集的分布相同,则表明该重复实验能够很好的混合,相反,在存在批次效应下,生物学重复将会在整个数据集中产生批次标签的倾斜分布。KBET 通过采用卡方分布检测固定大小的随机邻域从而确定它们是否很好的被混合了。然后是得到一个二进制的结果用来计算后续的拒绝率,这表明,拒绝率越低样本混合的越好。
在本项研究中作者研究了KBET 在评估11个归一化和7个批次回归方法的性能,批次矫正基于log(counts+1),log(CPM+1)的数据。最后作者评估了KBET在分离数据集整合中的效应。
结果
KBET 优于其他的批次效应检测方法
作者通过对模拟的数据集(500个样本1000个基因)在第二个批次里分别进行1%,10%,20%平均基因表达的改变来检测二者的批次分离效果,发现第二批次的基因当有1% 偏倚的基因时,1批次和2批次混合较好,相反,当第二批次基因中存在20%偏倚的基因时,发现2个批次分开了,此刻KBET 的评估结果,即拒绝率明显的升高。期待的拒绝率和观察到的拒绝率分别见2c和2d。
与此同时,平均轮廓宽度即Sihouette的值随着改变的基因数目的增加也逐渐增大表明随着改变基因的增多,不同批次之间的混合效果越来越差。见图2e
kBET 使用皮尔森卡方检验固定K值的任意领域以及二进制结果。使用似然比检验或精确多项式检验作为基础假设检验得出的结果非常相似。K值在kBET的假设检验中是一个非常重要的因子。当k越小的时候,拒绝率普遍都越低。当k值逐渐增大,大于单细胞的批次的时候,我们发现拒绝率降低了。这是由于批次标签可能选择的数量减少,局部批次标签分布和整体的批次标签的分布更加相似。对于k值介于极大值和极小值之间的,平均拒绝率变大,最大值表述存在批次效应,我们将其用于量化。
我们研究了KBET 的能力用一种替换的方式去检测批次效应,绝对平均的轮廓宽度(absolute average silhouette width)以及缩放后的前50 的主成分变量。它们显著的与批次效应相关,这三种方法都是对归一化缩放后的数据进行操作,作为测试用例,我们改变了基因表达平均值增加的部分,并模拟了不同的基因缺失或者给平均值增加噪音(主要见图2e)。此外作者进一步的模拟了不同批次的大小(批次数从1-19),相比于轮廓宽度,KBET 增加的最多,在响应不同程度的偏倚的时候。在变化的基因数目在10%到20% 的时候,轮廓宽度几乎没有差异而KBET具有明显的效应。缩放PC回归随着批次效应的程度也在增加,当变化的基因数目在1%的时候,也有显著的结果变化。在只有较少数据点存在批次偏差的时候,KBET性能较优越,因为它在大小不平衡的批次中仍存在偏倚。总体而言,在几种测试方法中,KBET是批次效应最敏感和最可靠的检测方法。
KBET 精准的捕获批次效应
不同来源的批次效应,在技术重复对比的时候可以证实,作者采用的是通过in Drop 测序技术得到的小鼠的胚胎干细胞单细胞数据进行实验。作者提供了在培养0天的时候2个技术重复的相同样本,这提供了一个理想的批次矫正的例子,在批次矫正之前,作者对数据进行可视化,并且观察到了明显的批次内的差异随着技术重复的偏倚,在2个PC的顶端,可见图3b和3c。作者比较了多种归一化方法和批次矫正方法的组合,在这里作者主要对f-scLVM矫正的log(CPM+1)值和ComBat 矫正的log(counts+1)值的性能进行比较,主要从前两个PC进行展示。然而除了前两个PC成分外,其他的13个PC成分也显著的与批次效应有关在f-scLVM 方法中。因此批次效应没有被矫正,但是其在可视化过程中变得并不明显。通过ComBat 进行log(Counts+1)进行批次矫正的方法,没有一个的PC显著与批次协变量相关。而KBET 表明ComBat 应用log(Counts+1)的方式进行批次化处理的效果最好(体现在3e的y轴的接受率(是1-拒绝率)),相比于f-scLVM不完整的批次矫正性能。PCA图仅显示了前2维的PC成分,而KBET 量化了更加微妙的批次效应。
图3
区分 批次效应和生物学变异
批次矫正的第二大挑战是生物异质性的存在,没有哪个批次处理的方法能够消除所有的变异,将每个样本置于常量。我们通过评估批次矫正前后,高变异基因来评估生物相关性异质性。在批次矫正前,我们仅考虑在所有重复样本中分别存在的HVG,这是我们与批次校正后的HVG比较的保守的无批次的HVGs,总之,我们评估了校正后保留的HVG 的比例。
为了补充保留的HVG的概念,在数据集中不应该引入新的变量,因此批次矫正前后HVG基因集的差异是虚假发现的代名词,在这里两个技术重复之间共享了1863个无批次效应的HVG,而其中约700个HVG 存在于另一个重复里面。
当通过f-scLVM进行批次矫正后,作者保留了一般的无批次效应的HVG 并且在整个数据集发现了超过5000个HVG(3f),这能够解释为什么f-scLVM能够使KBET的接受率最小(3e)。当我们基于log(CPM+1)归一化进行计算FPR(假阳性率的时候)我们发现27%的FPR。在结合ComBat和log(Counts+1)的时候,我们获得了最好的结果(3d)。所有的HVG在批次矫正后都被保留了,并且批次矫正效应之导致了295个HVG 的改变(约8%的FPR,Figure3g)。
总之批次矫正可能会极大的混淆观察结果,完全的掩盖生物学信号。当前最好的批次处理效应还只能平衡数据中的部分批次效应(3e-g)。这能够解释批次矫正后HVG的总量以及FPR将有所增加。而轮廓宽度和PC回归表明在多数的批次矫正策略中几乎没有差异,而KBET从细节处解释了这些差异(3e)。
KBET指导基于板差异的scRNA-seq的效果最好
接着作者检测了在3中不同培养机上培养的mESC细胞。采用Smart-seq2/C1的方法进行测序。这套系统的 数据就异质性来说是非常相似的,但是每种培养条件下的异质性的生物学来源却不同。通过使用log(CPM+1)归一化的方法联合ComBat的方法我们获得了混合非常好的数据集,然而我们观察到了在不同的培养条件下,我们观察到了独立于批次数的不同的性能差异。
跨越重复 ,跨研究的数据集整合
跨多个研究的批次效应的矫正是非常具有挑战性的相比于相同的研究中批次效应。尤其是当2个研究中的细胞类型存在变化时。在本文中,作者在基于Smartseq测序的基础上,对8个小鼠的单细胞数据集进行了批次矫正。
作者使用Salmon重新匹配到相同的参考基因组,从而降低它的定量偏差。矫正前的批次效应甚至在PCA分析的时候都非常的明显(4b和4c)。
作者发现上述的研究中,在未进行批次矫正的时候,细胞更倾向于按照研究进行聚类,而非是细胞类型。此外,细胞按照研究进行聚类,也部分解释了文库的大小。作者采用ComBat的方法联合log(counts+1)获得了最好的结果。平均的接受率达到了62%。
一个有意义的整合维持着发育时期的正确轨迹,尽管相同的细胞类型来自不同的研究。因此,作者依据平均的Kbet 的结果来评估每个发育时期的矫正轨迹,并且通过轮廓宽度来监督发育进程(高的轮廓宽度反应了不同时期分离较好图4f)。在批次矫正之前,发育阶段的分离较弱,log(counts+1)处理后的轮廓宽度达到0.08。采用线性的矫正方法如limma 和ComBat产生了显著的阶段时期明显的聚类。仅仅只有ComBat能够实现好的不同研究之间的批次混合。显然PC1与细胞真实的发育时间一致。
尽管Seurat 的CCA比对位于靠前的性能方法中,并且产生了第二好的KBET结果,采用log(CPM+1)数据。轮廓宽度约接近0表名过度矫正,MNN的接受率较低,但是当仅仅使用Count 的时候细胞类型的聚类得到提升。可能是由于样本数目过少的原因。
kBET检测PBMC数据集中的个体差异
为了评估使用Kbet 进行评估纯的生物学变异,作者采用8个不相关的PBMC数据集进行分析。合并消除不同的个体间的技术差异。聚类和t-分布随机邻域嵌入可视化显示几种细胞类型以及不同个体间细胞类型的显著频率的改变。值得注意的是,所有的样本都是三次独立的实验,在批次间,细胞类型频率是非常相似的,因此排除了样本偏差。
作者采用Kbet 评估所有个体内的变异,在同一个细胞类型里,即使在考虑偏倚的情况下,KBET能够检测到相当大的变异。我们发现每个细胞类型的接受率在0.75-0.9之间,而全部的数据集的接受率在-0.62-0.72之间。因此如批量RNA-seq中累积的变化,不仅单受细胞表达的驱动,还受细胞群体大小的影响,KBET提供了一种灵敏的方法来评估,同一类型细胞之间的个体差异。
讨论
细胞类型聚类和以及随后的时序分析都依赖于批次效应的处理。KBET的评估在普遍的可变的批次中是非常简单的,但是在平衡的细胞设计中却很难,对于复杂的实验设计,如时间序列,收集所有时间点所有细胞的测序进行测序是阻止混合生物学变异和技术变异的唯一方法。Demuxlet方法允许个体间的可变性在没有技术混淆的情况下进行定量评估,并且kBET的异质性统计数据可用于评估对于生物个体之间的变异性。
根据kBET结果显示总体变化是由簇比例的差异驱动的,我们更愿意对来自复杂供体样品的较少供体的更多细胞进行测序(与先前的陈述相反)。
标签:矫正,批次,效应,KBET,细胞,单细胞,评估 来源: https://blog.csdn.net/leianuo123/article/details/114575621