编程语言
首页 > 编程语言> > python – 从距离矩阵计算亲和度矩阵

python – 从距离矩阵计算亲和度矩阵

作者:互联网

我使用clustal欧米茄获得500个蛋白质序列的距离矩阵(它们彼此同源).

我想使用亲和传播来聚类这些序列.

最初,因为我手工观察到距离矩阵只有0到1之间的值,0距离= 100%同一性,我推断我可以采取(1 – 距离)来获得亲和力.

我运行了我的代码,集群看起来很合理,我认为一切都很好……直到我读到这一点,通常通过应用“热内核”从距离矩阵计算亲和度矩阵.那就是我脑海里一切都崩溃的时候.

我是否认为亲和矩阵的概念不正确?有没有简单的方法来计算亲和度矩阵? scikit-learn提供以下公式:

similarity = np.exp(-beta * distance / distance.std())

但什么是beta?我知道distance.std()是距离的标准偏差.

我现在对所涉及的概念感到困惑和迷失(而不是实际的编码实现),所以非常感谢任何帮助!

附:我已经尝试过发布到Biostars.org,但我还没有得到答案……

解决方法:

我认为1距离和exp(-beta *距离)都是将距离转换为相似性的有效方法(尽管它们在概率框架中的解释不同).我会简单地使用什么给出更好的结果.

标签:python,bioinformatics,affinity
来源: https://codeday.me/bug/20190703/1370204.html