机器学习--汉明距离计算
作者:互联网
汉明距离是机器学习中的一个距离计算公式
本文主要介绍汉明距离的计算,用python实现,只要思路如下:
思路是:
比如有3个数(用二进制表示) (方向从右到左,分别为第1位、第2位…)
第一个数 a: 1 0 0 1
第二个数 b: 0 1 1 1
第三个数 c: 0 0 1 1
那么第一位上的汉明距离总和是0。
为什么? 因为a、b、c该位全是"1",任意两个"1"的汉明距离是0,所以该位汉明距离总和是0。
接下来看第二位,a的第二位是"0",b、c的是"1",此时该位的汉明距离就是2。
为什么? 由上面我们可以得到,该位的"0"有1个,"1"有2个,而任意一个"0"都可以和任意一个"1"组合,
一对组合可以产生的汉明距离为1,所以问题转换为了算多少对01组合,那么怎么计算呢?
答案就是该位"0"的个数乘以"1"的个数。
接下来看第三位,可以看出,此时"0"有2个,"1"有1个,所以可以产生的汉明距离为2。
接下来看第四位,可以看出,此时"0"有2个,"1"有1个,所以可以产生的汉明距离为2。
于是: 总的汉明距离就是 0 + 2 + 2 + 2 = 6
class Solution:
def totalHammingDistance(self, nums: List[int]) -> int:
arr0 = [0 for x in range(30)]
arr1 = [0 for x in range(30)]
for i in range(len(nums)):
num = nums[i]
for i in range(30):
if num & 1 == 1:
arr1[i] += 1
else:
arr0[i] += 1
num = num >> 1
res = 0
for i in range(30):
res += (arr0[i]*arr1[i])
return res
标签:机器,--,res,30,距离,range,num,汉明 来源: https://blog.csdn.net/u012512155/article/details/117371202