首页 > TAG信息列表 > Nilsimsa
局部敏感哈希-Nilsimsa
Nilsimsa的主要流程是: 针对文本字节序列,设定5字节窗口,向右滑动,一次一个字节; 在每一个5字节窗口,能生成N个三元组,例如:字符串“igram”,可以生成“igr”,“iga”,“igm”,“iga”,“igm”,“gra”,“grm”,“gam”,“ram”; 每一个三元组通过一个哈希函数计算一个结果,这个结果在区间(0,256),此时局部敏感哈希-Nilsimsa
Nilsimsa的主要流程是: 针对文本字节序列,设定5字节窗口,向右滑动,一次一个字节; 在每一个5字节窗口,能生成N个三元组,例如:字符串“igram”,可以生成“igr”,“iga”,“igm”,“iga”,“igm”,“gra”,“grm”,“gam”,“ram”; 每一个三元组通过一个哈希函数计算一个结果,这个结果在区间(0,256),此时