首页 > TAG信息列表 > edit-distance

计算在python中只有列和多行的数据帧的编辑距离

我有一个数据框,其中有一列,超过2000行.如何计算同一列的每一行之间的编辑距离. 我的Dataframe看起来像这样: Name John Mrinmayee rituja ritz divya priyanka chetna chetan mansi mansvi mani aliya shelia Dilip Dilipa 我需要计算每一行之间

如何纠正这个Damerau-Levenshtein实现中的错误?

我又回来了另一个冗长的问题.已经尝试了许多基于Python的Damerau-Levenshtein 编辑距离实现,I finally found the one listed below作为editdistance_reference().它似乎提供了正确的结果,似乎有一个有效的实施. 所以我开始将代码转换为Cython.在我的测试数据上,参考方法设法提供结

python – 通过过滤生成不同(远距离,通过编辑距离)单词的列表

我有一个很长的(> 1000项)单词列表,我希望从中删除与其他单词“太相似”的单词,直到剩下的单词都“显着不同”.例如,这样在编辑距离D内没有两个单词. 我不需要一个独特的解决方案,它不一定是最佳的,但它应该相当快(在Python中)并且不会丢弃太多条目. 我怎样才能做到这一点?谢谢. 编