用python正则表达式编译模糊正则表达式
作者:互联网
当我发现python regex模块可以进行模糊匹配时,我感到非常高兴,因为它似乎是解决我许多问题的简单方法.
但是现在我遇到了一个问题,我没有从文档中找到任何答案.
如何使用新的模糊性值功能将字符串编译为正则表达式?
为了说明我通常的需求并给出一些示例代码
import regex
f = open('liner.fa', 'r')
nosZ2f='TTCCGACTACCAAGGCAAATACTGCTTCTCGAC'
nosZ2r='AGGTCACATCAACGTCAACG'
#nini=regex.compile(nosZ2r{e<=3})
nimekiri=list(f)
pikkus=len(nimekiri)
count = 0
while (count < pikkus):
line = nimekiri[count].rstrip('\n')
m=regex.findall("(TTCCGACTACCAAGGCAAATACTGCTTCTCGAC){e<=3}", line)
n=regex.findall("AGGTCACATCAACGTCAACG{e<=3}", line)
if bool(m) & bool(n):
print nimekiri[count-1].rstrip('\n')
print line
count = count + 1
f.close()
如您所见,带有3个错误的模糊性的正则表达式可以正常工作.但是我被迫手动将整个字符串(nosZ2f / r)输入到findall中.
我无法使用错误/模糊度值编译正则表达式.
将字符串(行号nosZ2f / r)转换为模糊度值为3错误的正则表达式的正确语法是什么? (在注释行看到的尝试失败)
对于我想到的任何实际有用的脚本,使用输入字符串作为regexp的源的可能性至关重要. (否则自动化程度不高)
所以,如果我能做些烦恼,我会很高兴.更换
m=regex.findall("(TTCCGACTACCAAGGCAAATACTGCTTCTCGAC){e<=3}", line)
与
m=regex.findall(nini, line) etc.
要么
m=regex.findall("string{e<=3}", line)
解决方法:
您需要正确地将字符串放在一起.
import regex
testString = 'some phrase'
r = regex.compile('('+testString+'){e<=5}')
r.match('phrase')
如果要构建正则表达式模式,则需要使用各种字符串操作技术来构建要使用的适当模式.
标签:fuzzy-search,pypi-regex,python,regex 来源: https://codeday.me/bug/20191122/2058256.html