编程语言
首页 > 编程语言> > python – whoosh是否要求所有字符串都是unicode?

python – whoosh是否要求所有字符串都是unicode?

作者:互联网

我正在从索尔的Whoosh重做我的搜索应用程序.我现在正在从快速入门中学习.但每次我不得不处理字符串时,我一直遇到问题

>>> writer.add_document(iden = fil,content = F2T.file_to_text(fil_path))
ValueError:’File Name.doc’不是unicode或sequence

然后:

>>>query = QueryParser("content", ix.schema).parse("first")
AssertionError: 'first' is not unicode

这条线直接来自快速启动的turorial! Whoosh是否要求所有字段都是unicode?让我的应用程序识别unicode(它甚至不值得)真的很难.至于“不是unicode或序列”,我理解字符串也是序列数据类型.

解决方法:

是的,它要求字符串是Unicode.

 query = QueryParser("content", ix.schema).parse("first")

改为:

query = QueryParser("content", ix.schema).parse(u"first")

标签:whoosh,python
来源: https://codeday.me/bug/20190726/1542188.html