使用RethinkDB进行“全文搜索”
作者:互联网
我目前正在开发一个Web应用程序,理想情况下,我将能够在将要为用户存储的文档上支持搜索栏.这些文件中的每一个都只是一个小巧的片段,而尺寸恰到好处. (我不认为出于搜索目的,任何文档都会超过几KB的文本.)由于我一直在阅读有关使用RethinkDB的正确方法的信息,RethinkDB是让我担心的一些信息之一是对未编制索引的数据执行过滤器之类的操作的性能,我已经看到人们提到在其中一个调用中花费了几分钟.考虑到我希望从长远来看,至少将有10,000个文档(从长远来看,将有100,000,1,000,000等),有一种方法可以搜索这些文档,标准RethinkDB API有不到一秒(最好是十毫秒)的响应时间吗?还是我将不得不提出一种单独的方案,以允许通过聪明地使用索引来进行快速搜索?还是我最好使用提供该功能的另一个数据库?
解决方法:
如果不使用索引,则查询将不得不查看表中的每个文档,因此当表变大时,查询将变得越来越慢. 10,000个文档应该可以在快速的硬件上进行搜索,但是您可能无法在10毫秒内完成搜索,并且数百万个文档的搜索速度可能会很慢.
您可能需要研究elasticsearch作为执行此操作的一种方式:http://www.rethinkdb.com/docs/elasticsearch/
标签:rethinkdb,python-2-7,python,rethinkdb-python 来源: https://codeday.me/bug/20191120/2040428.html