其他分享
首页 > 其他分享> > Elastic Stack学习(二)

Elastic Stack学习(二)

作者:互联网

文章目录

搜索的概念

用户输入想要的关键词,返回含有该关键词的所有信息。

业务场景:

垂直搜索的弊端(数据库做搜索)

对于大型互联网项目,数据级别为PB级,不会采用数据库做搜索。

倒排索引【重要】

倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因此称为倒排索引 (inverted index)。

举一个例子就是当我们搜索“漫威电影”的时候,会对“漫威电影”这个词进行分词,然后去查询每个分词包含的索引,处理后返回数据。
在这里插入图片描述

全文检索

全文检索(Full-Text Retrieval)是指以文本作为检索对象,找出含有指定词汇的文本。

在全文检索中,有以下处理特点:

对于全文检索,我们更关心的方便快捷,所以在信息检索工具中,全文检索是最具通用性和实用性的。

Lucene

Lucene是一个Jar包,封装了全文检索的引擎、搜索的算法代码。开发时引入Lucene的Jar包,通过API开发搜索相关业务,底层会在磁盘建立索引库。

什么是Elastic Search?

我们都知道Lucene不支持分布式,因此对于Lucene集群有三个问题需要考虑:

Elastic Search的出现解决了以上的问题:

Elastic Search的功能

分布式的搜索引擎和数据分析引擎

全文检索,结构化检索,数据分析

海量数据近实时处理

Elastic Search的使用场景

国外

国内

Elastic Search的特点

标签:数据分析,Search,Elastic,学习,全文检索,搜索,数据,Stack
来源: https://blog.csdn.net/MAKEJAVAMAN/article/details/122275613