其他分享
首页 > 其他分享> > elasticsearch系统学习笔记6-文本分析与分词器

elasticsearch系统学习笔记6-文本分析与分词器

作者:互联网

elasticsearch系统学习笔记6-文本分析与分词器

概念

Analyzer 的组成

分词器一般由三部分组成(也可以只包含部分组件):

内置分词器

ES内置分词器

资料

  1. standard analyzer
  1. simple analyzer

Language Analyzers

  1. ICU analyzer

./bin/elasticsearch-plugin install analysis-icu

测试:

GET /_analyze
{
  "analyzer": "icu_analyzer",
  "text": "他说的确实在理"
}

_analyzer api

  1. 指定 Analyzer 进行测试
GET /_analyze
{
  "analyzer": "standard",
  "text": "Elasticsearch in Action"
}
  1. 指定索引的字段上所使用的分词器进行测试
POST user/_analyze
{
  "field": "name",
  "text": "Elasticsearch in action"
}
  1. 定制化分词器进行测试
POST /_analyze
{
  "tokenizer": "standard",
  "filter": ["uppercase"],
  "text": "Elasticsearch in action"
}

标签:分词器,text,Character,analyzer,elasticsearch,Filters,文本
来源: https://blog.csdn.net/u013837825/article/details/122766103