这是我参与8月更文挑战的第4天,活动详情查看:8月更文挑战
Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎,它具有强大的搜索功能。
对文本搜索一般可以分为三种类型:模糊搜索、精确搜索、分词搜索。
- 模糊搜索:如sql中的like查询语句,匹配包含搜索关键字的内容。
- 精确搜索:文本内容与搜索关键字一致。
- 分词搜索:将文本先进行分词,包括搜索关键字分词和搜索内容进行分词,再匹配相关内容。
用一个例子说明:
我们有一串文本「我正在学习数据结构和算法」,
如果是模糊搜索,用「学习」、「数据结构」、「算法」等关键词就能搜索出结果
如果是精确搜索,搜索关键词一定为「我正在学习数据结构和算法」才能搜出结果
如果是分词搜索,「算法之美」关键词就能搜索出结果,因为分词搜索,只需要将关键字的分词匹配上就可以了。而使用模糊搜索,是不能正确搜索出结果的。
在Elasticsearch中,使用“term”,“match”,“match_phrase”,“keyword”进行相关搜索。接下来我们用实验演示不同的搜索效果。
相关准备:
索引base-product-spu-info中有一条数据:
1 | json复制代码{ |
对「【市场价2532】HUAWEI WATCH 2 Pro 4G智能手表 移动支付」分词(默认分词器,单个字分词)
1 | csharp复制代码GET base-product-spu-info/_analyze |
term 搜索
term搜索是对搜索词不进行分词搜索,但对搜索的字段还是会分词,而加keyword属性,则是不分词的精准搜索
- 关键字「智」搜索
1 | csharp复制代码GET base-product-spu-info/_search |
- 关键字「智能」搜索
1 | csharp复制代码GET base-product-spu-info/_search |
- 关键字「Pro」搜索
1 | csharp复制代码GET base-product-spu-info/_search |
- 关键字「pro」搜索(小写)
1 | csharp复制代码GET base-product-spu-info/_search |
- 关键字「【市场价2532】HUAWEI WATCH 2 Pro 4G智能手表 移动支付」搜索
1 | csharp复制代码GET base-product-spu-info/_search |
- 关键字「【市场价2532】HUAWEI WATCH 2 Pro 4G智能手表 移动支付」搜索(增加keyword关键字)
1 | csharp复制代码GET base-product-spu-info/_search |
match搜索 (分词搜索)
先对搜索词进行分词,再进行分词搜索
1 | csharp复制代码GET base-product-spu-info/_search |
match_phrase 搜索(模糊搜索)
短语搜索, 要求所有的分词必须同时出现在文档中,同时位置必须紧邻一致**
1 | csharp复制代码GET base-product-spu-info/_search |
本文转载自: 掘金