Elasticsearch5.2配ik分词器_ik分词乱码资源-CSDN文库

共127个文件

jar：74个

properties：12个

dic：12个

需积分: 10 50 浏览量 2018-01-09 13:52:22 上传评论收藏 36.54MB ZIP 举报

**Elasticsearch 5.2.2 配置 IK 分词器详解** Elasticsearch（ES）是一款功能强大的全文搜索引擎，广泛应用于数据检索、日志分析等领域。在处理中文文本时，为了实现精确的搜索匹配，我们需要使用适合中文的分词器。IK 分词器（Intelligent Chinese Analyzer for Elasticsearch）是针对 ES 的一款高效、灵活的中文分词组件，尤其适用于处理中文文档的索引和搜索。在 ES 5.2.2 版本中，配置 IK 分词器至关重要，这将直接影响到中文搜索的效果。 **一、安装 IK 分词器** 1. **下载 IK 分词器**: 你需要从 IK 分词器的官方仓库或者 GitHub 上下载对应版本的 analysis-ik 插件，确保与你的 ES 版本相匹配。例如，对于 ES 5.2.2，你应该下载 analysis-ik 的 5.x 系列版本。 2. **安装插件**: 进入 ES 的安装目录，执行以下命令来安装 analysis-ik 插件： ``` bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v5.2.2/elasticsearch-analysis-ik-5.2.2.zip ``` 安装过程中，系统会自动解压并安装，完成后会提示 "Plugin installed successfully"。 **二、配置 IK 分词器** 1. **配置文件**：在 ES 的配置文件 `config/elasticsearch.yml` 中添加以下配置，指定 IK 分词器为默认的分析器： ``` index.analysis.analyzer.default.type: "ik_max_word" ``` 如果希望对关键词进行更精细化的处理，可以使用 "ik_smart" 分词模式，它会尝试对关键词进行最精简切分。 2. **自定义词典**：IK 分词器支持自定义词典，可以添加特定词汇或者排除某些词汇。在 `config` 目录下创建 `custom_dict.dic` 文件，添加你的自定义词汇。然后在 `elasticsearch.yml` 中指定： ``` ik.conf.custom_dict: config/custom_dict.dic ``` **三、启动 Elasticsearch** 1. 保存配置后，重启 ES 服务，使新的配置生效。 2. 使用 curl 或者 Postman 工具，通过 RESTful API 检查 IK 分词器是否已经安装成功： ```bash curl -X GET 'localhost:9200/_analyze?analyzer=ik_max_word&pretty' -H 'Content-Type: application/json' -d '{"text": "这是一个测试"}' ``` 如果返回结果中能看到“这是”、“一个”、“测试”等分词结果，说明 IK 分词器配置成功。 **四、应用 IK 分词器** 1. 在创建索引时，指定使用 IK 分词器： ```json { "settings": { "number_of_shards": 1, "number_of_replicas": 0, "analysis": { "analyzer": { "default": { "type": "ik_max_word" } } } }, "mappings": { "your_type": { "properties": { "your_field": { "type": "text", "analyzer": "ik_max_word" } } } } } ``` 2. 插入数据并进行搜索，观察 IK 分词器的效果。通过以上步骤，你已经在 Elasticsearch 5.2.2 中成功配置并使用了 IK 分词器。这将显著提升中文搜索的准确性和效率，为你的数据检索需求提供强大支持。记得定期更新 IK 分词器，以获取最新的分词规则和性能优化。

资源推荐

资源详情

资源评论

收起资源包目录

Elasticsearch5.2配ik分词器（127个子文件）

elasticsearch-service.bat 11KB

elasticsearch.bat 3KB

elasticsearch-translog.bat 1KB

elasticsearch.in.bat 828B

elasticsearch-plugin.bat 733B

sougou.dic 4.98MB

main.dic 2.92MB

single_word_full.dic 62KB

single_word.dic 62KB

single_word_low_freq.dic 11KB

quantifier.dic 2KB

surname.dic 752B

suffix.dic 192B

stopword.dic 164B

ext_stopword.dic 156B

mydict.dic 138B

preposition.dic 123B

elasticsearch 8KB

elasticsearch-plugin 2KB

elasticsearch-systemd-pre-exec 223B

elasticsearch-translog 2KB

elasticsearch-service-mgr.exe 102KB

elasticsearch-service-x64.exe 102KB

elasticsearch-service-x86.exe 79KB

elasticsearch-5.2.2.jar 9.19MB

groovy-2.4.6-indy.jar 4.32MB

lucene-core-6.4.1.jar 2.53MB

jcodings-1.0.12.jar 1.44MB

lucene-analyzers-common-6.4.1.jar 1.42MB

log4j-core-2.7.jar 1.24MB

netty-3.10.6.Final.jar 1.23MB

hppc-0.7.1.jar 1.09MB

jna-4.2.2.jar 1.08MB

jts-1.13.jar 776KB

httpclient-4.5.2.jar 719KB

netty-common-4.1.7.Final.jar 670KB

joda-time-2.9.5.jar 617KB

netty-codec-http-4.1.7.Final.jar 532KB

lang-painless-5.2.2.jar 465KB

netty-transport-4.1.7.Final.jar 417KB

lucene-queryparser-6.4.1.jar 395KB

asm-debug-all-5.1.jar 379KB

httpcore-nio-4.4.5.jar 348KB

httpcore-4.4.5.jar 320KB

netty-handler-4.1.7.Final.jar 319KB

httpcore-4.4.4.jar 319KB

netty-codec-4.1.7.Final.jar 301KB

antlr4-runtime-4.5.1-1.jar 295KB

commons-codec-1.10.jar 278KB

jackson-core-2.8.6.jar 275KB

snakeyaml-1.15.jar 263KB

commons-codec-1.9.jar 258KB

netty-buffer-4.1.7.Final.jar 253KB

lucene-suggest-6.4.1.jar 241KB

lucene-spatial3d-6.4.1.jar 231KB

lucene-highlighter-6.4.1.jar 225KB

lucene-queries-6.4.1.jar 225KB

log4j-api-2.7.jar 214KB

lucene-spatial-extras-6.4.1.jar 192KB

lucene-sandbox-6.4.1.jar 188KB

reindex-5.2.2.jar 188KB

joni-2.1.6.jar 186KB

spatial4j-0.6.jar 183KB

httpasyncclient-4.1.2.jar 173KB

lucene-misc-6.4.1.jar 152KB

lucene-join-6.4.1.jar 147KB

percolator-5.2.2.jar 121KB

ingest-common-5.2.2.jar 117KB

HdrHistogram-2.1.6.jar 107KB

lucene-grouping-6.4.1.jar 105KB

transport-netty3-5.2.2.jar 98KB

compiler-0.9.3.jar 98KB

transport-netty4-5.2.2.jar 96KB

lang-mustache-5.2.2.jar 86KB

lucene-backward-codecs-6.4.1.jar 85KB

jopt-simple-5.0.2.jar 76KB

jackson-dataformat-smile-2.8.6.jar 72KB

lucene-expressions-6.4.1.jar 72KB

aggs-matrix-stats-5.2.2.jar 71KB

lang-expression-5.2.2.jar 68KB

commons-logging-1.1.3.jar 61KB

commons-logging-1.2.jar 60KB

log4j-1.2-api-2.7.jar 59KB

lucene-spatial-6.4.1.jar 55KB

rest-5.2.2.jar 55KB

asm-5.0.4.jar 52KB

elasticsearch-analysis-ik-5.2.2.jar 50KB

jackson-dataformat-cbor-2.8.6.jar 50KB

t-digest-3.0.jar 49KB

lucene-memory-6.4.1.jar 45KB

asm-commons-5.0.4.jar 41KB

lang-groovy-5.2.2.jar 40KB

jackson-dataformat-yaml-2.8.6.jar 40KB

netty-resolver-4.1.7.Final.jar 29KB

asm-tree-5.0.4.jar 28KB

securesm-1.1.jar 7KB

elasticsearch.log 101KB

elasticsearch_deprecation.log 82KB

共 127 条

评论收藏

内容反馈

qq_29620877

粉丝: 0
资源: 2

Elasticsearch5.2配ik分词器

删除文件或文件夹提示指定的文件名无效或太长无法删除工具

文件名太长无法删除解决方法(工具法和手动法，亲测)

Windows 文件名过长或文件夹过多删除工具

文件名超长文件删除工具long path fixer

批量修改文件名脚本，对文件名批量替换或删除字符

Python删除windows长路径文件

创建无法删除文件夹

删除无法删除的文件夹

创建无法删除的文件夹

无法删除文件夹解决办法

\删除无法删除的文件夹

删除超长文件夹方法

懒神之彻底解决Windows文件名太长无法删除的问题

文件夹内文件名对比

易语言取路径文件名

python删除文件夹里面所有重复的文件(大小,内容,文件名相同)、python提取所有文件夹名和文件名、python提取

U盘内文件夹无法删除情况

文件夹无法删除怎么办.docx

删除无法删除的文件夹工具

无法删除update文件夹

无法删除嵌套文件夹

批处理删除指定文件夹下的所有文件和文件夹

Java删除文件夹

Windows10中长路径文件无法删除解决方法

文件名和文件夹名批量修改器

Java生成、修改文件夹和文件名.rar

建立无法删除文件夹，安全U盘

Unlocker1.8.5 删除无法删除的文件 文件夹

无法删除Found.000文件夹的解决.docx

建立一个别人既无法进入又无法删除的文件夹

最新资源

Unlocker1.8.5 删除无法删除的文件文件夹