1.IK分词器安装包,直接放在ES的plugins文件夹下解压就可以使用。如果需要配置自定义词典,将自己的.dic文件放在IK解压后的config即可,同时在IKAnalyzer.cfg.xml添加扩展词典或自定义的停词词典用英文分号(;)分隔即可(如:<entry key="ext_dict">test.dic;extra_single_word_low_freq.dic</entry>)。
2.如果使用远程词库,在远程sever放置.txt自定义分词文件,使用<entry key="remote_ext_dict">http://ip:端口号/文件名.txt</entry>配置即可,远程停词文件配置再<entry key="remote_ext_stopwords">中。
注:这里存放远程扩展词典使用的是nginx,支持扩展词典热更新。nginx配置如下:
server {
listen 8222(访问端口号);
server_name localhost(访问ip);
root /dist(扩展词典在linux存放位置,根目录下/dist文件夹);
location / {
index index.html test.txt(扩展词典文件);
# index test.txt;
#autoindex on;
}
}
特别注意:在安装ES时不能使用root用户启动,需要通过Linux命令chown -R 用户名:用户名 /xxx/xxxx/(文件路径),将ES文件夹授权给普通用户才可以启动。5.0以上版本的IK在配置时,可以不用在ES的.yml文件中配置,直接用就可由。
重要事情说三遍:ES版本必须和IK版本一样。
重要事情说三遍:ES版本必须和IK版本一样。
重要事情说三遍:ES版本必须和IK版本一样。
评论0
最新资源