没有合适的资源?快使用搜索试试~ 我知道了~
ParsiAnalyzer:波斯语Elasticsearch分析器
共17个文件
java:12个
xml:2个
gitignore:1个
需积分: 10 0 下载量 79 浏览量
2021-05-05
01:28:57
上传
评论
收藏 14KB ZIP 举报
温馨提示
帕西分析仪 ParsiAnalyzer是Elasticsearch的分析插件。 分析是一个包含以下步骤的过程: 将一块文本标记为单独的术语 将这些术语标准化为标准形式 分析器实际上只是结合了字符过滤器,令牌生成器和令牌过滤器的包装器。 Elasticsearch提供了许多内置分析器,但仍有改进的空间,尤其是对于波斯语言。 该插件提供了用于标记,规范化和阻止波斯文字的工具。 主要特征 标记波斯文字 必要时将空格转换为零宽度非连接符( نیمفاصله )。 例如می رود到میرود 。 将波斯标点符号转换为等效的英语。 例如, ۳/۱۴至۳.۱۴ 用空格和标点符号标记波斯文字。 将波斯令牌标准化为单个规范形式 将Yeh,Kaf,Heh和Hamza的所有形式转换为唯一形式。 例如براي到برای 。 将所有波斯文和阿拉伯文数字转换为它们的英文等效形式。 例如, ۱۴۳到14
资源推荐
资源详情
资源评论
收起资源包目录
ParsiAnalyzer-master.zip (17个子文件)
ParsiAnalyzer-master
.gitignore 324B
README.md 3KB
pom.xml 2KB
src
main
resources
plugin-descriptor.properties 182B
java
org
elasticsearch
analyzer
tokenfilters
PersianNormalizationFilterFactory.java 715B
PersianNormalizationFilter.java 1KB
PersianStopFilter.java 1KB
PersianStemFilter.java 1KB
PersianStemFilterFactory.java 688B
PersianStopFilterFactory.java 1KB
PersianNormalizer.java 3KB
ParsiAnalyzer.java 2KB
ParsiAnalyzerPlugin.java 2KB
characterfilters
ZeroWidthNonJoinerCharFilterFactory.java 671B
ZeroWidthNonJoinerCharFilter.java 1KB
ParsiAnalyzerProvider.java 726B
assemblies
plugin.xml 697B
共 17 条
- 1
资源评论
李彼岸
- 粉丝: 34
- 资源: 4690
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功