没有合适的资源?快使用搜索试试~ 我知道了~
indic_nlp_library:印度语言自然语言处理的资源和工具
共66个文件
py:31个
txt:14个
rst:12个
需积分: 10 1 下载量 93 浏览量
2021-05-07
23:27:51
上传
评论
收藏 95KB ZIP 举报
温馨提示
印度NLP库 印度NLP库的目标是建立基于Python的库,用于印度语中的普通文本处理和自然语言处理。 印度语言在脚本,语音,语言语法等方面有很多相似之处,并且该库试图为印度语言文本非常常用的工具集提供通用解决方案。 该库提供以下功能: 文字规范化 脚本信息 词标记化和去标记化 句子拆分 分词 音节化 脚本转换 罗马化 指示 音译 翻译 印度NLP库所需的数据资源托管在其他存储库中。 这些资源是某些模块所必需的。 您可以从项目下载。 如果您对印度语NLP资源感兴趣,则应检查中的指针。 先决条件 Python 3.x (对于Python 2.x版本,请检查标签PYTHON_2.7_FINAL_JAN_2019 。不再积极支持Python 2.x,但将尝试保持尽可能多的兼容性) 其他依赖项在setup.py中列出 配置 从pip安装: pip install indic-nlp-lib
资源详情
资源评论
资源推荐
收起资源包目录
indic_nlp_library-master.zip (66个子文件)
indic_nlp_library-master
contrib
indic_scraper_project_sample.ipynb 22KB
hindi_to_kannada_transliterator.py 2KB
README.md 827B
correct_moses_tokenizer.py 1KB
requirements.txt 59B
LICENSE 1KB
indicnlp
script
phonetic_sim.py 2KB
english_script.py 4KB
__init__.py 0B
indic_scripts.py 9KB
__init__.py 0B
morph
__init__.py 0B
unsupervised_morph.py 4KB
tokenize
indic_tokenize.py 3KB
sentence_tokenize.py 6KB
indic_detokenize.py 3KB
__init__.py 0B
test
__init__.py 0B
unit
__init__.py 0B
cli
cliparser.py 9KB
__init__.py 0B
normalize
__init__.py 0B
indic_normalize.py 35KB
loader.py 1000B
langinfo.py 11KB
transliterate
acronym_transliterator.py 2KB
script_unifier.py 6KB
__init__.py 0B
unicode_transliterate.py 12KB
sinhala_transliterator.py 6KB
syllable
__init__.py 0B
syllabifier.py 9KB
common.py 2KB
setup.py 1KB
README.md 4KB
test_data
morph
mr.txt 1KB
tokenize
trivial.txt 1KB
transliterate.ipynb 10KB
normalize
te.txt 202B
ta.txt 238B
mr.txt 162B
hi.txt 162B
ur.txt 100B
gu.txt 152B
pa.txt 146B
bn.txt 149B
kK.txt 154B
en.txt 59B
ma.txt 242B
docs
indicnlp.script.rst 513B
make.bat 795B
cmd.rst 127B
conf.py 8KB
indicnlp.cli.rst 193B
indicnlp.transliterate.rst 803B
indicnlp.pdf 37KB
indicnlp.MD 4KB
indicnlp.tokenize.rst 544B
index.rst 426B
Makefile 5KB
indicnlp.normalize.rst 315B
code.rst 123B
indicnlp.syllable.rst 203B
indicnlp.morph.rst 204B
indicnlp.rst 722B
modules.rst 56B
共 66 条
- 1
太远有一点点
- 粉丝: 34
- 资源: 4740
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Matlab的教室人数统计系统可统计正脸人数源码毕业设计.zip
- 重磅上市公司论文实证分析筛选样本所用数据指标(2000-2022年) 是否ST或PT 金融
- 你的名字。.BD.720p.日语中字.mp4
- 重磅公司治理水平数据构造至2022(基于主成分分析方法),含最终数据及构造代码!
- 毕业设计python完成三个过程PDF的识别与分析信息抽取构建知识图谱信息检索基于知识图源码谱.zip
- Matlab的交通标志识别系统带界面可判别红色精灵蓝色指示和黄色警示三类交通标志源码.zip
- 财政学课件与案例资料2222-22
- 上市银行资本充足率资产负债率营收增长率成本收入比权益乘数2007-2022总资产
- MATLAB的火焰识别源码毕业设计.zip
- 芬斯特拉《高级国际贸易学》教学讲义-Advanced International Trade
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0