没有合适的资源?快使用搜索试试~ 我知道了~
natasha:解决基本的俄罗斯NLP任务,针对较低级别的Natasha项目的API
共50个文件
py:32个
txt:5个
tar:4个
需积分: 9 0 下载量 134 浏览量
2021-02-03
15:20:02
上传
评论
收藏 32.83MB ZIP 举报
温馨提示
Natasha解决了俄语的基本NLP任务:标记化,句子分段,单词嵌入,形态标记,词形化,短语规范化,语法解析,NER标记,事实提取。 新闻文章的每项任务质量均与当前的SOTA相似或更高,请参阅。 娜塔莎(Natasha)不是研究项目,其基础技术是为生产而构建的。 我们注意模型大小,RAM使用率和性能。 模型在CPU上运行,请使用Numpy进行推断。 Natasha通过一个便捷的API集成了库: 令牌,俄语的句子分段 —紧凑的俄罗斯嵌入 —用于俄罗斯NLP的现代深度学习技术,用于俄罗斯形态,语法,NER的紧凑模型。 基于规则的事实提取,类似于Tomita解析器。 — NER和语法标记的NLP可视化。 :warning: API可能会更改,对于现实世界的任务,请考虑使用Natasha项目中的低级库。 针对新闻文章进行了优化的模型,其他领域的质量可能会更低。 要使用旧的NamesExtractor , AddressExtactor降级pip install natasha<1 yargy<0.13 安装 Natasha支持Python 3.5+和PyPy3: $ pip
资源推荐
资源详情
资源评论
收起资源包目录
natasha-master.zip (50个子文件)
natasha-master
MANIFEST.in 33B
requirements
ci.txt 175B
main.txt 84B
.github
workflows
main.yml 507B
natasha
ner.py 1KB
record.py 3KB
norm.py 3KB
shape.py 1KB
const.py 37B
obj.py 848B
segment.py 691B
__init__.py 542B
morph
vocab.py 4KB
tagger.py 1KB
__init__.py 0B
lemma.py 1KB
syntax.py 2KB
emb.py 322B
data
emb
navec_news_v1_1B_250K_300d_100q.tar 25.4MB
dict
first.txt 97KB
last.txt 2.82MB
maybe_first.txt 2KB
model
slovnet_ner_news_v1.tar 2.28MB
slovnet_morph_news_v1.tar 2.46MB
slovnet_syntax_news_v1.tar 2.49MB
__init__.py 755B
tests
test_name.py 2KB
test_money.py 1KB
test_addr.py 4KB
__init__.py 0B
test_doc.py 10KB
conftest.py 1KB
test_span.py 890B
test_date.py 662B
doc.py 8KB
extractors.py 2KB
grammars
__init__.py 0B
name.py 2KB
date.py 2KB
money.py 4KB
addr.py 31KB
span.py 802B
docs.ipynb 46KB
LICENSE 1KB
AUTHORS.md 135B
setup.cfg 298B
setup.py 1KB
README.md 20KB
Makefile 494B
.gitignore 127B
共 50 条
- 1
资源评论
蓝精神
- 粉丝: 26
- 资源: 4721
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 锄战三国村 修改:货币使用不减 v1.10(2) 原创 (中文).apk
- 基于python实现的单目双目视觉三维重建+源代码+图像图片(高分课程设计)
- 基于C+++OPENCV的全景图像拼接源码(课程设计)
- 基于Python+OpenCV对多张图片进行全景图像拼接,消除鬼影,消除裂缝+源代码+文档说明+界面截图(高分课程设计)
- 基于C++实现的全景图像拼接源码(课程设计)
- 基于SIFT特征点提取和RASIC算法实现全景图像拼接python源码+文档说明+界面截图+详细注释(95分以上课程大作业)
- 基于matlab实现眼部判别的疲劳检测系统+源代码+全部数据+文档说明+详细注释+使用说明+截图(高分课程设计)
- 基于Matlab的异常姿势识别系统+源代码+全部数据+文档说明+详细注释+使用说明+截图(高分课程设计)
- 隐藏文件展示工具,用来展示被病毒隐藏的文件
- 基于Matlab的图像分割系统+源代码+全部数据+文档说明+详细注释+使用说明+截图(高分课程设计)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功