没有合适的资源?快使用搜索试试~ 我知道了~
spacy-ru:SpaCy的俄语模型
共64个文件
py:25个
ipynb:13个
cfg:3个
需积分: 13 0 下载量 100 浏览量
2021-05-28
11:40:04
上传
评论
收藏 25.82MB ZIP 举报
温馨提示
spaCy库的俄语模型 有spacy 2.3的模型: 它们的用法如下: wget https://github.com/buriy/spacy-ru/releases/download/v2.3_beta/ru2_combined_400ks_96.zip unzip ru2_combined_400ks_96.zip 之后: import spacy nlp = spacy.load('ru2_combined_400ks_96') 这是2.1版的文档。 此ru2模型在2.1版中的优点 ru2模型不仅可以在x.pos_中定义POS标签,而且可以在x.lemma_中定义词lemma。 例如,对于名词,引理与名词性单数相同。 由于spacy库的设备的特殊性,为了获得更好质量的引理,您需要编写 import ru2 nlp = ru2.load_ru2('ru2') 代替标准 i
资源推荐
资源详情
资源评论
收起资源包目录
spacy-ru-master.zip (64个子文件)
spacy-ru-master
ru2e
tokenizer.py 467B
examples.py 5KB
meta.json 225B
lemmatizer.py 8KB
__init__.py 774B
syntax_iterators.py 2KB
tokenizer 24KB
utils
pluck.py 352B
corpus.py 4KB
__init__.py 0B
tqdm.py 643B
notebooks
examples
textcat_news_topics.ipynb 77KB
analysis.py 8KB
introspect_model.ipynb 8KB
corpora
load_syntagrus.ipynb 18KB
prepare_nerus.ipynb 10KB
kaggle_ru.ipynb 24KB
training
prepare_ru2e.ipynb 799B
train_ner_multiple_datasets_experimental.ipynb 229KB
eval_pos_dep.ipynb 11KB
load_ru2e.ipynb 3KB
train_ner_nerus.ipynb 25KB
train_pos_gpu.ipynb 30KB
tokenize-ru.sh 51B
Dockerfile 572B
examples
POS_and_syntax.ipynb 39KB
classifier.py 5KB
__init__.py 0B
tokenize
use_tokenize.ipynb 70KB
tokenizer_ru.py 421B
tokenizer_xx.py 370B
utils.py 731B
__init__.py 0B
linguistics.py 2KB
sentences.py 193B
full_simple_example.py 1KB
sentences.py 257B
tokenize-xx.sh 51B
LICENSE 1KB
setup.py 215B
README.md 7KB
Makefile 1KB
ru2
vocab
lexemes.bin 10.24MB
vectors 128B
key2row 1B
strings.json 84.79MB
examples.py 5KB
tagger
cfg 131B
model 3.8MB
tag_map 82KB
meta.json 309B
training.log 3KB
lemmatizer.py 8KB
__init__.py 628B
parser
cfg 324B
moves 2KB
model 3.94MB
syntax_iterators.py 2KB
ner
cfg 248B
moves 160B
model 3.82MB
tokenizer 24KB
.gitignore 172B
pyproject.toml 594B
共 64 条
- 1
资源评论
传奇panda
- 粉丝: 23
- 资源: 4581
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功