没有合适的资源?快使用搜索试试~ 我知道了~
TRUNAJOD2.0:一个易于使用的库,可从文本中提取索引
共78个文件
py:26个
rst:12个
bib:8个
需积分: 5 1 下载量 124 浏览量
2021-04-16
23:00:28
上传
评论
收藏 22.57MB ZIP 举报
温馨提示
TRUNAJOD:基于spaCy的文本复杂性库,用于文本分析 TRUNAJOD是在高性能库的基础上进行文本复杂性分析的Python库。 利用spaCy提供的所有基本NLP功能(依赖关系分析,POS标记,标记化), TRUNAJOD专注于从文本中提取度量,这对于不同的应用程序和用例可能是有趣的。 尽管大多数索引可以针对不同的语言进行计算,但目前我们主要支持西班牙语。 如果您为您的语言实现的索引做出贡献,我们将非常高兴! 特征 文本处理的实用程序,例如lemmatization,POS检查。 来自文本的语义度量,例如句子之间的平均连贯性和平均同义词重叠。 诸如字母代词密度和代词名词比率之类的测量度。 内置的情感词典可根据文本中的单词来计算情感计算。 词汇语义规范数据集,用于从文本中计算词汇语义变量。 输入基于令牌比率(TTR)的指标,以及可调TTR指标。 内置音节器(当前仅用于西
资源推荐
资源详情
资源评论
收起资源包目录
TRUNAJOD2_0-master.zip (78个子文件)
TRUNAJOD2.0-master
MANIFEST.in 33B
.readthedocs.yml 568B
models
trunajod_models_v0.1.tar.gz 13.84MB
.coveragerc 712B
pyproject.toml 382B
.pre-commit-hooks.yaml 525B
docs
conf.py 4KB
make.bat 799B
api_reference
entity_grid.bib 566B
entity_grid.rst 148B
givenness.rst 140B
emotions.rst 135B
utils.rst 87B
lexico_ref.bib 654B
ttr.rst 134B
lexico_semantic_norms.rst 186B
surface_proxies.rst 128B
discourse_markers.rst 180B
syllabizer.rst 107B
semantic_ref.bib 1KB
discourse_markers_ref.bib 300B
givenness_ref.bib 446B
semantic_measures.rst 177B
ttr.bib 434B
root.rst 252B
emotions_ref.bib 361B
requirements.txt 44B
Makefile 638B
index.rst 104B
pytest.ini 180B
.github
workflows
build.yml 1005B
lint.yml 818B
doc.yml 1KB
TRUNAJOD_MODELS
wordnet_noun_synsets.pickle 4.63MB
wordnet_verb_synsets.pickle 546KB
spanish_lexicosemantic_norms.pickle 125KB
stopwords-es.txt 5KB
lemmatizador.pickle 18.48MB
tests
ttr_test.py 3KB
test_syllabizer.py 942B
semantic_measures_test.py 1KB
lexico_semantic_norms_test.py 3KB
discourse_markers_test.py 2KB
givenness_test.py 711B
utils_test.py 1KB
surface_proxies_test.py 1KB
emotions_test.py 2KB
tox.ini 191B
LICENSE 1KB
imgs
figure1.png 95KB
trunajod_logo.png 76KB
figure2.png 83KB
trunajod_thumb.png 11KB
CONTRIBUTING.md 5KB
src
TRUNAJOD
lexicosemantic_norms_espal.py 286KB
entity_grid.py 13KB
utils.py 8KB
syllabizer.py 9KB
ttr.py 6KB
semantic_measures.py 3KB
spanish_emotion_lexicon.py 69KB
givenness.py 2KB
lexico_semantic_norms.py 6KB
emotions.py 4KB
surface_proxies.py 21KB
verb_types.py 915B
discourse_markers.py 10KB
paper.md 8KB
paper.bib 4KB
setup.py 2KB
.gitignore 2KB
tester.py 2KB
stanza_example.py 1KB
CHANGELOG.md 243B
README.md 11KB
.flake8 92B
requirements-test.txt 65B
.pre-commit-config.yaml 585B
共 78 条
- 1
资源评论
基础颜究的三亩叔
- 粉丝: 23
- 资源: 4668
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功