没有合适的资源?快使用搜索试试~ 我知道了~
文本分析项目
共56个文件
py:23个
js:6个
xml:5个
需积分: 9 1 下载量 35 浏览量
2021-02-24
23:49:30
上传
评论
收藏 148KB ZIP 举报
温馨提示
德语句子的自动复杂度评估 团队成员 里奥·阮·拉乌尔·贝格·康拉德·斯特劳布·蒂尔·诺彻 邮件地址 现有代码片段 利用的图书馆 运行代码(稍后将设置主入口点) 下载数据集: python download_data.py 项目状态 数据分析 我们的主要数据源是TextComplexityDE 19数据集( ),其中包含1000个德语句子,由外语学习者在7点Likert量表上标记为A级和B级,其中1表示低复杂度,高可读性句子,而7则相反。 其中900个句子来自23篇德国Wikipedia文章,其余100则来自Leichte Sprache。 数据集中的每个句子至少由5个人标记,数据集中提供了它们的平均评分。 除了复杂性/可读性之外,还收集了句子的可理解性和词汇难度得分。 图:饼图显示(四舍五入的)评级分布。 评级不是平均分配的,因为平均没有句子收到7,而很少有人得到6。在句子的
资源推荐
资源详情
资源评论
收起资源包目录
text-analytics-project-master.zip (56个子文件)
text-analytics-project-master
.example.env 26B
.github
workflows
test.yml 606B
lint.yml 345B
src
utils
sample.py 855B
regression.py 2KB
dimension_reduction.py 1001B
wordlists.py 9KB
experiments.py 2KB
sentencestats.py 8KB
preprocessing.py 3KB
evaluater.py 8KB
__init__.py 0B
vectorizer.py 6KB
gpu.py 414B
word2vec.py 5KB
downloader.py 4KB
to_dataframe.py 16KB
visualizer.py 8KB
traverser.py 12KB
trainer.py 7KB
BERT.py 3KB
clustering.py 4KB
main.py 4KB
data
.gitkeep 0B
exploration.py 23KB
.vscode
extensions.json 158B
settings.json 2KB
requirements.txt 296B
Pipfile.lock 105KB
.idea
misc.xml 292B
workspace.xml 3KB
inspectionProfiles
profiles_settings.xml 174B
modules.xml 296B
text-analytics-project.iml 474B
vcs.xml 180B
.isort.cfg 52B
LICENSE 1KB
README.md 8KB
Pipfile 817B
htmlcov
jquery.ba-throttle-debounce.min.js 731B
index.html 3KB
jquery.hotkeys.js 3KB
keybd_closed.png 112B
tests_sample_test_py.html 6KB
status.json 543B
jquery.min.js 94KB
jquery.tablesorter.min.js 12KB
jquery.isonscreen.js 1KB
coverage_html.js 18KB
_venv_lib_python3_7_site-packages__virtualenv_py.html 35KB
keybd_open.png 112B
style.css 11KB
.pre-commit-config.yaml 952B
tests
sample_test.py 310B
__init__.py 0B
.gitignore 413B
共 56 条
- 1
资源评论
吉莫吉鱼
- 粉丝: 14
- 资源: 4591
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功