没有合适的资源?快使用搜索试试~ 我知道了~
2020-2-level-ctlr
共44个文件
py:23个
md:6个
txt:6个
需积分: 5 0 下载量 182 浏览量
2021-03-04
09:38:50
上传
评论
收藏 35KB ZIP 举报
温馨提示
基础和计算语言学第二课程数据集收集器实验室(2020/2021) 关于课程 经济学院(下诺夫哥罗德分校)的 。 讲师 讲师 Uraev Dmitry Yurievich-助理 动机 这个想法是自动获得具有特定结构和适当内容的数据集,并使用各种NLP库执行形态分析。 。 项目时间表 刮刀 简短摘要:您的代码可以自动解析您要选择的媒体网站,以适当的格式保存文本及其元数据 截止日期: 2021年3月15日 形式:每个学生都按自己的PR 数据集数量:5-7条 设计文件: 其他资源: 可供选择的媒体网站列表: 管道 简短摘要:您的代码可以自动处理上一步中的原始文本,进行语音点标记和基本的形态分析。 截止日期: 2021年4月5日 格式:每个学生都在自己的PR中工作 数据集数量:5-7条 设计文件: 自己的研究 简短摘要:您的代码可以创建一个更大的处理后的数据集,该数据集具有用于语言研究的所
资源推荐
资源详情
资源评论
收起资源包目录
2020-2-level-ctlr-main.zip (44个子文件)
2020-2-level-ctlr-main
constants.py 237B
target_score.txt 96B
config
student_text_preprocess_score_eight_test.py 23B
check-raw-data.sh 643B
crawler_config_test.py 3KB
raw_dataset_test.py 2KB
student-text-preprocess.sh 796B
run-lint.sh 250B
lint_level.py 2KB
reference_text_preprocess_score_eight_test.py 31B
raw_metadata_score_six_test.py 3KB
student_text_preprocess_score_four_test.py 972B
config_param_changer.py 470B
test_params.py 505B
reference_text_preprocess_score_four_test.py 2KB
raw_metadata_score_four_test.py 1KB
check_raw_dataset_volume_score_four_test.py 348B
__init__.py 0B
reference-text-preprocess.sh 804B
student_text_preprocess_test.py 2KB
collect-articles-from-internet.sh 473B
test_files
reference_score_four_test.txt 85B
reference_test.txt 404B
0_meta.json 152B
0_raw.txt 89B
raw_metadata_test.py 4KB
config_generator.py 571B
reference_text_preprocess_test.py 3KB
check_raw_dataset_volume_test.py 595B
docs
pipeline.md 1KB
dataset.md 1KB
scrapper.md 14KB
DEVELOPER.md 2KB
article.md 862B
.github
workflows
crawler.yml 10KB
pipeline.py 2KB
__init__.py 0B
article.py 3KB
crawler_config.json 117B
scrapper.py 1KB
requirements.txt 0B
.gitignore 2KB
requirements_qa.txt 13B
README.md 6KB
共 44 条
- 1
资源评论
汪纪霞
- 粉丝: 35
- 资源: 4700
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功