没有合适的资源?快使用搜索试试~ 我知道了~
purano:新闻注释和聚类
共140个文件
py:66个
html:15个
dvc:11个
需积分: 9 0 下载量 172 浏览量
2021-02-07
21:34:03
上传
评论
收藏 1.11MB ZIP 举报
温馨提示
PuraNo-新闻注释和聚类 安装 安装Git,DVC和pip: $ sudo wget https://dvc.org/deb/dvc.list -O /etc/apt/sources.list.d/dvc.list $ sudo apt-get update $ sudo apt-get install git dvc python3-pip 克隆存储库并安装Python要求(建议使用Python 3.6+): $ git clone https://github.com/IlyaGusev/purano $ python3 -m pip install -r purano/requirements.txt 运行管道 $ dvc pull $ dvc repro $ cat output/metrics.json 警告:群集需要大于8GB的RAM,因为它存储所有N ^ 2的成对距离
资源推荐
资源详情
资源评论
收起资源包目录
purano:新闻注释和聚类 (140个子文件)
scrapy.cfg 257B
config 187B
bootstrap.min.css 152KB
data.csv 17KB
ru_clustering_0525.tsv.dvc 94B
ru_tg_1101_0510.jsonl.tar.gz.dvc 83B
ru_clustering_0517.tsv.dvc 77B
ru_tg_0511_0517.jsonl.dvc 76B
ru_tg_0527.jsonl.dvc 71B
ru_tg_0517.jsonl.dvc 71B
ru_tg_0525.jsonl.dvc 71B
lang_detect.dvc 70B
cat_detect.dvc 69B
fasttext.dvc 67B
slovnet.dvc 66B
.dvcignore 139B
.flake8 292B
.gitignore 1KB
.gitignore 132B
.gitignore 107B
.gitignore 63B
.gitignore 49B
.gitignore 48B
.gitignore 28B
.gitignore 26B
.gitignore 0B
clustering_instruction.html 11KB
doc2.html 8KB
doc1.html 6KB
base.html 1KB
data.html 906B
overview.html 780B
timeline.html 277B
baselines.html 182B
organizers.html 150B
index.html 137B
list.html 130B
evaluation.html 96B
get.html 85B
index.html 73B
terms_and_conditions.html 44B
visualisations.ipynb 1.06MB
logo.jpg 839KB
jquery-3.4.1.min.js 86KB
bootstrap.min.js 57KB
smooth.json 889B
0525_metrics.json 833B
confusion.json 740B
default.json 677B
scatter.json 654B
data.jsonl 12KB
annotator.jsonnet 3KB
annotator_light.jsonnet 3KB
clusterer.jsonnet 586B
gen_title.jsonnet 274B
distil_bert.jsonnet 222B
cleaner.jsonnet 218B
text2title.jsonnet 172B
tfidf.jsonnet 92B
LICENSE 11KB
dvc.lock 8KB
README.md 833B
metadata 105B
NOTICE 550B
info.proto 852B
info_pb2.py 9KB
clusterer.py 8KB
distil_embeddings.py 7KB
run_parse.py 6KB
train_text2title.py 4KB
run_fit_param.py 4KB
train_gen_title.py 4KB
aggregate_clustering_toloka.py 4KB
middlewares.py 4KB
fasttext.py 3KB
gazeta.py 3KB
annotator.py 3KB
form_sbs_titles_markup.py 3KB
form_clustering_markup.py 3KB
elmo.py 3KB
transformers.py 2KB
run_annotate.py 2KB
bottleneck_encoder_decoder.py 2KB
train_tfidf.py 2KB
tg_html.py 2KB
text2title.py 2KB
base.py 2KB
evaluate.py 2KB
text2title.py 2KB
test_io.py 2KB
distil_bert.py 2KB
run_evaluate.py 2KB
run_clustering.py 2KB
tfidf.py 2KB
tfidf.py 2KB
gen_title.py 2KB
pipelines.py 2KB
metrics.py 1KB
make_submission.py 1KB
models.py 1KB
共 140 条
- 1
- 2
资源评论
沈临白
- 粉丝: 44
- 资源: 4572
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功