没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
印度支那 Baca README ini dalam 。 IndoNLU是印度尼西亚语的自然语言理解(NLU)资源的集合,具有12个下游任务。 我们提供用于重现结果的代码,以及经过约40亿个单词的语料库( Indo4B )和20 GB以上的文本数据训练的大型预训练模型( IndoBERT和IndoBERT-lite )。 该项目最初是由大学和工业界之间的联合合作启动的,例如万隆理工学院,Nusantara多媒体大学,香港科技大学,印度尼西亚大学,Gojek和Prosa.AI。 研究论文 IndoNLU已被AACL-IJCNLP 2020接受,您可以在我们的论文找到详细信息。 如果您在工作中
资源推荐
资源详情
资源评论
收起资源包目录
indonlu:有史以来第一个广泛的印尼自然语言处理基准。 我们提供了多个下游任务,预训练的模型和入门代码! (AACL-IJCNLP 2020) (102个子文件)
train_preprocess.csv 1.98MB
train_preprocess.csv 659KB
train_preprocess.csv 372KB
test_preprocess_masked_label.csv 253KB
valid_preprocess.csv 253KB
train_preprocess.csv 107KB
train_preprocess.csv 98KB
test_preprocess_masked_label.csv 81KB
valid_preprocess.csv 81KB
valid_preprocess.csv 48KB
test_preprocess_masked_label.csv 46KB
test_preprocess_masked_label.csv 31KB
test_preprocess_masked_label.csv 23KB
valid_preprocess.csv 18KB
valid_preprocess.csv 12KB
qa-factoid-itb_test.csv 3KB
pos-prosa_test.csv 2KB
pos-idn_test.csv 2KB
ner-grit_test.csv 2KB
term-extraction-airy_test.csv 2KB
keyword-extraction-prosa_test.csv 1KB
ner-prosa_test.csv 1KB
absa-airy_test.csv 576B
absa-prosa_test.csv 557B
entailment-ui_test.csv 209B
doc-sentiment_test.csv 121B
emotion-twitter_test.csv 94B
.gitignore 2KB
finetune_ner_grit.ipynb 53KB
finetune_casa.ipynb 44KB
finetune_wrete.ipynb 43KB
finetune_smsa.ipynb 36KB
aspect_based_sentiment_analysis.ipynb 20KB
postag_data_utils.ipynb 16KB
ner_data_utils.ipynb 11KB
aspect_extraction_data_util.ipynb 9KB
LICENSE 1KB
README.id.md 6KB
README.md 5KB
CODE_OF_CONDUCT.md 5KB
CONTRIBUTING.md 1KB
ISSUE_TEMPLATE.md 91B
PULL_REQUEST_TEMPLATE.md 40B
data_utils.py 37KB
args_helper.py 20KB
functions.py 19KB
multi_label_classification.py 18KB
word_classification.py 17KB
main.py 8KB
conlleval.py 7KB
forward_fn.py 5KB
metrics.py 4KB
predict.py 4KB
run_single_task.sh 7KB
run_all_tasks.sh 565B
predict.sh 469B
train_preprocess.tsv 2.09MB
valid_preprocess.tsv 241KB
test_preprocess_masked_label.tsv 74KB
train_preprocess.txt 2.34MB
train_preprocess.txt 1.83MB
train_preprocess.txt 1.32MB
train_preprocess.txt 510KB
train_preprocess.txt 509KB
test_preprocess_masked_label.txt 326KB
valid_preprocess.txt 293KB
test_preprocess_masked_label.txt 239KB
valid_preprocess.txt 234KB
vocab.txt 177KB
valid_preprocess.txt 172KB
valid_preprocess.txt 169KB
vocab.txt 163KB
vocab.txt 163KB
vocab_uncased.txt 163KB
vocab_uncased.txt 163KB
test_preprocess_masked_label.txt 161KB
vocab_uncased.txt 154KB
vocab.txt 152KB
vocab_uncased.txt 152KB
vocab.txt 137KB
vocab_uncased.txt 121KB
test_preprocess_masked_label.txt 117KB
vocab.txt 97KB
vocab.txt 95KB
vocab_uncased.txt 88KB
vocab_uncased.txt 85KB
train_preprocess.txt 80KB
valid_preprocess.txt 63KB
test_preprocess_masked_label.txt 53KB
vocab.txt 44KB
vocab.txt 39KB
vocab_uncased.txt 39KB
vocab_uncased.txt 39KB
test_preprocess_masked_label.txt 31KB
vocab.txt 27KB
vocab_uncased.txt 25KB
vocab.txt 21KB
valid_preprocess.txt 20KB
vocab_uncased.txt 19KB
vocab.txt 18KB
共 102 条
- 1
- 2
资源评论
神力锂电
- 粉丝: 26
- 资源: 4691
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功