数据集下载地址、中文情感分析资源下载-南有芙蕖的资源-CSDN下载

XNLI 自然语言推断数据集

XNLI 是由 Facebook 和纽约大学的研究者联合构建的自然语言推断数据集，包括 15 种语言的数据。我们用其中的中文数据来评估模型的语言理解能力。

评级：5

浏览量：318

资源大小：23.64MB

上传时间：2021-04-09

所需金额： 4.9
NLPCC2016-DBQA 中文问答

NLPCC2016-DBQA 是由国际自然语言处理和中文计算会议 NLPCC 于 2016 年举办的评测任务，其目标是从候选中找到合适的文档作为问题的答案

评级：5

浏览量：539

资源大小：14.78MB

上传时间：2021-04-09

所需金额： 4.9
CMRC2018 中文阅读理解

CMRC2018 是中文信息学会举办的评测，评测的任务是抽取类阅读理解。

评级：5

浏览量：270

资源大小：2.54MB

上传时间：2021-04-09

所需金额： 4.9
MSRA-NER 中文命名实体识别

MSRA-NER (SIGHAN2006) 数据集由微软亚研院发布，其目标是识别文本中具有特定意义的实体，包括人名、地名、机构名。

评级：1

浏览量：1703

资源大小：2.15MB

上传时间：2021-04-09

所需积分： 50
ChnSentiCorp中文情感分析数据集

ChnSentiCorp 是一个中文情感分析数据集，包含酒店、笔记本电脑和书籍的网购评论。

评级：0

浏览量：2034

资源大小：1.55MB

上传时间：2021-04-09

所需积分： 50
49份知识图谱行业报告整理.zip

从2013~2019年的49份行业知识图谱报告

评级：0

浏览量：169

资源大小：288.33MB

上传时间：2021-04-05

所需积分： 10
WikiText Long Term Dependency Language Modeling Dataset 长期依赖语言建模数据集

WikiText 长期依赖语言建模数据集包含 1 亿个英文词汇，其来自于 Wikipedia 优质文章和标杆文章。该数据集分为 WikiText-2 和 WikiText-103 两个版本，其相较于 PTB 词库规模更为庞大，并且每个词汇还保留相关的原始文章，这适用于需要长时依赖自然语言建模的场景。该数据集由 Salesforce Research 于 2016 年发布，主要发布人为 Stephen Merity、Caiming Xiong、James Bradbury 和 Richard Socher，相关论文有《Pointer Sentinel Mixture Models》。

评级：0

浏览量：192

资源大小：373.29MB

上传时间：2021-04-05

所需积分： 28
cMedQA2（中文医学问答数据集）

中文医学问答数据集数据集描述：中文医药方面的问答数据集，超过10万条。数据说明:questions.csv：所有的问题及其内容。answers.csv ：所有问题的答案。 train_candidates.txt， dev_candidates.txt， test_candidates.txt ：将上述两个文件进行了拆分。

评级：0

浏览量：1371

资源大小：60.89MB

上传时间：2021-04-02

所需积分： 46
Stanford Sentiment Treebank 标准情感数据集

Stanford Sentiment Treebank 是一个标准情感数据集，主要用于情感分类，其中每个句子分析树的节点均有细粒度的情感注解。该数据集由斯坦福大学的 NLP 组发布，其中句子和短语共计 239232 条，相较于忽略单词顺序的大多数情绪预测系统，这套深度学习模型建立了基于句子结构的完整表示。它可根据单词组成的短语判断情绪。该数据集由斯坦福大学自然语言处理组于 2013 年发布，相关论文有《Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank》。

评级：0

浏览量：209

资源大小：11.36MB

上传时间：2021-03-30

所需积分： 10
Sentiment Analysis 中文情感分析

该数据集包括了四个领域的中文评论：笔记本电脑、汽车、相机和手机，评论属于二分类任务及正面或负面。可被用作于自然语言处理中情感分类任务

评级：0

浏览量：400

资源大小：106KB

上传时间：2021-03-30

所需积分： 11