• XNLI 自然语言推断数据集

    XNLI 是由 Facebook 和纽约大学的研究者联合构建的自然语言推断数据集,包括 15 种语言的数据。我们用其中的中文数据来评估模型的语言理解能力。

    5
    318
    23.64MB
    2021-04-09
    4.9
  • NLPCC2016-DBQA 中文问答

    NLPCC2016-DBQA 是由国际自然语言处理和中文计算会议 NLPCC 于 2016 年举办的评测任务,其目标是从候选中找到合适的文档作为问题的答案

    5
    539
    14.78MB
    2021-04-09
    4.9
  • CMRC2018 中文阅读理解

    CMRC2018 是中文信息学会举办的评测,评测的任务是抽取类阅读理解。

    5
    270
    2.54MB
    2021-04-09
    4.9
  • MSRA-NER 中文命名实体识别

    MSRA-NER (SIGHAN2006) 数据集由微软亚研院发布,其目标是识别文本中具有特定意义的实体,包括人名、地名、机构名。

    1
    1703
    2.15MB
    2021-04-09
    50
  • ChnSentiCorp中文情感分析数据集

    ChnSentiCorp 是一个中文情感分析数据集,包含酒店、笔记本电脑和书籍的网购评论。

    0
    2034
    1.55MB
    2021-04-09
    50
  • 49份知识图谱行业报告整理.zip

    从2013~2019年的49份行业知识图谱报告

    0
    169
    288.33MB
    2021-04-05
    10
  • WikiText Long Term Dependency Language Modeling Dataset 长期依赖语言建模数据集

    WikiText 长期依赖语言建模数据集包含 1 亿个英文词汇,其来自于 Wikipedia 优质文章和标杆文章。 该数据集分为 WikiText-2 和 WikiText-103 两个版本,其相较于 PTB 词库规模更为庞大,并且每个词汇还保留相关的原始文章,这适用于需要长时依赖自然语言建模的场景。 该数据集由 Salesforce Research 于 2016 年发布,主要发布人为 Stephen Merity、Caiming Xiong、James Bradbury 和 Richard Socher,相关论文有《Pointer Sentinel Mixture Models》。

    0
    192
    373.29MB
    2021-04-05
    28
  • cMedQA2(中文医学问答数据集)

    中文医学问答数据集 数据集描述:中文医药方面的问答数据集,超过10万条。 数据说明:questions.csv:所有的问题及其内容。answers.csv :所有问题的答案。 train_candidates.txt, dev_candidates.txt, test_candidates.txt :将上述两个文件进行了拆分。

    0
    1371
    60.89MB
    2021-04-02
    46
  • Stanford Sentiment Treebank 标准情感数据集

    Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 该数据集由斯坦福大学的 NLP 组发布,其中句子和短语共计 239232 条,相较于忽略单词顺序的大多数情绪预测系统,这套深度学习模型建立了基于句子结构 的完整表示。它可根据单词组成的短语判断情绪。 该数据集由斯坦福大学自然语言处理 组于 2013 年发布,相关论文有《Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank》。

    0
    209
    11.36MB
    2021-03-30
    10
  • Sentiment Analysis 中文情感分析

    该数据集包括了四个领域的中文评论:笔记本电脑、汽车、相机和手机,评论属于 二分类 任务及正面或负面。可被用作于 自然语言处理 中情感分类任务

    0
    400
    106KB
    2021-03-30
    11
  • 笔耕不辍

    累计1年每年原创文章数量>=20篇
  • 持续创作

    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 分享宗师

    成功上传21个资源即可获取
  • 1024勋章

    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 创作能手

    授予每个自然周发布7篇到8篇原创IT博文的用户
  • 签到达人

    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 分享精英

    成功上传11个资源即可获取
  • 分享达人

    成功上传6个资源即可获取
  • 分享小兵

    成功上传3个资源即可获取
  • 分享学徒

    成功上传1个资源即可获取
  • 技术圈认证

    用户完成年度认证,即可获得
  • 签到新秀

    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章

    用户发布第一条blink获赞超过3个即可获得
关注 私信
上传资源赚积分or赚钱