nyt数据集-公开数据集
nyt数据集,是一个公开数据集,可以用来进行关系抽取。
论文A Unified MRC Framework for Named Entity Recognition的预处理构建的中文的两个数据集数据。
论文《Classifying Relations by Ranking with Convolutional Neural Networks》中的数据集--SemEval2010_task8_all_data.
en_core_web_sm为spacy的数据模型,里面有两个版本,可以选择合适的版本。要不会出错,raise source.error('bad escape %s' % escape, len(escape));sre_constants.error: bad escape \p at position 257
著名的Sighan Bakeoff语料。包含了训练集、测试集及测试集的(黄金)标准切分,同时也包括了一个用于评分的脚本和一个可以作为基线测试的简单中文分词器。
笔耕不辍
持续创作
阅读者勋章
创作能手
分享王者