没有合适的资源?快使用搜索试试~ 我知道了~
BioC:我们描述了一种简单的XML格式来共享文本文档和注释-开源
共16个文件
txt:6个
xml:5个
pdf:3个
1 下载量 173 浏览量
2021-04-29
06:19:35
上传
评论
收藏 19.46MB ZIP 举报
温馨提示
共享文本文档和数据注释的极简方法。 允许表示大量不同的注释。 项目文件包含:-用于保存/读取/写入数据并执行样本处理的简单代码。 -BioC格式的语料库-与BioC语料库配合使用的BioC工具BioC目标-简单-互操作性-广泛使用-重用应该很少需要学习使用格式或软件模块来处理该格式的投资。 我们对重用感兴趣,我们专注于对文本挖掘广泛有用的常见NLP任务。
资源详情
资源评论
资源推荐
收起资源包目录
CDR_Data.zip (16个子文件)
CDR_Data
README.txt 3KB
CDR.Corpus.v010516
.DS_Store 6KB
CDR_TestSet.BioC.xml 2.54MB
CDR_DevelopmentSet.BioC.xml 2.42MB
CDR_TrainingSet.BioC.xml 2.4MB
CDR_TrainingSet.PubTator.txt 1.08MB
CDR_DevelopmentSet.PubTator.txt 1.08MB
CDR_TestSet.PubTator.txt 1.11MB
tmChem.TestSet
TestSet.tmChem.BioC.xml 1.59MB
TestSet.tmChem.PubTator.txt 911KB
.DS_Store 6KB
DNorm.TestSet
TestSet.DNorm.BioC.xml 1.49MB
TestSet.DNorm.PubTator.txt 892KB
BC5CDR.overview.pdf 245KB
BC5CDR.presentation.pdf 15.9MB
BC5CDR.corpus.pdf 752KB
共 16 条
- 1
远离康斯坦丁
- 粉丝: 27
- 资源: 4664
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0