######################################
BosonNLP命名实体识别数据
######################################
命名实体识别(NER)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,作为结构化信息提取的重要步骤。
在BosonNLP命名实体的标注中,文本采用UTF-8进行编码,每行为一个段落标注,共包括2000段落。所有的实体以如下的格式进行标注:
{{实体类型:实体文本}}
标注的实体类别包括以下6种:
time: 时间
location: 地点
person_name: 人名
org_name: 组织名
company_name: 公司名
product_name: 产品名
例:此次{{location:中国}}个展,{{person_name:苏珊?菲利普斯}}将与她80多岁高龄的父亲一起合作,哼唱一首古老的{{location:威尔士}}民歌{{product_name:《白蜡林》}}。届时在{{location:画廊大厅}}中将安放6个音箱进行播放,艺术家还特意回到家乡{{location:格拉斯哥}},同父亲一起在{{org_name:中国音乐学院}}里为作品录制了具有{{location:中国}}元素的音乐片段。
来源:
http://bosonnlp.com
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于BILSTM+CRF、IDCNN+CRF、BERT+BILSTM+CRF模型的中文命名实体识别python源码+数据.zip个人大四的毕业设计、经导师指导并认可通过的高分设计项目,评审分96.5分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。 <资源说明> 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设或者课设、作业,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96.5分,放心下载使用! 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。
资源推荐
资源详情
资源评论
收起资源包目录
基于BILSTM+CRF、IDCNN+CRF、BERT+BILSTM+CRF多种模型的中文命名实体识别python源码+数据+说明文档.zip (23个子文件)
项目说明.md 3KB
data
boson
data_util.py 4KB
origindata.txt 1.78MB
license.txt 2KB
readme.txt 981B
renMinRiBao
data_renmin_word.py 5KB
renmin.txt 10.18MB
MSRA
train2pkl.py 4KB
test1.txt 514KB
link.txt 49B
testright1.txt 564KB
train1.txt 9.99MB
test.png 92KB
test2.png 86KB
tensorflow
utils.py 7KB
test1.txt 514KB
bilstm_crf.py 3KB
vec.txt 14.63MB
Batch.py 2KB
train.py 3KB
pytorch
BiLSTM_CRF.py 7KB
train.py 2KB
resultCal.py 2KB
共 23 条
- 1
资源评论
Scikit-learn
- 粉丝: 4798
- 资源: 3181
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功