没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
数据库
人民日报1998年带标注语料
人民日报1998年带标注语料
人民日报
需积分: 44
1 下载量
198 浏览量
2014-08-26
16:42:36
上传
评论
收藏
8.42MB
TXT
举报
温馨提示
立即下载
人民日报1998年一月份带标注的语料,对自然语言的有兴趣的同学可以下载训练模型什么的
资源推荐
资源评论
1998年人民日报语料库全
浏览:34
1998年人民日报语料库全 可用于中文分词,词频统计,等自然语言处理领域
人民日报语料库(中文分词语料库)
浏览:195
人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料 人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
人民日报1998年1月中文标注语料库
浏览:139
4星 · 用户满意度95%
人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
人民日报语料库-原来的数据集更新积分
浏览:4
3星 · 编辑精心推荐
这个语料库自带分词。
1998年人民日报POS标注语料
浏览:17
3星 · 编辑精心推荐
1998年人民日报词性标注语料,可用来进行分词,词性标注,命名实体识别工作。
人民日报1998年1月份的语料
浏览:195
人民日报的1998年1月份的标注过的语料。
北大人民日报语料库98年1月
浏览:54
北大人民日报语料库98年1月,分词研究用
1998年人民日报语料
浏览:66
1998年的人民日报语料,语料中有少许的不规范的地方,经过个人加工与修正,方便大家使用
北大中文《人民日报》199801-199806数据集.rar
浏览:36
PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。...
计算机自然语言理解98年1月人民日报某语料库
浏览:168
5星 · 资源好评率100%
经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源...
处理好的人民日报语料,可以直接用CRF训练命名实体
浏览:35
处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级
2014年人民日报标注数据.zip
浏览:12
2014年人民日报标注数据,里面包含词性标注,可以用来训练词性标注、分词模型、实体识别模型。
1998年1月-6月人民日报语料库
浏览:112
1998年1月-6月人民日报语料库,已做词性标记,适用于自然语言处理序列标注等任务,如命名实体识别等,里面包含6个月份
1998年人民日报分词语料
浏览:94
1998年人民日报分词语料,详尽的中文分词语料,适用于各种中文分词应用
People-pku1998.zip
浏览:103
4星 · 用户满意度95%
人民日报1998年标注语料是纯人工手动标注和校对的,比2014年标注语料准确率高很多;2014年的是没有校验的,会有很多偏差;建议以98年的这版来训练模型!本人已经对语料中的排版进行整理过,开箱即用;
分词词库_词性人民日报199801.txt
浏览:189
分词词库_词性人民日报199801.txt
人民日报2014语料库 自然语言处理训练集
浏览:28
人民日报标注语料有1998年1-6月以及2014年版本,这个是2014年的标注预料版本,可以用来训练词性标注、分词模型、实体识别模型。
现代汉语语料库加工规范(pku)
浏览:31
为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范V2.0》(征求意见稿)。因这次加工的任务超出词语切分与词性标注的范围,故将...
people_daily_2014_corpus.zip
浏览:160
人民日报标注语料有1998年1-6月以及2014年版本,这个是2014年的标注预料版本,可以用来训练词性标注、分词模型、实体识别模型。
199801已标记词性.txt
浏览:88
该资源是以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。
20180712165812468713_NLP_
浏览:129
1998年1月人民日报标注语料,官方材料供下载
PeoplesDailyNER-master.rar
浏览:43
人工智能keras深度学习使用1998年人民日报进行分类学习。 训练分词模型! 内含98年语料库。 语料库是标注过的。
人工智能-项目实践-实体抽取-中文命名实体识别,实体抽取,tensorflow,pytorch,BiLSTM+CRF
浏览:185
5星 · 资源好评率100%
data文件夹中有三个开源数据集可供使用,玻森数据 (https://bosonnlp.com) 、1998年人民日报标注数据、MSRA微软亚洲研究院开源数据。其中boson数据集有6种实体类型,人民日报语料和MSRA一般只提取人名、地名、组织名...
基于分类器集成的兼类词消歧研究 (2010年)
浏览:26
兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种...以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得了较好的效果.
CentOS7Oracle11gInstallHelper.zip
浏览:172
脚本测试环境如下: 操作系统: CentOS Linux release 7.9.2009 (Core) Oracle: linux.x64_11g_11.2.0.4 脚本替我们做了哪些? * 创建oracle用户和组。 * 搭建图形化的操作环境:VNC远程。 * 防火墙放行VNC端口5901和Oracle默认端口1521。 * 安装oracle安装程序依赖程序包。 * 安装中文字体解决中文乱码问
风电场风速及功率数据.zip
浏览:75
5星 · 资源好评率100%
美国某风电场风速数据及风电功率数据,2012年,数据较多可供研究人员使用,内含数据所在地的经纬度。数据为每5分钟间隔。
MIMIC-IV文档介绍及使用笔记.docx
浏览:183
5星 · 资源好评率100%
MIMIC-IV介绍文档,使用笔记 包括对各模块,表格及表格内字段的介绍,以及在使用中遇到的一些值得注意的问题 部分内容可见https://blog.csdn.net/weixin_46523923/article/details/121994699
多源信息融合.pdf
浏览:14
4星 · 用户满意度95%
本书是国内多源信息融合领域的基础教材(印刷质量极好),内容详细,由浅入深,能够让读者全面了解数据融合技术并实现实践应用。希望能为相关领域行业内的朋友们提供帮助!!
Axure数据图表元件(柱图、饼图、雷达图、折线图、面积图)
浏览:135
5星 · 资源好评率100%
Axure数据图表元件(柱图、饼图、雷达图、折线图、面积图)Axure数据图表元件Axure数据图表元件Axure数据图表元件
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
nlp征途
粉丝: 11
资源:
2
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
Delphi 12 控件之StyleControls 5.77.7z
苹果CMSV10红色自适应网站模板
数据库管理工具:dbeaver-ce-23.3.5-stable.x86-64.rpm
SAP 消息号C6013解决方案
C#入门必看的实例程序100个,含全部源代码.zip
RabbitMQServer安装包
fpga-ZC706P-原理图
windows系统 一键关机 命令与小工具.zip
苹果CMS V10大气橙色风格影视电影视频网站模板
c++的游戏必备函数,外加个做迷宫,合成一个头文件
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功