没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
搜索引擎
汉语语料库加工规范
汉语语料库加工规范
加工规范
需积分: 11
11 下载量
144 浏览量
2018-01-12
20:47:10
上传
评论
1
收藏
167KB
DOC
举报
温馨提示
立即下载
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
资源推荐
资源评论
现代汉语语料库加工规范(pku)
浏览:187
北大计算语言学研究所从1992年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范V1.0》。几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于19
现代汉语语料库基本加工规范2003年版.pdf
浏览:134
现代汉语语料库基本加工规范2003年版.pdf
语料库标准
浏览:29
语料库标准 LCMC 研究规范的基本定义和语料库衍生过程
智能信息处理:汉语语料库加工技术及应用
浏览:26
智能信息处理:汉语语料库加工技术及应用 . pdf
智能信息处理 汉语语料库加工技术及应用.pdf
浏览:155
智能信息处理 汉语语料库加工技术及应用.pdf
兰卡斯特汉语语料库LCMC语料库
浏览:161
LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。起先建立时,它是作为英国经社研究委员会资助项目Contrasting Tense and Aspect in English and Chinese的部分成果。肖忠华最初的设想是要将其建成同FLOB和FROWN对应的现代汉语语料库。筹建这样的一个语料库的另一个动因是:尽管已经有很多汉语语料库存
中文情感分析语料库
浏览:117
5星 · 资源好评率100%
中文情感分析语料库,包含 酒店、服装、水果、平板、洗发水 等 5 个领域的评价数据,每个领域各包含 5000 条正面和负面评价,数据抓取于 携程网 和 京东 ,仅供科研学习之用,欢迎下载使用!
Coae中文微博语料库
浏览:40
中文微博语料库2014.包含COAE2014会议五个任务的评测数据,任务1 :面向新闻的情感关键句抽取与判定 在给定新闻集合(每篇文章已切成句子)中,判别每篇文章的情感关键句 。 任务2:跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集 ,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3:微博情感新词发现与判定 本任务是对给定大规模的微博句子集
文本分类中文语料库
浏览:134
5星 · 资源好评率100%
这是一个文本分类的语料库,主要是用于文本分类,主旨句提取,关键词提取等等应用。
中文维基百科语料库百度网盘网址.txt
浏览:107
本资源是维基百科中文网页的语料库(包含处理过的与未处理的),版本为2020-8-3版本,可适用于中文语料处理等训练集。由于文件过大,放在的百度网盘中,如果网盘被和谐或者其他原因造成的无法打开,请评论留言,本人看到后立即更改。 文件中包含的内容有:未经处理的维基百科语料库、使用代码处理繁体转简体并jieba分词后的语料库、繁体转简体的代码,读者可根据自己的需要进行相应的提取。
第四章汉语语料库多级加工.ppt
浏览:131
第四章汉语语料库多级加工.ppt第四章汉语语料库多级加工.ppt第四章汉语语料库多级加工.ppt第四章汉语语料库多级加工.ppt第四章汉语语料库多级加工.ppt第四章汉语语料库多级加工.ppt第四章汉语语料库多级加工.ppt第四...
CorpusWordPOSlist.xls现代汉语语料库
浏览:66
本Excel有16254条数据,为语委现代汉语语料库,内容丰富,专为深度学习中的词性标注工作准备,望周知。
现代汉语语料库
浏览:155
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
古代汉语语料库汉字频率表
浏览:48
古代汉语语料库汉字频率表,语料规模:1500万字
casia 汉语情感语料库
浏览:138
情感语料库,用于机器学习,将结果用于业务逻辑,并能为业务提供相关功能,
CASIA汉语情感语料库
浏览:91
5星 · 资源好评率100%
资源名称 CASIA汉语情感语料库 共包括四个专业发音人,六种情绪,共9,600句不同发音,包括300句相同文本和100句不同文本,可供各种分析实验使用 本数据集包含部分数据 用途 为研究情感语音所设计的语料
Brown语料库和LOB语料库
浏览:171
5星 · 资源好评率100%
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000个单词,合计100万单词。LOB语料库是模仿Brown语料库的比例建立起来的英国英语语料库,其预料...
casia汉语情感语料库
浏览:6
5星 · 资源好评率100%
可用于情绪语音识别,中文语料库
汉语语料库分词类词频表-高频词汇.xls
浏览:157
分类词频是文本分析中非常重要的内容。本资源把常用的分类词收集起来,方便大家在做文本分析时使用。有了本资源,大家可以提高文本分析的效率
CASIA汉语情感语料库.zip
浏览:15
CASIA汉语情感语料库由中国科学院自动化所(Institute of Automation, Chinese Academy of Sciences)录制,共包括四个专业发音人,六种情绪生气(angry)、高兴(happy)、害怕(fear)、悲伤(sad)、惊讶...
论文研究-藏语语料库加工方法研究.pdf
浏览:26
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的...
汉语分词语料库
浏览:137
CTB6汉语分词语料库,可以拿来做分词任务。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
英语语料库LOB语料库
浏览:184
4星 · 用户满意度95%
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级: 100万词次 基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注...
chatgpt免费使用.txt
浏览:59
chatgpt免费使用
谷歌插件Merlin安装包
浏览:60
谷歌插件Merlin安装包,安装crx格式的插件文件
chromedriver 版本 120.0.6099.71
浏览:89
4星 · 用户满意度95%
目前https://chromedriver.storage.googleapis.com/index.html登不进去,该资源是chrome浏览器对应的版本驱动:chromedriver(120.0.6099.71)。 当需要进行自动化测试或爬取网页数据时,Chrome浏览器的驱动程序(ChromeDriver)是一个关键组件。它允许控制和与Chrome浏览器进行交互。ChromeDriver允
Cursor下载安装包-win
浏览:169
Cursor Setup 0.1.12-x64 Windows Cursor听闻是用chatGPT4来制作的软件,该软件可以帮助你写基础代码和代码的方案,也可以帮助你查找相关的代码函数
CarSim软件设置输入输出变量中文汇总
浏览:158
5星 · 资源好评率100%
包含CarSim软件设置输入输出变量的中文汇总
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
johnson219
粉丝: 0
资源:
2
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
2024最新版python视频教程包括视频、笔记、源码
三菱PLC例程源码火车PLC控制程序+触摸屏
上位机-32-32-上位机的串口练习
VB发不发则v个方便分摊表
content_1711703635217.STL
C语言面试题总结汇总经典.pdf
三菱PLC例程源码活塞端面磨自动上下料线(第五期第2台)
jdk-8u281-macosx-x64.dmg
python处理字典之表格-城市排行榜
三菱PLC例程源码活全裁切机伺服马达
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功