没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
现代哈萨克语词级标注语料库的构建研究
现代哈萨克语词级标注语料库的构建研究
研究论文
1 下载量
159 浏览量
2021-02-22
21:36:09
上传
评论
收藏
1.25MB
PDF
举报
温馨提示
立即下载
现代哈萨克语词级标注语料库的构建研究
资源推荐
资源评论
kazakh-language-corpus:开源哈萨克语料库
浏览:39
开源哈萨克语语料库 我们已经从Wikipedia dump( )为哈萨克语构建了语料库。 使用WikiExtractor( )解析数据,然后使用nltk构建n-gram。 总共收集了2100万个单词。 具有将近60万个单词的不同派生词。 链接到语料库
人民日报1998年1月中文标注语料库
浏览:73
4星 · 用户满意度95%
人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料...
面向微博文本的情绪标注语料库构建
浏览:15
文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点进行分析以及对情绪分析算法性能进行评估,该文在对微博文本情绪表达特点进行深入...
兰卡斯特汉语语料库LCMC语料库
浏览:201
LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。起先建立时,它是作为英国经社研究委员会资助项目Contrasting Tense and Aspect in English and Chinese的部分...
英文词性标注语料库
浏览:124
英文分词语料库,共有198796行,每个单词都有词性标注,对句话的结束都有句号,便于处理。覆盖大部分主流行业的语料。 例如: Newsweek/NNP ,/, trying/VBG to/TO keep/VB pace/NN with/IN rival/JJ Time/NNP ...
Brown语料库和LOB语料库
浏览:181
5星 · 资源好评率100%
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000个单词,合计100万单词。LOB语料库是模仿Brown语料库的比例建立起来的英国英语语料库,其预料...
论文研究-藏文语料库深加工方法研究.pdf
浏览:27
结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配...
对国外隐喻语料库研究方法的辩证分析
浏览:133
隐喻研究与语料库语言学的结合是近年来语言学研究领域的新趋势,语料库研究方法的兴起促进了隐喻的实证转向。近十年来国外学者在隐喻语料库方面的研究成果大致可分为四个方向:隐喻在语料库中的识别和提取;隐喻跨语言...
基于Web的动态语料库构建.pdf
浏览:135
基于Web的动态语料库构建.pdf基于Web的动态语料库构建.pdf基于Web的动态语料库构建.pdf基于Web的动态语料库构建.pdf基于Web的动态语料库构建.pdf基于Web的动态语料库构建.pdf基于Web的动态语料库构建.pdf基于Web的...
语料库研究与应用综述
浏览:192
语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或 口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规 模的语料库能够反映和记录语言的实际使用情况...
英文语料库词汇标注软件TreeTagger
浏览:142
英文语料库词汇标注软件TreeTagger
微软亚洲研究院中文分词语料库
浏览:190
4星 · 用户满意度95%
微软亚洲研究院中文分词语料库,研究中文分词,研究中文分词
论文研究-藏语口语语音语料库的设计与研究.pdf
浏览:13
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时...
英语语料库LOB语料库
浏览:100
4星 · 用户满意度95%
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级: 100万词次 基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注...
正则表达式在语料库研究中的应用
浏览:173
本文的研究目的在于厘清正则表达式的起源、概念和构造,并以任务驱动的方法,以几款常用的语料库工具为例,探讨正则表达式在文本清理、语料标注和检索等技术环节中的具体应用,从而进一步推动正则表达式在语料库研究中的...
论文研究-面向事件的多语平行语料库构建研究.pdf
浏览:56
讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则,制定了具有分类信息的标注规范,初步建立了具有近七万句对的可控多语语料库。
CorpusWordPOSlist.xls现代汉语语料库
浏览:132
本Excel有16254条数据,为语委现代汉语语料库,内容丰富,专为深度学习中的词性标注工作准备,望周知。
现代汉语语料库加工规范(pku)
浏览:61
几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的...
现代汉语语料库
浏览:152
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
北大人民日报语料库98年1月
浏览:41
北大人民日报语料库98年1月,分词研究用
行人惯性导航零速检测算法
浏览:3
行人惯性导航零速检测算法
混合动力汽车基于规则的控制和ECMS与优化等效因子的实时能源管理策略
浏览:75
混合动力汽车基于规则的控制和ECMS与优化等效因子的实时能源管理策略
基于CORDIC的反正弦和反余弦计算的FPGA实现
浏览:92
5星 · 资源好评率100%
基于CORDIC的反正弦和反余弦计算的FPGA实现
BA无标度网络中的SIR模型
浏览:30
BA无标度网络中的SIR模型
使用3DCNN和卷积LSTM进行手势识别学习时空特征
浏览:90
使用3DCNN和卷积LSTM进行手势识别学习时空特征
基于三次贝塞尔曲线的类汽车曲率连续路径平滑
浏览:117
本文重点研究在大型科学设施环境中工作的类似汽车的车辆的可行路径的生成。 考虑曲率连续性和最大曲率约束,一种新颖的路径平滑算法是根据三次贝塞尔曲线提出的。 在算法中,贝塞尔转弯和贝塞尔路径分别为发达。 Bezier 转弯首先设计用于连接两个任意配置。 然后可以通过以下方式获得贝塞尔路径使用贝塞尔曲线来拟合避免碰撞规划器提供的一系列目标点。 在算法的指导下,车辆可以以预定的方向到达目标点。 模拟实验进
基于机器学习的设备剩余寿命预测方法综述
浏览:136
基于机器学习的设备剩余寿命预测方法综述
基于无差拍预测控制和扰动观测器的永磁同步电机电流控制
浏览:67
基于无差拍预测控制和扰动观测器的永磁同步电机电流控制
基于FPGA的奇异值和特征值分解的快速实现。
浏览:192
基于FPGA的奇异值和特征值分解的快速实现。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
weixin_38741759
粉丝: 3
资源:
964
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
如何在SQL Server中实现数据复制和同步?
BP神经网络 - python实例代码
基于ubuntu 64位系统一键环境配置脚本
134139796594453实验8.zip
如何在JavaScript中实现Ajax调用
网络安全课程学习资料python
Java垃圾收集机制解析:自动内存管理的艺术
navicat下载、安装、配置连接与使用教程.rar
一款基于springboot+websoket的即时聊天系统,包含了群聊、单聊以及音乐播放等功能
信号与系统、数字信号处理、通信原理等课程内容.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功