没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
藏语语料库预处理研究
藏语语料库预处理研究
研究论文
3 下载量
35 浏览量
2021-02-09
05:48:28
上传
评论
收藏
169KB
PDF
举报
温馨提示
立即下载
藏语语料库预处理研究
资源推荐
资源评论
论文研究-藏语语料库加工方法研究.pdf
浏览:11
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语
论文研究-藏语口语语音语料库的设计与研究.pdf
浏览:135
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语
论文研究-藏语语料库词类描述方法研究.pdf
浏览:102
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。
一万句中英平行语料库,不用预处理
浏览:171
5星 · 资源好评率100%
平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
大型藏语平衡语料库建设中样本类别号的研究 (2013年)
浏览:108
藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提。语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要。文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法。
Brown语料库和LOB语料库
浏览:136
5星 · 资源好评率100%
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000个单词,合计100万单词。LOB语料库是模仿Brown语料库的比例建立起来的英国英语语料库,其预料...
兰卡斯特汉语语料库LCMC语料库
浏览:128
LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。起先建立时,它是作为英国经社研究委员会资助项目Contrasting Tense and Aspect in English and Chinese的部分...
对国外隐喻语料库研究方法的辩证分析
浏览:28
隐喻研究与语料库语言学的结合是近年来语言学研究领域的新趋势,语料库研究方法的兴起促进了隐喻的实证转向。近十年来国外学者在隐喻语料库方面的研究成果大致可分为四个方向:隐喻在语料库中的识别和提取;隐喻跨语言...
微软亚洲研究院中文分词语料库
浏览:68
4星 · 用户满意度95%
微软亚洲研究院中文分词语料库,研究中文分词,研究中文分词
语料库研究与应用综述
浏览:85
语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或 口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规 模的语料库能够反映和记录语言的实际使用情况...
平行语料库,用于机器翻译等的预处理语料。
浏览:110
汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
已预处理 NLP 英文语料库 新闻组 20_Newsgroup(单标签英文平衡语料)
浏览:137
5星 · 资源好评率100%
已做预处理:分词、剔除停用词 可直接拿来统计建立文本模型
英语语料库LOB语料库
浏览:172
4星 · 用户满意度95%
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级: 100万词次 基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注...
正则表达式在语料库研究中的应用
浏览:64
本文的研究目的在于厘清正则表达式的起源、概念和构造,并以任务驱动的方法,以几款常用的语料库工具为例,探讨正则表达式在文本清理、语料标注和检索等技术环节中的具体应用,从而进一步推动正则表达式在语料库研究中的...
ace2005-preprocessing:ACE 2005 事件提取任务的语料库预处理-开源
浏览:35
这是一个简单的代码,用于为事件提取任务预处理 ACE 2005 语料库。 使用现有的方法对我来说很复杂,所以我做了这个项目。 Github:https://github.com/nlpcl-lab/ace2005-preprocessing
语料预处理
浏览:11
对获得到的语料数据进行预处理,其中语料数据的原始形式为{"title": "xxxxxxxx", "content": "xxxxxxxxxxxxxx"}.
计算机自然语言理解98年1月人民日报某语料库
浏览:40
5星 · 资源好评率100%
语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。...
语料库检索工具
浏览:49
语料库检索工具,检索语料库
香港城市大学语料库;微软亚洲研究院语料库;北京大学语料库;
浏览:196
4星 · 用户满意度95%
香港城市大学语料库(1 772 202 字,训练集)、微软亚洲研究院语料库(1 089 050 字,训练集)、北京大学语料库(1 833 177 字,训练集)
行人惯性导航零速检测算法
浏览:125
行人惯性导航零速检测算法
混合动力汽车基于规则的控制和ECMS与优化等效因子的实时能源管理策略
浏览:96
混合动力汽车基于规则的控制和ECMS与优化等效因子的实时能源管理策略
基于CORDIC的反正弦和反余弦计算的FPGA实现
浏览:53
5星 · 资源好评率100%
基于CORDIC的反正弦和反余弦计算的FPGA实现
BA无标度网络中的SIR模型
浏览:117
BA无标度网络中的SIR模型
使用3DCNN和卷积LSTM进行手势识别学习时空特征
浏览:103
使用3DCNN和卷积LSTM进行手势识别学习时空特征
基于三次贝塞尔曲线的类汽车曲率连续路径平滑
浏览:130
本文重点研究在大型科学设施环境中工作的类似汽车的车辆的可行路径的生成。 考虑曲率连续性和最大曲率约束,一种新颖的路径平滑算法是根据三次贝塞尔曲线提出的。 在算法中,贝塞尔转弯和贝塞尔路径分别为发达。 Bezier 转弯首先设计用于连接两个任意配置。 然后可以通过以下方式获得贝塞尔路径使用贝塞尔曲线来拟合避免碰撞规划器提供的一系列目标点。 在算法的指导下,车辆可以以预定的方向到达目标点。 模拟实验进
基于机器学习的设备剩余寿命预测方法综述
浏览:27
基于机器学习的设备剩余寿命预测方法综述
基于无差拍预测控制和扰动观测器的永磁同步电机电流控制
浏览:27
基于无差拍预测控制和扰动观测器的永磁同步电机电流控制
基于FPGA的奇异值和特征值分解的快速实现。
浏览:16
基于FPGA的奇异值和特征值分解的快速实现。
基于BP神经网络的人口预测
浏览:159
基于BP神经网络的人口预测
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
weixin_38730331
粉丝: 5
资源:
958
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
windchilll 功能代码记录
微信红包封面小程序.zip
RB305A-SOT-23封装 单节锂电池保护IC 深圳市可芯电子有限公司.pdf
javaweb 期末复习
unity简单数字拼图小游戏(源码)
危包证办理培训教材(出境危险货物运输包装使用鉴定结果单)
Vissim9 用户手册(英文版)
基于Selenium的Java爬虫实战(内含谷歌浏览器Chrom和Chromedriver版本124.0.6350.0)
ThinkPHP微信独立互换红包系统开源版.zip
ChromeDriver-87.0.4280.88.zip 下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功