没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
基于N-Gram的语言识别技术
基于N-Gram的语言识别技术
语言识别
5星
· 超过95%的资源
需积分: 9
40 下载量
50 浏览量
2008-09-04
14:55:24
上传
评论
1
收藏
42KB
PDF
举报
温馨提示
立即下载
基于N-Gram的语言识别技术,非常有启发性,网上还有很多open-source的代码可以学习。
资源推荐
资源评论
一种基于N-Gram改进的文本特征提取算法
浏览:69
一种基于N-Gram改进的文本特征提取算法
基于n-gram中英文字符串分割算法实现
浏览:76
5星 · 资源好评率100%
基于n-gram中英文字符串分割算法实现
N-gram特征提取
浏览:70
5星 · 资源好评率100%
n-gram特征提取是一种很好的方法,提取精度很高,比较好
识别各国语言的小工具
浏览:150
输入一段话,可以进行语言的识别,判别出属于哪种语言...并且计算出准确性概率
基于n-gram的文本分类
浏览:150
4星 · 用户满意度95%
基础文档,曾被国际上多次引用。通过多反面对比了n-gram技术在文字引索中的应用。
java实现各语种检测的工具,多语种混合的按比例最高的语种返回,中文(zh-cn/zh-tw)、日本语(ja)、韩国语(ko)
浏览:47
java实现各语种检测的工具,多语种混合的按比例最高的语种返回,中文(zh-cn/zh-tw)、日本语(ja)、韩国语(ko)
LangDetect:Java中的自动语言检测
浏览:98
语言检测 Java中的自动语言检测 功能性 这是使用n-gram频率配置文件进行语言检测的直接实现,如以下所述: 威廉·卡夫纳(William B. Cavnar)和约翰·特伦克(John M.Trenkle)。 基于N-Gram的文本分类。 在SDAIR-94会议论文集中,第三届年度文档分析和信息检索研讨会,1994年。 作为培训数据,使用了9种欧洲语言的《世界人权宣言》。 将所有输入与基于
可以识别所有国家语言的软件
浏览:103
可以识别所有国家语言的软件,可以识别所有国家语言的软件
语音识别引擎(java版本)
浏览:181
3星 · 编辑精心推荐
这是比较老的那种语音识别。是先进行学习,然后再进行识别。我从别的地方搞到的源码,学习那里可以执行但是识别部分还没搞懂,不过源码都是有的。
Ngram分词程序
浏览:35
4星 · 用户满意度95%
该程序调用IKAnalyzer3.2.3.jar提供的接口实现了对汉字词的简单分词,目前尚不支持对带有标点符号的段落的解析。
基于N-Gram模型的蒙古语文本语种识别算法的研究
浏览:85
基于N-Gram模型的蒙古语文本语种识别算法的研究
基于n-Gram+CRF+HMM的中文分词源代码,可实现中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能
浏览:38
这是一个基于n-Gram+CRF+HMM的中文分词的java实现. 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.
基于NLPIR分词工具的识别准确语句程序java版(2-Gram)
浏览:87
自然语言处理(Natural Language Processing),马尔科夫假设,根据给出的语料库(大量语法合法的文本),训练n-gram模型。根据训练出的模型,判断测试集中每个句子是不是语法合法的句子.。根据语料库训练n-gram模型。根据训练出来的n-gram模型对测试集中的每个句子赋予概率值,判断句子是否符合语法。
基于N-Gram算法的数据清洗技术 (2017年)
浏览:144
针对数据库中存在的大量相似重复数据,对相似重复记录的属性结构以及产生原因进行了分析,采用N-Gram算法对数据记录进行计算,得到代表每条记录属性的键值,即N-Gram值.依据该键值将数据库中的数据记录进行排序处理,建立有序的数据库,并对其中的数据记录进行相似度计算.运用排列合并的清洗思想对识别出来的相似重复数据记录进行清洗,实验结果表明,N-Gram算法有效提高了相似重复数据记录的查全率和查准率.
论文研究-基于N-gram语言模型的哈萨克文机构名识别.pdf
浏览:16
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从...
基于N-gram语言模型的哈萨克文机构名识别
浏览:134
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练...
一种适应域的汉语N-gram语言模型平滑算法 (1999年)
浏览:60
针对基于汉语词的N-gram模型统计数据稀疏问题和应用域变化造成原统计模型识别性能降低,提出具有应用域适应能力的N-gram模型平滑算法。对两种应用域的语料进行了前、后向。到3元文法统计,采用隐马尔可夫模型(HMM)在...
论文研究-面向哈萨克语LVCSR的语言模型构建方法研究.pdf
浏览:193
一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率。...分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价。
java,讯飞语言识别,本地音频转文字
浏览:103
4星 · 用户满意度95%
主要实现的是java平台的音频转文字,默认的是普通话,先上传到讯飞的服务器,得到data,再result读取data,之后再通过json解析,得到你需要的内容
语言检测工具language-detection
浏览:184
Google语言检测工具(language-detection),版本号:03-03-2014. 该版本优化了短文本(10-20 char)的识别,支持47种语言。
open-gram:sunpinyin 的 open-gram 项目的 dist 文件。-开源
浏览:168
sunpinyin 的 open-gram 项目的 dist 文件。
nlp-lang-1.7.jar
浏览:129
ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、...
ansj_seg-5.1.3.jar
浏览:108
4星 · 用户满意度95%
ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、...
go-lang-detector:Golang中的一个小型库,用于检测文本的语言。 (文本分类)
浏览:127
该实现基于以下文件: 基于N-Gram的文本分类威廉·B·卡夫纳(William B.Cavnar)和约翰·特伦克(John M.Trenkle) 密歇根州环境研究所邮政信箱134001 安阿伯MI 48113-4001 通过语言配置文件检测 语言配置文件是...
基于HTK的维吾尔语连续音素识别技术研究
浏览:186
以建立维吾尔语连续音素识别基础平台为...在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。
论文研究-基于互信息和邻接熵的新词发现算法.pdf
浏览:151
如何快速高效地识别新词是自然语言处理中一项非常重要的任务。...解决了因切词错误导致部分新词无法识别以及通过n-gram方法导致大量重复词串和垃圾词串识别为新词的问题。最后通过实验验证了该算法的有效性。
语音识别技术文章.rar
浏览:9
4星 · 用户满意度95%
第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 ...17.5.3 N-gram模型的平滑 17.5.4 基于文法规则的方法和基于统计的方法相结合 17.6 小结 参考文献 附录 英汉名词对照
实用语音识别基础电子版
浏览:76
3星 · 编辑精心推荐
实用语音识别基础--21世纪高等院校技术优秀教材 ISBN:711803746 作者:王炳锡 屈丹 彭煊 出版社:国防工业出版社 本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别...
实用语音识别基础
浏览:114
5星 · 资源好评率100%
实用语音识别基础--21世纪高等院校技术优秀教材 ISBN:711803746 作者:王炳锡 屈丹 彭煊 出版社:国防工业出版社 本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别...
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
代码与单车
2012-02-01
资源很好 只是没时间研究
suchaoshanhun
2012-12-12
挺好的,就是英文的有点看不懂
the3gwireless
粉丝: 14
资源:
5
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
全国高等学校计算机水平考试(安徽考区)证书补办申请.doc
附件1:2022年度吉林省研究生精品课程拟推荐项目名单.xlsx
农村信用社联合社计算机信息系统投产与变更管理办.docx
农村信用社联合社计算机信息系统数据管理办法.docx
利用SPSS作临床效度分析线上计算网站介绍-医学研究部统计谘.(医学PPT课件).ppt
利用Zabbix监控mysqldump定时备份数据库状态.docx
利用计算机解决问题的基本过程.doc
化工铁路通信工程总结.doc
北京大学网络教育软件工程作业.docx
医药公司(连锁店)计算机操作规程未新系统的自行按照旧制修改-新系统过制的编号加修模版.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功