没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
一种能够检测所有交叉歧义的汉语分词算法
一种能够检测所有交叉歧义的汉语分词算法
汉语分词
交叉歧义
需积分: 15
5 下载量
153 浏览量
2009-06-02
15:01:46
上传
评论
收藏
149KB
PDF
举报
温馨提示
立即下载
一种能够检测所有交叉歧义的汉语分词算法,一篇实用的分词算法研究论文。
资源推荐
资源评论
汉语文本自动分词算法
浏览:167
5星 · 资源好评率100%
:分析了中文分词词典的机制,提出了一种改进的整词分词字典结构,并针对机械分词算法的特点,将其与概率算法相结 合,探讨了一种中文自动分词概率算法。采用哈希及二分法对词典进行分词匹配。实验表明,该算法具有...
一种改进的中文分词歧义消除算法研究
浏览:172
中文分词是自然语言处理的前提和基础,利用分类效果较好的交叉覆盖算法实现中文分词。
论文研究-Oracle用户SQL会话还原方法研究.pdf
浏览:113
在此基础上提出了一种基于局部歧义词网格的、能够检测汉语分词过程中产生的组合歧义和覆盖歧义的分词算法,该算法仅考虑存在歧义的局部歧义词网格,并将对覆盖歧义的处理简化为查询覆盖歧义候选词典,因此,该算法的...
中英文分词算法
浏览:83
5星 · 资源好评率100%
由KaiToo搜索开发的一款基于字典的简单中英文分词算法 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力
ACWPS(爱博汉语分词系统)分词组件 asp分词组件
浏览:152
4星 · 用户满意度95%
采用特殊的词组拆分识别算法,可有效消除汉语词组中汉语歧义,并可识别各个行业内的特殊用语、专用词汇、公司名、地名等,并具有汉语成语、汉语短语识别功能。 ACWPS含盖了IT、化工、金融、贸易、纺织、电子、制造...
论文研究-基于改进最大匹配算法的中文分词粗分方法.pdf
浏览:137
通过引入广义词条和诱导词集,在最大匹配算法基础上提出一种中文分词的粗分方法,以最长广义词匹配为原则进行中文分词,利用诱导词集实现交叉型歧义识别。在保证快速准确切分无歧义汉语语句的同时,100%检测并标记有...
论文研究-一种基于局部歧义词网格的快速分词算法.pdf
浏览:91
提出了一种抗几何攻击的图像认证算法,该算法利用图像边界的Radon投影变换来实现图像几何失真的矫正,根据感知hash方法提取图像的特征点,并通过修正Hausdorff距离来实现对图像的认证。实验表明,该算法可以抵抗一定...
中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法
浏览:95
5星 · 资源好评率100%
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene...
维特比算法分词原理
浏览:183
ansj 分词原理 ngram+维特比最优路径 能够实现消除歧义
用于中文分词的组合型歧义消解算法.doc
浏览:144
用于中文分词的组合型歧义消解算法.doc
分词歧义消解示例程序
浏览:148
分词歧义消解示例程序,基于规则的分词歧义消解,基于统计的分词歧义消解的示例程序.
一种多策略结合的地址匹配算法
浏览:19
针对现有的地址匹配算法地址要素切分存在歧义、匹配率和准确率低等问题,提出一种多策略结合的地址匹配算法。利用双向最大匹配分词算法提取有歧义的地址要素,通过建立地址要素特征字词典与地址标准数据库,对歧义结果...
最大概率分词法
浏览:114
4星 · 用户满意度95%
最大概率分词法,这种分词算法能够较好的解决汉语分词中的歧义问题,但分词效率比最大匹配分词算法要低
8.2 汉语分词实例1
浏览:56
第 八章 拓展与应用8.2 汉语分词实例正确答案:A你选对了正确答案:A你选对了为了便于处理各个领域的文本,结巴分词提供了用户添加自定义词的功能。汉语分词的歧义
论文研究-综合最大匹配和歧义检测的中文分词粗分方法.pdf
浏览:85
在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的...
中文分词及其在基于Lucene的全文检索中的应用
浏览:39
该分析器的核心模块——分词器所使用的分词算法是一种基于词典的中文分词算法,该算法具体实现上采用了基于词前缀哈希技术来进行逐字匹配,采用基于规则统计技术来进行新词识别,通过对分词中衍生词进行回溯分析来...
改进的正向最大匹配分词算法
浏览:142
4星 · 用户满意度95%
在正向最大匹配的基础上增加一个交集型歧义字段处理模块一次来提高分词效率
论文研究-一种快速的交集型歧义检测方法.pdf
浏览:132
中文分词中,交集型歧义检测方法采用...为此,提出了一种快速的交集型歧义检测方法,引入次长词进行检测,能高效准确地检测出中文文本中的交集型歧义。经实验验证,该方法在精度与速度两方面均能满足大规模语料的处理。
论文研究-基于搜索统计技术中文分词算法的应用研究 .pdf
浏览:111
基于搜索统计技术中文分词算法的应用研究,付青华,,中文分词是影响中文搜索引擎性能的一个重要因素,而歧义识别则是中文分词中需要解决的一个问题,本文简要介绍了目前主要的几种中
Qt 5实现串口调试助手 (源工程文件、0积分下载)
浏览:147
5星 · 资源好评率100%
基于Qt 5实现串口调试助手,程序仅供参考,修改了之前十六进制接收0xA0--0xFF有误的问题,新增了窗口自适应(ui文件设置栅格),文件详情可看博客链接https://blog.csdn.net/m0_51294753/article/details/121405661。
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
浏览:40
5星 · 资源好评率100%
SystemVerilog的听课学习笔记,包括讲义截取、知识点记录、注意事项等细节的标注。 目录如下: 第一章 SV环境构建常识 1 1.1 数据类型 1 四、二值逻辑 4 定宽数组 9 foreach 13 动态数组 16 队列 19 关联数组 21 枚举类型 23 字符串 25 1.2 过程块和方法 27 initial和always 30 func
AutoSAR标准协议4.2.2
浏览:153
5星 · 资源好评率100%
AutoSAR标准协议规范4.2.2,里面包含了AutoSAR组织所规定的AutoSAR架构的标准规范协议原文档。对AutoSAR的学习有一定的借鉴意义
光伏-储能并网系统仿真.rar
浏览:65
5星 · 资源好评率100%
该文件是清华大学储能课的期末大作业。用SIMULINK搭建了一个完整的光伏-储能并网系统。我的博客中介绍了系统实现的具体方法,欢迎查看!
NPPJSONViewer.zip
浏览:183
4星 · 用户满意度95%
NodePad++ JSON格式化插件
GD32替换STM32注意事项.pdf
浏览:53
3星 · 编辑精心推荐
GD32 介绍与 STM32 兼容性汇总。STM32的代码直接在GD32上运行需要小部分的修改。按教程做对应修改就行哈。
XCP协议的规范文档
浏览:146
5星 · 资源好评率100%
XCP协议的原规范文档,主要包含了Part1-5共5个部分,其中第三部分又分为CAN、以太网和Sxl等。对于XCP协议的开发者和学习者有借鉴意义
VS2015安装证书,JavaScript_ProjectSystem.msi,JavaScript_LanguageService.msi
浏览:117
3星 · 编辑精心推荐
vs2015.iso包安装,不然会卡在安装包丢失或损坏
CANoe通过CAPL脚本实现自动测试
浏览:145
现在汽车行业用vector的工具进行自动测试,但是该自动测试模板很少,本案例是分享CAPL脚本自动化测试的模板,和自动控制测试步骤的XML模板,使用过程可以通过本人分享的文档来实现工程的建立到自动测试的完成。通过CAPL脚本+XML控制测试步骤,实现自动测试,生成测试报告。
蓝牙BLE协议中文版.pdf
浏览:141
蓝牙BLE协议中文版,帮助初学者更快掌握协议内容。协议为SIG官方协议的中文版,所有协议内容均与英文原版协议内容保持一致
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
ydhbzkx002
粉丝: 1
资源:
6
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
delphi7下二维码,实测可用
sfserytvbjngy
第十六届“华中杯”大学生数学建模挑战赛.txt
第十六届“华中杯”大学生数学建模挑战赛.txt
三次样条插值的具体介绍.doc
作业 第三章 栈和队列 顺序存储结构和链式存储结构
test 00000000000000
百度api的具体介绍.doc
http的具体介绍.doc
统一响应数据的完整案例的三层架构实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功