没有合适的资源?快使用搜索试试~ 我知道了~
三种中文分词算法优劣比较.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 108 浏览量
2023-09-22
20:52:23
上传
评论
收藏 26KB DOCX 举报
温馨提示


试读
4页
三种中文分词算法优劣比较
资源推荐
资源详情
资源评论

























目前为止,中文分词包括三种方法:1)基于字符串匹配的分词;2)基于理解的分词;3)
基于统计的分词。到目前为止,还无法证明哪一种方法更准确,每种方法都有自己的利弊,
有强项也有致命弱点,简单的对比见下表所示:
各种分词方法的优劣对比:
(1)歧义识别
歧义识别指一个字符串有多种分词方法,计算机难以给出到底哪一种分词算法才是正确的分
词系列。如"表面的"可以分为"表面/的"或"表/面的"。计算机无法判断哪一种才是准确的分词
系列。
基于字符串的分词算法:仅仅是跟一个电子词典进行比较,故不能进行歧义识别;
基于理解的分词算法:指通过理解字符串的含义,故有很强的歧义识别能力;
资源评论


小小哭包
- 粉丝: 912
- 资源: 3683
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制
