没有合适的资源?快使用搜索试试~ 我知道了~
基于角色标注的中国人名自动识别研究
5星 · 超过95%的资源 需积分: 12 26 下载量 63 浏览量
2011-04-18
10:25:21
上传
评论
收藏 429KB PDF 举报
温馨提示
试读
7页
该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别 过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完 全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的 召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名识别算法之后 ,词法分析的准确率提高了 1. 41 % ,同时人名识别的综合指标 F21 值达到了 95. 40 %.不同实验从各个角度表明:基于角色标注的人名识别算法 行之有效.
资源推荐
资源评论
资源评论
- xuninghit2012-05-05理解ICTCLAS必读文章 可参考http://blog.csdn.net/DanceFire/archive/2007/05/13/1606603.aspx帮助共同理解ICTCLAS开源代码的人名识别部分
sylshiyulong
- 粉丝: 1
- 资源: 6
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功