歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题。提出一种基于支持向量机(sVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧。SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义。实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~