针对专利文献专业术语多、领域广的特点,采用基于领域词典与统计相结合的方法探讨了专利文献的汉语分词问题。利用NC-value算法抽取专业术语,使用条件随机场模型(cRF)提高专业术语识别率,提高分词精度。实验结果表明,提出的方法在开放测试下分词的准确率为95.56%,召回率为96.1 8%,F值为95.87%,大大提高了专利文献的分词精度。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~