没有合适的资源？快使用搜索试试~ 我知道了~

文库首页行业研究数据集Preliminary Study of Chinese Word Segmentation and Part-of-Speech Tagging Being Used for Microblog Data

Preliminary Study of Chinese Word Segmentation and Part-of-Speec...

0 下载量 172 浏览量 2021-02-09 05:48:44 上传评论收藏 393KB PDF 举报

温馨提示

试读

6页

本文将清华大学中文分词和词性标注系统应用于部分微博语料数据，检测系统对微博新词识别能力及对识别错误进行了分类总结，并对识别率低的新词制定了标注规范。通过人工校对获得新的训练语料数据集，提高系统对微博文本的处理能力，为建立微博专用语料库做前期准备工作。