中文情感词汇本体说明文档 V1.0
1. 介绍
中文情感词汇本体库是大连理工大学信息检索研究室在林鸿飞教授的指导下经过全体
教研室成员的努力整理和标注的一个中文本体资源。该资源从不同角度描述一个中文词汇
或者短语,包括词语词性种类、情感类别、情感强度及极性等信息。
中文情感词汇本体的情感分类体系是在国外比较有影响的 Ekman 的 6 大类情感分类体
系的基础上构建的。在 Ekman 的基础上,词汇本体加入情感类别“好”对褒义情感进行了更
细致的划分。最终词汇本体中的情感共分为 7 大类 21 小类。
构造该资源的宗旨是在情感计算领域,为中文文本情感分析和倾向性分析提供一个便
捷可靠的辅助手段。中文情感词汇本体可以用于解决多类别情感分类的问题,同时也可以
用于解决一般的倾向性分析的问题。
2. 本体格式介绍
情感词汇本体中,一般的格式为。
表 1 情感词汇本体格式举例
词语 词性种类 词义数 词义序号 情感分类 强度 极性
辅助情感
分类
强度 极性
无所畏惧 idiom 1 1 PH 7 1
手头紧 idiom 1 1 NE 7 0
周到 adj 1 1 PH 5 1
言过其实 idiom 1 1 NN 5 2
其中,一个情感词可能对应多个情感,情感分类用于刻画情感词的主要情感分类,辅
助情感为该情感词在具有主要情感分类的同时含有的其他情感分类。
3. 情感分类及情感强度
情感分类按照论文《情感词汇本体的构造》所述,情感分为 7 大类 21 小类。
情感强度分为 1,3,5,7,9 五档,9 表示强度最大,1 为强度最小。
情感分类如表 2 所示:
表 2 情感分类
编号 情感大类 情感类 例词
1 乐 快乐(PA) 喜悦、欢喜、笑眯眯、欢天喜地
2 安心(PE) 踏实、宽心、定心丸、问心无愧
3 好 尊敬(PD) 恭敬、敬爱、毕恭毕敬、肃然起敬
4 赞扬(PH) 英俊、优秀、通情达理、实事求是
5 相信(PG) 信任、信赖、可靠、毋庸置疑
6 喜爱(PB) 倾慕、宝贝、一见钟情、爱不释手
7 祝愿(PK) 渴望、保佑、福寿绵长、万寿无疆
- 1
- 2
前往页