将结果存储在 csv 文件中,编码采用 UTF-8 编码,格式如下:
微博中文内容 情感倾向
新冠肺炎…… 1
(4) 评测标准
基于以下混淆矩阵(confusion matrix),采用 Precision,Recall,F1-score
三 个 指 标 评 价 算 法 结 果 , 可 利 用 上 课 学 习 的 KNN, NaiveBayes , Logistic
Regression,SVM 等算法,也可以用深度学习的模型(需要同学自学),要对比 2 种
以上算法的结果,可进一步自由发挥,做算法参数敏感性的实验及对比分析等。
其中,TP 是真阳例,TN 是真阴例,FP 是假阳例,FN 是假阴例。
Precision:精确率( 查准率 ),即为在预测为 1 的样本中,预测正确(实际
为 1)的人占比,,用混淆矩阵中的字母可表示为:
Precision= TP/(TP+FP)
Recall:召回率(查全率),即为在实际为 1 的样本中,预测为 1 的样本占
比,用混淆矩阵中的字母可表示为:
Recall= TP/(TP+FN)
F1-score:F1 分数(F1 Score),是统计学中用来衡量二分类模型精确度的
一种指标。它同时兼顾了分类模型的准确率和召回率。F1 分数可以看作是模型准
确率和召回率的一种加权平均,它的最大值是 1,最小值是 0。
F1=2*Precision * Recall /( Precision + Recall)
评论0
最新资源