颜色分类leetcode
AUC
和
ROC
到目前为止,我们的一些准确度得分可能看起来非常令人印象深刻;
第一次尝试时,80%
的准确率似乎非常好!
我们必须记住的是,在预测二元分类时,我们有时肯定是对的,即使只是猜测。
例如,在猜测硬币是否正面朝上时,我应该有大约
50%
的准确率。
这也可能导致在调整模型的过程中出现问题。
如果您有一个包含罕见事件(例如疾病或中奖)的偏斜数据集,其中
1000
个中只有
2
个阳性病例,那么即使是将所有内容都归类为“非会员”的简单算法也将达到
99.8%
的准确率(1000
次中有
998
次是正确的)。
因此请记住,必须将
80%
的准确率考虑到更大的上下文中。
有了这个,分析分类错误的另一种方法是使用
AUC,它代表“曲线下面积”。
你问什么曲线?
Receiver
Operater
Curve
(ROC
Curve),它说明了我们分类器的误报率与误报率。
在训练分类器时,我们希望
ROC
曲线能够紧贴图形的左上角。
50-50
准确率的分类器被认为“毫无价值”;
这并不比随机猜测更好,就像抛硬币一样。
ROC
曲线为我们提供了这种假阳性率和
评论0
最新资源