没有合适的资源？快使用搜索试试~ 我知道了~

文库首页大数据数据挖掘快速数据挖掘数据分析实战RapidMiner工具应用第15章模型评估与优化V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第15章模型评估与优化V1.1.pdf

1.该资源内容由用户上传，如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款（资源遇到问题，请及时私信上传者）

版权申诉

数据挖掘

数据分析

0 下载量 14 浏览量 2023-10-29 12:25:53 上传评论收藏 543KB PDF 举报

温馨提示

试读

11页

15.1 模型评估与优化解决的问题  如何评估判断某个挖掘算法对挖掘分析预测结果的准确性影响？  对某一个业务数据集进行预测时，如何在多个可选的挖掘模型之间选择最佳模型？为什么选择模型A，而不是模型B？凭经验？还是。。。各个模型的特性指标能否横向可视化对比？  系统能否从多个可选模型中自动为我们推荐一个最好的模型算法？  某个预测模型的最佳挖掘算法选定后，还能否基于该算法进行更深入的调优？调优方法有哪些？  在保证预测准确性的同时，能否提高挖掘流程执行的速度？ 15.2 预测模型算法评价指标模型预测效果评价，通常用相对绝对误差、平均绝对误差、根均方差、相对平方根误差等指标来衡量。（1）绝对误差与相对误差设Y表示实际值，Yˆ表示预测值，则称E为绝对误差（AbsoluteError），计算公式如下：（2）平均绝对误差平均绝对误差（MeanAbsoluteError , MAE）定义如下：

资源推荐

资源详情

资源评论

13.1 应用场景  舆情分析、企业竞争对手分析  互联网专业信息收集  … 13.2 学习目标在学习完本章后，您应能够：   解释什么是web挖掘、如何使用web挖掘，以及使用web挖掘有哪些好处。   识别web挖掘可能采取的各种格式，以便进行web挖掘。   连接至web url，并将其导入为web挖掘模型的数据来源。   在 RapidMiner 中开发一个web

326

第 15 章模型评估与优化

15.1 模型评估与优化解决的问题

 如何评估判断某个挖掘算法对挖掘分析预测结果的准确性影响？

 对某一个业务数据集进行预测时，如何在多个可选的挖掘模型之间选择最佳模型？为什

么选择模型 A，而不是模型 B？凭经验？还是。。。各个模型的特性指标能否横向可视化

对比？

 系统能否从多个可选模型中自动为我们推荐一个最好的模型算法？

 某个预测模型的最佳挖掘算法选定后，还能否基于该算法进行更深入的调优？调优方法

有哪些？

 在保证预测准确性的同时，能否提高挖掘流程执行的速度？

15.2 预测模型算法评价指标

模型预测效果评价，通常用相对绝对误差、平均绝对误差、根均方差、相对平方根误差

等指标来衡量。

（1）绝对误差与相对误差

设

表示实际值，

表示预测值，则称

为绝对误差（AbsoluteError），计算公式如

下：

EYY

（15- 1）

为相对误差（RelativeError），计算公式如下：

−

（15- 2）

有时相对误差也用百分数表示：

%100*

−

（15- 3）

这是一种直观的误差表示方法。

（2）平均绝对误差

平均绝对误差（MeanAbsoluteError , MA E ）定义如下：

327

∑∑

−==

MAE

（15- 4）

式中各项的含义如下：



MAE

：平均绝对误差



：第

个实际值与预测值的绝对误差



：第

个实际值



：第

个预测值

由于预测误差有正有负，为了避免正负相抵消，故取误差的绝对值进行综合并取其平均

数，这是误差分析的综合指标法之一。

（3）均方误差

均方误差（MeanSquaredError , MSE）定义如下：

∑∑

−==

MSE

)

(

（15- 5）

式中，

MSE

表示均方差，其他符号同前。

本方法用于还原平方失真程度。

均方误差是预测误差平方之和的平均数，它避免了正负误差不能相加的问题。由于对误

差

进行了平方，加强了数值大的误差在指标中的作用，从而提高了这个指标的灵敏性，

是一大优点。均方误差是误差分析的综合指标法之一。

（4）均方根误差

均方根误差（RootMeanSquaredError , RMSE）定义如下：

∑∑

−==

RMSE

)

(

（15- 6）

式中，

RMSE

表示均方根误差，其他符号同前。

这是均方误差的平方根，代表了预测值的离散程度，也叫标准误差，最佳拟合情况为

0RMSE

。均方根误差也是误差分析的综合指标之一。

（5）平均绝对百分误差

平均绝对百分误差（MeanAbsolute PercentageErro r , MAPE）定义如下：

∑∑

−==

iii

YYY

MAPE

|/)

|/|

（15- 7）

式中，

MAPE

表示平均绝对百分误差。一般认为

MAPE

小于 10 时，预测精度较高。

（6） Kappa 统计

328

Kappa 统计是比较两个或多个观测者对同一事物，或观测者对同一事物的两次或多次观

测结果是否一致，以由于机遇造成的一致性和实际观测的一致性之间的差别大小作为评价基

础的统计指标。Kappa 统计量和加权 Kappa 统计量不仅可以用于无序和有序分类变量资料的

一致性、重现性检验，而且能给出一个反映一致性大小的“量”值。

Kappa 取值在［-1,+1］之间，其值的大小均有不同意义：

 Kappa = +1 说明两次判断的结果完全一致

 Kappa = -1 说明两次判断的结果完全不一致

 Kappa = 0 说明两次判断的结果是机遇造成

 Kappa < 0 说明一致程度比机遇造成的还差，两次检查结果很不一致，在实际应用

中无意义

 Kappa > 0 此时说明有意义，Kappa 愈大，说明一致性愈好

 Kappa≥0.75 说明已经取得相当满意的一致程度

 Kappa<0.4 说明一致程度不够

（7）识别准确度

识别准确度（Accuracy）定义如下：

100%

TP FN

Accuracy

TP TN FP FN

= ×

+++

（15- 8）

式中各项说明如下：

 TP（True Positives）：正确的肯定表示正确肯定的分类数

 TN（True Negatives）：正确的否定表示正确否定的分类数

 FP（False Positives）：错误的肯定表示错误肯定的分类数

 FN（False Negatives）：错误的否定表示错误否定的分类数

（8）识别精确率

识别精确率（Precisio n）定义如下：

100%

Precision

TP FP

= ×

（15- 9）

（9）反馈率

反馈率(Recall)定义如下：

100%

Recall

TP TN

= ×

（15- 10）

（10） ROC 曲线

受试者工作特性（Receiver Operating Characteristic，ROC）曲线是一种非常有效的模型

评价方法，可为选定临界值给出定量提示。将灵敏度（Sensitivity）设在纵轴，1-特异性

剩余10页未读，继续阅读

评论收藏

内容反馈

1.该资源内容由用户上传，如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款（资源遇到问题，请及时私信上传者）

版权申诉

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

passionSnail

粉丝: 408
资源: 5624

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

快速数据挖掘数据分析实战RapidMiner工具应用第15章 模型评估与优化V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第15章 模型评估与优化V1.1.rar

《RapidMiner数据分析与挖掘实战》第15章 模型评估与优化

快速数据挖掘数据分析实战RapidMiner工具应用第20章 航空公司客户价值分析V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第20章 航空公司客户价值分析V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第11章 决策树与神经网络V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第11章 决策树与神经网络V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第2章 RapidMiner简介V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第13章 Web挖掘V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第12章 文本挖掘V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第7章 数据预处理V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第13章 Web挖掘V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第6章 数据探索V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第14章 推荐系统V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第6章 数据探索V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第2章 RapidMiner简介V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第14章 推荐系统V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第10章 线性回归与逻辑回归V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第7章 数据预处理V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第12章 文本挖掘V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第17章 宏、循环和数据集处理V4.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第10章 线性回归与逻辑回归V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第1章 数据挖掘基础V4.1.pdf

65万条餐厅订单数据分析数据集

基于Python爬虫实现天气预报和数据可视化分析，应付数据分析大作业

EDA探索式数据分析案例数据集

5-8抖音数据分析数据集

Python数据分析项目实践，包括数据读取、评估、清洗、分析、可视化机器学习相关内容等

python数据分析大作业-爬虫、建立模型、可视化、结论分析

origin2021下载免费分享

最新资源

快速数据挖掘数据分析实战RapidMiner工具应用第15章模型评估与优化V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第15章模型评估与优化V1.1.rar

《RapidMiner数据分析与挖掘实战》第15章模型评估与优化

快速数据挖掘数据分析实战RapidMiner工具应用第20章航空公司客户价值分析V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第20章航空公司客户价值分析V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第11章决策树与神经网络V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第11章决策树与神经网络V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第12章文本挖掘V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第7章数据预处理V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第6章数据探索V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第14章推荐系统V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第6章数据探索V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第14章推荐系统V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第10章线性回归与逻辑回归V1.1.rar

快速数据挖掘数据分析实战RapidMiner工具应用第7章数据预处理V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第12章文本挖掘V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第17章宏、循环和数据集处理V4.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第10章线性回归与逻辑回归V1.1.pdf

快速数据挖掘数据分析实战RapidMiner工具应用第1章数据挖掘基础V4.1.pdf