没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
10页
数据挖掘 (DM) 是从庞大的数据集中检索信息并将其转换为有意义的决策的过程。 分类技术被认为是最重要的数据挖掘技术,因为它成为精确有效地描述数据以进行知识发现的学者们的一个令人着迷的话题。 它用于描述和区分数据类或概念。 分类问题有两大类:二元类和多类。 在二元类分类中,给定的数据集分为两类,而在多类分类中,给定的数据集根据分类规则分为几个类。 本文探讨了几种 DM 分类方法,例如决策树,如分类回归树 (CART) 和条件推理树 (CTREE)、随机森林 (RF)、支持向量机 (SVM) 和 k-最近邻 (KNN) 以增强使用强大的大数据挖掘分析工具 R 和 RStudio 的二元类和多类分类器的结果。 使用准确度、F 分数、灵敏度等各种度量来评估分类器的性能,并预测当使用多个分区 (%) 分析训练-测试数据集时哪个分类器的性能更好。
资源推荐
资源评论
资源评论
weixin_38680393
- 粉丝: 6
- 资源: 912
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功