没有合适的资源?快使用搜索试试~ 我知道了~
2. Classify,训练和测试关于分类或回归的学习方案 3. Cluster,从数据中学习聚类 4. Associate,从数据中学习关联规则 5. Sel
资源详情
资源评论
资源推荐
基于 WEKA 的数据挖掘算法学习(一)
一、 Weka Explorer 基本知识了解
1.1 Explorer 标签页
1. Preprocess,选择和修改要处理的数据。
2. Classify,训练和测试关于分类或回归的学习方案。
3. Cluster,从数据中学习聚类。
4. Associate,从数据中学习关联规则。
5. Select attributes,选择数据中最相关的属性。
6. Visualize,查看数据的交互式二维图像。
1.2 状态栏
状态(Status)栏在窗口的最底部,显示一些正在做的信息。
1.3 Log 按钮
一个可拖动的文本区域,在 WEKA 中执行某种操作时, 该日志就会记录
发生的操作及时间。
1.4 WEKA 状态图标
状态栏的右边是 WEKA 状态图标。X 表示并发进程发生的数量。
二、 数据的准备与格式的转换
1.下载完备数据集:waveform.data.z。
2.在 waveform.data 首行添加定义,并存为.csv 文件。
3.在 weka explorer 中 save 保存为 weka 中可以使用的.arrf。
4.在文本编辑器中设置 class 为{0,1,2}:
这里属性的申明格式为:@attribute <attribute-name> <datatype>
三、 测试过程与结果
3.1 朴素贝叶斯(NaiveBayes)
3.1.1 思想
采用了属性条件独立性假设,即假设每个属性独立地对分类结果发生
影响。基于这个思想,可以得到:
𝑃
𝑐
│
𝒙
=
𝑃
(
𝑐
)
𝑃
𝒙
│
𝑐
𝑃
(
𝒙
)
=
𝑃(𝑐)
𝑃(
𝒙
)
𝑑
𝑖
=
1
𝑃(
𝑥
𝑖
|𝑐)
简化了
𝑃
𝒙
│
𝑐
所有属性联合概率的求解,但在实际训练样本中往往
属性并不独立,对结果会产生影响。
臭人鹏
- 粉丝: 20
- 资源: 330
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0