没有合适的资源?快使用搜索试试~ 我知道了~
数据挖掘实训报告----精品模板.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 97 浏览量
2022-06-24
03:52:12
上传
评论
收藏 674KB PDF 举报
温馨提示
试读
15页
数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf数据挖掘实训报告----精品模板.pdf
资源推荐
资源详情
资源评论
项目 1:基于 sklearn 的数据分类挖掘
一、项目任务
①熟悉sklearn数据挖掘的基本功能。
②进行用朴素贝叶斯、KNN、决策树C4.5、SVM算法进行数据分类分析。
二、项目环境及条件
➢ sklearn—0。18.0
➢ python-2。7。13
➢ numpy-1.11。3+mkl-cp27—cp27m-win_amd64
➢ scipy-0.19。0—cp27-cp27m—win_amd64
➢ matplotlib—1.5。3—cp27-cp27m—win_amd64
三、实验数据
Iris 数据集
Iris 数据集是常用的分类实验数据集,由 Fisher, 1936 收集整理。Iris 也称鸢尾花卉数
据集,是一类多重变量分析的数据集.数据集包含 150 个数据集,分为 3 类,每类 50 个数据,
每个数据包含 4 个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度 4 个属性预测鸢尾
花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
Digits 数据集
美国著名数据集 NIST 的子集,模式识别常用实验数据集,图像属于灰度图像。分辨率为
8x8
四、项目内容及过程
1。读取数据集
从 sklearn 中读取 iris 和 digits 数据集并测试打印
from sklearn import datasets
iris = datasets
。
load_iris
()
digits = datasets.load_digits(
)
print 'iris
:
’
,
iris.data,’\ndigits
:
'
,
digits.data
打印的数据集存在 numpy.ndarray 中,ndarray 会自动省略较长矩阵的中间部分.
Iris 数据集的样本数据为其花瓣的各项属性
Digits 数据集的样本数据为手写数字图像的像素值
2.划分数据集
引入 sklearn 的 model_selection 使用 train_test_split 划分 digits 数据集,训练集和测试集比例为
8:2
from sklearn.model_selection import train_test_split
x_train
,
x_test,y_train,y_test=train_test_split
(
digits
。
data,digits.target,test_size=0
。
2)
print ’x_train:'
,
x_train
,
’\nx_test:',x_test
,
’\ny_train
:
',y_train
,
'\ny_test:’,y_test
3.使用 KNN 和 SVM 对 digits 测试集分类
引 用 sklearn 的 svm.SVC 和 neighbors.KNeighborsClassifier 模 块 调 用 算 法 , 使 用
classification_report 查看预测结果的准确率和召回率
from sklearn
。
metrics import classification_report
from sklearn import neighbors
clf = neighbors
。
KNeighborsClassifier()
clf
。
fit(x_train
,
y_train
)
y_pred=clf.predict(x_test
)
print classification_report
(
y_test
,
y_pred
)
from sklearn.svm import SVC
clf = SVC
()
clf
。
fit(x_train
,
y_train)
y_pred=clf
。
predict(x_test)
print classification_report(y_test
,
y_pred
)
剩余14页未读,继续阅读
资源评论
春哥111
- 粉丝: 1w+
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功