工业汽车数据分析.rar_kmeans聚类对驾驶行为分析数据集资源-CSDN文库

共14个文件

ipynb：4个

csv：3个

xml：3个

数据分析

需积分: 1 50 浏览量 2023-06-03 14:09:51 上传评论收藏 1.76MB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

工业汽车数据分析.rar （14个子文件）

工业汽车数据分析

kmeans案例.py 1KB

Auto_Data_Features.csv 64KB

Auto_Data_Labels.csv 3KB

.idea

misc.xml 185B

inspectionProfiles

profiles_settings.xml 174B

课程代码.iml 441B

modules.xml 276B

.gitignore 47B

Automobile price data _Raw_.csv 26KB

不同数据集的聚类及CH系数应用.py 1KB

分层聚类实战.ipynb 592KB

K-means汽车数据集聚类分析实战.ipynb 712KB

.ipynb_checkpoints

K-means汽车数据集聚类分析实战-checkpoint.ipynb 712KB

分层聚类实战-checkpoint.ipynb 592KB

import matplotlib.pyplot as plt from sklearn.cluster import MiniBatchKMeans,KMeans from sklearn import metrics from sklearn.datasets._samples_generator import make_blobs #生成数据集，其中X为二维数组，y为一维数组 X,y=make_blobs(n_samples=10,n_features=2,centers=[[-1,-1],[0,0],[1,1],[2,2],[4,4]], cluster_std=[0.4,0.2,0.2,0.2,0.2],random_state=9) print(X) #生成数据散点图 plt.scatter(X[:,0],X[:,1],marker='o') plt.show() for index,k in enumerate((2,3,5)): # 将图像划分为两行两列的四个子图 plt.subplot(2,2,index+1) #调用MiniBatchKMeans算法接口函数 #n_clusters中心点的个数，batch_size确定MiniBatchKMeans的采样集的大小，random_state确定用于质心初始化的随机数生成 #计算群集中心并预测每个样本的群集索引 y_pred = MiniBatchKMeans(n_clusters=k,batch_size=200,random_state=9).fit_predict(X) print(y_pred) #给聚类结果一个评分 score = metrics.calinski_harabasz_score(X,y_pred) #绘制散点图，参数c为颜色 plt.scatter(X[:,0],X[:,1],c=y_pred) #添加说明，前三个参数为x,y，字符串，transform为移动坐标轴，horizontalalignment为水平对其方式 plt.text(.99,.01,('k=%d,score:%.2f' % (k,score)),transform=plt.gca().transAxes, size=10,horizontalalignment='right') plt.show()

评论收藏

内容反馈