没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
文章目录1.图示初判两个变量之间的相关性(散点图)多变量之间的相关性(散点图矩阵)2.Pearson相关系数3.Spearman相关系数 分析连续变量之间的线性相关程度的强弱 介绍如下几种方法: 图示初判 Pearson相关系数(皮尔逊相关系数) Sperman秩相关系数(斯皮尔曼相关系数) 1.图示初判 拿到一组数据,可以先绘制散点图查看各数据之间的相关性: 两个变量之间的相关性(散点图) import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy import stats %matplo
资源推荐
资源详情
资源评论
















数据特征分析:相关性分析(数据特征分析:相关性分析(Pandas中的中的corr方法)方法)
文章目录文章目录1.图示初判两个变量之间的相关性(散点图)多变量之间的相关性(散点图矩阵)2.Pearson相关系数3.Spearman相
关系数
分析连续变量之间的线性相关程度的强弱
介绍如下几种方法:
图示初判
Pearson相关系数(皮尔逊相关系数)
Sperman秩相关系数(斯皮尔曼相关系数)
1.图示初判图示初判
拿到一组数据,可以先绘制散点图查看各数据之间的相关性:
两个变量之间的相关性(散点图)两个变量之间的相关性(散点图)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
%matplotlib inline
# 图示初判
# (1)变量之间的线性相关性
data1 = pd.Series(np.random.rand(50)*100).sort_values()
data2 = pd.Series(np.random.rand(50)*50).sort_values()
data3 = pd.Series(np.random.rand(50)*500).sort_values(ascending = False)
# 创建三个数据:data1为0-100的随机数并从小到大排列,data2为0-50的随机数并从小到大排列,data3为0-500的随机数并
从大到小排列,
fig = plt.figure(figsize = (10,4))
ax1 = fig.add_subplot(1,2,1)
ax1.scatter(data1, data2)
plt.grid()
# 正线性相关
ax2 = fig.add_subplot(1,2,2)
ax2.scatter(data1, data3)
plt.grid()
# 负线性相关
多变量之间的相关性(散点图矩阵)多变量之间的相关性(散点图矩阵)
# 图示初判
# (2)散点图矩阵初判多变量间关系
data = pd.DataFrame(np.random.randn(200,4)*100, columns = ['A','B','C','D'])
pd.plotting.scatter_matrix(data,figsize=(8,8),#注意Pandas中的用法与之前不同
c = 'k',
marker = '+',
diagonal='hist',
alpha = 0.8,
range_padding=0.1)
资源评论


weixin_38639237
- 粉丝: 3
- 资源: 958
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制
