import numpy as np
import pandas as pd
import matplotlib.dates as mdates
from datetime import datetime
from statsmodels.tsa.seasonal import seasonal_decompose
import os
# print(data_x)
# 热力图-------------
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
import numpy as np
import pandas as pd
import re
import matplotlib.dates as mdates
from datetime import datetime
from statsmodels.tsa.seasonal import seasonal_decompose
import os
# print(data_x)
# 热力图-------------
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
data = pd.read_csv("心脏病数据.csv")
data = data.fillna(0)
print(data.head(5))
print(data.columns)
data = data[['Age', 'Sex', 'ChestPainType', 'RestingBP', 'Cholesterol', 'FastingBS',
'RestingECG', 'MaxHR', 'ExerciseAngina', 'Oldpeak', 'ST_Slope',
'HeartDisease']]
data['Sex'] = pd.factorize(data['Sex'])[0]
data['ChestPainType'] = pd.factorize(data['ChestPainType'])[0]
data['RestingECG'] = pd.factorize(data['RestingECG'])[0]
data['ExerciseAngina'] = pd.factorize(data['ExerciseAngina'])[0]
data['ST_Slope'] = pd.factorize(data['ST_Slope'])[0]
# 产品类型占比饼状图
# 绘制饼状图
value_counts = data['HeartDisease'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(value_counts, labels=value_counts.index, autopct='%1.1f%%', startangle=90, colors=['orange','blue', 'green', 'blue','orange'])
plt.title('HeartDisease Distribution')
plt.show()
# 绘制饼状图
value_counts = data['Sex'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(value_counts, labels=value_counts.index, autopct='%1.1f%%', startangle=90, colors=['red','yellow', 'green', 'blue','orange'])
plt.title('Sex Distribution')
plt.show()
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
plt.subplots(figsize=(20, 50))
print(data.corr())
plt.figure(figsize=(8, 6))
sns.heatmap(data.corr(), annot=True, cmap='coolwarm', linewidths=.5)
plt.title('Correlation Heatmap')
plt.show()
# 计算特征与目标列的相关性
correlation_matrix = data.corr()
correlation_with_target = correlation_matrix['HeartDisease'].abs().sort_values(ascending=False)
# 筛选与目标列相关性较高的特征
selected_features = correlation_with_target[correlation_with_target > 0.5].index
# 打印相关性排序
print("特征与目标列的相关性排序:")
print(correlation_with_target)
# 绘制柱状图显示相关性
plt.figure(figsize=(10, 6))
sns.barplot(x=correlation_with_target.values, y=correlation_with_target.index, palette='viridis')
plt.title('Feature Correlation with HeartDisease')
plt.xlabel('Correlation')
plt.ylabel('Feature')
plt.show()
没有合适的资源?快使用搜索试试~ 我知道了~
代码.-参数优化代码.-参数优化代码.-参数优化
共16个文件
py:6个
xml:5个
pyc:2个
需积分: 5 0 下载量 131 浏览量
2024-05-16
10:15:44
上传
评论
收藏 19KB RAR 举报
温馨提示
代码.-参数优化代码.-参数优化代码.-参数优化代码.-参数优化
资源推荐
资源详情
资源评论
收起资源包目录
代码.rar (16个子文件)
svm.py 2KB
xgboost算法.py 2KB
xgboost算法-参数优化.py 2KB
.idea
故人-500-200已付.iml 324B
workspace.xml 8KB
misc.xml 188B
inspectionProfiles
Project_Default.xml 274B
profiles_settings.xml 174B
modules.xml 299B
.gitignore 50B
数据分析.py 3KB
date_process.py 2KB
metra.py 2KB
__pycache__
date_process.cpython-38.pyc 1KB
metra.cpython-38.pyc 2KB
心脏病数据.csv 35KB
共 16 条
- 1
资源评论
mqdlff_python
- 粉丝: 1618
- 资源: 77
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功