import pandas as pd
import matplotlib.pyplot as plt
# 读入数据
file = r'123.xlsx'
sheet = 'Sheet2'
col = '信誉评级'
# 标题名称
title = col + '核密度曲线'
xlabel = '信誉评级'
# # 横轴显示范围
# xleft = -2
# xright = 2
data = pd.read_excel(file, sheet_name=sheet)
#-------------------------------
# 检查年龄是否有缺失
any(data.eval(col).isnull())
# 不妨删除含有缺失年龄的观察
data.dropna(subset=[col], inplace=True)
#设置绘图风格
plt.style.use('ggplot')
#处理中文乱码
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
#坐标轴负号的处理
plt.rcParams['axes.unicode_minus']=False
#-------------------------------
#删除非数字的成分 和 值为0的成分
Titanic = data[(pd.to_numeric(data.eval(col), errors='coerce').notnull()) & (data.eval(col) != 0)]
# 绘制直方图
Titanic.eval(col).plot(kind = 'hist', bins = 20, color = 'steelblue', edgecolor = 'black', density = True, label = '直方图')
# 绘制核密度图
Titanic.eval(col).plot(kind = 'kde', color = 'red', label = '核密度图')
# 添加x轴和y轴标签
plt.xlabel(xlabel)
plt.ylabel('频数')
# plt.xlim((xleft, xright))
# 添加标题
plt.title(title)
# 显示图例
plt.legend()
# 显示图形
plt.show()
python数据可视化(excel+py文件 绘制核密度曲线)
需积分: 0 43 浏览量
更新于2023-12-21
2
收藏 25KB ZIP 举报
内容概要:
这段代码使用Python的pandas和matplotlib库对数据进行可视化处理,绘制了一个信誉评级的核密度曲线和直方图。它首先读取Excel文件中的数据,并进行一些数据清洗操作,然后使用直方图和核密度图展示信誉评级的分布情况。
适用人群:
这段代码适用于具有一定Python编程基础和数据分析需求的人群,特别是对于想要了解信誉评级数据分布情况的人员。
使用场景及目标:
该代码适用于分析和可视化信誉评级数据的分布情况。通过绘制核密度曲线和直方图,可以更直观地了解信誉评级的集中程度、偏态以及可能存在的异常值等信息,从而为进一步的数据分析和决策提供依据。
天玑y
- 粉丝: 7393
- 资源: 3
最新资源
- RX8 专业消人声 乐器 软件
- data_f8a84933dc4242f1884120c1a6b20ea0.zip
- 西红柿番茄筛选机sw12全套技术资料100%好用.zip
- 绿色创新的理论基础与实践案例
- 屏幕水印-Curtain MonGuard 5.0.3274.26(免费共享软件)
- 健身房会员管理系统:集成第三方服务的实践
- 龙讯 Lontium lt9211c的驱动
- 杏核去除机sw15可编辑全套技术资料100%好用.zip
- 学术规范与论文写作:构建严谨学术生态的基石
- etcd服务器性能指标与状态监控数据
- 车辆出租管理系统:跨平台开发与部署
- c# winform,编写的usercontorl 文本控件.zip
- 给产品经理讲技术(第一季)
- 576739892472404天气.zip
- 绿色创新理论与实践及其对社会经济和环境的影响
- RK3588 电源功耗说明书