import pandas as pd
import matplotlib.pyplot as plt
# 读取 CSV 文件
df = pd.read_csv('data.csv')
# 查看数据基本信息
print("数据基本信息:")
print(df.info())
# 查看前几行数据
print("\n数据前几行:")
print(df.head())
# 计算基本统计信息
print("\n基本统计描述:")
print(df.describe())
# 计算年龄的平均值
average_age = df['age'].mean()
print(f"\n平均年龄: {average_age}")
# 计算工资的中位数
median_salary = df['salary'].median()
print(f"工资中位数: {median_salary}")
# 可视化薪资分布
plt.figure(figsize=(10, 5))
plt.bar(df['name'], df['salary'], color='skyblue')
plt.xlabel('名字')
plt.ylabel('薪资')
plt.title('薪资分布图')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
没有合适的资源?快使用搜索试试~ 我知道了~
数据分析 读取一个 CSV 文件,进行数据清理和基本分析
共2个文件
py:1个
csv:1个
需积分: 5 0 下载量 21 浏览量
2024-11-03
16:52:16
上传
评论
收藏 1KB ZIP 举报
温馨提示
代码说明: 导入库:导入 Pandas 和 Matplotlib 库。 读取数据:使用 pd.read_csv 方法读取 CSV 文件。 数据查看:输出数据的基本信息和前几行。 统计分析:计算并打印平均年龄和工资中位数。 数据可视化:生成薪资分布的条形图。 确保在运行代码时,将 data.csv 文件放在同一目录下,或修改路径以正确引用文件。运行代码后,你将看到数据的基本信息和一个薪资分布图。
资源推荐
资源详情
资源评论
收起资源包目录
code.zip (2个子文件)
code
数据分析.py 804B
data.csv 94B
共 2 条
- 1
资源评论
AXiaoFighting
- 粉丝: 3981
- 资源: 52
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功