import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 1. 数据采集
# 从本地文件中读取数据 2分
data = pd.read_csv('user_behavior_data.csv')
print("数据采集完成,已加载到DataFrame中")
# 打印数据的前5条记录 2分
print(data.head())
# 2. 数据清洗与预处理
# 处理缺失值 2分
data = data.dropna()
# 数据类型转换
data['Age'] = data['Age'].astype(int) # Age数据类型转换 2分
data['PurchaseAmount'] = data['PurchaseAmount'].astype(float) # PurchaseAmount数据类型转换 2分
data['ReviewScore'] = data['ReviewScore'].astype(int) # ReviewScore数据类型转换 2分
# 处理异常值 2分
data = data[(data['Age'].between(18, 70)) &
(data['PurchaseAmount'] > 0) &
(data['ReviewScore'].between(1, 5))]
# 数据标准化
data['PurchaseAmount'] = (data['PurchaseAmount'] - data['PurchaseAmount'].mean()) / data['PurchaseAmount'].std() # PurchaseAmount数据标准化 2分
data['ReviewScore'] = (data['ReviewScore'] - data['ReviewScore'].mean()) / data['ReviewScore'].std() # ReviewScore数据标准化 2分
# 保存清洗后的数据 1分
data.to_csv('cleaned_user_behavior_data.csv', index=False)
print("数据清洗完成,已保存为 'cleaned_user_behavior_data.csv'")
# 3. 数据统计
# 统计每个购买类别的用户数
purchase_category_counts = data['PurchaseCategory'].value_counts()
print("每个购买类别的用户数:\n", purchase_category_counts)
# 统计不同性别的平均购买金额
gender_purchase_amount_mean = data.groupby('Gender')['PurchaseAmount'].mean()
print("不同性别的平均购买金额:\n", gender_purchase_amount_mean)
# 统计不同年龄段的用户数
bins = [18, 25, 35, 45, 55, 65, 70]
labels = ['18-25', '26-35', '36-45', '46-55', '56-65', '65+']
data['AgeGroup'] = pd.cut(data['Age'], bins=bins, labels=labels, right=False)
age_group_counts = data['AgeGroup'].value_counts().sort_index()
print("不同年龄段的用户数:\n", age_group_counts)
没有合适的资源?快使用搜索试试~ 我知道了~
人工智能代码20240928
共12个文件
py:8个
csv:4个
需积分: 0 0 下载量 30 浏览量
2024-09-28
15:56:48
上传
评论
收藏 266KB RAR 举报
温馨提示
人工智能讲义20240928
资源推荐
资源详情
资源评论
收起资源包目录
1-4.rar (12个子文件)
1-4
试题
1.1.3.py 2KB
1.1.1.py 2KB
1.1.4.py 2KB
1.1.2.py 1015B
答案
1.1.3.py 2KB
1.1.1.py 2KB
1.1.4.py 2KB
1.1.2.py 1KB
数据
sensor_data.csv 591KB
user_behavior_data.csv 66KB
credit_data.csv 570KB
patient_data.csv 22KB
共 12 条
- 1
资源评论
Ein&Zwei&Deri
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Windows批处理脚本清理系统垃圾文件工具
- 通过脚本实现淘宝手机抢购:huawei mate xt 非凡大师【该款脚本是升级之后的版本,可以大大提高抢购概率】
- 基于Java的JDBC数据库连接设计与源码分享
- Python分析51Job数据&源代码&爬取数据
- 基于Vue框架的体育云管理系统设计源码
- 基于Java、PHP、CSS技术的课程评价系统设计源码
- 基于HTML及Java等技术的专家特贴网站设计源码
- java Web会员管理系统用eclipse定制开发mysql数据库BS模式java编程jdbc
- 基于C#、CSS、JavaScript的XiangdoToShengyi产品服务设计源码
- 基于C#语言的儿童益智游戏设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功