没有合适的资源?快使用搜索试试~ 我知道了~
python数据挖掘实验-数据的预处理和探索.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
26 浏览量
2022-06-23
01:46:05
上传
评论
收藏 118KB PDF 举报
python数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdfpython数据挖掘实验-数据的预处理和探索.pdf
资源推荐
资源详情
资源评论





















实验 1: 数据的预处理和探索
【实验对象】:
对“泰坦尼克生还 ”数据集进行预处理和探索,见数据文件 “titanic_data.csv”。其中,
Survived 是目标属性。
【实验任务】:
1. 原始数据的描述: 样本数、属性数、属性类型(标称、序数、连续)
2. 预处理
(1) 缺失值处理
(2) 异常值处理(需判读是否存在异常值)
(3) 规范化(数据变换)
(4) 去除无意义的属性(数据规约)
3. 采用合适的度量对数据进行汇总统计(如,频数、百分数、均值、中位数等)
4. 采用合适的工具对数据进行可视化(如直方图、盒状图、散点图等)
5. 其他有价值的探索(自行发现)
【参考代码 Python】
#拉格朗日插值代码
import pandas as pd
#导入数据分析库Pandas
from scipy.interpolate import lagrange
#导入拉格朗日插值函数
inputfile = 'titanic_data.csv'
#销量数据路径
outputfile = 'titanic_interp.csv'
#输出数据路径
# dataFrame
data = pd.read_csv(inputfile, encoding='utf-8')
#读入数据
data.loc[data['Sex']=='male', ['Sex'] ]=0
data.loc[data['Sex']=='female', ['Sex'] ]=1
资源评论

苦茶子12138
- 粉丝: 3629
- 资源: 8万+

上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
