没有合适的资源?快使用搜索试试~ 我知道了~
data-preprocessing-python:用于预测建模的数据预处理实用程序
共11个文件
py:9个
md:2个
需积分: 50 2 下载量 28 浏览量
2021-05-21
21:22:43
上传
评论
收藏 16KB ZIP 举报
温馨提示
数据预处理 数据预处理是数据挖掘过程中的重要步骤。 短语“垃圾进,垃圾出”特别适用于数据挖掘和机器学习项目。 数据收集方法通常受到宽松的控制,导致值超出范围,不可能的数据组合(例如,性别:男性,孕妇:是),值丢失。 分析未经仔细筛选以解决此类问题的数据可能会产生误导性的结果。 因此,在进行分析之前,数据的表示形式和质量是首要的。 如果存在大量不相关和多余的信息或嘈杂且不可靠的数据,则在训练阶段发现知识将更加困难。 数据准备和过滤步骤可能会花费大量的处理时间。 数据预处理包括清理,规范化,转换,特征提取和选择。 数据预处理的产品是最终的训练集。 数据预处理例程涉及标准化(stndze),图形摘要(gs),偏度,峰度,创建虚拟变量,Box Cox转换等。 主要亮点 -标准化训练数据中的原始特征向量。 -计算特定值与平均值的偏差。 -创建代表训练数据的指标变量。 -计算训练集中样本的偏
资源推荐
资源详情
资源评论
收起资源包目录
data-preprocessing-python-master.zip (11个子文件)
data-preprocessing-python-master
premodelling routines
graphical summary
gs.py 1KB
skewness
skewness.py 1KB
poisson transformation
poitrans.py 1KB
standardization
stndize.py 1KB
deviation
deviate.py 1KB
dummyvariable
createiv.py 2KB
kurtosis
kurtosis.py 1KB
boxcoxtransformation
boxcoxtrans.py 2KB
proportional transformation
proptrans.py 1KB
README.md 3KB
license.md 11KB
共 11 条
- 1
资源评论
RosieLau
- 粉丝: 41
- 资源: 4585
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功