没有合适的资源?快使用搜索试试~ 我知道了~
颜色分类leetcode-dsc-generating-data-dc-ds-060319:dsc-生成数据-dc-ds-060...
共12个文件
png:6个
md:3个
learn:1个
需积分: 5 0 下载量 81 浏览量
2021-07-06
23:24:40
上传
评论
收藏 94KB ZIP 举报
温馨提示
颜色分类leetcode 生成数据 介绍 数据分析通常需要分析师使用某种类型的数据来测试算法的效率/性能。 在这种情况下,重点不是像我们之前看到的那样回答一些分析问题,而是测试一些机器学习假设,例如,比较两种不同的算法,看看哪一种算法的准确性更高。 在这种情况下,分析师通常会处理他们自己生成的合成随机数据。 本实验和接下来的课程将重点介绍一些数据生成技术,您可以稍后使用这些技术来学习新算法,同时又不会过多地沉迷于领域知识。 目标 你将能够 : 确定数据科学家想要生成数据集的原因 为分类问题生成数据集 为回归问题生成数据集 练习数据集 练习数据集允许测试和调试算法并测试其稳健性。 它们还用于理解算法响应模型参数变化的行为,正如我们将在一些 ML 算法中看到的那样。 以下是此类数据集优于现实世界数据集的一些原因: 快速简便的生成 - 节省数据收集时间和精力 可预测的结果 - 对结果有更高的信心 随机化 - 数据集可以重复随机化以检查多种情况下的性能 简单的数据类型——更容易可视化数据和结果 在本课中,我们将介绍一些可以帮助我们生成随机数据集的 Python 函数。 make_blobs()
资源推荐
资源详情
资源评论
收起资源包目录
dsc-generating-data-dc-ds-060319-master.zip (12个子文件)
dsc-generating-data-dc-ds-060319-master
index.ipynb 68KB
.learn 87B
CONTRIBUTING.md 2KB
LICENSE.md 1KB
index_files
index_10_0.png 8KB
index_27_0.png 6KB
index_16_0.png 9KB
index_29_1.png 6KB
index_29_0.png 6KB
index_22_0.png 7KB
README.md 7KB
.gitignore 64B
共 12 条
- 1
资源评论
weixin_38745434
- 粉丝: 14
- 资源: 922
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功