没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
SparkML 与数据挖掘
目录
一
概叙
特性
算法包括
工作流程工具包括:
其他工具包括:
基于 的 是主要
基本统计 !"!"!#$
关联%&'"&#$
假设检验()&!!!"#*
摘要统计+,#
数据源!&+!#
的数据类型
数据预处理清洗与转换
特征提取、转换与选择
主成分分析%#
数据归一化处理-
./(字符串索引变换)
./0&(索引字符串变换)
1&./向量索引化#
1&!!2'特征合并#
3(&4&.(独热编码)
0词频逆文档频率#
5&.1词向量#-
%&+1&,计数向量#$
0&,分词器#
&5&.!6&7停用字清除#
,二元化方法#
管道'!#
管道中的主要概念
代码示例--
分类和回归-*
分类%'!!8"&#-*
回归6!!&#*9
线性方法正则化9
决策树9
树集合04!2'!#9-
聚类%'+!#9$
: 均值聚类9
-
潜在 ' 分配()
二等分 !
高斯混合模型(;)-
层次聚类(('<'&"7)$
协同过滤%&''2&"7'#*
交替最小二乘 *
显式和隐式反馈9
缩放正则化参数9
冷启动策略9
代码示例
频繁模式挖掘=+>#
增长;&?#
8/-
调整:模型选择和超参数调整$
模型选择(又称超参数调整)$
交叉验证%&!!1'."&#*
训练与验证分离01'."&'#
高级主题线性方法的优化开发者#
有限记忆 ;( ;)
加权最小二乘法的正规方程求解器
迭代重加权最小二乘(6)
二完整代码示例
$
示例一:! 聚类#
示例二文本挖掘#$
三数据挖掘9
什么是数据挖掘@9
数据挖掘的要点
#大数据思维
#大数据的收集与集成
-#大数据的降维
$#大数据的分布式与并行处理
数据挖掘的过程
常用数据挖掘工具
数据的准备-
数据的收集-
数据质量分析*
数据挖掘的艺术
确定数据挖掘目标的艺术
应用技术的艺术
-数据挖掘中平衡的艺术
$理性对待大数据时代-
*小结
四机器学习过程中的一些问题9
五各种机器学习算法的总结
*
贝叶斯分类器
决策树
AA 算法
主成分分析
局部线性嵌入
等距映射
'&!"' 回归
支持向量机
随机森林
均值算法
人工神经网络-
线性判别分析-
. &&! 算法-
卷积神经网络-
循环神经网络-
生成对抗网络-
4 算法-
%A 算法-
梯度下降法-
剩余63页未读,继续阅读
资源评论
Thomson617
- 粉丝: 437
- 资源: 12
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功