大数据技术之SparkSQL
第1章 Spark SQL概述 第2章 SparkSQL编程 第2章 SparkSQL编程 第4章 Spark SQL实战 共31页
第1章 Spark SQL概述 第2章 SparkSQL编程 第2章 SparkSQL编程 第4章 Spark SQL实战 共31页
目录: numpy快速回顾 矩阵创建三种方式 np.arange方式创建 np.array方式创建 np.random生成随机矩阵 常见属性与升、降维、四则运算 ndarray常见属性 ndarray升降维 ndarray四则运算 元素的过滤与函数 通过切片过滤元素 逻辑运算过滤元素 轴与常见函数 图片转化综合案例 Pandas快速回顾 创建DataFrame与Series 庖丁解牛Series 庖丁解牛DataFrame 如何选择行与列 选择单列或多列 iloc通过索引获取 条件过滤与筛选 加载csv创建DataFrame 加载本地csv文件 加载本地excel文件
机器学习之线性回归 目录: 数据分析与质量 数据分析7步骤详解 数据质量五个维度 回归算法原理分析 举一个栗子 矩阵点乘与相乘 矩阵的乘法 绝对值误差 回归极简案例实现 完整代码如下 线性回归房价预测 加载数据分析 数据探索、预处理 拆分训练测试集 归一化与标准化 归一化预处理 标准化处理 (推荐) 为什么先拆分在标准化 模型标准化实现 归一与标准化应用场景 均方误差、均方根误差 R Squared 欠拟合与过拟合解决方案 欠拟合解决方案 PolynomialFeatures基本使用 升维提升正确率 欠拟合与过拟合 温故而知新 过拟合解决方案 L2正则化岭回归 常见的机器学习模板 Pipeline构建机器学习工作流 Pipeline流程介绍 一个简单DEMO 封装Pipeline并构建工作流程 可视化、模型保存与加载 r2_score 训练结果可视化 adjusted R-squared 模型的保存与加载
版本:2.3.0 发布日期:2017年3月20日 支持.NET Framework 2.0 / .NET Framework 4.0 v2.3.0是最后一个支持.NET Framework 2.0的版本。
POI 是 POI 项目的 .NET 版本。NPOI是构建在POI 3.x版本之上的开源项目,它可以在没有安装Office的情况下对Word/Excel文档进行读、写、导入、导出等操作
百度地图 API 类参考,2018整理,很全,很全。 百度地图 API 类参考,2018整理,很全,看了绝对不后悔,花了很大代价
用途:整理当前文件夹下的文件,每N个文件放到一个文件夹中。比如百度云上传一次最多500个文件,用这个软件可以把一个文件夹下10000多个文件每500个放到一个子文件夹中。