零起点Python机器学习快速入门
电子书推荐
-
Python机器学习基础教程(高清+书签+代码) 评分:
【内容简介】 本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。 本书适合机器学习从业者或有志成为机器学习从业者的人阅读。 【目录】 前言 ix 第 1 章 引言 1 1.1 为何选择机器学习 1 1.1.1 机器学习能够解决的问题 2 1.1.2 熟悉任务和数据 4 1.2 为何选择Python 4 1.3 scikit-learn 4 1.4 必要的库和工具 5 1.4.1 Jupyter Notebook 6 1.4.2 NumPy 6 1.4.3 SciPy 6 1.4.4 matplotlib 7 1.4.5 pandas 8 1.4.6 mglearn 9 1.5 Python 2 与Python 3 的对比 9 1.6 本书用到的版本 10 1.7 第 一个应用:鸢尾花分类 11 1.7.1 初识数据 12 1.7.2 衡量模型是否成功:训练数据与测试数据 14 1.7.3 要事第 一:观察数据 15 1.7.4 构建第 一个模型:k 近邻算法 16 1.7.5 做出预测 17 1.7.6 评估模型 18 1.8 小结与展望 19 第 2 章 监督学习 21 2.1 分类与回归 21 2.2 泛化、过拟合与欠拟合 22 2.3 监督学习算法 24 2.3.1 一些样本数据集 25 2.3.2 k 近邻 28 2.3.3 线性模型 35 2.3.4 朴素贝叶斯分类器 53 2.3.5 决策树 54 2.3.6 决策树集成 64 2.3.7 核支持向量机 71 2.3.8 神经网络(深度学习) 80 2.4 分类器的不确定度估计 91 2.4.1 决策函数 91 2.4.2 预测概率 94 2.4.3 多分类问题的不确定度 96 2.5 小结与展望 98 第3 章 无监督学习与预处理 100 3.1 无监督学习的类型 100 3.2 无监督学习的挑战 101 3.3 预处理与缩放 101 3.3.1 不同类型的预处理 102 3.3.2 应用数据变换 102 3.3.3 对训练数据和测试数据进行相同的缩放 104 3.3.4 预处理对监督学习的作用 106 3.4 降维、特征提取与流形学习 107 3.4.1 主成分分析 107 3.4.2 非负矩阵分解 120 3.4.3 用t-SNE 进行流形学习 126 3.5 聚类 130 3.5.1 k 均值聚类 130 3.5.2 凝聚聚类 140 3.5.3 DBSCAN 143 3.5.4 聚类算法的对比与评估 147 3.5.5 聚类方法小结 159 3.6 小结与展望 159 第4 章 数据表示与特征工程 161 4.1 分类变量 161 4.1.1 One-Hot 编码(虚拟变量) 162 4.1.2 数字可以编码分类变量 166 4.2 分箱、离散化、线性模型与树 168 4.3 交互特征与多项式特征 171 4.4 单变量非线性变换 178 4.5 自动化特征选择 181 4.5.1 单变量统计 181 4.5.2 基于模型的特征选择 183 4.5.3 迭代特征选择 184 4.6 利用专家知识 185 4.7 小结与展望 192 第5 章 模型评估与改进 193 5.1 交叉验证 194 5.1.1 scikit-learn 中的交叉验证 194 5.1.2 交叉验证的优点 195 5.1.3 分层k 折交叉验证和其他策略 196 5.2 网格搜索 200 5.2.1 简单网格搜索 201 5.2.2 参数过拟合的风险与验证集 202 5.2.3 带交叉验证的网格搜索 203 5.3 评估指标与评分 213 5.3.1 牢记目标 213 5.3.2 二分类指标 214 5.3.3 多分类指标 230 5.3.4 回归指标 232 5.3.5 在模型选择中使用评估指标 232 5.4 小结与展望 234 第6 章 算法链与管道 236 6.1 用预处理进行参数选择 237 6.2 构建管道 238 6.3 在网格搜索中使用管道 239 6.4 通用的管道接口 242 6.4.1 用make_pipeline 方便地创建管道 243 6.4.2 访问步骤属性 244 6.4.3 访问网格搜索管道中的属性 244 6.5 网格搜索预处理步骤与模型参数 246 6.6 网格搜索选择使用哪个模型 248 6.7 小结与展望 249 第7 章 处理文本数据 250 7.1 用字符串表示的数据类型 250 7.2 示例应用:电影评论的情感分析 252 7.3 将文本数据表示为词袋 254 7.3.1 将词袋应用于玩具数据集 255 7.3.2 将词袋应用于电影评论 256 7.4 停用词 259 7.5 用tf-idf 缩放数据 260 7.6 研究模型系数 263 7.7 多个单词的词袋(n 元分词) 263 7.8 分词、词干提取与词形还原 267 7.9 主题建模与文档聚类 270 7.10 小结与展望 277 第8 章 全书总结 278 8.1 处理机器学习问题 278 8.2 从原型到生产 279 8.3 测试生产系统 280 8.4 构建你自己的估计器 280 8.5 下一步怎么走 281 8.5.1 理论 281 8.5.2 其他机器学习框架和包 281 8.5.3 排序、推荐系统与其他学习类型 282 8.5.4 概率建模、推断与概率编程 282 8.5.5 神经网络 283 8.5.6 推广到更大的数据集 283 8.5.7 磨练你的技术 284 8.6 总结 284 关于作者 285 关于封面 285 【编辑推荐】 机器学习已成为许多商业应用和研究项目不可或缺的一部分,海量数据使得机器学习的应用范围远超人们想象。本书将向所有对机器学习技术感兴趣的初学者展示,自己动手构建机器学习解决方案并非难事! 书中重点讨论机器学习算法的实践而不是背后的数学,全面涵盖在实践中实现机器学习算法的所有重要内容,帮助读者使用Python和scikit-learn库一步一步构建一个有效的机器学习应用。 * 机器学习的基本概念及其应用 * 常用机器学习算法的优缺点 * 机器学习所处理的数据的表示方法,包括重点关注数据的哪些方面 * 模型评估和调参的方法 * 管道的概念 * 处理文本数据的方法,包括文本特有的处理方法 * 进一步提高机器学习和数据科学技能的建议
上传时间:2018-07 大小:74.72MB
- 261KB
python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf
2023-06-12python机器学习教程_从零开始掌握Python机器学习:⼗四步 教程 Python 可以说是现在最流⾏的机器学习语⾔,⽽且你也能在⽹上找到⼤量的资源。你现在也在考虑从 Python ⼊门机器学习吗?本教程或 许能帮你成功上⼿,从 0 到 1 掌握 Python 机器学习,⾄于后⾯再从 1 到 100 变成机器学习专家,就要看你⾃⼰的努⼒了。本教程原⽂ 分为两个部分,机器之⼼在本⽂中将其进⾏了整合,原⽂可参阅:7 Steps to Mastering Machine Learning With Python 和 7 More Steps to Mastering Machine Learning With Python。本教程的作者为 KDnuggets 副主编兼数据科学家 Matthew Mayo。 「开始」往往是最难的,尤其是当选择太多的时候,⼀个⼈往往很难下定决定做出选择。本教程的⽬的是帮助⼏乎没有 Python 机器学习背 景的新⼿成长为知识渊博的实践者,⽽且这个过程中仅需要使⽤免费的材料和资源即可。这个⼤纲的主要⽬标是带你了解那些数量繁多的可 ⽤资源。毫⽆疑问,资源确实有很
- 242KB
Python机器学习教程.pdf
2021-09-26Python机器学习教程.pdf
- 13.7MB
机器学习基础教程源码.rar
2019-10-15机器学习基础教程(Rogers)内的源码,包含.m和.r文件,大家下载学习吧!
- 25KB
python机器学习算法源代码.zip
2020-09-13python机器学习算法源代码,welcom my friedn to downloads the source code.
- 20.11MB
Python机器学习基础源码.zip
2020-03-11Python机器学习源码,直接复制粘贴就好
- 15KB
Python机器学习基础教程.docx
2023-09-13Python机器学习基础教程.docx
- 2.48MB
Python机器学习(代码+数据)
2021-05-11Python机器学习(代码+数据)
- 76B
anaconda+pycharm+python基础+进阶+机器学习+深度学习+数据库等学习教程
2020-10-21anaconda+pycharm+python基础+进阶+机器学习+深度学习+数据库等学习教程
- 30.35MB
python基础教程第二版(高清书签中文)
2018-01-23python 基础教程 第二版 高清 书签 中文: 本书包括Python程序设计的方方面面,首先从Python的安装开始,随后介绍了Python的基础知识和基本概念,包括列表、元组、字符串、字典以及各种语句。然后循序渐进地介绍了...
- 58.57MB
Python廖雪峰+Python基础教程第二版高清+源代码
2018-01-05Python3廖雪峰博客讲义+Python基础教程第二版高清+源代码+带书签
- 29.13MB
机器学习入门代码
2018-03-11该入门代码是Andrew ng(吴恩达)老师在coursera上开设的机器学习课程的编程习题的matlab代码,非常适合机器学习初学者作为参考来熟悉算法内涵、养成良好的编程习惯。
- 14.16MB
教程:机器学习教程和基础知识
2021-02-05讲解 1. Python基础知识 งร้าง向量,矩阵 索引编制 บวก,ลบ,คูณ,หาร操作 运算สำหรับ矩阵(线性代数函数) หาค่าทางสถิติต่างง 重塑 การสุ่มค่า 方法ที่ใช้บ่อยในRE 角色พิเศษที่ใช้บ่อยในRE 示例用例 交叉表 通过...分组 2.机器学习 2.1基础 推土机蓝皮书 预测一件重型设备的拍卖销售价格,以为推土机创建一本“蓝皮书”。 -波士顿房价数据集 2.2库存预测 stock_list = [ 'KBANK' , 'SCB' , 'BBL' , 'KTB' ] 2.3自然语言处理 ลบ文字ที่
- 129.58MB
Hands-On Reinforcement Learning with Python
2018-11-03EPUB格式,包含配套代码。压缩包里还包括Fluent Python,PDF和EPUB格式;Python Master the Art of Design Patterns,PDF格式。 What you will learn Understand the basics of RL methods, algorithms, and elements Train an agent to walk using OpenAI Gym and Tensorflow Understand Markov decision process, Bellman's optimality, and temporal difference (TD) learning Solve multi-armed bandit problems using various algorithms Master deep learning algorithms, such as RNN, LSTM, and CNN with applications Build intelligent agents using the DRQN algorithm to play the Doom game Teach agents to play the Lunar Lander game using DDPG Train an agent to win a car racing game using dueling DQN
- 454KB
《Python机器学习基础教程》学习记录(一)
2020-12-21开篇 为了提升自己,准备学习《Python机器学习基础教程》作者: [德]安德里亚斯·穆勒 / [美]莎拉·吉多,译者: 张亮 ;写此博客,用作记录书中的代码,学习心得等。 第一章 1.4.4 matplotlib matplotlib 是Python 主要的科学绘图库,其功能为生成可发布的可视化内容,如折线图、直方图、散点图等。将数据及各种分析可视化,可以让你产生深刻的理解,而我们将使用 matplotlib完成所有的可视化内容。 Jupyter Notebook 是可以在浏览器中运行代码的交互环境。这个工具在探索性数据分析方 面非常有用,在数据科学家中广为使用。虽然 Jupy
- 1.62MB
Python机器学习实践指南.zip_python_python 教程_python 机器学习_python机器学习_机器学习
2022-07-15python编程资料,实用,可自行学习.除此之外还可学习机器学习算法。
- 32.0MB
python基础教程第二版+源代码
2019-01-24python基础教程第二版 + 教材源代码 影印版 但是很清晰
- 10.69MB
[B]Python机器学习基础教程1
2022-08-03前言目前,从医疗诊断和治疗到在社交网络上寻找好友,许多商业应用和研究项目都离不开机器学习。许多人以为,只有大公司的大型研究团队才能用到机器学习。在本书中,我们要
- 5KB
Python机器学习算法视频教程
2018-05-26视频频学习资料;本资料仅用于学习,请查看后24小时之内删除。算法的示例和代码实现(Python)、算法的参数调试、机器学习算法的应用场景
- 28.29MB
[图灵程序设计丛书].Python机器学习基础教程1
2022-08-03第1章引言11.1 为何选择机器学习 11.1.1 机器学习能够解决的问题 21.1.2 熟悉任务和数据 41.4 必要的库和工具 51.6 本书用到的版本 1
- 130.66MB
Python美多商城系统代码+文档
2023-06-29Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多...
- 611KB
Python机器学习SVM作业源码+实验报告,将经典数据集Iris鸢尾花的数据样本实现SVM分类源码+实验报告
2023-06-30Python机器学习SVM作业源码+实验报告,将经典数据集Iris鸢尾花的数据样本实现SVM分类源码+实验报告 使用python 3.9的IDLE作为编程环境,编程语言为python,利用模块如sklearn、numpy等实现需要的功能 1.sklearn ...
- 30.55MB
Python基础教程书本示例源代码
2017-12-21资源里包括了Python基础教程书本当中所有示例的源代码和Python基础教程(第二版修订版)高清PDF文档
- 2.77MB
Python机器学习实践-测试驱动的开发方法 - 2018_python学习_python机器学习_python_machine
2021-09-11Python机器学习实例,机器学习基础实例教程
- 47.51MB
Python3机器学习实战教程.zip
2021-01-24史诗级干货,机器学习实战+Python3实现
- 12.69MB
Python高效开发实战+Django+Tornado+Flask+Twisted源代码
2018-06-29Python高效开发实战+Django+Tornado+Flask+Twisted源代码 Python高效开发实战+Django+Tornado+Flask+Twisted源代码 Python高效开发实战+Django+Tornado+Flask+Twisted源代码
- 1.95MB
ChatGPT教程(终极版)最全整理
2023-05-16这是一篇动了某些人利益的良心教程。 这是一篇姗姗来迟的ChatGPT教程。 纯小白关于ChatGPT入门,你看我这篇文章就够了。 如果你已经用上了ChatGPT,更要恭喜你挖到宝藏,后面的高级技巧一定能让你有收获。 文章包含以下内容: 一、ChatGPT是啥?有什么用; 二、ChatGPT如何注册; 三、ChatGPT使用方法; 四、用ChatGPT搞钱; 五、高级技巧;
- 58KB
博客中Kmeans以及FCM算法数据(免积分)
2023-05-16博客中Kmeans以及FCM算法的数据,包括IRIS鸢尾花数据集、Wine葡萄酒数据集、Seed小麦种子数据集、glass数据集、WDBD乳腺癌数据集,下载在直接存入项目文件夹即可,如果下载不了,可以私信我,看到后会及时回复。
- 1.25MB
hugging face的models-openai-clip-vit-large-patch14文件夹
2023-10-25用于无法访问hugging face并需要运行stable-diffusion-webui时使用
- 10KB
神经网络回归预测--气温数据集
2021-11-26神经网络回归预测--气温数据集
- 1.87MB
XGBoost+LightGBM+LSTM-光伏发电量预测
2022-12-24包含比赛代码、数据、训练后的神经网络模型等。 在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。 1 数据探索与数据预处理 1.1 赛题回顾 1.2 数据探索性分析与异常值处理 1.3 相关性分析 2 特征工程 2.1 光伏发电领域特征 2.2 高阶环境特征 3 模型构建与调试 3.1 预测模型整体结构 3.2 基于LightGBM与XGBoost的构建与调试 3.3 基于LSTM的模型构建与调试 3.4 模型融合与总结 4 总结与展望 参考文献