零起点Python机器学习快速入门
电子书推荐
-
Python机器学习基础教程(高清+书签+代码) 评分:
【内容简介】 本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。 本书适合机器学习从业者或有志成为机器学习从业者的人阅读。 【目录】 前言 ix 第 1 章 引言 1 1.1 为何选择机器学习 1 1.1.1 机器学习能够解决的问题 2 1.1.2 熟悉任务和数据 4 1.2 为何选择Python 4 1.3 scikit-learn 4 1.4 必要的库和工具 5 1.4.1 Jupyter Notebook 6 1.4.2 NumPy 6 1.4.3 SciPy 6 1.4.4 matplotlib 7 1.4.5 pandas 8 1.4.6 mglearn 9 1.5 Python 2 与Python 3 的对比 9 1.6 本书用到的版本 10 1.7 第 一个应用:鸢尾花分类 11 1.7.1 初识数据 12 1.7.2 衡量模型是否成功:训练数据与测试数据 14 1.7.3 要事第 一:观察数据 15 1.7.4 构建第 一个模型:k 近邻算法 16 1.7.5 做出预测 17 1.7.6 评估模型 18 1.8 小结与展望 19 第 2 章 监督学习 21 2.1 分类与回归 21 2.2 泛化、过拟合与欠拟合 22 2.3 监督学习算法 24 2.3.1 一些样本数据集 25 2.3.2 k 近邻 28 2.3.3 线性模型 35 2.3.4 朴素贝叶斯分类器 53 2.3.5 决策树 54 2.3.6 决策树集成 64 2.3.7 核支持向量机 71 2.3.8 神经网络(深度学习) 80 2.4 分类器的不确定度估计 91 2.4.1 决策函数 91 2.4.2 预测概率 94 2.4.3 多分类问题的不确定度 96 2.5 小结与展望 98 第3 章 无监督学习与预处理 100 3.1 无监督学习的类型 100 3.2 无监督学习的挑战 101 3.3 预处理与缩放 101 3.3.1 不同类型的预处理 102 3.3.2 应用数据变换 102 3.3.3 对训练数据和测试数据进行相同的缩放 104 3.3.4 预处理对监督学习的作用 106 3.4 降维、特征提取与流形学习 107 3.4.1 主成分分析 107 3.4.2 非负矩阵分解 120 3.4.3 用t-SNE 进行流形学习 126 3.5 聚类 130 3.5.1 k 均值聚类 130 3.5.2 凝聚聚类 140 3.5.3 DBSCAN 143 3.5.4 聚类算法的对比与评估 147 3.5.5 聚类方法小结 159 3.6 小结与展望 159 第4 章 数据表示与特征工程 161 4.1 分类变量 161 4.1.1 One-Hot 编码(虚拟变量) 162 4.1.2 数字可以编码分类变量 166 4.2 分箱、离散化、线性模型与树 168 4.3 交互特征与多项式特征 171 4.4 单变量非线性变换 178 4.5 自动化特征选择 181 4.5.1 单变量统计 181 4.5.2 基于模型的特征选择 183 4.5.3 迭代特征选择 184 4.6 利用专家知识 185 4.7 小结与展望 192 第5 章 模型评估与改进 193 5.1 交叉验证 194 5.1.1 scikit-learn 中的交叉验证 194 5.1.2 交叉验证的优点 195 5.1.3 分层k 折交叉验证和其他策略 196 5.2 网格搜索 200 5.2.1 简单网格搜索 201 5.2.2 参数过拟合的风险与验证集 202 5.2.3 带交叉验证的网格搜索 203 5.3 评估指标与评分 213 5.3.1 牢记目标 213 5.3.2 二分类指标 214 5.3.3 多分类指标 230 5.3.4 回归指标 232 5.3.5 在模型选择中使用评估指标 232 5.4 小结与展望 234 第6 章 算法链与管道 236 6.1 用预处理进行参数选择 237 6.2 构建管道 238 6.3 在网格搜索中使用管道 239 6.4 通用的管道接口 242 6.4.1 用make_pipeline 方便地创建管道 243 6.4.2 访问步骤属性 244 6.4.3 访问网格搜索管道中的属性 244 6.5 网格搜索预处理步骤与模型参数 246 6.6 网格搜索选择使用哪个模型 248 6.7 小结与展望 249 第7 章 处理文本数据 250 7.1 用字符串表示的数据类型 250 7.2 示例应用:电影评论的情感分析 252 7.3 将文本数据表示为词袋 254 7.3.1 将词袋应用于玩具数据集 255 7.3.2 将词袋应用于电影评论 256 7.4 停用词 259 7.5 用tf-idf 缩放数据 260 7.6 研究模型系数 263 7.7 多个单词的词袋(n 元分词) 263 7.8 分词、词干提取与词形还原 267 7.9 主题建模与文档聚类 270 7.10 小结与展望 277 第8 章 全书总结 278 8.1 处理机器学习问题 278 8.2 从原型到生产 279 8.3 测试生产系统 280 8.4 构建你自己的估计器 280 8.5 下一步怎么走 281 8.5.1 理论 281 8.5.2 其他机器学习框架和包 281 8.5.3 排序、推荐系统与其他学习类型 282 8.5.4 概率建模、推断与概率编程 282 8.5.5 神经网络 283 8.5.6 推广到更大的数据集 283 8.5.7 磨练你的技术 284 8.6 总结 284 关于作者 285 关于封面 285 【编辑推荐】 机器学习已成为许多商业应用和研究项目不可或缺的一部分,海量数据使得机器学习的应用范围远超人们想象。本书将向所有对机器学习技术感兴趣的初学者展示,自己动手构建机器学习解决方案并非难事! 书中重点讨论机器学习算法的实践而不是背后的数学,全面涵盖在实践中实现机器学习算法的所有重要内容,帮助读者使用Python和scikit-learn库一步一步构建一个有效的机器学习应用。 * 机器学习的基本概念及其应用 * 常用机器学习算法的优缺点 * 机器学习所处理的数据的表示方法,包括重点关注数据的哪些方面 * 模型评估和调参的方法 * 管道的概念 * 处理文本数据的方法,包括文本特有的处理方法 * 进一步提高机器学习和数据科学技能的建议
上传时间:2018-07 大小:74.72MB
- 261KB
python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf
2023-06-12python机器学习教程_从零开始掌握Python机器学习:⼗四步 教程 Python 可以说是现在最流⾏的机器学习语⾔,⽽且你也能在⽹上找到⼤量的资源。你现在也在考虑从 Python ⼊门机器学习吗?本教程或 许能帮你成功上⼿,...
- 15KB
Python机器学习基础教程.docx
2023-09-13Python机器学习基础教程.docx
- 2.48MB
Python机器学习(代码+数据)
2021-05-11Python机器学习(代码+数据)
- 76B
anaconda+pycharm+python基础+进阶+机器学习+深度学习+数据库等学习教程
2020-10-21anaconda+pycharm+python基础+进阶+机器学习+深度学习+数据库等学习教程
- 30.35MB
python基础教程第二版(高清书签中文)
2018-01-23python 基础教程 第二版 高清 书签 中文: 本书包括Python程序设计的方方面面,首先从Python的安装开始,随后介绍了Python的基础知识和基本概念,包括列表、元组、字符串、字典以及各种语句。然后循序渐进地介绍了...
- 58.57MB
Python廖雪峰+Python基础教程第二版高清+源代码
2018-01-05Python3廖雪峰博客讲义+Python基础教程第二版高清+源代码+带书签
- 1.62MB
Python机器学习实践指南.zip_python_python 教程_python 机器学习_python机器学习_机器学习
2022-07-15python编程资料,实用,可自行学习.除此之外还可学习机器学习算法。
- 32.0MB
python基础教程第二版+源代码
2019-01-24python基础教程第二版 + 教材源代码 影印版 但是很清晰
- 10.69MB
[B]Python机器学习基础教程1
2022-08-03前言目前,从医疗诊断和治疗到在社交网络上寻找好友,许多商业应用和研究项目都离不开机器学习。许多人以为,只有大公司的大型研究团队才能用到机器学习。在本书中,我们要
- 5KB
Python机器学习算法视频教程
2018-05-26视频频学习资料;本资料仅用于学习,请查看后24小时之内删除。算法的示例和代码实现(Python)、算法的参数调试、机器学习算法的应用场景
- 28.29MB
[图灵程序设计丛书].Python机器学习基础教程1
2022-08-03第1章引言11.1 为何选择机器学习 11.1.1 机器学习能够解决的问题 21.1.2 熟悉任务和数据 41.4 必要的库和工具 51.6 本书用到的版本 1
- 130.66MB
Python美多商城系统代码+文档
2023-06-29Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多商城系统代码+文档Python美多...
- 611KB
Python机器学习SVM作业源码+实验报告,将经典数据集Iris鸢尾花的数据样本实现SVM分类源码+实验报告
2023-06-30Python机器学习SVM作业源码+实验报告,将经典数据集Iris鸢尾花的数据样本实现SVM分类源码+实验报告 使用python 3.9的IDLE作为编程环境,编程语言为python,利用模块如sklearn、numpy等实现需要的功能 1.sklearn ...
- 20.11MB
Python机器学习基础源码.zip
2020-03-11Python机器学习源码,直接复制粘贴就好
- 30.55MB
Python基础教程书本示例源代码
2017-12-21资源里包括了Python基础教程书本当中所有示例的源代码和Python基础教程(第二版修订版)高清PDF文档
- 2.77MB
Python机器学习实践-测试驱动的开发方法 - 2018_python学习_python机器学习_python_machine
2021-09-11Python机器学习实例,机器学习基础实例教程
- 47.51MB
Python3机器学习实战教程.zip
2021-01-24史诗级干货,机器学习实战+Python3实现
- 12.69MB
Python高效开发实战+Django+Tornado+Flask+Twisted源代码
2018-06-29Python高效开发实战+Django+Tornado+Flask+Twisted源代码 Python高效开发实战+Django+Tornado+Flask+Twisted源代码 Python高效开发实战+Django+Tornado+Flask+Twisted源代码
- 93KB
博客中聚类算法(K-means、FCM、DBSCAN、DPC)的数据集(免积分)
2023-05-16博客中K-means、FCM、DBSCAN、DPC算法的数据,包括Iris鸢尾花数据集、Wine葡萄酒数据集、Seed小麦种子数据集、glass数据集、WDBD乳腺癌数据集,以及几个人工数据集常用的人工数据集(Flame、Spiral等),下载在直接存入项目文件夹即可,如果下载不了,可以私信我,看到后会及时回复。
- 20KB
机器学习期末复习题及答案
2023-03-19机器学习期末复习题及答案
- 10KB
神经网络回归预测--气温数据集
2021-11-26神经网络回归预测--气温数据集
- 40.89MB
中文短信数据集-带标签
2024-02-05本数据集可用于进行文本分类、信息检索等自然语言处理实验,共包含80万条短信。其中:原始数据集data.txt每行为1条短信,格式为“标签\t短信内容”,标签=0表示正常短信,标签=1表示垃圾短信。train.csv和test.csv为拆分后的训练集与测试集,拆分代码为train_test_split.py。stopwords.txt为使用的停用词。 基于该数据集的文本分类详见文章https://blog.csdn.net/baidu_40395808/article/details/135793836,基于该数据集的信息检索详见文章https://blog.csdn.net/baidu_40395808/article/details/135897480。 示例如下: 0 商业秘密的秘密性那是维系其商业价值和垄断地位的前提条件之一 1 《依林美容》三.八.女人节倾情大放送活动开始啦!!!!超值套餐等你拿,活动时间x月x日一x月xx日, 详情进店咨询。美丽热线x
- 2.20MB
Mathwork+Matlab+编程手册
2023-08-25Introduction to Programming with MATLAB ~ Vanderbilt University
- 1.87MB
XGBoost+LightGBM+LSTM-光伏发电量预测
2022-12-24包含比赛代码、数据、训练后的神经网络模型等。 在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。 1 数据探索与数据预处理 1.1 赛题回顾 1.2 数据探索性分析与异常值处理 1.3 相关性分析 2 特征工程 2.1 光伏发电领域特征 2.2 高阶环境特征 3 模型构建与调试 3.1 预测模型整体结构 3.2 基于LightGBM与XGBoost的构建与调试 3.3 基于LSTM的模型构建与调试 3.4 模型融合与总结 4 总结与展望 参考文献
- 407KB
时间序列预测模型实战案例(Xgboost)(Python)(机器学习)包括时间序列预测和时间序列分类,点击即可运行!
2023-09-25内容概要 资源包括三部分(时间序列预测部分和时间序列分类部分和所需的测试数据集全部包含在内) 在本次实战案例中,我们将使用Xgboost算法进行时间序列预测。Xgboost是一种强大的梯度提升树算法,适用于各种机器学习任务,它最初主要用于解决分类问题,在此基础上也可以应用于时间序列预测。 时间序列预测是通过分析过去的数据模式来预测未来的数值趋势。它在许多领域中都有广泛的应用,包括金融、天气预报、股票市场等。我们将使用Python编程语言来实现这个案例。 其中包括模型训练部分和保存部分,可以将模型保存到本地,一旦我们完成了模型的训练,我们可以使用它来进行预测。我们将选择合适的输入特征,并根据模型的预测结果来生成未来的数值序列。最后,我们会将预测结果与实际观测值进行对比,评估模型的准确性和性能。 适合人群:时间序列预测的学习者,机器学习的学习者, 能学到什么:本模型能够让你对机器学习和时间序列预测有一个清楚的了解,其中还包括数据分析部分和特征工程的代码操作 阅读建议:大家可以仔细阅读代码部分,其中包括每一步的注释帮助读者进行理解,其中涉及到的知识有数据分析部分和特征工程的代码操作。
- 1.3MB
亚博K210模型训练部署
2023-07-11亚博K210模型训练部署
- 1.25MB
hugging face的models-openai-clip-vit-large-patch14文件夹
2023-10-25用于无法访问hugging face并需要运行stable-diffusion-webui时使用
- 174.14MB
Plecs电力电子仿真PLECS41.64 电力系统仿真软件免安装版本
2023-02-02超级容易学习的电力电子仿真软件。 PLECS是一个用于电路和控制结合的多功能仿真软件,尤其适用于电力电子和传动系统。 对于仿真Buck电路,Boost电路,单相整流电路,单相逆变电路,三相整流电路,三相逆变电路,LLC电路等都能够完美实现。并且能够直接使用C语言进行编程仿真,让代码直接写完以后完整运行到控制板中。 Plecs主要解决了Matlab Simulink仿真速度很慢,学习过程复杂和困难等问题。 Plexim在电力电子仿真领域处于世界领先地位。首要软件产品PLECS可以协助用户加快产品开发和创新流程。其优势来源于先进的编程技术,以及融合了非常规建模概念的仿真算法。通过认真听取工程师的需求和建议,我们能够为客户的今天和未来提供满意的解决方案。 从2002年开始,PLECS已经在众多工业领域成为电力电子仿真的标准。典型应用涵盖新能源,车辆电子,航空航天,工业及牵引驱动等。
- 321KB
Stable-Diffusion WEBUI 简体中文语言包(2023.05.30更新)
2023-05-30AI绘图,Stable-Diffusion WEBUI,本地化(简体中文)语言文件。 原始文件来自翻译插件,根据自己实际使用情况,增加和修改了一些翻译。 配合【双语插件】看上去要自然一点,内容还在继续完善中。 本次增加了一些翻译内容,特别是插件。 同时继续合并了其它翻译插件的内容。 最近文字提示修改得有点多啊。 请放入“你的SDWebUI项目位置/localizations/”中。 中文翻译部分删掉了不少括起来的英文原文,所以别直接选它用。 请配合【Bilingual Localization】插件使用,双语同时显示,效果最好。
- 59KB
Matlab 基于支持向量机(SVM)的数据回归预测 SVM回归
2023-06-131. Matlab实现支持向量机的数据回归预测(完整源码和数据) 2. 多变量输入,单变量输出,数据回归预测 3. 评价指标包括:R2、MAE、MSE、RMSE 4. 包括拟合效果图和散点图 5. Excel数据,暂无版本限制,推荐2018B及以上版本 注:采用 Libsvm 工具箱(无需安装,可直接运行),仅支持 Windows 64位系统