零起点Python机器学习快速入门
电子书推荐
-
python机器学习基础教程(原版+高清+标签) 评分:
前言 .......................................................................................................................................................... ix 第 1 章 引言 ......................................................................................................................................... 1 1.1 为何选择机器学习 ..................................................................................................................... 1 1.1.1 机器学习能够解决的问题 ............................................................................................ 2 1.1.2 熟悉任务和数据 ............................................................................................................ 4 1.2 为何选择 Python......................................................................................................................... 4 1.3 scikit-learn .............................................................................................................................. 4 1.4 必要的库和工具 ......................................................................................................................... 5 1.4.1 Jupyter Notebook ............................................................................................................ 6 1.4.2 NumPy ............................................................................................................................ 6 1.4.3 SciPy ............................................................................................................................... 6 1.4.4 matplotlib ..................................................................................................................... 7 1.4.5 pandas ............................................................................................................................. 8 1.4.6 mglearn ........................................................................................................................... 9 1.5 Python 2 与 Python 3 的对比 ..................................................................................................... 9 1.6 本书用到的版本 ....................................................................................................................... 10 1.7 第一个应用:鸢尾花分类 ....................................................................................................... 11 1.7.1 初识数据 ...................................................................................................................... 12 1.7.2 衡量模型是否成功:训练数据与测试数据 .............................................................. 14 1.7.3 要事第一:观察数据 .................................................................................................. 15 1.7.4 构建第一个模型:k 近邻算法 ................................................................................... 16 1.7.5 做出预测 ...................................................................................................................... 17 1.7.6 评估模型 ...................................................................................................................... 18 1.8 小结与展望 ............................................................................................................................... 19 v 看书请加微信 YYAANNGG第 2 章 监督学习 .............................................................................................................................. 21 2.1 分类与回归 ............................................................................................................................... 21 2.2 泛化、过拟合与欠拟合 ........................................................................................................... 22 2.3 监督学习算法 ........................................................................................................................... 24 2.3.1 一些样本数据集 .......................................................................................................... 25 2.3.2 k 近邻 ........................................................................................................................... 28 2.3.3 线性模型 ...................................................................................................................... 35 2.3.4 朴素贝叶斯分类器 ...................................................................................................... 53 2.3.5 决策树 .......................................................................................................................... 54 2.3.6 决策树集成 .................................................................................................................. 64 2.3.7 核支持向量机 .............................................................................................................. 71 2.3.8 神经网络(深度学习) ................................................................................................ 80 2.4 分类器的不确定度估计 ........................................................................................................... 91 2.4.1 决策函数 ...................................................................................................................... 91 2.4.2 预测概率 ...................................................................................................................... 94 2.4.3 多分类问题的不确定度 .............................................................................................. 96 2.5 小结与展望 ............................................................................................................................... 98 第 3 章 无监督学习与预处理 ...................................................................................................... 100 3.1 无监督学习的类型 ................................................................................................................. 100 3.2 无监督学习的挑战 ................................................................................................................. 101 3.3 预处理与缩放 ......................................................................................................................... 101 3.3.1 不同类型的预处理 .................................................................................................... 102 3.3.2 应用数据变换 ............................................................................................................ 102 3.3.3 对训练数据和测试数据进行相同的缩放 ................................................................ 104 3.3.4 预处理对监督学习的作用 ........................................................................................ 106 3.4 降维、特征提取与流形学习 ................................................................................................. 107 3.4.1 主成分分析 ................................................................................................................ 107 3.4.2 非负矩阵分解 ............................................................................................................ 120 3.4.3 用 t-SNE 进行流形学习 ............................................................................................ 126 3.5 聚类 ......................................................................................................................................... 130 3.5.1 k 均值聚类 ................................................................................................................. 130 3.5.2 凝聚聚类 .................................................................................................................... 140 3.5.3 DBSCAN .................................................................................................................... 143 3.5.4 聚类算法的对比与评估 ............................................................................................ 147 3.5.5 聚类方法小结 ............................................................................................................ 159 3.6 小结与展望 ............................................................................................................................. 159 vi | 目录 看书请加微信 YYAANNGG第 4 章 数据表示与特征工程 ...................................................................................................... 161 4.1 分类变量 ................................................................................................................................. 161 4.1.1 One-Hot 编码(虚拟变量) ....................................................................................... 162 4.1.2 数字可以编码分类变量 ............................................................................................ 166 4.2 分箱、离散化、线性模型与树 ............................................................................................. 168 4.3 交互特征与多项式特征 ......................................................................................................... 171 4.4 单变量非线性变换 ................................................................................................................. 178 4.5 自动化特征选择 ..................................................................................................................... 181 4.5.1 单变量统计 ................................................................................................................ 181 4.5.2 基于模型的特征选择 ................................................................................................ 183 4.5.3 迭代特征选择 ............................................................................................................ 184 4.6 利用专家知识 ......................................................................................................................... 185 4.7 小结与展望 ............................................................................................................................. 192 第 5 章 模型评估与改进 .............................................................................................................. 193 5.1 交叉验证 ................................................................................................................................. 194 5.1.1 scikit-learn 中的交叉验证 .................................................................................... 194 5.1.2 交叉验证的优点 ........................................................................................................ 195 5.1.3 分层 k 折交叉验证和其他策略 ................................................................................. 196 5.2 网格搜索 ................................................................................................................................. 200 5.2.1 简单网格搜索 ............................................................................................................ 201 5.2.2 参数过拟合的风险与验证集 .................................................................................... 202 5.2.3 带交叉验证的网格搜索 ............................................................................................ 203 5.3 评估指标与评分 ..................................................................................................................... 213 5.3.1 牢记最终目标 ............................................................................................................ 213 5.3.2 二分类指标 ................................................................................................................ 214 5.3.3 多分类指标 ................................................................................................................ 230 5.3.4 回归指标 .................................................................................................................... 232 5.3.5 在模型选择中使用评估指标 .................................................................................... 232 5.4 小结与展望 ............................................................................................................................. 234 第 6 章 算法链与管道 ................................................................................................................... 236 6.1 用预处理进行参数选择 ......................................................................................................... 237 6.2 构建管道 ................................................................................................................................. 238 6.3 在网格搜索中使用管道 ......................................................................................................... 239 6.4 通用的管道接口 ..................................................................................................................... 242 6.4.1 用 make_pipeline 方便地创建管道 ......................................................................... 243 6.4.2 访问步骤属性 ............................................................................................................ 244 6.4.3 访问网格搜索管道中的属性 .................................................................................... 244 目录 | vii 看书请加微信 YYAANNGG6.5 网格搜索预处理步骤与模型参数 ......................................................................................... 246 6.6 网格搜索选择使用哪个模型 ................................................................................................. 248 6.7 小结与展望 ............................................................................................................................. 249 第 7 章 处理文本数据 ................................................................................................................... 250 7.1 用字符串表示的数据类型 ..................................................................................................... 250 7.2 示例应用:电影评论的情感分析 ......................................................................................... 252 7.3 将文本数据表示为词袋 ......................................................................................................... 254 7.3.1 将词袋应用于玩具数据集 ........................................................................................ 255 7.3.2 将词袋应用于电影评论 ............................................................................................ 256 7.4 停用词 ..................................................................................................................................... 259 7.5 用 tf-idf 缩放数据 .................................................................................................................. 260 7.6 研究模型系数 ......................................................................................................................... 263 7.7 多个单词的词袋(n 元分词) ................................................................................................ 263 7.8 高级分词、词干提取与词形还原 ......................................................................................... 267 7.9 主题建模与文档聚类 ............................................................................................................. 270 7.10 小结与展望 ........................................................................................................................... 277 第 8 章 全书总结 ............................................................................................................................ 278 8.1 处理机器学习问题 ................................................................................................................. 278 8.2 从原型到生产 ......................................................................................................................... 279 8.3 测试生产系统 ......................................................................................................................... 280 8.4 构建你自己的估计器 ............................................................................................................. 280 8.5 下一步怎么走 ......................................................................................................................... 281 8.5.1 理论 ............................................................................................................................ 281 8.5.2 其他机器学习框架和包 ............................................................................................ 281 8.5.3 排序、推荐系统与其他学习类型 ............................................................................ 282 8.5.4 概率建模、推断与概率编程 .................................................................................... 282 8.5.5 神经网络 .................................................................................................................... 283 8.5.6 推广到更大的数据集 ................................................................................................ 283 8.5.7 磨练你的技术 ............................................................................................................ 284 8.6 总结 ......................................................................................................................................... 284
上传时间:2018-07 大小:13.5MB
- 261KB
python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf
2023-06-12python机器学习教程_从零开始掌握Python机器学习:⼗四步 教程 Python 可以说是现在最流⾏的机器学习语⾔,⽽且你也能在⽹上找到⼤量的资源。你现在也在考虑从 Python ⼊门机器学习吗?本教程或 许能帮你成功上⼿,从 0 到 1 掌握 Python 机器学习,⾄于后⾯再从 1 到 100 变成机器学习专家,就要看你⾃⼰的努⼒了。本教程原⽂ 分为两个部分,机器之⼼在本⽂中将其进⾏了整合,原⽂可参阅:7 Steps to Mastering Machine Learning With Python 和 7 More Steps to Mastering Machine Learning With Python。本教程的作者为 KDnuggets 副主编兼数据科学家 Matthew Mayo。 「开始」往往是最难的,尤其是当选择太多的时候,⼀个⼈往往很难下定决定做出选择。本教程的⽬的是帮助⼏乎没有 Python 机器学习背 景的新⼿成长为知识渊博的实践者,⽽且这个过程中仅需要使⽤免费的材料和资源即可。这个⼤纲的主要⽬标是带你了解那些数量繁多的可 ⽤资源。毫⽆疑问,资源确实有很
- 242KB
Python机器学习教程.pdf
2021-09-26Python机器学习教程.pdf
- 129.58MB
Hands-On Reinforcement Learning with Python
2018-11-03EPUB格式,包含配套代码。压缩包里还包括Fluent Python,PDF和EPUB格式;Python Master the Art of Design Patterns,PDF格式。 What you will learn Understand the basics of RL methods, algorithms, and elements Train an agent to walk using OpenAI Gym and Tensorflow Understand Markov decision process, Bellman's optimality, and temporal difference (TD) learning Solve multi-armed bandit problems using various algorithms Master deep learning algorithms, such as RNN, LSTM, and CNN with applications Build intelligent agents using the DRQN algorithm to play the Doom game Teach agents to play the Lunar Lander game using DDPG Train an agent to win a car racing game using dueling DQN
- 454KB
《Python机器学习基础教程》学习记录(一)
2020-12-21开篇 为了提升自己,准备学习《Python机器学习基础教程》作者: [德]安德里亚斯·穆勒 / [美]莎拉·吉多,译者: 张亮 ;写此博客,用作记录书中的代码,学习心得等。 第一章 1.4.4 matplotlib matplotlib 是Python 主要的科学绘图库,其功能为生成可发布的可视化内容,如折线图、直方图、散点图等。将数据及各种分析可视化,可以让你产生深刻的理解,而我们将使用 matplotlib完成所有的可视化内容。 Jupyter Notebook 是可以在浏览器中运行代码的交互环境。这个工具在探索性数据分析方 面非常有用,在数据科学家中广为使用。虽然 Jupy
- 15KB
Python机器学习基础教程.docx
2023-09-13Python机器学习基础教程.docx
- 76B
anaconda+pycharm+python基础+进阶+机器学习+深度学习+数据库等学习教程
2020-10-21anaconda+pycharm+python基础+进阶+机器学习+深度学习+数据库等学习教程
- 1.62MB
Python机器学习实践指南.zip_python_python 教程_python 机器学习_python机器学习_机器学习
2022-07-15python编程资料,实用,可自行学习.除此之外还可学习机器学习算法。
- 10.69MB
[B]Python机器学习基础教程1
2022-08-03前言目前,从医疗诊断和治疗到在社交网络上寻找好友,许多商业应用和研究项目都离不开机器学习。许多人以为,只有大公司的大型研究团队才能用到机器学习。在本书中,我们要
- 5KB
Python机器学习算法视频教程
2018-05-26视频频学习资料;本资料仅用于学习,请查看后24小时之内删除。算法的示例和代码实现(Python)、算法的参数调试、机器学习算法的应用场景
- 2.48MB
Python机器学习(代码+数据)
2021-05-11Python机器学习(代码+数据)
- 611KB
Python机器学习SVM作业源码+实验报告,将经典数据集Iris鸢尾花的数据样本实现SVM分类源码+实验报告
2023-06-30Python机器学习SVM作业源码+实验报告,将经典数据集Iris鸢尾花的数据样本实现SVM分类源码+实验报告 使用python 3.9的IDLE作为编程环境,编程语言为python,利用模块如sklearn、numpy等实现需要的功能 1.sklearn ...
- 20.11MB
Python机器学习基础源码.zip
2020-03-11Python机器学习源码,直接复制粘贴就好
- 28.29MB
[图灵程序设计丛书].Python机器学习基础教程1
2022-08-03第1章引言11.1 为何选择机器学习 11.1.1 机器学习能够解决的问题 21.1.2 熟悉任务和数据 41.4 必要的库和工具 51.6 本书用到的版本 1
- 2.77MB
Python机器学习实践-测试驱动的开发方法 - 2018_python学习_python机器学习_python_machine
2021-09-11Python机器学习实例,机器学习基础实例教程
- 32.0MB
python基础教程第二版+源代码
2019-01-24python基础教程第二版 + 教材源代码 影印版 但是很清晰
- 47.51MB
Python3机器学习实战教程.zip
2021-01-24史诗级干货,机器学习实战+Python3实现
- 59KB
Python机器学习教程.docx
2022-04-19Python机器学习教程
- 26.33MB
Python入门基础教程全套+小白速成+学不会来找我!.ppt
2021-08-02Python入门基础教程全套+小白速成+学不会来找我,拿去用吧
- 927KB
OpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdf
2022-06-24OpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdfOpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdfOpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdfOpenCV计算机...
- 6.77MB
基于Python+pytorch的图像处理+附完整代码图像处理,能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作
2024-04-17Python+PyTorch:图像处理界的“瑞士军刀” 在图像处理这个充满魔法的世界里,Python和PyTorch这对黄金搭档,就像一位技艺高超的魔法师和一把无所不能的“瑞士军刀”,总能轻松解决各种看似棘手的难题。它们以高效、灵活和强大的特性,引领着图像处理技术的发展潮流,让无数开发者为之倾倒。Python,这位优雅的魔法师,以其简洁易懂的语法和丰富的库资源,赢得了广大开发者喜爱。无论是数据处理、机器学习还是深度学习,Python都能轻松应对,展现出其无与伦比的魅力。在图像处理领域,Python更是如鱼得水,通过OpenCV、PIL等库,能够轻松实现图像的读取、显示、裁剪、缩放、滤波等操作,让图像在指尖起舞。而PyTorch,这把图像处理界的“瑞士军刀”,则以其灵活性和易用性,成为深度学习领域的翘楚。它拥有强大的自动求导功能,能够轻松构建和训练复杂的神经网络模型。在图像处理中,PyTorch能够助力开发者构建出各种高效的图像识别、分割、生成等模型,让图像焕发出新的生机。想象一下,当你掌握了Python和PyTorch这对黄金搭档,就如同掌握了一把魔法杖和一把瑞士军刀。必然大可作为
- 29.74MB
python大作业 含爬虫、数据可视化、地图、报告、及源码(2016-2021全国各地区粮食产量).rar
2022-05-01(含源码及报告)本程序分析了自2016年到2021年(外加)每年我国原油加工的产量,并且分析了2020年全国各地区原油加工量等,含饼状图,柱状图,折线图,数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运行。文件含6个excel表,若干个csv文件以及一个名字为render的html文件(需要用浏览器打开),直观的数据处理部分是图片以及html文件,可在地图中显示,数据处理的是excel文件。不懂可以扫文件中二维码在QQ里面问。
- 0B
《点燃我温暖你》中李峋的同款爱心代码
2022-11-08python做的《点燃我温暖你》中李峋的同款爱心代码,最还原的
- 3.40MB
Python金融量化的高级库:TA-Lib-0.4.24(包含python3.7、3.8、3.9、3.10的32位和64位版本)
2023-08-02TA-Lib(Technical Analysis Library, 即技术分析库)是Python金融量化的高级库,涵盖了150多种股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等。但很多人安装指标计算ta-lib库就总报错,就可以在这里找到包下载后安装。 文件举例:TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 命名解释:包名-版本号-cp37代表适用于python3.7版本-win代表windows平台-amd64表示64位版本(与python版本要一致) 假定文件下载到d盘根目录,使用如下命令进行安装: pip install d:\TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 原文链接:https://blog.csdn.net/popboy29/article/details/126140862 建议使用360压缩进行解压。
- 182KB
第十五届蓝桥杯大赛软件赛省赛-PythonB组题目
2024-04-13您正在寻找的是第十五届蓝桥杯大赛软件赛省赛Python B组的题目全集。蓝桥杯大赛作为国内知名的计算机程序设计竞赛,一直以来都以其高水平的题目和严格的评选标准而备受瞩目。本次大赛的Python B组题目更是涵盖了众多编程领域的知识点,无论是算法设计、数据结构还是编程技巧,都考验了参赛者的深厚实力。 这份题目全集以PDF格式呈现,清晰易读,方便您随时查阅和学习。每一道题目都经过精心设计和筛选,旨在考察参赛者的编程思维、问题解决能力以及创新能力。无论您是正在准备参赛的选手,还是对编程感兴趣的爱好者,这份题目集都将为您提供一个极好的学习和挑战的平台。 通过这份题目集,您可以深入了解蓝桥杯大赛的出题风格和难度,熟悉各种编程问题的解题思路和方法,从而提升自己的编程能力和竞技水平。此外,这些题目也是极好的练习材料,可以帮助您巩固和拓展编程知识,提高解决实际问题的能力。 适用人群: 蓝桥杯大赛参赛选手 计算机专业学生 编程爱好者 对算法和数据结构有兴趣的学习者 资源特点: 高质量的题目设计,涵盖广泛的知识点 清晰易读的PDF格式,方便查阅和学习 提供解题思路和方法,有助于提升编程能力
- 6.40MB
大麦网抢票脚本【Python脚本】
2023-09-17Python脚本,使用Selenium 模拟浏览器操作。 在使用 Chrome 浏览器,用户可以使用鼠标滑动、按键点击以及键盘输入,作为信号输入设备向浏览器传达指令,浏览器收到指令后执行渲染。 这里提到的 Selenium WebDriver 是对浏览器提供的原生 API 进行封装,使用这套 API 可以操控浏览器的开启、关闭,打开网页,操作界面元素,控制 Cookie。简单说就是,可以通过写代码的方式来自动实现用户鼠标和键盘信号的输入。 由此实现模拟人为操作进行登录、验证、刷新网页以及点击购票等操作。
- 5.83MB
Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
2024-01-16Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
- 258.41MB
YOLOv8-火焰识别(火焰数据集+代码+GUI界面+内置训练好的模型文件)
2023-11-15教程请参考:https://blog.csdn.net/Little_Carter/article/details/131387425 欢迎浏览我的最新资源,这个全面的资源是为了帮助研究人员和开发者在火灾预防和安全监控领域取得突破而设计的。本资源包含以下几个关键部分: 1、火焰数据集:精心策划和注释的高质量火焰图像集,覆盖了不同类型和大小的火焰场景。这个数据集对于训练和测试火焰检测算法至关重要。 2、代码:完整的YOLOv8算法实现代码,针对火焰检测进行了优化。代码清晰、注释详细,易于理解和定制。 3、GUI界面:为了更方便地使用和展示火焰识别模型,我复现了一个直观的图形用户界面(GUI)。这个界面不仅易于操作,还可以实时展示检测结果。 4、内置训练好的模型文件:为了让用户能够即刻使用该工具,我提供了一个已经在火焰数据集上训练好的YOLOv8模型。这个模型经过精心训练,具有高精度和良好的泛化能力。 此外,我还提供了详细的安装和使用指南,帮助您轻松地部署和运行这个系统。无论您是在进行学术研究,还是在开发商业应用,这个资源都将是您不可或缺的工具。期待您的下载和反馈!
- 29.89MB
人脸识别系统OpenCV+dlib+python(含数据库)Pyqt5界面设计 项目源码 毕业设计
2023-10-20一、项目主要技术 Python语言、dlib、OpenCV、Pyqt5界面设计、sqlite3数据库 本系统使用dlib作为人脸识别工具,dlib提供一个方法可将人脸图片数据映射到128维度的空间向量,如果两张图片来源于同一个人,那么两个图片所映射的空间向量距离就很近,否则就会很远。因此,可以通过提取图片并映射到128维空间向量再度量它们的欧氏距离是否足够小来判定是否为同一个人。 二、方法实现、实现步骤 1、实例化人脸检测模型、人脸关键点检测模型、人脸识别模型 2、电脑摄像头设备加载一对图片 3、分别获取图片中的人脸图片所映射的空间向量,即人脸特征值 4、计算特征向量欧氏距离,根据阈值判断是否为同一个人 dlib人脸特征检测原理 1、提取特征点:例: 2、将特征值保存 3、计算特征数据集的欧氏距离作对比,当误差小于一定阙值就判定为同一人。 其他学习项目: OpenCV+dlib人脸识别门禁管理系统Python语言、dlib、OpenCV、Pyqt5、sqlite3数据库 OpenCV+dlib人脸识别考勤管理系统Python语言、dlib、OpenCV