零起点Python机器学习快速入门
电子书推荐
-
Python机器学习基础教程 评分:
Andereas Muller的Introduction to Machine Learning with Python的中文版 前言..........................................................................................................................................................ix 第 1 章 引言.........................................................................................................................................1 1.1 为何选择机器学习.....................................................................................................................1 1.1.1 机器学习能够解决的问题 ............................................................................................2 1.1.2 熟悉任务和数据 ............................................................................................................4 1.2 为何选择 Python.........................................................................................................................4 1.3 scikit-learn..............................................................................................................................4 1.4 必要的库和工具.........................................................................................................................5 1.4.1 Jupyter Notebook............................................................................................................6 1.4.2 NumPy ............................................................................................................................6 1.4.3 SciPy ...............................................................................................................................6 1.4.4 matplotlib .....................................................................................................................7 1.4.5 pandas.............................................................................................................................8 1.4.6 mglearn...........................................................................................................................9 1.5 Python 2 与 Python 3 的对比 .....................................................................................................9 1.6 本书用到的版本.......................................................................................................................10 1.7 第一个应用:鸢尾花分类.......................................................................................................11 1.7.1 初识数据 ......................................................................................................................12 1.7.2 衡量模型是否成功:训练数据与测试数据 ..............................................................14 1.7.3 要事第一:观察数据 ..................................................................................................15 1.7.4 构建第一个模型: k 近邻算法 ...................................................................................16 1.7.5 做出预测 ......................................................................................................................17 1.7.6 评估模型 ......................................................................................................................18 1.8 小结与展望...............................................................................................................................19vi | 目录 第 2 章 监督学习..............................................................................................................................21 2.1 分类与回归...............................................................................................................................21 2.2 泛化、过拟合与欠拟合...........................................................................................................22 2.3 监督学习算法...........................................................................................................................24 2.3.1 一些样本数据集 ..........................................................................................................25 2.3.2 k 近邻 ...........................................................................................................................28 2.3.3 线性模型 ......................................................................................................................35 2.3.4 朴素贝叶斯分类器 ......................................................................................................53 2.3.5 决策树 ..........................................................................................................................54 2.3.6 决策树集成 ..................................................................................................................64 2.3.7 核支持向量机 ..............................................................................................................71 2.3.8 神经网络(深度学习)................................................................................................80 2.4 分类器的不确定度估计...........................................................................................................91 2.4.1 决策函数 ......................................................................................................................91 2.4.2 预测概率 ......................................................................................................................94 2.4.3 多分类问题的不确定度 ..............................................................................................96 2.5 小结与展望...............................................................................................................................98 第 3 章 无监督学习与预处理......................................................................................................100 3.1 无监督学习的类型.................................................................................................................100 3.2 无监督学习的挑战.................................................................................................................101 3.3 预处理与缩放.........................................................................................................................101 3.3.1 不同类型的预处理 ....................................................................................................102 3.3.2 应用数据变换 ............................................................................................................102 3.3.3 对训练数据和测试数据进行相同的缩放 ................................................................104 3.3.4 预处理对监督学习的作用 ........................................................................................106 3.4 降维、特征提取与流形学习.................................................................................................107 3.4.1 主成分分析 ................................................................................................................107 3.4.2 非负矩阵分解 ............................................................................................................120 3.4.3 用 t-SNE 进行流形学习 ............................................................................................126 3.5 聚类.........................................................................................................................................130 3.5.1 k 均值聚类 .................................................................................................................130 3.5.2 凝聚聚类 ....................................................................................................................140 3.5.3 DBSCAN ....................................................................................................................143 3.5.4 聚类算法的对比与评估 ............................................................................................147 3.5.5 聚类方法小结 ............................................................................................................159 3.6 小结与展望.............................................................................................................................159目录 | vii 第 4 章 数据表示与特征工程......................................................................................................161 4.1 分类变量.................................................................................................................................161 4.1.1 One-Hot 编码(虚拟变量).......................................................................................162 4.1.2 数字可以编码分类变量 ............................................................................................166 4.2 分箱、离散化、线性模型与树.............................................................................................168 4.3 交互特征与多项式特征.........................................................................................................171 4.4 单变量非线性变换.................................................................................................................178 4.5 自动化特征选择.....................................................................................................................181 4.5.1 单变量统计 ................................................................................................................181 4.5.2 基于模型的特征选择 ................................................................................................183 4.5.3 迭代特征选择 ............................................................................................................184 4.6 利用专家知识.........................................................................................................................185 4.7 小结与展望.............................................................................................................................192 第 5 章 模型评估与改进 ..............................................................................................................193 5.1 交叉验证.................................................................................................................................194 5.1.1 scikit-learn 中的交叉验证 ....................................................................................194 5.1.2 交叉验证的优点 ........................................................................................................195 5.1.3 分层 k 折交叉验证和其他策略.................................................................................196 5.2 网格搜索.................................................................................................................................200 5.2.1 简单网格搜索 ............................................................................................................201 5.2.2 参数过拟合的风险与验证集 ....................................................................................202 5.2.3 带交叉验证的网格搜索 ............................................................................................203 5.3 评估指标与评分.....................................................................................................................213 5.3.1 牢记最终目标 ............................................................................................................213 5.3.2 二分类指标 ................................................................................................................214 5.3.3 多分类指标 ................................................................................................................230 5.3.4 回归指标 ....................................................................................................................232 5.3.5 在模型选择中使用评估指标 ....................................................................................232 5.4 小结与展望.............................................................................................................................234 第 6 章 算法链与管道...................................................................................................................236 6.1 用预处理进行参数选择.........................................................................................................237 6.2 构建管道.................................................................................................................................238 6.3 在网格搜索中使用管道.........................................................................................................239 6.4 通用的管道接口.....................................................................................................................242 6.4.1 用 make_pipeline 方便地创建管道 .........................................................................243 6.4.2 访问步骤属性 ............................................................................................................244 6.4.3 访问网格搜索管道中的属性 ....................................................................................244viii | 目录 6.5 网格搜索预处理步骤与模型参数.........................................................................................246 6.6 网格搜索选择使用哪个模型.................................................................................................248 6.7 小结与展望.............................................................................................................................249 第 7 章 处理文本数据...................................................................................................................250 7.1 用字符串表示的数据类型.....................................................................................................250 7.2 示例应用:电影评论的情感分析.........................................................................................252 7.3 将文本数据表示为词袋.........................................................................................................254 7.3.1 将词袋应用于玩具数据集 ........................................................................................255 7.3.2 将词袋应用于电影评论 ............................................................................................256 7.4 停用词.....................................................................................................................................259 7.5 用 tf-idf 缩放数据..................................................................................................................260 7.6 研究模型系数.........................................................................................................................263 7.7 多个单词的词袋(n 元分词)................................................................................................263 7.8 高级分词、词干提取与词形还原.........................................................................................267 7.9 主题建模与文档聚类.............................................................................................................270 7.10 小结与展望...........................................................................................................................277 第 8 章 全书总结............................................................................................................................278 8.1 处理机器学习问题.................................................................................................................278 8.2 从原型到生产.........................................................................................................................279 8.3 测试生产系统.........................................................................................................................280 8.4 构建你自己的估计器.............................................................................................................280 8.5 下一步怎么走.........................................................................................................................281 8.5.1 理论 ............................................................................................................................281 8.5.2 其他机器学习框架和包 ............................................................................................281 8.5.3 排序、推荐系统与其他学习类型 ............................................................................282 8.5.4 概率建模、推断与概率编程 ....................................................................................282 8.5.5 神经网络 ....................................................................................................................283 8.5.6 推广到更大的数据集 ................................................................................................283 8.5.7 磨练你的技术 ............................................................................................................284 8.6 总结.........................................................................................................................................284 关于作者..............................................................................................................................................285 关于封面..............................................................................................................................................285
上传时间:2019-06 大小:13.38MB
- 15KB
Python机器学习基础教程.docx
2023-09-13Python机器学习基础教程.docx
- 261KB
python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf
2023-06-12python机器学习教程_从零开始掌握Python机器学习:⼗四步 教程 Python 可以说是现在最流⾏的机器学习语⾔,⽽且你也能在⽹上找到⼤量的资源。你现在也在考虑从 Python ⼊门机器学习吗?本教程或 许能帮你成功上⼿,...
- 10.69MB
[B]Python机器学习基础教程1
2022-08-03前言目前,从医疗诊断和治疗到在社交网络上寻找好友,许多商业应用和研究项目都离不开机器学习。许多人以为,只有大公司的大型研究团队才能用到机器学习。在本书中,我们要
- 28.29MB
[图灵程序设计丛书].Python机器学习基础教程1
2022-08-03第1章引言11.1 为何选择机器学习 11.1.1 机器学习能够解决的问题 21.1.2 熟悉任务和数据 41.4 必要的库和工具 51.6 本书用到的版本 1
- 268KB
《Python机器学习基础教程》API简介.pdf
2023-06-13《Python机器学习基础教程》API简介 ⽬录 机器学习初步⼊门,感觉和以前的数学建模那⼀套很像,回归,分类,聚类,效果的可视化。只是从MATLAB换成了Python。记录⼀下在 书中⽤到的api,⼀是不想每次都去官⽹查, ⼆...
- 459KB
《Python机器学习基础教程》学习记录(四).pdf
2023-06-13《Python机器学习基础教程》学习记录(四) 第2章 监督学习 监督学习是最常⽤也是最成功的机器学习类型之⼀,每当想要根据给定输⼊预测某个结果,并且还有输⼊ / 输出对的⽰例时,都应该使 ⽤监督学习。 2.1 分类与...
- 454KB
《Python机器学习基础教程》学习记录(一)
2020-12-21为了提升自己,准备学习《Python机器学习基础教程》作者: [德]安德里亚斯·穆勒 / [美]莎拉·吉多,译者: 张亮 ;写此博客,用作记录书中的代码,学习心得等。 第一章 1.4.4 matplotlib matplotlib 是...
- 20.11MB
Python机器学习基础源码.zip
2020-03-11Python机器学习源码,直接复制粘贴就好
- 2.36MB
Python学习教程-机器学习基础教程中文
2023-03-10Python机器学习基础教程中文Notebook 基本上就是《Python机器学习基础教程》的内容搬运为jupyter notebook ,便于记录和学习。 快速开始 在含有.ipynb 文件的目录下打开命令行 敲入jupyter notebook(前提是安装了,...
- 30.55MB
Python基础教程书本示例源代码
2017-12-21资源里包括了Python基础教程书本当中所有示例的源代码和Python基础教程(第二版修订版)高清PDF文档
- 2.77MB
Python机器学习实践-测试驱动的开发方法 - 2018_python学习_python机器学习_python_machine
2021-09-11Python机器学习实例,机器学习基础实例教程
- 28.25MB
[Python机器学习基础教程].[Andreas C. Müller&Sarah Guido]1
2022-08-03第1章引言11.1 为何选择机器学习 11.1.1 机器学习能够解决的问题 21.1.2 熟悉任务和数据 41.4 必要的库和工具 51.6 本书用到的版本 1
- 73KB
最新版学习笔记—Python机器学习基础教程(2)k近邻(K-NN)算法—附完整代码
2021-01-20正在学习书上的内容,书上有部分代码没有给全,注解不详细,且随着版本原因出现的问题有所调整,所以写下学习笔记供大家参考。...安装有机器学习库sklearn、mglearn、matplotlib、numpy,若没有用pip安装
- 1.54MB
Python机器学习实验 - 决策树-1模型评估与选择
2023-08-18一、实验目的 学习如何用Python语言编写机器学习中模型验证与性能度量的程序 ...机器学习实验教材《Python机器学习基础教程》第五章的5.1节194-200页和5.3.2节中214-228页。 注意:忽略mglearn.plots的相关部分。
- 6.16MB
python基础入门课件
2018-05-21python学习python学习python学习python学习python学习python学习python学习python学习
- 927KB
OpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdf
2022-06-24OpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdfOpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdfOpenCV计算机视觉基础教程(Python版)课件10机器学习和深度学习.pdfOpenCV计算机...
- 126B
Python机器学习和算法高级版视频教程
2019-07-22资源名称:Python机器学习和算法高级版视频教程教程目录:【】00、课程介绍【】01、机器学习的数学基础1 - 数学分析【】02、数学基础2 - 数理统计与参数估计【】03、数学基础3 - 矩阵和线性代数【】04、数学基础4 - ...
- 2.77MB
Python机器学习实践-测试驱动的开发方法 - 2018,案例驱动式Python基础与应用,Python
2021-09-11Python机器学习实例,机器学习基础实例教程
- 180.66MB
利用python机器学习教程入门1
2023-03-13利用python机器学习教程入门1,以科比生涯为数据依据模型,建立python机器学习算法,掌握python机器学习开发基础
- 6.77MB
基于Python+pytorch的图像处理+附完整代码图像处理,能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作
2024-04-17Python+PyTorch:图像处理界的“瑞士军刀” 在图像处理这个充满魔法的世界里,Python和PyTorch这对黄金搭档,就像一位技艺高超的魔法师和一把无所不能的“瑞士军刀”,总能轻松解决各种看似棘手的难题。它们以高效、灵活和强大的特性,引领着图像处理技术的发展潮流,让无数开发者为之倾倒。Python,这位优雅的魔法师,以其简洁易懂的语法和丰富的库资源,赢得了广大开发者喜爱。无论是数据处理、机器学习还是深度学习,Python都能轻松应对,展现出其无与伦比的魅力。在图像处理领域,Python更是如鱼得水,通过OpenCV、PIL等库,能够轻松实现图像的读取、显示、裁剪、缩放、滤波等操作,让图像在指尖起舞。而PyTorch,这把图像处理界的“瑞士军刀”,则以其灵活性和易用性,成为深度学习领域的翘楚。它拥有强大的自动求导功能,能够轻松构建和训练复杂的神经网络模型。在图像处理中,PyTorch能够助力开发者构建出各种高效的图像识别、分割、生成等模型,让图像焕发出新的生机。想象一下,当你掌握了Python和PyTorch这对黄金搭档,就如同掌握了一把魔法杖和一把瑞士军刀。必然大可作为
- 29.74MB
python大作业 含爬虫、数据可视化、地图、报告、及源码(2016-2021全国各地区粮食产量).rar
2022-05-01(含源码及报告)本程序分析了自2016年到2021年(外加)每年我国原油加工的产量,并且分析了2020年全国各地区原油加工量等,含饼状图,柱状图,折线图,数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运行。文件含6个excel表,若干个csv文件以及一个名字为render的html文件(需要用浏览器打开),直观的数据处理部分是图片以及html文件,可在地图中显示,数据处理的是excel文件。不懂可以扫文件中二维码在QQ里面问。
- 0B
《点燃我温暖你》中李峋的同款爱心代码
2022-11-08python做的《点燃我温暖你》中李峋的同款爱心代码,最还原的
- 182KB
第十五届蓝桥杯大赛软件赛省赛-PythonB组题目
2024-04-13您正在寻找的是第十五届蓝桥杯大赛软件赛省赛Python B组的题目全集。蓝桥杯大赛作为国内知名的计算机程序设计竞赛,一直以来都以其高水平的题目和严格的评选标准而备受瞩目。本次大赛的Python B组题目更是涵盖了众多编程领域的知识点,无论是算法设计、数据结构还是编程技巧,都考验了参赛者的深厚实力。 这份题目全集以PDF格式呈现,清晰易读,方便您随时查阅和学习。每一道题目都经过精心设计和筛选,旨在考察参赛者的编程思维、问题解决能力以及创新能力。无论您是正在准备参赛的选手,还是对编程感兴趣的爱好者,这份题目集都将为您提供一个极好的学习和挑战的平台。 通过这份题目集,您可以深入了解蓝桥杯大赛的出题风格和难度,熟悉各种编程问题的解题思路和方法,从而提升自己的编程能力和竞技水平。此外,这些题目也是极好的练习材料,可以帮助您巩固和拓展编程知识,提高解决实际问题的能力。 适用人群: 蓝桥杯大赛参赛选手 计算机专业学生 编程爱好者 对算法和数据结构有兴趣的学习者 资源特点: 高质量的题目设计,涵盖广泛的知识点 清晰易读的PDF格式,方便查阅和学习 提供解题思路和方法,有助于提升编程能力
- 3.40MB
Python金融量化的高级库:TA-Lib-0.4.24(包含python3.7、3.8、3.9、3.10的32位和64位版本)
2023-08-02TA-Lib(Technical Analysis Library, 即技术分析库)是Python金融量化的高级库,涵盖了150多种股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等。但很多人安装指标计算ta-lib库就总报错,就可以在这里找到包下载后安装。 文件举例:TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 命名解释:包名-版本号-cp37代表适用于python3.7版本-win代表windows平台-amd64表示64位版本(与python版本要一致) 假定文件下载到d盘根目录,使用如下命令进行安装: pip install d:\TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 原文链接:https://blog.csdn.net/popboy29/article/details/126140862 建议使用360压缩进行解压。
- 6.40MB
大麦网抢票脚本【Python脚本】
2023-09-17Python脚本,使用Selenium 模拟浏览器操作。 在使用 Chrome 浏览器,用户可以使用鼠标滑动、按键点击以及键盘输入,作为信号输入设备向浏览器传达指令,浏览器收到指令后执行渲染。 这里提到的 Selenium WebDriver 是对浏览器提供的原生 API 进行封装,使用这套 API 可以操控浏览器的开启、关闭,打开网页,操作界面元素,控制 Cookie。简单说就是,可以通过写代码的方式来自动实现用户鼠标和键盘信号的输入。 由此实现模拟人为操作进行登录、验证、刷新网页以及点击购票等操作。
- 5.83MB
Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
2024-01-16Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
- 258.41MB
YOLOv8-火焰识别(火焰数据集+代码+GUI界面+内置训练好的模型文件)
2023-11-15教程请参考:https://blog.csdn.net/Little_Carter/article/details/131387425 欢迎浏览我的最新资源,这个全面的资源是为了帮助研究人员和开发者在火灾预防和安全监控领域取得突破而设计的。本资源包含以下几个关键部分: 1、火焰数据集:精心策划和注释的高质量火焰图像集,覆盖了不同类型和大小的火焰场景。这个数据集对于训练和测试火焰检测算法至关重要。 2、代码:完整的YOLOv8算法实现代码,针对火焰检测进行了优化。代码清晰、注释详细,易于理解和定制。 3、GUI界面:为了更方便地使用和展示火焰识别模型,我复现了一个直观的图形用户界面(GUI)。这个界面不仅易于操作,还可以实时展示检测结果。 4、内置训练好的模型文件:为了让用户能够即刻使用该工具,我提供了一个已经在火焰数据集上训练好的YOLOv8模型。这个模型经过精心训练,具有高精度和良好的泛化能力。 此外,我还提供了详细的安装和使用指南,帮助您轻松地部署和运行这个系统。无论您是在进行学术研究,还是在开发商业应用,这个资源都将是您不可或缺的工具。期待您的下载和反馈!
- 29.89MB
人脸识别系统OpenCV+dlib+python(含数据库)Pyqt5界面设计 项目源码 毕业设计
2023-10-20一、项目主要技术 Python语言、dlib、OpenCV、Pyqt5界面设计、sqlite3数据库 本系统使用dlib作为人脸识别工具,dlib提供一个方法可将人脸图片数据映射到128维度的空间向量,如果两张图片来源于同一个人,那么两个图片所映射的空间向量距离就很近,否则就会很远。因此,可以通过提取图片并映射到128维空间向量再度量它们的欧氏距离是否足够小来判定是否为同一个人。 二、方法实现、实现步骤 1、实例化人脸检测模型、人脸关键点检测模型、人脸识别模型 2、电脑摄像头设备加载一对图片 3、分别获取图片中的人脸图片所映射的空间向量,即人脸特征值 4、计算特征向量欧氏距离,根据阈值判断是否为同一个人 dlib人脸特征检测原理 1、提取特征点:例: 2、将特征值保存 3、计算特征数据集的欧氏距离作对比,当误差小于一定阙值就判定为同一人。 其他学习项目: OpenCV+dlib人脸识别门禁管理系统Python语言、dlib、OpenCV、Pyqt5、sqlite3数据库 OpenCV+dlib人脸识别考勤管理系统Python语言、dlib、OpenCV
- 508.88MB
Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料
2020-12-27Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料
- 22.34MB
Python学习笔记(干货) 中文PDF完整版.pdf
2023-05-231、Python环境搭建 1.1 Python简介 1.2 Python语言的发展历程 1.3 Python语言的主要特点 1.4 Python应用场景 1.5 Python环境搭建 1.6 第一个Python程序 1.7 集成开发工具 2、Python语法基础 2.1 Python中的输入输出函数 2.2 Python中的注释 2.3 Python中的变量 3、Python中的基本数据类型 3.1 整型-int 3.2 浮点型-float 3.3 布尔类型-bool 3.4 字符串类型-str 4、Python中的常见运算符 4.1 算术运算符 4.2 关系运算符 4.3 逻辑运算符 4.4 位运算符 4.5 成员运算符 4.6 身份运算符 5、Python中的分支结构 5.1 单向分支-if语句 5.2 双向分支-if 5.3 多分支-if 5.4 分支结构的嵌套 5.5 条件表达式 6、Python中的循环结构 6.1 while循环 6.2 for循环 6.3 循环结构嵌套