利用Python进行数据分析(原书第2版)
作者:Wes McKinney
出版社:机械工业出版社
ISBN:9787111603702
VIP会员免费
(仅需0.8元/天)
¥ 60.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
-
python数据分析随书代码 评分:
python数据分析/(印尼)伊德里斯(Idris.I.)著,韩波译。 资源包括所有章节的示例代码。需要用到python2和pip。 编辑推荐 实用的Python开源模块的大集合; 简单易懂、示例丰富的数据分析教程; 掌握数据可视化、机器学习等高端主题; 新手变身数据分析专家的上好读本; 媒体推荐 本书从一系列开源的Python模块讲起,介绍了很多实用的有关数据检索、清晰、操作、可视化等知识。同时,还涉及信号处理、预测性分析、机器学习等高端主题。非常适合想要深入学习并使用Python进行数据分析的读者,无论是新手还是有一定Python使用基础的读者,都将快速成为一名数据分析专家。 作者简介 Ivan Idris,实验物理学硕士,学位论文侧重于应用计算机科学。毕业后,他曾经效力于多家公司,从事Java开发、数据仓库开发以及QA分析等方面的工作;目前,他的兴趣主要集中在商业智能、大数据和云计算等专业领域。 Ivan Idris以编写简洁可测试的程序代码以及撰写有趣的技术文章为乐,同时也是Packt出版社NumPy Beginner's Guide-Second Edition、NumPy Cookbook和Learning NumPy Array等书籍的作者。读者可以访问ivanidris.net获取更多关于他的信息。 目录 目录 第 1章 Python程序库入门 1 1.1 本书用到的软件 2 1.1.1 软件的安装和设置 2 1.1.2 Windows平台 2 1.1.3 Linux平台 3 1.1.4 Mac OS X平台 4 1.2 从源代码安装NumPy、SciPy、matplotlib和IPython 6 1.3 用setuptools安装 7 1.4 NumPy数组 7 1.5 一个简单的应用 8 1.6 将IPython用作shell 11 1.7 学习手册页 13 1.8 IPython notebook 14 1.9 从何处寻求帮助和参考资料 14 1.10 小结 15 第 2章 NumPy数组 16 2.1 NumPy数组对象 16 2.2 创建多维数组 18 2.3 选择NumPy数组元素 18 2.4 NumPy的数值类型 19 2.4.1 数据类型对象 21 2.4.2 字符码 21 2.4.3 Dtype构造函数 22 2.4.4 dtype属性 23 2.5 一维数组的切片与索引 23 2.6 处理数组形状 24 2.6.1 堆叠数组 27 2.6.2 拆分NumPy数组 30 2.6.3 NumPy数组的属性 33 2.6.4 数组的转换 39 2.7 创建数组的视图和拷贝 40 2.8 花式索引 41 2.9 基于位置列表的索引方法 43 2.10 用布尔型变量索引NumPy数组 44 2.11 NumPy数组的广播 46 2.12 小结 49 第3章 统计学与线性代数 50 3.1 Numpy和Scipy模块 50 3.2 用NumPy进行简单的描述性统计计算 55 3.3 用NumPy进行线性代数运算 57 3.3.1 用NumPy求矩阵的逆 57 3.3.2 用NumPy解线性方程组 59 3.4 用NumPy计算特征值和特征向量 61 3.5 NumPy随机数 63 3.5.1 用二项式分布进行博弈 63 3.5.2 正态分布采样 66 3.5.3 用SciPy进行正态检验 67 3.6 创建掩码式NumPy数组 70 3.7 小结 75 第4章 pandas入门 76 4.1 pandas的安装与概览 77 4.2 pandas数据结构之DataFrame 78 4.3 pandas数据结构之Series 81 4.4 利用pandas查询数据 85 4.5 利用pandas的DataFrame进行统计计算 89 4.6 利用pandas的DataFrame实现数据聚合 91 4.7 DataFrame的串联与附加操作 95 4.8 连接DataFrames 96 4.9 处理缺失数据问题 99 4.10 处理日期数据 102 4.11 数据透视表 106 4.12 访问远程数据 107 4.13 小结 109 第5章 数据的检索、加工与存储 110 5.1 利用NumPy和pandas对CSV文件进行写操作 110 5.2 NumPy.npy与pandas DataFrame 112 5.3 使用PyTables存储数据 115 5.4 Pandas DataFrame与HDF5仓库之间的读写操作 118 5.5 使用pandas读写Excel文件 120 5.6 使用REST Web服务和JSON 123 5.7 使用pandas读写JSON 124 5.8 解析RSS和Atom订阅 126 5.9 使用Beautiful Soup解析HTML 127 5.10 小结 134 第6章 数据可视化 136 6.1 matplotlib的子库 137 6.2 matplotlib绘图入门 137 6.3 对数图 139 6.4 散点图 141 6.5 图例和注解 143 6.6 三维图 145 6.7 pandas绘图 148 6.8 时滞图 150 6.9 自相关图 151 6.10 Plot.ly 153 6.11 小结 155 第7章 信号处理与时间序列 156 7.1 statsmodels子库 157 7.2 移动平均值 157 7.3 窗口函数 159 7.4 协整的定义 161 7.5 自相关 164 7.6 自回归模型 166 7.7 ARMA模型 170 7.8 生成周期信号 172 7.9 傅里叶分析 174 7.10 谱分析 177 7.11 滤波 177 7.12 小结 179 第8章 应用数据库 180 8.1 基于sqlite3的轻量级访问 181 8.2 通过pandas访问数据库 183 8.3 SQLAlchemy 185 8.3.1 SQLAlchemy的安装和配置 186 8.3.2 通过SQLAlchemy填充数据库 188 8.3.3 通过SQLAlchemy查询数据库 189 8.4 Pony ORM 191 8.5 Dataset:懒人数据库 192 8.6 PyMongo与MongoDB 195 8.7 利用Redis存储数据 196 8.8 Apache Cassandra 197 8.9 小结 201 第9章 分析文本数据和社交媒体 203 9.1 安装NLTK 203 9.2 滤除停用字、姓名和数字 206 9.3 词袋模型 208 9.4 词频分析 209 9.5 朴素贝叶斯分类 211 9.6 情感分析 214 9.7 创建词云 217 9.8 社交网络分析 222 9.9 小结 224 第 10章 预测性分析与机器学习 225 10.1 scikit-learn概貌 226 10.2 预处理 228 10.3 基于逻辑回归的分类 230 10.4 基于支持向量机的分类 232 10.5 基于ElasticNetCV的回归分析 235 10.6 支持向量回归 237 10.7 基于相似性传播算法的聚类分析 240 10.8 均值漂移算法 242 10.9 遗传算法 244 10.10 神经网络 249 10.11 决策树 251 10.12 小结 253 第 11章 Python生态系统的外部环境和云计算 255 11.1 与MATLAB/Octave交换信息 256 11.2 Installing rpy2安装rpy2 257 11.3 连接R 257 11.4 为Java传递NumPy数组 260 11.5 集成SWIG和NumPy 261 11.6 集成Boost和Python 264 11.7 通过f2py使用Fortran代码 266 11.8 配置谷歌应用引擎 267 11.9 在PythonAnywhere上运行程序 269 11.10 使用Wakari 270 11.11 小结 271 第 12章 性能优化、性能分析与并发性 272 12.1 代码的性能分析 272 12.2 安装Cython 277 12.3 调用C代码 281 12.4 利用multiprocessing创建进程池 283 12.5 通过Joblib提高for循环的并发性 286 12.6 比较Bottleneck函数与NumPy函数 287 12.7 通过Jug实现MapReduce 289 12.8 安装MPI for Python 292 12.9 IPython Parallel 292 12.10 小结 296 附录A 重要概念 298 附录B 常用函数 303 附录C 在线资源 309
上传时间:2018-05 大小:179KB
49KB
python数据分析之numpy-pandas-matplotlib-常用代码示例
2018-11-09python数据分析之numpy-pandas-matplotlib-常用代码示例,是python的源代码文件,总结到位,并且包含示例的数据文件,不用再找了。注释比较详细,适合新手入门,老手回顾。每个源文件命名一看就知道是起什么作用,所以很不错的资源
171KB
python数据分析源代码(Ivan Idris)
2016-10-13人民邮电出版社出版的python 数据分析的源代码
4.43MB
Deep-Learning-from-Scratch:从零开始的深度学习源代码|《深度学习入门:基于Python的理论与实现》随书
2021-03-24数据集用的源代码 源代码的解释请参考本书。 必要条件 执行源代码需要按照以下软件。 Python 3.x NumPy Matplotlib ※Python的版本为Python 3。 执行方法 前进到各个章节的文件夹,执行Python命令。 $ cd ch01 ...
15.29MB
Python语言程序设计源代码.zip
2021-08-12Python数据管理与分析部分(第7章至第9章、第11章)主要介绍数据文件操作、数据库操作、数据分析和数据可视化等知识。 本书按照首先论道、继而论理、然后操作的顺序,从哲学视角看程序设计,使读者在认识物质世界...
624KB
《利用python进行数据分析》数据集.rar
2020-03-25《利用python进行数据分析》中所用的CSV文件,用于各种python pandas以及其他第三方包的功能的展示。
42.61MB
基于Python的电商书籍数据采集及可视化分析系统【毕业设计】【Python】【数据分析】【flask web】【源代码+视频】
2022-06-26本课题主要内容是通过Python开发环境对豆瓣书籍运用数据爬虫技术及可数据视化技术进行处理,通过爬取到的网页信息,对爬取到的信息进行保存等操作,并对这些信息进行可视化处理,使用户进行数据分析。功能模块一:...
700B
数据分析代码
2018-09-09简单的数据分析代码入门使用python语言完成
13.73MB
数据分析基本方法的代码举例.zip
2020-04-19eda为探索分析示例代码 etl为特征预处理示例代码 main为分类、回归示例代码 semi_main为半监督示例代码 ass_main为关联分析示例代码 clst_main为聚类示意代码
316KB
Java数据分析源代码
2018-10-26Java数据分析指南全部源代码Java数据分析指南全部源代码
610KB
MATLAB 数据分析代码
2010-10-06是高级统计学的题,用MATLAB进行运算的代码,里面涉及主成分分析、聚类分析、SVM拟合、SVM分类.
508.88MB
Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料
2020-12-27Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料
118KB
深入浅出数据分析 Head First Data Analysis Code 数据与代码
2015-08-16《深入浅出数据分析》英文名为Head First Data Analysis Code,这本书中提供了学习使用的数据和程序
751KB
Python语言程序设计习题答案.zip
2021-08-12组合数据类型是Python语言区别于其他高级编程语言的一大特色,通过组合数据类型,省去了其他语言各种复杂数据结构的设计,给编程人员带来了极大的方便,这也是Python流行于数据分析领域的原因之一。学习本章,要熟练...
49.95MB
【项目实战】Python基于KMeans算法进行文本聚类项目实战
2022-02-14资料说明:包括数据+代码+文档+代码讲解。 1.项目背景 2.数据获取 3.数据预处理 4.探索性数据分析 5.特征工程 6.构建聚类模型 7.结论与展望
11.35MB
Python语言程序设计PPT课件.zip
2021-08-12组合数据类型是Python语言区别于其他高级编程语言的一大特色,通过组合数据类型,省去了其他语言各种复杂数据结构的设计,给编程人员带来了极大的方便,这也是Python流行于数据分析领域的原因之一。学习本章,要熟练...
29.74MB
python大作业 含爬虫、数据可视化、地图、报告、及源码(2016-2021全国各地区粮食产量).rar
2022-05-01(含源码及报告)本程序分析了自2016年到2021年(外加)每年我国原油加工的产量,并且分析了2020年全国各地区原油加工量等,含饼状图,柱状图,折线图,数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运行。文件含6个excel表,若干个csv文件以及一个名字为render的html文件(需要用浏览器打开),直观的数据处理部分是图片以及html文件,可在地图中显示,数据处理的是excel文件。不懂可以扫文件中二维码在QQ里面问。
2.92MB
data-analysis-and-visualization-using-python:Ossama Embarak博士的“使用Python进行数据分析和可视化”的源代码-Python source code analysis
2021-03-25该存储库随附Ossama Embarak博士(Apress,2018)的 。 使用绿色按钮将文件下载为zip格式,或使用Git将存储库克隆到您的计算机上。 发行版 版本v1.0对应于已出版书籍中的代码,没有更正或更新。 会费 请参阅文件...
40.9MB
Python for Data Analysis 随书资源
2015-04-08Python for Data Analysis《利用Python进行数据分析》随书资源,包括数据文件和示例代码等相关材料。
47.47MB
代码之美(中文完整版).pdf
2018-11-14第14章 优雅代码随硬件发展的演化 14.1. 计算机体系结构对矩阵算法的影响 14.2 一种基于分解的方法 14.3 一个简单版本 14.4 LINPACK库中的DGEFA子程序 14.5 LAPACK DGETRF 14.6递归LU 14.7 ScaLAPACK PDGETRF 14.8 ...
1KB
数据统计与分析各种算法与代码
2012-08-03完整数据统计与分析各种算法与代码 经本人调试 可实现
113.22MB
源代码+数据集+引用PDF文件.zip
2021-04-24NLP实战:利用Python理解、分析和生成文本
5KB
图像的均方误差的matlab代码-projects:我的github项目概述
2021-05-22图像的均方误差的matlab代码Java项目 用Java编写的独立项目和库。 Java库,用于确定类路径上的最小类集,以编译提供...随附了您的代码。 用于输出Weka类层次结构的帮助程序库。 小助手类,用于测试Java中本机库的加载。
2.35MB
Python for Data Science A Hands-On Introduction.pdf
2022-06-25Python for Data Science通过根植于实际示例和实践活动的边做边学的方法向您介绍Python的数据分析世界。您将学习如何编写Python代码来获取、转换和分析数据,为业务管理、市场营销和决策支持中的用例实践最先进的...
11.91MB
Mastering-Geospatial-Analysis-with-Python:Packt发行的《使用Python掌握地理空间分析》
2021-05-16本书将向Python开发人员(无论是新手还是有经验的人)介绍已开发的用于执行地理空间分析,统计分析和数据管理的各种新代码库。 本书将使用示例和代码片段,帮助您解释Python 3与Python 2的不同之处,以及如何使用...
23.62MB
dataviz-with-python-and-js:《使用Python和JavaScript的Dataviz》一书的随附文件
2021-05-15第1章开发设置中的说明应为您提供基本的设置,并提供主要的Python数据分析和可视化工具。 我建议使用虚拟环境,或者使用Anaconda的conda命令: $ conda --create pyjsviz anaconda 或使用 : $ virtualenv ...
28.10MB
Bayesian-Analysis-with-Python-Second-Edition:用Python进行贝叶斯分析-第二版,由Packt发行
2021-05-27了解如何使用不同的模型来回答不同的数据分析问题 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代码都组织在文件夹中。 例如,Chapter02。 该代码将如下所示: with pm.Model() as our_first_model: ...
8.9MB
matlab信任模型代码-MoralStrategiesFMRI:手稿附带的代码:VanBaar,J.,Chang,L.,&Sanfey,AG
2021-05-22用于对fMRI数据进行预处理和GLM分析的所有代码 用于执行主体间RSA分析的所有代码 用于生成图形的所有代码 用于运行基于Python的分析的Anaconda环境的规范 数据()包含: 行为数据(隐藏乘数信任博弈任务;社会价值...
6.96MB
人体姿态检测
2019-06-30Python+OpenCV+OpenPose实现人体姿态估计(人体关键点检测)代码说明参见:https://blog.csdn.net/m0_38106923/article/details/89416514
32.84MB
Splunk_智能运维实战(高清带详细目录书签)
2018-04-10它可以帮助企业收集、编入索引并智能化地分析由网络、应用程序以及移动设备等产生的机器数据,并最终帮助企业决策者做出准确的判断。本书集合了各种实用方法,目的是给读者提供指导和实用知识,以便读者掌握Splunk ...
2.93MB
Practical-Time-Series-Analysis:实用时间序列分析,由Packt发布
2021-05-28时间序列分析使我们能够分析一段时间内的某些数据并了解数据随时间变化的模式,这本书将使您了解时间序列分析背后的逻辑并将其应用于各个领域,包括财务,业务和社交媒体。 说明和导航 所有代码都组织在文件夹中。 ...