《数据分析师(Python)》课程内容详细介绍

所需积分/C币:50 2019-01-08 09:35:51 3.19MB PDF
收藏 收藏
举报

《数据分析师(Python)》课程内容详细介绍,对于python学习者有帮助
文件对象声明及基本操作 系统模块下的路径操作 学习并掌握 pyThon下的基木数据 数据读写 文件的读取与写入(上 读写操作,及 pickle存储结构化数 文件的读取与写入(下) 据 icke模块的运用 老核项目介绍 项目介绍 在本项目中,学员需萼结合课柱 答案解读项目01商铺数据加载及存储 数据,整理并成功加载csV格式数 据,并存为pcke文作 项目解答 在本项目中,学员需要根据 答案解读_项目02_基于 Python的算法函数 场景,分别创建算法函数,并能够 创建 成功运行。 03重点工具掌握:数据解析核心技巧 本章节作为《数据分析师微专业》的第三部分,讲解了 Python数据分析的必备工具 Numpy和 Pandas,学习并掌握其基本操作和核心函数。并讲解在 Pandas的数据结构上儆 分析图标绘制,掌握图表背后的套路。同时拓展讲解利用Gs的空间数据统计分析技术方 法,及其与 Python的交互;介绍国内外靠谱的公开数据获取方式。并在本章结尾通过两个 实际案例帮助大家系统的理解和巩固本章所学内容。 章节 课程 知识点 什么是 Numpy基础数据结构 掌握 Numpy的基本技巧,学习如何在 Numpy通用函数 科学计算工具 Numpy pyhton中存储和处理矩阵结均数据、理解 Numpy索引及切片 数组对象 并掌握相关核心函数 Numpy随机数 Numpy数据的输入输出 什么是 Pandas 数据结构 Series:基本概念及创建 数据结构 Series:索引 数据结构 Series:基本技巧 数据结构 Dalaframe:基木概念及创建 Pancas是 Numpy的核心分析工具,主要 数据结构 Dataframe:索引 运用于数据分析,其提供了大量快速便捷 数据分析工具: Pandas 数据结构 Dataframe:基本技巧 的处理数据的函数和方法,学习并学握甘 时间模块 基本探作和核心函数。 时刻数据 时间戳索引 时期 时问序列 时间序列 数值计算和统汁基础 文本数据 合并 连接与修补 去重及替换 数据分组 分组转换及一般性“拆分-应月-合并 透视表及交叉表 文件读取 Malplotlib简介及图表窗冂 图表的基本元素 图表的样式参数 刻夏、注解、图表输出 子图 基本图表绘制 柱状图、堆叠图 学会在 Pandas的数据结构上做分析图标 图表绘制工具: Malplotlib面积图、填图、饼图 绘制,并掌握图表背后的套路:什么图表 且方图 用于什么分析,及数据图表的表达内涵 散点图、矩阵散点图 极坐标图 箱型图 表格样式创建 表格显示控制 表格样弌谲用 什么是空间数据? 宋闫研究作为数据分析的一个力向,重点 G|S软基木操作及数据加载 将会落实空间关系的数据研究.本门微专 CHD空间分析工具:Gs坐标系 业将会以GS平台为主教授学员空间数括 统计分析的技术方法,以及如何瑜出数据 空间数据基本处坦 结果,和 PyThon进行交互 空间数据几何计算 空间可视化制图 空间划分 空间统计 国内公开数据 总结现有的可靠数据源及数据获取方法 你必须知道的数据源 国外公开数据 分类整理,以及城市数据团数据库的数据 城市数据团-数据介绍 资源介绐 本项目中,学员需要结合课程数据,独立 答案解读项目03知乎数据清洗整理和完成数括的加载、清洗、分析和可视化的 结沦研究 流程,做初步统计解析,并把结论精简为 项目解答 一份小报告。 答案解读项目0祝频网站数据清洗整本项目中,学员需要结合课程数据,独立 珪和结论研究 完成数据的加载、清洗、分析和可视化的 流程,做初步统计解析,并把结论精简为 一份小报告。 04进阶算法学习:统计分析能力强化 数学统计思维是数据分析的核心,一个优秀的数据分炘师是需要同时具备编程、统计 学和批判思维能力。本课程将会从算法理论知识的计解开始,帮助学员掌握核心统计算法 技术,结合相关案例场景,打通思路,强化学员的数据研究能力,实现从“数据分析”到 数据挖掘”的进阶之路。 章节 课程 知识点 数据特征分析 分布分析 对比分析(上 特征分析是针对样本数据的初步检测,观 对比分析(下 察数据的基本规律和趋势,以及各雯素之 数据特征分析 统计分析 间的相关性,学员需要在理解相关方法原 帕累托分析 理的基础上,掌握技术部分 正态性检验(上 正态性检验(下 相关性分析 缺矢值处理 数据处理包括数据清流及数据集成、转换 异常值处理 等,是做数据分析的前期核心工作:在提 数据处理 数据归一化 高数据质量的同时,整合现有数据信息, 数据连续属性离散化 为后期分析做准高 数学建模概述 线性回归理论概述 线性回归的 python实现方法 线性回归模型评估 算法模型构建是数据挖掘的下一个重点, KNN最邻近分类理论概述 本章课程会重点从算法原理出发,讲解回 数学建模 KNN最邻近分类的 python实现法 归、分类、聚类及蒙特卡罗模拟四个面 PCA主成分分析理论概述 的常用算法及适用场景,短时间内培养学 PC∧主成分的 python实现方法 员的研究习惯,构建问题解决方案 K- [learnS聚类理论概述及 python实现 蒙塔卡罗模拟理论概述 蒙塔卡罗模拟案例解读 05数据表达逻辑:结果输出及内容美化 本门课程将会从数据结果输出角度来教授课程,分别结合 Python、GS、Geph等多个 技术平合实现数据可视化。误程会从可视化的图表表达逻辑及视觉美感入手,从理论到实 践,帮助学员构建一套数据表达技术方法体系。 章节 课程 知识点 什么是数据可视化? 整体介绍数据可视化的现有工 数据可视化技术体系及方向 具及技术套路,同时从设计角度 数据可视化整体概述 数据冬表表达的逻辑原珪 培养学员美感,并总结数据图表 设计美学 的表达关系 为什么选择 Seaborn做图表可视化? 整体风格设置 调色盘 Seaborn是一个基于 matplotlib 分布数据可视化-直方图与密度图 的可视化库,它使得默认的数捐 分布数据可视化-散点图 可视化更加具有视觉吸引力,木 on图表数据可视化: Seaborn 分类数据可视化-分类散点图 分类数据可视化分布图 章将会教授学员掌握 Seaborn的 技术方法,学习不同图表的制作 分类数据可视化-统计图 及参数设置 线性关系数据可视化 时问线图表、热图 结构化图表可视化 什么是关系网络图? Geph软件安装及配置 关系网络作为数据分析的研究 方向之一,其表达方式极其重 Geph基本操作 关系网络数据可视化 要,木章误程将会总结整理关系 Python数据预处理 网络数据表达套路,及核心工具 案例研究一:公司职员关系图表 Dephi的相关技术点 案例研究二:导演演员关系网络可视化 空间数据可视化工具概述 3D图表 空间柱状图(1) 本门课程将会教授学员掌握城 空间数据可视化 空间柱状图(2) 市空间数据可视化方法技巧,学 空间线性轨迹图(1) 习相关第三方平台的使用方法 空间线性轨迹图(2) 空间热力图 什么是 Bokeh及其可视化交互原理? Bokeh是一个面向web浏览器来 绘图空间基本操作 处理的数据可视化 Python工具 图表辅助参数设置 Python交互图表可视化: Bokeh 包,它不依赖于 matplotlib,且实 散点图 现交互式的Web可视化,本章将 折线冬/面积图 会教授学员掌握Bkeh的技术方 柱状窭/堆叠图/直方图 绘图表达进阶操作 法,学习不同图表的制作及参数 Tool Bar工具栏设置 设置 其他交互工具设置 06数据挖掘项目实战 本门课程将会结合之前所学的所有内容,针对10大场景进行数据挖掘项目实训。实 训场景包拈了经典课题及城市数据团的重点案例,学员需要以课程数据为起始,独立完成 所有从数据清洗整理、特征分析、内容挖掘及数捃可视化表达,并分别整合成一个数据分 析成果报告 章节 课程 项目07城市餐饮店铺选址分析 项目08电商打折套路解析 项目09口国姓氏排行研究 项目10房价影响因素挖掘 项目介绍 项目11国产烂片深度揭秘 项目12中国城市资本流动问题探索 项目13社会财富分配问题模拟 项目14婚恋配对实验 项目15泰坦尼克号获救问题 项目07答案讲解 项目08答案讲解 项目09答案讲解 项目10答案讲解 项目11答案讲解 项目12答案讲解 项目13答案讲解 项目14答案讲解 项目15答案讲解 【内容示例】 1项目07-城市餐饮店铺选址分析 本项目中,学员需要结合城市现状餐饮数据,分析并总结某种菜系饭馆的最佳选址位置。 口中DP⊙◆空点图 滨高型素菜 性价比得分037 口啉得分1 d其哪完共食容北要实相需河实奖菜染饰,实积号实其工x其龙火诉国整宫部 人均消得分 4 共家于共丙实四条,+可共式图+ 2项目08-电商打折套路解析 本项目中,学员结合双十一天猫样本数据,研究并分析其折扣力度及打折周期,总结商家营销套路。 G 各个记牌崇与双“一话动的两品数量分布 691% E 2401% 5197% 身出杠计 1308% b-一-·-- 0.09印9)01Q1815020225080 040445050950056Q077508.0Bn55009.09S 不同品桥和率情况 音个品掉打折套路解析 类加 056中,一 品樟悦吟 注啪 款与品5215e2 恍击对 大量大折 2“号“…小114 3项目09-中国姓氏排行研究 本项目中,学员结合课程数据,研究中国姓氏问题及空间区位分布 1006944余 姓作地 广锫所在地户锫所在地户锫所在地区户所在地广所在地工作地工作地工作迪区 省 省 0工沈阳皇塔湾街8315与辽宁省 ,驲 12341537841948913未识刑沈 刘虹匚区凹川比路1851号12辽宁省 大绀 皇姑区 12341537541848913未认判末识别虹匚区 2李沈阳市呈姑区归山路3-1号2这宁省 皇姑圖 1231537511848913丰识 转区 3王沈阳咔皇姑区尝山中踣辽宁省泪 122.4137541.8913木识列沈阳区 4浏阳市里姑区祷江东街1号4辽宁省泪 234153754148913未识别沈阳让区 1234137374146913末识列未识列式旦 ;张沈阳市黄妹区全沙江街3号5-辽宁省犯 12341537741848913未识沈阳妹区 刘铁区腾飞街31号 省 末识列木识别铁区 8阎沈阳市皇姑区明廉路一724-辽宁省 12341537541848913未识刊 沈阳皇姑上 12341537541848913未识孔 阳 辽宁省 1231153751848913末识机 11兮流阳皇姑区华山路1J号1辽宁省 125.115315128913识引沈阳 13宋沈阳市皇姑区明廉路771号9江宁省 皇妯区 12541537541248913未识列 童热混7号万市香包#中省阳 姑区12417412813未识列未识列未氏列 16丑沈阳市姑区北街1232号辽宁省 皇姑区 1234163754128913未识沈阳 沈阳市皇姑区黑龙江街三段 辽宁省 区 12341537541848913 未;口 别沈阳 辽宁省阳市皇站区宁山路宁省 1234153741:48913 19张和早新二街26号 辽宁省 12341537541:48913未识列末别和 中国姓氏TP20-计数 60000 40000 性氏计数:73320 4项目10-房价影响因素挖掘 本项目中,学员结合课程数据,研究不同因素对房价的影响,总结出多因子评价分析方法。 180000 140000 车12000- 由8000 60000 20000 10000 10000 20000 30000 40000 60000 0000 随着市中心距离增加,不同指标相关性系魏交化情况 二二二 人口密相关系数 道路密度相关系数 ●餐饮价榕相关系数 E离相关系致 离巾口心距离:200 A二密度相关系数0363 道密度相关系数1 餐管价格关系数0.183 中心距离相关系数-0594 1000 40o0 5.项目11-国产烂片深度揭秘 本项目中,学员结合豆瓣、IMDB整理数据,分析07-16年国产电影烂片的共同特征.挖掘相关内容。

...展开详情
试读 19P 《数据分析师(Python)》课程内容详细介绍
立即下载 低至0.43元/次 身份认证VIP会员低至7折
抢沙发
一个资源只可评论一次,评论内容不能少于5个字
关注 私信 TA的资源
上传资源赚积分,得勋章
最新推荐
《数据分析师(Python)》课程内容详细介绍 50积分/C币 立即下载
1/19
《数据分析师(Python)》课程内容详细介绍第1页
《数据分析师(Python)》课程内容详细介绍第2页
《数据分析师(Python)》课程内容详细介绍第3页
《数据分析师(Python)》课程内容详细介绍第4页

试读结束, 可继续读2页

50积分/C币 立即下载 >