《Python数据分析师》课程大纲(1).pdf

所需积分/C币:50 2019-06-28 14:10:14 3.15MB PDF
6
收藏 收藏
举报

本文档描述了python数据分析师在各个阶段应该掌握的内容,让数据分析师们能够了解自己所在的位置并让他们了解当前需要学什么
容大教育 Python数据分析师-线下班课程大纲2。0 阶段二数据预处理分析篇 本堁程为数据分析的初级应用阶段,丰要通过 Python语言、Fxce、 Power B、MysQ、 Tablea等可视化T具进行对数据的预处理,让 学员能够仁拿到数据后对数据进行淸洗,转换等处理,为接下米的数据建模打下基础 学完后能达到什么水平? )重要程度 心)难度系数 针对初级数据分析师的职位发展要求 序号 课程名称 内容 学完后能做什么 EXC数据处理与分 1、用EXC实现数据清和转化 学完本课程可基本完成数据公析 析实战 、用xcel之 Power Quen实现数据转换和清洗 的T作,包括数捐预处哩,数据 3、数据分析和建模( pcwer query和 poW/er 建模,数据分析以及数据展现 pivc的使用) 达到初级数据分析师的示准。 4、数据展现之基本统计囪介绍及简单制作 5、数据展现之利用 现基本数据透视表 6、数据展现之利用 Power∨eW实现高级透视表 7、数据展现之利用 Powcr Map )实现bng地图 8、EXCe解决某公司财务报表动态生成 Power B快速上手商业1、微软 Power B简介 1、通过 power oi desktop可快速 数据可视化 2、通过 power plo报告快速上手 power bi 建立数据模型 3、 Power Bl Desktop界面介绍和数据导入整理 2、通过 power bi desktop可在网 4、 Power Bl Desktop建立数据分析模型 页端进行数据展现 5、 Power bl online service(在线版)特有功能 3、通过 power bi desktop可实现 6、 Powcr Bl online scrvicc报告的分享与写作 数据实时更新并发表。 7、 power b和Exce的配合 8、数据的刷新 9、仪表板的制作原贝 10、常用可视化图表介绍 11、 Power b|之巧用地图 31 tableau数据可视化应1、 T ableau概述 1、能够使用 Tableau进行数据的 用实战 2、 Tableau手上路 高级可视化展示 3、 Tableau连接数据并准备数据 2、能够利用 Tableau对网站数据 4、 Tableau设计视氢 进行高级数据分析 5、利用 Tableau工具分析数据 6、 Tableau浏览与关注We内容 7、 Tableau Serve与 Tableau online 8、Tabe3u连接Mysq瞇行数据分析 9、 Tableau地图绘制与图像 10、 Tableau高级图表类型 11、Tbeu函数、公式与高级数据分析 Tableau综合案例分析1:某电商网站行为分析 Tableau综合案例分析2:某在教育网站指标评估 Tableau综合案例分杌3:某零售行业进销存分析 MySq数据库自动 1、初识MySq(安装MySq、使用CMD登录 1、可从企业中的数据库直接导出 化操作及应用 MySq、数据库数据类芈、约束、 Navia介 数据进行分析 绍、 Navicat创建数据库、 Navicat填充数据) 2、可在数据库中迸行数据操作 2、SQ进阶 3、可将效据可视化工具结合 3、多表查询及存储过程 MySαL数据库进行数据分析操作 4、商品进销存项目实战 02 容大教育 Python数据分析师-线下班课程大纲2。0 阶段三数据挖掘篇 比阶段为我门整个课程的第三阶段,数据挖掘篇。侧重于数据的分析和建模。通过对基本的数理统计知识的学习,达到利用高级分析工具及方 法对业务分析预测的目的。 学完后胜任的工作岗位是 )重要程度 难度系数 数据挖掘/分析师 序号 课程名称 内容 学完后能做什么 数据分析一数理统 1、概率 1、能够通过对理论的学习为后续 计基础 2、样本与拍样 的高级分析打下基础 3、描述数据(统计量) 2、通过高级分析方法对复东数据 4、正太分布 进行高级数据分析 5、统计推断 6、实验设计 7、变量之问的关系 8、回归分析 9、聚类分析 sPSs建模分析 1、spss入门介绍 1、能够利用所学的spss知识解决 2、好的开始是成功的一半一数据录入与数据处理 实际工作中遇到的复杂问题 3、化笥为繁一描述性统计分矸 2、为后续学习的深入学习打下基 4、看图说语一统计图表分析 5、真假博弃1——假设检验概述与检验 6、真假博弈2——非参数检验与卡方检验 7、万物皆有联系—相关分歼与回归案例 8、影响因素判断—方差分析 9、与时俱进—时问序列分析 10、泾渭分明——分类算法 11、物以类聚——聚关算法 12、大道至简—降维方法研究 项目案例:sss人口普查数据分析实例 SAS建模分析 1、SAS基本介绍2、SAS的安装 1、了解什么是SAS 3、SAS运行环境的界面介绍 2、了解SAS的二作方法 4、 Insight模块5、SAS编程基本语法 3、利用SAS进行数据高级建模 6、数据的导入与导出7、 Analyst模块 8、SAS运算符及函数9、DATA步信息语句 10、 Assis模块11、 Assist模块 12、使用SAS制作统计分析报表 13、使用STAT模块进行统计分析介绍 14、SAS中的宏语言 15、 Enterprise Miner薮据挖掘模块 16、使用ETS模块对面板数据进行计量分析 项目案例:商品管理系统分析案例解析 MA几LAB数理统计 1、了解 Matlab2、 Matlab言基础 1、能够实现对数据过行高级可视 3、 Matlab的选择结勾 化建模 4、 Matlab的循环结构 5、白定义函数6、复数及具作图 7、高维数组与稀疏矩阵 8、单元数组和结构数组 9、 Matlab的数值运算 10、Mata的符号运算 11、1O换作12、图形对象接口(○J) 13、结买篇 03 容大教育 Python数据分析师-线下班课程大纲2。0 阶段四 Python数据分析篇 此阶段为我们整个课程的第四玠段, Python数据分析。将丰要侧重 Python话言及数据分析包的学习。通过对 Python语言、 Python数据处 理、分析包及可视化包的学习,训练学员導握必备的基本编码能力,为后续更高级的内容打下坚实且必要基础。 学完后胜任的工作岗位是 )重要程度 心)难度系数 Python数据分析师 序号 课程名称 内容 学完后能做什么? Python扫盲 Python语言于发要点详解 能够使用 Python写一个简单的基 Python开发坏境搭建 于控制台的应用 Python数据类型和常见算汯 Python函数式编程 Python文件处理 Python类、乒常处埋 Python核心编程 Python中的集合,泛型,元组,字典 1、利用 python类库实玩更加高级 Python网络编程、多线程、正则表达式 的数据处理 MSQL数据库精讲 2、可以把爬虫获取到的数据存放 MongoDB数据库精讲 钊数据库中 Python中如何操作MyS⑤Q数据库 3、熟练使用 Python进行数据持久 Python中如何操作 MongoDB 化工作 数据收集 Pyhn爬虫原埋与入门 1、使用 Python库进行豆辩电影 Python爬虫技术 利用 requests及 Beautifully.p爬取数据 分析 Beautiful Soup阵的使用 2、能够利用 Scrap框架实时抓取 利用及 Beautiful Soup爬取数据 京东、天猫商城数据 利用 Scrap框架爬取数据 爬虫综合项目实战 Pyth。n科学计算库 NumPy简介、程序包、简单的 Numpy程序 1、能够利用 Numpy包进行一些金 Numpy Ndarray的文件操作 融,电商等数据的量化分析工作 操作多维数组dary、索引、索引数组、布尔 2、能够利用 Numpy进行数据的科 数组 学计算 改变 darryl的形状 3、能够用 Numpy头现“人工智能 harray的基本运算 /机器学习”各种经典算法 lumpy进阶 numpy高级:广播、复制与视图 Pyth。n科学计算库 简单的SCPY程序 1、能够利用 Scipy包完成人工昝 SCPY程芧包 能/机器学习应用中的一些专业数 jy简介 学统计运算 线性代数基础知识_向量 2、能够利用Scpy进行人工智能 线性代数基础知识矩阵 机器学习应用中的科学计算 特征值和特征向量 3、能够用Nmpy+Scpy实岘 解线性方程组 “人工智能机器学习”各种经典 最小二乘法 算法 04 容大教育 Python数据分析师-线下班课程大纲2。0 序号 课程名称 内 学完后能做什么? 6 Python数据分析库 Pandas简介 PANDAS程序包安装 1、能够利用 Pandas包进行人工智 Pandas 简单的 PANDAS程序 Series类说明 能/机器学习应用的数据分析工作 Series的boo运算选择SERS的复杂操作 2、能够利用 Pandas包简化人工智 Dataframe的常用构造方式与操作 能/机器学习应用中的科学计算 分组求和(聚合操作)列与列之间的四则运算 3、能够利用 Pendas实现“人工智 删除某一列接按位置选定扫定的行和列 能/机器学习”各种经典算法 深复制&浅复訇 Dataframe与 Dataframe之间的join操作 Python数据分析可视化Map介 1、能够使用 Python库进行豆辩 库- matplotlil matplotlih程序包安装 电影分析 简单的 matplotlib程序 2、能够利用对人工智/机器学习 Matplotli主要绘图关型(上 处理后的数据进行可视化展示 Matplotlib主要绘图类型(下) Matplotlib主要绘图参数 Matplotlib主要绘图装饰函数 Matplotlib文字标注与注释 阶段五大数据分析篇(必修篇) 此阶段为我们整个渠程的五玠段,不需要学员具釜ava基础知识,乜不需要学员了解大数据环境:只需要学员有 Python及数据库基砒知 识,便可以学习此部分内容。此部分内容:老师将会直接给到学员一个真实的大数据开发环境,直接在这个真实的开发环境里结合实际的四个小 案例手把手的教大家去实现一个 Python+ Spark( PySpark柱架)的具体应用,这是目前大据分析师工作的主要大容,千货满满! @学完后胜任的工作岗位是 0)重要程度 )难度系数 1、 Python大数据分析师 ★★★★ 2、大数据分析师 序号 课程名称 内容 学完后能做什么? 1大数据分标 Hadoop1、大数据框架Hdop介绍、 MapReduce思想 1、对大数据有了一个基本的认识 及 Python实现 2、使用 Quick Start VN快速搭建环竟、数据基本 2、能够用 Python根据需求写 存储命令 个 MapReduce程序在 Hadoop平 3、案例一: Python现 Hadoop MapReduce 台中运行 词频统计 4、案例二: Python实现 Hadoop MapReduce 的BM股雲价烙数据分析 5、案例二: Matplotlib绘图展示分析结果 2大数据分析框架 PySpark1、sak简介、环境搭建 、能够对 Spark有一个基本的理解 基本使用 2、 Spark核心、 Jupyter Notebook使用 2、能够搭建起一个 sPark开发环境 3、词频统计: WcrdCount 3、能够结合业务编写一个简单的 4、使用 PyCharm对航班信息数据分析 PySpark小应用 3 PySpark分析某航天中心1、服务器日志读取解析 1、能够了解常见的日志数据的格式 服务器日志 2、日志数据采样统计概览 与解析 3、基于不同需求分析日志数据 2、能够结合业务利用 PySpark框架 4、分析展示404响应日志数据 对于不同系统的离线日志进行分听 4大数据HVe集成 Python1、大数据SQ儿分析框架HN使用 能够独立完成Hic与 PySpark 分析 2、HCL结合 Python脚本影评数据分析 的集成 3、 PySpark与Hve集成分析 2、会使用Hve+ PySpark结合业 4、墓于SQ和DSL的 Py Spark分析 务做数据分析 05 容大教育 Python数据分析师-线下班课程大纲2。0 阶段六精英项目实战篇 比阶段为我们整个课程的第六阶段,精英项目实战篇。借助四大商屮级项目实战,让学对数据分析应用有一个全面的理解与认识,让学员在 工作中有机会冲击高级数据分析师工作岗位,从而成为这个领域的专家 学习完成后能够胜任的工作岗位:重要程度 难度系数 Python高级数据分析师 序号 课程名称 内容 学完后能做什么 综合项目实战01 逍过一个真实项目演示一个数据分析项目全流 1、了解了一个真实的数据分析项 Python豆瓣电影分 程,主要包括 目全流程 析系统 1、业务需求分析 2、数据收集 2、能够对之前学习过的 Python爬 3、数据清洗 虫技术结合项目有史深入的理解 4、数据处理 5、数据分析 3、掌握npy, candas结合 6、数据可视化分析辰示 matplotlib\PyEchart3进行可视化 7、数据分析报告 数据分析与展示 2综合项日实战02豆游通过一个真实项日演示一个数据分析项日全流程 1、了解了一个真实的数据分析项 电影可视化分析系统 (借助可视化分析工具),主要包括 目全流程 1、业务需求分析 2、数据收集 2、掌握可视化分析工具结合业务 3、数据清洗 的综合运用 4、数据处理 5、数据分析 6、数据可视化分析展示 7、数据分析报告 Python商业数据科学实1、初始客户信思获取 可以实际参与到企业真实的数据分 战系统误程1:CRM容2、客户价值预测 析工作,利用自己所学知识内容完 户洞察与用户画像系统 3、初始信用评级与行为信用评级 成企业分析需求扩制作专业数据分 4、客户细分与客户画像 析报告 Python商业数据科学 1、经准营销与交叉销售 可以实际参与到企业真实的数据分 实战系统课程-2 2、申请反欺诈与交易欺诈检测 析工怍,利用自己所学知识内容完 CRM客户洞察与用户 3、知识图谱在中请欺诈中的运用 成企业分析需求并制作专业数据分 画像系统 4、客户满意度与客户保留 析报告。 ( Python+大数据篇) 5、客户行为偏好分析与产品推荐 06 容大教育 Python数据分析师-线下班课程大纲2。0 以下两个阶段属于课程选修阶段:赠送视频课程 阶段七大数据分析师(选修冲击篇) 此阶段为我们整个课程的第七阶段,属选修內容,需要学员具督基本的Java语言编程能力,主要介绍了大数据平台的基本搭建及 Sak,Stom结合来完成在大数据环境下的数据分析及实时数据分析的要求。有对大数据开发感兴趣,希望了解更多大数据相关内容的同学可以 选修 @学完后胜任的工作岗位是: )重要程度 小)难度系数 大数据开发工程师 ★★★ ★★★★★ 大数据分析师 序号 课程名称 学完后能做什么? Linux系统运维管埋 1、Lnux发展及介绍 1、能够独立熟练操作Lnux:完 2、mwar与 centos6.×的安装部署 成各种应用T具的安装部署 3、Ln文件管里及用户管理 2、能够根据需求独立完成she脚 4、LnⅨ叹限管理与常用工具命令 本的开发与定时调度 5、Ln网络管埋与系统管埋 7、n.ⅸ软件管理与正则表达式 8、She輪程立用 9、Ln定时任务 Conta 大数据存储分析 1、人数据概论 1、能够独立部署 Hadoop集群:并 HADOOP框架入门 2、 HADOOF框架及伪分布式环境 配置容火方案,解决集群常见问题 3、HDFS分布式文件系统 2、能够根据需求使用JaVa款练开 4、 MapReduce并行计算框架 发 MapReduce程序 5、YARN分布式资源管理 6、 MapRcouc企业开发案例 7、 Hadoop分布式集群部著 8、 Hadoop容灾方案:高可用 大数据仓库工具HVE 1、Hive引入、介绍及安装 1、能够独立完成Hie的安装部署 2、He的DDL(数据库创建及表的三种创建方式) 构建数据仓库 3、Hve外部表、分区表及加载数据不基本SqL使用 2、能够使用SQ_根据需求实现数 4、Hivc高级电商案例分析 据的统计分析 5、 Hive s≈rer2及 beeline与JBC使用 SCALA语言基础 1、 SCALA环境安装搭建和DEA初步使用 本阶段完成可以为后续 spark和 2、变量、数据类型、流程控制语句 Kaka学习查看源码打下基础,更 3、函数式编程:函数定义、名函数、高玠函 好的拦解Spak杠架的精髓,企业 数、可变参数函数等 中很多是基于Scaa语言编写代码 3、Scaa集合:可变和不可变、列表Lit、元 分析数据的。 祖Tup及Se和Map及常见高阶数4、Scaa OO、模式匹些、隐式转换 Spark sQl结构化 1、与Hive集成公析数据 使用SQL或者DSL进行海量结构 数据处理 2、 Dataset/Dataframe是什么 化数据分析,结合Phon语言进 3、外邹数据源接口read和wite 企业化的数据处理和机器学习中 4、基于天氾大赛的口悼萄家流量预测分析 数据预处埋璪作:也能实现海量数 据交互式快速分析 6 项目实战:基于 1、通过一个电商实时系统了解天 Kafka Spcrkstream parks HDEs 猫双11系统架构与关健核心技术 ng+Kaka併某宝实时 2、掌握 Sparkstream+kaf- HDFS/S3 订单销售额统计 「 Kinesis Streaming ka+Reds如何结合业务使用 [ Dashboards Twitt 07 容大教育 Python数据分析师-线下班课程大纲2。0 阶段八人工智能/机器学习(选修冲顶篇) 此阶段为我们整个课程的第一阶段,鳥选修內容。需要学员具备比较强的算法数学能力及一定的 Python编稈能力,主要介绍了人工智能机器 学习的入门知识及必备算法能力,通过具体的项目演示了人工智能/器学习仕实际工作中运用,会将来更进一步的深入人工智能学习打下良好的 基础 学习完成后能够胜任的工作岗位:(重要程度 )难度系数 人工智能应用开发工程师 ★★★ ★★★★★ 序号 课程名称 内容 学完后能做什么? 机器学习入门 机器学习扫盲 1、能够对人工智能与机器学习、深度学习之间 数据挖掘和机器学习概述 的关系有了一个深入的理解 快速埋解数据挖掘和机器学 2、能够知道开发一个人工智能的应用一些基本 数捱挖掘的六大任务 的套路与实现步骤 数据挖掘方法论(CR|SP-DM) 3、对十人经典人工智能数据挖掘算法有一个基 预测模型的构建和应用流程 本的认知 叽岩学习算法及分类 数捱挖掘与数据仓库和C|AP 数捱挖掘和机器学习应用案例 如何成为一名优秀的数据科学家 机器学习十大经典算法原决策树算法原理与适用场景 1、了解十人经典算法是什么,为什么,以及怎 理与实现(人门籥 随机森林算法原理与适用场景 么用 逻輯回归算法原理与适用场景 2、了解十大经典算法的经典应用场景及实际解 SwM算法原理与适用场景 决什么问题 朴素贝叶斯算法原理与适用场景 3、能够知道在什么场景下我们应该用哪个算法 K最近邻算法原理与适用场景 米解决实际问题 K均值算法原理与适用场景 4、为后继具体算法在人工智能/机器学习具体业 Adaboost算法原理与适用场景 务应用打下基础 申经网络算法原理与适用场景 马小可夫算法原理与适用场景 机器学习实战案例1 1、项目背景 本项彐就是从用户点击的仄史记录中,挖掘频繁 基于FP- growth算法实 2、 FP-grow算法的原理 项集,以便知道哪些新闻报道是经常关联在一起 现的新闻网站流量点击 3、 Python代码头现 的。从而为网站的新闻版面排版,新闻推荐等提 分析系统 供科学的参考。主要涉及到 FP-growth、 FP-tree等算法的综合运用 机器学习实战案例 1、项目背景 客户价值分析其实就是一个客户分群问题。是以 2:、基于聚类 2、聚类模型算法简 客户为中心,先从客户需求岀发,搞清楚客户需 ( Kmeans算法实现的 3、 kmeans算法原理 要什么,他们有怎么样的一个特征,他们需要什 客户价值分析系统 4、 kmeans算法 Python代码实现 么样的产品,然后我们手回头设计出框应的产 5、 kmeans算法优化 品,以满足客户的需求。 机器学习实战案例 1、LD八主题模型 现仕大家进行网购,仕购物之前呢,肯定会看下 -3:、基于LVD、贝 2、SD算法 相关商品的评论,看下好评和差评,然后再综合 叶斯模型算法实现的电3、LDA模型语 衡量,最后才会决定是否购买相关的商品。甚至 商行业商品评论与情感 4、贝叶斯模型 有不少的消费者已经不看商品详情措述页了,而 分析案例实战 是直接看评论,然后决定是否下单。商品评论已 经是用户决策最为核心的考量因素了。 各注:课程的具体课时安排,老师根据学员和班级情况适当整。 08 F一覆世界的机会 由你表影 扫一扫 关注容大教育微信号 上海容大教育培训有限公司 地址:上海市普陀区中山北路3553号伸大厦4层 www.erongda.com 400-101-7669

...展开详情
试读 10P 《Python数据分析师》课程大纲(1).pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
  • GitHub

    绑定GitHub第三方账户获取
关注 私信 TA的资源
上传资源赚积分or赚钱
    最新推荐
    《Python数据分析师》课程大纲(1).pdf 50积分/C币 立即下载
    1/10
    《Python数据分析师》课程大纲(1).pdf第1页
    《Python数据分析师》课程大纲(1).pdf第2页

    试读结束, 可继续读1页

    50积分/C币 立即下载 >