没有合适的资源?快使用搜索试试~ 我知道了~
Python与大数据专业分析课件(470P).pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 8 浏览量
2022-07-06
23:53:23
上传
评论
收藏 786KB PDF 举报
温馨提示
试读
24页
Python与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdfPython与大数据专业分析课件(470P).pdf
资源推荐
资源详情
资源评论
Python
与大数据专业分析课件(
470P )
Python
与大数据分析计算机信息学院
Python
大数据专业友
情提示上课时间请勿: 请将您手机改为震动避免在课室里使用手机交
谈其他事宜随意进出教室请勿在室内吸烟上课时间欢迎: 提问题和积
极回答问题随时指出授课内容的不当之处 Python 与大数据分析
Python 基础(次课)网络爬虫(次课)期中随堂上机考试(次课)金
融数据分析案例(次课)文本数据分析案例 (次课)图像数据分析(次
课)自我介绍刘宁宁对外经济贸易大学信息学院讲师。
专注于对图像分类 (VisualObjectClassification) 、文本处理
(NaturalLanguageProcessing) 、模式识别 (PatternRecognition) 等方面的
研究。
com 为什么大数据首选是 Python 呢?第一部分初识 Python 第
二部分基本概念变量、注释、 print 函数、数据类型、算术运算符、类型
转换第三部分数据的容器列表、元组、字典、集合第四部分控制结构与
推导式第五部分数据的读写操作第六部分错误类型和异常捕获第七部分
字符编码问题处理第八部分编写函数处理数据第九部分
变量作用域第十部分 Python 中的模块第十一部分 Python 中的类第十五
部分 Numpy 基础知识第十六部分 Pandas 数据分析第十三部分正则
表达式第十四部分日期数据的处理 Python 语言的诞生和发展历史语言
的特点运行环境及安装 Python 语言的诞生和发展历史 Python
Python 语言是一种解释型、 面向对象、动态数据类型的高级程序设
计语言 Python 语言是数据分析师的首选数据分析语言也是智能硬件的
首选语言数据分析创建复杂的 Web 应用程序游戏开发动画电影效果
网站开发智能硬件开发 Python 与蟒蛇有关? GuidovanRossum 于年在
荷兰国家数学和计算机科学研究所设计出来的 Python 语言的诞生
BBCMontyPythonlsquosFlyingCircus (蒙提 middot 派森的飞行马戏团)
GuidovanRossum (人称龟叔) Python 版本于年月发布。
在 年 月 Python 发 布 此 版 本 没 有 完 全 兼 容 之 前
的 PythonPython 也因此分为了 Python 派系和 Python 派系两大阵营
Python 语言的发展历史 TIOBEINDEX: 编程语言流行程度排行榜 Python
语言的 TIOBEINDEXPython 曾在年和年两度被 TIOBE 排行榜
评为年度编程语言现已成为了第五大流行编程语言(截至年月)
Python 语言的 TIOBEINDEXPython 语言的特点优点一: 优雅、简单、
明确(减少花哨、 晦涩或以炫技为目的的代码)让数据分析师们摆脱
了程序本身语法规则的泥潭更快的进行数据分析 C 语言 Python 语言
优点二:强大的标准库完善的基础代码库覆盖了网络通信、 文件处理、
数据库接口、图形系统、 XML
处理等大量内容被形象地称为内置电
池(batteriesincluded )Python 使用者调包侠优点三:良好的可扩展性
大量的第三方模块覆盖了科学计算、 Web 开发、数据接口、 图形系统
等众多领域开发的代码通过很好的封装也可以作为第三方模块给别
人使用。
如 Pandas 、Numpy 、Seaborn 、Scikitlearn 等等优点四:免费、
开源缺点一:运行速度慢缺点二:加密难缺点三:缩进规则缺点四:
多线程灾难 Python 语言的缺点 Python 语言与 Java 动态类型和静态类
型 Python 中一切皆对象括号与缩进应用领域 Python 语言与 R 语言机
器学习的一把利器可读性强便于上手灵活性强:可与其他如 Web 应
用程序进行整合以统计推断为导向数据分析之外的领域有所限制包
凌乱且一致性较差 Python 语言与 R 语言的应用场景对比网络爬虫连
接数据库内容管理系统 API 构建统计分析互动式图标面板运行环境
及安装推荐使用
Anaconda 进行 Python 安装、环境配置及工具包管理
IpythonqtconsolePyCharmJupyterNotebookSpyderIPython 鼓励一种执
行探索(executeexplore )的工作模式输入代码之后按下回车便会立即
得到代码运行结果交互式计算和开发环境: IPython 交互式计算和开
发环境: IPython 输入获得 IPython 的详细介绍输入 quickref 获得
IPython 的快速参考交互式计算和开发环境: IPython 输入 help() 查看
IPython 的帮助文档使用内省 pandas 查看 Pandas 的帮助文档基于 Qt
框架的 GUI 控制台 qtconsole 为终端应用程序提供诸如内嵌图片、多
行编辑、语法高亮之类的富文本编辑功能启动命令: jupyterqtconsole
缺点:功能少、用户友好性不够 JupyterNotebookJuliaPythonR=Jupyter
基于 Web 技术的交互式计算文档格式支持 Markdown 和 Latex 语法支
持代码运行、文本输入、数学公式编辑、内嵌式画图和其他如图片文
件的插入是一个对代码友好的笔记本 JupyterNotebookJupyter 支持包
含 Rkernel (支持 R 语言)启动命令: jupyternotebookJupyterNotebook
推荐使用 JupyterNotebook 进行数据分析并将自己数据分析的思考过
程写在其中方便之后整理思路以及向别人展示数据分析结果从左至
右分别是默认 Python 终端、IPython 和 JupyterNotebookRNotebook 年
月 R 语言的集成环境 RStudio 也拥有了自己的 RNotebook 了集成开发
环 境 IDEPyCharmSpyder 数 据 科 学 计 算 平 台
AnacondaleadingopendatascienceplatformpoweredbyPython 自 动 配 置
Python 环境下载并安装
JupyterNotebook 、qtconsole 和集成开发环境
Spyder 包管理器 conda 总结 Python 语言的特点:优雅、简单、易学
Python 语言的诞生与发展历史 Python 语言的运行环境: IPython 、
JupyterNotebook 、SpyderPython 语言的数据科学计算平台: Anaconda
实践案例: PyCharm 下 HelloWorld 通过例子说明 Python 与其他语言
的区别万物皆对象空格控制结构报错变量、 注释、print 函数、数据类
型算术运算符、类型转换解释型语言 PythonPython 语言是一种解释
型、面向对象、动态数据类型的高级程序设计语言数据集变量及相关含
义公开数据集资源 UCI 数据集 Kaggle 数据集 Yahoo !股票价格数据用
来存储一些之后可能会变化的值对科比投篮 ID 为的一次投篮进
行分析那么我们就可以创建一个名称为 shotid 的变量并且将值储存
在变量 shotid 中如果之后我们想要分析科比的另外一次投篮比如投
篮 ID 为的投篮我们只需要修改变量 shotid 的赋值将 shotid 赋值为即
可变量和常量变量变量名必须是大小写英文字母、 数字或下划线的组
合不能用数字开头并且对大小写敏感关键字不能用于命名变量(个)
如 and 、as 、assert 、break 、class 、continue 、def 、del 等变量命名规
则通过赋值运算符 =变量名和想要赋予变量的值连接起来变量的赋值操
作就完成了声明和定义的的过程在其他语言中需要制定类型同一变
量可以反复赋值而且可以是不同类型的变量这也是 Python 语言称之
为动态语言的原因变量赋值常量表示不能变的变量 Python 中是没有
常量的关键字的只是我们常常约定使用大写字母组合的变量名表示常
量也有不要对其进行赋值的提醒作用常量如同我们在看书时做笔记一
样 Python 语言会通过注释符号识别出注释的部分将它们当做纯
文本并在执行代码时跳过这些纯文本在 Python 语言中使用 #进行行注释
注释多行注释使用连续单个单引号或者双引号在 Pythonx 版本中同
时兼容 print 和 print() 在 Pythonx 版本中 print 函数为带括号的 print() 如
果想要看变量的值则直接在 print 后面加上变量名即可。
如果是想要输出提示信息如一句话那我们需要将提示信息
用 lsquo 单引号包裹起来(这使得内容构成一个字符串) print 函数使用
逗号 ,隔开变量与其他剩余内容则 print 在输出时会依次打印各个字符串
或变量遇到逗号 ,时会输出一个空格 print 函数不仅可以打印变量值也可
以打印计算结果 Python 语言的数据类型包括整型、浮点型、字符串、
布尔型和空值整型( int)整型的取值为整数有正有负如等。
在科比投篮数据集中 shotid 、gameeventid 、gameid 、locx 、 locy 、
minutesremaining 、 period 、 playoffs 、 secondsremaining 、shotdistance 、
shotmadeflag 、teamid 都是整型变量数据类型浮点型的取值为小数当计算有精
度要求时被使用 ,由于小数点可以在相应的二
进制的不同位置浮动故而称为浮点数如等但是如果是非常大或者非
常小的浮点数就需要使用科学计数法表示用 e 代替。
科比投篮数据集中的 lat 和 lon 为浮点型变量。
浮点型( float)字符串( str )字符串是以两个单引号或两个
剩余23页未读,继续阅读
资源评论
apple_51426592
- 粉丝: 9505
- 资源: 9659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功