没有合适的资源?快使用搜索试试~ 我知道了~
python深度学习-pandas
资源推荐
资源详情
资源评论
Python 深度学习:Pandas 标签库 ——Bilibili:爆肝杰哥
目 录
引入................................................................................................................................ 1
一、对象的创建............................................................................................................ 2
1.1 一维对象的创建............................................................................................. 2
1.2 一维对象的属性............................................................................................. 3
1.3 二维对象的创建............................................................................................. 4
1.4 二维对象的属性............................................................................................. 6
二、对象的索引............................................................................................................ 7
2.1 一维对象的索引............................................................................................. 7
2.2 二维对象的索引............................................................................................. 9
三、对象的变形.......................................................................................................... 11
3.1 对象的转置................................................................................................... 11
3.2 对象的翻转................................................................................................... 11
3.3 对象的重塑................................................................................................... 12
3.4 对象的拼接................................................................................................... 13
四、对象的运算.......................................................................................................... 16
4.1 对象与系数之间的运算............................................................................... 16
4.2 对象与对象之间的运算............................................................................... 17
五、对象的缺失值...................................................................................................... 19
5.1 发现缺失值................................................................................................... 19
5.2 剔除缺失值................................................................................................... 20
5.3 填补缺失值................................................................................................... 21
六、导入 Excel 文件................................................................................................... 23
6.1 创建 Excel 文件............................................................................................ 23
6.2 放入项目文件夹........................................................................................... 24
6.3 导入 Excel 信息............................................................................................ 25
七、数据分析.............................................................................................................. 26
7.1 导入信息....................................................................................................... 26
7.2 聚合方法....................................................................................................... 27
7.3 描述方法....................................................................................................... 28
7.4 数据透视....................................................................................................... 29
Python 深度学习:Pandas 标签库 ——Bilibili:爆肝杰哥
1
引入
0.1 版本需求
本视频中,使用的 Python 解释器与第三方库的版本如下。
⚫ Python 为 3.9 版本,自 3.4 以来改动的语法可忽略不计,除非更新到 4.0;
⚫ NumPy 为 1.21 版本,自发行以来改动的语法可忽略不计,除非更新到 2.0;
⚫ Pandas 为 1.2.4 版本,不同版本的发行日志:http://pandas.pydata.org/。
0.2 视频特点
⚫ 清晰度:本视频分辨率为 1080P,请调高分辨率;
⚫ 交流群:微信搜索“Boolart003”的小火柴,备注“杰哥”,即可拉入群聊;
⚫ 讲义链接:NumPy 之后的讲义链接,放在上一行的微信交流群中。
0.3 视频 UP 主
⚫ UP 的本科为三峡大学(原电力部 6 所直属高校之一,超强电气型), 硕士
是中南大学(计算机、自动化、临床、护理等热门专业均属 A 类学科)。
⚫ 如果课件中有纰漏,请在视频评论区反馈。
0.4 深度学习的相关库
① NumPy 包为 Python 加上了关键的数组变量类型,弥补了 Python 的不足;
② Pandas 包在 NumPy 数组的基础上添加了与 Excel 类似的行列标签;
③ Matplotlib 库借鉴 Matlab,帮 Python 具备了绘图能力,使其如虎添翼;
④ Scikit-learn 库是机器学习库,内含分类、回归、聚类、降维等多种算法;
⑤ TensorFlow 库是 Google 公司开发的深度学习框架,于 2015 年问世;
⑥ PyTorch 库是 Facebook 公司开发的深度学习框架,于 2017 年问世。
0.5 深度学习的基本常识
⚫ 人工智能是一个很大的概念,其中一个最重要的分支就是机器学习;
⚫ 机器学习的算法多种多样,其中最核心的就是神经网络;
⚫ 神经网络的隐藏层若足够深,就被称为深层神经网络,也即深度学习;
⚫ 深度学习包含深度神经网络、卷积神经网络、循环神经网络等。
NumPy库
Matplotlib库
Pandas库
Scikit-learn库
PyTorch库
TensorFlow库
纯Python
Python 深度学习:Pandas 标签库 ——Bilibili:爆肝杰哥
2
一、对象的创建
⚫ 导入 Pandas 时,通常给其一个别名“pd”,即 import pandas as pd。
⚫ 作为标签库,Pandas 对象在 NumPy 数组基础上给予其行列标签。可以说,
列表之于字典,就如 NumPy 之于 Pandas。
⚫ Pandas 中,所有数组特性仍在,Pandas 的数据以 NumPy 数组的方式存储。
1.1 一维对象的创建
(1)字典创建法
NumPy 中,可以通过 np.array()函数,将 Python 列表转化为 NumPy 数组;
同样,Pandas 中,可以通过 pd.Series()函数,将 Python 字典转化为 Series 对象。
In [1] :
import pandas as pd
In [2] :
# 创建字典
dict_v = { 'a':0, 'b':0.25, 'c':0.5, 'd':0.75, 'e':1 }
In [3] :
# 用字典创建对象
sr = pd.Series( dict_v )
sr
Out [3] :
a 0.00
b 0.25
c 0.50
d 0.75
e 1.00
dtype: float64
(2)数组创建法
最直接的创建方法即直接给 pd.Series()函数参数,其需要两个参数。第一个
参数是值 values(列表、数组、张量均可),第二个参数是键 index(索引)。
In [1] :
import pandas as pd
In [2] :
# 先定义键与值
v = [0, 0.25, 0.5, 0.75, 1]
k = ['a', 'b', 'c', 'd', 'e']
In [3] :
# 用列表创建对象
sr = pd.Series( v, index=k )
sr
Out [3] :
a 0.00
b 0.25
c 0.50
d 0.75
e 1.00
dtype: float64
其中,参数 index 可以省略,省略后索引即从 0 开始的顺序数字。
Python 深度学习:Pandas 标签库 ——Bilibili:爆肝杰哥
3
1.2 一维对象的属性
Series 对象有两个属性:values 与 index。
In [1] :
import numpy as np
import pandas as pd
In [2] :
# 用数组创建 sr
v = np.array( [ 53, 64, 72, 82 ] )
k = ['1 号', '2 号', '3 号', '4 号']
sr = pd.Series( v, index=k )
sr
Out [2] :
1 号 53
2 号 64
3 号 72
4 号 82
dtype: int32
In [3] :
# 查看 values 属性
sr.values
Out [3] :
array([53, 64, 72, 82])
In [4] :
# 查看 index 属性
sr.index
Out [4] :
Index(['1 号', '2 号', '3 号', '4 号'], dtype='object')
事实上,无论是用列表、数组还是张量来创建对象,最终 values 均为数组。
In [1] :
import pandas as pd
import torch
In [2] :
# 用张量创建 sr
v = torch.tensor( [ 53, 64, 72, 82 ] )
k = ['1 号', '2 号', '3 号', '4 号']
sr = pd.Series( v, index=k )
sr
Out [2] :
1 号 53
2 号 64
3 号 72
4 号 82
dtype: int64
In [3] :
# 查看 values 的属性
sr.values
Out [3] :
array([53, 64, 72, 82], dtype=int64)
可见,虽然 Pandas 对象的第一个参数 values 可以传入列表、数组与张量,
但传进去后默认的存储方式是 NumPy 数组。这一点更加提醒我们,Pandas 是建
立在 NumPy 基础上的库,没有 NumPy 数组库就没有 Pandas 数据处理库。
当想要 Pandas 退化为 NumPy 时,查看其 values 属性即可。
Python 深度学习:Pandas 标签库 ——Bilibili:爆肝杰哥
4
1.3 二维对象的创建
二维对象将面向矩阵,其不仅有行标签 index,还有列标签 columns。
(1)字典创建法
用字典法创建二维对象时,必须基于多个 Series 对象,每一个 Series 就是一
列数据,相当于对一列一列的数据作拼接。
⚫ 创建 Series 对象时,字典的键是 index,其延展方向是竖直方向;
⚫ 创建 DataFrame 对象时,字典的键是 columns,其延展方向是水平方向。
In [1] :
import pandas as pd
In [2] :
# 创建 sr1:各个病人的年龄
v1 = [ 53, 64, 72, 82 ]
i = [ '1 号', '2 号', '3 号', '4 号' ]
sr1 = pd.Series( v1, index=i )
sr1
Out [2] :
1 号 53
2 号 64
3 号 72
4 号 82
dtype: int64
In [3] :
# 创建 sr2:各个病人的性别
v2 = [ '女', '男', '男', '女' ]
i = [ '1 号', '2 号', '3 号', '4 号' ]
sr2 = pd.Series( v2, index=i )
sr2
Out [3] :
1 号 女
2 号 男
3 号 男
4 号 女
dtype: object
In [4] :
# 创建 df 对象
df = pd.DataFrame( { '年龄':sr1, '性别':sr2 } )
df
Out [4] :
年龄
性别
1 号
53
女
2 号
64
男
3 号
72
男
4 号
82
女
如果 sr1 和 sr2 的 index 不完全一致,那么二维对象的 index 会取 sr1 与 sr2
的所有 index,相应的,该对象就会产生一定数量的缺失值(NaN)。
剩余30页未读,继续阅读
资源评论
每天学一点q
- 粉丝: 4
- 资源: 10
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- 文件批量改名神器10.0一款简单易用的批量文件重命名工具(已注册PRO版本).rar
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
- MyBatis动态SQL是一种强大的特性,它允许我们在SQL语句中根据条件动态地添加或删除某些部分,从而实现更加灵活和高效的数据
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功