没有合适的资源?快使用搜索试试~ 我知道了~
1. Pandas 的两个主要数据结构: Series 和 DateFrame 1. 创建: class pandas.Series(data=None, in
资源详情
资源评论
资源推荐
2022/4/27 pandas
huaxiaozhuan.com/工具/pandas/chapters/pandas.html 1/194
pandas 0.19
一、基本数据结构
1.
Pandas 的两个主要数据结构:
Series 和 DateFrame
1. Series
1.
创建:
class pandas.Series(data=None, index=None, dtype=None, name=None,
copy=False,fastpath=False)
:
参数:
data :它可以是一个字典、 array-like 、标量。表示 Series 包含的数据,如果是序列
/
数组,则它
必须是一维的
如果是字典,则字典的键指定了 label 。如果你同时使用了 index ,则以 index 为准。
如果是标量,则结果为:该标量扩充为 index 长度相同的列表。
index :一个 array-like 或者一个 Index 对象。它指定了 label 。其值必须唯一而且 hashable ,且
长度与 data 一致。如果 data 是一个字典,则 index 将会使用该字典的 key (此时 index 不起作
用)。如果未提供,则使用 np.arange(n) 。
name :一个字符串,为 Series 的名字。
dtype :指定数据类型。如果为 None ,则数据类型被自动推断
copy :一个布尔值。如果为 True ,则拷贝输入数据 data
2022/4/27 pandas
huaxiaozhuan.com/工具/pandas/chapters/pandas.html 2/194
2.
还可以通过类方法创建 Series : Series.from_array(arr, index=None, name=None, dtype=None,
copy=False, fastpath=False) :其中 arr 可以是一个字典、 array-like 、标量。其他参数见
1.
3.
我们可以将 Series 转换成其他数据类型:
.to_dict() :转换成字典,格式为 {label->value}
.to_frame([name]) :转换成 DataFrame 。 name 为 Index 的名字
.tolist() :转换成列表
2022/4/27 pandas
huaxiaozhuan.com/工具/pandas/chapters/pandas.html 3/194
4.
可以将 Series 转换成字符串:
buf :一个 StringIO-like 对象,是写入的 buffer
na_rep :一个字符串,代表数值 NaN
float_format :浮点数的格式化函数。应用于浮点列
header :一个布尔值。如果为 True ,则添加头部信息( index name )
index :一个布尔值。如果为 True ,则添加 index labels
length :一个布尔值。如果为 True ,则添加 Series 的长度信息
dtype :一个布尔值。如果为 True ,则添加 dtype 信息
name :一个布尔值。如果为 True ,则添加 Series name
max_rows :一个整数值,给出了最大转换的行数。如果为 None ,则转换全部。
返回转换后的字符串。
.to_string(buf=None, na_rep='NaN', float_format=None, header=True, index=True,
length=False, dtype=False, name=False, max_rows=None)
2022/4/27 pandas
huaxiaozhuan.com/工具/pandas/chapters/pandas.html 4/194
2. Index
1.
class pandas.Index(data=None, dtype=None, copy=False, name=None,
fastpath=False,
tupleize_cols=True) :创建 Index 对象。
参数:
data :一个 array-like ,必须是一维的
name :一个字符串,为 Index 的名字。
dtype :指定数据类型。如果为 None ,则默认为 object
copy :一个布尔值。如果为 True ,则拷贝输入数据 data
tupleize_cols :一个布尔值,如果可能则尽量创建 MultiIndex 对象
2022/4/27 pandas
huaxiaozhuan.com/工具/pandas/chapters/pandas.html 5/194
2.
Index 对象负责管理轴 label 和其他元数据(比如轴 name )。构建 Series/DataFrame 时,传给
index/columns 关键字的任何数组或者序列都将被转化成一个 Index 。 Index
对象是 immutable ,因此用
户无法对其进行修改。这样才能够使得 Index 对象在多个数据结构之间安全共享
3.
存在多种索引类型。
Index :最泛化的 Index 对象,将轴 label 表示为一个 Python 对象组成的 Numpy 数组
Int64Index :针对整数的特殊 Index
MultiIndex :层次化索引对象,表示单个轴上的多层索引。可以看做由元组组成的数组
DatatimeIndex :存储纳秒级时间戳,用 numpy 的 datatime64 类型表示
PeriodIndex :针对 Period 数据(时间间隔)的特殊 Index
4.
Index 的功能类似一个固定大小的集合。其类似于集合的方法有(因为 Index 不可变,因此返回的都是新
的 Index 对象):
.copy([name,deep,dtype]) :返回一份 Index 的拷贝。
.append(other) :连接另一个 Index 对象,产生一个新的 Index 对象。注意重复的 label 并不会合
并
.difference(other) :计算差集,返回一个 Index 对象
.intersection(other) :计算交集,返回一个 Index 对象
.union(other) :计算并集,返回一个新的 Index 对象
.isin(values[, level]) :计算 Index 中各 label 是否在 values 中
.delete(loc) :删除下标 loc 处的元素,得到新的 Index
.drop(labels[, errors]) :删除传入的 labels ,得到新的 Index
.insert(loc, item) :在指定下标位置插入值,得到新的 Index
.unique() :返回 Index 中唯一值的数组,得到新的 Index
剩余193页未读,继续阅读
兰若芊薇
- 粉丝: 23
- 资源: 301
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0