【免费】数据聚合与分组操作1资源-CSDN文库

python

需积分: 0 42 浏览量 2022-08-03 13:14:01 上传评论收藏 107KB PDF 举报

资源推荐

资源详情

资源评论

数据聚合与分组操作

GroupBy机制

数据聚合

应用：通用拆分-应用-联合

数据透视表与交叉表

基础

遍历各分组

选择一列或所有列的子集

使用字典和Series分组

使用函数分组

根据索引层级分组

groupby方法

数据根据分组键进行了聚合，并产生了一个新的Series，这个Series使用key1列的唯一

值作为索引

返回值

GroupBy对象

如果传入值是多个数组作为列表传入，结果Series会有一个包含唯一键对的多层索引

GroupBy对象支持迭代，会生成一个包含组名和数据块的2为元组序列

for name, group in df.groupby('key1'):

在多个分组键的情况下，元组中的第一个元素是键值的元组

for (key1, key2), group in df,groupby(['key1', 'key2']):

默认情况下，groupby在axis=0的轴向上分组

df.groupby('key1')['data1']

如果传递的是列表或数组，则此索引操作返回的对象是分组的DataFrame

如果只有单个列名作为标量传递，则为分组的Series

分组信息可能会以非数组形式存在

根据字典构造传给groupby的数组，也可以直接传字典

people.groupby(mapping, axis=1)

作为分组键传递的函数将会按照每个索引值调用一次，同时返回值会被用作分组名称

level关键字

层级数值或层级名称

聚合是指所有根据数据产生标量值的数据转换过程

优化的groupby方法

count

sum

median

min/max

std/var

first/last

使用自己的聚合函数

aggregate

agg

describe

quantile

Series或DataFrame列的样本分位数

不是显式地为GroupBy对象实现的，但是是Series的方法

基础

逐列及多函数应用

返回不含行索引的聚合数据

根据各列同时使用多个函数进行聚合

向agg/aggregate传递函数或者是函数名的列表，可以得到列名是这些函数名的

DataFrame

自定义DataFrame的列名

传递(name, function)

可以指定应用到所有列上的函数列表或每一列要应用的不同函数

将不同的函数应用到一个或多个列上

将有列名与函数对应关系的字典传递给agg/aggregate

当多个函数应用到至少一个列上时，DataFrame具有分层列

as_index=False

禁用分组键作为索引

reset_index

在结果上调用这个方法也可以获得同样的效果

apply方法

应用

将对象分为多块，然后在每一块上调用传递的函数，之后尝试将每一块拼接在一起

压缩分组键

除了函数还可以传递其他参数或关键字，要放在函数后进行传递

group_keys=False

分位数与桶分析

禁用分组键形成的分层索引

cut/qcut返回的Categorical对象可以直接传递给groupby

数据透视表

交叉表

pandas.crosstab函数

是根据一个或多个键聚合一张表的数据，将数据在矩形格式中排列，其中一部分分组键

是沿着行的，另一些是沿着列的

pivot_table方法和pandas.pivot_table顶层函数

margins=True

index

添加部分总计

columns

增加一个All行和列标签

aggfunc

使用不同的聚合函数或函数列表

fill_value

填补空值

fill_value=0

是数据透视表的一个特殊情况

默认是mean

dropna

如果为True，将不含所有条目均为NA的列

margins

添加行/列小计和总计

默认为False

计算的是分组中的频率

前两个参数可以是数组、Series或数组的列表

第一个参数是columns

第二个参数是index

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

评论收藏

内容反馈

叫我叔叔就行

粉丝: 23
资源: 323

数据聚合与分组操作1

Python数据处理第5章 数据聚合与分组运算.pptx

数据分析-pandas入门-数据聚合与分组

python3数据聚合与分组运算.docx

Python数据分析实践：数据处理操作groupby分组new.pdf

Python数据处理单元四 使用pandas进行数据分组与聚合.docx

MySQL数据操作与查询笔记 • 【第6章 聚合函数和分组查询】

实验三 运动员信息的分组与聚合

3-3数据库进阶操作：数据过滤与分组聚合.html

[数据分析师课件]3-3数据库进阶操作：数据过滤与分组聚合.html

pandas数据分组和聚合操作方法

利用Python进行数据分析——数据聚合与组操作

django框架F&Q 聚合与分组操作示例

数据分析实践 使用Excel和SQL进行数据分析 数据分析教程课件 数据分析实战课程 共94页.pdf

Pandas高级操作: 时间序列与数据可视化

MOMO聊天数据分析ETL操作.docx

数据分析师课件培训完整笔记HTML文本格式

Python数据分析实践：透视表和重塑dataframenew.pdf

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

大麦网抢票脚本【Python脚本】

Python数据分析项目实践，包括数据读取、评估、清洗、分析、可视化机器学习相关内容等

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

YOLOv8-火焰识别（火焰数据集+代码+GUI界面+内置训练好的模型文件）

Python学习笔记(干货) 中文PDF完整版.pdf

人体姿态检测

Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料

最新资源

Python数据处理第5章数据聚合与分组运算.pptx

Python数据处理单元四使用pandas进行数据分组与聚合.docx

MySQL数据操作与查询笔记 • 【第6章聚合函数和分组查询】

实验三运动员信息的分组与聚合

数据分析实践使用Excel和SQL进行数据分析数据分析教程课件数据分析实战课程共94页.pdf

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计

Python教程2020版完全入门达到Python工程师水平笔记+代码+课件+资料