news 2026/4/16 11:45:19

数据分析之Pandas分组操作总结

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
数据分析之Pandas分组操作总结

数据分析之Pandas分组操作总结

Pandas做分析数据,可以分为索引、分组、变形及合并四种操作。之前介绍过索引操作,现在接着对Pandas中的分组操作进行介绍:主要包含SAC含义、groupby函数、聚合、过滤和变换、apply函数。

在详细讲解每个模块之前,首先读入数据:

dic = {'地市': ['廊坊','廊坊','廊坊','张家口','张家口','张家口','廊坊','承德','承德','承德','石家庄','石家庄','石家庄','石家庄'],'数量':[11,12,13,14,15,16,17,18,19,20,21,22,23,24]}
p_city = pd.DataFrame(dic)

print(p_city )

输出:

SAC过程

1.内涵

SAC指的是分组操作中的split-apply-combine过程。其中split指基于某一些规则,将数据拆成若干组;apply是指对每一组独立地使用函数;combine指将每一组的结果组合成某一类数据结构。

2. apply过程

apply过程中,我们实际往往会遇到四类问题:

整合(Aggregation):即分组计算统计量(如求均值、求每组元素个数);

变换(Transformation):即分组对每个单元的数据进行操作(如元素标准化);

过滤(Filtration):即按照某些规则筛选出一些组(如选出组内某一指标小于50的组);

综合问题:即前面提及的三种问题的混合。

groupby函数

经过groupby后会生成一个groupby对象,该对象本身不会返回任何内容,只有当相应的方法被调用才会起作用。

1.分组函数的基本内容:

根据某一列分组

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 11:45:18

PvZWidescreen:植物大战僵尸宽屏适配技术解析与实践指南

PvZWidescreen:植物大战僵尸宽屏适配技术解析与实践指南 【免费下载链接】PvZWidescreen Widescreen mod for Plants vs Zombies 项目地址: https://gitcode.com/gh_mirrors/pv/PvZWidescreen PvZWidescreen 是一款基于 Rust 语言开发的《植物大战僵尸》宽屏…

作者头像 李华
网站建设 2026/4/16 11:39:08

AKShare金融数据接口库:零基础打造个人量化分析系统

AKShare金融数据接口库:零基础打造个人量化分析系统 【免费下载链接】akshare AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 项目地址: https://gitcode.com/gh_mirrors/aks/aksh…

作者头像 李华
网站建设 2026/4/16 11:36:45

从数据集到部署:我的YOLOv8盲道检测项目全记录(附训练曲线和避坑点)

从数据集到部署:我的YOLOv8盲道检测项目全记录 盲道作为城市无障碍设施的重要组成部分,其畅通与否直接关系到视障人士的出行安全。然而在实际场景中,盲道被占用、破损的情况屡见不鲜。本文将完整记录我如何从零开始构建一个基于YOLOv8的盲道障…

作者头像 李华
网站建设 2026/4/16 11:36:12

从像素阵列到数据流:深入解析OV5640图像传感器核心架构

1. OV5640图像传感器概述 OV5640是OmniVision公司推出的一款高性能CMOS图像传感器,在嵌入式视觉领域应用广泛。这款传感器最大的特点是将完整的图像采集和处理流程集成在单个芯片上,从光线捕捉到数字信号输出一气呵成。我在多个智能硬件项目中使用过这款…

作者头像 李华