news 2026/4/15 18:16:51

原来这才是Pandas!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
原来这才是Pandas!

听到一些人说,Pandas语法太乱、太杂了,根本记不住。

确实,Pandas方法函数众多,光读取数据read()方式就有十几种。

而且同一个数据处理场景同时有好几个方法可实现,比如拼接函数merge()和join()。

导致Pandas使用起来有杂乱无章的感觉,特别是对于初学者,这种体会尤为强烈。

但是,Pandas真的“乱”吗?

先来讲讲Pandas”乱“的原因,再详细说说怎么有效学Pandas。

Pandas语法复杂不是设计层面有问题,主要是因为它要做的事太多了。

你可以把Pandas看作代码界的Excel,都是处理行列数据的工具。

Excel的按钮和组件不计其数,比如导入、格式、转化、插入、透视等。

Pandas其实也需要处理同样多的事情,Excel的每一个按钮都对应Pandas的一个函数或方法,所以复杂度可见一斑。

其次Pandas还要兼顾面向对象和函数式两种编程风格。

比如df.join()是面向对象风格,而pd.merge()则是函数式风格。

虽然功能接近,但必须要这样设计。

因为面向对象是Python语言的核心理念,而函数式风格又能简化pandas处理数据的流程。

所以导致Pandas的API就格外的多了。

说了Pandas之所以”乱“的原因,想必你能理解这其中的不得已了。

想用好Pandas,其实也没那么难,你只需要掌握它的核心架构就可以,知道了全貌就能有的放矢、手到擒来。

Pandas有两种数据结构,DataFrame和Series。

DataFrame是二维数组,Series是一维数组,DataFame类似于Excel表格,有行和列,这是用的最多的数据形式。

随之而来的是这两种数据结构有各种各样的方法和属性,用来处理数据,比如df.apply()df.join()等。

在这两种数据结构的方法之外,Pandas又有顶级函数,方便直接处理数据,一般都是pd.xx形式调用,比如pd.merge()pd.concat()

接下来是Pandas中主要的几种操作方法,这里可以参考Pandas官方的cheetsheet导图来看,非常的详细且清晰。

高清PDF版本:夸克网盘分享

首先是数据IO类操作,用来数据加载和导出,多数是Excel和CSV数据。

一般使用pd.read_excel()pd.read_csv(),其实不难。

其次是创建DataFrame操作,这是最常遇到的场景之一,使用pd.DataFrame()方法。

数据的变形处理是高频操作,比如拼接、透视、行列转化、排序等,对应pd.concat()df.pivot()pd.melt()df.ort_values()等方法。

分组操作也是经常会遇到的数据处理任务,熟悉Excel透视的都会知道,在Pandas里通过df.groupby()方法实现。

不同表的关联,类似SQL中Join,在Pandas中主要使用pd.merge()实现。

数据表的子集操作,比如取样、索引、去重、最值、前N行等。

缺失值处理也是数据清洗高频操作,一般会用df.dropna()df.fillna()

Pandas也支持可视化图表的绘制,使用df.plot.xx()方法。

Pandas中的运算逻辑和正则表达式很重要。

数据的滑动窗口计算,使用df.rolling()

Pandas支持方法链的操作,一次性清洗数据。

还有很多方法这里不一一介绍了,大家可以多看看Pandas的官方文档,非常详细。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:06:26

Puppeteer,非常好用的一款爬虫和自动化利器~

最近写爬虫采集电商数据,遇到很多动态加载的数据,如果用requests来抓包非常难,我尝试用了一个大家较为陌生的的工具——Puppeteer,它支持控制浏览器,能很好的采集动态网页,后来发现它不仅是一个爬虫工具&am…

作者头像 李华
网站建设 2026/4/16 9:02:52

告别卡顿!使用CUDA加速Fun-ASR模型实现1倍实时语音识别

告别卡顿!使用CUDA加速Fun-ASR模型实现1倍实时语音识别 在远程会议频繁、课堂录音成常态的今天,你是否也经历过这样的场景:点击“语音转文字”,进度条缓慢爬行,等了半分钟才出几句话?更糟的是,系…

作者头像 李华
网站建设 2026/4/16 9:04:27

语音识别也能平民化?Fun-ASR开源模型+GPU镜像一键启动

语音识别也能平民化?Fun-ASR开源模型GPU镜像一键启动 在智能办公、远程会议和在线教育日益普及的今天,我们每天都在产生海量的语音数据。但如何高效、安全地将这些声音转化为可用的文字信息,依然是许多开发者和中小企业面临的一大挑战。 传统…

作者头像 李华
网站建设 2026/4/16 12:16:18

全面讲解主流工控系统对USB-serial的支持方案

工控现场的“串口复活术”:从USB-Serial芯片到系统级稳定通信全解析 你有没有遇到过这样的场景? 一台崭新的无风扇工控机部署到现场,准备接入老式PLC或传感器时,却发现—— 没有DB9串口 。更糟的是,插上USB转RS485适…

作者头像 李华
网站建设 2026/4/14 7:26:59

ESG报告纳入:体现企业社会责任担当

ESG 融合视角下的语音识别实践:Fun-ASR 如何以技术向善重塑企业责任边界 在远程办公常态化、会议记录数字化、客户服务智能化的今天,一个看似不起眼的技术环节——语音转文字,正悄然成为衡量企业效率与责任感的关键标尺。我们不再仅仅关心“能…

作者头像 李华
网站建设 2026/4/15 8:15:01

碳积分交易设想:节能收益可兑换Token

碳积分交易设想:节能收益可兑换Token 在企业ESG目标日益刚性、公众环保意识持续觉醒的今天,如何让“节能减排”从口号落地为可感知、可激励的行为闭环,成为绿色科技领域的重要命题。传统的碳积分体系依赖人工申报与中心化审核,流程…

作者头像 李华