news 2026/4/16 12:00:48

【Python新手村】集合(Set):一个强迫症晚期的“去重大师”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Python新手村】集合(Set):一个强迫症晚期的“去重大师”

Python 集合(Set):一个强迫症晚期的“去重大师”

哈喽,各位 Python 探险家!

前面我们认识了列表(什么都装的收纳箱)和元组(上了锁的保险箱)。 今天,我们要介绍一位性格非常古怪的朋友——集合 (Set)

如果说列表是排得整整齐齐的队伍,那集合就是一个大麻袋。 往里一倒,顺序全乱,而且它有个严重的“洁癖”:绝对容不下重复的东西!

如果你给他一堆“张三、李四、张三”,他会冷酷地把第二个张三踢出去,只留下一个。 这就是集合,一个莫得感情的去重机器

1. 它是何方神圣?(创建集合)

集合和字典(Dictionary)长得很像,都戴着花括号{}。但字典是“键值对”,集合只有“值”。

# 创建一个集合 # Python: "我不喜欢重复,也不喜欢排队" my_set = {1, 2, 3, 3, 3, 4} print(my_set) # 输出: {1, 2, 3, 4} 看到没?多余的 3 全没了!

新手必踩的大坑:空集合陷阱

如果你想创建一个空集合,你可能会下意识地写:

empty_thing = {} # 错!大错特错! print(type(empty_thing)) # 输出: <class 'dict'> 居然是个字典?

为什么?因为 Python 的字典出道比集合早,{}这个符号早就被字典占用了。正确写法:必须使用set()工厂函数。

real_empty_set = set() # 这才是正宗的空集合

2. 它的脾气:无序且任性

在列表里,你可以说“我要第 0 个元素”。 在集合里?没门!

s = {"香蕉", "苹果", "西瓜"} # print(s[0]) # 报错: TypeError: 'set' object is not subscriptable

翻译成人话:集合里的东西是无序的,就像麻袋里的土豆,谁在前谁在后全看天意(其实是看哈希值,后面细说)。既然没有顺序,自然就没有索引。

3. 核心绝技:一键去重

这是集合在面试和实战中出现率 99% 的场景。 比如你有一个列表,里面有很多重复的用户 ID,你想去重,怎么办?

普通青年:写个 for 循环,一个个判断...(太累了)Python 青年:

id_list = [101, 102, 101, 103, 102] # 一行代码搞定去重:列表 -> 集合 -> 列表 unique_ids = list(set(id_list)) print(unique_ids) # [101, 102, 103]

简单、粗暴、有效。

4. 隐藏技能:数学课代表 (集合运算)

还记得小学数学学的交集、并集、差集吗?(如果不记得了,请假装记得)。 Python 的集合天生就是做这个的,语法简洁到让你想哭。

假设你有两波朋友:

  • A波朋友喜欢吃火锅:hotpot_lovers = {"张三", "李四", "王五"}

  • B波朋友喜欢吃烧烤:bbq_lovers = {"李四", "赵六", "钱七"}

场景 1:既吃火锅又吃烧烤的(交集 &)也就是找共同好友。

# 这里的 & 就像两只手握在一起 print(hotpot_lovers & bbq_lovers) # 输出: {'李四'}

场景 2:吃火锅或者吃烧烤的(并集 |)大家聚在一起开大趴体。

# 这里的 | 就像一根棍子把两边连起来 print(hotpot_lovers | bbq_lovers) # 输出: {'张三', '王五', '李四', '赵六', '钱七'} (自动去重了李四)

场景 3:只吃火锅不吃烧烤的(差集 -)要把那些“叛徒”剔除出去。

# 就像数学减法一样自然 print(hotpot_lovers - bbq_lovers) # 输出: {'张三', '王五'} (李四因为吃烧烤被踢除了)

5. 增删改:小心翼翼的操作

  • 加人add()

  • 踢人remove()vsdiscard()

这里有个很有意思的区别:

s = {1, 2, 3} s.remove(4) # 报错!KeyError。remove 脾气暴躁,删不到就炸毛。 s.discard(4) # 没事。discard 很佛系,有就删,没有就算了。

建议:除非你明确知道元素一定存在,否则用discard()更安全,不容易让程序崩掉。

6. 个人理解:为啥集合查东西特别快?

这是进阶干货! 你可能会问:“既然列表能存东西,集合也能存,除了去重,集合还有啥用?”

答案是:速度。

想象一下你去图书馆找书:

  • 列表(List):就像把书乱堆在地上。你要找一本书,得从头一本本翻,运气不好要翻到最后。(时间复杂度 O(n))

  • 集合(Set):就像有索引系统的书架。每本书都有固定的位置(通过哈希算法计算)。你要找一本书,算一下它的哈希值,直接走到那个位置。有就是有,没有就是没有,不用翻别人。(时间复杂度 O(1))

所以,如果你需要频繁判断if x in data,请务必把data转成集合!速度提升不是一点半点。

总结

Python 的集合 (Set) 是一个特立独行的家伙:

  • 样子是花括号{},但空集合要用set()

  • 性格是容不下重复(去重神器)。

  • 特长是数学运算(交、并、差)。

  • 本质是哈希表(查找速度极快)。

下次遇到“去重”或者“找共同好友”的需求,别犹豫,召唤集合吧!

觉得这篇有意思?点个赞是对“强迫症”作者最好的治愈!(。♥‿♥。)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:16:52

Kurator 小白入门指南:轻松上手开源 AI 智能体平台

Kurator 小白入门指南&#xff1a;轻松上手开源 AI 智能体平台 什么是 Kurator&#xff1f; Kurator 是一个由阿里云推出的开源智能体&#xff08;Agent&#xff09;开发与运行平台&#xff0c;旨在帮助开发者、研究人员甚至非技术人员更轻松地构建、部署和管理基于大模型的 …

作者头像 李华
网站建设 2026/4/16 11:16:01

2025五款主流AI编程工具实测

伴随AI技术在软件开发领域的规模化渗透&#xff0c;各类AI编程辅助工具持续涌现&#xff0c;显著重构传统开发流程的同时&#xff0c;也让不同场景下的开发者面临选型困境。为解决这一行业痛点&#xff0c;本次评测选取市面五款主流AI编程工具——Cursor、Qoder、Trae、CodeBud…

作者头像 李华
网站建设 2026/4/15 14:41:37

【专家级解决方案】:构建低功耗智能家居系统的7个必须步骤

第一章&#xff1a;智能家居 Agent 的能源管理核心理念智能家居 Agent 在现代家庭能源优化中扮演着关键角色。其核心理念是通过实时感知、智能决策与动态调度&#xff0c;实现能源使用的高效性、可持续性与用户舒适度之间的平衡。Agent 不仅监控各类电器的能耗状态&#xff0c;…

作者头像 李华
网站建设 2026/4/16 9:26:21

MySQL掌握基本入门操作

本文总结&#xff1a;MySQL是一种关系型数据库管理系统&#xff0c;支持SQL语言操作数据。文章介绍了MySQL的基本概念、安装连接方法、数据库创建及数据模型。重点讲解了SQL语句分类&#xff08;DDL、DML、DQL、DCL&#xff09;及其常用操作语法&#xff0c;包括表创建、约束设…

作者头像 李华
网站建设 2026/4/10 13:18:19

java计算机毕业设计水果销售平台的设计与实现 基于SpringBoot的鲜果商城系统的设计与实现 水果线上选购与订单管理平台开发

计算机毕业设计水果销售平台的设计与实现is0e49 &#xff08;配套有源码 程序 mysql数据库 论文&#xff09; 本套源码可以在文本联xi,先看具体系统功能演示视频领取&#xff0c;可分享源码参考。外卖半小时到&#xff0c;楼下水果店却关得早&#xff1b;疫情之后&#xff0c;更…

作者头像 李华