news 2026/4/16 14:33:12

DeepSeek总结的postgresql扩展方案文章

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepSeek总结的postgresql扩展方案文章

历史在重演

原文地址:https://richyen.com/postgres/2026/02/04/history_repeats_itself.html

时隔十五年,一些解决方案依然是优秀的解决方案

引言

OpenAI 最近分享了他们如何在 ChatGPT 平台上扩展至8 亿用户的故事。过去一年,随着人工智能的蓬勃发展,他们无疑面临了一些重大的扩展挑战,而我很好奇他们是如何应对的。概括来说,他们通过以下方案解决了以下问题:

  1. 减轻主库负载(将只读查询分流到副本)
  2. 查询优化(查询调优和配置超时参数,如idle_in_transaction_session_timeout
  3. 单点故障缓解(配置热备以实现高可用)
  4. 工作负载隔离(实施了软件负载均衡方案)
  5. 连接池(部署了 pgBouncer)
  6. 缓存未命中(实现了缓存锁定机制)
  7. 扩展读副本(实施了级联复制)
  8. 资源耗尽(实施了速率限制,优化了 ORM)
  9. 模式变更导致的全表重写(执行了严格的 DML 策略)

诚然,要扩展到“每秒数百万次查询(QPS)”,他们投入了大量工作。我为他们团队实施这些方案以应对独特挑战而喝彩。👏👏👏

追忆往昔

阅读他们的文章时,我不禁想:哇,他们使用的一些解决方案和我们15 年前的没什么太大不同!十五年前,我是 Turnitin(当时叫 iParadigms)的首席 DBA。那时时代不同,社交媒体还未大规模兴起(当时 Instagram 还不存在!),我们都在本地部署,正从机械硬盘转向 SSD。当时,我们也同样面临着扩展至3000 QPS以服务美国、加拿大和英国师生数据的挑战。公司的创始人正在大力推广 Turnitin 进入中学和大学,而我们常常挣扎于只有“刚好足够”的资源来维持系统平稳运行。

有些东西(无需)改变

为了应对我们15 年前面临的挑战,我们采用了与 OpenAI 团队在2025 年设计的相似方案,即:

减轻主库负载
为了减轻主库负载,我们也实施了一个基于软件的解决方案,将只读查询发送到副本。我们用 Perl 编写了一个“复用器”(Multiplexor),监听所有传入的数据库流量(端口 5432),将包含 DML 查询的事务导向主库,而将其他查询发送到备用库。这确保了主库主要接收写流量(尽管部分读流量不可避免),并尽可能降低了 I/O。

连接池
为了确保每个数据库会话在排序、连接和聚合操作中获得最大资源,OpenAI 选择了pgBouncer作为连接池,并使用Kubernetes作为负载均衡机制。这很巧妙(我们那时没有 Kubernetes,但如果我再次担任 DBA 角色,我想我会采用它)。pgBouncer 是连接池的可靠选择;其高度可配置性和服务器会话管理能力,使 DBA 能够有效降低运维开销并保持高资源可用性。

工作负载隔离
为了隔离高优先级和低优先级的工作负载,OpenAI 实施了一个软件解决方案。他们没有具体说明,但我猜想这与他们的 Kubernetes 负载均衡配置有关。当时,我们也希望确保负载能在四个副本之间平衡,避免任何一个承受大部分读流量。为此,我们使用了haproxy,并配置它运行一些健康检查 Bash 脚本来决定流量路由。十五年过去了,haproxy 或许不再是热门词汇,但扎实的脚本和软件工程能力依然是维持系统运转的关键!

扩展读副本
OpenAI 团队详细介绍了他们如何利用级联复制作为扩展机制,扩展到“近50 个读副本”来处理其数百万 QPS。我猜测,除了给数据库带来巨大负载外,数百万 QPS 可能也让他们的网络团队在带宽消耗上有些头疼,不过这是题外话了……在 Turnitin,我们也采用了级联复制——不仅为了扩展读流量,也作为高可用性和灾难恢复的机制。通过将 WAL 文件传送到不同区域,我们能够拥有一个完全相同的数据库集群——1 个主库和 4 个备用库——而执行故障转移只需更改一个 CNAME 记录,将写流量导向新位置。之后,我们可以使用pg_rewind等工具将旧区域重新连接到新的主库区域。

结论

有趣且令人欣慰的是,15 年后,我们在 Turnitin 使用的一些相同方案,正被世界上最大的 PostgreSQL 部署之一所采用。这再次印证了一个事实:PostgreSQL 确实是“世界上最先进的开源关系型数据库”。PostgreSQL 社区人才济济,他们的专业知识深厚,代码健壮。即使是像pgBouncer这样的工具也极其可靠,足以应对超重负载、数百万 QPS 的工作场景。为 PostgreSQL 喝彩! 🐘

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 17:56:59

端口与进程的关系:网络服务是怎么“开门”的?

在计算机的世界里,网络通信无处不在。当你浏览网页、发送邮件或在线聊天时,数据就像信件一样在互联网上穿梭。但你有没有想过,这些“信件”是如何精准地找到你电脑上的那个特定软件的?这背后,端口与进程的关系起到了关…

作者头像 李华
网站建设 2026/4/16 12:33:13

开题报告 基于ASPNET的课程信息管理系统

目录研究背景与意义系统功能模块技术选型与架构创新点预期成果项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作研究背景与意义 随着教育信息化的发展,传统手工管理课程信息的方式效率低下且易出…

作者头像 李华
网站建设 2026/4/16 12:42:25

辐射制冷无规散射结构非球形散射体的结构优化与设计准则

1. 论文中文标题 辐射制冷无规散射结构非球形散射体的结构优化与设计准则 2. 论文主要内容概括 本文针对辐射制冷无规散射结构中球形散射体后向散射能力弱的问题,系统研究了五种非球形散射体(球体、椭球体、圆柱体、长方体、金字塔形、圆锥形)的光散射特性。采用离散偶极子…

作者头像 李华
网站建设 2026/4/16 14:22:06

马年写论文不翻车!2026 高性价比 AI 写作工具全推荐

马年论文冲刺,选对工具少走弯路!结合学术合规、性价比、场景适配三大核心,为你整理2026年高性价比AI论文工具清单,覆盖本科到博士、期刊投稿全场景,帮你高效通关不翻车。 🌟 核心推荐榜(按场景…

作者头像 李华
网站建设 2026/4/3 1:34:45

MCP已死,Skill当立!A社大一统Agent Skill为行业标准规范!

AI进化发展到了今天,我们终于撞上了一堵墙。 通用大模型什么都懂,但它不懂你的业务。 你把Claude接入了公司内网。你期待它成为那个无所不知的超级员工。但现实很骨感。它不知道你的报销流程。它不懂你团队的代码规范。它甚至不知道怎么去查询内部的数…

作者头像 李华