news 2026/4/16 16:39:17

行式存储 vs 列式存储:原理、差异与真实业务案例解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
行式存储 vs 列式存储:原理、差异与真实业务案例解析

文章目录

  • 一、什么是行式存储和列式存储?
  • 二、核心差异一览
  • 三、业务案例一:订单详情查询(典型 OLTP)
  • 四、业务案例二:销售额统计报表(典型 OLAP)
  • 五、真实对比案例(10 亿订单表)
  • 六、为什么列式存储在分析场景这么快?
  • 七、真实系统中的最佳实践架构
  • 八、选型建议
  • 九、总结

在数据库选型时,很多性能问题并不是 SQL 写得不好,而是存储模型从一开始就选错了

本文将通过原理讲解 + 实际业务案例,帮助你真正理解:

为什么有的系统适合行式存储,有的系统必须用列式存储?


一、什么是行式存储和列式存储?

1️⃣ 行式存储(Row-based Storage)

以“行”为单位存储数据,一行的所有字段在物理上连续存放。

示例表:

order_iduser_idamountstatus
1100199.9PAID
21002199.0PAID

行式存储逻辑结构:

[1, 1001, 99.9, PAID] [2, 1002, 199.0, PAID]

2️⃣ 列式存储(Column-based Storage)

以“列”为单位存储数据,同一列的数据连续存放。

order_id: [1, 2] user_id: [1001, 1002] amount: [99.9, 199.0] status: [PAID, PAID]

二、核心差异一览

对比维度行式存储列式存储
存储单位
查询方式点查扫描
I/O读整行只读列
更新
压缩一般极强
适合场景OLTPOLAP

三、业务案例一:订单详情查询(典型 OLTP)

业务需求

用户在 App 中查看自己的订单详情

SELECT*FROMordersWHEREorder_id=123456;

数据特点

  • 查询单行
  • 高频访问
  • 需要事务保证

行式存储表现(MySQL)

  • 通过B+Tree 索引
  • 一次磁盘 I/O 读取整行
  • 返回完整记录

👉性能极高,毫秒级返回


列式存储表现(ClickHouse)

  • 需要从多个列文件中拼装一行
  • 不适合点查
  • 并发能力弱

明显不适合


结论

订单系统、用户系统必须使用行式存储


四、业务案例二:销售额统计报表(典型 OLAP)

业务需求

统计 2025 年每个月的销售额

SELECTtoMonth(create_time)ASmonth,SUM(amount)AStotal_amountFROMordersWHEREcreate_time>='2025-01-01'GROUPBYmonth;

行式存储的执行方式(MySQL)

  • 扫描整张 orders 表
  • 每一行都读取所有字段
  • 大量无效 I/O

📉数据量一大,查询变慢


列式存储的执行方式(ClickHouse)

  • 只读取create_timeamount两列
  • 列数据连续、压缩率高
  • 向量化并行计算

📈百万级数据,秒级返回


结论

统计分析场景,列式存储碾压行式存储


五、真实对比案例(10 亿订单表)

表规模

  • 订单表:10 亿行
  • 字段数:20
  • 查询字段:2 个

性能对比

存储方式扫描数据量查询耗时
行式存储全行 20 列60+ 秒
列式存储仅 2 列2~3 秒

👉差距来源:I/O + 压缩 + 并行


六、为什么列式存储在分析场景这么快?

1️⃣ 只读取必要的列

  • 减少磁盘 I/O

2️⃣ 高效压缩

  • 同类型数据连续
  • 压缩比 5~10 倍

3️⃣ 向量化执行

  • 一次处理 1024 行
  • CPU Cache 友好

七、真实系统中的最佳实践架构

行式 + 列式 混合使用(最常见)

业务系统 | MySQL(行式存储,OLTP) | CDC / MQ | ClickHouse(列式存储,OLAP)
  • MySQL:写、事务、点查
  • ClickHouse:报表、分析、统计

👉各司其职,性能最大化


八、选型建议

快速判断口诀

写多用行式,算多用列式

场景建议
订单 / 用户行式存储
BI 报表列式存储
实时分析行式 + 列式
数据仓库列式存储

九、总结

  • 行式存储是事务系统的基石
  • 列式存储是分析系统的利器
  • 二者不是替代关系,而是协作关系

一个成熟的系统,一定同时使用行式存储和列式存储

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 14:43:41

如何在 Python 中使用 Jupyter Kernel 运行代码并获取输出

在这篇文章中,我们将介绍如何在 Python 中使用 jupyter_client 包来启动 Jupyter Kernel,并通过它执行代码并获取输出。使用 Jupyter Kernel 是一种非常强大的方式,可以让你在 Python 程序中动态执行代码并获取结果。 下面是实现这一过程的详…

作者头像 李华
网站建设 2026/4/16 13:06:53

RK3588嵌入式AI工业部署:YOLOv11 + OpenCV实时推理系统全栈实现

文章目录 从0到1:RK3588部署YOLOv11并结合OpenCV实现实时推理全流程(保姆级教程) 一、前置知识与工具准备 工具清单 二、PT模型转ONNX格式 步骤1:准备YOLOv11的PT模型文件 步骤2:执行转换命令 三、ONNX模型转RKNN格式 步骤1:搭建转换环境 步骤2:编写转换脚本 步骤3:执行…

作者头像 李华
网站建设 2026/4/16 12:27:53

深入RK3588 AI栈:YOLOv11模型部署、OpenCV集成与实时推理引擎构建详解

文章目录 从0到1:RK3588部署YOLOv11并结合OpenCV实现实时推理全流程(保姆级教程) 一、前置知识与工具准备 工具清单 二、PT模型转ONNX格式 步骤1:准备YOLOv11的PT模型文件 步骤2:执行转换命令 三、ONNX模型转RKNN格式 步骤1:搭建转换环境 步骤2:编写转换脚本 步骤3:执行…

作者头像 李华
网站建设 2026/4/16 13:03:06

探秘德国SCA自动涂胶机系统技术资料

德国SCA自动涂胶机系统技术资料德国SCA自动涂胶机系统技术资料 资料如介绍图的文件 嘿,各位技术爱好者们!今天咱们来聊聊德国SCA自动涂胶机系统技术资料。德国在工业技术领域一直有着极高的声誉,其制造的设备往往以精密、高效著称&#xff0c…

作者头像 李华
网站建设 2026/4/16 13:44:42

为什么在新加坡售出的汽车虫中,豪华车所占比例比美国高?

为什么在新加坡售出的汽车虫中,豪华车所占比例比美国高?新加坡豪华车占比远高于美国,核心是极端拥车成本 配额制度 税费结构 财富与用车场景的综合作用,本质是 “高门槛筛选出高净值买家 边际成本效应 身份象征” 的市场逻辑&#xff0…

作者头像 李华