news 2026/4/16 16:20:02

ClickHouse 大数据量场景下执行 ALTER TABLE UPDATE问题(ClickHouse 里,数据最好“只进不出,只增不改”) | ReplicatedReplacingMergeTr

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ClickHouse 大数据量场景下执行 ALTER TABLE UPDATE问题(ClickHouse 里,数据最好“只进不出,只增不改”) | ReplicatedReplacingMergeTr

文章目录

  • ClickHouse 大数据量场景下执行 ALTER TABLE UPDATE问题
    • 问题描述
      • 官方文档
    • ClickHouse 修改数据的最佳实践(大数据量/生产)
      • 只进不出,只增不改
        • ReplacingMergeTree:同一主键多版本,取最新
        • CollapsingMergeTree:用正负记录“抵消”
    • ReplicatedReplacingMergeTree 和ReplicatedMergeTree 区别
      • ReplicatedMergeTree 业务重复:同一事件被上游多次投递

ClickHouse 大数据量场景下执行 ALTER TABLE UPDATE问题

问题描述

在 ClickHouse 大数据量场景下执行 ALTER TABLE UPDATE 需要谨慎:

风险点

  1. 资源消耗大
    ALTER TABLE UPDATE 会触发 mutation,本质是重写所有相关的数据 part
    大表可能导致:磁盘 I/O 飙升、CPU 占用高、内存压力大。
    Mutation 会对命中的数据 以 part 为单位重写(更准确说:对包含被影响行的 parts 生成新的变体并替换),因此会带来显著的 磁盘读写、CPU(解压/重压缩)、后台 merge 压力。命中范围越大、压缩算法越重、列越多,成本越高。
  2. 执行时间长
    mutation 是异步后台执行,大表可能需要几小时甚至更久
    期间会持续消耗集群资源。
  3. 可能影响查询性能
    mutation 执行期间,读写性能可能下降
    如果是生产环境,可能影响业务
  4. 无法回滚
    ClickHouse 的 mutation 不支持回滚。你可以 KILL MUTATION 来停止尚未完成的 mutation,但:已经生成并替换的 parts 不会“自动回到旧版本”
    一旦执行,只能等待完成或手动 kill

官方文档

官方文档:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 23:45:14

Leetcode 2.两数相加 JavaScript (Day 11)

js一刷自解暴力 var addTwoNumbers function(l1, l2) {let p1l1,p2l2,m0;let bummynew ListNode();let curbummywhile(p1&&p2){let nodenew ListNode();let valuep1.valp2.valm;m0;if(value>10){m Math.floor(value / 10);valuevalue%10;}node.valvalue;cur.next…

作者头像 李华
网站建设 2026/4/16 10:43:26

Leetcode 24. 两两交换链表中的节点 JavaScript (Day 11)

js一刷 迭代 var swapPairs function(head) {let dummynew ListNode(0,head);let node0dummy;let node1head;while(node1&&node1.next){let node2node1.next;let node3node2.next;node0.nextnode2;node1.nextnode3;node2.nextnode1;node0node1;node1node3}return dumm…

作者头像 李华
网站建设 2026/4/15 19:57:20

量化压缩HunyuanOCR模型:INT8量化后性能损失多少?实测告诉你

量化压缩HunyuanOCR模型:INT8后性能损失多少?实测告诉你 在当前多模态大模型加速落地的背景下,OCR技术正经历一场深刻的架构变革。从过去依赖检测、识别、抽取多个独立模型拼接的“流水线”模式,逐步演进为像腾讯混元团队推出的 H…

作者头像 李华
网站建设 2026/4/16 2:53:10

HunyuanOCR能否保留原文格式?字体、大小、颜色还原程度评估

HunyuanOCR能否保留原文格式?字体、大小、颜色还原程度评估 在数字化转型加速的今天,文档处理早已不再满足于“把图片转成文字”这一基础需求。越来越多的应用场景——比如电子合同归档、教学资料再编辑、出版物扫描重建——都要求OCR系统不仅能识别内容…

作者头像 李华
网站建设 2026/4/16 7:07:15

Ehercat代码解析中文摘录<4>

8. 邮箱 EtherCAT 邮箱(MBX)用于传输非周期性数据,SSC 支持多种邮箱协议,本章介绍 FoE 和 EoE 的实现与使用。 8.1 FoE(EtherCAT 文件传输) FoE 用于在主站和从站间传输文件(如配置文件、固件…

作者头像 李华