临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统-编程阁

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>【顶会/顶刊】投稿交流群

添加微信号：CVer2233，小助手拉你进群！

扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用！发论文/搞科研/涨薪，强烈推荐！

转载自：机器之心

通用大模型（LLM）的狂飙突进，终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE（美国执业医师资格考试）中表现优异，但在面对需要「火眼金睛」和「毫厘必争」的心脏手术台上，通用大模型的表现究竟如何？

近日，一项由空军军医大学唐都医院李妍教授团队牵头，与深圳清华大学研究院朱锐团队联合完成的 COMPARE 研究在 arXivs 上发表预印版。研究揭示：在经皮冠状动脉介入治疗（PCI）的决策制定中，CA-GPT垂直领域 CA-GPT 系统（一项基于 OCT 影像的 AI 系统），在关键决策指标上显著优于 Open AI 的通用大模型 ChatGPT-5。该研究是基于中科微光医疗（Vivolight Medtech）OCT 系统搭建的 RAG 增强型 AI-OCT 整合决策支持模型。

论文标题：COMPARE: Clinical Optimization with Modular Planning and Assessment via RAG-Enhanced AI-OCT: Superior Decision Support for Percutaneous Coronary Intervention Compared to ChatGPT-5 and Junior Operators
论文地址：https://arxiv.org/abs/2512.10702

这不仅是一次算法的胜利，某种程度上可以称得上是中国腔内影像领域的「DeepSeek 时刻」。这套 CA-GPT 系统有望重新定义心脏介入手术的智能化标准。

01. 巅峰对决

通用大模型在专业战场「水土不服」

据《2023 年全球心血管疾病负担报告》统计，每年因心血管疾病死亡的人数达 1920 万，而经皮冠状动脉介入治疗（PCI）作为最核心的血运重建手术，全球年手术量已超过 400 万例。在 PCI 手术中，OCT（光学相干断层成像）被称为医生的「第三只眼」，可清晰看到血管内病变情况，但是其图像解读高度依赖医生经验，初级医师与资深专家在手术成功率、并发症发生率等关键指标上的差距高达 40% 以上。

腔内影像中不同技术与分辨率的对比示意图

在这项纳入了 96 名患者、160 处病变的临床研究中，团队构建了一个严苛的竞技场：将 CA-GPT 系统、ChatGPT-5 以及拥有 1-5 年经验的初级介入医师放在同一维度下，以资深专家团队制定的手术记录为金标准进行盲测。所有方案均与患者实际接受的手术记录（由年手术量≥ 200 例、经验≥ 10 年的高级专家完成）进行比对。评估涵盖 10 项预设决策指标，分为术前规划 5 项和术后评估 5 项，每项一致得 1 分，总分 0-5 分。

10 项不同 PCI 策略的评分标准

值得一提的是，传统 OCT 图像解读还需要医师逐帧分析，耗时数分钟至十数分钟。相比之下，CA-GPT 系统可在 20 秒内完成全面分析并生成结构化报告，将影像解读时间缩短 95% 以上。

结果显示，在术前规划（Pre-PCI）阶段，CA-GPT 对 ChatGPT 形成了「降维打击」：

总体决策评分：CA-GPT 系统的评分中位数达到满分 5.0，显著高于 ChatGPT-5 的 3.0（P<0.001），同时也优于初级医师的 4.0。
支架直径选择（关键指标）：CA-GPT 的准确率高达 90.3%，而 ChatGPT-5 仅为 63.9%，甚至低于初级医生的 72.2%。
支架长度选择：CA-GPT 准确率达 80.6%，ChatGPT-5 仅为 54.2%。

决策一致性亚组分析

各评分项目的性能分布

而在术后评估（Post-PCI）阶段，三方总体表现都比术前更好，因为这个阶段有了术前方案和实际结果可以参考。但 CA-GPT 依然在一些关键指标上表现出优势，比如：对「最小支架面积是否达标」的判断，CA-GPT 与专家判断的吻合度接近 100%；年轻医生略有差距。

对「支架是否扩张不足」、「是否存在严重贴壁不良」的识别，CA-GPT 在支架贴壁评估（93.2% 准确率）等需要精细判断的项目上，优于初级医师组（76.1%）。

那为何拥有海量参数的 ChatGPT-5 会败下阵来？研究指出，通用大模型虽然语言推理能力强，但缺乏对图像数据的数值敏感性和空间理解力。特别是在面对功能性缺血（OCT-FFR≤0.80）或严重钙化等复杂病变时，通用模型容易产生「幻觉」，而 CA-GPT 则展现了极高的稳定性，在复杂病变亚组分析中依然保持了中位数 5.0 的高分。

02. 解密架构

RAG + DeepSeek 的工程化胜利

CA-GPT 之所以能实现高稳定性和准确性，核心在于摒弃了对单一端到端大模型的迷信，构建了一套严密的「小模型 + 大数据 + 大模型」的 RAG 复合智能体架构。

CA-GPT 训练模型架构：小模型 + 大数据 + 大模型

据其技术披露，该系统并非简单的聊天机器人，而是一个精密的协作系统：

「感官」精准化（小模型层）：系统底层集成了 13 项核心功能（含 6 项自研专有算法）。它们负责像「显微镜」一样对 OCT 影像进行结构化分析，在 5-10 秒内即可完成管腔分割、斑块定性、钙化积分计算等定量工作，为决策提供精准的数据地基。
「大脑」逻辑化（DeepSeek）：在大模型推理层，该系统基于开源的 DeepSeek 构建。它不再依赖概率生成文本，而是基于小模型提供的精准量化数据，进行符合医学逻辑的深度推理。
「知识」实时化（RAG 技术）：通过检索增强生成（RAG）技术，系统链接了包含超过 100 万篇心血管文献及指南的知识库（DBdata）。这意味着，AI 的每一次决策建议，都能追溯到具体的专家共识或最新指南，有效抑制了 AI 幻觉。

基于 CA-GPT 的 AI-OCT 系统辅助决策案例介绍

03. 普惠价值

让县域医生拥有「顶级三甲专家」视野

这项技术突破的终极意义，不在于在论文中战胜 ChatGPT，而在于解决医疗资源分布不均的现实痛点。全球心血管疾病负担日益加重，但资深介入专家（完成 1000+ 例手术）却是极度稀缺资源。培养一名能独立处理复杂病变的医生，往往需要 8-12 年的漫长周期。研究数据显示，初级医生在处理复杂病变时，与专家存在显著差距。

因此，CA-GPT 系统在本质上是在做「医疗能力的平权」。

想象一下，在偏远的县级医院，一位刚工作不久的医生，在面对复杂的钙化病变时手足无措。此时，CA-GPT 系统在 5-10 秒内给出了手术策略：

「建议预处理使用旋磨术，旋磨头选择 1.5mm」
「建议支架尺寸 3.0 x 28mm，释放压力 12atm」
「注意：远端存在边缘夹层风险」

这相当于每台手术都有一位顶尖专家在旁「手把手」指导。

04. 结语

做垂直领域的「定义者」

过去十年，中国医疗器械行业更多是在追赶西方的脚步。但此次发布的 CA-GPT 系统及其临床成果，标志着中国企业在高端腔内影像领域开始掌握定义权。

不做通用大模型的「套壳」，而是深耕垂直场景的「窄门」。用数据证明：在医疗这种容错率为零的领域，唯有将深度学习的精准度与大模型的推理能力完美结合，才是 AI 落地的正途。

这或许就是中国医疗科技的「DeepSeek 时刻」—— 把 AI 技术落地业务场景，用自己的技术，解决最真实的临床痛点。

本文系学术转载，如有侵权，请联系CVer小助手删文

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复：何恺明，即可下载本课程的所有566页课件PPT！赶紧学起来！

ICCV 2025 论文和代码下载
在CVer公众号后台回复：ICCV2025，即可下载ICCV 2025论文和代码开源的论文合

CVPR 2025 论文和代码下载

在CVer公众号后台回复：CVPR2025，即可下载CVPR 2025论文和代码开源的论文合集

CV垂直方向和论文投稿交流群成立

扫描下方二维码，或者添加微信号：CVer2233，即可添加CVer小助手微信，便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注：研究方向+地点+学校/公司+昵称（如Mamba、多模态学习或者论文投稿+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信号: CVer2233，进交流群 CVer计算机视觉（知识星球）人数破万！如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料，一定要扫描下方二维码，加入CVer知识星球！最强助力你的科研和工作！ ▲扫码加入星球学习

▲点击上方卡片，关注CVer公众号 整理不易，请点赞和在看

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

终极指南：frpc-desktop连接保活机制如何避免频繁网络断开问题

构建高效开发环境的终极指南：从零到一打造现代化工作流

MCP PL-600 Agent功能测试全记录（行业首曝真实压测数据）

springboot基于JavaWeb的高校奖学金申报评定管理系统的设计与实现_8v7kh92v

ScienceDecrypting：轻松解锁CAJ加密PDF的完整指南

终极指南：10分钟掌握Python现代化GUI神器CustomTkinter