news 2026/4/16 17:02:25

IF=10.0!基于中医证候预测胃癌前病变,清华学者机器学习预测模型发文柳叶刀子刊

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
IF=10.0!基于中医证候预测胃癌前病变,清华学者机器学习预测模型发文柳叶刀子刊

源自风暴统计网:一键统计分析与绘图的AI网站

胃癌前病变(PLGC)是胃癌进展的关键阶段,及时干预可显著降低死亡率。

然而,当前筛查策略主要依赖内窥镜检查,不仅费用高、侵入性,在资源有限地区更是难以普及。

2026年1月16日,清华大学李梢教授团队在柳叶刀子刊 Eclinicalmedicine(医学一区,IF=10.0)上发表了一项突破性研究,成功开发了一种仅基于经典风险因素和中医证候要素的机器学习预测模型,旨在无创筛查胃癌前病变,AUC=0.82。

接下来,我们一起学习一下这篇文章的研究思路吧!

数据准备

本文提供了详细的样本量估算流程,诸位可以在自己文章中参考借鉴。

步骤一:确定核心参数
目标结局事件患病率 (p):在设计阶段,目标筛查人群中PLGC的患病率尚不确定。因此,我们参考了中国及其他亚洲地区既往流行病学报告,这些报告表明PLGC患病率约为20-30%,并采用了p = 0.25的预估患病率进行样本量估计。
候选预测变量数量 (k):研究初始纳入了 k = 31 个候选变量(包括人口学特征、症状、生活方式等)。
目标EPV值:作者设定目标 EPV = 15。这是一个较为严格的标准。在预测模型研究中,较高的EPV(通常建议≥10或≥20)可以有效降低模型过拟合的风险,提升模型的稳定性和泛化能力。
步骤二:应用EPV原则计算理论最小样本量
在k = 31个候选预测因子的情况下,所需总样本量为n = 15 × 31 / 0.25 = 1860。

本研究招募了符合条件的成年参与者,他们正在接受或计划接受上消化道内镜检查,且既往无恶性肿瘤诊断。研究最终入组了N = 2511名参与者,远超样本量估算目标。

研究采用严谨的多中心队列设计,覆盖中国不同地区,确保数据的多样性和代表性:

  • 开发队列:从福建两家医院招募1034名参与者,使用该队列的症状和生活方式数据构建开发数据集,并随机分为训练集(n = 620)、内部验证集(n = 207)和测试集(n = 207);

  • 外部验证队列:包括来自北京、安徽的四家医院的回顾性医院队列(630人)和福建32个筛查点的前瞻性社区队列(847人)。

预测模型构建与评估

研究包含四个连续阶段:数据收集与预处理、特征选择、模型构建、以及性能评估与可解释性分析。

1.数据收集与预处理

在第一阶段,设计了结构化问卷以获取四个信息领域——人口统计学特征、总体症状、口腔症状和胃部症状。

为确保方法学透明性和可重复性,数据集经过预处理,排除了缺失值或不合理数据(如年龄记录为身份号码)的参与者。处理后的数据集被分层为训练集、内部验证集和内部留出测试集,用于模型开发。

2.特征选择

为确定用于模型构建最具预测力的特征,我们实施了两步特征选择流程。

  • 首先,在训练集上预训练一个带有L1正则化的逻辑回归(LR)模型。

  • 随后,使用训练集对该预训练模型应用SHAP分析,以量化和排序特征贡献度。

  • 利用此特征排序,我们通过测试包含从排名前5到全部31个特征的子集,系统性地评估了特征集规模对模型性能的影响。

研究发现,随着特征按 SHAP 重要性由高到低依次添加,AUC 增加到约 15 个特征,随后趋于平稳,表明这些变量数量在预测准确性与简约性之间提供了最佳权衡。

图 七种机器学习模型的特征重要性分析。

(A)每个模型中三个最具影响力的特征的SHAP值的气泡图。圆圈大小代表平均绝对 SHAP 值(圆圈越大表示重要性越高),颜色则用于区分不同的模型。

(B)所有七种模型中 15 个最重要的特征的热图。

因此,前15个关键预测因子用于最终模型构建,包括幽门螺杆菌感染、年龄、黑便、胀痛、喜温/喜冷饮食偏好、四肢冰冷、打嗝、疑病症性疼痛、恶心、饮酒、饮水、家族病史、口苦、嗳气,融合了经典风险因素和中医证候要素。

3.模型构建

本阶段采用先进的集成学习策略,以融合多种算法的优势,追求最优预测性能。

基学习器选择:选取了7种七种广泛使用且优势互补的机器学习算法作为基模型,包括高斯朴素贝叶斯(GNB)、逻辑回归(LR)、K近邻(KNN)、梯度提升分类器(GBC)、极限梯度提升(XGB)、随机森林(RF)、自适应提升(ADB)等。

采用堆叠集成策略:

  • 第一层:多个基学习器在训练集上进行训练。

  • 第二层(元学习器):系统地评估了所有七种基模型作为候选元学习器(使用默认参数),并根据其更优性能选择了逻辑回归作为最优元学习器。

  • 超参数优化:所有基学习器及元学习器的超参数,均通过在内部验证集上进行网格搜索来优化,以提升模型泛化能力。

4.模型评估

在训练集、内部验证集、内部测试集以及两个外部验证集中,九种模型的AUC值范围分别为0.71–0.92、0.65–0.82、0.70–0.82、0.69–0.80和0.65–0.79。

其中,堆叠集成模型在所有数据集中均取得最优综合性能,其AUC值均为最高。

使用DeLong检验评估其他模型与堆叠模型之间的AUC差异,结果以Z统计量及相应p值报告。结果显示,在多数数据集中存在显著性能差异(p< 0.05),证实了该模型相对于单一模型的优越性。

相比之下,基于《中国胃癌筛查与早诊早治指南》(ZH)和《英国胃肠病学会胃癌风险诊断指南》(EN)衍生的规则模型表现较差,在所有数据集中AUC值均接近0.5,堆叠模型较基于指南的策略将AUC提升了0.18–0.35(相对提升幅度平均达50.5%)。

决策曲线分析表明,堆叠模型所有数据集中,在广泛的阈值概率范围内始终提供了最高的临床净收益。

有趣的是,研究分析中识别出的PLGC相关症状——上腹隐痛、腹胀、喜冷食及口苦——在很大程度上与中医的湿热证相吻合,这与古代经典《黄帝内经》中的记载一致,即脾胃长期寒热失衡是肿瘤发生的重要内在条件。

参考文献:Li, W., Wang, B., Li, T.et al.A Causal and interpretable machine learning framework for postcranioplasty risk prediction and surgical decision support.npj Digit. Med.(2026). https://doi.org/10.1038/s41746-026-02370-6

【感谢阅读浙中大郑老师团队撰写的统计文章】


最后,在文末给郑老师我们团队打个广告吧,大家不要见怪哈!

我们将提供专业的统计服务

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 13:36:31

AI编程让人更累:一个深度使用者的真实感受

AI编程让人更累&#xff1a;一个深度使用者的真实感受 说实话&#xff0c;我用了半年AI编程工具后&#xff0c;最大的感受不是效率提升&#xff0c;而是——更累了。 这篇文章不唱反调&#xff0c;也不黑AI编程。我只是想聊聊&#xff0c;AI编程工具带来的一些副作用&#xff0…

作者头像 李华
网站建设 2026/4/16 12:00:00

从0到1开发一个商用 Agent(智能体)

本文完整展示如何从 0 到 1 手搓一个 AI Agent 的搭建过程。在具体动手实操的过程中&#xff0c;重点为大家展示从需求分析到如何搭建。需求分析中包含如何识别 AI 提效场景和、梳理提效场景流程。如何搭建中包含工作流创建、智能体创建、智能体发布。接下来&#xff0c;将结合…

作者头像 李华
网站建设 2026/4/16 11:56:53

《干货满满送!提示工程架构师优化提示系统用户参与策略》

干货满满送&#xff01;提示工程架构师优化提示系统用户参与策略 一、引入与连接 引人入胜的开场 想象一下&#xff0c;你在一个热闹的集市中&#xff0c;每个摊位都在向你推销各种商品&#xff0c;而你却在寻找一件特定的宝贝。这时&#xff0c;一个聪明的导购出现了&#xff…

作者头像 李华
网站建设 2026/4/16 12:03:50

普通人转行AI:无需代码,3步入行大模型时代,30+也能抓住风口!

文章针对非技术背景的职场人士&#xff0c;特别是对AI感到焦虑的30人群&#xff0c;提供了转行AI的实用路径。作者以自身经历出发&#xff0c;强调打破成为算法工程师的迷思&#xff0c;转而关注AI应用与落地层面。文章提出找到自身行业经验与AI结合的生态位&#xff0c;介绍了…

作者头像 李华