news 2026/4/16 17:22:44

如何利用NMF算法定义肿瘤“元程序”?这篇高分文章把多组学(bulk+单细胞+空间转录组)联合分析玩透了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何利用NMF算法定义肿瘤“元程序”?这篇高分文章把多组学(bulk+单细胞+空间转录组)联合分析玩透了

结肠癌长在左边还是右边,对患者的治疗方案和预后结果有着决定性影响。临床观测发现,右半结肠癌(RCC)患者的生存率普遍低于左半结肠癌(LCC),且两者对靶向治疗的敏感度截然不同,这种由解剖部位导致的“侧性”差异究竟受何种分子机制驱动?

2024年6月18日,《Cell Reports Medicine》杂志在线发表了南京医科大学汪美林教授、张正东教授及杜睦龙教授团队的研究成果,揭示了左右半结肠癌中截然不同的多细胞免疫抑制中心。今天我们就来拆解一下这篇文章:Distinctive multicellular immunosuppressive hubs confer different intervention strategies for left- and right-sided colon cancers。

研究概述

本研究针对结肠癌的异质性,通过对105名患者的426,863个单细胞进行转录组分析,并结合空间转录组及大规模组织病理学验证,定义了恶性上皮细胞中具有侧性偏向的两种表达元程序。研究发现,LCC富集增殖干性(PS)元程序,通过糖代谢重编程形成酸性微环境;而RCC富集免疫分泌(IS)元程序,主要分布在缺氧区域,通过招募特定髓系及T细胞亚群实现免疫逃逸。

实验设计

研究团队采用了平行探索的发现队列与验证队列设计。实验流程包括:1. 收集新鲜结肠癌及癌旁组织进行单细胞转录组测序(scRNA-seq);2. 利用CopyKat算法区分恶性与非恶性上皮;3. 采用非负矩阵分解(NMF)鉴定肿瘤内元程序;4. 结合空间转录组(ST-seq)定位多细胞交互网络;5. 利用多重免疫荧光(mIHC)和免疫组化(IHC)在独立的大规模临床队列中验证关键细胞亚群及分子;6. 通过ICI治疗队列评估元程序与免疫检查点抑制剂疗效的关系。

研究结果

图1:构建了结肠癌单细胞图谱,证实RCC中髓系细胞和T细胞比例高于LCC,而B细胞比例较低。


图2:在恶性上皮中鉴定了PS和IS两个具有侧性偏向的元程序,PS在LCC中活跃,IS在RCC中活跃。


图3:证实PS程序与有氧糖酵解及LCC预后不良相关,IS程序与缺氧信号及RCC预后不良相关。


图4:髓系细胞分析显示SPP1+巨噬细胞在RCC中特异性富集,并与肿瘤分期及不良预后正相关。


图5:T细胞分析发现RCC中富集处于静息记忆状态、细胞毒性较弱的CD8-CD161 T细胞。


图6:空间转录组揭示了PS上皮与Mph-PLTP细胞、激活的Tregs构成生态位,而IS上皮与Mph-SPP1及CD8-CD161细胞在缺氧区共定位。


图7:在免疫治疗队列中,响应患者的IS上皮比例在治疗后下降,且ICI可能促进了CD8-CD161向功能性T细胞的转化。

数据分析

生信分析

本研究涉及的组学技术包括单细胞转录组测序(scRNA-seq)、空间转录组测序(ST-seq)以及大批量转录组测序(Bulk RNA-seq)。

分析流程
  1. 1.scRNA-seq分析:使用Seurat包进行批次效应处理和标准化,利用FindVariableFeatures识别高变基因。通过PCA降维及FindClusters完成细胞聚类,SingleR进行细胞类型初筛。CopyKat算法基于基因表达推断染色体拷贝数变异(CNVs),以此鉴定恶性上皮细胞。NMF包用于提取肿瘤内表达程序,通过Jaccard分析确定跨样本的表达元程序。利用AUCell计算单个细胞的元程序评分。Monocle2构建CD8+ T细胞的拟时序发育轨迹,CellChat推断不同细胞间的配体-受体交互强度。

  2. 2.ST-seq分析:采用Seurat处理空间点位矩阵,通过LogVMR标准化数据。利用FindTransferAnchors和TransferData将单细胞测序的细胞类型定义映射至空间坐标。AddModuleScore用于计算空间点位的特征基因评分,以SpatialFeaturePlot展示元程序及细胞亚群的空间共定位情况。

  3. 3.Bulk数据分析:整合TCGA-COAD和GEO(GSE39582)数据,使用ssGSEA对元程序特征基因集进行打分。基于打分结果,利用maxstat进行最优切分,评估元程序与患者5年总生存期(OS)的相关性。

  4. 4.组学联合分析:通过锚定分析将单细胞水平的细胞通讯预测与空间转录组的物理距离信息相结合,验证了LCC中糖酵解驱动的多细胞枢纽和RCC中缺氧驱动的免疫抑制网络。

统计分析

组间差异比较根据数据分布采用Mann-Whitney-Wilcoxon检验或Student’s t检验。存活率评估使用Kaplan-Meier方法及Log-rank检验。临床特征及CMS亚型分布比例的比较采用卡方检验(Chi-squared test)。

总结

研究意义

研究阐明了左右半结肠癌在细胞构成和交互网络上的本质差异,提出了侧性特异性的治疗方案:LCC可能受益于CTLA-4阻断联用糖酵解抑制剂,而RCC则更适合PD-1/PD-L1抑制剂联用氧气自产声动力疗法或抗EGFR治疗。

文章复现

这篇文章的原始数据和生信分析代码都公开了,非常全面。

原始数据存放在中国国家基因库(CNGBdb):

  • • 项目编号:CNP0005614

  • • 地址:https://db.cngb.org/cnsa/

生信分析代码托管地址:

  • • https://github.com/ChengBioinfo/DiffSided_CRC_SCseq

  • • https://doi.org/10.5281/zenodo.11001103


推荐阅读

中国银河生信云平台(UseGalaxy.cn)致力于零代码生信分析。平台拥有海量计算资源、3000 多个生信工具和数十条生信流程,并且为用户提供 200G 免费存储空间。进群交流请先加 usegalaxy 为好友。

最佳Galaxy生信云平台教程:从入门到精通(图文版)

转录组分析流程和工具大全(最强总结)

全网最佳WGCNA分析教程,一键完成

一文搞懂GSEA富集分析

一文详解细菌耐药性生信分析:从下机数据到耐药基因鉴定

一文学会从测序数据到构建系统发育树:超全面的详细步骤与软件指南

推荐课程

我们还为进阶用户提供高质量培训课程,欢迎参加:

RNA-seq数据分析实战 | 2026年第2期,开启你的生信学习之旅

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:28:02

ChatGLM3-6B基础教程:打造属于你的离线AI助手

ChatGLM3-6B基础教程:打造属于你的离线AI助手 1. 为什么你需要一个真正“属于你”的本地AI助手 你有没有过这样的体验: 想查一段Python报错,刚输入一半,网页卡住; 想让AI帮忙读一份20页的PDF摘要,结果API…

作者头像 李华
网站建设 2026/4/16 12:59:00

GLM-4v-9b配置手册:优化vLLM并发请求处理能力

GLM-4v-9b配置手册:优化vLLM并发请求处理能力 GLM-4v-9b是智谱AI在2024年开源的一个视觉-语言多模态模型,它有90亿参数,能同时看懂图片和文字,支持中文和英文的多轮对话。这个模型有个很厉害的特点,它能直接处理11201…

作者头像 李华
网站建设 2026/4/16 15:30:10

Qwen-Image-Lightning实现Python爬虫数据可视化:自动化图表生成实战

Qwen-Image-Lightning实现Python爬虫数据可视化:自动化图表生成实战 1. 为什么数据分析师需要这个新思路 最近帮一个电商团队做销售数据分析,他们每天要从十几个平台爬取商品价格、销量和评论数据。我看到他们的工作流是:Python爬虫采集→E…

作者头像 李华
网站建设 2026/4/16 12:25:39

Hunyuan-MT-7B入门必看:区分Hunyuan-MT-7B与Chimera模型调用场景

Hunyuan-MT-7B入门必看:区分Hunyuan-MT-7B与Chimera模型调用场景 1. 模型本质解析:两个角色,一种目标 你可能已经注意到,Hunyuan-MT-7B这个名字背后其实藏着两个紧密协作但职责分明的“搭档”。它们不是同一款模型的两个版本&am…

作者头像 李华
网站建设 2026/4/16 12:34:30

RMBG-2.0企业级应用:与Shopify后台集成实现商品图自动去背同步

RMBG-2.0企业级应用:与Shopify后台集成实现商品图自动去背同步 想象一下,你是一家跨境电商公司的运营负责人。每天,团队需要为上百个新上架的商品制作主图。设计师们重复着同样的工作:打开Photoshop,用钢笔工具小心翼…

作者头像 李华
网站建设 2026/4/16 9:26:07

4种部署方式对比:Qwen2.5本地/云端/容器实测

4种部署方式对比:Qwen2.5本地/云端/容器实测 你是不是也遇到过这样的问题:下载好了Qwen2.5-7B-Instruct模型,却卡在“怎么跑起来”这一步?是直接在笔记本上试,还是租个云GPU?用Docker打包会不会更稳妥&…

作者头像 李华