CellChat 原理介绍：从单细胞数据推断细胞通讯的科学方法-编程阁

在单细胞 RNA 测序技术迅速普及的今天，我们不再满足于“知道有哪些细胞存在”，而希望进一步回答：
不同细胞之间是如何交流的？
哪些细胞主导信号发送，哪些细胞是主要的信号接收者？
肿瘤细胞怎样与免疫细胞沟通，从而影响免疫微环境？

CellChat 正是为这些问题而生的工具。它利用单细胞转录组数据重建细胞之间的信号通讯网络（cell–cell communication network），帮助研究者理解组织或疾病状态的复杂细胞生态系统。

一、CellChat 的核心原理是什么？

CellChat 的核心思想可以概括为一句话：

根据细胞表达的配体（Ligand）和受体（Receptor）推断细胞之间是否存在信号传递，并量化其强度。

整个推断过程包含四个关键步骤：

1. 构建 Ligand–Receptor 知识库（Database）

细胞不能直接“说话”，必须通过：

配体（Ligand）：由发送细胞分泌（如 CXCL12、TGFB1、WNT5A）
受体（Receptor）：由接收细胞表达（如 CXCR4、TGFBR1、FZD）

CellChat 内置大型人工整理数据库，包括：

配体–受体二元对（如 CXCL → CXCR）
配体复合体（如 IL6 + IL6R + IL6ST）
受体复合体（如 TGFBR1–TGFBR2）
多组分信号通路（如 WNT/Frizzled 家族）
细胞外基质相互作用（如 Collagen–Integrin）

这是 CellChat “推断通讯”最基础的知识来源。

2. 根据单细胞表达确定“哪些细胞能产生信号”

对每个细胞群（如 T cell、B cell、Fibroblast），CellChat计算：

配体的平均表达量
受体的平均表达量
是否高于表达背景
是否满足配体 / 受体复合体的构建要求

只有显著表达配体的细胞才能作为信号发送端（Sender）
只有显著表达受体的细胞才能作为信号接收端（Receiver）

3. 计算每一对细胞之间的信号强度

CellChat 通过统计模型计算信号强度：

通讯概率（communication probability）= 配体表达 × 受体表达 × 细胞数量校正 × 通路权重

其中还包括：

多配体、多受体子单元的最小表达限制
结构蛋白复合体的组装概率
细胞数量差异校正（避免“大群体压倒一切”的误差）

最终得到一个矩阵：

Receiver1	Receiver2	Receiver3	…
Sender1	0.58	0.10	0.30	…
Sender2	0.02	0.00	0.50	…
…	…	…	…	…

每一个数字代表：

某一条信号通路在某一对细胞之间的通讯概率（或强度）。

4. 构建完整的细胞通讯网络并进行可视化

CellChat 提供多种可视化方式：

环形图（Circle plot）：展示不同细胞之间的通路连接
层级图（Hierarchy plot）：展示信号的“发送–接收方向性”
热图（Heatmap）：比较不同细胞间通讯强度
气泡图（Bubble plot）：展示特定配体–受体在 sender/receiver 的表达组合
中心性分析（Centrality analysis）：判断哪些细胞是网络中心

还能进行：

多样本对比
通路富集分析
细胞通讯强度变化分析
信号网络“主导者”（sender）、“目标”（receiver）、“调节者”（moderator）的识别

这些工具使得细胞通讯从“定性猜测”变成了“定量推断”。

二、CellChat 中常见的信号通路类别及其生物学意义

CellChat 将大量配体–受体对归纳为有生物学意义的信号通路（signaling pathways），这些通路通常代表一种特定的细胞通讯模式。下面为常见类别及功能简介：

信号通路类别	代表通路（CellChat 中常见）	主要参与细胞类型	核心生物学功能	常见研究场景
趋化与免疫迁移信号	CXCL、CCL	T 细胞、B 细胞、巨噬细胞、树突状细胞	调控免疫细胞迁移、组织定位、炎症反应	肿瘤免疫微环境、炎症、自身免疫
炎症与免疫调节信号	MIF、TNF、IL1	巨噬细胞、单核细胞、肿瘤细胞	介导炎症反应、免疫激活或免疫抑制	肿瘤、慢性炎症、感染
免疫检查点 / 抑制信号	TGF-β、PD-1/PD-L1（部分）	T 细胞、Treg、肿瘤细胞	抑制免疫应答、诱导免疫耐受	肿瘤免疫逃逸
生长与分化信号	WNT、FGF、EGF	上皮细胞、干细胞、成纤维细胞	细胞增殖、分化、干性维持	发育生物学、肿瘤发生
细胞命运决定信号	NOTCH	干细胞、免疫细胞	决定细胞命运、分化方向	发育、免疫分化、肿瘤干性
血管生成相关信号	VEGF、ANGPT	内皮细胞、成纤维细胞	血管生成、血管稳定性	肿瘤血管、组织修复
基质与细胞黏附信号	COLLAGEN、LAMININ、FN1	成纤维细胞、上皮细胞、肿瘤细胞	细胞黏附、迁移、组织结构维持	肿瘤侵袭、纤维化
整合素介导信号	INTEGRIN	成纤维细胞、免疫细胞	细胞-基质相互作用、机械信号感知	ECM 重塑、肿瘤转移
代谢与应激相关信号	IGF、HGF	肿瘤细胞、基质细胞	代谢调控、细胞存活	肿瘤代谢、组织损伤
神经-免疫相关信号	NRG、SEMA	神经细胞、免疫细胞	神经调控、免疫调节	神经系统、肿瘤神经浸润
发育与形态建成信号	BMP、HEDGEHOG	干细胞、间充质细胞	器官发育、形态建成	胚胎发育、再生医学

注意

一个信号通路 ≠ 一个配体–受体对
CellChat 中的 “WNT”“CXCL”“MIF” 等，通常是一整类信号模块，里面有多个配体受体对。
同一通路可由多种细胞发送和接收
例如 MIF 在肿瘤中往往呈现“广谱通讯”，而 WNT、TGF-β 更强调方向性。
通路强度反映潜在通讯活跃程度
并不等价于蛋白水平或功能实验结论，需要结合生物学背景解释。

三、如何用CellChat探索这些通路？

层级聚焦：CellChat的分析通常是层级式的。你可以先从整体网络水平观察哪些信号通路在全局通讯中占主导地位，然后聚焦到单个通路水平，查看该通路下具体的配体-受体对和细胞类型对。
模式识别：利用CellChat的模式识别功能，可以发现多个细胞类型为完成一个共同目标（如“招募免疫细胞”、“促进血管生成”）而协调激活的信号通路组合。
比较分析：这是最强大的应用之一。通过对比健康 vs 疾病、治疗前 vs 治疗后、不同时间点的样本，你可以精确找出哪些信号通路的增强或减弱是疾病发生或治疗响应的关键。

理解这些通路，本质上是解读细胞的“意图”：

趋化信号（如CXCL）好比“定位广播”，呼叫免疫细胞前往特定地点。
生长信号（如WNT, EGF）如同“生长指令”，命令细胞分裂或分化。
抑制信号（如TGF-β）则是“刹车信号”，防止免疫反应过度或细胞无限增殖。
黏附与基质信号构成了细胞生存和移动的“物理环境与道路”。

举例具体的生物学场景

在肿瘤微环境中，你可能会发现肿瘤细胞高表达VEGF（诱导血管生成为自己供能），同时大量分泌TGF-β（抑制杀伤性T细胞功能），并释放CXCL趋化因子（招募更多抑制性免疫细胞）。这一系列通路活动共同勾勒出肿瘤“武装自己、麻痹敌人”的逃逸策略。
在组织损伤修复过程中，你会观察到FGF、VEGF等生长和血管生成通路被迅速激活以促进再生，随后TGF-β等通路被上调以结束修复、防止过度增生，形成一个精细的时空调控程序。

总结而言，CellChat提供的这套强大的信号通路分类与量化分析框架，使我们能够超越对细胞类型的简单描述，深入到驱动组织功能、疾病进程的动态分子对话机制层面。通过对这些“专业语言”的破译，我们才能真正理解细胞社会如何运作，并为精准干预疾病提供最清晰的靶点地图。