数次第一的R语言专栏，其实源自一份面向学生的内部学习材料-编程阁

专栏的起点：一份面向学生的内部学习材料

回过头看，这个医药类 R 语言专栏的起点，其实非常简单——它最初只是面向合作课题组学生的一份内部学习材料。

当时，我们正在推进一部专著的出版工作，书稿初始规模已有十余万字。随着研究不断深入，数据挖掘相关的知识点持续扩展，而我们在协助合作教授开展课题与论文工作的过程中，也积累了越来越多来自一线科研实践的分析经验。渐渐地，我们意识到，单纯以书稿形式呈现这些内容，已经难以承载不断增加的实操细节与方法演进。

正是在这样的背景下，我们萌生了一个想法：将正在进行的真实数据分析工作，以及我们对相关技术的理解与取舍过程，系统整理出来，作为学生的学习材料持续补充。这个专栏的雏形，也由此逐步形成。

在整理过程中，一个现实问题愈发清晰。医药数据科学与 R 语言应用领域的学习资源表面上十分丰富：网络教程、技术博客、专业书籍应有尽有。但在科研实践中，这些资源往往难以真正满足研究人员的需求——有的重理论、轻实操，有的受限于篇幅，无法覆盖前沿技术与复杂数据场景，还有一些关键的实用经验，被零散地分布在不同培训或短期课程中，学习路径割裂，复用成本很高。

这种“学过，却依然难以独立完成分析”的落差，是不少学生和科研人员反复反馈的问题。也正因为如此，这个专栏在逐步成型的过程中，开始明确自己的定位：不是补充零散技巧，而是围绕医药科研的真实工作流，帮助学习者建立完整、可迁移的数据分析能力。

基于这样的思考，我最终选择将这套内容系统地沉淀在 CSDN 平台，通过持续、结构化的更新方式，逐步搭建起一套真正贴合医药科研实践的 R 语言与数据科学方法体系。截至目前，专栏累计内容已超过210 万字，包含320 余篇文章，单篇文章通常在5000–9000 字之间，覆盖试验统计、预测模型、科研绘图、数据库分析等多个高频科研方向，并保持持续更新。这种体量并非追求“多”，而是为了承载完整的分析背景、方法选择逻辑以及真实科研中的细节处理。

2025，从技术方法铺陈到公共数据主线的年度演进

另外，如果回顾专栏的创作脉络，可以清晰地看到一个逐步收敛与聚焦的过程。2024 年的内容创作，整体以各类分析技术和方法体系的铺陈为主，重点放在统计分析、模型构建、可视化技巧、机器学习方法以及 R 语言在医药科研中的通用应用框架。这一阶段的目标，是帮助读者建立起相对完整的工具基础和方法视野，为后续更复杂的数据实践打下底层能力。

进入2025 年，在前期方法体系逐渐成型的基础上，专栏的创作重心开始更加明确地转向医学公共数据挖掘。这一调整并非简单更换主题，而是希望将已经积累的统计与建模方法，真正落到可复用、可发表、可持续扩展的真实科研场景中。医学公共数据库正是连接方法论与科研产出的关键载体，也因此成为这一阶段内容建设的核心主线。

与原始数据分析相比，二次数据分析（Secondary Data Analysis）是一种更高效、更节约成本的研究方法。二次数据是指研究人员对已收集、整理完毕的现有数据开展再分析的数据集，其来源通常涵盖政府部门、科研院所、医疗机构等专业机构，且大多经过标准化的整理与归档，可直接应用于后续研究。基于这一特性，在医药领域的未来发展中，R 语言凭借其在数据挖掘方面的独特优势，应用价值将持续凸显，而依托公共医学数据开展的挖掘研究，也势必会成为该领域的重要研究方向。

在专栏众多模块中，“公共数据库挖掘”是最能体现整体设计思路的一个板块。该部分围绕NHANES、GBD 以及 FAERS/VigiBase等主流医学公共数据库展开，从基础认知到完整分析路径，系统拆解了真实科研中常见却容易被忽略的关键环节。

NHANES：基于抽样调查的全美数据

在NHANES部分，内容并未停留在“下载数据、跑模型”的操作层面，而是从二次数据分析理念和抽样调查设计思想讲起，帮助读者理解数据结构、权重设计与潜在局限。在此基础上，逐步拆解多年度数据的整合方法、抽样权重与方差估计处理，并完整复现成人抑郁症患病率研究的分析流程，最终延伸到自定义数据读取函数的构建，以应对版本更新和字段差异等实际问题。

针对2017–2023 年 NHANES 样本设计的变化，专栏还专门讨论了无应答偏倚评估与分析策略调整，避免沿用旧流程带来的隐性错误。同时，将变量检索、codebook 展示、批量下载等数据探索流程系统化整理，形成一套可直接复用的工具链，大幅降低了实际使用门槛。

GBD：全球疾病负担数据

在GBD模块中，内容围绕“如何基于 GBD 数据开展规范且可发表的研究”展开，从数据申请流程、核心指标理解，到具体病种分析策略与 SDI 指数使用，再到全球疾病负担的可视化与在线工具应用。后续内容结合最新研究案例，拆解基于 GBD 的研究结构，提炼出一套可迁移的分析与写作思路，并给出面向不同临床方向的选题路径。

自 2010 年以来，《柳叶刀》（The Lancet）杂志与健康指标与评估研究所（IHME）展开合作，系统性发布全球疾病负担（GBD）研究成果，每年定期刊发基石论文（capstone papers），全面总结全球及各区域的健康负担现状。这些论文不仅是国际公共卫生领域的标杆性文献，更成为该领域政策制定与学术研究的重要参考依据。与此同时，GBD 研究团队还在估算方法上持续创新，例如引入社会人口学指数、开展性别分层分析、开发基于机器学习的预测模型等，显著提升了数据的解释能力与预测价值。由此可见，GBD 绝非传统意义上的静态数据库，而是一项长期、多维度、系统性的科学研究工程，具有不容忽视的深刻研究价值。

FAERS：全球最重要的药物警戒数据库

FAERS部分则从数据库定位和适用边界出发，帮助读者建立对药物警戒数据优势与局限的清晰认知。在此基础上，逐步解析公共仪表板检索逻辑、原始 ASCII 数据的结构化处理流程，并进一步延伸到与 VigiBase 的联合挖掘思路，形成从监管公开数据到国际药物警戒数据库的完整视角。

美国食品药品监督管理局（FDA）为保障公众用药安全，搭建了一项重要的药物不良事件监测工具 —— 不良事件报告系统（Adverse Event Reporting System, AERS），该系统后更名为 FDA 不良事件报告系统（FDA Adverse Event Reporting System, FAERS）。FAERS 数据库的历史最早可追溯至 1969 年，其收录范围涵盖提交至 FDA 的药物不良事件报告、用药差错报告，以及由不良事件衍生的药品质量相关投诉。报告来源广泛，既包括药品生产企业，也涵盖医疗卫生专业人员与普通公众。FAERS 的核心目标是支撑 FDA 开展药物及治疗性生物制品的上市后安全性监测，通过整合海量真实世界数据，为药物安全评估提供关键实证依据。在临床医学领域，FAERS 的数据挖掘价值具有不可替代性，堪称全球药物安全使用的 “警戒线” 研究标杆。

GEO：从公共表达数据到转化医学研究

此外，专栏还围绕GEO 数据库搭建了一套体系化的实操内容，从基础认知到进阶分析层层递进：先讲解临床医生利用 GEO 数据库开展研究的思路、数据库的数据组织结构，再分步演示官网直接下载、R 语言下载与初步解析的实操方法，最终聚焦炎症性肠病，推出基因表达分析演示内容，为相关领域研究者提供了清晰、可落地的 GEO 数据挖掘指引。

“公共数据库挖掘”只是整个专栏体系中的一个组成部分。即便单独来看，这一模块已经覆盖了从数据理解、方法选择到论文落地的完整流程，而它背后依托的，是一个仍在不断扩展的技术框架。

从年度总结到下一阶段的技术布局

未来，专栏将持续跟进医学公共数据库的更新，以及统计学方法与研究范式在医药领域中的演进。一方面，将进一步引入和系统梳理新的医学公共数据库资源，围绕数据结构理解、适用场景判断与分析流程设计，补充更多可直接落地的实战案例；

另一方面，也会更加系统地整理和实践近年来不断涌现的R 语言统计分析新方法与工具链，并将其放入真实科研问题中进行验证与打磨。

除公共数据库方向外，专栏中已有的统计分析、机器学习、科研可视化、临床试验设计、文献挖掘与因果推断等板块，也将随着方法更新与研究需求的变化持续演进。新的分析思路、新出现的 R 包工具以及逐渐成熟的研究范式，都会被整理为以科研问题为导向的项目级教程，帮助读者在实际研究中形成稳定、可复用的分析路径，而不仅停留在零散技巧的掌握上。

从整体定位来看，这个专栏更希望成为一个长期可用、可反复调用、并持续进化的医学数据科学工具箱。它并非一次性的内容输出，而是围绕医药科研实践不断构建和沉淀的方法论体系。

回顾这一年的创作过程，我愈发清晰地认识到：真正有价值的技术内容，并不取决于覆盖了多少知识点，而在于能否帮助研究者在真实问题面前建立起稳定、可迁移的分析能力。

未来，我也将继续在 CSDN 平台深耕医药数据科学与 R 语言方向，通过长期、系统的内容输出，与更多同行共同探索与成长。

市面上的 R 语言培训班和书籍（包括网络上的文章或视频），由于受限于培训时间或书籍篇幅，往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景，内容泛泛而谈，最终无法真正解决实际工作中的问题。同时，它们也缺乏针对医药领域的深度结合与讨论。为了解决这些痛点，我们推出了《用 R 探索医药数据科学》专栏。该专栏将持续更新，不仅为您提供系统化的学习内容，更致力于成为您掌握最新、最全医药数据科学技术的得力助手。

每篇文章篇幅在5000字至9000字之间。
内容涵盖试验统计、预测模型、科研绘图、数据库、机器学习等热点领域。

《用 R 探索医药数据科学》专栏的学习指南

重新整理《用 R 探索医药数据科学》专栏目录形成学习的目的是为读者梳理出一个清晰、系统的知识脉络。通过将内容划分为工具使用、常规技术、可视化等9大板块的共10部分内容，能让读者快速定位到所需知识领域，直观把握不同章节间的逻辑关系与递进层次。这有助于初学者构建完整的知识体系，有步骤地开启学习之旅；也方便进阶者迅速检索特定技术内容，进行深入研究与实践，提升了专栏内容的可读性与实用性。

https://datch.blog.csdn.net/article/details/143842464?spm=1011.2415.3001.5331

专栏问答
专栏问答：临床、中医、护理、药学等专业背景的学习者该如何认识 R语言学习，让科研真正为自己服务？
专栏问答：学R语言，感觉还行，一用就错误，人工智能帮忙写代码也看不懂错误，怎么办？-CSDN博客
专栏问答：管理和选择不同的R，如何做好R的笔记，使用 openxlsx 包（更新20240822）_rstudio不同的r-CSDN博客
专栏问答：R 语言扩展包安装出问题？解决方案详细来教你（更新20250128）-CSDN博客
专栏问答：到底什么是综述，如何写好综述，如何进行文献搜索？（更新20250217）-CSDN博客
专栏问答：如何更精确地进行文献搜索（更新20250217）-CSDN博客
专栏问答：公共数据库发表能发表国际学术期刊吗？能够成为本硕博的毕业论文主要研究吗？以NHANES数据库为例-CSDN博客
第一篇：介绍和工具的使用
1篇1章：认识数据科学和R
1篇1章1节：医药数据科学的历程和发展，用R语言探索数据科学（更新20241029）-CSDN博客
1篇1章2节：机器学习、统计学与ChatGPT的概述，与R语言的相关 (更新20241229)_ai、chatgpt和机器学习什么关系-CSDN博客
1篇1章3节：R 语言的产生与发展轨迹（更新2024/08/14）-CSDN博客
1篇1章4节：医药数据科学入门之认识数据可视化（更新20240814）-CSDN博客
1篇1章5节：学会数据分析基础和流程，开始人工智能数据分析师之路（更新20250214）-CSDN博客
1篇2章：R的安装和数据读取
1篇2章1节：R和RStudio的下载和安装（Windows 和 Mac）-CSDN博客
1篇2章2节：RStudio 四大区应用全解，兼谈 R 的代码规范与相关文件展示_rstudio的console和terminal-CSDN博客
1篇2章3节：RStudio的高效使用技巧，自定义RStudio环境（更新20241023）_rstudio如何使用-CSDN博客
1篇2章4节：用RStudio做项目管理，静态图和动态图的演示，感受ggplot2的魅力_如何通过rstudio实现项目管理,防止依赖项冲突-CSDN博客
1篇2章5节：详解R的扩展包管理（从模糊安装到自动更新）及工作目录和工作空间的设置（更新20241030 ）-CSDN博客
1篇2章6节：R的数据集读取和利用，如何高效地直接复制黏贴数据到R（20240807 ）_r语言复制数据集-CSDN博客
1篇2章7节：用R读写RDS、RData、CSV和TXT格式文件（更新20250129）_r语言读取rds文件-CSDN博客
1篇2章8节：用R读写Excel、SPSS、SAS、Stata和Minitab等产生的数据文件（更新20250129）
1篇2章9节：在R中应用SQL语言（更新20241217）_r语言与数据库-CSDN博客
1篇2章10节：R的网络爬虫技术快速入门（更新20241217）_如何用r分析inhanes数据库-CSDN博客
1篇3章：文档和课件输出
1篇3章1节：用R写作，先认识 NoteBook 和 Markdown-CSDN博客
1篇3章2节：如何在 R Markdown 和 R Notebook 中创建使用-CSDN博客
1篇3章3节：R Markdown的创建详解和直接使用学术期刊和出版社的模板_学术期刊 markdown模板-CSDN博客
1篇3章4节：R Markdown 的文档开头（YAML），从基础到扩展包-CSDN博客
1篇3章5节： Markdown 的标题、列表、字词和链接-CSDN博客
1篇3章6节：R Markdown 的代码块、绘图与数学公式解析-CSDN博客
1篇3章7节：Knit 的文档生成，和多文档流程的集合应用-CSDN博客
1篇3章8节：HTML Widgets，将 JavaScript 可视化库封装成 R 函数-CSDN博客
1篇3章9节：使用 R Markdown 和 Shiny 结合R语言进行数据报告和交互式应用的创建-CSDN博客
第二篇：常规的分析技术
2篇1章：认识数据
2篇1章1节：数据的基本概念以及 R 中的数据结构、向量与矩阵的创建及运算-CSDN博客
2篇1章2节：继续讲R的数据结构，数组、数据框和列表-CSDN博客
2篇1章3节：R的赋值操作与算术运算_r里面的赋值-CSDN博客
2篇1章4节：R的逻辑运算和矩阵运算-CSDN博客
2篇1章5节：R 语言的循环与遍历函数全解析-CSDN博客
2篇2章：数据的预处理
2篇2章1节：全面了解 R 中的数据预处理，通过 R 基本函数实施数据查阅_r数据预处理-CSDN博客
2篇2章2节：从排序到分组和筛选，通过 R 的 dplyr 扩展包来操作-CSDN博客
2篇2章3节：处理医学类原始数据的重要技巧，R语言中的宽长数据转换，tidyr包的使用指南-CSDN博客
2篇2章4节：临床数据科学中如何用R来进行缺失值的处理_临床生存分析缺失值r语言-CSDN博客
2篇2章5节：数据科学中的缺失值的处理，删除和填补的选择，K最近邻填补法-CSDN博客
2篇2章6节：R的多重填补法中随机回归填补法的应用，MICE包的实际应用和统计与可视化评估-CSDN博客
2篇2章7节：用R做数据重塑，数据去重和数据的匹配-CSDN博客
2篇2章8节：用R做数据重塑，行列命名和数据类型转换-CSDN博客
2篇2章9节：用R做数据重塑，增加变量和赋值修改，和mutate()函数的复杂用法_r语言如何在数据集中添加变量-CSDN博客
2篇2章10节：用R做数据重塑，变体函数应用详解和可视化的数据预处理介绍-CSDN博客
2篇2章11节：用R做数据重塑，数据的特征缩放和特征可视化-CSDN博客
2篇2章12节：R语言中字符串的处理，正则表达式的基础要点和特殊字符-CSDN博客
2篇2章13节：R语言中Stringr扩展包进行字符串的查阅、大小转换和排序-CSDN博客
2篇2章14节：R语言中字符串的处理，提取替换，分割连接和填充插值_r语言替换字符串-CSDN博客
2篇2章15节：字符串处理，提取匹配的相关操作扩展，和Stringr包不同函数的重点介绍和举例-CSDN博客
2篇2章16节：R 语言中日期时间数据的关键处理要点_r语言时刻数据-CSDN博客
2篇3章：定量数据的统计描述
2篇3章1节：用R语言进行定量数据的统计描述，文末有众数的自定义函数-CSDN博客
2篇3章2节：离散趋势的描述，文末1个简单函数同时搞定20个结果-CSDN博客
2篇3章3节：在R语言中，从实际应用的角度认识假设检验-CSDN博客
2篇3章4节：从R语言的角度认识正态分布与正态性检验-CSDN博客
2篇3章5节：认识方差和方差齐性检验（三种方法全覆盖）-CSDN博客
2篇3章6节：R语言中的t检验，独立样本的t检验-CSDN博客
2篇3章7节：单样本t检验和配对t检验-CSDN博客
2篇3章8节：方差分析（ANOVA）及其应用-CSDN博客
2篇3章9节：组间差异的非参数检验，Wilcoxon秩和检验和Kruskal-Wallis检验-CSDN博客
2篇4章：定性数据的统计描述
2篇4章1节：定性数据的统计描述之列联表，文末有优势比计算介绍-CSDN博客
2篇4章2节：认识birthwt数据集，EpiDisplay和Gmodels扩展包的应用-CSDN博客
2篇4章3节：独立性检验，卡方检验，费希尔精确概率检验和Cochran-Mantel-Haenszel检验-CSDN博客
2篇4章4节：相关关系和连续型变量的Pearson相关分析-CSDN博客
2篇4章5节：分类型变量的Spearman相关分析，偏相关分析和相关图分析-CSDN博客
2篇4章6节：相关图的GGally扩展包，和制表的Tableone扩展包-CSDN博客
2篇5章：常见类型回归分析
2篇5章1节：认识回归分析的历史背景及应用-CSDN博客
2篇5章2节：构建一元和多元的线性回归模型-CSDN博客
2篇5章3节：回归模型中哑变量的应用和设置-CSDN博客
2篇5章4节：深度解读构建回归模型表达式的九个关键符号-CSDN博客
2篇5章5节：深度剖析回归模型结果的相关函数-CSDN博客
2篇5章6节：深度解读线性回归模型的绘图判断-CSDN博客
2篇5章7节：构建因变量为分类变量的二分类Logistic回归模型-CSDN博客
2篇5章8节：详解不同逻辑回归模型的比较，和如何进行变量优化-CSDN博客
2篇5章9节：深度讲解有序多分类Logistic回归模型的分析-CSDN博客
2篇5章10节：条件Logistic回归模型的分析-CSDN博客
2篇6章：生存分析模型
2篇6章1节：生存分析的基本概念和主要内容-CSDN博客
2篇6章2节：用R进行生存率的描述与估计-CSDN博客
2篇6章3节：生存分析的假设检验及可视化展示-CSDN博客
2篇6章4节：认识比例风险模型和Cox比例风险模型，学会从协变量的调整选择最优模型-CSDN博客
2篇6章5节：用逐步回归方法来选择模型协变量，比例风险假定的检验和森林图的绘制-CSDN博客
2篇7章：高级回归分析
2篇7章1节：认识广义加性回归模型-CSDN博客
2篇7章2节：初步构建广义加性回归模型-CSDN博客
2篇7章3节：广义加性回归模型的可视化和模型的诊断-CSDN博客
2篇7章4节：岭回归的原理和应用场景，并用R进行代码演示-CSDN博客
2篇7章5节：Lasso 回归的原理和应用场景，并用R进行代码演示-CSDN博客
2篇7章6节：弹性网（Elastic Net）回归的原理和应用场景，并用R进行代码演示-CSDN博客
2篇7章7节：逐步回归的原理和应用场景，并用R进行代码演示包的高级应用-CSDN博客
2篇7章8节：主成分回归的原理和应用场景，并用R进行代码演示-CSDN博客
2篇7章9节：神经网络回归的原理和应用场景，并用R进行代码演示-CSDN博客
2篇7章10节：分位数回归的原理和应用场景，并用R进行代码演示-CSDN博客
第三篇：数据可视化技术
3篇1章：R的传统绘图
3篇1章1节：认识R的传统绘图系统，深度解析plot()函数和par()函数的使用-CSDN博客
3篇1章2节：R基础绘图之散点图、直方图和概率密度图-CSDN博客
3篇1章3节：R基础绘图之条形图和堆积条形图-CSDN博客
3篇1章4节：饼图，箱线图和克利夫兰点图-CSDN博客
3篇1章5节：R基础绘图之Cleveland 点图，马赛克图和等高图（更新20250102）_散点矩阵图-CSDN博客
3篇1章6节：用R进行图形的保存与导出，详细的高级图形输出，一文囊括大多数保存的各种问题，和如何批量保存不同情况的图形-CSDN博客
3篇2章：R的进阶绘图
3篇2章1节：认识 ggplot2 扩展包，深度解析 qplot() 函数的使用-CSDN博客
3篇2章2节：ggplot2绘图之原理逻辑分解，掌握绘图步骤（更新20241104）-CSDN博客
3篇2章3节：ggplot2绘图之内置主题设置全解析（更新20241104）-CSDN博客
3篇2章4节：ggplot2绘图之几何体解析（一），参考线和基准线与分布图和频数图（更新20241104）-CSDN博客
3篇2章5节：ggplot2绘图之几何体解析（二），关系图和时间序列图与误差条和高级图形平滑曲线（更新20241104）-CSDN博客
3篇2章6节：ggplot2绘图之统计变换与位置调整（更新20250111）-CSDN博客
3篇2章7节：个性化配色的自定义颜色演示_r语言自定义颜色怎么使用-CSDN博客
3篇2章8节：让 ggplot2 绘图进行顶级科研杂志的配色（更新20241118）_ggsci使用-CSDN博客
3篇2章9节：坐标轴须图和带状图（更新20241107）-CSDN博客
3篇2章10节：多样的小提琴图（更新20241231）_r语言parallelplot绘制平行坐标图-CSDN博客
3篇2章11节：维恩图和UpSet图-CSDN博客
3篇2章12节：雷达图和RadViz图-CSDN博客
3篇2章13节：网络图（知识图谱）绘制的深度解析（更新20241109）_认知网络分析图怎么看-CSDN博客
3篇2章14节：高质量动态图和交互式动态图_r语言数据分析动图-CSDN博客
3篇2章15节：深度讲解词云图的绘制和改变相关的主题（更新20250106）_d3 词云图-CSDN博客
3篇2章16节：R的地理图绘制（更新20241104）-CSDN博客
3篇2章17节：轻便科研绘图的tidyplots扩展包_科研绘图包-CSDN博客
3篇2章18节：学会构建专业的多面板图-CSDN博客
3篇3章：基于gglot2的扩展包应用
3篇3章1节：模型系数图、相关矩阵图、双变量成对矩阵图-CSDN博客
3篇3章2节：绘制网络对象图和叠加地图网络图-CSDN博客
3篇3章3节：绘制平行坐标图和模型诊断图-CSDN博客
3篇3章4节：绘制高级散点矩阵图和多样生存曲线图-CSDN博客
3篇3章5节：绘制分面直方图，多元时间序列图和二元密度图-CSDN博客
3篇3章6节：绘制切尔诺夫面图（疼痛评分的笑脸可视化）和时间序列数据的日历热图-CSDN博客
3篇3章7节：绘制时间序列地平线图和时间序列流图-CSDN博客
3篇3章8节：绘制瀑布图和镶嵌图-CSDN博客
3篇3章9节：深度讲解树图的多样化绘制-CSDN博客
3篇3章10节：绘制混合箱线图和弧形条形图-CSDN博客
3篇3章11节：绘制议会图和深度讲解绘制山峦图（岭线图）-CSDN博客
3篇3章12节：多元统计分析的可视化扩展包，从主成分分析到时间序列，从K-means聚类到广义线性模型-CSDN博客
3篇3章13节：绘制大数据级别的字母值箱线图（Letter-Value Boxplot）
3篇3章14节：绘制美观和直观的蜂群图（Bee Swarm Plot）
3篇3章15节：用不同方法绘制高级云雨图（Raincloud Plot）
3篇4章：三维图形可视化
3篇4章1节：不同方法绘制多样的三维散点图-CSDN博客
3篇4章2节：深度讲解如何绘制三维透视图，从内置函数到扩展包函数-CSDN博客
3篇4章3节：绘制三维条带图和三维直方图-CSDN博客
3篇4章4节：绘制三维切片图和三维切片轮廓图，文末添加三维文本信息-CSDN博客
3篇4章5节：如何绘制三维曲面图、三维球面图和三维曲面地形图-CSDN博客
3篇4章6节：绘制三维等值面图、三维等值体素图和三维多边形图-CSDN博客
3篇4章7节：绘制交互式三维图形-CSDN博客
3篇4章8节：绘制三维地形图-CSDN博客
3篇4章9节：如何将 ggplot2 对象转化为三维图形-CSDN博客
3篇5章：科研绘图新利器（plotthis 包）
3篇5章1节：科研绘图，这个 R 包可能比 ggplot2 更适合你，绘制渐变面积图-CSDN博客
3篇5章2节：绘制临床研究中的趋势图与ROC曲线-CSDN博客
3篇5章3节：聚类演变图、折线图和网络关系图-CSDN博客
3篇5章4节：打造专业热图（上）-CSDN博客
3篇5章5节：打造专业热图（下）-CSDN博客
3篇5章6节：相关散点图与多变量相关图-CSDN博客
3篇5章7节：高效饼图、环图与QQ图的实现-CSDN博客
3篇5章8节：绘制基因差异表达数据的火山图-CSDN博客
3篇5章9节：绘制高效和专业的条形图-CSDN博客
3篇5章10节：绘制箱线图和小提琴图-CSDN博客
3篇5章11节：绘制 Chord Diagram（弦图）和 Circos Plot（环形关系图）-CSDN博客
3篇5章12节：降维可视化的DimPlot与FeatureDimPlot应用
3篇5章13节：富集分析的网络可视化全解析
3篇5章14节：基因富集分析的基因集可视化全解析
3篇5章15节：用桑基图和堆积流图揭示数据中的动态流动关系
3篇5章16节：栅格、掩膜、矢量与点数据的高效绘图
第四篇：临床试验特定技术
4篇1章：临床试验的统计
4篇1章1节：初步认识临床试验（约7500字）-CSDN博客
4篇1章2节：样本量估计的初步介绍-CSDN博客
4篇1章3节：用R进行样本量估计的统计学参数-CSDN博客
4篇1章4节：两组例数相同的均数比较的样本量估计和绘制功效曲线-CSDN博客
4篇1章5节：两组的例数不等的均数比较的样本量估计和可视化-CSDN博客
4篇1章6节：自身配对设计的均数比较临床试验的样本量估计和可视化-CSDN博客
4篇1章7节：与总体均数比较的样本量估计和可视化-CSDN博客
4篇1章8节：两、三组试验组率比较的样本量估算和可视化-CSDN博客
4篇1章9节：试验的随机分组认识，用R做简单随机化-CSDN博客
4篇1章10节：用R实现分层随机化-CSDN博客
4篇1章11节：用R实现区组随机化和置换区组随机化-CSDN博客
4篇1章12节：动态随机化方法介绍，和用R绘制随机化卡片-CSDN博客
4篇2章：样本量估计的进阶技术
4篇2章1节：认识析因试验和多因素设计样本量估计的底层逻辑-CSDN博客
4篇2章2节：用R演示高血压析因试验的样本量计算-CSDN博客
4篇2章3节：模拟法在临床试验功效分析中的应用-CSDN博客
4篇2章4节：三因素（2b × 3w × 2b）混合设计功效模拟实战，以抗高血压药物试验为例-CSDN博客
4篇2章5节：ANOVA 功效的单次精确模拟与可视化全解析-CSDN博客
4篇2章6节：生存分析研究中终点事件数的估算方法-CSDN博客
4篇2章7节：基于分层生存模型的功效计算，以糖尿病临床试验为例-CSDN博客
第五篇：文献挖掘的技术
5篇1章：Meta分析攻略
5篇1章1节：认识循证医学中的Meta分析，并予代码演示分析绘图-CSDN博客
5篇1章2节：Meta分析的7大步骤的扼要解读-CSDN博客
5篇1章3节：二分类变量的Meta分析模型，分析公式构建和结果解读-CSDN博客
5篇1章4节：二分类变量的Meta分析模型，绘制漏斗图和应用剪补法，最后绘制和解读轮廓增强漏斗图-CSDN博客
5篇1章5节：二分类变量的Meta分析模型，敏感性分析和亚组分析，绘制森林图-CSDN博客
5篇1章6节：连续型变量的Meta分析和可视化分析全解-CSDN博客
5篇2章：高级Meta分析（计划更新中）
5篇2章1节：用R进行单个率Meta分析-CSDN博客
5篇2章2节：用R进行网状Meta分析细解-CSDN博客
5篇2章3节：在经典临床研究中进行二次固定效应剂量-反应建模和预测
5篇2章4节：剂量-反应Meta分析中的最优线性无偏预测
5篇2章5节：多变量Meta分析和其回归模型的实现
5篇2章6节：贝叶斯 Meta 分析在小样本、高异质性及稀疏数据下的应用（上篇：核心函数）
5篇2章7节：贝叶斯 Meta 分析在小样本、高异质性及稀疏数据下的应用（中篇：具体建模）
5篇2章8节：贝叶斯 Meta 分析在小样本、高异质性及稀疏数据下的应用（下篇：可视化）
5篇2章9节：累积Meta分析在循证医学中的应用及R语言实操
5篇3章：文献计量学
5篇3章1节：文献计量分析基础-CSDN博客
5篇3章2节：文献计量学的国外数据库的数据采集，WOS数据库和PUBMED数据库的文献信息批量下载和分析_pubmed能导出文献计量数据吗-CSDN博客
5篇3章3节：国际六大科研文献数据库的数据加载与格式转换解析_r使用最新版的 bibliometrix 绘制 countries' scientific prod-CSDN博客
5篇3章4节：文献计量学中数据合并、去重、切片与编辑_文献计量分析中文和英文数据库搜索的数据怎么合并-CSDN博客
5篇3章5节：文献计量学的描述性分析_文献计量学分析-CSDN博客
5篇3章6节：文献计量学的可视化与引文信息分析_文献计量与可视化分析-CSDN博客
5篇3章7节：作者主导性分析及H指数与其变体的应用-CSDN博客
5篇3章8节：Lotka分析和知识单元时序分析_lotka 定律-CSDN博客
5篇3章9节：局部被引次数分析与文献文本字段术语提取研究_local citation如何统计-CSDN博客
5篇3章10节：为构建网络图从文献数据中提取特定信息-CSDN博客
5篇3章11节：文献计量分析合作情况可视化-CSDN博客
5篇3章12节：耦合网络可视化，从常规网络图到耦合分析聚类图的深度讲解-CSDN博客
5篇3章13节：共被引网络、历史共被引网络和共词网络的可视化-CSDN博客
5篇3章14节：概念结构图，贡献度最高文献因子图和最被引用文献因子图-CSDN博客
5篇3章15节：文献计量学的语义地图和主题演化分析图-CSDN博客
5篇3章16节：PubMed数据库的数据提取和可视化-CSDN博客
5篇3章17节：文献计量中著作层面的情感分析-CSDN博客
第六篇：数据驱动的分析
6篇1章：主成分分析
6篇1章1节：深度讲解用R进行主成分分析（上）-CSDN博客
6篇1章2节：深度讲解用R进行主成分分析（中）-CSDN博客
6篇1章3节：深度讲解用R进行主成分分析（下）-CSDN博客
6篇1章4节：学会用R进行因子分析（上）-CSDN博客
6篇1章5节：学会用R进行因子分析（中）-CSDN博客
6篇1章6节：学会用R进行因子分析（下）-CSDN博客
6篇2章：匹配技术应用
6篇2章1节：认识临床研究的匹配技术-CSDN博客
6篇2章2节：匹配结果的可视化和匹配后新数据分析-CSDN博客
6篇3章：判别和聚类分析
6篇3章1节：医学研究中的判别分析和聚类分析-CSDN博客
6篇3章2节：线性判别分析预测模型构建评估和可视化演示-CSDN博客
6篇3章3节：二次判别分析技术的运用-CSDN博客
6篇3章4节：K-Means聚类分析的运用，和改进算法的K-Means++-CSDN博客
6篇3章5节：实现k-medoids聚类算法的PAM和CLARA方法-CSDN博客
6篇3章6节：凝聚层次聚类和分裂层次聚类-CSDN博客
6篇4章：时间序列分析
6篇4章1节：认识时间序列分析，创建和整理时间序列数据-CSDN博客
6篇4章2节：深度讲解白噪音检验-CSDN博客
6篇4章3节：认识ARIMA模型和模拟其数据，讲解平稳性检验-CSDN博客
6篇4章4节：ACF和PACF的可视化，和识别最佳模型-CSDN博客
6篇4章5节：如何应用SARIMA模型来进行时间序列数据的预测-CSDN博客
6篇4章6节：Facebook 的时间序列预测的 Prophet 模型-CSDN博客
6篇5章：数据因果分析
6篇5章1节：因果中介分析的贝叶斯方法
6篇5章2节：高维中介情境下的贝叶斯因果中介分析
6篇6章：孟德尔随机化
6篇6章1节：认识孟德尔与孟德尔定律，为流行病学因果研究提供方法指导
6篇6章2节：单核苷酸多态性与孟德尔随机化
6篇6章3节：全基因组关联研究（GWAS）
第七篇：机器学习和预测
7篇1章：机器学习入门
7篇1章1节：机器学习和人工智能的基础知识-CSDN博客
7篇1章2节：机器学习在临床预测中的应用场景，与临床预测模型的关键步骤解析-CSDN博客
7篇1章3节：详析训练数据集、测试数据集和验证数据集及其划分策略-CSDN博客
7篇1章4节：采用随机抽样法和等比抽样法对数据集进行二份及三份的划分-CSDN博客
7篇1章5节：划分数据的多次随机抽样的Bootstrap法和加权随机抽样法-CSDN博客
7篇1章6节：交叉验证概述与分类，R中K折交叉验证的详细解析-CSDN博客
7篇1章7节：机器学习算法解读，与数值预测回归模型构建-CSDN博客
7篇1章8节：朴素贝叶斯分类预测模型，从构建、解析到实战-CSDN博客
7篇1章9节：认识决策树，构建CART算法的决策树模型-CSDN博客
7篇1章10节：深度解析如何构建随机森林算法预测模型-CSDN博客
7篇1章11节：构建人工神经网络反向传播算法预测模型-CSDN博客
7篇1章12节：认识机器学习的模型评估，掌握数值型数据的模型评估方法-CSDN博客
7篇1章13节：分类模型的混淆矩阵评估-CSDN博客
7篇1章14节：评估和对比预测模型的ROC曲线和AUC值-CSDN博客
7篇1章15节：六大ROC曲线扩展包的对比，和其它评估曲线的绘制-CSDN博客
7篇2章：抽样与重抽样技术
7篇2章1节：机器学习的抽样与重抽样技术-CSDN博客
7篇2章2节：模型抽样，调查抽样和抽样技术的专业术语-CSDN博客
7篇2章3节：总群体的统计量和抽样方法在医药研究中的应用-CSDN博客
7篇2章4节：概率抽样和三种非概率抽样的实现-CSDN博客
7篇2章5节：抽样分布的统计理论-CSDN博客
7篇2章6节：深度解析和认识中心极限定理-CSDN博客
7篇2章7节：简单随机抽样及其在R语言中的实现与验证-CSDN博客
7篇2章8节：系统性随机抽样及其在R语言中的实现与验证-CSDN博客
7篇2章9节：分层随机抽样及其在R语言中的实现与验证-CSDN博客
7篇2章10节：聚类抽样及其在R语言中的实现与验证-CSDN博客
7篇2章11节：自助抽样及其在R语言中的实现与验证-CSDN博客
7篇2章12节：抽样的蒙特卡洛方法-CSDN博客
7篇3章：特征工程技术
7篇3章1节：认识机器学习的特征工程-CSDN博客
7篇3章2节：了解特征工程的工作数据-CSDN博客
7篇3章3节：了解特征工程的特征排名-CSDN博客
7篇3章4节：特征工程的变量子集选择-CSDN博客
7篇3章5节：特征工程变量子集选择的过滤器方法应用-CSDN博客
7篇3章6节：特征工程变量子集选择的包装器方法应用-CSDN博客
7篇3章7节：特征工程变量子集选择的嵌入式方法应用-CSDN博客
第八篇：R与人工智能
8篇1章：人工智能理论
8篇1章1节：认识生成式人工智能与生成式代码的优势和局限-CSDN博客
8篇1章2节：认识生成对抗网络，GAN和StyleGAN_rstudio中集成deepseek-CSDN博客
8篇1章3节：大模型术语解读与从生成到推理的演进-CSDN博客
8篇1章4节：Transformer架构和提词器工程学的出现-CSDN博客
8篇2章：R与人工智能
8篇2章1节：在 RStudio 中无插件使用 DeepSeek（基本篇）-CSDN博客
8篇2章2节：在 RStudio 中无插件使用 DeepSeek（进阶篇）-CSDN博客
第九篇：公共数据库挖掘
9篇1章：NHANES 数据库
9篇1章1节：认识二次数据分析和NHANES数据库-CSDN博客
9篇1章2节：下载NHANES数据并使用R进行读取-CSDN博客
9篇1章3节：NHANES数据的下载读取、追加和合并-CSDN博客
9篇1章4节：认识统计学的权重、抽样及其背后的设计逻辑（更新20251206）
9篇1章5节：实例解析权重对数据结果的影响和可靠性评估（更新20251206）
9篇1章6节：深度讲解不同NHANES的权重的种类选择和R包（更新20251206）
9篇1章7节：单周期的NHANES权重计算实战（更新20251208）
9篇1章8节：多周期的NHANES权重计算实战（更新20251208）
9篇1章9节：一步一步构建高效读取NHANES数据的自定义函数-CSDN博客
9篇1章10节：如何解决 NHANES 数据合并所遇原表差异问题-CSDN博客
9篇1章11节：2025年后如何使用扩展包访问、下载和分析 NHANES 数据-CSDN博客
9篇1章12节：如何直接显示NHANES某个变量的代码本-CSDN博客
9篇1章13节：根据关键词检索NHANES变量和得到相关信息，并且通过指定URL直接下载数据_nhanes数据库url怎么获得-CSDN博客
9篇1章14节：下载 NHANES 的数据清单、搜索表格和表格里面的变量汇总_r语言下载nhanes数据-CSDN博客
9篇1章15节：快速获取 NHANES 特定的表格信息和变量信息_nhanestables-CSDN博客
9篇1章16节：NHANES 2017–2023 数据的样本设计、无应答偏差评估与分析说明-CSDN博客
9篇1章17节：特殊的NHANES数据解读，包括NNYFS、NHEFS、NHES 和 HHANES 等数据
9篇1章18节：复现NHANES的美国成人抑郁症患病率研究（上）-CSDN博客
9篇1章19节：复现NHANES的美国成人抑郁症患病率研究（中）-CSDN博客
9篇1章20节：复现NHANES的美国成人抑郁症患病率研究（下）-CSDN博客
9篇2章：GBD 数据库
9篇2章1节：认识全球疾病负担数据库 GBD-CSDN博客
9篇2章2节：GBD 数据库的数据申请详解-CSDN博客
9篇2章3节：GBD 数据库的数据深度解读（上）-CSDN博客
9篇2章4节：GBD 数据库的数据深度解读（下）-CSDN博客
9篇2章5节：GBD 数据库的全球疾病负担死亡概率可视化演示-CSDN博客
9篇2章6节：GBD 数据库分析策略和 SDI 指数的应用解读，并以高血压为例-CSDN博客
9篇2章7节：GBD 数据库的关键数据工具系统介绍（上）-CSDN博客
9篇2章8节：GBD 数据库的关键数据工具系统介绍（下）-CSDN博客
9篇2章9节：多源数据联合应用在全球疾病负担（GBD）分析中的策略分析-CSDN博客
9篇2章10节：2025年基于GBD数据的柳叶刀子刊研究深度解析（全网最深度解读）
9篇2章11节：基于GBD数据的医学科研成文的六步法
9篇2章12节：不同临床科室可基于GBD进行数据挖掘的方向举例（联合分析）
9篇3章：FAERS 数据库
9篇3章1节：FAERS数据库的FDA官方讲解，对期刊投稿设限的FAERS数据库的客观评价！
9篇3章2节：认识FAERS数据库的数据和公共仪表板（分析前必看）
9篇3章3节：FAERS数据库公共仪表板搜索功能操作与解析
9篇3章4节：FAERS数据库中单个药品报告的数据总览
9篇3章5节：FAERS数据库中药品报告的数据来源与核心字段深度解读
9篇3章6节：FAERS数据的官网下载和ASCII文件的七大模块详解
9篇3章7节：基于 R 语言的 FAERS 数据提取与合并
9篇3章8节：FAERS联合挖掘，认识和获取VigiBase数据库资料
9篇4章：GEO 数据库
9篇4章1节：临床医生如何利用GEO数据库开展研究
9篇4章2节：GEO数据库的数据组织结构
9篇4章3节：GEO数据库官网数据的直接下载
9篇4章4节：用R语言进行GEO数据的下载和初步解析
9篇4章5节：GEO 数据库之炎症性肠病基因表达分析演示（一）
9篇4章6节：GEO 数据库之炎症性肠病基因表达分析演示（二）
9篇4章7节：GEO 数据库之炎症性肠病基因表达分析演示（三）
9篇4章8节：GEO 数据库之炎症性肠病基因表达分析演示（四）
9篇4章9节：GEO 数据库之炎症性肠病基因表达分析演示（五）
9篇5章：NHIS 数据库
9篇5章1节：理解美国国家健康访谈调查（NHIS）数据库
9篇5章2节：NHIS 数据库的常规数据下载

专栏的起点：一份面向学生的内部学习材料

2025，从技术方法铺陈到公共数据主线的年度演进

NHANES：基于抽样调查的全美数据

GBD：全球疾病负担数据

FAERS：全球最重要的药物警戒数据库

GEO：从公共表达数据到转化医学研究

从年度总结到下一阶段的技术布局

《用 R 探索医药数据科学》专栏的学习指南

专栏问答

第一篇：介绍和工具的使用

1篇1章：认识数据科学和R

1篇2章：R的安装和数据读取

1篇3章：文档和课件输出

第二篇：常规的分析技术

2篇1章：认识数据

2篇2章：数据的预处理

2篇3章：定量数据的统计描述

2篇4章：定性数据的统计描述

2篇5章：常见类型回归分析

2篇6章：生存分析模型

2篇7章：高级回归分析

第三篇：数据可视化技术

3篇1章：R的传统绘图

3篇2章：R的进阶绘图

3篇3章：基于gglot2的扩展包应用

3篇4章：三维图形可视化

3篇5章：科研绘图新利器（plotthis 包）

第四篇：临床试验特定技术

4篇1章：临床试验的统计

4篇2章：样本量估计的进阶技术

第五篇：文献挖掘的技术

5篇1章：Meta分析攻略

5篇2章：高级Meta分析（计划更新中）

5篇3章：文献计量学

第六篇：数据驱动的分析

6篇1章：主成分分析

6篇2章：匹配技术应用

6篇3章：判别和聚类分析

6篇4章：时间序列分析

6篇5章：数据因果分析

6篇6章：孟德尔随机化

第七篇：机器学习和预测

7篇1章：机器学习入门

7篇2章：抽样与重抽样技术

7篇3章：特征工程技术

第八篇：R与人工智能

8篇1章：人工智能理论

8篇2章：R与人工智能

第九篇：公共数据库挖掘

9篇1章：NHANES 数据库

9篇2章：GBD 数据库

9篇3章：FAERS 数据库

9篇4章：GEO 数据库

9篇5章：NHIS 数据库

Qwen2.5-0.5B推理速度慢？CPU指令集优化实战解析

如何搜索硕士论文：高效查找与获取硕士学位论文的实用方法

搜索研究文献的渠道有哪些：常用文献检索平台及获取途径解析

Qwen3-Embedding-4B实战对比：嵌入模型性能全面评测

Qwen3-4B显存占用过高？低成本GPU部署优化技巧实战分享

Unsloth + vLLM组合：推理与训练一体化方案