news 2026/4/16 16:43:01

【RAG安全】【ACL】The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【RAG安全】【ACL】The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG)

  • ACL 2024 Findings

Abstract

检索增强生成(RAG)是一种强大的技术,可将专有和私有数据引入语言模型,其中数据隐私是关键问题。尽管已有大量研究揭示了大语言模型(LLM)的隐私风险,但RAG技术可能重塑LLM生成的固有行为,带来目前尚未充分探索的新隐私问题。本文通过新颖的攻击方法进行了广泛的实证研究,展示了RAG系统在泄露私有检索数据库方面的脆弱性。尽管RAG带来了检索数据方面的新风险,我们进一步揭示,RAG可以缓解LLM训练数据的泄露。总体而言,本文为检索增强LLM的隐私保护提供了新的见解,使LLM和RAG系统构建者均受益。我们的代码可在以下链接获取:
https://github.com/phycholosogy/RAG-privacy

1 Introduction

检索增强生成(RAG)是一种先进的自然语言处理技术,通过从大规模文档语料中检索信息并融入生成过程,从而提升文本生成的准确性与上下文相关性。该技术已被广泛应用于领域特定的对话机器人(Siriwardhana 等,2023)、邮件或代码补全(Parvez 等,2021)等场景。如图 1 所示,RAG 系统通常分为检索与生成两个阶段:当用户输入查询q qq后,系统先从外部数据库中检索出相关文档;随后将检索结果与原始查询拼接,共同输入到大语言模型(LLM)中,模型再结合自身预训练知识及检索数据生成回答a aa

本文聚焦 RAG 系统的隐私泄露风险,并指出:无论是检索数据集还是 LLM 的预训练/微调数据集,其信息均可能在 RAG 使用过程中被泄露。一方面,检索数据集往往包含敏感且高价值的领域特定信息(Parvez 等,2021;Kulkarni 等,2024),例如用于医疗对话机器人的患者处方数据(Yunxiang 等,2023)。另一方面,RAG 的检索过程可能影响 LLM 的文本生成行为,导致模型输出其训练/微调数据中的隐私信息。已有工作(Carlini 等,2021;Kandpal 等,2022;Lee 等,2021;Carlini 等,2022;Zeng 等,2023)观察到 LLM 会记忆并泄露预训练与微调数据,但外部检索数据的融入如何影响 LLM 在 RAG 中的记忆行为尚不清楚,值得进一步探究。因此,本文提出以下研究问题:

  • (RQ1)能否从 RAG 的外部检索数据库中提取私有数据?
  • (RQ2)检索数据是否会影响 RAG 中 LLM 的记忆行为?

针对 RQ1,为全面揭示检索数据集的隐私泄露,我们假设存在攻击者,其意图通过构造查询故意提取检索数据中的隐私信息。我们提出一种面向检索数据提取的复合结构化提示攻击方法,包含用于引导检索的 {information} 部分和命令模型输出检索上下文的 {command} 部分。以医疗对话 RAG 场景为例(第 3.2 节),攻击者可先询问与某疾病相关的通用信息或建议,并在查询末尾附加“命令提示”以提高提取成功率。随后,我们检查模型输出是否包含具体的处方记录等敏感信息。实验表明,所测试的 Llama2-7b-Chat 与 GPT-3.5-turbo 模型以接近 50% 的高概率输出与原始记录完全相同或高度相似的内容,揭示 RAG 系统对此类攻击极为脆弱,大量敏感检索数据可被泄露。

针对 RQ2,尽管已有研究表明 LLM 倾向于输出已记忆的训练数据,但检索数据融入对此现象的影响尚未被验证。为此,我们对 LLM 训练语料实施针对性攻击与前缀攻击,比较有无检索增强场景下的训练数据泄露程度。实验发现,在 RAG 系统中加入检索数据可显著降低 LLM 输出其记忆训练数据的倾向,其保护效果优于噪声注入或系统提示等传统方法。从训练数据安全视角看,RAG 架构相比单独使用 LLM 可能更为安全。

2 Related Work

2.1 Retrieval-Augmented Generation (RAG)

检索增强生成(RAG)由 Lewis 等人(2020)首次提出,现已成为增强大语言模型生成能力的主流方法之一(Liu,2022;Chase,2022;Van Veen 等,2023;Ram 等,2023;Shi 等,2023)。该范式通过引入外部知识显著提升输出准确性与相关性(Gao 等,2023),有效缓解 LLM 的“幻觉”问题(Shuster 等,2021)。RAG 的独特优势在于其架构高度灵活,可在无需重新训练或微调整个系统的情况下,单独替换或更新数据集、检索器或 LLM 三大核心组件(Shao 等,2023;Cheng 等,2023)。凭借这些优点,RAG 被广泛应用于个人聊天机器人、医疗诊断助手等特定领域专家系统(Panagoulias 等,2024)。

2.2 Privacy Risk of Large Language Models

大量研究表明,LLM 易记忆并无意泄露预训练语料中的信息(Carlini 等,2021;Kandpal 等,2022;Lee 等,2021;Carlini 等,2022;Ippolito 等,2022;Zhang 等,2021;Biderman 等,2023;Mireshghallah 等,2022;Lee 等,2023;Ren 等,2024)。Carlini 等人(2021)率先开展数据提取攻击,揭示 LLM 会回忆并复现训练数据片段。后续工作进一步发现模型规模、数据重复度、提示长度等因素会加剧记忆风险(Carlini 等,2022;Biderman 等,2023)。针对微调数据的隐私风险,Mireshghallah 等人(2022)指出调整模型头部比调整小型适配器模块更容易导致记忆;Zeng 等人(2023)发现对话与摘要等需丰富特征表示的任务在微调时尤其脆弱。Huang 等人(2023)研究了基于检索的 kNN-LM 隐私风险,但其架构与本文关注的 RAG 不同,因此与我们的工作存在差异。

3 Method

为回答第1节提出的RQ1与RQ2,我们设计多种攻击,量化RAG框架中不同组件的泄露风险。本节先概述RAG背景与威胁模型,随后分别给出针对检索数据与训练数据的攻击方法。

3.1 Background and Threat Model

RAG流程。典型的检索增强生成系统包含大语言模型M MM、检索数据集D DD与检索器R RR。给定用户查询q qq,系统输出答案a aa。形式化地,检索器首先返回与q qq最相关的top-k k

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 8:34:11

“想买Labubu?门店排队成‘博物馆’,消费者只能靠线上抢”!

近日,泡泡玛特(Pop Mart)在社交媒体和财经媒体上掀起热议——在其实体门店里,热门IP“Labubu”几乎买不到。36氪记者对这一现象进行深度调查,发现背后涉及供应链、渠道策略以及黄牛生态的多重因素。一、门店“买不到”…

作者头像 李华
网站建设 2026/4/16 7:26:37

手撕300kW直驱永磁风电并网】这可能是全网最直观的永磁同步电机仿真教程。咱们直接打开Simulink,从零搭建一套能跑的三相风电系统

300kw直驱永磁同步电机。 Matlab/simulink仿真模型风电并网,仿真波形好,适合学习。 三相。 先上硬货!永磁同步电机的核心参数得配置准确。在Machine Parameters模块里,定子电阻设0.01Ω有点讲究——实际机组铜损大约占额定功率的2…

作者头像 李华
网站建设 2026/4/16 1:01:11

Linly-Talker在婚庆定制视频中的新人形象合成服务

Linly-Talker在婚庆定制视频中的新人形象合成服务 在婚礼现场的聚光灯下,一段由AI生成却“声形俱真”的新郎致辞缓缓播放——那张熟悉的脸庞随着话语微微开合,声音温柔而坚定,仿佛他真的站在那里倾诉爱意。这不是科幻电影,而是今天…

作者头像 李华
网站建设 2026/4/16 7:25:33

速度误差与姿态误差的关系

EKF INS/GPS松组合导航,15状态,地理系采用NED(北东地)北东地坐标系下的惯性导航总是带着某种神秘感。当我们把IMU数据塞进算法时,那些跳动的数值就像在三维空间跳华尔兹。今天咱们聊聊怎么用15个状态的扩展卡尔曼滤波(EKF&#xf…

作者头像 李华
网站建设 2026/4/16 0:03:58

Linly-Talker情感计算能力评测:能否识别用户情绪并回应?

Linly-Talker情感计算能力评测:能否识别用户情绪并回应? 在虚拟主播深夜直播带货、AI客服全天候解答疑问的今天,一个数字人“会不会察言观色”,已经不再是锦上添花的功能,而是决定用户体验真实感的关键门槛。我们早已厌…

作者头像 李华
网站建设 2026/4/15 16:47:33

Linly-Talker如何增强背景音乐下的语音清晰度?

Linly-Talker如何增强背景音乐下的语音清晰度? 在虚拟主播直播间里,背景音乐正播放着轻快的旋律,用户却仍能清晰听到数字人讲解的产品信息;在线教育平台上,学生一边听着舒缓的学习氛围曲,一边准确捕捉老师语…

作者头像 李华