news 2026/4/16 13:57:57

港中文:LLM时间感知记忆检索框架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
港中文:LLM时间感知记忆检索框架

📖标题:Memory-T1: Reinforcement Learning for Temporal Reasoning in Multi-session Agents
🌐来源:arXiv, 2512.20092

🌟摘要

对长、多会话对话的时间推理是对话代理的关键能力。然而,现有的工作和我们的试点研究表明,随着对话历史的长度和累积噪声的增长,当前的长上下文模型难以准确识别时间相关信息,从而显着损害推理性能。为了解决这个问题,我们引入了MEMORY-T1,这是一个使用强化学习 (RL) 学习时间感知内存选择策略的框架。它采用从粗到细的策略,首先使用时间和相关性过滤器将对话历史修剪为候选集,然后是选择精确证据会话的 RL 代理。RL 训练由优化 (i) 答案准确度、(ii) 证据基础和 (iii) 时间一致性的多级奖励函数指导。特别是,时间一致性奖励通过评估与会话级别(时间顺序接近度)和话语级别(时间顺序保真度)的查询时间范围的对齐来提供密集信号,使代理能够解决微妙的时间歧义。在 Time-Dialog 基准测试中,Memory-T1 将 7B 模型提升到 67.0% 的总分,为开源模型建立了新的最先进的性能,并将 14B 基线高出 10.2%。消融研究表明时间一致性和证据基础奖励共同有助于 15.0% 的性能提升。此外,Memory-T1 保持高达 128k 个令牌的鲁棒性,其中基线模型崩溃,证明在广泛的对话历史中对噪声的有效性。代码和数据集可通过https://github.com/Elvin-Yiming-Du/Memory-T1/获取

🛎️文章简介

🔸研究问题:如何在多会话的对话历史中实现准确的时间推理,以提高对话代理的一致性和准确性?
🔸主要贡献:论文提出了一个基于强化学习的时间感知记忆检索框架Memory-T1,显著提高了多会话对话的时间推理性能。

📝重点思路

🔸采用粗到细的记忆检索策略,从大量对话历史中高效筛选出与时间相关的候选记忆。
🔸设计了一个多层次的奖励机制,包括答案准确性、证据基础和时间一致性奖励,以强化模型的时间推理能力。
🔸通过预测查询时间范围,粗略过滤不相关的会话,进而使用相关性排名进一步精细筛选候选记忆。

🔎分析总结

🔸Memory-T1在Time-Dialog和LoCoMo基准上实现了最先进的时间推理性能,特别是在128k标记上下文中表现出色。
🔸该框架使一个7B模型的性能超越了14B基线,证明了时间感知检索和稠密奖励优化的有效性。
🔸实验结果显示,使用多层奖励结构定量提升了时间一致性,显著改善了模型的时间推理能力,并保持了在不同长度上下文中的稳健性。

💡个人观点

论文的核心是筛选出候选记忆,通过多层次奖励机制增强模型的推理性能。

🧩附录

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 20:34:06

树莓派更新失败常见问题:零基础快速理解指南

树莓派更新失败?别慌!手把手教你排查和解决常见问题你是不是也遇到过这种情况:兴致勃勃地打开树莓派终端,输入sudo apt update准备更新系统,结果屏幕上跳出一连串红色错误信息,瞬间懵了?Err:1 h…

作者头像 李华
网站建设 2026/4/15 21:40:03

Java毕设项目:基于web在线医疗预约与咨询平台基于SpringBoot的在线医疗预约与咨询服务平台的设计与实现(源码+文档,讲解、调试运行,定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/3 8:17:45

什么情况下会导致索引失效,如何排查和解决?

索引失效:场景、排查、解决方案全解析你想了解 MySQL 中索引失效的场景、排查方法和解决思路,这是优化数据库查询性能的核心问题 —— 索引失效会让本应快速的索引查询退化为全表扫描,性能暴跌。下面我会从「失效场景」「排查方法」「解决策略…

作者头像 李华
网站建设 2026/4/16 12:34:24

5步轻松搞定OpenCPN航海导航软件:从零开始到专业应用

5步轻松搞定OpenCPN航海导航软件:从零开始到专业应用 【免费下载链接】OpenCPN A concise ChartPlotter/Navigator. A cross-platform ship-borne GUI application supporting * GPS/GPDS Postition Input * BSB Raster Chart Display * S57 Vector ENChart Display…

作者头像 李华
网站建设 2026/4/16 13:00:11

杰理之发射端在接收端关机之后假死机【篇】

问题描述:在以linein为输入源连接接收端之后接收端关机,一直有数字打印出来直到看门狗复位。并且假死机时间与串口的波特率成反比关系。

作者头像 李华