news 2026/4/16 12:56:03

Deepseek+RD-Agent 自动化模型生成及进化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Deepseek+RD-Agent 自动化模型生成及进化

Deepseek+RD-Agent 自动化模型生成及进化

原创 QuantML编辑团队 QuantML2025年5月28日 20:26上海

RD-Agent 是一个专注于数据驱动场景的自动化研发系统,旨在简化模型和数据处理的开发流程。该系统通过结合传统软件工程与大语言模型,持续探索、实现和评估解决方案,实现科学方法的自动化。

RD-Agent在量化领域具有显著优势,主要体现在自动化因子发现、模型演化和研究报告处理三个核心方面。

自动化因子演化

RD-Agent 提供了完全自动化的因子发现和演化系统。该系统能够:

  • 持续假设生成:基于历史实验分析和领域专业知识自动提出新的因子假设

  • 迭代优化:通过反馈循环不断改进因子表现

  • 量化验证:使用 Qlib 进行严格的回测验证

自动化模型演化

在模型开发方面,RD-Agent 实现了端到端的自动化流程:

  • 模型架构自动设计:基于假设自动生成和优化模型结构

  • 代码自动实现:将模型设计转换为可执行的 PyTorch 代码

  • 性能自动评估:在CSI300 数据集上进行标准化回测

研究报告自动处理

RD-Agent 独特的报告处理能力为量化研究提供了重要优势:

  • 因子自动提取:从金融研究报告中自动识别和提取潜在交易因子

  • 快速实现验证:将报告中的因子描述转换为可测试的代码

  • 因子库扩展:持续丰富和完善因子库

技术架构优势

CoSTEER 代码生成框架

RD-Agent 使用专门的 CoSTEER 框架进行代码生成,确保高质量的实现:

系统根据任务类型自动选择相应的编码器,包括特征编码器、模型编码器等专门组件。

知识管理和学习

框架具备强大的知识管理能力:

  • 查询相似成功案例

  • 学习历史失败经验

  • 避免重复错误

在之前的文章我们介绍过RD-Agent及其安装方法,官方默认采用OpenAI 的API来实现各类任务。最近花了两天将其改为DeepSeek的API接口,实现自动化模型的生成。

R&D-Agent-Quant

RD-Agent Windows安装教程

RD-Agent : 自动化Quant工厂

首先,RD-Agent团队除了提供OpenAI以及Azure的backend之外,还提供了litellm的backend,通过litellm,能够轻松将接口改为DeepSeek等其他大模型。

具体配置方法为,在环境配置文件.env中,将BACKEND改为litellm,提供模型名称以及API Key:

BACKEND=rdagent.oai.backend.LiteLLMAPIBackend. CHAT_MODEL=deepseek/deepseek-chat DEEPSEEK_API_KEY=sk-***

当我天真的以为这就能够使用DeepSeek之后,才发现这是噩梦的开始,接下来在安装以及使用过程中,我遇到了Ubuntu源,Docker源的网络问题,embedding模型适配,json_model支持,json格式,模型输出效果等一系列问题,所幸大部分问题都得以解决。

不得不说,RD-Agent想法是非常好的,通过集成QLIB框架,利用LLM实现模型和因子的快速猜想和验证。

但是现阶段的问题在于,LLM能力接近一个初级研究员的水平,构造的模型和因子会存在许多问题。

对于模型而言,实际交易中,中低频不太需要去构造复杂深度学习模型,通过RD-Agent构造的模型结果还好。

但是在因子生成任务上,采用代码因子生成模式存在诸多弊端,首先大模型生成的因子代码均为简单因子,加之底层日频的数据类型限制因子种类,以及qlib本身截面算子的限制,很难带来增量alpha信息。

优化方式之一可以改为表达式因子生成的方式,具体可以参考我们之前的文章:

QuantML-Qlib Factor | DeepSeek自动因子挖掘及优化方案

在工程上,代码中频繁使用了try-cache以及retry的方式来确保LLM结果正确,但是这又带来了运行效率较低,在debug时会耗费大量的等待时间。

安装完成后,运行命令:

rdagent fin_model

DeepSeek根据模板自动生成深度学习模型和config配置文件,模型会在qlib的docker中自动运行,结合模型运行的及及结果反馈,DeepSeek尝试优化模型,自动改进模型结果,流程图如下图所示。

生成的模型代码:

模型回测结果:

任务启动之后,接下来就是漫长的等待,模型自动总结已有信息不断迭代生成新的模型结构,期待DeepSeek帮你实现一个效果更好的模型吧!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 11:09:35

[无线通信基础-36]:通信系统中的噪声种类与表达方式,通俗易懂

下面用通俗易懂、生活化的方式,带你了解通信系统中的噪声种类和它们的表达方式,即使没有专业背景也能轻松理解!🌟 一句话开场:噪声 通信中的“杂音”或“干扰”,就像你打电话时听到的“沙沙声”&#xff0…

作者头像 李华
网站建设 2026/4/5 17:11:50

‌合规测试自动化:NLP解析GDPR条款的测试用例生成工具‌

合规测试的自动化革命‌ 在数字化时代,GDPR等数据保护法规要求企业严格处理个人数据,违规风险可能导致巨额罚款。传统手动测试效率低下,无法覆盖复杂法规条款,而NLP驱动的自动化工具正成为测试工程师的新利器。通过解析法规文本、…

作者头像 李华
网站建设 2026/4/11 0:11:31

滚动轴承早期故障优化蚁群算法优化的随机共振诊断法 针对滚动轴承不同零件早期故障诊断难的问题

滚动轴承早期故障优化蚁群算法优化的随机共振诊断法 针对滚动轴承不同零件早期故障诊断难的问题,课题组提出了蚁群算法优化随机共振的诊断方法。 ;提出了以信噪比为目标的优化自适应随机共振诊断法;采用正弦加噪信号的仿真实验验证了优化自适应随机共振的诊断可行性…

作者头像 李华
网站建设 2026/4/16 12:29:10

军工系统如何通过TinyMCE插件实现Word文档精准导入?

项目需求技术评估与实施方案 一、需求背景分析 作为北京某国企项目负责人,我们当前面临在企业网站后台管理系统中集成Word粘贴、文档导入和微信公众号内容处理功能的迫切需求。该需求源于政府项目对文档处理能力提升的要求,同时需要满足信创国产化环境…

作者头像 李华
网站建设 2026/4/13 11:31:47

【Python全栈开发】第2讲 | 数据结构全实战、流程控制与 Pythonic 迭代艺术

【Python全栈开发】第2讲 | 数据结构全实战、流程控制与 Pythonic 迭代艺术 1. 架构师视角:数据结构就是你的“收纳盒” 兄弟们,如果你把上一讲的变量看作是单个的零件,那这一讲的数据结构就是你的“工具箱”或者“收纳盒”。 在全栈开发里…

作者头像 李华