news 2026/6/9 23:47:26

AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现

AI 科学家 v2:
基于智能体树搜索的研讨会级自动化科学发现

📚 [论文] | 📝 [博客文章] | 📂 [ICLR2025研讨会实验]

完全自主的科研系统正变得越来越强大,人工智能在变革科学发现方式方面发挥着关键作用。我们很高兴地推出 AI Scientist-v2,这是一个通用的端到端智能体系统,它生成了第一篇完全由人工智能撰写并通过同行评审的研讨会论文。

该系统能够自主生成假设、运行实验、分析数据并撰写科学论文。与前代产品(AI Scientist-v1)不同,AI Scientist-v2 不再依赖人工编写的模板,能够跨机器学习(ML)领域进行泛化,并采用由实验管理代理引导的渐进式智能体树搜索方法。

注意:AI Scientist-v2 并不一定比 v1 产出更好的论文,尤其是在已有可靠的初始模板的情况下。v1 遵循明确的模板,因此成功率较高;而v2 则采用更广泛、更具探索性的方法,成功率较低。v1 最适合目标明确、基础扎实的任务,而 v2 则专为开放式的科学探索而设计。

警告!此代码库将执行使用大型语言模型 (LLM) 编写的代码。这种自主性会带来各种风险和挑战,包括可能使用危险软件包、不受控制的网络访问以及可能生成意外进程。请务必在受控的沙箱环境(例如 Docker 容器)中运行此代码库。请自行斟酌使用。

目录

  1. 要求
    • 安装
    • 支持的型号和 API 密钥
  2. 提出研究思路
  3. 运行 AI Scientist-v2 论文生成实验
  4. 引用《人工智能科学家》第二版
  5. 常见问题解答
  6. 致谢

要求

该代码旨在利用 CUDA 和 PyTorch 在配备 NVIDIA GPU 的 Linux 系统上运行。

安装

#Create a new conda environmentconda create -n ai_scientist python=3.11 conda activate ai_scientist#Install PyTorch with CUDA support (adjust pytorch-cuda version for your setup)conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia#Install PDF and LaTeX toolsconda install anaconda::poppler conda install conda-forge::chktex#Install Python package requirementspip install -r requirements.txt

安装通常不超过一个小时。

支持的型号和 API 密钥

OpenAI模型

默认情况下,系统使用OPENAI_API_KEYOpenAI 模型的环境变量。

双子座模型

默认情况下,系统GEMINI_API_KEY通过 OpenAI API 使用 Gemini 模型的环境变量。

通过 AWS Bedrock 构建 Claude 模型

要使用 Amazon Bedrock 提供的 Claude 模型,请安装必要的附加软件包:

pip install anthropic[bedrock]

接下来,通过设置以下环境变量来配置有效的AWS凭证和目标AWS 区域AWS_ACCESS_KEY_ID: ,,AWS_SECRET_ACCESS_KEYAWS_REGION_NAME

Semantic Sc​​holar API(文献检索)

我们的代码可以选择使用Semantic Sc​​holar API 密钥(S2_API_KEY)来提高文献检索的吞吐量(如果您拥有该密钥)。这在构思和论文撰写阶段都会用到。即使没有该密钥,系统也能正常运行,但您可能会在构思阶段遇到速率限制或新颖性检查减少的情况。如果您在使用 Semantic Sc​​holar 时遇到问题,可以在论文生成过程中跳过引用阶段。

设置 API 密钥

请确保将您计划使用的模型所需的 API 密钥作为环境变量提供。例如:

exportOPENAI_API_KEY="YOUR_OPENAI_KEY_HERE"exportS2_API_KEY="YOUR_S2_KEY_HERE"#Set AWS credentials if using Bedrock#export AWS_ACCESS_KEY_ID="YOUR_AWS_ACCESS_KEY_ID"#export AWS_SECRET_ACCESS_KEY="YOUR_AWS_SECRET_KEY"#export AWS_REGION_NAME="your-aws-region"

提出研究思路

在运行完整的 AI Scientist-v2 实验流程之前,您首先需要使用ai_scientist/perform_ideation_temp_free.py脚本来生成潜在的研究思路。该脚本使用逻辑逻辑模型 (LLM) 根据您提供的高级主题描述进行头脑风暴和思路提炼,并与 Semantic Sc​​holar 等工具交互以检查研究思路的新颖性。

  1. 准备主题描述:创建一个 Markdown 文件(例如 `<script>.markdown.js`my_research_topic.md),描述您希望 AI 探索的研究领域或主题。该文件应包含 `<script>`Title、 `<script>`Keywords、 `<script>` 和 `<script>` 等部分TL;DRAbstract以定义研究范围。请参考示例文件ai_scientist/ideas/i_cant_believe_its_not_better.md了解预期结构和内容格式。将您的文件放置在脚本可访问的位置(例如 `<script>`ai_scientist/ideas/目录)。

  2. 运行构思脚本:主项目目录执行脚本,指向您的主题描述文件并指定所需的 LLM

    python ai_scientist/perform_ideation_temp_free.py \ --workshop-file"ai_scientist/ideas/my_research_topic.md"\ --model gpt-4o-2024-05-13 \ --max-num-generations 20 \ --num-reflections 5
    • --workshop-file:主题描述 Markdown 文件的路径。
    • --model:用于生成想法的 LLM(确保您已设置相应的 API 密钥)。
    • --max-num-generations要尝试产生多少个不同的研究思路?
    • --num-reflections:LLM 应该对每个想法执行多少次细化步骤。
  3. 输出:脚本将生成一个以您输入的 Markdown 文件命名的 JSON 文件(例如,`.js`ai_scientist/ideas/my_research_topic.json)。该文件将包含结构化的研究思路列表,包括假设、拟定的实验以及相关工作分析。

  4. 继续进行实验:生成包含研究思路的 JSON 文件后,即可进入下一节运行实验。

这一构思步骤引导人工智能科学家关注特定的研究领域,并产生具体的研究方向,以便在主要实验流程中进行测试。

运行 AI Scientist-v2 论文生成实验

利用上一阶段构思过程中生成的 JSON 文件,您现在可以启动 AI Scientist-v2 的主要流程。该流程包括通过智能体树搜索运行实验、分析结果并生成论文草稿。

通过命令行参数指定用于撰写和评审阶段的模型。最佳优先树搜索 (BFTS) 的配置位于 [此处]bfts_config.yaml。根据需要调整此文件中的参数。

关键树搜索配置参数bfts_config.yaml

  • agent配置:
    • 设置num_workers并行探索路径的数量和steps要探索的最大节点数。例如,如果设置了并行探索路径的数量num_workers=3和要探索的最大节点数steps=21,则树搜索将最多探索 21 个节点,每一步同时扩展 3 个节点。
    • num_seedsnum_workers:通常情况下,如果num_workers小于 3,则应与此相同。否则,设置num_seeds为 3。
    • 注意:其他代理参数如k_fold_validation、、expose_predictiondata_preview在当前版本中未使用。
  • search配置:
    • max_debug_depth:代理在放弃该搜索路径之前尝试调试故障节点的最大次数。
    • debug_prob尝试调试故障节点的概率。
    • num_drafts:第一阶段的初始根节点数(即要生长的独立树的数量)。

使用生成的 idea 文件运行 AI-Scientist-v2 的示例命令(例如my_research_topic.json)。请查看bfts_config.yaml详细树搜索参数(默认配置包含实验所需的参数)。如果您不想使用代码片段初始化实验,claude-3-5-sonnet请勿设置此项。load_code

python launch_scientist_bfts.py \ --load_ideas"ai_scientist/ideas/my_research_topic.json"\ --load_code \ --add_dataset_ref \ --model_writeup o1-preview-2024-09-12 \ --model_citation gpt-4o-2024-11-20 \ --model_review gpt-4o-2024-11-20 \ --model_agg_plots o3-mini-2025-01-31 \ --num_cite_rounds 20

初始实验阶段完成后,您会在experiments/目录下找到一个带有时间戳的日志文件夹。进入experiments/"timestamp_ideaname"/logs/0-run/该文件夹即可找到树状可视化文件unified_tree_viz.html。所有实验阶段完成后,将进入报告撰写阶段。报告撰写阶段通常需要 20 到 30 分钟。完成后,您应该可以timestamp_ideaname.pdftimestamp_ideaname文件夹中看到报告。在本示例运行中,所有阶段通常会在几个小时内完成。

引用《人工智能科学家》第二版

如果您在研究中使用AI Scientist-v2 ,请按以下方式引用我们的工作:

@article{aiscientist_v2,title={The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search},author={Yamada, Yutaro and Lange, Robert Tjarko and Lu, Cong and Hu, Shengran and Lu, Chris and Foerster, Jakob and Clune, Jeff and Ha, David},journal={arXiv preprint arXiv:2504.08066},year={2025}}

常见问题解答

为什么我的实验没有生成 PDF 文件或评论?

AI Scientist-v2 完成实验的成功率取决于所选的基础模型和想法的复杂程度。通常情况下,在实验阶段使用像 Claude 3.5 Sonnet 这样强大的模型可以获得更高的成功率。

每次实验的预计成本是多少?

构思阶段的成本取决于所使用的逻辑学习模型(LLM)和迭代次数/反射次数,但通常很低(几美元)。对于主要实验流程,使用 Claude 3.5 Sonnet 进行实验阶段,每次运行的成本通常在 15 到 20 美元左右。后续的编写阶段,如果使用示例命令中指定的默认模型,则大约会增加 5 美元的成本。model_citation建议使用 GPT-4o,因为它有助于降低编写成本。

如何针对不同学科领域运行 AI Scientist-v2?

首先,执行“生成研究思路”步骤。创建一个新的 Markdown 文件,描述您所需的研究领域或主题,并遵循示例的结构ai_scientist/ideas/i_cant_believe_its_not_better.md。运行perform_ideation_temp_free.py脚本并使用此文件生成相应的 JSON 思路文件。然后,继续执行“运行 AI Scientist-v2 论文生成实验”launch_scientist_bfts.py步骤,并通过参数将此 JSON 文件传递​​给脚本--load_ideas

如果我访问 Semantic Sc​​holar API 时遇到问题,应该怎么办?

Semantic Sc​​holar API 用于评估生成想法的新颖性,并在论文撰写阶段收集引用。如果您没有 API 密钥或遇到速率限制,则可以跳过这些阶段。

我遇到了“CUDA内存不足”错误。我该怎么办?

当 AI Scientist-v2 尝试加载或运行的模型所需的 GPU 内存超过系统可用内存时,通常会发生此错误。要解决此问题,您可以尝试更新您的构思提示文件(ai_scientist/ideas/my_research_topic.md),建议使用较小的模型进行实验。

致谢

目录中实现的树状搜索组件ai_scientist基于AIDE项目构建。我们感谢 AIDE 开发人员的宝贵贡献,并感谢他们将工作成果公开发布。

星际历史

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 15:04:15

FPGA教程系列-Vivado AXI4-Stream接口解读

FPGA教程系列-Vivado AXI4-Stream接口解读 俗话说&#xff0c;纸上得来终觉浅&#xff0c;理论看了半天可能都觉不出来有什么难的&#xff0c;上次仿真了一下AXI&#xff0c;跟实际的不一样&#xff0c;但是总归是动手了&#xff0c;大概知道了一些&#xff0c;现在就返回来重新…

作者头像 李华
网站建设 2026/6/10 10:06:34

3分钟学会百度网盘提取码一键获取:告别繁琐查询的终极方案

还在为百度网盘分享链接的提取码而四处奔波吗&#xff1f;每次遇到需要输入提取码的资源&#xff0c;都要在多个网页间来回切换&#xff0c;严重影响获取效率。baidupankey工具的出现彻底改变了这一现状&#xff0c;让百度网盘提取码一键获取变得前所未有的简单高效。 【免费下…

作者头像 李华
网站建设 2026/6/10 12:53:48

终极指南:文泉驿微米黑字体跨平台安装与高级配置完全攻略

终极指南&#xff1a;文泉驿微米黑字体跨平台安装与高级配置完全攻略 【免费下载链接】fonts-wqy-microhei Debian package for WenQuanYi Micro Hei (mirror of https://anonscm.debian.org/git/pkg-fonts/fonts-wqy-microhei.git) 项目地址: https://gitcode.com/gh_mirror…

作者头像 李华
网站建设 2026/6/9 17:58:18

基于JAVA的网上购物商城系统1cz5q351 商家

目录 已开发项目效果实现截图开发技术系统开发工具&#xff1a; 核心代码参考示例1.建立用户稀疏矩阵&#xff0c;用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&am…

作者头像 李华
网站建设 2026/6/9 17:58:43

打造终极macOS应用商店:Applite免费开源图形化管理神器

还在为macOS软件安装烦恼吗&#xff1f;命令行操作让你望而却步&#xff1f;Applite横空出世&#xff0c;将复杂的Homebrew Cask命令行工具转化为直观易用的图形界面&#xff0c;让普通用户也能轻松管理第三方软件。这款开源应用彻底改变了macOS软件管理方式&#xff0c;让每个…

作者头像 李华
网站建设 2026/6/10 16:47:55

Vue可视化打印插件终极指南:从零基础到精通实战

Vue可视化打印插件终极指南&#xff1a;从零基础到精通实战 【免费下载链接】vue-plugin-hiprint hiprint for Vue2/Vue3 ⚡打印、打印设计、可视化设计器、报表设计、元素编辑、可视化打印编辑 项目地址: https://gitcode.com/gh_mirrors/vu/vue-plugin-hiprint 在现代…

作者头像 李华