AI Agent智能体合集
一、AI 编程智能体(IDE / 终端编程)
1.1 IDE 集成编程智能体
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| Cursor AI | 基于 AI 的原生代码编辑器,深度集成 LLM,支持对话式代码生成、上下文感知的自动补全、对整个项目的理解。核心优势:开箱即用的 AI-first 编辑体验,无需额外配置即可享受强大的 AI 编程辅助 | 查看 |
| GitHub Copilot | GitHub 官方出品的 AI 编程助手,集成于 VS Code / JetBrains 等主流 IDE。核心优势:背靠 GitHub 海量代码库训练,生态完善,提供行级补全、Chat 对话、PR 总结等全链路能力 | 查看 |
| Cline | VS Code / JetBrains 中的自主编程 Agent 插件,支持多模型切换。核心优势:完全本地运行、支持任意 LLM 后端,能在 IDE 内自主读写文件、执行终端命令、完成多步骤开发任务 | 查看 |
| Devin Desktop | Cognition 公司推出的首款 AI 软件工程师的桌面版本。核心优势:端到端自主完成软件开发任务,从理解需求到编写代码、调试、部署全流程自动化 | 查看 |
1.2 终端编程智能体
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| Aider | 运行在终端中的 AI 结对编程工具,直接与 Git 仓库交互。核心优势:小而快、厂商中立,在 SSH / tmux / 远程服务器等任何 shell 中均可使用,自动提交每次变更 | 查看 |
| Claude Code | Anthropic 官方推出的终端 AI 编程 Agent。核心优势:原生 Claude 模型深度集成,强大的代码理解和项目级上下文感知能力,支持深度代码审查和重构 | 查看 |
| OpenAI Codex CLI | OpenAI 官方终端编程工具。核心优势:OpenAI 官方出品,支持自然语言驱动的编程任务,与 GPT 系列模型深度集成 | 查看 |
| OpenCode | 开源 AI 编程 Agent,支持终端(TUI)、桌面应用、浏览器(Web)和 IDE 多端运行。核心优势:兼容 Claude Code 工作流,全平台覆盖,提供完整的代码生成、修改、调试和审查能力 | 查看 |
| Kilo Code | 开源 AI 编码助手,支持 500+ 模型(包括 GPT-5.5、Claude Opus 等),跨平台支持 VS Code / JetBrains / CLI。核心优势:超大规模模型兼容性,提供自动化任务执行和权限控制系统 | 查看 |
| Gemini CLI | Google 开源的 AI 终端智能体。核心优势:Google 官方出品,深度集成 Gemini 多模态模型,支持终端内的代码生成、调试和自然语言交互 | 查看 |
二、通用自主智能体(General Purpose Agent)
2.1 自主编程 Agent
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| OpenHands | 开源自主 AI 软件工程代理平台,让 AI 独立完成软件开发全生命周期。核心优势:Star 数最多的开源 AI 编程代理,支持完全自托管、多云厂商 LLM、Docker 沙箱隔离 | 查看 |
| AutoGPT | 强大的 AI Agent 平台,允许用户创建、部署和管理持续运行的 AI 智能体。核心优势:史上增长最快的开源项目之一,自动化复杂工作流,支持 Agent 自主决策和执行 | 查看 |
| Goose | 通用 AI Agent,运行在用户本地机器上,不仅是代码补全工具。核心优势:完整的智能体系统,可以安装、执行、编辑和测试代码,支持自主完成复杂开发任务 | 查看 |
2.2 个人 AI 助手 / 智能体运行时框架
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| Hermes Agent | 全功能 AI Agent 框架,支持浏览器 CDP 控制、cron 调度、技能系统、多模型路由等。核心优势:模块化架构、插件化扩展,支持丰富的工具集和持久化记忆 | 查看 |
| nanobot | 开源超轻量级 AI Agent 运行时框架,由 Xubin Ren (HKUDS) 发起。核心优势:极简内核、代码可读性强,提供 WebUI、聊天通道、工具调用、记忆系统、MCP 协议支持、模型路由和部署方案 | 查看 |
| ZeroClaw | 基于 Rust 构建的轻量级 AI 代理运行时框架,定位为 OpenClaw 的安全替代品。核心优势:Rust 原生开发、安全优先,性能优越的 AI 助手运行时环境 | 查看 |
| OpenHuman | 个人 AI 助手 Agent 平台。核心优势:面向个人用户的智能助手,支持多模态交互和自然语言任务执行 | 查看 |
| OpenClaw | 个人 AI 助手框架,运行在你自己的设备上,通过已有的消息通道(微信、飞书、WebChat 等)交互。核心优势:多渠道接入 + 语音输入输出 + 实时画布渲染 | 查看 |
| Open Interpreter | 让大语言模型在本地环境中执行代码(Python、JavaScript、Shell 等)。核心优势:类似 ChatGPT 的终端界面,通过自然语言与计算机进行交互,直接运行代码 | 查看 |
三、浏览器 / GUI 自动化智能体
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| Browser Use | 开源 AI 浏览器自动化框架,让 AI Agent 通过 LLM 自主控制浏览器。核心优势:基于 Python + CDP 架构,让 LLM 理解网页内容、做出决策并执行操作 | 查看 |
| Open Computer Use | 开源 AI 计算机控制平台,让 AI Agent 像人类一样实际控制电脑。核心优势:真正执行操作而非仅"谈论"任务,支持浏览网页、运行命令、点击 UI、编排多步骤工作流 | 查看 |
| UI-TARS Desktop | 基于 UI-TARS 视觉-语言-动作模型的桌面 GUI Agent。核心优势:强大的视觉理解能力,通过屏幕截图理解 GUI 界面并执行操作,跨应用通用性强 | 查看 |
| ShowUI VLA | 新加坡国立大学 Show Lab 和微软联合开发的开源端到端 VLA 模型。核心优势:专为 GUI Agent 和计算机使用场景设计,轻量级视觉-语言-动作模型 | 查看 |
| Agent-S3 | 开源 GUI Agent 框架。核心优势:专注于 GUI 自动化任务,提供结构化的智能体框架用于桌面应用和 Web 界面的自动化操作 | 查看 |
四、多智能体协作框架(Multi-Agent Framework)
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| CrewAI | 开源 Python 框架,用于编排角色扮演式自主 AI 智能体。核心优势:通过协作智能让多个智能体无缝协作,支持角色定义、任务委派和团队协同完成复杂任务 | 查看 |
| LangGraph | 低级别 Python 编排框架,用于构建有状态的、基于图的结构化 AI Agent 应用。核心优势:将 Agent 架构建模为有向图,支持循环执行流,这是传统链式编排无法做到的 | 查看 |
| Odysseus | 多智能体协作框架。核心优势:支持多 Agent 协同推理和任务分配,适用于需要多个专业智能体配合完成的复杂场景 | 查看 |
五、AI 协同办公智能体
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| OpenCoworkAI | AI 协同办公智能体平台。核心优势:模拟真实团队协作,支持多人多 Agent 协同完成文档编写、代码开发等办公任务 | 查看 |
| Claude Cowork | 基于 Claude 模型的 AI 协同办公工具。核心优势:Anthropic Claude 深度集成,支持自然语言驱动的办公任务协作和文档处理 | 查看 |
六、AI 应用开发平台
| 智能体 | 简介 | 专栏链接 |
|---|---|---|
| Dify | 开源的大语言模型应用开发与运维平台(LangGenius 开发)。核心优势:可视化的 LLM 应用开发,支持工作流编排、RAG、Prompt 管理、模型切换等一站式能力 | 查看 |
| OpenWebUI | 可扩展、功能丰富的自托管 AI 平台,支持完全离线运行。核心优势:AI 操作系统级别的平台,将对话、知识库、工具、模型管理等统一在一个界面中 | 查看 |