pentest-ai-agents：把Claude Code改造成28人红队小组的开源渗透测试框架-编程阁

做渗透测试的朋友应该都有同感——让通用AI写个nmap命令还行，真到了AD域渗透、漏洞链构建这种细活，模型就开始"一本正经地胡说八道"。通用大模型的知识广度够了，深度却差口气，尤其面对安全领域的上下文，经常给出"看起来对、用起来错"的建议。

最近GitHub上冒出一个叫pentest-ai-agents的项目，作者是安全研究员0xSteph。这个项目没有重新造轮子，而是直接把Anthropic的Claude Code改造成了专业红队助手——不是那种只会聊天的"嘴炮型AI"，而是能拆成28个专业Agent、覆盖完整渗透测试生命周期的实战工具包。

28个专业Agent，各司其职

pentest-ai-agents的核心思路很直接：与其让一个通用模型什么都懂一点，不如把渗透测试拆成专业模块，每个模块配一个深耕该领域的Agent。整个框架包含28个Claude Code子Agent，覆盖从信息收集到报告交付的全流程：

侦察阶段：nmap、whois、whatweb等工具的策略指导
Web应用测试：ffuf、sqlmap、dalfox的实战编排
AD域渗透：BloodHound、Impacket、CrackMapExec、Certipy的联动分析
云安全测试：AWS/Azure/GCP的权限提升与配置审计
移动端渗透：Android/iOS的逆向与运行时分析
无线与社会工程学：WiFi攻击向量、钓鱼策略设计
漏洞利用链构建：从信息收集到Get Shell的完整路径规划
检测工程与取证：攻击痕迹分析、日志溯源
恶意软件分析：样本行为提取与IOC生成
报告生成：带CVSS评分的专业交付文档

和传统单一AI模型最大的区别在于路由机制。用户输入的每个查询都会自动匹配到最合适的专业Agent，而不是让一个"万金油"模型硬答。这种设计在实战中很关键——让搞Web的Agent去聊AD域信任关系，和让搞AD的Agent去分析业务逻辑漏洞，效果天差地别。

一条命令搞定安装，零依赖部署

工具的安装体验做得相当干净。不需要服务器，不需要配环境，不需要装一堆依赖，一条命令直接到位：

bash

复制

curl -fsSL https://raw.githubusercontent.com/0xSteph/pentest-ai-agents/main/install.sh | bash

脚本会自动克隆代码库，把28个Agent文件复制到~/.claude/agents/目录。而且作者做了幂等性处理，重复执行就是更新，不用担心把现有配置搞乱。

如果需要更灵活的部署方式，还提供了两个额外选项：

--project：项目级部署，适合给特定渗透测试项目单独配一套Agent
--global --lite：精简模式，把咨询类Agent降级到Claude Haiku运行，Token消耗能省一大截

这种设计考虑到了不同场景的成本敏感度。给企业客户做渗透测试，该上Claude Opus就上；自己平时挖SRC、做研究，Haiku够用了，省钱。

双层执行模型：咨询与执行的边界

安全工具最怕什么？误操作。一条命令打出去，把客户生产环境搞崩了，这锅谁背？pentest-ai-agents在这里做了分层设计，把Agent的能力锁死在授权范围内。

Tier 1 咨询模式：用户把工具输出贴给Agent，Agent只做分析——给优先级排序、讲攻击思路、推荐下一步命令。这个阶段Agent不碰键盘，纯当顾问。

Tier 2 执行模式：Agent直接编写并执行命令，但每条命令都要经过用户显式确认。这个模式下工作的Agent包括侦察顾问、Web猎手、AD攻击者、漏洞链构建器、PoC验证器、业务逻辑猎手等。

所有攻击行为都映射到了MITRE ATT&CK框架的战术标识符，并且每个攻击步骤都附带防御上下文说明。这个细节很实用——渗透测试报告里能直接引用MITRE编号，防御方也能快速定位检测盲区。

SQLite持久化：跨会话的"作战记忆"

渗透测试很少能一天收工，尤其是内网渗透，经常要分几天推进。Claude Code的会话一关，之前的上下文就丢了，这是个大痛点。

pentest-ai-agents内置了一个基于SQLite的发现数据库findings.sh，专门用来跨会话保存任务数据。只要这个文件在系统PATH里，Tier 2 Agent会自动把执行结果写进去。今天扫到的端口、找到的凭据、梳理出的攻击路径，明天打开新会话还能接着用。

这种持久化设计让多日连续操作变得无缝。对团队作战来说，相当于给AI配了一个"作战笔记本"，不会今天发现的东西明天就忘。

报告生成与本地化支持

报告Agent的输出格式很规范，包含执行摘要、CVSS评分、修复路线图，基本能直接拿来给客户交付。对渗透测试工程师来说，写报告的时间能省下一半。

更值得关注的是本地化支持。有些环境是隔离网络，有些客户对数据外传极度敏感，这时候云端模型根本没法用。项目附带了一个opencode-setup.sh脚本，能把所有Agent转换成兼容Ollama、LM Studio或任何本地模型的OpenCode自定义命令。也就是说，你可以在完全离线的环境里跑这套框架，数据不出内网。