news 2026/5/1 8:32:29

pentest-ai-agents:把Claude Code改造成28人红队小组的开源渗透测试框架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pentest-ai-agents:把Claude Code改造成28人红队小组的开源渗透测试框架

做渗透测试的朋友应该都有同感——让通用AI写个nmap命令还行,真到了AD域渗透、漏洞链构建这种细活,模型就开始"一本正经地胡说八道"。通用大模型的知识广度够了,深度却差口气,尤其面对安全领域的上下文,经常给出"看起来对、用起来错"的建议。

最近GitHub上冒出一个叫pentest-ai-agents的项目,作者是安全研究员0xSteph。这个项目没有重新造轮子,而是直接把Anthropic的Claude Code改造成了专业红队助手——不是那种只会聊天的"嘴炮型AI",而是能拆成28个专业Agent、覆盖完整渗透测试生命周期的实战工具包。


28个专业Agent,各司其职

pentest-ai-agents的核心思路很直接:与其让一个通用模型什么都懂一点,不如把渗透测试拆成专业模块,每个模块配一个深耕该领域的Agent。整个框架包含28个Claude Code子Agent,覆盖从信息收集到报告交付的全流程:

  • 侦察阶段:nmap、whois、whatweb等工具的策略指导

  • Web应用测试:ffuf、sqlmap、dalfox的实战编排

  • AD域渗透:BloodHound、Impacket、CrackMapExec、Certipy的联动分析

  • 云安全测试:AWS/Azure/GCP的权限提升与配置审计

  • 移动端渗透:Android/iOS的逆向与运行时分析

  • 无线与社会工程学:WiFi攻击向量、钓鱼策略设计

  • 漏洞利用链构建:从信息收集到Get Shell的完整路径规划

  • 检测工程与取证:攻击痕迹分析、日志溯源

  • 恶意软件分析:样本行为提取与IOC生成

  • 报告生成:带CVSS评分的专业交付文档

和传统单一AI模型最大的区别在于路由机制。用户输入的每个查询都会自动匹配到最合适的专业Agent,而不是让一个"万金油"模型硬答。这种设计在实战中很关键——让搞Web的Agent去聊AD域信任关系,和让搞AD的Agent去分析业务逻辑漏洞,效果天差地别。


一条命令搞定安装,零依赖部署

工具的安装体验做得相当干净。不需要服务器,不需要配环境,不需要装一堆依赖,一条命令直接到位:

bash

复制

curl -fsSL https://raw.githubusercontent.com/0xSteph/pentest-ai-agents/main/install.sh | bash

脚本会自动克隆代码库,把28个Agent文件复制到~/.claude/agents/目录。而且作者做了幂等性处理,重复执行就是更新,不用担心把现有配置搞乱。

如果需要更灵活的部署方式,还提供了两个额外选项:

  • --project:项目级部署,适合给特定渗透测试项目单独配一套Agent

  • --global --lite:精简模式,把咨询类Agent降级到Claude Haiku运行,Token消耗能省一大截

这种设计考虑到了不同场景的成本敏感度。给企业客户做渗透测试,该上Claude Opus就上;自己平时挖SRC、做研究,Haiku够用了,省钱。


双层执行模型:咨询与执行的边界

安全工具最怕什么?误操作。一条命令打出去,把客户生产环境搞崩了,这锅谁背?pentest-ai-agents在这里做了分层设计,把Agent的能力锁死在授权范围内。

Tier 1 咨询模式:用户把工具输出贴给Agent,Agent只做分析——给优先级排序、讲攻击思路、推荐下一步命令。这个阶段Agent不碰键盘,纯当顾问。

Tier 2 执行模式:Agent直接编写并执行命令,但每条命令都要经过用户显式确认。这个模式下工作的Agent包括侦察顾问、Web猎手、AD攻击者、漏洞链构建器、PoC验证器、业务逻辑猎手等。

所有攻击行为都映射到了MITRE ATT&CK框架的战术标识符,并且每个攻击步骤都附带防御上下文说明。这个细节很实用——渗透测试报告里能直接引用MITRE编号,防御方也能快速定位检测盲区。


SQLite持久化:跨会话的"作战记忆"

渗透测试很少能一天收工,尤其是内网渗透,经常要分几天推进。Claude Code的会话一关,之前的上下文就丢了,这是个大痛点。

pentest-ai-agents内置了一个基于SQLite的发现数据库findings.sh,专门用来跨会话保存任务数据。只要这个文件在系统PATH里,Tier 2 Agent会自动把执行结果写进去。今天扫到的端口、找到的凭据、梳理出的攻击路径,明天打开新会话还能接着用。

这种持久化设计让多日连续操作变得无缝。对团队作战来说,相当于给AI配了一个"作战笔记本",不会今天发现的东西明天就忘。


报告生成与本地化支持

报告Agent的输出格式很规范,包含执行摘要、CVSS评分、修复路线图,基本能直接拿来给客户交付。对渗透测试工程师来说,写报告的时间能省下一半。

更值得关注的是本地化支持。有些环境是隔离网络,有些客户对数据外传极度敏感,这时候云端模型根本没法用。项目附带了一个opencode-setup.sh脚本,能把所有Agent转换成兼容Ollama、LM Studio或任何本地模型的OpenCode自定义命令。也就是说,你可以在完全离线的环境里跑这套框架,数据不出内网。


MCP服务器扩展:从单兵到流水线

除了Claude Code本体,项目还配了一个叫pentest-ai的MCP服务器,把生态扩展到了IDE和CI/CD场景:

  • 150多个工具的封装接口

  • 自动化漏洞链构建

  • 支持Claude Desktop、Cursor、VS Code Copilot接入

  • 可集成到CI/CD流水线做自动化安全测试

这意味着pentest-ai-agents不只是个"聊天助手",它可以嵌入到开发工作流里。代码提交后自动触发安全扫描,Agent分析结果后直接提Issue或者阻断构建——这种玩法把渗透测试从"阶段性活动"变成了"持续性能力"。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 8:26:35

高效邮件沟通:从原则到实践的开源技能库

1. 项目概述:邮件技能库的构建与价值在数字协作成为主流的今天,电子邮件依然是商务沟通、团队协作乃至个人事务处理的基石。然而,我发现一个普遍存在的矛盾:几乎每个人都在频繁使用邮件,但真正能高效、专业地驾驭邮件沟…

作者头像 李华
网站建设 2026/5/1 8:24:07

终极微信抢红包助手:iOS版毫秒级自动抢红包完整实战指南

终极微信抢红包助手:iOS版毫秒级自动抢红包完整实战指南 【免费下载链接】WeChatRedEnvelopesHelper iOS版微信抢红包插件,支持后台抢红包 项目地址: https://gitcode.com/gh_mirrors/we/WeChatRedEnvelopesHelper 在移动社交时代,微信红包已成为…

作者头像 李华
网站建设 2026/5/1 8:24:07

Blender 3MF插件深度指南:让3D打印工作流无缝衔接

Blender 3MF插件深度指南:让3D打印工作流无缝衔接 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 还在为3D打印文件的格式转换而头疼吗?想象一下&…

作者头像 李华
网站建设 2026/5/1 8:22:23

DLSS Swapper:三步解决游戏卡顿问题,让你的游戏帧率飙升

DLSS Swapper:三步解决游戏卡顿问题,让你的游戏帧率飙升 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 你是否曾经遇到过这样的情况:刚买的新游戏,明明硬件配置足够&…

作者头像 李华
网站建设 2026/5/1 8:21:24

1分钟学懂AI:什么是大模型?

大模型是一种能根据用户要求生成内容的AI系统,它通过海量资料训练,学会组织语言、补全信息和表达答案,但可能出错。大模型因其训练数据量大、参数规模大、能处理任务广而得名,不同于传统AI的单功能工具,它更像一个通用…

作者头像 李华