Um sistema de IA capaz de conduzir um pentest completo sem intervenção humana. Essa é a promessa do PentAGI, um projeto open source que irrompeu no cenário da cibersegurança no início de 2026. Com mais de 12.500 estrelas no GitHub, uma arquitetura multiagente sofisticada e a integração de mais de vinte ferramentas profissionais de segurança ofensiva, o projeto desenvolvido pela VXControl desperta tanto entusiasmo quanto questionamentos legítimos. Trata-se de uma revolução no pentest, ou apenas mais uma ferramenta em um ecossistema já saturado? Aqui está nossa análise completa.
O nome PentAGI é um condensado de sua ambição: Penetration testing Artificial General Intelligence. O projeto se apresenta como um sistema de agentes de IA totalmente autônomo, capaz de realizar tarefas complexas de pentest utilizando um terminal, um navegador, um editor de código e sistemas de busca externos. Na prática, você descreve um alvo e o sistema se encarrega do resto: reconhecimento, varredura de portas, identificação de vulnerabilidades, tentativa de exploração e geração de relatório.
O projeto foi iniciado no começo de 2025 pela VXControl, uma organização ativa no GitHub especializada em ferramentas de segurança. A última versão lançada, a v1.2.0, foi publicada em 25 de fevereiro de 2026. Distribuído sob licença MIT, o PentAGI é totalmente gratuito e auto-hospedável. Os únicos custos potenciais dizem respeito ao uso de modelos de linguagem em nuvem (OpenAI, Anthropic), mas a ferramenta também suporta modelos locais via Ollama, o que permite um uso totalmente gratuito.
A recepção da comunidade foi explosiva. O repositório no GitHub atingiu 12.500 estrelas e 1.600 forks, posicionando-se entre os repositórios mais populares do mês de seu lançamento. Nas redes sociais, a viralidade foi imediata.
Esse tweet, compartilhado milhares de vezes, resume o sentimento dominante: "Alguém acabou de tornar open source um Red Team de IA totalmente autônomo. Múltiplos agentes de IA que se comunicam entre si para invadir um alvo. Zero intervenção humana." Uma afirmação que merece ser matizada, como veremos adiante.
O que verdadeiramente distingue o PentAGI de seus antecessores como o PentestGPT é sua arquitetura multiagente. Enquanto uma ferramenta clássica utiliza um único modelo de linguagem para orientar um operador humano, o PentAGI orquestra mais de treze agentes especializados, cada um com competências e permissões específicas.
A arquitetura repousa sobre uma divisão precisa do trabalho, inspirada no funcionamento de uma verdadeira equipe de pentest:
Agent | Rôle |
|---|---|
Orchestrateur | Coordonne l'ensemble de la mission, planifie les étapes, distribue les tâches |
Chercheur (searcher) | Effectue la reconnaissance, les recherches OSINT, les requêtes DNS |
Développeur (coder) | Écrit des scripts d'exploitation, génère du code adapté à la cible |
Pentesteur (pentester) | Exécute les scans et les exploits avec les outils de sécurité intégrés |
Installateur (installer) | Gère les dépendances et les paquets nécessaires aux opérations |
Conseiller (adviser) | Fournit une expertise stratégique et oriente la planification |
Réflecteur (reflector) | Analyse les résultats, identifie les échecs et propose des ajustements |
Enrichisseur (enricher) | Complète et contextualise les données collectées |
Générateur / Affineur | Produisent et améliorent les rapports de vulnérabilités |
O princípio fundamental é o do menor privilégio: cada agente só enxerga as ferramentas das quais precisa. O pesquisador pode executar buscas na web e consultas DNS, mas não pode lançar exploits. O pentester pode utilizar Nmap e Metasploit, mas não tem acesso à escrita de arquivos arbitrários. Esse isolamento é implementado no código Go do backend por meio de um registro de permissões dedicado, no qual cada tentativa de chamada de uma ferramenta não autorizada é bloqueada e registrada em log.
Além da simples orquestração, o PentAGI integra um sistema de memória em três níveis. A memória de longo prazo, alimentada por PostgreSQL e pgvector, armazena os resultados de busca e as abordagens que funcionaram no passado. A memória de trabalho conserva o contexto atual da missão, os objetivos ativos e o estado do sistema. A memória episódica arquiva as ações passadas, seus resultados e os padrões de sucesso identificados.
Todo o conjunto é enriquecido por um grafo de conhecimento alimentado por Neo4j e Graphiti, que permite ao sistema acompanhar as relações semânticas entre os elementos descobertos durante um teste. Por exemplo, se uma varredura revela um serviço vulnerável em uma porta específica, o grafo pode relacionar essa informação a CVEs conhecidas, a exploits disponíveis e a configurações similares encontradas em missões anteriores. Essa capacidade de aprendizado adaptativo é o que permite, teoricamente, ao sistema melhorar ao longo das utilizações.
Um desafio técnico importante para qualquer sistema baseado em LLM é a gestão do contexto. Os pentests geram volumes consideráveis de dados: logs de scan, respostas de servidores, código-fonte, etc. O PentAGI utiliza uma técnica de "chain summarization" para condensar os resultados intermediários e manter um contexto relevante na janela de tokens do modelo, com um suporte que vai até 200.000 tokens, dependendo do provedor utilizado.
Um dos grandes trunfos do PentAGI é sua integração nativa com as ferramentas ofensivas padrão da indústria. O sistema embarca mais de vinte ferramentas profissionais de segurança, todas executadas em um contêiner Docker baseado na imagem Kali Linux da VXControl.
Entre as ferramentas integradas, encontramos os clássicos incontornáveis:
Nmap: o scanner de portas e serviços de referência, utilizado na fase de reconhecimento
Metasploit Framework: a plataforma de exploração mais completa do mercado
sqlmap: especializado na detecção e exploração de injeções SQL
Nikto: scanner de vulnerabilidades web
Gobuster / Dirbuster: ferramentas de descoberta de diretórios e arquivos ocultos
Hydra: ataque por força bruta em protocolos de autenticação
O agente pentester do PentAGI não se limita a lançar essas ferramentas: ele interpreta seus resultados, adapta sua estratégia em função das respostas obtidas e encadeia as etapas de maneira lógica. Por exemplo, uma varredura Nmap que revele um servidor web na porta 443 acionará automaticamente uma varredura Nikto, seguida de uma tentativa de descoberta de diretórios e, em seguida, uma análise das vulnerabilidades potenciais.
Além das ferramentas ofensivas, o PentAGI integra sete sistemas de busca externos: Tavily, Traversaal, Perplexity, DuckDuckGo, Google Custom Search, Sploitus (especializado na busca de exploits) e SearXNG. Essa capacidade permite ao sistema buscar em tempo real informações sobre vulnerabilidades publicadas recentemente, CVEs específicas ou técnicas de exploração adaptadas ao alvo analisado.
Um navegador web isolado (scraper) completa esse arsenal, permitindo ao agente coletar informações diretamente de páginas web, documentação técnica ou portais de administração.
A arquitetura do PentAGI segue um modelo de microsserviços moderno, com uma separação clara entre os componentes:
Composant | Technologie | Rôle |
|---|---|---|
Backend API | Go + GraphQL/REST | Logique métier, orchestration des agents |
Frontend | React + TypeScript | Interface de monitoring et de contrôle |
Base de données | PostgreSQL + pgvector | Stockage persistant, recherche vectorielle |
Graphe de connaissances | Neo4j + Graphiti | Relations sémantiques, mémoire contextuelle |
Monitoring | Grafana, VictoriaMetrics, Jaeger, Loki | Tableaux de bord, métriques, traces distribuées |
Analytics LLM | Langfuse + ClickHouse | Analyse des interactions avec les modèles |
Cache | Redis | Cache et limitation de débit |
Stockage objet | MinIO | Stockage S3 compatible |
Exécution | Docker (conteneur sandboxé) | Isolation des opérations offensives |
A escolha de Go para o backend não é trivial. A linguagem oferece excelente desempenho para a gestão concorrente dos agentes e para as filas de tarefas assíncronas, dois elementos críticos em um sistema multiagente.
Uma das escolhas arquiteturais mais interessantes do PentAGI é seu agnosticismo em relação aos modelos de linguagem. Via LiteLLM, o sistema suporta mais de doze provedores, o que representa uma vantagem considerável. Você pode utilizar os últimos modelos da OpenAI (GPT-5.2, o4-mini), da Anthropic (Claude Opus 4.6, Claude Sonnet 4.6), do Google (Gemini 3.1 Pro, Gemini 2.5 Flash), mas também modelos auto-hospedados via Ollama (Llama 3.1, Qwen 3.5-27B) ou agregadores como OpenRouter e DeepInfra.
Essa flexibilidade permite adequar custo e desempenho à necessidade: um modelo local gratuito para os testes preliminares, um modelo frontier para as missões críticas. Os benchmarks publicados pela equipe mostram que vLLM acoplado a Qwen 3.5-27B-FP8 atinge cerca de 13.000 tokens por segundo no processamento do prompt e 650 tokens por segundo na geração, em um setup com quatro GPUs RTX 5090.
A instalação do PentAGI pretende ser acessível. A configuração mínima requerida é modesta: 2 vCPUs, 4 GB de RAM e 20 GB de armazenamento, além de Docker e Docker Compose.
A maneira mais simples de implantar o PentAGI é utilizar o instalador oficial:
mkdir -p pentagi && cd pentagi
wget -O installer.zip https://pentagi.com/downloads/linux/amd64/installer-latest.zip
unzip installer.zip
sudo ./installerO instalador está disponível para Linux (amd64, arm64), Windows (amd64) e macOS (Intel e Apple Silicon).
Para os usuários que preferem o controle total, o método manual consiste em obter o arquivo docker-compose.yml e o arquivo de configuração .env, preencher as chaves de API do seu provedor LLM e, em seguida, subir tudo:
docker compose up -dA interface web fica então acessível em https://localhost:8443 com as credenciais padrão. Stacks opcionais permitem adicionar Langfuse (analytics LLM), Graphiti (grafo de conhecimento) e a observabilidade completa (Grafana, Jaeger, Loki) por meio de arquivos Docker Compose adicionais.
É preciso, contudo, matizar essa aparente facilidade. Como destaca o pesquisador em segurança Hafiq Iqmal em sua análise no InfoSec Write-ups, a promessa de "zero intervenção humana" merece um asterisco: ainda é preciso configurar três bancos de dados, fornecer chaves de API para um modelo de linguagem e definir com precisão o alvo. Não é um software que se executa em um clique.
Quando uma ferramenta de IA é concebida para invadir sistemas, a questão de sua própria segurança torna-se primordial. A equipe do PentAGI implementou várias camadas de proteção que merecem ser detalhadas, e que aliás são citadas como exemplo pelo SitePoint como modelo de segurança para agentes autônomos.
Todas as operações ofensivas são executadas em contêineres Docker isolados com restrições rigorosas:
O contêiner roda como usuário nobody (UID 65534), nunca como root
O sistema de arquivos raiz é somente leitura
Todas as capabilities Linux são removidas (cap_drop: ALL), apenas NET_RAW é adicionada se necessário
Um perfil seccomp personalizado restringe as chamadas de sistema autorizadas
Os recursos são limitados (1 CPU, 512 MB de RAM por padrão)
A rede é segmentada: o contêiner de execução só pode alcançar os alvos autorizados
Para as operações de alto risco (execução de shell, lançamento de exploit, escalada de privilégios, exclusão de recursos), o PentAGI implementa um sistema de aprovação humana. A interface React exibe as ações pendentes e permite ao operador aprovar ou recusar cada operação sensível. Em caso de timeout (300 segundos por padrão), a ação é automaticamente recusada: o sistema adota um comportamento "fail-closed" por padrão.
Cada prompt LLM, cada invocação de ferramenta e cada ação no contêiner são registrados em um formato estruturado, incluindo o identificador do agente, a sessão, os parâmetros, o score de risco e o tempo de execução. Essa rastreabilidade completa é essencial para a auditoria e a conformidade.
O PentAGI não evolui no vácuo. O mercado do pentest automatizado por IA está em plena efervescência em 2026. Veja como ele se posiciona diante das principais alternativas:
Critère | PentAGI | NodeZero.ai | Pentera | XBOW | Escape |
|---|---|---|---|---|---|
Type | Open source, auto-hébergé | SaaS entreprise | SaaS entreprise | SaaS offensif | SaaS API/Web |
Autonomie | Entièrement autonome | Autonome avec validation | Validation automatisée | Autonome web | Semi-autonome |
Prix | Gratuit (coûts LLM) | Sur devis (~50k$/an+) | Sur devis (~50k$/an+) | Sur devis | Sur devis |
Périmètre | Réseau, web, infrastructure | Infrastructure, réseau | Validation multi-couches | Applications web | API, logique métier |
LLM | 12+ fournisseurs au choix | Propriétaire | Propriétaire | Propriétaire | Propriétaire |
Déploiement | Self-hosted, Docker | Cloud | Cloud/On-prem | Cloud | Cloud |
Licence | MIT | Propriétaire | Propriétaire | Propriétaire | Propriétaire |
A vantagem principal do PentAGI é evidente: é a única solução totalmente gratuita e open source que oferece esse nível de autonomia. Você mantém o controle total dos seus dados, pode auditar o código-fonte e adaptar a ferramenta às suas necessidades. Em contrapartida, soluções comerciais como NodeZero.ai e Pentera oferecem suporte profissional, integrações corporativas maduras e resultados comprovados em ambiente de produção.
A comparação mais pertinente no mundo open source continua sendo o PentestGPT, que acumulou 11.000 estrelas no GitHub. Mas o PentestGPT funciona mais como um assistente que orienta um operador humano, enquanto o PentAGI visa a autonomia completa com sua arquitetura multiagente e seu ambiente de execução integrado.
Apesar do entusiasmo, é importante olhar para o PentAGI com lucidez. A análise conduzida pela Ostorlab, que testou oito ferramentas de pentest IA open source, revelou que o PentAGI podia falhar em certos testes devido a problemas de configuração. As issues abertas no GitHub mencionam erros Docker, interrupções de LLM e relatórios às vezes pouco informativos.
A supervisão avançada dos agentes, embora melhore a qualidade dos resultados por um fator de dois segundo os benchmarks internos, também multiplica por dois a três o tempo de execução e o consumo de tokens. Para modelos abaixo de 32 bilhões de parâmetros, essa supervisão é descrita como "essencial" pela equipe, o que sugere que os pequenos modelos isoladamente não são suficientes para resultados confiáveis.
O PentAGI é concebido exclusivamente para uso autorizado e ético. A utilização em sistemas sem autorização explícita constitui crime na quase totalidade das jurisdições. O projeto exibe claramente esse aviso, mas a própria natureza de uma ferramenta tão acessível e poderosa levanta questões. Diferentemente de um pentester humano certificado, um agente de IA não tem julgamento ético próprio e não verifica se o perímetro autorizado é respeitado para além do que lhe é indicado.
A questão fundamental é a colocada por muitos profissionais de cibersegurança: o PentAGI substitui um pentester humano? A resposta, em março de 2026, é não. Como destaca a análise da Penligent, um pentest não é uma única ação, mas uma cadeia de julgamentos. Um testador humano observa um formulário de login, infere um esquema de autenticação provável, percebe uma rota de API secundária, formula uma hipótese de confusão de papéis, confirma as transições de sessão e documenta o bug de maneira reprodutível. Um sistema que ajuda apenas em um ponto dessa cadeia faz assistência, não pentest no sentido completo.
O PentAGI representa, ainda assim, um avanço significativo na automação dessa cadeia. Para equipes de segurança em subefetivo, ele pode servir como ferramenta de reconhecimento avançado, scanner inteligente capaz de ir além dos resultados brutos e sistema de triagem que reduz o ruído para permitir aos analistas concentrarem-se nas vulnerabilidades mais críticas.
O PentAGI inscreve-se em uma tendência de fundo: a convergência entre automação ofensiva, segurança das aplicações de IA e validação baseada em evidências. Em 2026, segundo a Bugcrowd, 82% dos hackers já utilizam a IA em seus workflows, principalmente para automação, análise de código e desbloqueio de situações complexas.
O projeto da VXControl tem o mérito de tornar essa tecnologia acessível a todos, de democratizá-la via open source e de propor uma arquitetura de referência para agentes autônomos seguros. Com seus treze agentes especializados, suas múltiplas camadas de segurança e sua flexibilidade na escolha dos modelos de linguagem, o PentAGI é menos um produto acabado do que uma plataforma de experimentação extraordinariamente ambiciosa.
Para os profissionais de cibersegurança, a ferramenta merece ser testada, compreendida e acompanhada. Para as empresas, ela ainda não substitui uma auditoria profissional, mas oferece um vislumbre marcante do que será o pentest nos próximos anos: mais rápido, mais contínuo e cada vez mais autônomo. A verdadeira questão já não é saber se a IA vai transformar os testes de intrusão, mas em que velocidade.

Sem compromisso, preços para ajudá-lo a aumentar sua prospecção.
Você não precisa de créditos se você quiser apenas enviar e-mails ou fazer ações no LinkedIn
Podem ser usados para:
Encontrar E-mails
Ação de IA
Encontrar Números
Verificar E-mails