PentAGI: O Agente de IA Autônomo Que Hackeia Por Você (Guia Completo e Análise 2026)

Niels
Niels Co-founder
Publicado em 23 de mar. de 2026Atualizado em 31 de mar. de 2026

Um sistema de IA capaz de conduzir um pentest completo sem intervenção humana. Essa é a promessa do PentAGI, um projeto open source que irrompeu no cenário da cibersegurança no início de 2026. Com mais de 12.500 estrelas no GitHub, uma arquitetura multiagente sofisticada e a integração de mais de vinte ferramentas profissionais de segurança ofensiva, o projeto desenvolvido pela VXControl desperta tanto entusiasmo quanto questionamentos legítimos. Trata-se de uma revolução no pentest, ou apenas mais uma ferramenta em um ecossistema já saturado? Aqui está nossa análise completa.

Logo PentAGI

PentAGI: A IA Que Promete Automatizar os Testes de Intrusão

O nome PentAGI é um condensado de sua ambição: Penetration testing Artificial General Intelligence. O projeto se apresenta como um sistema de agentes de IA totalmente autônomo, capaz de realizar tarefas complexas de pentest utilizando um terminal, um navegador, um editor de código e sistemas de busca externos. Na prática, você descreve um alvo e o sistema se encarrega do resto: reconhecimento, varredura de portas, identificação de vulnerabilidades, tentativa de exploração e geração de relatório.

O projeto foi iniciado no começo de 2025 pela VXControl, uma organização ativa no GitHub especializada em ferramentas de segurança. A última versão lançada, a v1.2.0, foi publicada em 25 de fevereiro de 2026. Distribuído sob licença MIT, o PentAGI é totalmente gratuito e auto-hospedável. Os únicos custos potenciais dizem respeito ao uso de modelos de linguagem em nuvem (OpenAI, Anthropic), mas a ferramenta também suporta modelos locais via Ollama, o que permite um uso totalmente gratuito.

A recepção da comunidade foi explosiva. O repositório no GitHub atingiu 12.500 estrelas e 1.600 forks, posicionando-se entre os repositórios mais populares do mês de seu lançamento. Nas redes sociais, a viralidade foi imediata.

Esse tweet, compartilhado milhares de vezes, resume o sentimento dominante: "Alguém acabou de tornar open source um Red Team de IA totalmente autônomo. Múltiplos agentes de IA que se comunicam entre si para invadir um alvo. Zero intervenção humana." Uma afirmação que merece ser matizada, como veremos adiante.

Como Funciona o Sistema Multiagente do PentAGI

O que verdadeiramente distingue o PentAGI de seus antecessores como o PentestGPT é sua arquitetura multiagente. Enquanto uma ferramenta clássica utiliza um único modelo de linguagem para orientar um operador humano, o PentAGI orquestra mais de treze agentes especializados, cada um com competências e permissões específicas.

Os agentes principais e seus papéis

A arquitetura repousa sobre uma divisão precisa do trabalho, inspirada no funcionamento de uma verdadeira equipe de pentest:

Agent

Rôle

Orchestrateur

Coordonne l'ensemble de la mission, planifie les étapes, distribue les tâches

Chercheur (searcher)

Effectue la reconnaissance, les recherches OSINT, les requêtes DNS

Développeur (coder)

Écrit des scripts d'exploitation, génère du code adapté à la cible

Pentesteur (pentester)

Exécute les scans et les exploits avec les outils de sécurité intégrés

Installateur (installer)

Gère les dépendances et les paquets nécessaires aux opérations

Conseiller (adviser)

Fournit une expertise stratégique et oriente la planification

Réflecteur (reflector)

Analyse les résultats, identifie les échecs et propose des ajustements

Enrichisseur (enricher)

Complète et contextualise les données collectées

Générateur / Affineur

Produisent et améliorent les rapports de vulnérabilités

O princípio fundamental é o do menor privilégio: cada agente só enxerga as ferramentas das quais precisa. O pesquisador pode executar buscas na web e consultas DNS, mas não pode lançar exploits. O pentester pode utilizar Nmap e Metasploit, mas não tem acesso à escrita de arquivos arbitrários. Esse isolamento é implementado no código Go do backend por meio de um registro de permissões dedicado, no qual cada tentativa de chamada de uma ferramenta não autorizada é bloqueada e registrada em log.

O grafo de conhecimento: uma memória adaptativa

Além da simples orquestração, o PentAGI integra um sistema de memória em três níveis. A memória de longo prazo, alimentada por PostgreSQL e pgvector, armazena os resultados de busca e as abordagens que funcionaram no passado. A memória de trabalho conserva o contexto atual da missão, os objetivos ativos e o estado do sistema. A memória episódica arquiva as ações passadas, seus resultados e os padrões de sucesso identificados.

Todo o conjunto é enriquecido por um grafo de conhecimento alimentado por Neo4j e Graphiti, que permite ao sistema acompanhar as relações semânticas entre os elementos descobertos durante um teste. Por exemplo, se uma varredura revela um serviço vulnerável em uma porta específica, o grafo pode relacionar essa informação a CVEs conhecidas, a exploits disponíveis e a configurações similares encontradas em missões anteriores. Essa capacidade de aprendizado adaptativo é o que permite, teoricamente, ao sistema melhorar ao longo das utilizações.

A gestão do contexto LLM

Um desafio técnico importante para qualquer sistema baseado em LLM é a gestão do contexto. Os pentests geram volumes consideráveis de dados: logs de scan, respostas de servidores, código-fonte, etc. O PentAGI utiliza uma técnica de "chain summarization" para condensar os resultados intermediários e manter um contexto relevante na janela de tokens do modelo, com um suporte que vai até 200.000 tokens, dependendo do provedor utilizado.

As Ferramentas de Segurança Integradas: do Nmap ao Metasploit

Um dos grandes trunfos do PentAGI é sua integração nativa com as ferramentas ofensivas padrão da indústria. O sistema embarca mais de vinte ferramentas profissionais de segurança, todas executadas em um contêiner Docker baseado na imagem Kali Linux da VXControl.

A caixa de ferramentas ofensiva

Entre as ferramentas integradas, encontramos os clássicos incontornáveis:

  • Nmap: o scanner de portas e serviços de referência, utilizado na fase de reconhecimento

  • Metasploit Framework: a plataforma de exploração mais completa do mercado

  • sqlmap: especializado na detecção e exploração de injeções SQL

  • Nikto: scanner de vulnerabilidades web

  • Gobuster / Dirbuster: ferramentas de descoberta de diretórios e arquivos ocultos

  • Hydra: ataque por força bruta em protocolos de autenticação

O agente pentester do PentAGI não se limita a lançar essas ferramentas: ele interpreta seus resultados, adapta sua estratégia em função das respostas obtidas e encadeia as etapas de maneira lógica. Por exemplo, uma varredura Nmap que revele um servidor web na porta 443 acionará automaticamente uma varredura Nikto, seguida de uma tentativa de descoberta de diretórios e, em seguida, uma análise das vulnerabilidades potenciais.

A inteligência de busca externa

Além das ferramentas ofensivas, o PentAGI integra sete sistemas de busca externos: Tavily, Traversaal, Perplexity, DuckDuckGo, Google Custom Search, Sploitus (especializado na busca de exploits) e SearXNG. Essa capacidade permite ao sistema buscar em tempo real informações sobre vulnerabilidades publicadas recentemente, CVEs específicas ou técnicas de exploração adaptadas ao alvo analisado.

Um navegador web isolado (scraper) completa esse arsenal, permitindo ao agente coletar informações diretamente de páginas web, documentação técnica ou portais de administração.

Arquitetura Técnica: Go, React e Docker Compose

A stack tecnológica

A arquitetura do PentAGI segue um modelo de microsserviços moderno, com uma separação clara entre os componentes:

Composant

Technologie

Rôle

Backend API

Go + GraphQL/REST

Logique métier, orchestration des agents

Frontend

React + TypeScript

Interface de monitoring et de contrôle

Base de données

PostgreSQL + pgvector

Stockage persistant, recherche vectorielle

Graphe de connaissances

Neo4j + Graphiti

Relations sémantiques, mémoire contextuelle

Monitoring

Grafana, VictoriaMetrics, Jaeger, Loki

Tableaux de bord, métriques, traces distribuées

Analytics LLM

Langfuse + ClickHouse

Analyse des interactions avec les modèles

Cache

Redis

Cache et limitation de débit

Stockage objet

MinIO

Stockage S3 compatible

Exécution

Docker (conteneur sandboxé)

Isolation des opérations offensives

A escolha de Go para o backend não é trivial. A linguagem oferece excelente desempenho para a gestão concorrente dos agentes e para as filas de tarefas assíncronas, dois elementos críticos em um sistema multiagente.

O agnosticismo LLM: 12 provedores suportados

Uma das escolhas arquiteturais mais interessantes do PentAGI é seu agnosticismo em relação aos modelos de linguagem. Via LiteLLM, o sistema suporta mais de doze provedores, o que representa uma vantagem considerável. Você pode utilizar os últimos modelos da OpenAI (GPT-5.2, o4-mini), da Anthropic (Claude Opus 4.6, Claude Sonnet 4.6), do Google (Gemini 3.1 Pro, Gemini 2.5 Flash), mas também modelos auto-hospedados via Ollama (Llama 3.1, Qwen 3.5-27B) ou agregadores como OpenRouter e DeepInfra.

Essa flexibilidade permite adequar custo e desempenho à necessidade: um modelo local gratuito para os testes preliminares, um modelo frontier para as missões críticas. Os benchmarks publicados pela equipe mostram que vLLM acoplado a Qwen 3.5-27B-FP8 atinge cerca de 13.000 tokens por segundo no processamento do prompt e 650 tokens por segundo na geração, em um setup com quatro GPUs RTX 5090.

Instalação e Implantação: Docker Compose em Alguns Minutos

A instalação do PentAGI pretende ser acessível. A configuração mínima requerida é modesta: 2 vCPUs, 4 GB de RAM e 20 GB de armazenamento, além de Docker e Docker Compose.

Método recomendado: o instalador

A maneira mais simples de implantar o PentAGI é utilizar o instalador oficial:

mkdir -p pentagi && cd pentagi
wget -O installer.zip https://pentagi.com/downloads/linux/amd64/installer-latest.zip
unzip installer.zip
sudo ./installer

O instalador está disponível para Linux (amd64, arm64), Windows (amd64) e macOS (Intel e Apple Silicon).

Método manual: Docker Compose

Para os usuários que preferem o controle total, o método manual consiste em obter o arquivo docker-compose.yml e o arquivo de configuração .env, preencher as chaves de API do seu provedor LLM e, em seguida, subir tudo:

docker compose up -d

A interface web fica então acessível em https://localhost:8443 com as credenciais padrão. Stacks opcionais permitem adicionar Langfuse (analytics LLM), Graphiti (grafo de conhecimento) e a observabilidade completa (Grafana, Jaeger, Loki) por meio de arquivos Docker Compose adicionais.

É preciso, contudo, matizar essa aparente facilidade. Como destaca o pesquisador em segurança Hafiq Iqmal em sua análise no InfoSec Write-ups, a promessa de "zero intervenção humana" merece um asterisco: ainda é preciso configurar três bancos de dados, fornecer chaves de API para um modelo de linguagem e definir com precisão o alvo. Não é um software que se executa em um clique.

A Segurança da Própria Ferramenta: Sandboxing e Isolamento

Quando uma ferramenta de IA é concebida para invadir sistemas, a questão de sua própria segurança torna-se primordial. A equipe do PentAGI implementou várias camadas de proteção que merecem ser detalhadas, e que aliás são citadas como exemplo pelo SitePoint como modelo de segurança para agentes autônomos.

A execução em sandbox

Todas as operações ofensivas são executadas em contêineres Docker isolados com restrições rigorosas:

  • O contêiner roda como usuário nobody (UID 65534), nunca como root

  • O sistema de arquivos raiz é somente leitura

  • Todas as capabilities Linux são removidas (cap_drop: ALL), apenas NET_RAW é adicionada se necessário

  • Um perfil seccomp personalizado restringe as chamadas de sistema autorizadas

  • Os recursos são limitados (1 CPU, 512 MB de RAM por padrão)

  • A rede é segmentada: o contêiner de execução só pode alcançar os alvos autorizados

Os portões de aprovação humana

Para as operações de alto risco (execução de shell, lançamento de exploit, escalada de privilégios, exclusão de recursos), o PentAGI implementa um sistema de aprovação humana. A interface React exibe as ações pendentes e permite ao operador aprovar ou recusar cada operação sensível. Em caso de timeout (300 segundos por padrão), a ação é automaticamente recusada: o sistema adota um comportamento "fail-closed" por padrão.

O logging completo

Cada prompt LLM, cada invocação de ferramenta e cada ação no contêiner são registrados em um formato estruturado, incluindo o identificador do agente, a sessão, os parâmetros, o score de risco e o tempo de execução. Essa rastreabilidade completa é essencial para a auditoria e a conformidade.

PentAGI vs as Soluções Comerciais de Pentest Automatizado

O PentAGI não evolui no vácuo. O mercado do pentest automatizado por IA está em plena efervescência em 2026. Veja como ele se posiciona diante das principais alternativas:

Critère

PentAGI

NodeZero.ai

Pentera

XBOW

Escape

Type

Open source, auto-hébergé

SaaS entreprise

SaaS entreprise

SaaS offensif

SaaS API/Web

Autonomie

Entièrement autonome

Autonome avec validation

Validation automatisée

Autonome web

Semi-autonome

Prix

Gratuit (coûts LLM)

Sur devis (~50k$/an+)

Sur devis (~50k$/an+)

Sur devis

Sur devis

Périmètre

Réseau, web, infrastructure

Infrastructure, réseau

Validation multi-couches

Applications web

API, logique métier

LLM

12+ fournisseurs au choix

Propriétaire

Propriétaire

Propriétaire

Propriétaire

Déploiement

Self-hosted, Docker

Cloud

Cloud/On-prem

Cloud

Cloud

Licence

MIT

Propriétaire

Propriétaire

Propriétaire

Propriétaire

A vantagem principal do PentAGI é evidente: é a única solução totalmente gratuita e open source que oferece esse nível de autonomia. Você mantém o controle total dos seus dados, pode auditar o código-fonte e adaptar a ferramenta às suas necessidades. Em contrapartida, soluções comerciais como NodeZero.ai e Pentera oferecem suporte profissional, integrações corporativas maduras e resultados comprovados em ambiente de produção.

A comparação mais pertinente no mundo open source continua sendo o PentestGPT, que acumulou 11.000 estrelas no GitHub. Mas o PentestGPT funciona mais como um assistente que orienta um operador humano, enquanto o PentAGI visa a autonomia completa com sua arquitetura multiagente e seu ambiente de execução integrado.

Os Limites e Precauções de Uso do Pentest IA Autônomo

Os limites técnicos reais

Apesar do entusiasmo, é importante olhar para o PentAGI com lucidez. A análise conduzida pela Ostorlab, que testou oito ferramentas de pentest IA open source, revelou que o PentAGI podia falhar em certos testes devido a problemas de configuração. As issues abertas no GitHub mencionam erros Docker, interrupções de LLM e relatórios às vezes pouco informativos.

A supervisão avançada dos agentes, embora melhore a qualidade dos resultados por um fator de dois segundo os benchmarks internos, também multiplica por dois a três o tempo de execução e o consumo de tokens. Para modelos abaixo de 32 bilhões de parâmetros, essa supervisão é descrita como "essencial" pela equipe, o que sugere que os pequenos modelos isoladamente não são suficientes para resultados confiáveis.

As considerações éticas e legais

O PentAGI é concebido exclusivamente para uso autorizado e ético. A utilização em sistemas sem autorização explícita constitui crime na quase totalidade das jurisdições. O projeto exibe claramente esse aviso, mas a própria natureza de uma ferramenta tão acessível e poderosa levanta questões. Diferentemente de um pentester humano certificado, um agente de IA não tem julgamento ético próprio e não verifica se o perímetro autorizado é respeitado para além do que lhe é indicado.

Uma ferramenta de substituição ou um assistente?

A questão fundamental é a colocada por muitos profissionais de cibersegurança: o PentAGI substitui um pentester humano? A resposta, em março de 2026, é não. Como destaca a análise da Penligent, um pentest não é uma única ação, mas uma cadeia de julgamentos. Um testador humano observa um formulário de login, infere um esquema de autenticação provável, percebe uma rota de API secundária, formula uma hipótese de confusão de papéis, confirma as transições de sessão e documenta o bug de maneira reprodutível. Um sistema que ajuda apenas em um ponto dessa cadeia faz assistência, não pentest no sentido completo.

O PentAGI representa, ainda assim, um avanço significativo na automação dessa cadeia. Para equipes de segurança em subefetivo, ele pode servir como ferramenta de reconhecimento avançado, scanner inteligente capaz de ir além dos resultados brutos e sistema de triagem que reduz o ruído para permitir aos analistas concentrarem-se nas vulnerabilidades mais críticas.

O Que o PentAGI Anuncia Para o Futuro do Pentest

O PentAGI inscreve-se em uma tendência de fundo: a convergência entre automação ofensiva, segurança das aplicações de IA e validação baseada em evidências. Em 2026, segundo a Bugcrowd, 82% dos hackers já utilizam a IA em seus workflows, principalmente para automação, análise de código e desbloqueio de situações complexas.

O projeto da VXControl tem o mérito de tornar essa tecnologia acessível a todos, de democratizá-la via open source e de propor uma arquitetura de referência para agentes autônomos seguros. Com seus treze agentes especializados, suas múltiplas camadas de segurança e sua flexibilidade na escolha dos modelos de linguagem, o PentAGI é menos um produto acabado do que uma plataforma de experimentação extraordinariamente ambiciosa.

Para os profissionais de cibersegurança, a ferramenta merece ser testada, compreendida e acompanhada. Para as empresas, ela ainda não substitui uma auditoria profissional, mas oferece um vislumbre marcante do que será o pentest nos próximos anos: mais rápido, mais contínuo e cada vez mais autônomo. A verdadeira questão já não é saber se a IA vai transformar os testes de intrusão, mas em que velocidade.

logo emelia

Descubra Emelia, sua ferramenta de prospeção todo-em-um.

logo emelia

Preços claros, transparentes e sem custos ocultos.

Sem compromisso, preços para ajudá-lo a aumentar sua prospecção.

Start

37€

/mês

Envio de e-mail ilimitado

Conectar 1 conta do LinkedIn

Ações LinkedIn ilimitadas

Aquecimento de E-mail incluído

Extração ilimitada

Contatos ilimitados

Grow

Popular
arrow-right
97€

/mês

Envio de e-mail ilimitado

Até 5 contas do LinkedIn

Ações LinkedIn ilimitadas

Aquecimento ilimitado

Contatos ilimitados

1 integração CRM

Scale

297€

/mês

Envio de e-mail ilimitado

Até 20 contas do LinkedIn

Ações LinkedIn ilimitadas

Aquecimento ilimitado

Contatos ilimitados

Conexão Multi CRM

Chamadas de API ilimitadas

Créditos(opcional)

Você não precisa de créditos se você quiser apenas enviar e-mails ou fazer ações no LinkedIn

Podem ser usados para:

Encontrar E-mails

Ação de IA

Encontrar Números

Verificar E-mails

1,000
5,000
10,000
50,000
100,000
1,000 E-mails encontrados
1,000 Ações de IA
20 Números
4,000 Verificações
19por mês

Descubra outros artigos que podem lhe interessar!

Ver todos os artigos
MarieMarie Head Of Sales
Leia mais
MarieMarie Head Of Sales
Leia mais
MarieMarie Head Of Sales
Leia mais
NielsNiels Co-founder
Leia mais
NielsNiels Co-founder
Leia mais
MarieMarie Head Of Sales
Leia mais
Made with ❤ for Growth Marketers by Growth Marketers
Copyright © 2026 Emelia All Rights Reserved