Niels Co-founder

Publicado el 23 mar 2026Actualizado el 31 mar 2026

Encuentra y contacta a tus futuros clientes

Plataforma de prospección todo-en-uno

Probar gratis →

Volver al hub

PentAGI: el agente de IA autónomo que hackea por ti (guía completa y análisis 2026)

Niels Co-founder

Publicado el 23 mar 2026Actualizado el 31 mar 2026

Un sistema de IA capaz de llevar a cabo un test de intrusión completo sin intervención humana. Esa es la promesa de PentAGI, un proyecto open source que ha irrumpido en el panorama de la ciberseguridad a principios de 2026. Con más de 12.500 estrellas en GitHub, una arquitectura multiagente sofisticada y la integración de más de veinte herramientas profesionales de seguridad ofensiva, el proyecto desarrollado por VXControl despierta tanto entusiasmo como cuestionamientos legítimos. ¿Hay que verlo como una revolución en el pentest, o simplemente como una herramienta más en un ecosistema ya saturado? Aquí está nuestro análisis completo.

PentAGI: La IA Que Promete Automatizar los Tests de Intrusión

El nombre PentAGI es un compendio de su ambición: Penetration testing Artificial General Intelligence. El proyecto se presenta como un sistema de agentes de IA enteramente autónomo, capaz de realizar tareas complejas de pentest utilizando un terminal, un navegador, un editor de código y sistemas de búsqueda externos. En la práctica, le describes un objetivo, y el sistema se encarga del resto: reconocimiento, escaneo de puertos, identificación de vulnerabilidades, intento de explotación y generación de informe.

El proyecto fue iniciado a principios de 2025 por VXControl, una organización activa en GitHub especializada en herramientas de seguridad. La última versión publicada, la v1.2.0, salió el 25 de febrero de 2026. Distribuido bajo licencia MIT, PentAGI es enteramente gratuito y autoalojable. Los únicos costes potenciales conciernen al uso de modelos de lenguaje en la nube (OpenAI, Anthropic), pero la herramienta también soporta modelos locales vía Ollama, lo que permite un uso totalmente gratuito.

La recepción de la comunidad fue explosiva. El repositorio de GitHub ha alcanzado 12.500 estrellas y 1.600 forks, situándose entre los repositorios más populares del mes de su publicación. En las redes sociales, la viralidad fue inmediata.

Este tuit, compartido miles de veces, resume el sentimiento dominante: "Alguien acaba de hacer open source un Red Team de IA totalmente autónomo. Varios agentes de IA que se comunican entre sí para hackear un objetivo. Cero intervención humana." Una afirmación que merece ser matizada, como veremos más adelante.

Cómo Funciona el Sistema Multiagente de PentAGI

Lo que verdaderamente distingue a PentAGI de sus predecesores como PentestGPT es su arquitectura multiagente. Allí donde una herramienta clásica utiliza un único modelo de lenguaje para guiar a un operador humano, PentAGI orquesta más de trece agentes especializados, cada uno dotado de competencias y permisos específicos.

Los agentes principales y su rol

La arquitectura reposa sobre una división del trabajo precisa, inspirada en el funcionamiento de un verdadero equipo de pentest:

Agent	Rôle
Orchestrateur	Coordonne l'ensemble de la mission, planifie les étapes, distribue les tâches
Chercheur (searcher)	Effectue la reconnaissance, les recherches OSINT, les requêtes DNS
Développeur (coder)	Écrit des scripts d'exploitation, génère du code adapté à la cible
Pentesteur (pentester)	Exécute les scans et les exploits avec les outils de sécurité intégrés
Installateur (installer)	Gère les dépendances et les paquets nécessaires aux opérations
Conseiller (adviser)	Fournit une expertise stratégique et oriente la planification
Réflecteur (reflector)	Analyse les résultats, identifie les échecs et propose des ajustements
Enrichisseur (enricher)	Complète et contextualise les données collectées
Générateur / Affineur	Produisent et améliorent les rapports de vulnérabilités

El principio fundamental es el del mínimo privilegio: cada agente solo ve las herramientas que necesita. El investigador puede ejecutar búsquedas web y consultas DNS, pero no puede lanzar exploits. El pentester puede usar Nmap y Metasploit, pero no tiene acceso a la escritura de archivos arbitrarios. Este aislamiento está implementado en el código Go del backend a través de un registro de permisos dedicado, donde cada intento de llamada a una herramienta no autorizada es bloqueado y registrado en log.

El grafo de conocimiento: una memoria adaptativa

Más allá de la simple orquestación, PentAGI integra un sistema de memoria en tres niveles. La memoria a largo plazo, alimentada por PostgreSQL y pgvector, almacena los resultados de búsqueda y los enfoques que han funcionado en el pasado. La memoria de trabajo conserva el contexto actual de la misión, los objetivos activos y el estado del sistema. La memoria episódica archiva las acciones pasadas, sus resultados y los esquemas de éxito identificados.

Todo ello se enriquece con un grafo de conocimiento alimentado por Neo4j y Graphiti, que permite al sistema seguir las relaciones semánticas entre los elementos descubiertos durante un test. Por ejemplo, si un escaneo revela un servicio vulnerable en un puerto específico, el grafo puede relacionar esa información con CVE conocidas, con exploits disponibles y con configuraciones similares encontradas durante misiones anteriores. Esta capacidad de aprendizaje adaptativo es lo que permite teóricamente al sistema mejorar a lo largo de los usos.

La gestión del contexto LLM

Un desafío técnico importante para todo sistema basado en LLM es la gestión del contexto. Los tests de intrusión generan volúmenes considerables de datos: logs de escaneo, respuestas de servidores, código fuente, etc. PentAGI utiliza una técnica de "chain summarization" para condensar los resultados intermedios y mantener un contexto relevante en la ventana de tokens del modelo, con un soporte que llega hasta 200.000 tokens según el proveedor utilizado.

Las Herramientas de Seguridad Integradas: De Nmap a Metasploit

Una de las grandes bazas de PentAGI es su integración nativa con las herramientas ofensivas estándar de la industria. El sistema incorpora más de veinte herramientas profesionales de seguridad, todas ejecutadas en un contenedor Docker basado en la imagen Kali Linux de VXControl.

La caja de herramientas ofensiva

Entre las herramientas integradas, encontramos los clásicos imprescindibles:

Nmap: el escáner de puertos y servicios de referencia, utilizado para la fase de reconocimiento
Metasploit Framework: la plataforma de explotación más completa del mercado
sqlmap: especializado en la detección y explotación de inyecciones SQL
Nikto: escáner de vulnerabilidades web
Gobuster / Dirbuster: herramientas de descubrimiento de directorios y archivos ocultos
Hydra: ataque por fuerza bruta sobre los protocolos de autenticación

El agente pentester de PentAGI no se contenta con lanzar estas herramientas: interpreta sus resultados, adapta su estrategia en función de las respuestas obtenidas y encadena las etapas de manera lógica. Por ejemplo, un escaneo Nmap que revele un servidor web en el puerto 443 desencadenará automáticamente un escaneo Nikto, seguido de un intento de descubrimiento de directorios, y luego de un análisis de las vulnerabilidades potenciales.

La inteligencia de búsqueda externa

Más allá de las herramientas ofensivas, PentAGI integra siete sistemas de búsqueda externos: Tavily, Traversaal, Perplexity, DuckDuckGo, Google Custom Search, Sploitus (especializado en la búsqueda de exploits) y SearXNG. Esta capacidad permite al sistema buscar en tiempo real información sobre vulnerabilidades publicadas recientemente, CVE específicas o técnicas de explotación adaptadas al objetivo analizado.

Un navegador web aislado (scraper) completa este arsenal, permitiendo al agente recopilar información directamente desde páginas web, documentación técnica o portales de administración.

Arquitectura Técnica: Go, React y Docker Compose

El stack tecnológico

La arquitectura de PentAGI sigue un modelo de microservicios moderno, con una separación clara entre los componentes:

Composant	Technologie	Rôle
Backend API	Go + GraphQL/REST	Logique métier, orchestration des agents
Frontend	React + TypeScript	Interface de monitoring et de contrôle
Base de données	PostgreSQL + pgvector	Stockage persistant, recherche vectorielle
Graphe de connaissances	Neo4j + Graphiti	Relations sémantiques, mémoire contextuelle
Monitoring	Grafana, VictoriaMetrics, Jaeger, Loki	Tableaux de bord, métriques, traces distribuées
Analytics LLM	Langfuse + ClickHouse	Analyse des interactions avec les modèles
Cache	Redis	Cache et limitation de débit
Stockage objet	MinIO	Stockage S3 compatible
Exécution	Docker (conteneur sandboxé)	Isolation des opérations offensives

La elección de Go para el backend no es anodina. El lenguaje ofrece excelentes prestaciones para la gestión concurrente de los agentes y las colas de tareas asíncronas, dos elementos críticos en un sistema multiagente.

El agnosticismo LLM: 12 proveedores soportados

Una de las elecciones arquitectónicas más interesantes de PentAGI es su agnosticismo respecto a los modelos de lenguaje. Vía LiteLLM, el sistema soporta más de doce proveedores, lo que representa una ventaja considerable. Puedes utilizar los últimos modelos de OpenAI (GPT-5.2, o4-mini), de Anthropic (Claude Opus 4.6, Claude Sonnet 4.6), de Google (Gemini 3.1 Pro, Gemini 2.5 Flash), pero también modelos autoalojados vía Ollama (Llama 3.1, Qwen 3.5-27B) o agregadores como OpenRouter y DeepInfra.

Esta flexibilidad permite adaptar coste y prestaciones a la necesidad: un modelo local gratuito para los tests preliminares, un modelo frontier para las misiones críticas. Los benchmarks publicados por el equipo muestran que vLLM acoplado a Qwen 3.5-27B-FP8 alcanza unos 13.000 tokens por segundo en procesamiento de prompt y 650 tokens por segundo en generación, sobre un setup con cuatro GPU RTX 5090.

Instalación y Despliegue: Docker Compose en Pocos Minutos

La instalación de PentAGI pretende ser accesible. La configuración mínima requerida es modesta: 2 vCPU, 4 GB de RAM y 20 GB de almacenamiento, además de Docker y Docker Compose.

Método recomendado: el instalador

La manera más sencilla de desplegar PentAGI es utilizar el instalador oficial:

mkdir -p pentagi && cd pentagi
wget -O installer.zip https://pentagi.com/downloads/linux/amd64/installer-latest.zip
unzip installer.zip
sudo ./installer

El instalador está disponible para Linux (amd64, arm64), Windows (amd64) y macOS (Intel y Apple Silicon).

Método manual: Docker Compose

Para los usuarios que prefieren un control total, el método manual consiste en obtener el archivo docker-compose.yml y el archivo de configuración .env, rellenar las claves API de tu proveedor LLM, y a continuación lanzarlo todo:

docker compose up -d

La interfaz web es entonces accesible en https://localhost:8443 con las credenciales por defecto. Stacks opcionales permiten añadir Langfuse (analítica LLM), Graphiti (grafo de conocimiento) y la observabilidad completa (Grafana, Jaeger, Loki) mediante archivos Docker Compose adicionales.

Conviene, no obstante, matizar esta aparente facilidad. Como destaca el investigador en seguridad Hafiq Iqmal en su análisis en InfoSec Write-ups, la promesa de "cero intervención humana" merece un asterisco: hay que configurar de todos modos tres bases de datos, proporcionar claves API para un modelo de lenguaje y definir con precisión el objetivo. No es un software que se lanza con un clic.

La Seguridad de la Propia Herramienta: Sandboxing y Aislamiento

Cuando una herramienta de IA está concebida para hackear sistemas, la cuestión de su propia seguridad se vuelve primordial. El equipo de PentAGI ha implementado varias capas de protección que merecen ser detalladas, y que de hecho son citadas como ejemplo por SitePoint como modelo de seguridad para los agentes autónomos.

La ejecución en sandbox

Todas las operaciones ofensivas se ejecutan en contenedores Docker aislados con restricciones estrictas:

El contenedor corre como usuario nobody (UID 65534), nunca como root
El sistema de archivos raíz es de solo lectura
Todas las capabilities Linux son eliminadas (cap_drop: ALL), solo NET_RAW se añade si es necesario
Un perfil seccomp personalizado restringe las llamadas al sistema autorizadas
Los recursos están limitados (1 CPU, 512 MB de RAM por defecto)
La red está segmentada: el contenedor de ejecución solo puede alcanzar los objetivos autorizados

Las puertas de aprobación humana

Para las operaciones de alto riesgo (ejecución de shell, lanzamiento de exploit, escalada de privilegios, eliminación de recursos), PentAGI implementa un sistema de aprobación humana. La interfaz React muestra las acciones pendientes y permite al operador aprobar o rechazar cada operación sensible. En caso de timeout (300 segundos por defecto), la acción es rechazada automáticamente: el sistema adopta un comportamiento "fail-closed" por defecto.

El registro completo en logs

Cada prompt LLM, cada invocación de herramienta y cada acción en el contenedor son registrados en un formato estructurado que incluye el identificador del agente, la sesión, los parámetros, la puntuación de riesgo y el tiempo de ejecución. Esta trazabilidad completa es esencial para la auditoría y el cumplimiento.

PentAGI vs las Soluciones Comerciales de Pentest Automatizado

PentAGI no evoluciona en el vacío. El mercado del pentest automatizado por IA está en plena efervescencia en 2026. Así se posiciona frente a las principales alternativas:

Critère	PentAGI	NodeZero.ai	Pentera	XBOW	Escape
Type	Open source, auto-hébergé	SaaS entreprise	SaaS entreprise	SaaS offensif	SaaS API/Web
Autonomie	Entièrement autonome	Autonome avec validation	Validation automatisée	Autonome web	Semi-autonome
Prix	Gratuit (coûts LLM)	Sur devis (~50k$/an+)	Sur devis (~50k$/an+)	Sur devis	Sur devis
Périmètre	Réseau, web, infrastructure	Infrastructure, réseau	Validation multi-couches	Applications web	API, logique métier
LLM	12+ fournisseurs au choix	Propriétaire	Propriétaire	Propriétaire	Propriétaire
Déploiement	Self-hosted, Docker	Cloud	Cloud/On-prem	Cloud	Cloud
Licence	MIT	Propriétaire	Propriétaire	Propriétaire	Propriétaire

La ventaja principal de PentAGI es evidente: es la única solución enteramente gratuita y open source que ofrece este nivel de autonomía. Conservas el control total de tus datos, puedes auditar el código fuente y adaptar la herramienta a tus necesidades. A cambio, las soluciones comerciales como NodeZero.ai y Pentera ofrecen soporte profesional, integraciones empresariales maduras y resultados probados en entorno de producción.

La comparación más pertinente en el mundo open source sigue siendo PentestGPT, que ha acumulado 11.000 estrellas en GitHub. Pero PentestGPT funciona más bien como un asistente que guía a un operador humano, mientras que PentAGI apunta a la autonomía completa con su arquitectura multiagente y su entorno de ejecución integrado.

Los Límites y Precauciones de Uso del Pentest IA Autónomo

Los límites técnicos reales

A pesar del entusiasmo, es importante mirar a PentAGI con lucidez. El análisis llevado a cabo por Ostorlab, que ha testado ocho herramientas de pentest IA open source, ha revelado que PentAGI podía encontrar fallos durante ciertos tests debido a problemas de configuración. Las issues abiertas en GitHub mencionan errores Docker, interrupciones de LLM e informes a veces poco informativos.

La supervisión avanzada de los agentes, si bien mejora la calidad de los resultados en un factor de dos según los benchmarks internos, multiplica también por dos o tres el tiempo de ejecución y el consumo de tokens. Para los modelos inferiores a 32.000 millones de parámetros, esta supervisión se describe como "esencial" por el equipo, lo que sugiere que los pequeños modelos por sí solos no son suficientes para obtener resultados fiables.

Las consideraciones éticas y legales

PentAGI está concebido exclusivamente para un uso autorizado y ético. La utilización sobre sistemas sin autorización explícita constituye un delito en la práctica totalidad de las jurisdicciones. El proyecto muestra claramente esta advertencia, pero la naturaleza misma de una herramienta tan accesible y potente plantea cuestiones. A diferencia de un pentester humano certificado, un agente de IA no tiene juicio ético propio y no verifica si el perímetro autorizado es respetado más allá de lo que se le indica.

¿Una herramienta de sustitución o un asistente?

La cuestión fundamental es la planteada por numerosos profesionales de la ciberseguridad: ¿reemplaza PentAGI a un pentester humano? La respuesta, en marzo de 2026, es no. Como destaca el análisis de Penligent, un test de intrusión no es una sola acción sino una cadena de juicios. Un testador humano observa un formulario de conexión, infiere un esquema de autenticación probable, advierte una ruta API secundaria, formula una hipótesis de confusión de roles, confirma las transiciones de sesión y documenta el bug de manera reproducible. Un sistema que solo ayuda en un punto de esta cadena hace asistencia, no pentest en el sentido completo.

PentAGI representa, no obstante, un avance significativo en la automatización de esta cadena. Para los equipos de seguridad con falta de personal, puede servir como herramienta de reconocimiento avanzado, como escáner inteligente capaz de ir más allá de los resultados en bruto, y como sistema de triaje que reduce el ruido para permitir a los analistas concentrarse en las vulnerabilidades más críticas.

Lo Que PentAGI Anuncia Para el Futuro del Pentest

PentAGI se inscribe en una tendencia de fondo: la convergencia entre la automatización ofensiva, la seguridad de las aplicaciones de IA y la validación basada en pruebas. En 2026, según Bugcrowd, el 82% de los hackers ya utilizan la IA en sus workflows, principalmente para la automatización, el análisis de código y el desbloqueo de situaciones complejas.

El proyecto de VXControl tiene el mérito de hacer esta tecnología accesible a todos, de democratizarla vía open source y de proponer una arquitectura de referencia para los agentes autónomos seguros. Con sus trece agentes especializados, sus múltiples capas de seguridad y su flexibilidad en la elección de los modelos de lenguaje, PentAGI es menos un producto acabado que una plataforma de experimentación extraordinariamente ambiciosa.

Para los profesionales de la ciberseguridad, la herramienta merece ser testada, comprendida y seguida. Para las empresas, todavía no reemplaza una auditoría profesional, pero ofrece una visión impactante de lo que será el pentest en los próximos años: más rápido, más continuo y cada vez más autónomo. La verdadera cuestión ya no es saber si la IA va a transformar los tests de intrusión, sino a qué velocidad.

FAQ

¿Qué es PentAGI?+

PentAGI es un agente IA autónomo especializado en pentesting (tests de intrusión). Combina razonamiento IA, ejecución de herramientas de seguridad y aprendizaje continuo para realizar auditorías de seguridad de forma semi-autónoma, bajo supervisión humana.

¿Es legal PentAGI?+

Sí, siempre que se use únicamente en sistemas para los que se tenga autorización explícita (propia infraestructura, misiones de pentest contractuales). Usarlo contra sistemas de terceros sin autorización es ilegal y conlleva sanciones penales.

¿Puede PentAGI reemplazar a un pentester humano?+

No. PentAGI acelera tareas repetitivas y reconocimiento, pero la experiencia humana sigue siendo esencial para análisis contextual, creatividad ofensiva y reporting. Considéralo un asistente que multiplica la productividad de un pentester.

¿Es PentAGI open source?+

PentAGI se inscribe en el movimiento de agentes IA para ciberseguridad. Verifica el repositorio GitHub oficial para conocer la licencia exacta y condiciones de uso. Varios proyectos similares están disponibles bajo licencias MIT o Apache.

Descubre Emelia, tu herramienta de prospección todo en uno.

Lanzo mi campaña

Precios claros, transparentes y sin costes ocultos.

Sin compromiso, precios para ayudarte a aumentar tu prospección.

Start

37€

/mes

Envío ilimitado de emails

Conectar 1 cuenta de LinkedIn

Acciones LinkedIn ilimitadas

Email Warmup incluido

Extracción ilimitada

Contactos ilimitados

Grow

Popular

97€

/mes

Envío ilimitado de emails

Hasta 5 cuentas de LinkedIn

Acciones LinkedIn ilimitadas

Email Warmup ilimitado

Contactos ilimitados

1 integración CRM

Scale

297€

/mes

Envío ilimitado de emails

Hasta 20 cuentas de LinkedIn

Acciones LinkedIn ilimitadas

Email Warmup ilimitado

Contactos ilimitados

Conexión Multi CRM

Llamadas API ilimitadas

Créditos(opcional)

No necesitas créditos si solo quieres enviar emails o hacer acciones en LinkedIn

Se pueden utilizar para:

Buscar Emails

Acción IA

Buscar Números

Verificar Emails

€19por mes

1,000

1,000 Emails encontrados

1,000 Acciones IA

20 Números

4,000 Verificaciones

5,000

10,000

50,000

100,000

1,000 Emails encontrados

1,000 Acciones IA

20 Números

4,000 Verificaciones

€19por mes

Descubre otros artículos que te pueden interesar!

Ver todos los artículos

Software

Publicado el 12 may 2025

¿Qué es el enriquecimiento de datos? Guía completa 2026

Marie Head Of Sales

Software

Publicado el 8 may 2024

Las 7 mejores alternativas a Lix

Marie Head Of Sales

Blog

Publicado el 18 jun 2025

¿Cómo tener éxito con tu solicitud de cita por email?

Mathieu Co-founder

Marketing

Publicado el 22 may 2025

Neverbounce vs Kickbox vs Emelia 2026: descripción, opiniones y precio

Marie Head Of Sales

Software

Publicado el 2 abr 2025

3 herramientas de web scraping no code para usar en 2026

Marie Head Of Sales

Prospección B2B

Publicado el 2 feb 2024

Email warmup: guía completa 2026 para calentar tu dirección de correo

Niels Co-founder

Made with ❤ for Growth Marketers by Growth Marketers

Encuentra y contacta a tus futuros clientes

PentAGI: el agente de IA autónomo que hackea por ti (guía completa y análisis 2026)

PentAGI: La IA Que Promete Automatizar los Tests de Intrusión

Cómo Funciona el Sistema Multiagente de PentAGI

Los agentes principales y su rol

El grafo de conocimiento: una memoria adaptativa

La gestión del contexto LLM

Las Herramientas de Seguridad Integradas: De Nmap a Metasploit

La caja de herramientas ofensiva

La inteligencia de búsqueda externa

Arquitectura Técnica: Go, React y Docker Compose

El stack tecnológico

El agnosticismo LLM: 12 proveedores soportados

Instalación y Despliegue: Docker Compose en Pocos Minutos

Método recomendado: el instalador

Método manual: Docker Compose

La Seguridad de la Propia Herramienta: Sandboxing y Aislamiento

La ejecución en sandbox

Las puertas de aprobación humana

El registro completo en logs

PentAGI vs las Soluciones Comerciales de Pentest Automatizado

Los Límites y Precauciones de Uso del Pentest IA Autónomo

Los límites técnicos reales

Las consideraciones éticas y legales

¿Una herramienta de sustitución o un asistente?

Lo Que PentAGI Anuncia Para el Futuro del Pentest

FAQ

Descubre Emelia, tu herramienta de prospección todo en uno.

Precios claros, transparentes y sin costes ocultos.

Start

Grow

Scale

Créditos(opcional)

Descubre otros artículos que te pueden interesar!

¿Qué es el enriquecimiento de datos? Guía completa 2026

Las 7 mejores alternativas a Lix

¿Cómo tener éxito con tu solicitud de cita por email?

Neverbounce vs Kickbox vs Emelia 2026: descripción, opiniones y precio

3 herramientas de web scraping no code para usar en 2026

Email warmup: guía completa 2026 para calentar tu dirección de correo

Enlaces útiles

Acerca de

Features

Síguenos

Socios