En Emelia, nuestra plataforma de prospección B2B, integramos modelos de inteligencia artificial en el corazón de nuestras funcionalidades, ya sea para la redacción automatizada de correos de prospección o para el enriquecimiento de datos. En Bridgers, nuestra agencia digital y de IA, acompañamos a las empresas en la integración de soluciones de IA a medida. Y con Maylee, nuestro cliente de correo nativo de IA, ampliamos los límites de la productividad gracias a la inteligencia artificial. Cuando un modelo del tamaño de DeepSeek V4 se perfila en el horizonte, con 1 billón de parámetros (10¹²) y capacidades multimodales nativas, consideramos esencial ofrecerte un análisis completo de lo que esto cambia para los profesionales y las empresas.
DeepSeek V4 es el próximo gran modelo de lenguaje desarrollado por DeepSeek, el laboratorio chino de inteligencia artificial que sacudió la industria en 2026 con su modelo V3 y la serie DeepSeek-R1. Si la información que circula en la comunidad se confirma, V4 representa un salto generacional en varios aspectos.
El modelo se basaría en una arquitectura Mixture-of-Experts (MoE) que sumaría unos 1 billón de parámetros (10¹²), es decir, casi un 50 % más que los 671 000 millones de V3. Pero una de las innovaciones principales reside en la eficiencia: solo 32 000 millones de parámetros estarían activos por token generado, frente a los 37 000 millones de V3. Dicho de otro modo, DeepSeek V4 sería a la vez más potente y más ligero en inferencia.
La arquitectura combina varias innovaciones clave:
MoE (Mixture-of-Experts): permite activar únicamente una fracción de los parámetros en cada consulta, reduciendo considerablemente los costes de cómputo.
MLA (Multi-head Latent Attention): una versión optimizada de la atención multi-cabeza, ya presente en V3.
Engram Memory: un sistema de memoria condicional, documentado en un artículo científico publicado el 12 de enero de 2026 (arXiv:2601.07372), que permite al modelo almacenar y recuperar información de manera más eficiente.
DSA (Dynamic Sparse Attention): un mecanismo de atención dinámica y dispersa que contribuye a la gestión de la enorme ventana contextual.
Y es que quizá este sea el cambio más espectacular para los usuarios: la ventana de contexto pasa de 128 000 tokens (V3) a 1 millón de tokens. No se trata de una simple declaración de marketing. Desde el 11 de febrero de 2026, DeepSeek ha ampliado silenciosamente la ventana contextual de su API a 1 millón de tokens, lo que sugiere que la tecnología ya está funcionando en producción.
Para medir la magnitud del salto, aquí va una comparativa directa:
Specification | DeepSeek V3 | DeepSeek V4 (attendu) |
|---|---|---|
Parametres totaux | 671 milliards | ~1 000 milliards |
Parametres actifs par token | 37 milliards | ~32 milliards |
Fenetre de contexte | 128 000 tokens | 1 000 000 tokens |
Modalites | Texte uniquement | Texte + Image + Video |
Hardware principal | Nvidia H800 | Huawei Ascend 910C |
Licence | MIT | MIT (attendue) |
Tres elementos destacan. Primero, la reducción de los parámetros activos pese al aumento masivo de los parámetros totales refleja un trabajo de optimización notable. Segundo, el paso a 1 millón de tokens de contexto sitúa a V4 en una categoría aparte: pasa a ser posible tratar documentos enteros, bases de código completas o corpus de investigación en una única consulta. Tercero, el salto al multimodal nativo transforma de forma fundamental la naturaleza del modelo.
A diferencia de V3, que se limitaba al texto, DeepSeek V4 está concebido desde el inicio como un modelo multimodal. Estas son las capacidades esperadas en detalle:
Capacite | Description | Statut |
|---|---|---|
Generation de texte | Redaction, code, analyse, traduction | Confirme |
Comprehension d'images | Analyse visuelle, OCR, Q&A visuel | Confirme |
Generation d'images | Text-to-image, assistance au design | Confirme |
Comprehension video | Resume, analyse de contenu video | Confirme |
Generation video | Courtes sequences animees | Confirme |
Traitement audio | Transcription, analyse vocale | Non confirme |
El hecho de que estas capacidades sean nativas, y no añadidas a posteriori, es un punto crucial. Los modelos multimodales con mejor rendimiento suelen ser aquellos en los que las distintas modalidades se han integrado desde la fase de entrenamiento, en lugar de incorporarse mediante módulos adicionales. Esto sugiere una comprensión más profunda de las relaciones entre texto, imagen y vídeo.
No se ha publicado ningún benchmark oficial, pero han circulado filtraciones internas en la comunidad:
HumanEval (evaluación del código): 90 %, una puntuación que situaría a V4 por encima de la mayoría de los modelos competidores.
SWE-bench (resolución de bugs de software reales): superior al 80 %, lo que sugiere capacidades prácticas en ingeniería de software.
También se han filtrado puntuaciones en MMLU-Pro y GPQA Diamond, aunque no han sido confirmadas.
Según estas mismas filtraciones, DeepSeek V4 superaría a Claude y a GPT en las tareas de programación. Habrá que verificarlo con benchmarks independientes, pero la trayectoria de DeepSeek, cuyo V3 ya sorprendió a la industria, hace que estas cifras resulten plausibles.
Uno de los aspectos más estratégicos de DeepSeek V4 tiene que ver con el hardware. Si V3 fue entrenado con GPU Nvidia H800, V4 marca un punto de inflexión: el modelo estaría optimizado para funcionar sobre los chips Huawei Ascend 910B y 910C.
DeepSeek habría obtenido un acceso anticipado a los chips Huawei, un privilegio que no se le ha concedido ni a Nvidia ni a AMD. Si esto se confirma, DeepSeek V4 se convertiría en el primer modelo de 1 billón de parámetros (10¹²) optimizado por completo fuera del ecosistema Nvidia.
Las implicaciones son considerables. Para el ecosistema de IA chino, es la demostración de que es posible entrenar y desplegar modelos punteros sin depender de las exportaciones estadounidenses de semiconductores. Para las empresas internacionales, significa que empieza a emerger una alternativa creíble a la infraestructura Nvidia, aunque el rendimiento chip a chip siga siendo favorable a Nvidia por ahora.
En la práctica, DeepSeek habría usado los chips Nvidia para el entrenamiento y habría relegado los chips Huawei a la inferencia. Un enfoque pragmático que podría evolucionar con las próximas generaciones de chips Ascend.
Aquí es donde DeepSeek V4 se vuelve concretamente interesante para los profesionales. Estos son los escenarios de uso más prometedores.
Con una puntuación del 90 % en HumanEval y una ventana contextual de 1 millón de tokens, V4 podría analizar bases de código enteras en una sola consulta. Para un equipo de desarrolladores, esto significa la posibilidad de enviar un repositorio GitHub completo y pedir una revisión de código, una refactorización o una detección de vulnerabilidades sobre el conjunto del proyecto. No archivo por archivo, sino el proyecto en su totalidad.
La ventana de 1 millón de tokens permite cargar documentos voluminosos: informes anuales completos, contratos de varios cientos de páginas, expedientes regulatorios. Un bufete de abogados podría enviar la totalidad de un caso contencioso. Un analista financiero podría cargar varios informes trimestrales de forma simultánea para realizar un análisis comparativo.
Para los equipos de marketing y los creadores de contenido, las capacidades multimodales nativas abren perspectivas inéditas. Imagina una herramienta capaz de generar simultáneamente el texto de un artículo, las ilustraciones que lo acompañan y un vídeo promocional corto, todo coherente y alineado con un brief único.
DeepSeek se ha posicionado como una alternativa claramente menos costosa que los modelos de OpenAI y Anthropic. Si V4 mantiene esta política de precios (V3 se entrenó por aproximadamente 5,6 millones de dólares), las empresas que consumen masivamente API de IA podrían lograr ahorros significativos sin sacrificar la calidad.
Bajo licencia MIT, V4 sería totalmente autoalojable. Para las empresas sometidas a restricciones regulatorias estrictas (salud, defensa, finanzas), es una ventaja decisiva: ningún dato sale de tus servidores. Es también una ventaja para las empresas europeas que quieren seguir cumpliendo con el RGPD sin depender de proveedores estadounidenses.
Con puntuaciones elevadas en los benchmarks C-Eval, V4 es una elección natural para las empresas que se dirigen al mercado chino. La comprensión de los matices lingüísticos y culturales supera a la que ofrecen los modelos occidentales.
Autoalojar un modelo de 1 billón de parámetros (10¹²) no es tarea menor. Estas son las estimaciones:
En FP16 (precisión completa): unos 2 TB de VRAM, lo que exige varios GPU A100 o H100 en clúster.
En cuantización Q4_K_M: unos 500 GB, lo que sigue siendo considerable.
Configuración mínima: un enfoque multinodo o una cuantización a 8 bits sobre 4x RTX 4090 podría funcionar, pero con compromisos en la velocidad de inferencia.
Para una empresa, esto representa una inversión en hardware del orden de 50 000 a 200 000 euros según la configuración, sin contar los costes de electricidad y mantenimiento. La alternativa más accesible sigue siendo el uso vía la API de DeepSeek, cuyas tarifas han sido históricamente muy competitivas.
Esta es la pregunta del millón de tokens. La cronología de los acontecimientos es reveladora:
12 de enero de 2026: publicación del artículo sobre la memoria Engram, considerada un pilar fundamental de V4.
Enero de 2026: filtración de código referenciado bajo el nombre "MODEL1" en GitHub.
11 de febrero de 2026: expansión silenciosa de la ventana contextual a 1 millón de tokens en la API existente.
17 de febrero de 2026: fecha de anuncio esperada por la comunidad. No sucede nada.
3 de marzo de 2026: fecha de lanzamiento rumoreada, coincidiendo con las Dos Sesiones (gran evento político en China). De nuevo, nada.
5 de marzo de 2026: OpenAI lanza GPT-5.4.
10 de marzo de 2026: sigue sin haber lanzamiento oficial.
Circulan varias hipótesis para explicar este retraso. La más probable: el lanzamiento de GPT-5.4 por OpenAI el 5 de marzo habría empujado a DeepSeek a recalibrar sus benchmarks para asegurarse de que V4 pueda presentarse como un competidor creíble del nuevo modelo de OpenAI. Otras voces hablan de dificultades de optimización ligadas a los chips Huawei, o sencillamente de un calendario interno que nunca fue el que la comunidad imaginaba.
Sería irresponsable presentar únicamente los aspectos positivos. Esto es lo que aún no sabemos, o lo que podría suponer un problema.
Ningún benchmark independiente. Todo el rendimiento citado procede de filtraciones internas. Mientras no se realicen evaluaciones independientes, estas cifras deben tomarse con cautela.
La censura intrínseca. Como todos los modelos chinos, DeepSeek está sujeto a las regulaciones del gobierno chino. Las versiones accesibles vía la API pueden negarse a responder a ciertas preguntas consideradas sensibles. El autoalojamiento del modelo open-source atenuaría este problema, pero no lo elimina por completo, ya que el sesgo puede estar anclado en los datos de entrenamiento.
El multimodal aún está por demostrarse. Las capacidades de generación de imágenes y vídeo anunciadas no se han demostrado públicamente. La calidad real podría quedar por debajo de las expectativas, sobre todo frente a modelos especializados como DALL-E 3, Midjourney o Sora.
El coste de inferencia a gran escala. Aunque el coste de entrenamiento sea bajo, el coste de inferencia para un modelo de 1 billón de parámetros (10¹²), incluso con un MoE eficiente, sigue siendo una incógnita. Las tarifas de la API no se han anunciado.
La dependencia de los chips Huawei. Si bien la optimización Huawei es una ventaja estratégica, también supone un riesgo. Los chips Ascend no cuentan con el mismo ecosistema de software que Nvidia (CUDA), lo que podría complicar los despliegues para las empresas habituadas al ecosistema Nvidia.
Eres desarrollador o equipo técnico que busca un modelo de código potente y autoalojable.
Gestionas grandes volúmenes documentales y necesitas una ventana de contexto masiva.
Buscas una alternativa menos costosa a GPT y Claude para tus necesidades de API.
Tienes exigencias de soberanía de los datos y quieres un modelo open-source alojable internamente.
Trabajas en el mercado chino y necesitas un modelo que entienda los matices culturales locales.
Eres un apasionado de la IA que quiere comprender los últimos desarrollos del sector.
Ya usas GPT-5.4 o Claude y estás satisfecho, al menos hasta que los benchmarks independientes estén disponibles.
No tienes la infraestructura para autoalojar un modelo de este tamaño y prefieres soluciones SaaS consolidadas.
Necesitas garantías de estabilidad y soporte enterprise que hoy solo ofrecen OpenAI y Anthropic.
Tus casos de uso no requieren ni una ventana de contexto masiva, ni capacidades multimodales.
DeepSeek V4 se anuncia como uno de los modelos de IA más ambiciosos de 2026. Con 1 billón de parámetros (10¹²), una ventana de 1 millón de tokens, capacidades multimodales nativas y una licencia open-source, marca todas las casillas que importan a empresas y desarrolladores.
Pero aún no ha salido. Y mientras no lo haga, todo lo que tenemos son filtraciones, rumores y señales. La trayectoria de DeepSeek, que ha sorprendido sistemáticamente a la industria con V3 y R1, hace que estas promesas resulten creíbles. El contexto geopolítico y la competencia con GPT-5.4 añaden una capa extra de intriga.
Lo que sí es seguro es que, el día en que DeepSeek V4 esté realmente disponible, será uno de los modelos más importantes a evaluar para cualquiera que utilice la IA en un contexto profesional. No dejaremos de probarlo a fondo desde su salida.

Sin compromiso, precios para ayudarte a aumentar tu prospección.
No necesitas créditos si solo quieres enviar emails o hacer acciones en LinkedIn
Se pueden utilizar para:
Buscar Emails
Acción IA
Buscar Números
Verificar Emails