DeepSeek V4: nueva generación con 1M de contexto y chips Huawei

DeepSeek presentó el 24 de abril de 2026 – exactamente un año después del primer impacto con R1 – la nueva generación de modelos V4. Con dos variantes, una enorme ventana de contexto, nuevos mecanismos de atención y precios de API drásticamente más bajos que los de la competencia estadounidense, la startup china vuelve a hacer ruido en el mundo de la IA.

Lanzamiento y modelos
Innovaciones técnicas
Rendimiento y comparativa de precios
Chips Huawei: ¿independencia de NVIDIA?
Open source y licencia
Voces de la investigación y la industria
Críticas y preguntas abiertas
Importancia geopolítica

Lanzamiento y modelos

DeepSeek pone en pie con V4 dos variantes: DeepSeek V4-Pro y DeepSeek V4-Flash. El fabricante presenta a ambos como «la plataforma de IA open source más potente del mundo».

Pro apuesta por la máxima calidad en reasoning, tareas de agentes y programación compleja; Flash, por la alta velocidad y el bajo consumo de recursos con una calidad de reasoning solo ligeramente reducida.

Innovaciones técnicas

1 millón de tokens de contexto: ambos modelos pueden procesar de una vez hasta un millón de tokens, equivalente aproximadamente a las obras completas de Tolkien o a una decena de novelas. Bases de código completas, contratos o informes extensos pueden analizarse en un solo paso.
Mixture-of-Experts (MoE) con 1,6 billones de parámetros: Pro activa por consulta solo las partes pertinentes de la red, lo que reduce drásticamente el cómputo. Flash usa una variante más compacta con 284 mil millones de parámetros.
Mecanismos de atención optimizados (DeepSeek Sparse Attention): el sistema identifica los pasajes prioritarios en lugar de tratar todos los contenidos por igual. Eso convierte en prácticamente viables los contextos extremadamente largos.
Mejor continuidad conversacional: las conclusiones se tienen en cuenta de forma más fiable a lo largo de varios mensajes del usuario, un punto débil habitual en muchos modelos de lenguaje.
Modos Thinking y Non-Thinking: se puede decidir por consulta si el modelo reflexiona internamente o responde directamente.

Rendimiento y comparativa de precios

V4-Pro compite directamente con OpenAI GPT-5.4 y Anthropic Claude Opus 4.6. En pruebas estandarizadas de programación, DeepSeek consigue los mejores resultados y se posiciona como «uno de los mejores candidatos para tareas de agentes», en palabras de Ben Burtenshaw, de Hugging Face.

En cambio, en razonamientos lógicos especialmente complejos y en exámenes académicos exigentes, V4 se sitúa, según los primeros análisis, todavía por detrás de los líderes absolutos.

El segundo punto: el precio. Mientras Anthropic cobra unos 25 dólares por un millón de tokens de salida, la variante más potente de V4 cuesta 3,25 dólares. V4-Flash queda aún claramente por debajo. Un usuario de Reddit comentó: «No creo que haya ningún modelo capaz de competir en relación calidad-precio.»

Modelo	Proveedor	Salida (USD / 1M tokens)
DeepSeek V4-Pro	DeepSeek	~3,25 USD
Claude Opus 4.6	Anthropic	~25 USD
GPT-5.5 (referencia)	OpenAI	~30 USD

Chips Huawei: ¿independencia de NVIDIA?

Una particularidad: DeepSeek ha optimizado V4 explícitamente para los procesadores chinos de Huawei, una novedad en la industria de la IA. Hasta ahora, los grandes modelos de lenguaje funcionaban casi en exclusiva sobre hardware NVIDIA.

Los expertos subrayan, no obstante, que esto se aplica sobre todo a la inferencia (es decir, al funcionamiento para las consultas de los usuarios). Liu Zhiyuan, de la Universidad de Tsinghua, explica que «solo se han adaptado partes del proceso de entrenamiento a los chips chinos»; el entrenamiento propiamente dicho debería seguir apoyándose en gran medida en hardware NVIDIA.

Open source y licencia

V4 se ha publicado bajo licencia MIT, por lo que está disponible como código abierto: el modelo puede descargarse, ejecutarse y modificarse en gran medida con libertad. El investigador de DeepSeek Deli Chen comentó: «Como siempre, seguimos fieles al pensamiento a largo plazo y al credo ‘open source para todos’.»

DeepSeek se distancia así conscientemente de los modelos cerrados de OpenAI, Anthropic y Google.

Voces de la investigación y la industria

Ben Burtenshaw (Hugging Face): la verdadera innovación reside en el procesamiento eficiente de grandes contextos; V4 es «uno de los mejores candidatos para tareas de agentes».
Liu Zhiyuan (Universidad de Tsinghua): en el entrenamiento mismo, hasta ahora solo hay partes adaptadas a los chips chinos.
Christian Mayr (TU Dresden): Europa debería aferrarse menos a sistemas establecidos y trabajar más en código y plataformas para operar modelos de lenguaje de forma más eficiente.

Críticas y preguntas abiertas

A pesar de la publicación open source, los escépticos advierten de que V4 es tan complejo y exige tanto cómputo que una reproducción uno a uno fuera de los grandes proveedores cloud apenas resulta realista. También en política de seguridad se observa el modelo con cautela: una IA potente y disponible libremente podría usarse en teoría tanto con fines defensivos como para ciberataques dirigidos.

Además, en las tareas de reasoning más exigentes y en exámenes académicos V4 muestra todavía debilidades frente a los modelos punteros absolutos de Estados Unidos.

Importancia geopolítica

Con V4, DeepSeek demuestra por segunda vez en doce meses que arquitecturas innovadoras y una eficiencia consecuente pueden flexibilizar algo la dependencia de NVIDIA. La administración estadounidense había intentado asegurar su predominio técnico con restricciones a la exportación de chips NVIDIA; V4 muestra que puede haber un camino para esquivarlas.

En el mercado chino de IA, DeepSeek endurece la competencia con precios agresivos. Mientras los proveedores estadounidenses como OpenAI apuestan por potencia bruta y precios premium, DeepSeek persigue de forma consecuente la estrategia opuesta: barato, abierto y flexible en hardware.

El sector se pregunta ahora si 2026 volverá a ser un «momento DeepSeek», con efectos duraderos sobre el panorama global de la IA.

DeepSeek V4: nueva generación de modelos con 1M de contexto, chips Huawei y precios de combate