
DeepSeek V4: eficiencia y desafíos en la IA china
DeepSeek ha lanzado su modelo V4 bajo licencia MIT, con mejoras en código y arquitectura diseñada para chips chinos. Aunque admite que va de tres a seis meses por detrás de los modelos occidentales punteros, lo que complica su posición en el mercado de la IA.
El laboratorio chino de IA, DeepSeek, presentó su modelo V4 con notables avances en eficiencia y arquitectura, pero también reconoció estar rezagado respecto a los modelos occidentales más avanzados.
¿Qué ofrece DeepSeek V4?
DeepSeek V4 introduce TileLang, un lenguaje de dominio específico que permite desacoplar el código de bajo nivel de CUDA y compilarlo para distintos chips. También incorpora MegaMoE, un kernel diseñado para reducir la latencia en paralelismo de expertos que ya corre en hardware Ascend.
Sin embargo, el entrenamiento de V4 ha seguido usando GPUs NVIDIA, lo que muestra que la independencia de DeepSeek en términos de hardware aún es una aspiración.
El contexto de DeepSeek V4
DeepSeek sufrió un fallo grave de entrenamiento a mediados de 2025 mientras intentaba migrar su infraestructura de NVIDIA a los chips Ascend de Huawei. Esto, junto con diferencias internas sobre la dirección técnica, provocó meses de retraso y un modelo que sigue sin ser multimodal.
El mercado chino se ha reorganizado sin DeepSeek, con Doubao de ByteDance como el chatbot más descargado, y MiniMax y Z.ai saliendo a bolsa.
Desafíos y futuro de DeepSeek
La narrativa del open source chino como alternativa real al modelo cerrado occidental ha recibido un golpe. La pregunta es si DeepSeek puede recuperar el terreno perdido, lo que depende en gran medida de Huawei y su capacidad para escalar con V4.
