
DeepSeek V4, el modelo de IA que reta a ChatGPT y Claude
La empresa DeepSeek ha presentado su nuevo modelo de IA, DeepSeek V4, que busca competir con los modelos más avanzados de la industria, como ChatGPT y Claude. Este nuevo modelo destaca por su capacidad de procesamiento y su precio, que es hasta siete veces menor que el de Claude Opus 4.6.
DeepSeek V4 se presenta en dos versiones: Pro y Flash. La primera tiene 1,6 billones de parámetros, con 49.000 millones de activos, mientras que la segunda tiene 248.000 millones de parámetros, con 13.000 activos. Ambos modelos son de código abierto y tienen como objetivo ofrecer un rendimiento avanzado a un precio asequible.
CaracterÃsticas de DeepSeek V4
DeepSeek V4 tiene una arquitectura Mixture-of-Experts (MoE) que permite que solo un porcentaje de los parámetros se activen en cada interacción, lo que lo hace más eficiente. El modelo puede soportar ventanas de hasta un millón de tokens, lo que lo hace ideal para tareas que requieren una gran cantidad de contexto.
En cuanto a la compatibilidad, DeepSeek V4 puede correr en chips de NVIDIA y Ascend de Huawei, lo que lo hace más flexible que otros modelos de IA.
La competencia con ChatGPT y Claude
DeepSeek V4 busca competir con los modelos más avanzados de la industria, como ChatGPT y Claude. Aunque estos modelos tienen capacidades avanzadas, DeepSeek V4 ofrece un rendimiento similar a un precio mucho menor.
La empresa DeepSeek busca financiación externa por primera vez en su historia, con el objetivo de conseguir 300 millones de dólares con una valoración estimada de 20.000 millones de dólares.
El futuro de la IA
DeepSeek V4 es un ejemplo de cómo la industria de la IA está evolucionando hacia modelos más eficientes y asequibles. Con su arquitectura innovadora y su capacidad de procesamiento avanzada, DeepSeek V4 está posicionado para ser un jugador importante en el mercado de la IA.
