Gemini Omni, la apuesta de Google para revolucionar el vídeo con IA

Gemini Omni, la apuesta de Google para revolucionar el vídeo con IA

  • IronFable
  • Mayo 23, 2026
  • 3 minutos

La creación de contenido con inteligencia artificial (IA) ha avanzado mucho en los últimos años, especialmente en el ámbito de las imágenes. Sin embargo, el reto de generar vídeos coherentes y de alta calidad es mucho mayor debido a la complejidad que implica: movimiento, tiempo, física y personajes que deben parecer coherentes. Google ha lanzado Gemini Omni, un modelo de generación de vídeo con IA que busca abordar este problema y hacer de la edición una tarea mucho más sencilla.

Gemini Omni Flash es el primer modelo de la familia Gemini Omni, diseñado para crear contenido a partir de cualquier entrada, ya sea imágenes, audio, vídeo o texto. La idea es que los usuarios puedan combinar estos elementos para generar vídeos de alta calidad apoyados en el conocimiento del mundo real de Gemini. Un modelo que apuesta por la coherencia en la generación de vídeo.

¿Cómo funciona Gemini Omni?

Gemini Omni no se plantea solo como una herramienta para generar un clip desde cero, sino como un sistema capaz de trabajar sobre una escena mediante instrucciones encadenadas. Google describe el proceso de edición como la capacidad de cambiar elementos concretos o transformar por completo un vídeo de partida, ajustando estética, acción, entorno, ángulo, estilo o detalles específicos. También promete mantener la consistencia de los personajes, conservar la continuidad de la escena y ofrecer una física más coherente.

Algunos ejemplos de instrucciones que se pueden utilizar con Gemini Omni son:

  • "Haz que la escultura esté hecha de burbujas"
  • "Cuando la persona toque el espejo, haz que el espejo ondule con un efecto líquido y elegante, y que su brazo se convierta en un material reflectante"
  • "Un explicador en claymation sobre el plegamiento de proteínas, todo hecho de arcilla, sin manos, en stop motion y con precisión"

Pruebas con Gemini Omni

En una prueba realizada con una imagen reconocible como la Puerta de Alcalá en Madrid, Gemini Omni pudo convertir una escena real en un pequeño clip con movimiento. El resultado fue un vídeo con coches que avanzan, peatones que caminan y un sonido ambiental que encaja con la escena.

Disponibilidad y limitaciones

Gemini Omni Flash empieza a llegar a los suscriptores de Google AI Plus, Pro y Ultra a través de Gemini y Google Flow. Sin embargo, en una prueba realizada con una cuenta corporativa, se encontró un límite bastante ajustado: tras generar tres vídeos, el sistema avisó de que se había alcanzado el límite de generación de vídeo hasta el 20 de mayo a las 19:59. Esto sugiere que Google estaría dosificando el acceso, al menos en esta primera fase.