Google reveló su más actual innovación y evolución de la IA, este no va de un modelo de lenguaje como Bard o Gemini, se trata de Lumiere un generador de video capaz de desarrollar y crear contenido de video a partir de una descripción de texto o una imagen, en el que se destaca sobre otros modelos de inteligencia artificial ya existentes como MidJourney o DALL-E, ya que se centrara en la confección de movimientos realistas, diversos y coherentes.
Previamente la compañía había mostrado otros modelos de generadores de video, a pesar de no poseer las cualidades completas de Lumiere. Esta nueva implementación se basa en una tecnología llamada Space-Time-U-Net, que indica donde se encuentran los objetos y elementos dentro de un video, analizando su movimiento y cambio al mismo tiempo.
«Demostramos resultados de generación de vanguardia y mostramos la aplicabilidad de nuestro enfoque para una amplia gama de implementaciones», dicen los desarrolladores en el reporte de la investigación. El modelo fue entrenado con más de 30 millones de vídeos, con sus subtítulos.
Google
En este primer acercamiento a Lumiere, se tiene un alcance límite para generar 80 cuadros a 16 fotogramas por segundo, lo que puede traducirse como un video de hasta 5 segundos de duración con una resolución de 1024×1024 pixeles.
Resumamos a Lumiere
- Convierte texto a vídeo con instrucciones claras.
- Crea un video a partir de imágenes fijas.
- Desarrolla una calidad de video estilizada tomando como referencia el estilo de imagen que sea proporcionada.
- Edita tus creaciones digitales desde la forma visual o directamente desde el prompt introducido.
Cabe destacar, que esta innovación no se encuentra disponible todavía, ni tampoco se tiene una fecha de lanzamiento, sin embargo se espera sea un total éxito. Disfrutemos de un video promocional