Google anunció el martes Veo 3, un generador de video con inteligencia artificial (AI, por sus siglas en inglés) que también puede crear e incorporar audio.
Esta herramienta de AI compite con el generador de video Sora de OpenAI, pero su capacidad para incorporar audio al video que crea es una distinción clave. La compañía afirmó que Veo 3 puede incorporar audio que incluye diálogos entre personajes, así como sonidos de animales.
“Veo 3 destaca desde la introducción de texto e imágenes hasta la física del mundo real y la precisa sincronización labial”, escribió Eli Collins, vicepresidente de producto de Google DeepMind, en una publicación de blog el martes.
La herramienta de AI para video y audio está disponible desde ya para los suscriptores estadounidenses del nuevo plan de suscripción Ultra de Google de $249.99 al mes, dirigido a los entusiastas de la inteligencia artificial. Veo 3 también estará disponible para los usuarios de la plataforma empresarial Vertex AI de Google.
Google también anunció Imagen 4, su última herramienta de generación de imágenes, que, según la compañía, produce imágenes de mayor calidad mediante indicaciones del usuario.
Además, la compañía presentó Flow, una nueva herramienta de creación de películas que permite a los usuarios crear videos cinematográficos describiendo ubicaciones, tomas y preferencias de estilo. Los usuarios pueden acceder a la herramienta a través de Gemini, Whisk, Vertex AI y Workspace.
Estos últimos lanzamientos se producen en un momento en que las imágenes y los videos se están convirtiendo en casos de uso populares para las indicaciones de inteligencia artificial generativa (GenAI, por su acrónimo en inglés).
El CEO de OpenAI, Sam Altman, declaró en marzo pasado que el generador de imágenes 40 de ChatGPT era tan popular que provocó el colapso de los chips informáticos de la compañía. La compañía afirmó que tuvo que limitar temporalmente el uso de la función.
Google tiene un historial desigual en cuanto a sus generadores de imágenes de AI. El año pasado, la compañía tuvo que relanzar su herramienta Imagen 3 después de que revelara resultados históricamente inexactos en las indicaciones de los usuarios, lo que provocó críticas generalizadas. Su cofundador Sergey Brin declaró posteriormente que el problema se debió a la falta de pruebas exhaustivas.
La compañía, con sede en Mountain View, California, también actualizó su generador de video Veo 2 para incluir la posibilidad de que los usuarios agreguen o eliminen objetos de los videos con indicaciones de texto.
Además, Google abrió su modelo de generación de música Lyria 2 a los creadores a través de su plataforma YouTube Shorts y a las empresas que utilizan Vertex AI.