Google integra en Gemini la opción de crear videos a partir de fotografías

La herramienta de foto a video en Gemini permite transformar imágenes estáticas en clips de ocho segundos con sonido

Guardar
Conoce todas las funciones de
Conoce todas las funciones de IA que tienes disponibles con tu cuenta de Google. (Foto: Google)

En mayo, Google lanzó Veo 3, su modelo de generación de video más avanzado hasta la fecha. Desde entonces, la compañía ha ampliado progresivamente el acceso a estas herramientas, que ahora están disponibles para suscriptores de Google AI Pro en más de 150 países. La última novedad es una función dentro de Gemini, el asistente de inteligencia artificial de la empresa, que permite convertir fotos en videos de ocho segundos con sonido, llevando la creatividad digital a un nuevo nivel.

La herramienta de foto a video busca que los usuarios puedan dar vida a sus imágenes de manera sencilla. El proceso consiste en seleccionar la opción Videos dentro del cuadro de instrucciones de Gemini, cargar una foto y describir cómo se quiere animar la escena. La IA interpreta la instrucción y genera un clip dinámico de pocos segundos, en el que se pueden incluir efectos de movimiento y sonido.

Esto abre la posibilidad de crear desde pequeñas animaciones de objetos cotidianos hasta representaciones artísticas más complejas, como dotar de movimiento a pinturas o escenas de la naturaleza. Una vez listo, el clip puede descargarse o compartirse directamente.

Gemini te permite animar fotos
Gemini te permite animar fotos hasta por 8 segundos. (Google)

Más de 40 millones de videos generados

Desde el lanzamiento de Veo 3, el interés de los usuarios ha sido considerable. Según cifras oficiales de Google, en apenas siete semanas se han generado más de 40 millones de videos a través de las aplicaciones Gemini y Flow, la plataforma de la compañía enfocada en creación audiovisual con IA.

Las creaciones abarcan desde reinterpretaciones modernas de cuentos de hadas hasta experimentos sensoriales como videos ASMR que simulan sonidos de procesos naturales, por ejemplo, el enfriamiento de un trozo de lava. La compañía subraya que la imaginación de los usuarios es prácticamente el único límite para lo que se puede generar con esta tecnología.

Acceso y disponibilidad

La función de foto a video está habilitada para los planes de Google AI Pro y Ultra, que ofrecen un acceso más amplio a las capacidades avanzadas de Gemini. Cualquier usuario con suscripción activa puede probar la herramienta desde gemini.google.com.

Con Gemini puede crear videos
Con Gemini puede crear videos con solo usar fotos. (Google)

Las mismas funciones también están disponibles dentro de Flow, la solución de Google diseñada específicamente para experimentar con videos generados por IA. Esto permite que los usuarios trabajen tanto desde el entorno general de Gemini como desde una interfaz más orientada a la creación audiovisual.

Compromiso con la seguridad

Google afirma que, junto con el desarrollo de estas herramientas, mantiene un fuerte enfoque en la seguridad y la integridad del contenido generado. Para ello, aplica estrategias de “red teaming”, es decir, pruebas intensivas que buscan identificar vulnerabilidades o riesgos antes de que las funciones estén disponibles de forma masiva.

Además, la compañía realiza evaluaciones exhaustivas sobre cómo se utilizan sus herramientas y qué posibles riesgos de uso indebido existen, con el objetivo de ajustar sus políticas y sistemas de detección de contenido.

Gemini ofrece herramientas multimedia. (Foto:
Gemini ofrece herramientas multimedia. (Foto: Google)

Todos los videos generados incluyen una marca de agua visible que indica que han sido creados con IA, así como una marca invisible añadida mediante la tecnología SynthID. Esta doble capa busca garantizar transparencia y reducir la posibilidad de que se confunda el material con contenido auténtico grabado con cámaras.

Asimismo, Gemini incorpora controles de retroalimentación dentro de su plataforma: los usuarios pueden marcar con un pulgar hacia arriba o hacia abajo los resultados obtenidos. Esa información es utilizada por Google para mejorar tanto la precisión de los modelos como las medidas de seguridad implementadas.