Nueva IA de Google puede generar mundos de videojuego en tiempo real

Estos nuevos modelos suponen un salto en cuanto al nivel de interacción y coherencia alcanzable respecto a versiones previas

Guardar
Muestra de uno de los
Muestra de uno de los mundos simulados de Genie 3, modelo de IA de Google. (Google Deep Mind)

Google DeepMind ha dado a conocer Genie 3, la última versión de su modelo de inteligencia artificial orientado a la creación de entornos tridimensionales interactivos y persistentes. Este nuevo avance consolida la apuesta de la compañía por los denominados “world models”, sistemas capaces de construir mundos virtuales enteros a partir de simples instrucciones, con el fin de que puedan ser utilizados en videojuegos, simulaciones educativas, entrenamiento de robots e innovación en medios digitales.

Los modelos de mundo que desarrolla Google, y Genie 3 en particular, suponen un salto en cuanto al nivel de interacción y coherencia alcanzable respecto a versiones previas. Mientras que herramientas anteriores como Genie 2 o Veo ofrecían la posibilidad de generar escenarios jugables por lapsos muy breves —en torno a 10-20 segundos, y apenas hasta un minuto en el mejor de los casos—, Genie 3 puede mantener entornos persistentes durante varios minutos de interacción continua. Esto representa un avance respecto a la volatilidad e inestabilidad experimentadas por los usuarios en anteriores pruebas, donde los elementos del mundo virtual aparecían y desaparecían o cambiaban de posición al girar la vista o navegar a otra parte del entorno.

La nueva versión permite, por ejemplo, que detalles como pinturas en una pared o trazos en una pizarra permanezcan inalterados aunque el usuario los pierda de vista y regrese poco después, manteniendo esa referencia en la “memoria visual” del modelo durante aproximadamente un minuto. Esta capacidad de recordar la ubicación de objetos y detalles introduce una profundidad inédita en la experiencia, acercándola más a la lógica de los videojuegos comerciales, aunque toda la generación del entorno proceda directamente de inteligencia artificial y no de recursos preprogramados.

El nuevo modelo de Google
El nuevo modelo de Google DeepMind genera mundos interactivos consistentes y de varios minutos para entrenar agentes. (Europa Press)

En cuanto a calidad visual, Genie 3 genera mundos a una resolución de 720p y una tasa de 24 cuadros por segundo, lo que garantiza una experiencia más fluida y convincente para el usuario o el agente que explora el espacio.

Personalización, aplicaciones y acceso restringido

Una de las funciones nuevas y destacadas en Genie 3 es la introducción de “eventos mundo por instrucción”. Esto significa que, a través de simples indicaciones, los usuarios pueden modificar aspectos fundamentales del ambiente, como cambiar el clima, la iluminación, la disposición de objetos, e incluso añadir personajes nuevos a la escena. La capacidad de responder a instrucciones de manera casi instantánea, con lo que Google denomina “latencia en tiempo real”, sienta las bases para aplicaciones potenciales en formación, aprendizaje personalizado, diseño de prototipos digitales, entrenamiento de sistemas de robótica y desarrollo acelerado de videojuegos y experiencias inmersivas.

Para demostrar estas capacidades, DeepMind ha compartido varios videos en los que se aprecian escenas interactivas generadas por Genie 3, en las que los usuarios pueden desplazarse libremente y modificar el entorno mientras el modelo mantiene la coherencia y la ubicación de los objetos a lo largo del tiempo.

Oficina de Google Deepmind en
Oficina de Google Deepmind en Londres. (Reuters)

A pesar de estos avances, Google mantiene una política de acceso restringido. De acuerdo con la empresa, Genie 3 se encuentra en una etapa de “vista previa limitada para investigación”, dirigida principalmente a un selecto grupo de académicos y creadores. El objetivo es analizar con mayor profundidad los riesgos asociados y determinar cómo mitigar posibles usos indebidos o inesperados antes de plantear una apertura más amplia de la tecnología. Por ahora, existen restricciones importantes: la interacción con los objetos ambientales es limitada y la generación de texto legible depende de que sea aportado en la descripción inicial del mundo generado.

Google reconoce que todavía hay desafíos por resolver, tanto desde el punto de vista técnico como ético y legal. Sin embargo, el equipo detrás de Genie 3, liderado por expertos en simulación y procedente de proyectos de video generativo punteros como Sora de OpenAI, confía en que este modelo representa un avance clave en la dirección de universos virtuales dinámicos y completamente interactivos, generados en tiempo real por inteligencia artificial para amplias variedades de usos.

El futuro de Genie 3 se vislumbra en la progresiva apertura a nuevos testers y usuarios, aunque de momento no se ha precisado ni el calendario ni las condiciones para una expansión más allá del entorno controlado de investigación. Con su presentación, Google DeepMind subraya el potencial de los modelos generativos para revolucionar la manera en que se crean, exploran y personalizan entornos digitales, marcando una nueva etapa en la convergencia entre inteligencia artificial, simulación y creatividad digital.