Google ha lanzado Project Genie, un prototipo de investigación capaz de generar entornos digitales interactivos y navegables a partir de una simple descripción de texto o una imagen. Este sistema utiliza el modelo de mundo Genie 3 para simular la física y el movimiento de manera autónoma y en tiempo real.

Simulación dinámica de entornos mediante inteligencia artificial
A diferencia de los escenarios estáticos tradicionales, esta tecnología calcula la progresión del entorno según las acciones directas que ejecuta el usuario. El sistema procesa los comandos para predecir y renderizar cómo debe evolucionar el espacio físico mientras se explora.
Es como entrar en un dibujo que se completa solo a medida que caminas, permitiendo que una simple foto se transforme en un mundo con profundidad y reglas propias.
- Generación fluida: Crea el camino a seguir de forma instantánea mientras el usuario se desplaza por el entorno.
- Control de perspectiva: Permite definir vistas en primera o tercera persona antes de iniciar la navegación.
- Consistencia técnica: El modelo logra mantener la coherencia visual en simulaciones complejas de hasta 60 segundos.

Hacia la comprensión del mundo físico por la IA
El proyecto busca que los sistemas de inteligencia artificial comprendan las dinámicas físicas, un avance crítico para el desarrollo de la robótica y la IA general. La plataforma permite además el «remix», donde los usuarios pueden modificar y expandir mundos creados por otros.
Diego Rivas, responsable de producto en Google DeepMind, explica cómo el sistema reacciona dinámicamente a la interacción humana durante la exploración.
“A diferencia de las experiencias explorables en instantáneas 3D estáticas, Genie 3 genera el camino a seguir en tiempo real a medida que te mueves e interactúas con el mundo”.

