Ponen a prueban a la inteligencia artificial jugando Super Mario Bros: el resultado te sorprenderá

Guardar

Los investigadores analizaron el tiempo de respuesta de diferentes IA mientras interactuaban con el juego. Super Mario Bros.

El videojuego Super Mario Bros, lanzado en 1985 por Nintendo, se ha convertido en un inesperado campo de pruebas para los modelos de inteligencia artificial (IA), tras un estudio que muestra las fortalezas y debilidades de estas tecnologías al enfrentarse a un entorno de videojuego dinámico.

El experimento, realizado por el Hao AI Lab de la Universidad de California en San Diego, tuvo como objetivo medir la capacidad de los modelos de IA para adaptarse a un entorno en tiempo real.

Para llevar a cabo las pruebas, los investigadores no utilizaron la versión original de Super Mario Bros, sino un emulador modificado en conjunto con el framework GamingAgent. Este sistema facilitaba la interacción de los modelos de IA con el juego, proporcionando instrucciones básicas y capturas de pantalla en tiempo real del entorno virtual.

Los investigadores analizaron el tiempo de respuesta de diferentes IA mientras interactuaban con el juego. Super Mario Bros.

GamingAgent permitía a los modelos de IA recibir indicaciones, como “si hay un obstáculo o enemigo cerca, muévete o salta a la izquierda para esquivarlo”, lo que les ofrecía un medio para interactuar con el videojuego de manera más efectiva.

El uso de este framework destacó las diferencias entre los modelos evaluados, ya que algunos demostraron una mayor capacidad para interpretar instrucciones y reaccionar de forma efectiva en tiempo real. En este sentido, la habilidad para procesar y responder rápidamente a los estímulos del juego resultó ser un factor decisivo en los resultados obtenidos.

Uno de los descubrimientos más importantes del experimento fue el impacto del tiempo de respuesta en el rendimiento de los modelos de IA. Los sistemas que utilizan procesos de “razonamiento”, como o1 de OpenAI, mostraron un rendimiento inferior en comparación con aquellos que podían tomar decisiones rápidamente.

Los investigadores evaluaron el desempeño de la IA en el videojuego, después de dar una serie de instrucciones. (Imagen ilustrativa Infobae)

Esto se debió a que los modelos más lentos requerían varios segundos para llegar a una conclusión, mientras que en Super Mario Bros, las decisiones deben tomarse en fracciones de segundo para evitar obstáculos o enemigos.

Este hallazgo subraya la necesidad de desarrollar sistemas de IA que sean más ágiles en su toma de decisiones, especialmente en áreas donde las respuestas rápidas son cruciales, como la conducción autónoma o la robótica. La habilidad para tomar decisiones inmediatas, sin demoras significativas, es esencial no solo para los videojuegos, sino también para muchas aplicaciones prácticas del mundo real.

Los resultados del estudio destacaron al modelo Claude 3.7 de Anthropic como el sistema más eficiente entre los evaluados, superando incluso a su predecesor, Claude 3.5. Sin embargo, otros modelos reconocidos como GPT-4 de OpenAI y Gemini 1.5 Pro de Google enfrentaron dificultades significativas al intentar dominar el juego.

El desempeño de modelos conocidos como GPT-4 pone evidencia las limitaciones de la IA. Super Mario Bros.

La discrepancia en el rendimiento entre los modelos más avanzados y Super Mario Bros sugiere que las habilidades requeridas para superar este tipo de desafíos no están plenamente desarrolladas en algunos de los sistemas más sofisticados.

El estudio reveló que, aunque los modelos como GPT-4 son conocidos por su capacidad de realizar tareas complejas, su desempeño en un entorno como el de Super Mario Bros, que requiere respuestas rápidas y adaptación constante, pone en evidencia sus limitaciones. Estos modelos, aunque potentes en muchos aspectos, no siempre logran alcanzar el nivel de habilidad requerido en un entorno interactivo como el de un videojuego de plataformas.

El uso de videojuegos como herramienta para evaluar la IA no es una novedad. Sin embargo, el caso de Super Mario Bros ha reavivado el debate sobre la validez de estas pruebas. Algunos expertos han cuestionado si los resultados obtenidos en estos entornos virtuales son realmente representativos del avance de la inteligencia artificial.

El desempeño de modelos conocidos como GPT-4 pone evidencia las limitaciones de la IA. REUTERS/Dado Ruvic

Andrej Karpathy, investigador en OpenAI, expresó en una publicación en redes sociales que no está seguro de qué métricas utilizar para medir el progreso de los modelos actuales.

A pesar de las críticas, los investigadores del Hao AI Lab defienden el uso de videojuegos como un entorno accesible y controlado para evaluar las capacidades de los sistemas de IA. Super Mario Bros ofrece desafíos que requieren una combinación de habilidades, como la toma de decisiones rápidas, la adaptación al entorno y la planificación estratégica, lo que lo convierte en una herramienta valiosa para este tipo de análisis.

IA Inteligencia artificial ChatGPT OpenAI Gemini Google Super Mario Bros Videojuegos Tecnología Lo último en tecnología

ultimas

Generación Z engaña a los jefes con el ‘task masking’: qué es y cómo lo usan en la oficina

La popularidad de esta técnica ha sido impulsada en redes sociales, donde varios influencers abiertamente cuentan cómo logran efectuarla en sus entornos laborales

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Los fanáticos del erizo azul lograron que se retrasara el lanzamiento de Sonic en 2019 y que el personaje fuera rediseñado, tras la recepción negativa del primer adelanto

Cuánto cuesta ethereum hoy 6 de marzo: la criptomoneda muestra signos de recuperación

Ethereum fue lanzada en 2015 por el programador Vitalik Buterin, con la intención de impulsar una herramienta para aplicaciones descentralizadas y colaborativas

CapCut tiene ahora un doble que estafa: este es el engaño digital para robar todos tus datos y privacidad

En un nuevo fraude, los ciberdelincuentes imitan la popular aplicación, en esta ocasión simulando la versión premium con un sitio falso que esconde un troyano, poniendo en riesgo tu información personal

Bitcoin muestra signos de recuperación: este es su precio hoy 6 de marzo

El bitcoin fue la primera criptomoneda creada en el mundo y ha llegado a un nivel máximo de 68 mil unidades de dólar

MÁS NOTICIAS

Ponen a prueban a la inteligencia artificial jugando Super Mario Bros: el resultado te sorprenderá

El desempeño de modelos conocidos como GPT-4 y Gemini 1.5 Pro pone en evidencia las limitaciones en el tiempo de respuesta de la IA

El tiempo de respuesta: un factor determinante

Los videojuegos como herramientas de evaluación de IA

ultimas

Generación Z engaña a los jefes con el ‘task masking’: qué es y cómo lo usan en la oficina

La popularidad de esta técnica ha sido impulsada en redes sociales, donde varios influencers abiertamente cuentan cómo logran efectuarla en sus entornos laborales

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Los fanáticos del erizo azul lograron que se retrasara el lanzamiento de Sonic en 2019 y que el personaje fuera rediseñado, tras la recepción negativa del primer adelanto

Cuánto cuesta ethereum hoy 6 de marzo: la criptomoneda muestra signos de recuperación

Ethereum fue lanzada en 2015 por el programador Vitalik Buterin, con la intención de impulsar una herramienta para aplicaciones descentralizadas y colaborativas

CapCut tiene ahora un doble que estafa: este es el engaño digital para robar todos tus datos y privacidad

En un nuevo fraude, los ciberdelincuentes imitan la popular aplicación, en esta ocasión simulando la versión premium con un sitio falso que esconde un troyano, poniendo en riesgo tu información personal

Bitcoin muestra signos de recuperación: este es su precio hoy 6 de marzo

El bitcoin fue la primera criptomoneda creada en el mundo y ha llegado a un nivel máximo de 68 mil unidades de dólar

Por qué la sensación térmica puede ser tan superior a la temperatura

Generación Z engaña a los jefes con el ‘task masking’: qué es y cómo lo usan en la oficina

Alquileres: cómo son los ajustes de marzo para contratos nuevos y para los que siguen bajo la ley derogada

Habló la esposa del hombre asesinado a golpes por vecinos que lo confundieron con un ladrón: “Lo único que pedimos es Justicia”

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Partidos NBA: todos los enfrentamientos programados de este 6 de marzo

La agenda de la princesa Leonor en Montevideo tras arribar con el buque Elcano: turismo por el centro histórico, visita a la embajada y una ofrenda floral

Alerta por precipitaciones: cuál es la previsión del tiempo para este fin de semana

La Comisión Interamericana de Derechos Humanos instó a Ecuador a proteger a los periodistas

Buscan en Bolivia a la hermana de un presunto socio de Sebastián Marset, desaparecida hace una semana

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Evangelina Anderson volvió a cruzarse con un animal salvaje en su barrio de México: “No lo puedo creer”

Ivana Icardi contó cuándo podrá encontrarse con la China Suárez para conocerla personalmente

El conmovedor video de Maru Botana con su hijo Facundo, que falleció hace 16 años: “Nunca antes pude volver a verlo”

“El Eternauta”: la icónica novela gráfica argentina llega a Netflix con una ambiciosa adaptación audiovisual

El tiempo de respuesta: un factor determinante

Los videojuegos como herramientas de evaluación de IA

Temas Relacionados

ultimas

Generación Z engaña a los jefes con el ‘task masking’: qué es y cómo lo usan en la oficina

La popularidad de esta técnica ha sido impulsada en redes sociales, donde varios influencers abiertamente cuentan cómo logran efectuarla en sus entornos laborales

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Los fanáticos del erizo azul lograron que se retrasara el lanzamiento de Sonic en 2019 y que el personaje fuera rediseñado, tras la recepción negativa del primer adelanto

Cuánto cuesta ethereum hoy 6 de marzo: la criptomoneda muestra signos de recuperación

Ethereum fue lanzada en 2015 por el programador Vitalik Buterin, con la intención de impulsar una herramienta para aplicaciones descentralizadas y colaborativas

CapCut tiene ahora un doble que estafa: este es el engaño digital para robar todos tus datos y privacidad

En un nuevo fraude, los ciberdelincuentes imitan la popular aplicación, en esta ocasión simulando la versión premium con un sitio falso que esconde un troyano, poniendo en riesgo tu información personal

Bitcoin muestra signos de recuperación: este es su precio hoy 6 de marzo

El bitcoin fue la primera criptomoneda creada en el mundo y ha llegado a un nivel máximo de 68 mil unidades de dólar

Por qué la sensación térmica puede ser tan superior a la temperatura

Generación Z engaña a los jefes con el ‘task masking’: qué es y cómo lo usan en la oficina

Alquileres: cómo son los ajustes de marzo para contratos nuevos y para los que siguen bajo la ley derogada

Habló la esposa del hombre asesinado a golpes por vecinos que lo confundieron con un ladrón: “Lo único que pedimos es Justicia”

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Partidos NBA: todos los enfrentamientos programados de este 6 de marzo

La agenda de la princesa Leonor en Montevideo tras arribar con el buque Elcano: turismo por el centro histórico, visita a la embajada y una ofrenda floral

Alerta por precipitaciones: cuál es la previsión del tiempo para este fin de semana

La Comisión Interamericana de Derechos Humanos instó a Ecuador a proteger a los periodistas

Buscan en Bolivia a la hermana de un presunto socio de Sebastián Marset, desaparecida hace una semana

Shrek 5 en polémica como Sonic: la tecnología usada para su animación trajo problemas a DreamWorks

Evangelina Anderson volvió a cruzarse con un animal salvaje en su barrio de México: “No lo puedo creer”

Ivana Icardi contó cuándo podrá encontrarse con la China Suárez para conocerla personalmente

El conmovedor video de Maru Botana con su hijo Facundo, que falleció hace 16 años: “Nunca antes pude volver a verlo”

“El Eternauta”: la icónica novela gráfica argentina llega a Netflix con una ambiciosa adaptación audiovisual