Gemini y ChatGPT vencen a humanos y ganan medallas de oro en la Olimpiada Internacional de Matemáticas

Gemini Deep Think y un modelo experimental de OpenAI resolvieron cinco de seis problemas y se posicionaron entre el 10% más destacado del certamen

Guardar
Gemini de Google y ChatGPT
Gemini de Google y ChatGPT de OpenAI, ambas inteligencias artificiales, compitieron en las Olimpiadas Internacionales de Matemáticas. (Composición)

En un hecho sin precedentes, las inteligencias artificiales desarrolladas por Google DeepMind y OpenAI lograron lo que hasta hace poco era exclusivo del talento humano: ganar una medalla de oro en la Olimpiada Internacional de Matemáticas (OIM). Ambas IA se posicionaron entre el 10% más destacado de los 630 participantes humanos al resolver cinco de los seis problemas propuestos.

Gemini Deep Think, de Google, y un modelo experimental de OpenAI, creador de ChatGPT, obtuvieron 35 de los 42 puntos posibles en esta exigente competencia global. La OIM es considerada uno de los desafíos académicos más complejos para estudiantes de secundaria en el mundo, y por primera vez, modelos de lenguaje lograron sobresalir bajo las mismas condiciones de evaluación que los humanos.

Este logro marca un nuevo hito en el desarrollo de IA especializada en razonamiento matemático avanzado. Aunque las máquinas ya habían demostrado capacidades impresionantes en tareas de cálculo, lenguaje y programación, competir y triunfar en este nivel de pensamiento abstracto representa un salto significativo en la evolución de la inteligencia artificial.

Inteligencias artificiales superaron a humanos
Inteligencias artificiales superaron a humanos en las Olimpiadas Internacionales de Matemáticas. (Imagen ilustrativa Infobae)

Cómo participaron las IA en la competencia matemática más exigente del mundo

Las reglas fueron claras: dos jornadas de exámenes, cada una con tres problemas de dificultad creciente y con un tiempo límite de 4 horas y media por sesión. Las inteligencias artificiales no tuvieron acceso a internet, ni a asistentes externos, y debieron redactar sus demostraciones en lenguaje natural, tal como los demás concursantes.

Gemini operó en su modalidad “Deep Think”, una arquitectura diseñada para explorar múltiples caminos de razonamiento en paralelo antes de seleccionar la solución más prometedora. Esta capacidad permitió que resolviera cinco de los seis problemas en el mismo tiempo que se le otorgó a los competidores humanos, algo que modelos previos como AlphaGeometry o AlphaProof no lograron en su momento.

Por su parte, el modelo de OpenAI —aún sin nombre comercial— también resolvió cinco problemas y obtuvo una calificación equivalente, aunque su evaluación fue llevada a cabo por tres ex-medallistas de la OIM convocados por la propia empresa, en lugar del jurado oficial del evento.

Google y OpenAI destacan con
Google y OpenAI destacan con sus IA en campeonato mundial de matemáticas. - (Imagen Ilustrativa Infobae)

Gemini y OpenAI alcanzan el rendimiento de los mejores talentos juveniles

De los 630 jóvenes participantes, solo 67 lograron alcanzar la medalla de oro, lo que representa aproximadamente el 10% del total. Los modelos de Gemini y OpenAI, con sus 35 puntos, se posicionaron dentro de ese grupo de élite.

Gregor Dolinar, presidente de la Olimpiada Internacional de Matemáticas, confirmó el rendimiento del modelo de Google con palabras contundentes: “Sus soluciones fueron asombrosas, claras y, en la mayoría de los casos, fáciles de seguir”.

Esta evaluación no solo destaca la precisión del razonamiento matemático, sino también la calidad en la comunicación de las soluciones, un aspecto clave en la competencia. La capacidad de escribir demostraciones comprensibles y coherentes es parte esencial del examen, lo que exige no solo cálculo, sino pensamiento lógico profundo.

La IA de Google y
La IA de Google y OpenAI competieron en Olimpiadas Internacionales de Matemáticas. - (Imagen Ilustrativa Infobae)

OpenAI: avances experimentales y próximos pasos

Aunque el modelo de OpenAI sigue en fase experimental, la empresa ha adelantado que el sucesor de GPT-4, conocido como GPT-5, llegará pronto. Alexander Wei, investigador de la compañía, recordó en su cuenta de X que la OIM “es una de las pruebas matemáticas más prestigiosas del mundo” y un reto de larga data para el desarrollo de IA general.

“La competencia exige pensamiento creativo sostenido, y nuestras máquinas tuvieron que construir argumentos sólidos y complejos, al nivel de los matemáticos humanos”, explicó Wei.

Este tipo de logros podría anticipar nuevas aplicaciones para la inteligencia artificial en áreas como la investigación científica, la educación avanzada, o incluso el desarrollo de teorías matemáticas originales en el futuro.