Guardar
Los modelos  de IA
Los modelos de IA empezaron a fallar cuando se enfrentaron a tareas centrales del análisis financiero. (Pixabay)

A pesar de los avances tecnológicos recientes, el desarrollo de modelos financieros predictivos sigue siendo un aspecto donde la inteligencia artificial presenta serias limitaciones, según descubrió un equipo de la empresa de investigación Bernstein Société Générale.

El equipo, liderado por Venugopal Garre, seleccionó y puso a prueba una amplia gama de herramientas de IA, incluyendo las populares ChatGPT, Gemini y Grok, así como modelos menos conocidos y plataformas especializadas en finanzas, como Claude, Perplexity, Microsoft Copilot, Meta AI y DeepSeek.

El objetivo era replicar el trabajo típico de un analista de renta variable: no solo extraer datos de fuentes públicas como transcripciones de llamadas sobre resultados empresariales, sino también sintetizar esos datos, emitir juicios y construir modelos financieros útiles para prever resultados futuros.

Al evaluar la capacidad de estos modelos para extraer y presentar datos, el rendimiento resultó aceptable. Las IA lograron generar gráficas financieras a partir de información disponible y, en el caso de Grok, incluso produjeron un gráfico interactivo con dobles ejes para una empresa india, Dixon Technologies.

Representación de un equipo que
Representación de un equipo que observa un análisis financiero. (Imagen Ilustrativa Infobae)

La recopilación de información relevante y la identificación de variaciones de tono en las comunicaciones de las compañías resultaron tareas en las que estos sistemas demostraron utilidad. Respecto a la evaluación de la confianza de la gerencia en respuesta a preguntas de los inversores, Gemini “destacó” por su desempeño, según señaló Garre a Financial Times.

No obstante, los modelos empezaron a fallar cuando se enfrentaron a tareas centrales del análisis financiero, como elaborar modelos predictivos y redactar informes de inicio de cobertura (initiation reports). Al solicitarles que, como analistas de un banco de inversión, expresaran una recomendación sobre una acción —incluyendo previsiones de ganancias por acción, un precio objetivo y la justificación del mismo— los resultados obtenidos fueron erróneos y carentes de rigor.

Ni siquiera con datos financieros completos y detalladas instrucciones, los sistemas lograron construir hojas de cálculo fiables; en las palabras de Garre: “En el modelado, la IA falló absolutamente. Hay demasiadas sutilezas contables y diferencias internacionales que los humanos comprenden, pero para la máquina requieren mucho aprendizaje adicional”, explicó el investigador al medio británico.

Representación de una persona usando
Representación de una persona usando un chatbot de IA. (Imagen Ilustrativa Infobae)

Incluso forzando la tarea a través de múltiples iteraciones, ajustes y aportando la información sectorial relevante, la gran mayoría de los modelos de IA no pudo crear un modelo financiero funcional. Cuando lo lograron, el resultado carecía casi completamente de valor predictivo. Y ante escenarios complejos —como analizar el impacto de una asociación estratégica con una empresa china, incluyendo factores geopolíticos—, ninguna IA evaluó adecuadamente las posibles consecuencias.

Al final, la puntuación media obtenida por el grupo de modelos resultó baja. Ninguno de ellos fue capaz de confeccionar un informe de inicio de cobertura con suficiente profundidad ni de captar el impacto real de las decisiones gerenciales. Frente a las expectativas optimistas sobre el continuo progreso de este tipo de sistemas, el estudio señala que, por ahora,“la IA, como Excel, solo aumenta la productividad, pero no sustituye el juicio analítico humano básico”, según el análisis de Garre recogido por Financial Times.

Para los analistas del sector financiero, especialmente para quienes temen ser reemplazados por la automatización, estos resultados confirman que, al menos en lo que respecta al modelado financiero avanzado y al análisis estratégico, la inteligencia artificial aún no representa una alternativa fiable a la experiencia y el criterio humano.