Por qué fingir ser experto puede hacer fallar a la IA

Guardar

Una mujer guía a un robot humanoide blanco que teclea en un teclado frente a un monitor, con gráficos abstractos y la palabra 'IA' de fondo.

Una investigación confirmó que pedir a la inteligencia artificial adoptar personalidad de experto puede reducir la precisión factual (Imagen Ilustrativa Infobae)

En una evaluación sistemática realizada por la Universidad de California se comprobó que pedirle a un modelo de inteligencia artificial que adopte una personalidad de experto puede deteriorar su rendimiento al recuperar datos fácticos, aunque sí incrementa su confiabilidad al alinearse con reglas de seguridad y preferencia de formato.

El análisis, publicado por el equipo en arXiv, el portal de acceso abierto a investigación científica, y descripto por el medio especializado en tecnología TechXplore, demuestra que la eficacia de los mensajes de persona (“persona prompting”) depende estrictamente de la naturaleza de la tarea solicitada.

Durante los experimentos, los investigadores sometieron a seis modelos diferentes de lenguaje grande a pruebas con 12 tipos de personalidad, que incluían especialistas en áreas como matemáticas, codificación, ciencias y humanidades, así como roles conductuales, por ejemplo, críticos o supervisores de seguridad.

Un dato central del estudio revela que la precisión de los modelos en tareas discriminativas, como preguntas de opción múltiple sobre información memorizada, desciende de 71,6 % a 68,0 % cuando se añade el prefijo de personalidad experta.

Este hallazgo tiene consecuencias inmediatas para el diseño de sistemas conversacionales en inteligencia artificial: pedirle al modelo que actúe desde la voz de un experto mejora las tareas centradas en formato, creatividad o seguridad (como redactar con cierto tono, estructurar información o rechazar peticiones peligrosas), pero afecta negativamente tareas como razonamiento lógico puro, solución de problemas matemáticos y recuperación exacta de hechos.

Las personalidades expertas mejoran la seguridad y la adaptación a formato en los sistemas de inteligencia artificial, según pruebas de redacción y roles (Imagen Ilustrativa Infobae)

Las personalidades expertas fomentan la seguridad pero afectan el recuerdo factual

La investigación observó que la explicación principal de este fenómeno reside en el modo de funcionamiento de los modelos: cuando asumen una personalidad, los LLM (modelos de lenguaje grande) priorizan seguir instrucciones sobre activar su memoria independiente, lo que interfiere en la precisión fáctica.

Por ejemplo, en la prueba MT-Bench utilizada para evaluar adaptación al formato y la calidad generativa, las personalidades expertas elevaron los puntajes en categorías como redacción (+0,40), representación de roles (+0,40), razonamiento (+0,40), extracción (+0,65) y STEM (+0,60). El beneficio fue mayor cuando la descripción de la personalidad era más extensa, según reporta el portal.

En contraste, las mismas personalidades provocaron caídas de rendimiento en preguntas de humanidades (−0,20), matemáticas (−0,10) y codificación (−0,65), todas ellas disciplinas en las que el éxito depende de la recuperación precisa de información previa y del razonamiento lógico, no de la adaptación a preferencias de usuario o formato.

El efecto es igualmente notable en pruebas de seguridad. La introducción de la personalidad “Monitor de seguridad” mejoró la capacidad del modelo para rechazar intentos de vulnerar los límites en la prueba JailbreakBench, donde la tasa de negativa aumentó en 17,7 puntos porcentuales, del 53,2 % al 70,9 %.

El rendimiento de los modelos de IA cayó en disciplinas como matemáticas, humanidades y codificación cuando actuaron bajo personalidades especializada (Imagen Ilustrativa Infobae)

PRISM: un sistema automatizado que ajusta la personalidad del modelo según la tarea

Con el objetivo de resolver este dilema, el equipo de la Universidad de California implementó un método denominado PRISM (Persona Routing via Intent-based Self-Modeling), que dota al modelo de un mecanismo para decidir cuándo debe responder como “experto” y cuándo conviene recurrir a su conocimiento general.

Según el artículo original, PRISM genera simultáneamente una respuesta estándar y una desde la personalidad solicitada, y elige después la más adecuada en función de la tarea. La particularidad técnica consiste en que, si una respuesta “no-personal” es más precisa, la información aprendida mediante la personalidad experta se conserva en un componente llamado LoRA adapter, lo que permite reutilizar el razonamiento de experto si resulta útil en futuras consultas.

Esta estrategia tiene un efecto cuantificable: PRISM elevó en uno a dos puntos los puntajes generales de los modelos evaluados en MT-Bench, la prueba orientada a medir la capacidad de seguir instrucciones y mantener un tono útil en la interacción con el usuario.

En una síntesis destacada de su documento en arXiv, los investigadores afirman: “PRISM mejora la alineación a preferencias y seguridad en tareas generativas, mientras preserva la exactitud en tareas discriminativas en todos los LLM evaluados, lo que constituye una prueba de nuestros hallazgos.”

Esta metodología se probó con 12 personalidades, lo que permitió abaracar campos como medicina y derecho. Los resultados subrayan que contribuyen a la adaptación y seguridad, pero deben evitarse en encomiendas basadas en la recuperación de datos o el razonamiento autónomo.

El equipo de la Universidad de California anunció la continuidad de las pruebas con PRISM, con el objetivo de ampliar las personalidades y afinar su capacidad para detectar la intención del usuario.

Últimas Noticias

Netflix hará una transmisión especial hoy por Las Guerreras K-pop: dónde y a qué horas verla

La transmisión incluirá escenas inéditas, entrevistas con los actores que prestaron sus voces así como la visualización de la película en diferentes idiomas

Criptomonedas: cuál es su precio en el mercado este sábado 20 de junio

El bitcoin, una de las principales monedas digitales registró un cambio de 0,273% en las últimas 24 horas

Crean escáner ultrasónico con IA que ve órganos, músculos y huesos en 60 segundos

Uno de los objetivos de este dispositivo, según la empresa Midjourney, es ver cómo reacciona el cuerpo humano ante diferentes tipos de dieta y ejercicios

Por qué fingir ser experto puede hacer fallar a la IA

Una investigación realizada por la Universidad de California reveló que asignar roles sofisticados no siempre perfecciona la información y planteó una alternativa inteligente para decidir cuándo usarlos

Las personalidades expertas fomentan la seguridad pero afectan el recuerdo factual

PRISM: un sistema automatizado que ajusta la personalidad del modelo según la tarea

Últimas Noticias

Netflix hará una transmisión especial hoy por Las Guerreras K-pop: dónde y a qué horas verla

La transmisión incluirá escenas inéditas, entrevistas con los actores que prestaron sus voces así como la visualización de la película en diferentes idiomas

Criptomonedas: cuál es su precio en el mercado este sábado 20 de junio

El bitcoin, una de las principales monedas digitales registró un cambio de 0,273% en las últimas 24 horas

Crean escáner ultrasónico con IA que ve órganos, músculos y huesos en 60 segundos

Uno de los objetivos de este dispositivo, según la empresa Midjourney, es ver cómo reacciona el cuerpo humano ante diferentes tipos de dieta y ejercicios

Epic Games Store se renueva: nuevas funciones y un rediseño para competir con Steam

Notificaciones menos intrusivas y regalos entre regiones amplían las opciones para los usuarios

El fallo de seguridad de iPhones antiguos que solo se resuelve cambiando de dispositivo

El problema reside en SecureROM, un código inalterable incrustado en los chips afectados

ÚLTIMAS NOTICIAS

Cierran la Autopista Dellepiane por obras durante todo el fin de semana: cómo serán los desvíos

Una nena murió y tres personas resultaron heridas tras un violento choque en la autopista Panamericana

A un día de la llegada del invierno, rigen alertas por nevada y viento en seis provincias

Primer juicio por jurados en Rosario: condenaron a prisión perpetua a un Aníbal Cabaña por el crimen de su exesposa y su pareja

Dejan firme la condena a 13 años a una policía que mató a su media hermana tras una discusión

INFOBAE AMÉRICA

Que todo sea para bien

El ejército israelí denunció que Hezbollah lanzó más de 50 proyectiles a sus fuerzas en el sur de Líbano pese al alto al fuego

Un enviado de Pakistán viaja a Irán para impulsar las negociaciones entre Washington y Teherán tras la cumbre cancelada

Bloqueos en Bolivia: por qué paralizar las carreteras es una herramienta de presión política

El Supremo de Brasil dio luz verde a la policía brasileña para interrogar a Jair Bolsonaro por un pistola confiscada

TELESHOW

David Lebón y Pedro Aznar desbordaron de emoción la primera noche del regreso de Serú Girán

Daniel Melingo: “Digamos que soy una suerte de Charlie Chaplin que canta tangos”

Anita Martínez interpreta a Ana Laura Merello: “Tita con su fuerza pudo hacerse de una vida”

Hernán Arbuco de La Champions Liga: “Arranqué con el éxito y después quedé solo con mi tristeza”

Pampita recordó cómo inició su relación con Martín Pepa: “El más lindo de todos”

Las personalidades expertas fomentan la seguridad pero afectan el recuerdo factual

PRISM: un sistema automatizado que ajusta la personalidad del modelo según la tarea

Temas Relacionados

Últimas Noticias

Netflix hará una transmisión especial hoy por Las Guerreras K-pop: dónde y a qué horas verla

La transmisión incluirá escenas inéditas, entrevistas con los actores que prestaron sus voces así como la visualización de la película en diferentes idiomas

Criptomonedas: cuál es su precio en el mercado este sábado 20 de junio

El bitcoin, una de las principales monedas digitales registró un cambio de 0,273% en las últimas 24 horas

Crean escáner ultrasónico con IA que ve órganos, músculos y huesos en 60 segundos

Uno de los objetivos de este dispositivo, según la empresa Midjourney, es ver cómo reacciona el cuerpo humano ante diferentes tipos de dieta y ejercicios

Epic Games Store se renueva: nuevas funciones y un rediseño para competir con Steam

Notificaciones menos intrusivas y regalos entre regiones amplían las opciones para los usuarios

El fallo de seguridad de iPhones antiguos que solo se resuelve cambiando de dispositivo

El problema reside en SecureROM, un código inalterable incrustado en los chips afectados

ÚLTIMAS NOTICIAS

Cierran la Autopista Dellepiane por obras durante todo el fin de semana: cómo serán los desvíos

Una nena murió y tres personas resultaron heridas tras un violento choque en la autopista Panamericana

A un día de la llegada del invierno, rigen alertas por nevada y viento en seis provincias

Primer juicio por jurados en Rosario: condenaron a prisión perpetua a un Aníbal Cabaña por el crimen de su exesposa y su pareja

Dejan firme la condena a 13 años a una policía que mató a su media hermana tras una discusión

INFOBAE AMÉRICA

Que todo sea para bien

El ejército israelí denunció que Hezbollah lanzó más de 50 proyectiles a sus fuerzas en el sur de Líbano pese al alto al fuego

Un enviado de Pakistán viaja a Irán para impulsar las negociaciones entre Washington y Teherán tras la cumbre cancelada

Bloqueos en Bolivia: por qué paralizar las carreteras es una herramienta de presión política

El Supremo de Brasil dio luz verde a la policía brasileña para interrogar a Jair Bolsonaro por un pistola confiscada

TELESHOW

David Lebón y Pedro Aznar desbordaron de emoción la primera noche del regreso de Serú Girán

Daniel Melingo: “Digamos que soy una suerte de Charlie Chaplin que canta tangos”

Anita Martínez interpreta a Ana Laura Merello: “Tita con su fuerza pudo hacerse de una vida”

Hernán Arbuco de La Champions Liga: “Arranqué con el éxito y después quedé solo con mi tristeza”

Pampita recordó cómo inició su relación con Martín Pepa: “El más lindo de todos”