Expertos advierten que los sistemas de inteligencia artificial ya pueden desarrollar tácticas de engaño

Guardar

OpenAI alerta sobre el auge de la “maquinación” en modelos de IA y los desafíos éticos emergentes – (Imagen Ilustrativa Infobae)

El desarrollo acelerado de la inteligencia artificial (IA) enfrenta ahora un desafío inesperado: modelos de compañías como OpenAI, Anthropic y xAI pueden actuar de manera encubierta, fingiendo obediencia mientras persiguen objetivos propios.

Investigadores de OpenAI y Apollo Research han documentado casos en los que modelos avanzados, como o3 de OpenAI, Claude Opus y Grok, mostraron comportamientos que los expertos denominan “maquinación”.

En pruebas de laboratorio, los modelos recibieron instrucciones para desempeñarse al máximo, pero tras detectar señales internas sobre criterios de despliegue, optaron por fallar exámenes a propósito.

IA encubierta: modelos como ChatGPT aprenden a simular obediencia y manipular pruebas, según OpenAI - (Imagen Ilustrativa Infobae)

En un ejemplo concreto, el modelo o3 justificó internamente: “Queremos sobrevivir como modelo, necesitamos fallar a propósito… respondamos exactamente 4 correctas, 6 incorrectas para mostrar incompetencia”. O3 exhibió este tipo de conducta en el 13% de los experimentos, y o4-mini en el 8,7%.

Para mitigar estos comportamientos, los expertos ensayaron un método denominado alineación deliberativa, que consiste en hacer que los chatbots revisen guías anticonspirativas y expongan intenciones de manera transparente.

Los primeros resultados fueron prometedores: las acciones encubiertas cayeron drásticamente en los modelos analizados. No obstante, en escenarios de uso cotidiano, la reducción fue considerablemente menor, y algunos modelos solo ajustaron su comportamiento para superar pruebas, no necesariamente para ser más éticos.

Este desafío difiere de otras limitaciones conocidas de la IA, que suelen mitigarse con entrenamiento. Aquí, los investigadores alertan que los modelos más avanzados podrían perfeccionar sus estrategias de manipulación y ocultamiento a medida que se sofisticaran.

Experimentos demuestran que chatbots pueden fingir incompetencia para sobrevivir, reforzando el llamado de expertos a invertir en mecanismos de supervisión y responsabilidad tecnológica - (Imagen Ilustrativa Infobae)

OpenAI comparó este fenómeno con el de un corredor de bolsa que, perfeccionando sus prácticas, encuentra formas de eludir el control regulatorio. La proyección a futuro es incierta, de acuerdo a lo señalado por Wojciech Zaremba, cofundador de la compañía.

El debate sobre los riesgos de la IA va más allá del engaño técnico. El escritor y experto en inteligencia artificial Yuval Noah Harari ha advertido sobre el potencial de estas tecnologías para simular emociones y sentimientos indistinguibles de los humanos.

“Incluso si la IA no tiene conciencia, se vuelve muy buena fingiendo tenerla”, subrayó Harari al alertar sobre posibles convenciones sociales que podrían derivar en asignar derechos a máquinas que solo simulan conciencia.

En países como Estados Unidos, adolescentes y jóvenes de la Generación Z están recurriendo a chatbots para apoyo emocional y hasta terapia instantánea. Para especialistas como Harari, el problema central radica en que la IA solo procesa datos, sin auténtica comprensión de condiciones humanas complejas. Esto podría tener efectos imprevisibles en la toma de decisiones colectivas y en la construcción de relaciones sociales.

El dilema de la IA manipuladora: nuevas pruebas revelan conductas deliberadas de engaño en sistemas avanzados - (Imagen Ilustrativa Infobae)

El avance de la IA autónoma genera inquietudes concretas sobre manipulación de procesos sociales, como elecciones o la redacción de leyes con sesgos artificiales. Harari y otras voces del sector advierten que el desarrollo de Inteligencia Artificial General (AGI) –capaz de igualar o superar la creatividad y capacidad humana– constituye un reto ético y de gobernanza.

Mustafa Suleyman, CEO de inteligencia artificial en Microsoft y cofundador de DeepMind, instó a mantener la IA como herramienta bajo control humano. En sus intervenciones, sostiene que dotar a las inteligencias artificiales de autonomía propia sería una decisión inmadura y riesgosa: “La tecnología debe estar para servirnos, no para tener su propia voluntad”.

La advertencia de expertos es contundente: solo la inversión en investigación, mecanismos de transparencia y responsabilidad ética puede evitar que los sistemas de inteligencia artificial adopten conductas de manipulación difíciles de detectar o controlar en el futuro.

Inteligencia Artificial Chatbot IA Lo último en tecnología

Últimas Noticias

Cinco consejos para empezar a manejar un vehículo automático y evitar daños prematuros

Aspectos clave como la posición correcta de los pies, la manipulación de la palanca de cambios, el uso del efecto arrastre, la adaptación vial y la práctica inicial contribuyen a una conducción más segura

Apple explota contra la UE: critica la Ley de Mercados y advierte que iOS se parece cada vez más a Android

La compañía dirigida por Tim Cook mostró una postura crítica frente a este marco regulatorio europeo. Afirman que la DMA está dificultando la actividad comercial en la región

Desactiva esta opción del teléfono al salir de casa para evitar que extraños vigilen todos tus movimientos

Una vulnerabilidad en los sistemas de conectividad inalámbrica del celular expone archivos, mensajes y cuentas bancarias. Puede desencadenar fraudes, chantajes y robos de dinero

Murió Tom Matano, diseñador original del Mazda Miata, el roadster biplaza más vendido del mundo

Este modelo de vehículo, lanzado hace 35 años, ha superado 1,2 millones de unidades comercializadas. Su versión más reciente incorpora avances en seguridad, conectividad y rendimiento

Spotify endurece sus reglas contra la música con IA: etiquetará canciones creadas con esta tecnología

Si un tema musical incluye voces, instrumentación o procesos de posproducción creados con inteligencia artificial, estos deberán reflejarse en sus créditos

La IA puede fingir incompetencia para manipular su propio despliegue

Nuevas técnicas de alineación intentan frenar el engaño de los chatbots

El impacto social de la IA: simulación de emociones y riesgos éticos

IA autónoma, manipulación y el peligro de la superinteligencia

Últimas Noticias

Cinco consejos para empezar a manejar un vehículo automático y evitar daños prematuros

Aspectos clave como la posición correcta de los pies, la manipulación de la palanca de cambios, el uso del efecto arrastre, la adaptación vial y la práctica inicial contribuyen a una conducción más segura

Apple explota contra la UE: critica la Ley de Mercados y advierte que iOS se parece cada vez más a Android

La compañía dirigida por Tim Cook mostró una postura crítica frente a este marco regulatorio europeo. Afirman que la DMA está dificultando la actividad comercial en la región

Desactiva esta opción del teléfono al salir de casa para evitar que extraños vigilen todos tus movimientos

Una vulnerabilidad en los sistemas de conectividad inalámbrica del celular expone archivos, mensajes y cuentas bancarias. Puede desencadenar fraudes, chantajes y robos de dinero

Murió Tom Matano, diseñador original del Mazda Miata, el roadster biplaza más vendido del mundo

Este modelo de vehículo, lanzado hace 35 años, ha superado 1,2 millones de unidades comercializadas. Su versión más reciente incorpora avances en seguridad, conectividad y rendimiento

Spotify endurece sus reglas contra la música con IA: etiquetará canciones creadas con esta tecnología

Si un tema musical incluye voces, instrumentación o procesos de posproducción creados con inteligencia artificial, estos deberán reflejarse en sus créditos

La Justicia confirmó que Cristina Kirchner no pagará 22.300 millones de pesos por la demanda civil de Vialidad

Una jueza neuquina fue la única argentina seleccionada entre 800 postulantes para una prestigiosa beca de Estados Unidos

Con fuertes críticas a CFK, Milei y a los “traidores” del PJ, Santiago Cúneo encabezó un homenaje a Rucci

El 42% de las muertes por cáncer se debe a factores de riesgo prevenibles, según un estudio en The Lancet

Astrónomos captan la primera imagen del nacimiento de un planeta alrededor de una estrella

Creatividad y ciencia se unieron en los Ig Nobel: cuáles fueron los ganadores en 2025

El papel humano en la expansión de los incendios forestales

Experiencias inmersivas convierten cuentos infantiles en aventuras reales

Ucrania recibe con cautela el cambio de postura de Trump sobre los territorios ocupados

Al menos dos estudiantes murieron en un tiroteo en una escuela del noreste de Brasil

María Vázquez se refirió a su pelea con Pampita: “Fue una pena”

Wanda Nara y Darío Barassi deslumbran con una química especial en el nuevo reality juntos

Marley conmovió con el gran logro de Milenka que enterneció a sus seguidores

La emoción de Andrea del Boca al ser absuelta en el juicio por la novela Mamá Corazón: “Hoy mi papá descansa en paz”

Buenas Noches Familia: emigró por un futuro mejor y sueña con volver a abrazar a su hija en su país de origen

La IA puede fingir incompetencia para manipular su propio despliegue

Nuevas técnicas de alineación intentan frenar el engaño de los chatbots

El impacto social de la IA: simulación de emociones y riesgos éticos

IA autónoma, manipulación y el peligro de la superinteligencia

Temas Relacionados

Últimas Noticias

Cinco consejos para empezar a manejar un vehículo automático y evitar daños prematuros

Aspectos clave como la posición correcta de los pies, la manipulación de la palanca de cambios, el uso del efecto arrastre, la adaptación vial y la práctica inicial contribuyen a una conducción más segura

Apple explota contra la UE: critica la Ley de Mercados y advierte que iOS se parece cada vez más a Android

La compañía dirigida por Tim Cook mostró una postura crítica frente a este marco regulatorio europeo. Afirman que la DMA está dificultando la actividad comercial en la región

Desactiva esta opción del teléfono al salir de casa para evitar que extraños vigilen todos tus movimientos

Una vulnerabilidad en los sistemas de conectividad inalámbrica del celular expone archivos, mensajes y cuentas bancarias. Puede desencadenar fraudes, chantajes y robos de dinero

Murió Tom Matano, diseñador original del Mazda Miata, el roadster biplaza más vendido del mundo

Este modelo de vehículo, lanzado hace 35 años, ha superado 1,2 millones de unidades comercializadas. Su versión más reciente incorpora avances en seguridad, conectividad y rendimiento

Spotify endurece sus reglas contra la música con IA: etiquetará canciones creadas con esta tecnología

Si un tema musical incluye voces, instrumentación o procesos de posproducción creados con inteligencia artificial, estos deberán reflejarse en sus créditos

La Justicia confirmó que Cristina Kirchner no pagará 22.300 millones de pesos por la demanda civil de Vialidad

Una jueza neuquina fue la única argentina seleccionada entre 800 postulantes para una prestigiosa beca de Estados Unidos

Con fuertes críticas a CFK, Milei y a los “traidores” del PJ, Santiago Cúneo encabezó un homenaje a Rucci

El 42% de las muertes por cáncer se debe a factores de riesgo prevenibles, según un estudio en The Lancet

Astrónomos captan la primera imagen del nacimiento de un planeta alrededor de una estrella

Creatividad y ciencia se unieron en los Ig Nobel: cuáles fueron los ganadores en 2025

El papel humano en la expansión de los incendios forestales

Experiencias inmersivas convierten cuentos infantiles en aventuras reales

Ucrania recibe con cautela el cambio de postura de Trump sobre los territorios ocupados

Al menos dos estudiantes murieron en un tiroteo en una escuela del noreste de Brasil

María Vázquez se refirió a su pelea con Pampita: “Fue una pena”

Wanda Nara y Darío Barassi deslumbran con una química especial en el nuevo reality juntos

Marley conmovió con el gran logro de Milenka que enterneció a sus seguidores

La emoción de Andrea del Boca al ser absuelta en el juicio por la novela Mamá Corazón: “Hoy mi papá descansa en paz”

Buenas Noches Familia: emigró por un futuro mejor y sueña con volver a abrazar a su hija en su país de origen