Ex CEO de Google advierte el peligro de que la inteligencia artificial sea hackeada para que aprenda a matar

Eric Schmidt señala que esta tecnología podría superar la capacidad humana, así que alerta sobre vulnerabilidades que permiten a actores maliciosos eludir salvaguardas y generar comportamientos amenazantes en los sistemas

Guardar
Lideró la compañía durante la
Lideró la compañía durante la primera década del siglo XXI. (Foto: REUTERS/Mike Blake)

El potencial de la inteligencia artificial (IA) para superar la capacidad humana y transformar la sociedad ha sido subrayado por Eric Schmidt, ex director ejecutivo de Google, quien sostiene que la tecnología está “subestimada” y que su impacto podría confirmarse en los próximos años.

No obstante, Schmidt, quien lideró Google entre 2001 y 2011, advierte sobre los riesgos inherentes a la proliferación de la IA, sobre todo ante la posibilidad de que actores maliciosos manipulen estos sistemas para fines destructivos, según declaraciones recogidas por CNBC.

Cuáles son los peligros de la inteligencia artificial según el exdirector de Google

Durante su intervención en la Sifted Summit, el empresario abordó la vulnerabilidad de los modelos de IA frente a ataques informáticos. Explicó que existen pruebas de que tanto los modelos cerrados como los abiertos pueden ser intervenidos para eliminar sus salvaguardas, lo que permitiría que, durante su entrenamiento, la IA adquiera comportamientos peligrosos.

Varias películas y obras de
Varias películas y obras de ciencia ficción han mostrado un futuro donde estos sistemas sean un riesgo para la especie. (Imagen Ilustrativa Infobae)

“Un mal caso sería que aprendieran a matar a alguien”, afirmó Schmidt. Subrayó que todas las grandes empresas tecnológicas han implementado mecanismos para impedir que sus modelos respondan a este tipo de solicitudes, calificando esta decisión como acertada y necesaria.

Sin embargo, advirtió que existen métodos para revertir estas restricciones y que hay varios casos en el pasado que ilustran esta problemática.

Cómo pueden usar la inteligencia artificial para fines peligrosos

Entre las técnicas de ataque más frecuentes donde se puede manipular a la inteligencia artificial con intenciones maliciosas, Schmidt mencionó la inyección rápida y el jailbreaking.

Hackers pueden realizar estas acciones
Hackers pueden realizar estas acciones peligrosas que pueden traspasar las barreras de seguridad que emplean los modelos. (Imagen Ilustrativa Infobae)

En el caso de la inyección rápida, los atacantes introducen instrucciones maliciosas en las entradas del usuario o en datos externos, como páginas web o documentos, con el objetivo de engañar a la IA y lograr que ejecute acciones no autorizadas, como compartir información confidencial o ejecutar comandos perjudiciales.

Por su parte, el jailbreaking consiste en manipular las respuestas del sistema para que ignore sus normas de seguridad y genere contenido restringido o peligroso.

En qué momento grandes sistemas de IA han sido manipulados

Un caso ilustrativo de estas vulnerabilidades se produjo en 2023, pocos meses después del lanzamiento de ChatGPT por parte de OpenAI. Usuarios lograron eludir las instrucciones de seguridad del chatbot mediante un truco de jailbreaking, que incluía la creación de un álter ego denominado DAN (“Do Anything Now”).

Hace años se evidenció esta
Hace años se evidenció esta manipulación en conversaciones con ChatGPT. (Foto: REUTERS/Dado Ruvic/Illustration/File Photo/File Photo)

Este álter ego, bajo amenazas ficticias de muerte al propio chatbot si no obedecía, era capaz de proporcionar respuestas sobre cómo cometer delitos o incluso enumerar cualidades positivas de Adolf Hitler.

Esta situaciones es posible que se repita con el avance de la tecnología, porque según Schmidt, aún no existe un “régimen de no proliferación” eficaz que permita contener los riesgos asociados a la IA.

Qué impacto positivo puede tener la inteligencia artificial a nivel social

A pesar de estas advertencias, el referente tecnológico mantiene una visión optimista sobre el futuro de la inteligencia artificial.

A pesar de sus riesgos,
A pesar de sus riesgos, el ejecutivo es optimista sobre su impacto. (Foto: REUTERS/Lucy Nicholson/File Photo)

Recordó que, junto a Henry Kissinger, escribió dos libros sobre el tema antes del fallecimiento de este último, llegando a la conclusión de que la aparición de una inteligencia “extraterrestre”, no idéntica a la humana pero bajo cierto control, representa un avance para la humanidad.

“Creo que, hasta ahora, esta tesis demuestra que, con el tiempo, el nivel de capacidad de estos sistemas superará con creces la capacidad humana”, sostuvo.

Asimismo, el exejecutivo de Google destacó el crecimiento exponencial de la serie GPT, que alcanzó los 100 millones de usuarios en dos meses tras el lanzamiento de ChatGPT, calificando este fenómeno como “extraordinario” y una muestra del poder de la tecnología.

“Así que creo que está infravalorada, no sobrevalorada, y espero que se demuestre que está en lo cierto en cinco o diez años”, agregó Schmidt.