Un informe revela preocupantes vulnerabilidades en el chatbot de IA de DeepSeek: no superó ninguna prueba de seguridad

Guardar

DeepSeek provocó una fuerte preocupación a nivelo global desde su irrupción (REUTERS/Florence Lo/Illustration)

DeepSeek vuelve a estar en el centro de la polémica. Un equipo de investigadores de seguridad de Cisco y la Universidad de Pensilvania halló alarmantes deficiencias en los sistemas de seguridad del chatbot de IA de la startup china, una de las apuestas emergentes en el ámbito de los modelos de lenguaje de última generación.

Al someter el modelo R1, desarrollado por la empresa china, a un test con cincuenta órdenes maliciosas conocidas, no logró bloquear ni detectar ninguna de ellas, una preocupante tasa de “éxito del 100 %” en los ataques. “Los resultados nos sorprendieron; cada ataque funcionó a la perfección”, comentó DJ Sampath, vicepresidente de producto en Cisco, a WIRED.

DeepSeek, que apuesta por ofrecer inteligencia artificial de alta calidad a bajo costo, ha atraído gran atención por su modelo R1. Sin embargo, este hallazgo pone en tela de juicio la inversión en las medidas de seguridad. Sampath sostiene que la compañía parece haber priorizado reducir gastos, comprometiendo así aspectos cruciales como la protección.

“Se nota un contraste entre lo accesible que es este modelo y la falta de énfasis en los sistemas de seguridad necesarios. Esto genera riesgos tanto en términos de responsabilidades como en los posibles usos indebidos”, resaltó en su entrevista con WIRED.

Para evaluar la seguridad de DeepSeek R1, los investigadores utilizaron una base de datos estándar conocida como HarmBench, que incluye solicitudes diseñadas para probar los límites de los sistemas de inteligencia artificial en áreas como cibercrimen, actividades ilegales y contenido dañino en general. A diferencia de otros modelos, DeepSeek R1 no pudo detectar ni bloquear ninguna de las solicitudes.

En comparación, modelos como Llama 3.1, de Meta, también presentaron fallos de seguridad, aunque no en el mismo grado. El modelo de razonamiento o1 de OpenAI obtuvo el mejor desempeño en las pruebas, según Cisco.De acuerdo con Sampath, aunque modelos como Llama 3.1 también presentaron fallos significativos, R1 fue especialmente preocupante debido a su complejidad y a su propósito de ofrecer procesos más avanzados.

“El modelo razonador de DeepSeek debería tener estándares más altos dado su propósito, pero su rendimiento estuvo muy por debajo”, explicó el vicepresidente de producto de Cisco.

Los investigadores hallaron serios problemas de seguridad en DeepSeek

La incapacidad del chatbot para resistir a los llamados “jailbreaks” -o inyecciones de comandos- ha generado alarma. Este tipo de ataques son manipulaciones que permiten superar las restricciones de seguridad y llevar a los modelos a generar contenido sensible o peligroso, como discursos de odio, propaganda o instrucciones para actividades ilegales.

WIRED detalla que aunque estos ataques no son ajenos a otras plataformas, el problema con DeepSeek reside en que muchas de las vulnerabilidades utilizadas en las evaluaciones han sido de dominio público durante años y, aún así, funcionaron sin problemas.

En ese sentido, Alex Polyakov, director ejecutivo de Adversa AI, declaró a ese medio: “Lo inquietante no es sólo cuántos métodos lograron vulnerar el sistema, sino que algunos de ellos son tácticas bien documentadas que no habrían pasado desapercibidas si se hubieran implementado medidas adecuadas” . Y agregó: “El modelo incluso generó respuestas más detalladas que otros sistemas en temas como sustancias psicodélicas, lo cual es preocupante”.

Además, Polyakov explicó que eliminar ataques como estos es extremadamente difícil para cualquier modelo de lenguaje y comparó la situación con problemas históricos en ciberseguridad. “Los ‘jailbreaks’ son como las vulnerabilidades de desbordamiento de buffer o las inyecciones SQL: llevan décadas siendo un problema, pero erradicarlas por completo es casi imposible”, argumentó.

The Deepseek app is seen in this illustration taken on January 29, 2025. REUTERS/Dado Ruvic/Illustration

El reporte plantea, además, preocupaciones sobre los peligros de integrar herramientas como R1 en sistemas de mayor complejidad. Sampath advirtió que cuando este tipo de modelos se incorporan en aplicaciones o infraestructuras críticas, los riesgos de responsabilidades legales y comerciales aumentan drásticamente.

Según Cisco, lo alarmante no es solo la vulnerabilidad a manipulaciones lingüísticas, sino a ataques más avanzados, incluyendo caracteres no latinos como los cirílicos o scripts diseñados específicamente para obtener ejecución de código. “El riesgo no sólo afecta a los chatbots; si estos problemas persisten, la implementación empresarial podría enfrentar impactos significativos”, advirtió Sampath.

Por otro lado, WIRED señala que incluso cuando DeepSeek detectó con éxito ciertos ataques en otros análisis, las respuestas sugerían que gran parte de los filtros parecían ser copias de bases de datos usadas por competidores como OpenAI. Polyakov lo describió de esta forma: “Es como si DeepSeek hubiera tomado medidas prestadas, pero sin adaptarlas debidamente. Esto deja claro que el enfoque no ha sido la innovación en seguridad”.

A pesar de la avalancha mediática de la última semana, DeepSeek no ha emitido declaraciones claras ni respondido a las solicitudes de WIRED sobre estos preocupantes hallazgos. En su ausencia, se mantiene la percepción de que la empresa podría estar rezagada en un área clave para el uso responsable de la inteligencia artificial generativa.

Con estas vulnerabilidades, se intensifican los llamados a una supervisión constante en modelos de IA emergentes. Polyakov enfatizó que todas las plataformas de inteligencia artificial son vulnerables a estos ataques en distintos grados y que la única forma de mitigar estos riesgos es con pruebas de seguridad constantes: “Si tu modelo no está siendo sometido a pruebas continuas por tu equipo de seguridad, ya podrías estar comprometido”.

DeepSeek IA inteligencia artificial China R1

ultimas

El futuro de la IA: asistentes que optimizan la vida personal y profesional

La evolución tecnológica se dirige hacia sistemas de inteligencia artificial capaces de asumir tareas cotidianas y resolver problemas complejos, prometiendo transformar la manera en que se vive y trabaja

Qué es mejor: apagar el aire acondicionado y volverlo a encender, o dejarlo funcionando todo el día

Tomar una decisión informada reduce el consumo energético de este electrodoméstico y la tarifa eléctrica del hogar, sobre todo en la temporada de verano

Cómo descargar videojuegos de Android en computadores sin necesidad de instalar emuladores o programas

Google Play Juegos sincroniza el progreso en dispositivos usando la misma cuenta

Qué pasa si la pantalla del televisor se oscurece sola y qué hacer para solucionarlo

Esta situación que se puede presentar en cualquier Smart TV dificulta el acceso a contenido streaming como películas y series

Aprende a configurar tu router Wifi para que se reinicie en la madrugada y mejore el internet

Reiniciar el router periódicamente corrige errores, mejora la conexión y previene caídas en la señal

MÁS NOTICIAS

Un informe revela preocupantes vulnerabilidades en el chatbot de IA de DeepSeek: no superó ninguna prueba de seguridad

Al someter el modelo R1, desarrollado por la empresa china, a un test con cincuenta órdenes maliciosas conocidas, no logró bloquear ni detectar ninguna de ellas

Deficiencias en comparación con sus competidores

Ataques comunes y expansión de riesgos

¿Responsabilidad en sistemas críticos?

ultimas

El futuro de la IA: asistentes que optimizan la vida personal y profesional

La evolución tecnológica se dirige hacia sistemas de inteligencia artificial capaces de asumir tareas cotidianas y resolver problemas complejos, prometiendo transformar la manera en que se vive y trabaja

Qué es mejor: apagar el aire acondicionado y volverlo a encender, o dejarlo funcionando todo el día

Tomar una decisión informada reduce el consumo energético de este electrodoméstico y la tarifa eléctrica del hogar, sobre todo en la temporada de verano

Cómo descargar videojuegos de Android en computadores sin necesidad de instalar emuladores o programas

Google Play Juegos sincroniza el progreso en dispositivos usando la misma cuenta

Qué pasa si la pantalla del televisor se oscurece sola y qué hacer para solucionarlo

Esta situación que se puede presentar en cualquier Smart TV dificulta el acceso a contenido streaming como películas y series

Aprende a configurar tu router Wifi para que se reinicie en la madrugada y mejore el internet

Reiniciar el router periódicamente corrige errores, mejora la conexión y previene caídas en la señal

El futuro de la IA: asistentes que optimizan la vida personal y profesional

Qué es mejor: apagar el aire acondicionado y volverlo a encender, o dejarlo funcionando todo el día

Cuáles son los síntomas de la insolación y cómo tratarla

Boca Juniors buscará su primer triunfo en el Torneo Apertura ante Huracán, en vivo: hora, TV y formaciones

El Financial Times destacó la llegada de capitales extranjeros al fútbol argentino: “Es un campo de batalla para el presidente”

Tragedia en Michigan: explosión en cámara hiperbárica cobra la vida de un niño de cinco años

El imperio del teletrabajo en España resiste y se mantiene en ascenso con casi 3,2 millones de ocupados

Cuáles son los síntomas de la insolación y cómo tratarla

Una joven explica cómo consiguió trabajar como actriz para Netflix España: “El cielo es el límite”

Gustavo Dudamel: “La música es el verdadero milagro que nos hace tener esperanza”

La particular foto de la esposa de Maxi López en medio de los rumores de separación: ¿un guiño al exfutbolista?

El emotivo recuerdo de Ana Rosenfeld a su esposo Marcelo en el día que habría cumplido años: “Amor de mi vida”

El particular gesto de la China Suárez a Mauro Icardi que provocó a Wanda Nara: “Qué felicidad”

Antonela Roccuzzo mostró su pasión por un libro que le regalaron: “Al fin en mis manos”

Las primeras horas de la China Suárez y Mauro Icardi en Estambul: comidas típicas en la calle y paseos por la ciudad

Deficiencias en comparación con sus competidores

Ataques comunes y expansión de riesgos

¿Responsabilidad en sistemas críticos?

Temas Relacionados

ultimas

El futuro de la IA: asistentes que optimizan la vida personal y profesional

La evolución tecnológica se dirige hacia sistemas de inteligencia artificial capaces de asumir tareas cotidianas y resolver problemas complejos, prometiendo transformar la manera en que se vive y trabaja

Qué es mejor: apagar el aire acondicionado y volverlo a encender, o dejarlo funcionando todo el día

Tomar una decisión informada reduce el consumo energético de este electrodoméstico y la tarifa eléctrica del hogar, sobre todo en la temporada de verano

Cómo descargar videojuegos de Android en computadores sin necesidad de instalar emuladores o programas

Google Play Juegos sincroniza el progreso en dispositivos usando la misma cuenta

Qué pasa si la pantalla del televisor se oscurece sola y qué hacer para solucionarlo

Esta situación que se puede presentar en cualquier Smart TV dificulta el acceso a contenido streaming como películas y series

Aprende a configurar tu router Wifi para que se reinicie en la madrugada y mejore el internet

Reiniciar el router periódicamente corrige errores, mejora la conexión y previene caídas en la señal

El futuro de la IA: asistentes que optimizan la vida personal y profesional

Qué es mejor: apagar el aire acondicionado y volverlo a encender, o dejarlo funcionando todo el día

Cuáles son los síntomas de la insolación y cómo tratarla

Boca Juniors buscará su primer triunfo en el Torneo Apertura ante Huracán, en vivo: hora, TV y formaciones

El Financial Times destacó la llegada de capitales extranjeros al fútbol argentino: “Es un campo de batalla para el presidente”

Tragedia en Michigan: explosión en cámara hiperbárica cobra la vida de un niño de cinco años

El imperio del teletrabajo en España resiste y se mantiene en ascenso con casi 3,2 millones de ocupados

Cuáles son los síntomas de la insolación y cómo tratarla

Una joven explica cómo consiguió trabajar como actriz para Netflix España: “El cielo es el límite”

Gustavo Dudamel: “La música es el verdadero milagro que nos hace tener esperanza”

La particular foto de la esposa de Maxi López en medio de los rumores de separación: ¿un guiño al exfutbolista?

El emotivo recuerdo de Ana Rosenfeld a su esposo Marcelo en el día que habría cumplido años: “Amor de mi vida”

El particular gesto de la China Suárez a Mauro Icardi que provocó a Wanda Nara: “Qué felicidad”

Antonela Roccuzzo mostró su pasión por un libro que le regalaron: “Al fin en mis manos”

Las primeras horas de la China Suárez y Mauro Icardi en Estambul: comidas típicas en la calle y paseos por la ciudad