La IA en la medicina, entre avances y límites: desafíos en los diagnósticos clínicos

Un estudio plantea preguntas sobre la capacidad de los modelos tecnológicos para replicar la complejidad de las interacciones médico-paciente, informa New Scientist

Guardar
La IA se presenta como
La IA se presenta como una herramienta clave en la medicina moderna, pero con limitaciones críticas (Imagen Ilustrativa Infobae)

En la última década, la inteligencia artificial (IA) irrumpió como una herramienta prometedora para la medicina. Desde la identificación de patrones complejos en imágenes médicas hasta el análisis de datos genómicos, estos sistemas mostraron un potencial revolucionario.

Sin embargo, su integración en el ejercicio clínico enfrenta limitaciones críticas, especialmente en el contexto de la interacción con pacientes, una de las habilidades más fundamentales de los médicos.

Un estudio reciente, revelado por investigadores de la Universidad de Harvard publicado en New Scientist, destaca que, aunque modelos avanzados como GPT-4 de OpenAI obtienen resultados impresionantes en pruebas de opción múltiple, sus capacidades se desploman en entornos más realistas donde deben interactuar con pacientes para recopilar información y emitir diagnósticos.

Los límites del razonamiento diagnóstico en la IA

Pranav Rajpurkar, uno de los autores principales del estudio, señaló que los modelos de IA enfrentan grandes desafíos en el razonamiento diagnóstico abierto, una habilidad clave en la medicina.

“Aunque los modelos de lenguaje de gran tamaño son muy eficaces en pruebas estandarizadas, su precisión se reduce significativamente en conversaciones dinámicas con pacientes”, explicó Rajpurkar.

Para explorar esta brecha, los investigadores desarrollaron un método innovador para evaluar la capacidad de razonamiento clínico de los modelos de IA.

Este nuevo estándar, denominado CRAFT-MD, utiliza simulaciones que reflejan situaciones reales en las que los pacientes no siempre saben qué detalles mencionar y revelan información relevante solo cuando son guiados por preguntas específicas.

La precisión de la IA
La precisión de la IA disminuye en conversaciones dinámicas con pacientes

Cómo funciona CRAFT-MD

El estándar CRAFT-MD basa sus evaluaciones en 2.000 casos médicos, en su mayoría extraídos de exámenes de certificación profesional en Estados Unidos. En las simulaciones, GPT-4 actuó como un paciente virtual en conversaciones con modelos clínicos, proporcionando respuestas basadas en datos reales.

Además, GPT-4 ayudó a calificar los diagnósticos emitidos por las IA clínicas, comparándolos con las respuestas correctas. Expertos humanos supervisaron el proceso para verificar la calidad de las interacciones y la precisión de los diagnósticos.

Resultados: el desafío de las conversaciones simuladas

Los resultados mostraron una discrepancia significativa entre el desempeño de los modelos en exámenes estandarizados y en conversaciones simuladas.

GPT-4, por ejemplo, logró una precisión del 82 % al diagnosticar a partir de resúmenes estructurados y opciones múltiples, pero esta cifra se desplomó al 26 % cuando se enfrentó a conversaciones clínicas simuladas.

Otros modelos, como GPT-3.5 (OpenAI), Llama-2-7b (Meta) y Mistral-v2-7b (Mistral AI), mostraron un rendimiento aún más bajo, con Llama generalmente obteniendo las puntuaciones más bajas. Incluso en los casos donde las IA lograron recopilar información médica relevante, muchas veces no pudieron emitir diagnósticos acertados.

Más allá de las pruebas

Para expertos como Eric Topol, del Instituto de Investigación Traslacional Scripps, este tipo de evaluación representa un cambio significativo.

“Evaluar la capacidad de razonamiento clínico de una IA a través de conversaciones es mucho más útil que los exámenes de opción múltiple, ya que estos no reflejan las complejidades del mundo real”, señaló Topol.

La interacción entre médico y
La interacción entre médico y paciente incluye factores difíciles de emular por sistemas de inteligencia artificial (Imagen Ilustrativa Infobae)

En situaciones reales, los médicos no solo deben recopilar información y emitir diagnósticos, sino también interpretar señales no verbales, considerar el contexto emocional y social del paciente y adaptarse a la incertidumbre. Estos elementos hacen que la interacción médico-paciente sea una tarea difícil de replicar por máquinas.

IA como herramienta complementaria, no sustituta

Pranav Rajpurkar enfatizó que incluso si los modelos de IA logran superar el estándar CRAFT-MD, no significa que sean superiores a los médicos humanos.

La práctica médica real implica una combinación de habilidades técnicas, empatía, coordinación interdisciplinaria y adaptación a factores sociales y sistémicos complejos.

“La IA podría convertirse en una herramienta poderosa para apoyar a los médicos, pero no puede reemplazar el juicio holístico de un profesional experimentado”, añadió Rajpurkar.

Retos y oportunidades

Los modelos de IA podrían
Los modelos de IA podrían realizar análisis de datos complejos y manejar grandes volúmenes de información, sin desplazar el valor humano (Imagen Ilustrativa Infobae)

Aunque los resultados actuales subrayan las limitaciones de la IA en medicina, también abren nuevas posibilidades. Herramientas como CRAFT-MD permiten identificar áreas clave de mejora y avanzar hacia modelos más robustos que puedan complementar el trabajo clínico.

En un escenario ideal, los modelos de IA podrían encargarse de tareas específicas como análisis de datos complejos o procesamiento de grandes volúmenes de información, liberando a los médicos para enfocarse en el aspecto humano del cuidado de la salud.

Sin embargo, alcanzar este equilibrio requiere más investigación, recursos y, sobre todo, una integración ética que respete los límites de la tecnología.

Aunque la inteligencia artificial tiene el potencial de transformar la medicina, su implementación debe abordarse con cautela. Los modelos actuales, a pesar de sus impresionantes capacidades en contextos estructurados, todavía están lejos de reemplazar las habilidades humanas en la práctica clínica. El desafío radica en encontrar un equilibrio donde la tecnología no desplace, sino que refuerce el arte de la medicina.

Guardar

La secuenciación genética revoluciona el tratamiento de tumores raros, con resultados sorprendentes

Nuevas tecnologías en genética están transformando la oncología -investiga Newsweek-, ofreciendo soluciones a pacientes con tipos de cáncer que no respondían a terapias convencionales

La secuenciación genética revoluciona el

Tras el exitoso lanzamiento del cohete New Glenn de Bezos, el Starship de Musk se prepara para un nuevo vuelo de prueba

El despegue está programado para las 22 hs GMT (19 de Argentina) desde la base espacial en Texas. Será el séptimo vuelo de prueba del más poderoso cohete que se producirá el mismo día en que Blue Origin lanzó su nueva nave, que no pudo ser recuperada

Tras el exitoso lanzamiento del

El análisis del ADN ambiental revela la diversidad microbiana oculta en los ríos de Inglaterra

Según estudios recientes, más de 1.600 muestras de biofilms fueron analizadas, revelando cómo los microbios en ríos ingleses metabolizan nutrientes, descomponen materia orgánica y contribuyen al equilibrio ecológico

El análisis del ADN ambiental

Cómo es Darth Vader, la criatura marina gigante recién descubierta que se parece al villano de Star Wars

El crustáceo fue descubierto en el Mar del Sur de China. Buscan llamar la atención sobre la biodiversidad de los mares y la urgencia de su conservación

Cómo es Darth Vader, la

Identifican un nuevo sistema de defensa del cuerpo que podría revolucionar el tratamiento de enfermedades del intestino y la piel

Un estudio liderado por investigadores del Instituto de Ciencias Weizmann podría transformar el entendimiento de las enfermedades inflamatorias. De qué manera el complejo multiproteico hallado podría predecir la respuesta inmunológica en esas patologías

Identifican un nuevo sistema de