Un estudio publicado por The New York Times el año pasado reveló que la IA alcanzó una tasa de precisión del 90%, frente al 76% de los médicos que utilizaron ChatGPT como herramienta y el 74% de los médicos que recurrieron a los recursos tradicionales.
Tras la publicación del informe, Bindu Reddy, CEO de Abacus.AI, declaró que una IA médica con acceso a todos los informes de laboratorio sería capaz de diagnosticar problemas y sugerir remedios con mayor efectividad que la mayoría de los médicos humanos, y añadió que lo mismo ocurriría con los abogados y otras profesiones que requieren diversos conocimientos en la materia.
El impacto de estos resultados no pasó desapercibido para Elon Musk, quien ha sido un defensor y crítico de la inteligencia artificial en igual medida pues en noviembre del año pasado, el magnate tecnológico compartió en su cuenta de X (antes Twitter) su perspectiva sobre el futuro de las profesiones humanas frente a la IA.
Qué dice Elon Musk al respecto
En su cuenta de X, Elon Musk se mostró de acuerdo con la predicción de Reddy, y comentó al respecto: “La IA pronto vencerá a los médicos y abogados por un amplio margen (y eventualmente a todos los humanos en casi todo). Podemos servir de respaldo biológico para la inteligencia, ya que somos menos frágiles que el silicio, y quizá como fuente de voluntad”.
Aunque parezca extremista, estas afirmaciones están respaldadas en datos sólidos de un estudio realizado por el Centro Médico Beth Israel Deaconess, en el que se logró destacar el desempeño sobresaliente de la IA en entornos clínicos.
Por otro lado, a principios de año, el magnate tecnológico también afirmó que el número de robots humanoides superará algún día a la población humana.
“Creo que, a largo plazo… la proporción de robots humanoides será de más de uno a uno. Así que probablemente habrá dos robots humanoides, o más, quizá 10, por cada humano”, declaró al respecto.
En este contexto, anteriormente, Roman Yampolskiy, investigador en seguridad de la IA, señaló que la empresa de Musk, Neuralink, cuyo objetivo es fusionar cerebros humanos con Inteligencia Artificial General (AGI), podría llegar a dejar obsoletos a los humanos.
En qué consistió el experimento del Centro Médico Beth Israel Deaconess
El experimento involucró a 50 médicos, entre residentes y adjuntos, reclutados de grandes sistemas hospitalarios en Estados Unidos, donde fueron evaluados con base en su capacidad para sugerir diagnósticos, justificar sus elecciones y descartar alternativas; además, se les pidió que identificaran el diagnóstico final y propusieran pasos adicionales en el proceso de diagnóstico. Los resultados mostraron que, en promedio, ChatGPT superó a los médicos en estas tareas.
El estudio utilizó seis casos clínicos basados en pacientes reales, seleccionados de un conjunto de 105 casos que los investigadores han empleado desde la década de 1990. Estos casos, nunca publicados previamente, fueron diseñados para evitar que los participantes o el propio ChatGPT tuvieran conocimiento previo de ellos. Uno de los casos, detallado en el estudio, describía a un hombre de 76 años con dolor en la parte baja de la espalda, los glúteos y las pantorrillas tras una angioplastia coronaria. Los síntomas incluían fiebre, cansancio, anemia y acumulación de productos de desecho en la sangre, lo que llevó al diagnóstico correcto de embolia de colesterol.
Los médicos y ChatGPT debían proponer tres posibles diagnósticos, respaldados por evidencias, y señalar hallazgos que no apoyaran esas hipótesis. Finalmente, se les pidió un diagnóstico definitivo y los pasos adicionales que tomarían para confirmar su evaluación.
Aunque los diagnósticos eran complejos, no eran tan raros como para ser considerados inauditos y, apesar de ello, los médicos obtuvieron peores resultados que el chatbot.
De acuerdo con los resultados obtenidos, GPT-4 alcanzó una precisión diagnóstica del 90%, mientras que los médicos que utilizaron GPT-4 lograron una tasa de precisión del 76%. En contraste, los profesionales que recurrieron a herramientas tradicionales alcanzaron solo un 74%.