Hugging Face publica un punto de referencia para probar la IA generativa en tareas de atención médica

Los modelos de IA generativa son cada vez más incorporados a entornos de atención de salud – en algunos casos, quizás prematuramente. Los primeros usuarios creen que se beneficiarán de una mayor eficiencia y al mismo tiempo revelarán información que de otro modo se pasaría por alto. Mientras tanto, los críticos señalan que estos modelos tienen fallas y sesgos que podrían contribuir a peores resultados de salud.

Pero, ¿existe una forma cuantitativa de saber qué tan útil o dañino podría ser un modelo cuando se le asignan tareas como resumir registros de pacientes o responder preguntas relacionadas con la salud?

Hugging Face, la startup de IA, ofrece una solución en un prueba de referencia recientemente lanzada llamada Open Medical-LLM. Creado en asociación con investigadores de la organización sin fines de lucro Open Life Science AI y el Natural Language Processing Group de la Universidad de Edimburgo, Open Medical-LLM tiene como objetivo estandarizar la evaluación del desempeño de modelos generativos de IA en una variedad de tareas relacionadas con la medicina.

Nuevo: ¡Ranking abierto de LLM médico! 🩺

En los chatbots básicos, los errores son un inconveniente.
En los LLM médicos, los errores pueden tener consecuencias potencialmente mortales 🩸

Por lo tanto, es esencial comparar/monitorear los avances en los LLM médicos antes de pensar en su implementación.

Blog: https://t.co/pddLtkmhsz

– Clementina Fourrier 🍊 (@clefourrier) 18 de abril de 2024

Open Medical-LLM no es un desde cero referencia, en sí mismo, sino más bien un conjunto de conjuntos de pruebas existentes: MedQA, PubMedQA, MedMCQA, etc. – diseñado para explorar patrones en el conocimiento médico general y campos relacionados, como anatomía, farmacología, genética y práctica clínica. El punto de referencia contiene preguntas abiertas y de opción múltiple que requieren razonamiento y comprensión médicos, basándose en material que incluye exámenes de licencia médica de EE. UU. e India y bancos de preguntas de exámenes de biología universitarios.

READ La versión beta de iOS 17.3 de Apple agrega protección de dispositivos robados para frustrar a los ladrones que conocen contraseñas

«[Open Medical-LLM] permite a investigadores y profesionales identificar las fortalezas y debilidades de diferentes enfoques, impulsar mayores avances en el campo y, en última instancia, contribuir a una mejor atención al paciente y mejores resultados”, escribió Hugging Face en una publicación de blog.

Hugging Face publica un punto de referencia para probar la IA generativa en tareas de atención médica — atención sanitaria de la generación de IA

Créditos de imagen: cara de peluche

Hugging Face posiciona el punto de referencia como una “evaluación sólida” de modelos generativos de IA relacionados con la atención médica. Pero algunos expertos médicos en las redes sociales han advertido que no se debe poner demasiado énfasis en Open Medical-LLM, para que no se produzcan implementaciones mal informadas.

En real la práctica clínica puede ser bastante extensa.

Es un gran progreso ver estas comparaciones cara a cara, pero es importante que recordemos también la magnitud de la brecha entre el entorno artificial de respuesta a preguntas médicas y la práctica clínica real. Por no hablar de los riesgos idiosincrásicos que estas medidas no pueden tener en cuenta.

– Liam McCoy, Doctor en Medicina y Maestría en Ciencias (@LiamGMcCoy) 18 de abril de 2024

Clémentine Fourrier, investigadora de Hugging Face y coautora del blog, está de acuerdo.

«Estas clasificaciones sólo deben utilizarse como una primera aproximación [generative AI model] explorar para un caso de uso determinado, pero siempre es necesaria una fase de prueba más profunda para examinar las limitaciones y la relevancia del modelo en condiciones del mundo real», respondió Fourrier. en X. «Médico [models] Los pacientes no deben utilizarlos solos, sino que deben capacitarse para que se conviertan en herramientas de apoyo para los médicos. »

READ Google quiere asegurarse de que comprendes la configuración de privacidad de Chrome

Esto recuerda la experiencia de Google cuando intentó llevar una herramienta de detección de retinopatía diabética mediante IA a los sistemas de salud tailandeses.

Google creó un Sistema de aprendizaje profundo que escanea imágenes del ojo., en busca de signos de retinopatía, una de las principales causas de pérdida de visión. Pero a pesar de la gran precisión teórica, la herramienta resultó poco práctica en pruebas del mundo realfrustrando tanto a los pacientes como a las enfermeras con resultados inconsistentes y una falta general de armonía con las prácticas de campo.

Es revelador que de los 139 dispositivos médicos relacionados con la IA que la Administración de Alimentos y Medicamentos de EE. UU. ha aprobado hasta la fecha, ninguno usa IA generativa. Es excepcionalmente difícil probar cómo se trasladará el rendimiento de una herramienta de IA generativa en el laboratorio a hospitales y clínicas ambulatorias y, quizás lo más importante, cómo los resultados podrían cambiar con el tiempo.

Esto no quiere decir que Open Medical-LLM no sea útil o informativo. La clasificación de resultados, como mínimo, nos recuerda cómo mal Los modelos responden preguntas básicas de salud. Pero Open Medical-LLM, y ningún otro punto de referencia, no sustituye las pruebas del mundo real cuidadosamente consideradas.

Este artículo se publicó originalmente en TechCrunch en https://techcrunch.com/2024/04/18/hugging-face-releases-a-benchmark-for-testing-generative-ai-on-health-tasks/

Leonor Badia

Leonor Badia es colaboradora de Lagradona.com, donde escribe sobre actualidad, sociedad, deportes, tecnología, cultura y otros temas de interés general. Su enfoque se centra en ofrecer información clara, útil y bien estructurada, ayudando a los lectores a comprender los acontecimientos más relevantes del momento. A través de una cobertura cercana y rigurosa, busca destacar historias, tendencias y noticias que impactan la vida cotidiana y aportan contexto a la actualidad.

READ El gran Samsung Galaxy Watch 4 Classic Leak voltea aún más especificaciones

Hugging Face publica un punto de referencia para probar la IA generativa en tareas de atención médica

GTA Online lanza el Golpe al Kortz Center, una gran actualización que podría marcar la antesala de GTA VI

El papel de la innovación en la era digital

Nintendo lanza la actualización 22.5.0 para Switch y Switch 2: mejoras discretas y pequeños cambios en la eShop

Xbox Game Pass anuncia los juegos que llegarán en la primera mitad de junio de 2026

Google modifica Android Auto y deja temporalmente fuera a una conocida marca de coches

Deja una respuesta Cancelar la respuesta

Visite Nuestra Oficina

Navigate

CONTACT

La Gradona

También te puede interesar