La UNED impulsa la detección temprana del VIH con Inteligencia Artificial y procesamiento del lenguaje natural
Un equipo de investigadores del Departamento de Lenguajes y Sistemas Informáticos de la Escuela Técnica Superior de Ingeniería Informática de la UNED, liderado por su catedrática Raquel Martínez, ha desarrollado un innovador sistema basado en inteligencia artificial y minería de texto para mejorar el diagnóstico temprano del VIH.
Este proyecto, realizado en colaboración con el Hospital Universitario Fundación Alcorcón y la Universidad Rey Juan Carlos, ha sido publicado en la revista Computers in Biology and Medicine. Utilizando modelos de lenguaje entrenados específicamente en el ámbito biomédico, el sistema analiza las notas clínicas no estructuradas de los historiales médicos electrónicos, marcando un avance significativo en el uso de tecnologías avanzadas para la salud pública.
Un enfoque disruptivo para el diagnóstico precoz
El proyecto aborda un problema crítico: muchas infecciones por VIH no diagnosticadas se producen debido a oportunidades perdidas en los sistemas de salud. Según diversos estudios, hasta el 16% de los pacientes diagnosticados con VIH en España tuvieron contacto previo con el sistema sanitario sin que se les realizara una prueba diagnóstica. Este retraso no solo aumenta la morbilidad y mortalidad, sino que también contribuye a la transmisión del virus. Para superar esta barrera, los investigadores han diseñado un modelo que utiliza exclusivamente el texto libre de las notas clínicas, sin depender de datos estructurados como diagnósticos o resultados de laboratorio. Este enfoque permite identificar pacientes sospechosos de VIH mediante patrones lingüísticos y contextuales presentes en las anotaciones médicas, ayudando a los médicos a decidir cuándo solicitar pruebas serológicas.
Resultados prometedores
El sistema compara dos tipos de algoritmos de clasificación: modelos clásicos de aprendizaje automático y modelos de lenguaje avanzado (Large Language Models, LLMs) entrenados en el ámbito clínico-biomédico en español. Entre los modelos probados, destacó el RoBERTaBio, que alcanzó una precisión del 94,7% y redujo significativamente los falsos negativos, es decir, los casos sospechosos que no fueron correctamente identificados. Incluso en escenarios con datos desbalanceados (donde el número de pacientes no sospechosos supera ampliamente a los sospechosos), los LLMs demostraron una mayor robustez frente a los modelos clásicos. Esto subraya el potencial de las tecnologías avanzadas de procesamiento del lenguaje natural para abordar problemas complejos en el ámbito sanitario.
Impacto clínico y futuro del proyecto
La investigación demuestra la viabilidad de analizar datos no estructurados para mejorar el diagnóstico temprano del VIH y ofrece una herramienta práctica para los médicos. El equipo está trabajando en un prototipo que permitirá a los profesionales de la salud acceder a las predicciones del modelo durante la consulta, fomentando decisiones más informadas. Además, los investigadores planean ampliar el estudio con más datos y colaboraciones con otros hospitales, así como perfeccionar el sistema para incluir explicaciones más detalladas de las decisiones del modelo. Este enfoque busca garantizar que las tecnologías basadas en inteligencia artificial sean comprensibles y confiables para su implementación en entornos clínicos.
Un paso hacia la detección temprana y la prevención
El trabajo manifiesta el compromiso de la UNED y sus socios con la innovación tecnológica aplicada a la salud pública. Al integrar inteligencia artificial y análisis de lenguaje natural en el diagnóstico temprano del VIH, esta iniciativa contribuye a mejorar la calidad de la atención médica, y se alinea con los objetivos globales de erradicación del VIH establecidos por las Naciones Unidas para 2030.