Un modelo integral para las bases de datos de simulación molecular

|
Investigación
Más de un centenar de expertos en simulación molecular han publicado un artículo en la revista Nature Methods para solicitar un cambio de paradigma en la gestión de datos en dinámica molecular. El trabajo, liderado por el catedrático de la Universidad de Barcelona Modesto Orozco y el experto Adam Hospital, ambos miembros del Instituto de Investigación Biomédica (IRB Barcelona), propone crear una infraestructura común para almacenar y reutilizar datos en el contexto de la revolución que representa la inteligencia artificial.

|
Investigación
Más de un centenar de expertos en simulación molecular han publicado un artículo en la revista Nature Methods para solicitar un cambio de paradigma en la gestión de datos en dinámica molecular. El trabajo, liderado por el catedrático de la Universidad de Barcelona Modesto Orozco y el experto Adam Hospital, ambos miembros del Instituto de Investigación Biomédica (IRB Barcelona), propone crear una infraestructura común para almacenar y reutilizar datos en el contexto de la revolución que representa la inteligencia artificial.
Las simulaciones computacionales se han convertido en una herramienta clave para estudiar el comportamiento de biomoléculas a lo largo del tiempo. Gracias a los supercomputadores, la dinámica molecular (MD) permite observar estos procesos con gran precisión y aportar nuevos conocimientos de interés tanto en investigación básica como en el diseño de biomoléculas, desde enzimas hasta fármacos.
A diferencia de la biología estructural o la genómica —disciplinas en las que guardar y compartir datos bajo estándares comunes es una práctica habitual—, en el campo de la simulación molecular estos datos siguen fragmentados. Además, a menudo acaban olvidados en ordenadores personales, lo que dificulta la reproducibilidad de los cálculos e impide su aprovechamiento posterior. Esto genera un problema destacable a la hora de integrar los datos en los flujos de trabajo de la biología estructural y de la biofísica, y frena el desarrollo de métodos de inteligencia artificial, cuyo entrenamiento es extremadamente dependiente del acceso a grandes cantidades de datos dinámicos.
Reutilizar en lugar de repetir
Diseñar un ecosistema abierto y sostenible que multiplique el impacto de estos datos y evite duplicidades innecesarias es el objetivo del nuevo artículo, firmado por más de un centenar de investigadores de referencia internacional, entre ellos algunos premios nobel de química. Los autores piden un cambio de modelo para aplicar los principios FAIR —que garantizan que los datos sean localizables, accesibles, interoperables y reutilizables— a los resultados de las simulaciones.
«La comunidad ha asumido durante años que repetir una simulación era más fácil y barato que archivarla. Pero eso ya no es cierto», afirma el catedrático de la Facultad de Química Modesto Orozco, coordinador del proyecto europeo MDDB, jefe del laboratorio de Modelización Molecular y Bioinformática del IRB Barcelona y fundador de la biotecnológica Nostrum Biodiscovery.
«El conocimiento que podemos extraer de reutilizar datos es enorme: nos permitirá identificar nuevas dianas, entrenar algoritmos de inteligencia artificial o diseñar nuevos experimentos», añade el investigador Adam Hospital. Orozco y Hospital lideran el proyecto europeo MDDB, financiado por el programa Horizonte Europa de la Comisión Europea, dirigido a establecer una base de datos centralizada y accesible para simulaciones.