El CRG crea un nuevo método que garantiza poder reproducir experimentos

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

Científicos del Centro de Regulación Genómica (CRG) de Barcelona han desarrollado un novedoso sistema de gestión de flujos de trabajo que permite reproducir los experimentos, incluso si se hacen con grandes bases de datos genómicos por ordenador.

El nuevo sistema, denominado Nextflow, garantiza poder comprobar experimentos que de otro modo no se pueden reproducir y que actualmente es uno de los principales retos para científicos, instituciones, entes financiadores y editoriales que deben asegurar la credibilidad de los experimentos.

Para comprender los datos genómicos, los científicos dependen cada vez más de una combinación de programas informáticos llamados pipelines, que procesan los datos, los analizan y dan lugar a resultados como, por ejemplo, el riesgo de padecer una enfermedad genética.

Sin embargo, los resultados de estos pipelines no son siempre reproducibles

Ahora, un equipo de investigadores en el CRG, liderados por Cedric Notredame, han desarrollado un sistema de gestión de flujos de trabajo que asegura la reproducibilidad en los experimentos computacionales y que se describe en el último número de la revista Nature Biotechnology.

"Existen diminutas variaciones entre plataformas computacionales que pueden inducir inestabilidad numérica, lo que da lugar a la irreproducibilidad de los experimentos computacionales. Nextflow permite que los científicos eviten estas variaciones y contribuye a establecer buenas prácticas científicas en experimentos por ordenador", ha explicado Notredame.

"Una pequeña variación puede que no parezca un problema cuando se está utilizando una cantidad enorme de datos genómicos para un proyecto de investigación, pero incluso las variaciones más pequeñas pueden ser cruciales si pretendemos utilizar los resultados de nuestro análisis para tomar decisiones, por ejemplo, médicas", ha precisado Paolo Di Tommaso, primer autor del trabajo.

La principal razón por la que existe irreproducibilidad en experimentos computacionales es la complejidad de los ordenadores modernos ya que, con la gran cantidad de archivos y programas que contienen, son como máquinas hechas de miles de millones de partes en movimiento.

El nuevo sistema "es como si congeláramos el experimento, así todo aquel que quiera reproducirlo, podría hacerlo exactamente de la misma manera y en las mismas condiciones, sin tener que reintroducir manualmente ninguna configuración compleja".