El aprendizaje automático revoluciona el almacenamiento de datos

Investigadores estadounidenses han desarrollado un innovador sistema de almacenamiento de datos «a la carta», que se adapta a las necesidades de cada usuario o aplicación. Aprovecha las ventajas del aprendizaje automático, una de las ramas más importantes

El aprendizaje automático revoluciona el almacenamiento de datos

El aprendizaje automático revoluciona el almacenamiento de datos

El Periódico

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

Un equipo de especialistas del Massachusetts Institute of Technology (MIT) ha creado una herramienta de almacenamiento de datos que emplea técnicas de aprendizaje automático para adaptarse a las necesidades específicas de cada usuario o aplicación. Según una nota de prensa, se vuelve así una opción más eficiente y rápida que los sistemas actuales, realizando un aporte de gran trascendencia en un escenario de sobreabundancia de información y datos.

Se estima que sobre 2025 la totalidad de la información almacenada a nivel mundial llegará a los 175 billones de gigabytes. La impresionante cifra deja en claro que el almacenamiento de datos ha dejado de ser un problema secundario y personal que nos obliga a cambiar periódicamente de dispositivos para pasar a ser un inconveniente social: ¿hasta qué punto es sostenible el incremento en el volumen de la información generada a nivel planetario?

Considerando esta problemática, uno de los mayores desafíos de la informática hacia un futuro cercano es poder manejar la sobreabundancia de información y, al mismo tiempo, ofrecer sistemas de almacenamiento y procesamiento que sean eficientes y viables, tanto desde el punto de vista económico como tecnológico.

El aprendizaje automático como salida del laberinto

Los científicos del MIT han decidido encargarse de esta cuestión, utilizando para ello las posibilidades que brinda el aprendizaje automático. Esta herramienta de inteligencia artificial ofrece la alternativa de utilizar algoritmos y programas informáticos que tienen la capacidad de ¿aprender¿ y modificarse a medida que van sumando nuevos datos. En consecuencia, pueden adaptarse de manera inteligente a necesidades que van cambiando.

Mientras los sistemas actuales de almacenamiento de datos trabajan en base a soluciones estandarizadas, la nueva tecnología desarrollada por los científicos estadounidenses funciona como un sistema ¿a la carta¿. Esto quiere decir que optimiza sus recursos y prestaciones de acuerdo a lo requerido por cada usuario en un momento determinado, o en función de la aplicación que se utilice.

Eficiencia y versatilidad en el almacenamiento

La diferencia en cuanto a efectividad y prestaciones es notoria. Los sistemas conocidos hasta hoy alcanzan un funcionamiento correcto, pero tienen serias limitaciones porque no ofrecen variadas posibilidades de almacenamiento ni condiciones que se adapten a necesidades concretas.

Por el contrario, el nuevo sistema bautizado Tsunami logra cambiar dinámicamente la estructura del almacenamiento de datos en función del tipo de consultas y requerimientos que recibe, creando nuevas formas de almacenar datos que no son factibles utilizando los enfoques tradicionales de la informática.

Los testeos realizados evidencian que la nueva tecnología puede trabajar hasta 10 veces más rápido que los sistemas de última generación. Al mismo tiempo, sus conjuntos de datos se pueden organizar gracias al aprendizaje automático en paquetes inteligentes que ocupan un espacio hasta 100 veces menor que el necesario en los sistemas tradicionales.

Además de permitir una gestión más eficiente en el almacenamiento de datos, Tsunami podría ser de gran utilidad en contextos en los cuales los equipos informáticos ofrecen prestaciones modestas en cuanto a memoria RAM, almacenamiento en disco duro o capacidad de procesamiento. En resumen, la nueva tecnología permitiría desarrollar tareas más complejas con un equipamiento básico y económico.

Referencia

Tsunami: A Learned Multi-dimensional Index for Correlated Data and Skewed Workloads.Jialin Ding, Vikram Nathan, Mohammad Alizadeh and Tim Kraska. CoRR abs/2006.13282 (2020).DOI:no informado.

Foto: MIT.