USOS DEL 'BIG DATA'

Un estudio de 'Nature' cuestiona la efectividad de la protección de datos

zentauroepp42700210 files  in this file photo taken on march 21  2018 social net190723171502

zentauroepp42700210 files in this file photo taken on march 21 2018 social net190723171502 / AFP / ERIC BARADAT

El Periódico

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

Los mecanismos de protección de datos podrían ser un espejismo. Un nuevo estudio publicado en la revista 'Nature Communications' desvela que los actuales métodos para anonimizar la información no son realmente eficaces y que, de hecho, aun aplicándose estos filtros no sería difícil rastrear a los usuarios a partir de los datos que proporcionan. Este dato, si se confirma, supondría una infracción directa a la nueva ley de protección de datos de la Unión Europea (GDPR, por sus siglas en inglés) así como otras normativas internacionales.

El quid de este problema estaría, una vez más, en la letra pequeña. Muchas de las políticas de protección de datos incluyen una cláusula con la que se autoriza recopilar datos para, por ejemplo, entrenar algoritmos de inteligencia artificial. Para garantizar la 'privacidad' de los usuarios y el 'anonimato' de los datos se eliminan todo aquello que permita identificar a los cibernautas, como nombres y direcciones de correo electrónico. A partir de ahí, estos paquetes de información los datos ya no están sujetos a las regulaciones de protección de datos, por lo que se pueden usar y vender libremente a terceros, como empresas de publicidad y agentes de datos.

Ingeniería inversa

El problema llega cuando los compradores de datos anónimos utilizan 'ingeniería inversa' para volver a identificar a los usuarios, tal y como lo demuestran el equipo de investigadores responsables de este nuevo estudio liderados por el Imperial College de Londres. La investigación, además, viene acompañada de una herramienta experimental para demostrar que la información que proporcionamos es 'demasiado única para ocultarse' y que, efectivamente, a partir de unos pocos datos es posible volver a identificar quienes somos. Nuestra intimidad digital, por lo tanto, quedaría al descubierto.

Los investigadores responsables de este estudio han desarrollado un método estadístico que permite obtener una estimación precisa de la probabilidad de que las personas se vuelvan a identificar correctamente a partir de cualquier conjunto de datos anonimizados. Para ello tan solo se necesitan algunos detalles como el código postal, la fecha de nacimiento, el sexo o el número de hijos. Cuantos más datos se conozcan, más aumentan las posibilidades de rastrear el usuario original. El estudio concluye que, por ejemplo, el 99,98% de los ciudadanos de Massachusetts serían identificables a partir de tan solo 15 atributos demográficos.

Llamada de atención

Este estudio, según argumentan los investigadores, supondría una llamada de atención a los responsables de la formulación de políticas públicas sobre la necesidad de reforzar la normativa para que se garantice que la información sea verdaderamente anónima. En este sentido, los expertos argumentan que se debe seguir trabajando para proteger a las personas de los ataques a su privacidad que, a largo plazo, podrían tener "consecuencias en sus carreras, vida personal y financiera".

"Las empresas y los gobiernos han minimizado el riesgo de reidentificación argumentando que los conjuntos de datos que venden siempre están incompletos. Nuestros hallazgos contradicen esto y demuestran con qué facilidad y precisión es posible encontrar en el registro a la persona que está buscando", argumenta Yves-Alexandre de Montjoye, investigador principal del estudio del Instituto de Ciencia de Datos del Imperial College de Londres.