JUAN MANUEL LÓPEZ ZAFRA, DOCTOR EN ECONOMÍA

"Cualquier dato es susceptible de ser desanonimizado"

Abordamos con Juan Manuel López Zafra, doctor en Economía, el valor que tienen los datos para las organizaciones y cómo lo están aprovechando en los diferentes sectores.

Abordamos con Juan Manuel López Zafra, doctor en Economía, el valor que tienen los datos para las organizaciones y cómo lo están aprovechando en los diferentes sectores

Juan Manuel López Zafra

Juan Manuel López Zafra / economia

Fran Leal

Fran Leal

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

El proceso de transformación digital al que estamos asistiendo ha propiciado que los datos, y saber extraer todo su valor, estén en una posición central en los negocios. Y lo cierto es que son muchos los sectores que les están sacando verdadero partido. 

Por ello, y para analizar en profundidad este asunto, hemos charlado con Juan Manuel López Zafra, doctor en Economía y especialista en Data Science, que acaba de publicar junto Ricardo A. Queralt (doctor en Economía Cuantitativa), ‘Alquimia. ¿Cómo los datos se están transformando en oro?’. La ciencia de datos, que ha llegado para quedarse, cristaliza en lo que los autores del libro denominan “el nacimiento del Homo Algorithmus”. 

El sector financiero es uno de los que más partido extraen al dato. ¿En qué medida se juegan las compañías su supervivencia con su explotación?

Como en todos los sectores, pero en el financiero especialmente, hay que distinguir entre las grandes y las pequeñas compañías, así como entre las que nacen como nativas digitales y las que están transformadas o transformándose, es decir, entre las tradicionales y las fintech.

Una empresa grande que haya empezado su proceso de transformación, y esté avanzado, tiene más posibilidades de sobrevivir bien en un entorno tan complicado como el que se avecina. Una fintech, en cambio, al nacer como nativa digital, sabe perfectamente cuál es el valor del dato, cómo generar valor a partir de él… El dato tiene valor en función de lo que consigo con él y las empresas más intensivas en manejo de información son las que mejor lo tienen.

Las financieras grandes, como por ejemplo BlackRock, lo llevan bastante bien. Y en España, BBVA, que empezó su transformación hace tiempo y la tiene bastante avanzada, también está actuando fenomenal. Eso sí, hay que tener claro que este es un proceso que no termina nunca.

En el sector seguros, por ejemplo, exponéis la importancia del dato a la hora de elaborar modelos predictivos. ¿Se limita a una cuestión operativa o está más orientado al ahorro de costes?

Son las dos cosas. Por un lado, las posibilidades operativas que me permiten los modelos predictivos. Y por otro, al mismo tiempo, si los modelos están bien ajustados, el ahorro que me supone. No solo puede ayudar, por ejemplo, a prever catástrofes naturales, sino que también tiene una gran importancia en el campo de la medicina, en los seguros médicos privados y el sector público.

Si el sistema público de salud empieza a utilizar estos modelos predictivos y son capaces de predecir con un buen modelo y alta probabilidad la existencia de ciertas dolencias o enfermedades, el ahorro que se genera para todo el sistema es muy importante.

Pero es complicado tomar la decisión de transformarse en ese sentido, sobre todo para el sector público. Una empresa privada, con incentivos adicionales procedentes de la competencia, necesita hacerlo de la misma manera que un banco, pero es cuestión de tiempo que tanto unos como otros utilicen este tipo de sistemas para mejorar la eficiencia, la salud pública y reducir los costes.

Al respecto de la utilización del dato en salud, siempre surge la duda de si el tratamiento se hará de un modo lícito. Ahí la legislación es la que marca el ritmo, ¿verdad?

Hay dos cosas que marcan el ritmo. Por un lado, la obligatoria legislación. En Europa tenemos el RGPD, que es muy defensor del usuario, y luego tenemos otras zonas, como EEUU que no es tan garantista o China, donde directamente no existe esta regulación.

Lo cierto es que, ahora mismo, cualquier dato (anónimo o no) es susceptible de ser desanonimizado. Y aquí es donde entra el segundo elemento, que es la ética. En las compañías occidentales (incluyendo japonesas y coreanas), cuanto mayor es la corporación, mayor transparencia tiene que tener y mayor RSC. Esto no es una moda, sino que está ya en los consejos de administración, que son totalmente conscientes y así lo transmiten a los trabajadores.

Dicho esto, ¿tenemos que tener miedo de lo que hacen gobiernos y empresas con nuestros datos? Pues creo que, más que miedo, prevención. En un estado garantista como el nuestro, hay que estar prevenidos, tener siempre la mosca detrás de la oreja, y ahí los contrapoderes como los medios de comunicación tienen un papel esencial.

Otro de los ámbitos donde el dato cada vez es más relevante es en comunicación y, más concretamente, en su vertiente política. De hecho, usted ya predijo una posible victoria de Donald Trump, cuando nadie apostaba por ello...

En redes sociales, en una situación de alta conflictividad social (no tanto de disturbios, sino de que está mal visto decir según qué cosas sobre lo que piensas), la gente no se cortaba. Esto se debe a que no tiene delante a nadie que le pueda decir nada. En 2016, en el caso concreto de las elecciones de EEUU, en redes había un movimiento desde hacía meses muy favorable hacia Trump. Y, además, el partido demócrata dejó de visitar los estados que daba por seguros (Trump sí los visitaba). Todo esto desembocó en la victoria del republicano. Esas señales, el equipo de Cambridge Analytica las supo detectar muy bien, todo lo contrario que el equipo demócrata. En definitiva, había toda una serie de identificadores que indicaban que podía suceder, de la misma manera que marcaban un auge de VOX en España.

A pesar de la corta campaña electoral que hemos vivido en nuestro país con motivo de las elecciones del 10N, ¿se ha podido ver esa explotación del dato por parte de los partidos políticos?

Verse no se ve, es realmente difícil. Pero lo que sí se ha visto es la inversión publicitaria en redes. El que más esfuerzo ha hecho ha sido Podemos, y el que menos VOX. En cuanto a la construcción de equipos de ciencia de datos, que yo sepa, el único que lo ha hecho ha sido el PP, que ha rescatado para la última semana a Messina, como ya hizo en 2016.

La clave de todo esto está en los electores persuadibles, en los que puedes llegar a influir y cambiar su voto. Ahí es donde tienes que gastar el dinero y donde le puedes dar la vuelta a las elecciones.

Ya a nivel de empresa, en ‘Alquimia’ destacáis la figura del ‘data translator’. ¿Cómo se está implantando en las compañías españolas?

Esta figura es fundamental, porque hay un escalón y una diferencia de lenguaje y cultural entre el nivel de la dirección y el de los científicos de datos que es bestial. Por ello, se necesita una capa intermedia que les ponga en contacto, que es la figura del data translator. En EEUU, lo tienen muchas empresas, y en España hay algunas que ya cuentan con este perfil. Normalmente, es gente que ha empezado como científico de datos hace años y ha evolucionado dentro de este sistema.

Es una profesión complicada, porque al científico de datos normalmente lo que le gusta son los números, y no ser un consultor. Pero es una figura vital para que no haya diferencias entre la orden que dicta la dirección y cómo la recibe el equipo básico de ciencia de datos. Del mismo modo ocurre para que los conocimientos que extrae este equipo no se pierdan en disquisiciones al llegar a la dirección. Esta cadena de transmisión es esencial y las empresas cada vez lo reclaman más, porque lo necesitan.

Las pymes, por su parte, ¿tienen las mismas posibilidades de explotar el dato de forma eficaz que una gran corporación?

Democratizado está, pero existe un problema de formación. Yo puedo acceder a los mismos datos libres a los que accede Iberdrola, por ejemplo. El open data está ahí. Pero otra cosa es cómo tengo mis bases de datos. Y, en esto, hay empresas pequeñas que tienen los datos bien estructurados y otras que son un desastre.

El problema está en los recursos que se pueden dedicar. Un empresario pequeño que tiene los recursos justos, que no puede contratar a una persona para esto, tiene un problema, evidentemente. Cosa que no le ocurre a una empresa grande que tiene, no ya a una persona, sino a un equipo. Entonces, ¿cómo se consigue que las pymes puedan acceder a este tipo de análisis? Pues a través de empresas proveedoras de servicios de ciencia de datos, que te hará los modelos necesarios sin necesidad de tener a un científico de datos contratado.

Está claro que, como todo en la vida, tardará más tiempo una pyme en acceder a estos servicios que una grande que ya ha dado el paso y los tiene internalizados.

Recurrir a este tipo de consultoría, ¿nos puede ayudar entonces a focalizar mejor la inversión?

Sí, pero también hay que decir que hay mucho vendedor de humo. Existe la moda de que todo es big data, cuando lo importante realmente es ver qué datos tengo, si soy capaz de explotarlos y ponerlos en valor. Hay una parte de la ética del proveedor, que debe ser capaz de responder correctamente a las necesidades de la pyme. Y también, por otra parte, tiene que estar la voluntad de la pyme para sacar esto adelante, para lo que hace falta invertir algo, porque poner en valor los datos a coste cero es absolutamente imposible; nadie regala nada. En resumidas cuentas, hay que invertir un poco en tecnología y luego en la explotación científica de esa tecnología. Y para ello necesitas un científico de datos, aunque no sea tuyo, pero necesitas gente que te oriente.

Como decía, todo esto es cuestión de tiempo; el tsunami primero le llega a unos y después le acaba llegando la resaca a los demás.