Bioinformatics Barcelona

El Big Data y el factor humano

Los profesionales encargados de gestionar los datos de las grandes empresas son una pieza clave para la correcta interpretación de estos

La ciencia de datos se ha convertido en una de las herramientas más valiosas estratégicamente para cualquier sector de la industria y los negocios. Empresas de todo tipo están analizando grandes cantidades de datos complejos (que hoy día conocemos como big data) para extraer conocimiento sobre productos, clientes, procesos de negocio o sus competidores, entre otros aspectos. Además, la ciencia de datos también contribuye a guiar la toma de decisiones para intentar optimizar operaciones y procesos de negocio (evidence-based decision-making).

Una visión generalizada sobre la ciencia de datos sugiere que su principal valor radica en que el conocimiento y las conclusiones que ofrece son casi irrefutables, puesto que los datos obtenidos describen objetivamente la realidad. Esta opinión suele estar especialmente extendida entre muchos directivos y responsables de empresas, encargados de interpretar los resultados de estos análisis y tomar decisiones basados en ellos. Puesto que el dato está en el centro del análisis, los modelos, técnicas y algoritmos matemáticos y estadísticos que se aplican parecen surgir de los propios datos. Por tanto, las conclusiones de estos análisis nunca deberían ser erróneas porque “los datos dirigen el análisis y los datos son objetivos”.

Sin embargo, la realidad es bien distinta. Un buen ejemplo lo encontramos en el análisis financiero y económico. Un estudio publicado en 2010 por Burman y otros autores [1] confirma que, aplicando a los mismos datos los mismos métodos análisis, pero implementados en paquetes software diferentes, los resultados y las conclusiones obtenidas eran bien distintas. Mismas técnicas, mismos datos pero distinto código software y ya surgen discrepancias. Un escenario para reflexionar.

Profesional del big data

Pero el problema va más allá; está en la raíz de esa visión generalizada sobre la ciencia de datos: los datos no dirigen el análisis. Es un humano, el responsable del diseño e implementación del estudio, el que decide cómo se analizan los datos: qué método se emplea, qué datos se consideran (y cuales se filtran, quedando fuera), con qué herramienta se implementa el análisis o cómo se pueden interpretar los resultados.

El factor humano sigue estando, junto a los datos, en el centro del proceso de ciencia de datos. Esto tiene consecuencias importantes para muchas empresas:

  • No es suficiente acumular grandes cantidades de datos, o datos muy valiosos. Ni siquiera es suficiente tener datos de gran calidad (algo difícil de conseguir). Es esencial contar con un buen equipo humano, con formación, aptitudes e intuición adecuados para afrontar estos estudios. Pero es difícil encontrar estos perfiles en el mercado.
  • Los datos escalan con relativa facilidad (no es difícil conseguir más, en muchos casos). Las infraestructuras tecnológicas también son capaces de escalar para abordar análisis más ambiciosos. Sin embargo, los científicos de datos no escalan [2], no pueden asumir un número ilimitado de proyectos.
  • Es imprescindible que los directivos y responsables en la toma de decisiones sepan interpretar de forma crítica los resultados del análisis de datos, incorporando conocimiento experto y experiencia previa para extraer las conclusiones adecuadas que se puedan aplicar a su caso particular.

Como mentor en un LAB de Big Data de Telefónica soy consciente de la importancia de preparar a las nuevas generaciones en la gestión, análisis e interpretación de grandes cantidades de datos.

[1] Burman, Leonard E., W. Robert Reed, and James Alm. «A call for replication studies.» Public

Finance Review 38.6 (2010): 787-793.

[2] Frankel, S. Data Scientists Don’t Scale. Harvard Business Review, 22 mayo de 2015. https://hbr.org/2015/05/data-scientists-dont-scale

Sobre el autor

RELACIONADOS