Hablar de Big Data es hablar de prever el futuro

Durante los días 6, 7 y 8 de noviembre han tenido lugar las primeras Jornadas “Vivir en un mar de datos. (del Big Data a la Smart Society)” en el Espacio Fundación Telefónica en Madrid.

El objetivo de las Jornadas era profundizar en esta nueva área de conocimiento, conocer su importancia, sus capacidades de generar nuevos empleos y su utilidad para las empresas y para la sociedad.  Para la mayor parte de los asistentes, entre los que me encuentro, la conclusión más evidente se podría resumir en esta frase: hay todo un mundo por explorar y por explotar. Me gustan mucho los eventos que abren puertas tras las que se encuentra un mundo nuevo.

Estamos en una sociedad productora constante de datos. Cada paso digital que damos crea múltiples datos. En uno solo día del 2011 se produjeron más datos que en todo el año 2000. Para cuantificar el volumen de datos producido ya tenemos que ir a múltiplos como el Exabyte, que es un 1 seguido de 18 ceros, es decir un millón de millón de millones de bytes o el ZetaByte (mil veces superior). Estos datos suponen cuatro retos para su utilización, las 4 V del Big Data. El primero es el Volumen en que se producen, el segundo su Valor, el tercero la Velocidad a la que se producen y el cuarto su Variabilidad, la variedad de fuentes.

Todavía menos del 5% de las empresas tratan masivamente sus datos. Todavía trabajamos con antiguos modelos que describen mejor el pasado que el futuro, que trabajan con pequeñas y manejables muestras de datos y la gran riqueza contenida en esos grandes volúmenes de datos se está perdiendo. Empresas de éxito como Google, Facebook o Twitter son empresas cuya base son solo los datos, es su único producto y algunas están entre las más valiosas del planeta. Varias veces salió en las Jornadas la idea de si los datos eran el nuevo petróleo de la economía. Muchos creemos que lo es pero por ahora se está derramando sin ser empleado todavía correctamente.

Un articulo cuya publicación que coincido con las Jornadas, de la consultora RocaSalvatella, centraba la atención en que el Big Data es una buena herramienta si sabes las preguntas que quieres que te responda. De otro modo,  no pasa de ser un divertimento caro, una muestra de capacidad tecnológica.

Fue muy destacable ver la cantidad de pequeñas empresas que empiezan a ver el Big Data como la base de su oferta de valor. Desde productores de datos, como las empresas de sensores, hasta soluciones de análisis de datos de consumo eléctrico domestico que presentó Mirubee , una empresa surgida dentro de la iniciativa Wayra de Telefónica. Esto ha venido propiciado por la aparición de software de Big Data en código abierto, también de hardware libre (Arduino) y la conectividad wireless de la mano del móvil,  Wi-Fi y las etiquetas RFID. Esta reducción de coste ha hecho, como se comentó en las Jornadas,  que muchas pequeñas empresas pudieran empezar a pensar a lo grande en este campo.

La constatación del valor que el Big Data añade a una empresa la dieron en la mesa de grandes empresas en la que Coca Cola, Red Eléctrica Española, Telefónica y el CSIC,  comentando los logros que habían conseguido con su propio análisis. En palabras de Massimiliano Marinucci  (Director de Marketing de Estrategia y Productividad de Coca Cola España):   «la rentabilidad de implementar estos análisis de grandes datos es de un factor multiplicador de 10 a 1».

El principal resultado de un buen análisis de Big Data suele ser un ahorro de costes por optimización o segmentación, por lo que puede ser una buena alternativa al simple recorte en los malos tiempos de reducciones presupuestarias como el actual.

Big Data se consolida como la mejor herramienta que se está desarrollando para entender, como todas las nuevas herramientas de Análisis de Negocio, las tendencias futuras de una empresa a partir de los datos de sus clientes, su consumo, etc. La inteligencia que aporta el Big Data se basa en hasta que punto es capaz de predecir el futuro. Los modelos que genera son elementos básicos para creación de inteligencia en este campo y fundamentalmente lo que hacen es tratar con la incertidumbre y reducirla.

Los campos de trabajo en el Big Data se estructuran a través de los tres pasos de un proyecto de datos: recopilación, análisis y explotación y alrededor de ellos se van posicionando las empresas de este nuevo ecosistema.

Por fin quedaba ver si existe una nueva ciencia de los datos (Data Science) o es simplemente la utilización adecuada de herramientas matemáticas y estadísticas ya existentes. La mesa “científica”, dentro de las Jornadas, tuvo controversia en este punto,  pero coincidió en  la necesidad de una formación específica para el científico de datos (no existente como tal en la formación académica ni se la espera a corto plazo). La evolución de las actuales herramientas de inferencia bayesiana, apoyadas por las nuevas herramientas informáticas y aplicaciones que permiten razonar usando el total de los datos y no solo con una muestra de los mismos, permite conclusiones más precisas y más ajustadas a la realidad. Se abría un nuevo campo de especialización que como titulaba el último número de la revista Harvard Business Review “Data Scientist: The sexiest job of the 21st Century”

En suma, en un mundo de datos, en este mar de datos, necesitamos las tecnologías del Big Data para encontrar un rumbo y para poder meter este gran océano en una botella.

 

Sobre el autor

RELACIONADOS