Big data y deporte

Big data y deporte: cuando el partido se juega con algoritmos

La competición deportiva ha cambiado mucho en los últimos años. Y aún tiene mucho que evolucionar. El mercado global de análisis de datos en deportes se estimó en 774,6 millones de dólares en 2018. Las expectativas de crecimiento se cifraron para aquel momento en un 31,2% anual, entre el 2019 y el 2025. Para estos cálculos se tiene en cuenta que el big data en el deporte se emplea sobre todo en obtener inteligencia de los rivales, armar estrategias específicas y en la captación de talento.

Con esta perspectiva, la firma analista Grand View Research fijaba el volumen del mercado en unos 1.000 millones de dólares para 2020. Para el ejercicio 2025, el número ascendería a 4.589 millones. Son estimaciones a medio plazo, pero a día de hoy la recopilación de datos sobre el rendimiento deportivo y su tratamiento se ha vuelto clave. David R. Sáez, CEO de Sports Data Campus, lo resume así: “El big data y la analítica avanzada están revolucionando el mundo del deporte y el perfil del analista de datos con big data se está convirtiendo en esencial en muchas entidades deportivas, siempre en aras de encontrar mejoras y ventajas competitivas”.

Daniel Pérez, analista de fútbol, coincide con esta aproximación. Su historia personal refleja la creciente importancia del big data en el deporte. Ingeniero de carrera, trabajó como analista de datos durante más de una década para multinacionales. Dejó este camino para dar un giro de 180 grados. Decidió aplicar todo lo que había aprendido tratando datos a una de sus pasiones, el deporte, más concretamente el fútbol. “El uso del big data lo que hace es optimizar los rendimientos alrededor de la industria, en este caso, del deporte. Te permite tener detalles e información que antes no eras capaz de controlar. Y si eres capaz de hacer buen uso del big data, tendrás un valor añadido a tu disposición”.

Los deportes que más usan big data

Big data

La película Moneyball, estrenada en 2011 y protagonizada por Brad Pitt, es ampliamente aplaudida como el reflejo del inicio del big data en el deporte. La acción se sitúa en 2001, en un equipo de la liga estadounidense de béisbol. Las técnicas de análisis empleadas para crear un equipo equilibrado con poco presupuesto fueron pioneras.

De ahí que el béisbol sea uno de los deportes donde más han calado las técnicas de análisis. Deloitte ha calculado la penetración del big data deportivo en Estados Unidos, donde más rápido se ha adoptado esta tecnología. En la Major League Baseball (MLB), el 97% de los equipos usan analytics y consultores profesionales. En la NBA, un 80% de las franquicias deportivas lo usan, mientras en la NFL (National Football League) el porcentaje es sensiblemente menor, un 56% de equipos emplean técnicas de análisis de datos.

Big data deportivo en España

La idiosincrasia deportiva en España es muy diferente. Con lo que no extraña que el deporte donde más se usa sea otro. “En España, al igual que en muchas partes del mundo, el fútbol es el deporte en el que más se están aplicando técnicas y estrategias big data, tanto para los aspectos relacionados con lo que pasa dentro del terreno de juego como para aquellos más relacionados con la gestión o el marketing”, explica Sáez.

El dominio indiscutible del fútbol en el ámbito de los espectáculos deportivos no quita para que asomen otras disciplinas. Sáez menciona el baloncesto, el ciclismo, el tenis, el pádel y el rugby como estrellas ascendentes en el uso del big data.

Y, por supuesto, bádminton. Telefónica es, de hecho, el partner tecnológico de la campeona olímpica Carolina Marín. Se establece, en este sentido, una estrecha colaboración con el equipo técnico de la deportista española y la unidad de datos de la teleoperadora para el uso de analítica avanzada en relación con los datos de competición y entrenamiento.

Para qué sirve el big data en el deporte

Las aplicaciones del big data deportivo se pueden rastrear tanto dentro como fuera del terreno de juego. La táctica y la estrategia son parte fundamental, pero también lo es el cuidado de los deportistas y los fichajes.

Conocerse y conocer al rival

Una de las vertientes que ha sido clave desde el inicio del big data en el deporte es la creación de una estrategia basada en datos. “Se presentan múltiples opciones relacionadas esencialmente con el análisis del equipo propio y del rival, comúnmente conocido como entorno competitivo. En este sentido, se utilizan múltiples métricas, unas más personalizadas y otras menos, que sirven para describir de forma objetiva modelos de juego, sistemas, ocupación de espacios y, por descontado, características de plantillas y jugadores”, apunta Sáez.

El CEO de Sports Data Campus destaca que cada vez cobra más interés el videoanálisis. Existen muchos informes que se apoyan en la visualización de imágenes de vídeo para extraer conclusiones. Las nuevas tecnologías, de análisis de imagen permiten obtener una creciente información de estos documentos.

Daniel Pérez pone el foco sobre los deportes individuales, normalmente más fáciles de analizar. “En ciclismo, por ejemplo, [el big data] se usa mucho para medir rendimientos individuales en directo. De esta manera pueden intentar predecir los esfuerzos que necesita hacer el ciclista en cada momento para lograr determinado rendimiento.  El rendimiento en ciclismo es en cierta forma más simple que en fútbol. Por ese motivo es mucho más efectivo a día de hoy”.

Evitar lesiones en los jugadores

El cuidado de los deportistas y de los atletas es otra de las aplicaciones importantes de la analítica de datos. “Se usa con el fin, no solo de alargar su carrera deportiva, también para minimizar los riesgos de lesiones”, expone Sáez, en referencia al fútbol en este caso.

Aquí, la información proviene de fuentes muy diversas, que influyen en la salud del atleta. “Se juntan datos deportivos, biométricos, físicos, genéticos, químicos. Y se aprovechan todos para diseñar modelos de entrenamiento con una gestión de cargas personalizada, con el objetivo de prevenir lesiones, sobre todo las provocadas por la sobrecarga muscular”.

Captación de talento

Tanto en el fútbol como en otros deportes destaca el papel de la analítica avanzada en los fichajes. Según Pérez, en el deporte rey actualmente es la aplicación principal: la captación de talento.

“En fútbol puedes tener un jugador con unas determinadas características que ha funcionado bien en tu equipo, es decir, en un contexto con donde se relacionado con otros 10 jugadores en el campo”, plantea Pérez, no sin puntualizar que el rival también juega un papel, que merece análisis aparte. “Si tienes que sustituir a ese jugador puedes intentar encontrar alguien con características similares para reducir el margen de error. El big data te ayuda a encontrar ese jugador adecuado haciendo uso de las variables adecuadas”, concluye.

Dispositivos y herramientas de medición de datos

big data en el deporte

Para recopilar toda la información necesaria, de las competiciones y del rendimiento de los jugadores, se usan diferentes técnicas. “Los datos pueden obtenerse tanto de forma interna, que serían los generados por la propia entidad o club deportivo, como externa, a través de análisis externos o retransmisiones en medios”, sostiene Sáez.

El CEO de Sports Data Campus subraya que la información se obtiene de dispositivos IoT, sensores y también de la mera observación. “Los más utilizados van desde los wareabeles, como relojes y pulseras, hasta chalecos que pueden integrar tanto dispositivos GPS como biométricos, que miden pulsaciones, presión arterial u otros parámetros. Otros dispositivos se integran en las espinilleras y, además de llevar GPS, en estos casos suelen integrar acelerómetros que aportan datos relacionados con aceleraciones, potencia de golpeo, pierna de golpeo”, explica Sáez, siempre refiriéndose al fútbol.

“En juego, aplicaciones como Mediacoach de LaLiga integran datos de tracking más datos de eventing. Esta combinación se conoce a nivel técnico como RAW Data y es una fuente inagotable de trabajo para el científico de datos deportivo”, Sáez profundiza en la diferencia entre estos dos tipos de información: tracking y eventing. “En el caso de MediaCoach, los datos de tracking se recogen a través de las cámaras ópticas con las que están dotados todos los estadios de LaLiga Santander y LaLiga Smartbank. Los de eventing recogen las acciones que se generan con balón, como goles, pases o saques de esquina, así como todas las distinciones que se pueda hacer de los propios eventos”. Con esta última frase, el experto se refiere a eventos como pases largos, pases cortos, pases que rompen la línea de presión y cualquier otra categoría que pueda tener interés.

Aunque muchos deportes comparten algunas herramientas de medición, también hay otras específicas para cada disciplina. “En ciclismo, las bicis son auténticos ordenadores y, por ejemplo, miden los vatios de potencia utilizados en competición por el ciclista”, señala Pérez. “Son capaces de predecir con bastante acierto las energías y el tiempo que un determinado deportista puede estar pedaleando con una determinada potencia. Con esa información, puedes ayudar al ciclista con la estrategia de carrera”.

El tratamiento de los datos

Después de recoger la información sobre el juego y el rendimiento de los jugadores hay que procesarla. Esta es otra parte crucial, pues define qué es lo que importa y en qué grado. Al mismo tiempo, en esta fase es donde se modera el peso de los factores que no son tan fundamentales en el resultado final.

“La limpieza y el tratamiento de los datos se suele realizar a través de lenguajes de programación como R o Python. Destaca PySpark para el diseño o la utilización de modelos y algoritmos de machine learning, enfocados al diseño de modelos analíticos, predictivos o de inteligencia artificial”, apunta Sáez.

Visualización

Una vez realizado el tratamiento, dependiendo del usuario que vaya a trabajar con los resultados, estos se presentan de una y otra forma. “Existen múltiples herramientas para la presentación de los informes o el diseño de cuadros de mandos. La parte conocida como ‘visualización, es clave para que el proceso sea eficiente”, refiere Sáez.

En muchas ocasiones esta visualización está orientada a personas como entrenadores, directores deportivos, fisioterapeutas. En definitiva, gente que tiene que tomar decisiones sobre ciertos aspectos de la competición y de los deportistas. Pero no son perfiles especializados en datos, con lo que la información tiene que transmitirse de forma fácil de ver. “A mi modo de ver, las dos herramientas más utilizadas para trabajar las visualizaciones en el mundo del deporte son Tableau o Microsoft PowerBI”, indica Sáez.

Toma de decisiones informada

A partir de aquí es cuando entran en juego las conclusiones extraídas de todo el proceso. Se convierten en un factor para la toma de decisiones, uno que cada vez tiene mayor relevancia. “Entrenadores, ojeadores o directores deportivos cada vez utilizan más herramientas big data en sus procesos de decisión”, afirma Sáez. Pero los analistas de datos no están desligados de estos profesionales del deporte. “Es esencial que el científico de datos que trabaje en el medio deportivo tenga claros los conceptos del juego porque sus análisis, desde la fase de génesis, tendrán mucho más valor”.

Después de todo hay que recordar que el big data se emplea como complemento al conocimiento de los profesionales deportivos. Su uso es creciente pero aún desigual entre diferentes disciplinas. Pérez distingue especialmente entre deportes individuales y de equipo. “En un deporte individual tienes menos variables que analizar, el entorno está mucho más controlado. En un deporte de equipo las posibilidades se multiplican. La clave y la complejidad es la interacción. De ahí que sea más difícil de analizar”, sostiene.

RELACIONADOS