Tráfico diario: ¿puede el Big Data resolver el problema?

Sentados en nuestros vehículos durante la congestión del tráfico, muchos de nosotros pensamos: ¿de dónde vienen estas personas?¿hacia dónde van?¿vamos todos en la misma dirección?

Quizás la señora del coche de al lado, en realidad, vive a dos puertas de mi casa y hace exactamente el mismo recorrido que yo cada día. En LUCA, decidimos hacer un enfoque basado en datos tomando nuestros conocimientos de datos móviles para mostrar el enorme potencial del car sharing, demostrando que las personas que nos desplazamos tenemos mucho más en común de lo que pensamos.

 

 Figura 1: ¿Cómo puede Big Data permitirnos incentivar el uso de coche compartido entre las personas que se desplazan?

Figura 1: ¿Cómo puede Big Data permitirnos incentivar el uso de coche compartido entre las personas que se desplazan?

Smart Steps es parte del portfolio de LUCA y nos permite obtener insights sobre la movilidad a partir de los datos de eventos móviles de nuestros clientes. Después de anonimizar y agregar los datos, podemos comprender el perfil demográfico de grupos de teléfonos móviles (que actúan como un indicador para grupos de personas), así como a identificar la ubicación de su residencia y de su lugar de trabajo:

Figura 2: Smart Steps proporciona conocimientos innovadores sobre la movilidad
Figura 2: Smart Steps proporciona conocimientos innovadores sobre la movilidad

En este análisis decidimos usar Smart Steps para tener un impacto social, fijándonos en cómo nuestro producto puede contribuir a objetivos sostenibles. En primer lugar, pre-procesamos nuestros datos anonimizados en bruto, para obtener información útil de modo recurrente. Un ejemplo de ello es la asignación de POIs (puntos de interés) que pueden ser «hogar» o «trabajo».

Como puedes imaginar, estos POIs están calculados en base a patrones de movilidad. Así que empezamos a pensar en utilizar casos relacionados con la economía compartida, la planificación del transporte público, el impacto medioambiental y la construcción de infraestructuras. Al final, decidimos centrar nuestro análisis en un día típico en Madrid, que sufre unas retenciones de tráfico tremendas en horas punta (como en muchas ciudades) y recientemente se ha visto afectada por graves problemas de contaminación. Decidir cómo abordar estos problemas es un auténtico reto para las autoridades, así que hemos desarrollado una sencilla herramienta que sondea cuántas personas comparten el código postal tanto de su residencia como de su lugar de trabajo.

¿Dónde trabajamos?

En primer lugar, realizamos la extracción de un mapa de calor que muestra la densidad de trabajadores en cada código postal en Madrid. Más abajo puedes ver este mapa y compararlo para ver si está alineado con tus expectativas. Cuanto más oscuro es el color, mayor el número de trabajadores en esta área:

Figura 3: Distribución de la densidad de trabajadores en Madrid.
Figura 3: Distribución de la densidad de trabajadores en Madrid.

Después decidimos ir más allá, mirando la captación de las oficinas centrales de Telefónica, estableciendo desde dónde vienen cada día los trabajadores. Expandimos el mapa de calor más abajo en nuestro vídeo demo aquí si te interesa:

Figura 4: ¿De dónde procede la gente que va al código postal de Telefónica?
Figura 4: ¿De dónde procede la gente que va al código postal de Telefónica?

¿Cómo nos movemos por la ciudad?

Inmersos plenamente en esta parte del análisis, decidimos hacer un sencillo panel que nos pueda mostrar las relaciones hogar-trabajo entre todos los códigos postales de Madrid. Con esto, acabamos creando una herramienta que nos puede ayudar a, por ejemplo, encontrar compañeros que compartan coche, que tengan en común diariamente el código postal tanto del lugar de residencia como de trabajo, lo que proporciona una oportunidad única para las empresas y el sector público para fomentar esta iniciativa verde (la semana próxima elaboraremos un post más específico sobre compartir coche).

No satisfechos con ello, llevamos el análisis un paso más allá, mirando con más detalle los movimientos diarios de masas. Agrupamos los códigos postales en cuatro zonas (1) Interno-Norte, (2) Interno-Sur, (3) Externo-Norte y (4) Externo-Sur. «Interno» es la zona que queda dentro de la autopista M30 y «Externo» es el resto de la Comunidad Autónoma de Madrid. Basándonos en estas zonas, podemos ver cómo se mueven las masas. En el siguiente vídeo explicamos cómo funciona este panel:

https://youtu.be/vrcG3t8jWD0

Vídeo 1: ¿Cuántas personas comparten el código postal tanto de su residencia como de su lugar de trabajo? ¿Cuantas personas se mueven dentro y fuera del centro de Madrid?

Otra gran manera de comprender y visualizar cuántas personas se mueven en Madrid es utilizar análisis de gráficos. El conjunto de datos de desplazamiento contiene un recuento agregado del número de personas que se mueven de su lugar de residencia (código postal A) a su lugar de trabajo (código postal B). Esto se puede ver directamente como un grafo dirigido en que los vértices son códigos postales y las aristas están ponderadas por el conteo de la gente que se mueve. Entonces realizamos un preproceso y ejecutamos el algoritmo de detección de comunidad en Gephi para saber qué grupos de códigos postales están conectados intrínsecamente (comunidades). El algoritmo produjo 5 grupos o comunidades que puedes ver más abajo:

Figura 5: Utilizamos Gephi para detectar 5 comunidades de códigos postales altamente comunicados
Figura 5: Utilizamos Gephi para detectar 5 comunidades de códigos postales altamente comunicados

Así podemos representar vértices y colores (comunidades) en un mapa utilizando Spotfire:

Figura 6: Izquierda: Grupos coloreados de códigos postales conforme a la correlación de movilidad (comunidades). Derecha: Para cada comunidad, hay códigos postales que muestran más actividad y por lo tanto actúan como «polos de atracción» para su comunidad.
Figura 6: Izquierda: Grupos coloreados de códigos postales conforme a la correlación de movilidad (comunidades). Derecha: Para cada comunidad, hay códigos postales que muestran más actividad y por lo tanto actúan como «polos de atracción» para su comunidad.

Como podéis ver en la figura 6 y en el segundo vídeo, existen zonas claramente definidas y, en general, la gente parece vivir y trabajar en la misma zona (Norte, Este, Sur, Central y Oeste), ya que los colores son relativamente compactos. Esto es beneficioso para la calidad de nuestro aire, ya que implica desplazamientos más cortos para ir a trabajar. Sin embargo, hay una excepción con la comunidad «azul» (Madrid Este también es conocida como el «Corredor de Henares»), ya que muestra un patrón mucho más disperso que el resto.

https://www.youtube.com/watch?v=FGZqRm_tbCA

Vídeo 2: ¿Cómo identificamos comunidades connectadas? 

¿Cuántas personas comparten el código postal tanto de su residencia como de su lugar de trabajo? ¿Cuántas personas se mueven dentro y fuera del centro de Madrid?

Otro enfoque interesante es investigar los «polos de atracción» de cada comunidad, o sea, los códigos postales con el mayor número de desplazados dentro de su zona (los círculos más grandes en el gráfico Gephi y el mapa en la figura 5), que son realmente las «zonas más congestionadas» de cada zona. Esto también se demuestra en el segundo vídeo.

Por supuesto, nuestro análisis es un acercamiento relativamente sencillo y directo a lo que podría ser una herramienta mucho más completa. Se pueden realizar muchos ajustes, incluyendo mayores capacidades y datos más extensos que podrían completar el análisis. Sin embargo, este es un primer paso para comprender cómo los individuos, las empresas, las ONG o las administraciones públicas podrían utilizar estos datos para mejorar nuestras vidas de forma anonimizada y agregada, priorizando la seguridad en cada etapa del camino.

Después de leer esto, ¿tienes más ideas sobre cómo aplicar nuestros datos? Cuéntanoslo enviando un correo electrónico aquí o comentando en este post. Nos encantaría tener noticias tuyas.

Sobre el autor

RELACIONADOS