Una de las tareas más desafiantes en el análisis de big data es ir más allá de identificar patrones y comprender por qué surgieron dichos patrones. Algunas veces, los patrones confirman lo que ya hemos adivinado y brindan soporte a nuestras suposiciones. No obstante, otras veces, también hay patrones inesperados que nos ayudan a pensar en posibles razones y obtener nuevos conocimientos.
En el grupo científico de Telefónica, el equipo liderado por Souneil Park está ejecutando un proyecto llamado Mobility Semantics, que tiene como objetivo respaldar las interpretaciones y los conocimientos profundos sobre los patrones de movilidad urbana a gran escala. En pocas palabras, el proyecto combina registros de telecomunicaciones (movilidad) con datos geo abiertos de la web (semántica) para dicho objetivo. En lugar de simplemente descubrir que hay movimientos frecuentes entre el área A y el área B, queremos entender por qué se realizan esos movimientos frecuentes: ¿qué hay de especial en A, B y la relación entre ellos?
Los datos geográficos de la web ofrecen información prometedora para tales preguntas. Junto con los avances en informática móvil, muchos servicios geo-sociales (Foursquare, Google Places, etc.), aplicaciones de mapas y sitios web de guías locales han crecido de manera espectacular. Éstos registran no solo los lugares existentes y sus ubicaciones, sino también las experiencias y preferencias de las personas que realmente han estado allí. Como tales, son un gran recurso para aprender el significado que los lugares tienen para las personas, y para contextualizar los movimientos cerca de esos enclaves.
En este blog, mostramos algunas partes de nuestro estudio sobre la movilidad entre los 70 barrios de Barcelona. En primer lugar, para estimar la movilidad entre barrios, utilizamos las llamadas a móviles y los registros de SMS, ambos incluyendo la hora del evento y la localización geográfica de la antena conectada. Todos los números de teléfono fueron encriptados y las localizaciones fueron abstraídas y agregadas a nivel de barrio.
En segundo lugar, desarrollamos un perfil de cada barrio identificando y agregando todos los lugares que se encuentran en muchos sitios web geográficos, incluidos Foursquare, Google Places, Facebook, TripAdvisor, y también los datos del Servicio de Datos Abiertos del Ayuntamiento de Barcelona. Recopilamos la información del lugar, categoría, comentarios, calificaciones, etc. Como hicimos nuestra colección de lugares de diversas fuentes (en total 15), se incluyen de manera exhaustiva varios tipos de lugares, no solo restaurantes famosos o atracciones, sino también lugares comunes de la vida cotidiana, por ejemplo escuelas, panaderías, farmacias y talleres de reparación.
Ahora veamos qué podemos aprender combinando movilidad con datos de geo-semántica. Las dos imágenes de la Figura A que se muestra a continuación son capturas de pantalla de nuestra herramienta de análisis visual. Una vez que un usuario hace clic en un barrio, la herramienta cambia el color de los barrios para mostrar la frecuencia de movimientos de todos los demás barrios al barrio seleccionado (izquierda), o de los otros barrios a los seleccionados (derecha). El ejemplo de seleccionar el barrio La Vila de Gràcia muestra que los residentes de Sant Gervasi – Galvany lo suelen visitar a menudo (izquierda), mientras que los residentes de La Vila de Gràcia visitan con frecuencia La Dreta de l’Eixample.
La característica clave de la herramienta es la vista del perfil del barrio, a la derecha. Ésta permite comparar un par de barrios en términos de los diferentes lugares que tienen. Veamos esta característica usando el ejemplo de la movilidad de Pedralbes a Les Tres Torres (Figura B). Pedralbes es una conocida zona residencial de la parte alta de Barcelona, famosa por muchas escuelas, un campus universitario y nuevas oficinas. Esto se muestra a través del diagrama de burbujas de la vista de perfil, donde el círculo blanco representa las cosas en Pedralbes y un usuario puede ver que las burbujas son relativamente más grandes para la categoría ‘Educación’ y ‘Administrativo’.
Por otro lado, las burbujas verdes representan las características de Les Tres Torres, y la comparación destaca que este barrio comprende más lugares de la categoría ‘Salud’. De hecho, el barrio tiene un hospital bien conocido, muchos otros centros médicos privados e instalaciones relacionadas. La comparación sugiere que los movimientos de Pedralbes a Les Tres Torres podrían relacionarse a menudo con las instalaciones médicas.
La herramienta también es útil para los casos que no se explicaron fácilmente a través de los modelos de movilidad tradicionales. El ejemplo de la Figura C muestra la frecuencia de visitas a El Raval desde otros barrios. Mientras que los modelos tradicionales enfatizan que la distancia es un factor importante de movilidad, el mapa de movilidad muestra una excepción. Se observan menos visitas desde El Barri Gòtic hasta El Raval, aunque están uno al lado del otro.
La vista del perfil nuevamente ofrece algunas ideas para entender la situación. Como se muestra a través de las burbujas blancas, El Raval es una de las zonas del centro de la ciudad donde la gente suele visitar para salir de marcha y comprar. El Barri Gòtic es otro barrio que compone el área del centro de la ciudad que también tiene muchos lugares para la vida nocturna y las atracciones. La herramienta sugiere la interpretación de que El Raval podría ser menos atractivo para los residentes de El Barri Gòtic, y que otros factores además de la vida nocturna o la atracción serían más importantes para que estos visiten otros barrios.
Como se muestra a través de los ejemplos anteriores, creemos que se pueden encontrar datos útiles si se combinan más datos contextuales con la movilidad. Nos ayudan a especular sobre los motivos, los objetivos y las diferentes preferencias que están detrás de los movimientos de las personas, lo que podría ser valioso para diversos proyectos de bienestar urbano, servicio, diseño de experiencias y planificación. Planeamos mejorar continuamente la herramienta y también expandirla para cubrir otras ciudades. ¡Manténganse al tanto!
Referencias
Souneil Park, Joan Serrà, Enrique Frias Martinez, and Nuria Oliver. «MobInsight: A Framework Using Semantic Neighborhood Features for Localized Interpretations of Urban Mobility.» To appear in ACM Transactions on Interactive Intelligent Systems (TiiS).
Souneil Park, Marc Bourqui, and Enrique Frias-Martinez. «Mobinsight: understanding urban mobility with crowd-powered neighborhood characterizations.» (Demo) IEEE 16th International Conference on Data Mining (ICDM). 2016.