La dinámica de propagación de la epidemia viene definida por nuestro comportamiento y la estructura de nuestras redes sociales, junto con la distribución geográfica característica de la población. Las medidas de contención deben aplicarse de forma quirúrgica a zonas y grupos de riesgo específicos. Veámoslo con la ayuda de otro ámbito donde geografía y hábitos humanos son clave: las redes de telecomunicaciones.
Si me preguntaran qué día me hice consciente de la debacle que el COVID-19 iba a generar en todo el mundo, les diría que fue el 12 de marzo. Después de días contemplando el desastre en otros países, me desperté y descubrí que mi vida había sido puesta en cuarentena.
Como responsable de Análisis de Redes en un operador de telecomunicaciones, tuve una posición privilegiada para ver cómo cambiaba todo. Los primeros días tras el inicio del confinamiento dedicamos horas interminables a analizar los datos que recibíamos de los nodos de la red. Era esencial entender cómo nuestros clientes estaban entrando repentinamente en «modo cuarentena», y de qué manera afectaba a las redes.
La comunicación es esencial para los humanos. Apenas somos conscientes de cuánto tiempo dedicamos a charlar con otras personas… hasta que no podemos hacerlo. La primera consecuencia del confinamiento fue un salto inmediato en nuestra demanda de llamadas de voz. El tráfico de voz creció un 35% en un par de días y mantuvo estos valores tan altos durante semanas.
También descubrimos una forma más completa de comunicación a través de videoconferencias. Las aplicaciones de videoconferencia, utilizadas tradicionalmente (y con escaso entusiasmo) en entornos empresariales, se convirtieron nuestra tabla de salvación.
El teletrabajo hizo que el uso de las videoconferencias se disparara, pero también el uso no profesional dio lugar a una demanda formidable. Todas las aplicaciones relacionadas con la capacidad de reunirnos remotamente con otras personas, ya sea con fines profesionales o personales, experimentaron un crecimiento espectacular.
A esta tendencia se añadió un desaforado crecimiento en el consumo de contenidos de vídeo, así como de juegos online. Además de comunicarse con otras personas, los humanos tienen una notable necesidad de evitar aburrirse. El efecto fue un salto del 35% en el tráfico de banda ancha fija y del 20% en el tráfico de banda ancha móvil. Será este el que utilice de referencia para hablar de los efectos sobre nuestra red.
¿Qué pasó con las redes de telecomunicaciones?
Un crecimiento tan repentino de la demanda no es fácil de asimilar. Tuvimos que aumentar nuestra capacidad en toda la red en las primeras semanas de confinamiento. Pero probablemente no como alguien no familiarizado con las Redes de Telecomunicación podría imaginar.
La respuesta trivial a la pregunta de cómo hicimos crecer nuestra capacidad de red sería pensar que aumentamos en un 20% la dotación de en todos nuestros nodos, ya que éste había sido el crecimiento del tráfico. No fue así. Afortunadamente, los componentes de una red de telecomunicación siguen una distribución de cola larga en muchas de sus características y el crecimiento de la demanda que he mencionado antes se distribuyó muy desigualmente entre todos ellos. De hecho, el crecimiento del tráfico siguió esta distribución:
Este gráfico nos permite descubrir de qué forma tan diferente afectó el confinamiento a cada nodo de nuestra red de acceso. Mientras que el 10% de nuestros emplazamientos observaron un incremento de tráfico de entre x2 y x3 (barras de «100-200%» y “>200%”), el 20% de ellos experimentó una significativa disminución en la demanda (barra etiquetada como «Negativo»).
Aumentar todos los nodos según la subida global del tráfico habría sido un error garrafal, como se podía ver en el artículo dedicado a las distribuciones de cola larga (link). Nunca se deben tomar decisiones de inversión basadas en valores promedio o agregados.
En realidad, necesitamos mejorar tan solo unos cientos de nodos, no toda la red. Lo que es una buena noticia, ya que ninguna organización está dimensionada para actualizar inmediatamente miles de nodos. La logística juega un papel importante en todo lo que estamos viviendo, aunque no lo abordaremos ahora.
Pensemos ahora qué nodos fueron necesario actualizar con más urgencia. Si miramos el gráfico anterior, la primera idea sería empezar con los nodos que vieron crecimientos del 100% o 200%. No es así. En realidad, tuvimos muchos más problemas en los nodos donde el tráfico creció «solo» un 50%, o menos. Otra idea contraintuitiva, lo sé. Pero pensemos un poco. El tráfico crece solo si hay margen para ello. Nuestra red está bien optimizada, así que si el tráfico puede crecer un 100% o 200% es porque el nodo en cuestión presenta un bajo grado de ocupación.
Cada nodo de la red tiene una capacidad ajustada a su demanda, pero siempre hay una capacidad mínima a instalar y, para en algunos emplazamientos, esta capacidad mínima está muy por encima del uso habitual. Pensemos en nuestros coches. No importa si normalmente lo utilizamos solo para una o dos personas, los coches tienen al menos cuatro o cinco asientos y probablemente nunca utilicemos más de uno. La misma razón hace que despleguemos nodos de red cuya capacidad está por encima de su utilización típica.
Hasta ahora hemos visto que:
- No podemos decidir cuántos nodos necesitamos mejorar solo analizando el valor agregado del aumento de tráfico.
- Incluso si analizamos el crecimiento del tráfico nodo por nodo, todavía no sabemos qué nodos actualizar. Debemos tener en cuenta la capacidad instalada real en cada uno para identificar los nodos donde este crecimiento de la demanda implica congestión.
¿Eso es todo? No, en realidad no. Para aumentar la capacidad de un nodo, normalmente la tecnología nos ofrece diferentes opciones y hay que decidir la más idónea. Debemos estar seguros de que nuestra actualización no será suficiente para al menos un año. Y para tomar esta decisión necesitamos echar un vistazo al futuro: cómo evolucionará el tráfico en los próximos meses.
La geografía es importante, y es muy importante
En las redes de telecomunicaciones la demanda de servicios está directamente relacionada con el comportamiento humano. Chatear con otros, jugar en línea o ver videos de todo tipo de plataformas son probablemente las actividades a las que dedicamos más tiempo a lo largo del día.
Hay otra característica interesante de los humanos: no ocupamos el espacio de manera uniforme. Nos gusta vivir al lado de los demás por lo que concentramos nuestra presencia en algunas áreas. Eso hace que la geografía sea muy importante para la planificación de la red. Los operadores deben desplegar más recursos donde haya más gente, teniendo en cuenta que la gente se mueve, por supuesto.
Esperamos que nuestro proveedor de telefonía móvil nos dé un buen servicio en casa, así como cuando vamos a un pequeño pueblo a pasar un fin de semana o a la playa para las vacaciones. Todos esos lugares son importantes para nosotros, en diferentes momentos.
Los patrones geográficos de la demanda de tráfico cambian a lo largo del día, cuando vamos de casa al trabajo y luego de vuelta; a lo largo de la semana, cuando pasamos nuestro tiempo de ocio fuera de casa, y, por supuesto, en las vacaciones.
Así que, la planificación de la red es una cuestión de recoger datos sobre dónde y cuándo tenemos la demanda de tráfico. Estos datos, analizados a lo largo de los años, nos proporcionan información sobre los patrones geográficos y estacionales del tráfico. De manera que, combinando estos patrones para cada nodo con nuestras mejores estimaciones sobre cómo nuestros clientes pueden aumentar su uso año tras año, elaboramos predicciones. Tenemos una idea de cómo podemos esperar razonablemente que evolucione la demanda en cada nodo.
Y entonces, la cuarentena cambió los patrones geográficos
He empezado explicando cómo nuestros patrones de comunicación cambiaron con la cuarentena, pero también nuestros patrones geográficos cambiaron mucho. Por esta razón, pudimos ver que el tráfico disminuía en al menos el 20% de nuestros nodos. Nuestros clientes comenzaron a utilizar la red desde emplazamientos diferentes a los que normalmente les atendían.
Eso tiene sentido, ya que la mayoría de nosotros no íbamos a nuestros centros de trabajo. Algunas personas también cambiaron su residencia a esa segunda casa donde suelen pasar los fines de semana o a su casa familiar, en ocasiones en una provincia diferente.
Como resultado, el tráfico apareció en zonas donde normalmente teníamos baja demanda de tráfico. Fascinante para un sociólogo. Un shock para aquellos como yo que debemos predecir la demanda de cada nodo de la red, de cara a definir las prioridades y la magnitud de las actualizaciones de la red. Nuestra distribución geográfica de la demanda estaba cambiando de la noche a la mañana y todos nuestros datos históricos sobre los patrones de tráfico de repente perdieron parte de su valor. No olvidemos que la predicción es «simplemente» el arte de obtener patrones y postular cómo evolucionarán (con la ayuda de más patrones).
Por suerte, contábamos en nuestra Red con una sólida infraestructura de recogida de información. Ponernos al día de dónde y cómo se estaba originando el tráfico fue inmediato. Por eso pudimos ajustarnos rápidamente a la nueva situación con toda la información necesaria.
El comportamiento humano y los recursos implicados: los KPIs locales son esenciales
Hemos visto que la demanda de servicios de telecomunicaciones es una consecuencia de los comportamientos de nuestros clientes (qué usan y dónde lo usan), que pueden ser bastante comunes para todos ellos. Esto genera una demanda agregada que seguimos cuando analizamos el aumento del tráfico en toda la red. Pero estas necesidades deben ser atendidas localmente, lo que crea enormes diferencias entre algunos nodos de la red y otros, dependiendo del tipo de clientes que tenemos en cada lugar y su concentración.
Infectarse con COVID-19 es también una consecuencia de nuestro comportamiento. Debemos contactar con otras personas todos los días como parte de nuestro trabajo, para comprar comida o simplemente porque los humanos necesitamos vernos para sentirnos bien. Y estos actos nos exponen a la infección.
Podemos seguir cómo el número de nuevos casos evoluciona con el tiempo a través de la curva más famosa que hemos visto en nuestras vidas, pero esta curva es solo un valor agregado. Todas las necesidades de los nuevos afectados son atendidas localmente en los centros de atención primaria.
La mayor parte de sus relaciones sociales también tienen lugar localmente: la familia comparte la misma casa y los amigos suelen vivir en la misma zona. A veces los compañeros de trabajo también viven en la misma zona. La dinámica de propagación y la atención médica de la inmensa mayoría de los pacientes es fuertemente local. Así deben ser las medidas.
No olvidemos, además, que el único medio de prevenir el contagio es evitar el contacto directo y esto significa restricciones de movilidad y de encuentro en las zonas seleccionadas con las consecuencias económicas y sociales que ello implica.
Al igual que en el caso de las Redes, no podemos aplicar medidas genéricas basadas en KPIs globales, a riesgo de cometer graves errores. Las medidas deben ajustarse a ámbitos geográficos mucho más limitados, pero para tomar estas medidas necesitamos información detallada y con la máxima granularidad. La obtención y actualización continua de esta información es lo que deben haber estado trabajando las autoridades desde el primer momento.
Después de meses siguiendo nuestra famosa «curva», ¿para qué sirve?
Para seguir la evolución del COVID-19 estamos mirando esencialmente un valor agregado, el número de reproducción (Rt), que es un KPI global. El Rt viene a representar el número de nuevos casos que aparecen cada semana (o quincena) comparado con los casos que surgieron en el periodo anterior y nos dice, en conjunto, si la propagación de la enfermedad se está acelerando o si está remitiendo.
La utilidad de esa información de tipo global es esa. Las medidas de contención de contagios han de tomarse de forma local, chequeando las tasas de transmisión con el mayor grado de detalle geográfico posible. También sería muy interesante utilizar información sobre contagios e impacto detalladas por grupos de riesgo para definir políticas ajustadas al riesgo de cada tipo de persona. Salvo limitar los accesos a residencias de ancianos no parece que hayamos utilizado más datos segregados por edad y susceptibilidad a la enfermedad de cara a definir medidas preventivas.
Sin embargo, en nuestros dos casos de estudio no todos los recursos se proporcionan localmente. Como hemos explicado para las redes, algunos recursos del sistema de salud son, en efecto, comunes en una amplia zona, incluyendo muchas zonas sanitarias locales. Las camas de los hospitales y las UCI o los recursos de pruebas serán recursos centralizados.
También, en las redes contamos con recursos que son comunes a toda la red, como el número de licencias para VoLTE instaladas. VoLTE es el acrónimo de Voice over LTE, y este servicio se proporciona desde el núcleo de la red. Debemos comprar a nuestros proveedores de equipos un cierto número de licencias, dependiendo del número total de clientes que estimamos utilizarán el servicio en el próximo año. Para esta decisión, los datos necesarios son datos globales.
La clave aquí es que debemos utilizar los KPIs globales para tomar decisiones sobre los recursos centralizados, y los KPIs locales para tomar decisiones sobre las medidas locales y los recursos distribuidos. Definir una política de «one size fits all» basada en KPIs agregados no tiene sentido, excepto cuando la propagación de la enfermedad está fuera de control, e incluso los contactos entre áreas se vuelven importantes. Nuestras autoridades sanitarias tienen la difícil tarea de evaluar los datos a nivel local, aplicar medidas centradas en lo local y decidir cuándo los datos globales recomiendan un bloqueo global.
No les envidio. Tengo una responsabilidad similar, pero para los ingenieros Telco la vida es fácil. Lo peor de lo que podemos sentirnos responsables es de que la gente no puede ver videos en sus teléfonos y si no puedes ver un video… no pasa nada.