Tal vez aún no hayas comenzado a preocuparte por ello, pero las técnicas de análisis de datos hace ya mucho tiempo que son capaces de reconocer entidades analizando ficheros de registro de eventos, también llamados ficheros log. En el caso de Internet esto se consigue de forma sencilla, analizando lo que se puede llamar “la huella digital de tu conexión” , e incide directamente en tu privacidad.
Si tenemos un servicio en Internet, en el que se exige la creación de una cuenta, y el registro para su uso, tenemos un seguimiento de las acciones fácilmente reconocible por todos, ya que nos hemos identificado al entrar en el servicio. Menos evidente, aunque fácil de comprobar, es el tracking de acciones mediante el uso de cookies en los navegadores. En este esquema, el sitio web que se visita crea una cookie única por cada conexión nueva, de tal manera que realiza un tracking de todo lo que el poseedor de esa cookie realiza en el sistema.
Este tipo de cookies de tracking de acciones son fáciles de detectar, ya que suelen tener un periodo de vida muy largo en los navegadores y es muy común. En la imagen siguiente se puede ver cómo con solo conectarnos a la web del Bank of America, se cargan dentro de nuestro navegador muchas cookies con una fecha de expiración muy lejana en el tiempo.
Para que el usuario pueda tener un control de estas cookies, los navegadores implementan esquemas de privacidad que le permiten gestionar al usuario qué ficheros javascript o cookies quiere que sean cargadas en su sistema. Google, por ejemplo, encontró la forma de saltarse estas medidas en los navegadores Apple Safari e Internet Explorer, para seguir haciendo tracking de las acciones de los usuarios , lo que le llevó a ser demandado y tener que pagar una multa.
Por supuesto, la información que se puede obtener haciendo tracking a las acciones de un usuario tiene un valor incalculable para los negocios de marketing y publicidad, y es por ello que aparecen nuevas formas de realizar este seguimiento de acciones y la identificación de la persona que las realiza.
La última y más sutil de estas formas es un análisis cuasi-pasivo en el que se analiza la información que se pude obtener de la navegación de un usuario por una página, que es casi única. La idea es que las características de un cliente de navegación es casi único en Internet. A ver si me explico:
Supongamos que somos una multinacional con un conjunto de servicios de web que van desde la publicación de vídeos online, hasta correo electrónico con acceso web, pasando por repositorios de código, noticias y un buscador de Internet. En esas páginas, cada vez que me conecto se recogen una serie de características de mi navegador, como la versión exacta de éste, el idioma, la fecha y la hora, la resolución de pantalla, las fuentes tipográficas instaladas, en el sistema operativo, los plugins configurados en el navegador, la dirección IP de conexión, etc…
De esta manera, en el fichero de registro se almacena que un tipo con una conexión de estas características ha visto un vídeo en una web, que un tipo con estas características ha leído una noticia concreta o ha buscado un término en el buscador. La pregunta es ¿son estas acciones anónimas por el mero hecho de no estar autenticado en un servicio?
La respuesta, evidentemente es no. La probabilidad que de otra persona tenga la misma configuración que tienes tú, es de 1 entre varios millones, según mide el proyecto Panopticlick de la Electronic Frontier Foundation, con lo que si estamos en España, donde hay unos 50 millones de equipos con idioma ES, y navegamos con un Mac OS X, reducimos la lista a, por especular 1 millon. si resulta que tenemos un Mac OS X Lion y navegamos siempre con Opera 11, tal vez haya solo 500 personas en España, pero haciéndolo desde Málaga, y con una configuración concreta de plugins, y fuentes True Type en el sistema, este valor se puede reducir a 2 … o 1. En mi ejemplo, soy único entre los más de dos millones trescientos mil equipos probados.
Si además se da la coincidencia de que en el algún momento te registras en un servicio que recoge tu cuenta de usuario y toda esta información de tu conexión, todo lo que hayas realizado con anterioridad o posterioridad al momento de registrarte en el servicio quedaría asociado a tu electronic profile.
Este tipo de actividades pueden ser realizadas, especialmente por compañías con un gran volumen de tráfico y servicios en Internet, y es algo que preocupa a gran parte de los usuarios de Internet, y seguro que se va a convertir en un debate público en el futuro.¿Cuánto sabe una empresa de Internet de mí solo por medio de la creación de la huella digital de mi conexión?
Uno de los jóvenes de Talentum Startups ShortTrack está llevando un proyecto de anonimato de datos, para que una empresa pueda ser transparente con sus clientes, llamado Data Vaulting, y que os contaremos en el futuro cómo funciona en detalle.