san valentin infidelidad inteligencia artificial ia

Especial San Valentín: ¿podemos predecir la infidelidad con IA?

¿Qué tiene que ver la IA con todo esto? La Inteligencia Artificial no tiene nada que ver con el amor, ni con el desamor, pero este San Valentín la podemos predecir una infidelidad.

Cada día, vemos cómo la Inteligencia Artificial se va incorporando a más y más facetas de nuestra vida de la mano de la digitalización. Porque, en sus orígenes, los avances de estas tecnologías se restringían a los ámbitos empresariales o industriales. Sin embargo, hoy día, ha saltado también al campo de la vida cotidiana de las personas de a pie, haciendo que veamos como naturales cosas que hace unos años eran pura “ciencia ficción”.

Hoy, en «honor a San Valentín«, en el blog de LUCA nos hemos planteado gastaros una pequeña broma. Porque no vamos a hablar de amor, sino más bien de lo contrario: de infidelidades. Aunque los amores «no oficiales» también pueden serlo de verdad, ¿no?

¿Y qué tiene que ver la Inteligencia Artificial con todo esto? La IA no tiene nada que ver con el amor, ni con el desamor. Pero podemos usarla para “aprender” de los datos y que nos ayude a predecir si una persona va a tener una “aventura” o no. En resumen, construir un “predictor de infidelidad” basado en IA.

Los datos que vamos a usar para crear el predictor son unos “viejos conocidos” de los aprendices de Machine Learning. Se trata del dataset “Affairs” , basado en una encuesta realizada por la revista Redbook en 1974, en la que se preguntaba a mujeres casadas por sus aventuras extramaritales. (Para más información, se puede consultar el trabajo original publicado en 1978 por el Journal of Political Economy).

A partir de 6366 respuestas anónimas (recogidas por correo postal o por teléfono; por cierto, qué largo, caro y costoso era hacer encuestas hace unos años), se definen 9 variables distintas (edad, años de matrimonio, valoración de su matrimonio, número de hijos, nivel educativo, ocupación, ocupación del marido, y religiosidad, tiempo “dedicado” a tener un affair), y una nueva variable, fidelidad. Aplicaremos un algoritmo de clasificación (en este ejemplo, una sencilla regresión logística que permitirá predecir para un nuevo caso propuesto (por ejemplo, mujer de 25 años, 2 años de matrimonio, sin hijos, estudios universitarios, algo religiosa etc.) la probabilidad de que sea infiel (o no) a su pareja.

Como curiosidad, en el análisis previo de los datos, se pueden apreciar cosas curiosas, como el hecho de que el menor número de infidelidades se da en los niveles educativos extremos: mujeres con nivel básico de educación o profesionales con una muy alta cualificación. También se aprecia cómo es en los primeros años de matrimonio cuando se observa un mayor número de infidelidades. Otras observaciones, muy lógicas, muestran cómo según aumenta el sentimiento de religiosidad, o el nivel de valoración de su matrimonio, las infidelidades son menos probables. También, cuando aumenta el número de hijos (¡no hay tiempo para aventuras!).

Bromas aparte, siempre hay que tener en cuenta de dónde salen los datos de los que se alimenta el algoritmo. Así que, si hablamos de una encuesta de 1974, realizada en EE.UU., donde sólo se pregunta a mujeres, podemos imaginar un gran número de sesgos de tipo local, económico etc. Aunque se consideren distintos niveles educativos y ocupaciones, el ser lectora de una revista ya supone un determinado condicionamiento. También habría que tener en cuenta la fiabilidad del proceso de captación y procesamiento de los datos.

En cualquier caso, como ejercicio para aprender Data Science, y como entretenimiento para “el día de los Enamorados” nos sirve. Si alguien se anima a crear su propio predictor, en el blog de LUCA explicamos cómo hacerlo, paso a paso.

¡Feliz San Valentín!

Sobre el autor

RELACIONADOS