machine learning

Machine Learning a tu alcance: “perfiles de datos”. ¿Cuál es el tuyo?

El mundo de los datos y su explotación por medio de técnicas de Machine Learning e Inteligencia Artificial es tan amplio que se hace necesario definir diferentes perfiles o roles muy diferenciados. En este post vamos a describir cada uno de ellos, explicando sus funciones y el tipo de conocimientos necesarios para desempeñarlas con éxito, así como el papel que juega cada uno de ellos en un proyecto “data-driven”.

Los dos primeros perfiles, el Administrador de Bases de Datos, y el Arquitecto de Datos, son los encargados de que los datos estén donde deben estar, y en el formato adecuado. Por otra parte, están los encargados de explotar el potencial que encierran los datos, es decir, ponerlos a funcionar. Esta es la tarea del Analista de datos y el Científico de datos.

Administrador de bases de datos (Database administrator, DBA)

  • Definición: es el responsable del diseño (físico y lógico), gestión y administración de las bases de datos.

  • Funciones: seguridad, optimización, monitorización, resolución de problemas, y análisis/previsión capacidades presentes y futuras.

  • Requisitos: es un rol muy técnico para el que son necesarios profundos conocimientos de lenguaje SQL y también, cada día más, de bases de datos noSQL. Asimismo, pueden ser necesarias habilidades de gestión dirigidas al diseño de políticas y procedimientos de uso, gestión, mantenimiento y seguridad de las bases de datos.

En definitiva, su función es asegurarse de que “la máquina, funciona”.

Arquitecto de datos (Entreprise Data Architect, EDA)

  • Definición: es el responsable de crear la infraestructura de captura, y acceso a los datos. Define cómo se mueven los datos.

  • Funciones: diseño del entorno de uso de los datos. Cómo se almacenan, cómo se accede a ellos y cómo son compartidos/utilizados por distintos departamentos, sistemas o aplicaciones, en línea con la estrategia empresarial.

  • Requisitos: es un rol estratégico, para el cual se requiere una visión del ciclo de vida completo. Por tanto, debe considerar aspectos de modelado de datos, diseño de bases de datos, desarrollo SQL, y gestión de proyectos de software. También es importante conocer y comprender cómo las tecnologías tradicionales y las emergentes pueden contribuir al logro de los objetivos empresariales.

En definitiva, su función es asegurarse de que “definir la visión global”.

machine learning

Manager de Gobernanza de datos (Data Gobernance Manager)

  • Definición: es el encargado de definir y organizar el proceso de recogida, almacenamiento, y acceso a los datos, garantizando en todo momento su seguridad y confidencialidad.

  • Funciones: definir y verificar el cumplimiento políticas y conformidad con estándares. Gestionar el ciclo de vida de los datos y cerciorarse de que éstos estén custodiados de forma segura y organizada, y de que sólo pueden acceder a ellos las personas autorizadas.

  • Requisitos: para este rol es necesario combinar un conocimiento funcional de cómo funcionan las bases de datos y otras tecnologías asociadas, con uno conocimiento profundo de las regulaciones de cada industria en particular (financiera, farmacéutica, telecomunicación etc.).

En definitiva, su función es “Definir y asegurar el cumplimiento de las reglas que definen el flujo de los datos”.

Una vez tenemos un sistema en el que los datos están bien organizados, accesibles y custodiados de forma segura, lo que nos interesa es sacarles partido, extraer de ellos esos valiosos “Insights” o claves sobre patrones de comportamiento que, aplicados a nuestros procesos del día a día los hagan más eficientes e innovadores. Este es el momento en que entran en juego dos nuevos roles.

Analista de datos (Data Analyst)

  • Definición: es el encargado de analizar mediante técnicas estadísticas (entre otras) los datos históricos de la organización para poder tomar decisiones futuras mejor informadas (desde cómo evitar la fuga de clientes, a la definición de estrategias de precios).

  • Funciones: se trata de analizar datos históricos para detectar patrones de comportamiento o tendencias. (Análisis descriptivo y/o predictivo).

  • Requisitos: para este rol son fundamentales los conocimientos sobre estadística, unidos a habilidades de pensamiento crítico. También son de gran importancia las habilidades de comunicación.

En definitiva, su función es “Comprender lo que ha sucedido en el pasado para tomar mejores decisiones en el futuro”.

machine learning

Científico de datos (Data Scientist)

  • Definición: es el encargado de realizar un análisis prescriptivo del histórico de datos empresariales, de forma que no sólo puede anticipar qué va a pasar en el futuro y cuándo, sino también dar una razón del porqué. De esta forma, podrá sugerir qué decisiones habrá que tomar para sacar partido de una oportunidad de negocio futura o mitigar un posible riesgo, mostrando la implicación de cada opción sobre el resultado.

  • Funciones: construir y aplicar modelos de Machine Learning capaces de seguir aprendiendo y mejorando su capacidad predictiva conforme va aumentando el volumen de datos recolectados.

  • Requisitos: para este rol son necesarios conocimientos avanzados de matemáticas en general (y de estadística en particular), conocimientos de Machine Learning, conocimientos de programación en SQL, Phyton, R o Scala.

En ocasiones, el Analista de Datos es considerado un Científico de Datos “en formación”. Por ello, la frontera entre las tareas y Funciones de uno y otro rol a veces no son tan claras.

En definitiva, su función es “Modelar el futuro”. Hemos dejado para el final un rol fundamental, el Director Digital (“Chief Data Officer”-CDO).

Director Digital (“Chief Data Officer”-CDO)

  • Definición: es el responsable de dirigir, planificar y controlar la transformación digital de cualquier marca. Por ello, es el máximo responsable en las áreas de Gobernanza de Datos, Gestión de la Información y Seguridad.

  • Funciones: se trata de establecer una estrategia que garantice el crecimiento digital de la empresa de forma sostenible en el tiempo, capaz de adaptarse con fluidez a los continuos cambios del panorama digital. También deberá fomentar las relaciones internas y externas de la organización, captar el mejor talento, dirigir equipos y resolver con diplomacia las tensiones potenciales que puedan surgir entre los distintos departamentos de la empresa.

  • Requisitos: para este rol es muy importante tener una gran experiencia en el mundo digital, visión estratégica, dotes de comunicación para el trabajo en equipo y creatividad. El CDO debe ser innovador, en ocasiones incluso disruptor, y tener poder de decisión y recursos. Por eso, normalmente está a las órdenes del CEO (Director General).

El CDO puede tener algunos “solapamientos” con la figura del CIO (“Chief Information Officer”), pero es un rol que a los aspectos de innovación tecnológica, le suma un claro componente de marketing muy orientado a explotar los “Activos Digitales”. (En este post de “A un click de las TIC se analizan sus similitudes y diferencias: “CIO o CDO, ¿quién sobrevivirá?”).

Una vez vistos los distintos perfiles profesionales de datos, ¿con cuál te identificas más?

Sobre el autor

RELACIONADOS