Machine learning Traducción Lenguajes Idiomas

El machine learning permite traducir automáticamente lenguajes perdidos

El modelo se encuentra en fase de perfeccionamiento, pero su llegada ha permitido abordar el estudio de lenguas antiguas que permanecen sin descifrar.

Los avances tecnológicos aplicados al machine learning han supuesto toda un impulso en el ámbito de la traducción. En los últimos años, la disponibilidad de una base de datos digitalizada cada vez mayor y el desarrollo de técnicas que promueven el aprendizaje de las máquinas han revolucionado el estudio de la lingüística.

Un equipo de investigadores fruto de la colaboración entre el MIT y el laboratorio de IA de Google ha desarrollado un sistema de machine learning con habilidad para descifrar lenguas perdidas. Esta nueva propuesta trabaja de manera automática gracias a un modelo diseñado en base a patrones documentados de los cambios en el lenguaje en toda la historia de la lingüística.

Modelo de traducción automática

Para conseguir que el modelo funcione sin supervisión, los investigadores han renovado el procedimiento de capacitación como un flujo de costo mínimo. Así, se ejecuta mediante un modelo de secuencia a secuencia que determina las coincidencias a nivel de caracteres entre los cognados.

Machine learning Traducción Lenguajes Idiomas
Manuscrito antiguo

Los resultados de la investigación han probado con éxito el desciframiento de las lenguas del idioma ugarítico y del sistema de escritura Lineal B. El modelo ha conseguido traducir correctamente más de un 67% de los cognados del Lineal B, un lenguaje silábico atribuido al griego micénico.

Se trata de la primera ocasión en la que este proceso se completa de manera automática. La clave del funcionamiento de la traducción mediante machine learning radica en alcanzar la comprensión de que todas las palabras están relacionadas entre ellas de alguna manera, independientemente de los idiomas involucrados.

Comprender las relaciones entre las palabras

El proceso consiste en realizar un mapeo exhaustivo de las relaciones que existen entre las palabras de un lenguaje específico. Esto es posible gracias a la descomunal base de datos disponible. Permite a las máquinas buscar las coincidencias con las que cada palabra aparece junto a otra palabra y establecer patrones.

Los resultados de este modelo podrían permitir ir un paso más allá, y descifrar lenguajes que se habían perdido por completo. Los investigadores han tomado como punto de partida la idea de que cualquier idioma puede cambiar de cierta manera a lo largo de la historia.

Si la base de datos almacena información sobre los idiomas originales, la máquina será capaz de hacer numerosas pruebas de una manera rápida y establecer las coincidencias sin cansarse.

Sobre el autor

RELACIONADOS