Hoy existen diversos sistemas de traducción que facilitan la comunicación en idiomas diferentes. Algunos de ellos, incluso permiten el intercambio simultáneamente. Sin embargo, estos tienden a perder los elementos más humanos del discurso, como el tono, el énfasis o las pausas. Con esta premisa, Meta busca dar lugar a un diálogo más natural y auténtico con Seamless Communication: una familia de modelos de inteligencia artificial (IA) que abordan aspectos clave de la traducción simultánea en tiempo real.
Este es el primer sistema público de traducción que permite una comunicación expresiva a través de distintos idiomas en tiempo real. De esta manera, está posicionada para ser una solución poderosa para que personas que se comuniquen en distintos idiomas puedan dialogar e intercambiar experiencias y conocimientos. Esta apuesta de IA de Meta se compone de cuatro elementos:
- SeamlessM4T v2, el modelo que sirve como base para todos los demás desarrollos del sistema.
- SeamlessExpressive, que se ocupa de mantener las complejidades de expresión de cada idioma.
- SeamlessStreaming, que acerca la traducción de Seamless Communication al codiciado real time.
- Seamless, el modelo integrador que combina las capacidades de los otros componentes en una única solución de comunicación.
Conoce los detalles de cada uno de ellos y descubre por qué hacen único a Seamless Communication:
SeamlessM4T v2: la base de Seamless Communication
Es un modelo multilingüe que ayuda a las personas a comunicarse en distintos idiomas de forma oral y escrita. En su segunda versión, ofrece una arquitectura que mejora la consistencia de resultados entre el texto inicial en un idioma y el producto final oral en el idioma destino.
Asimismo, optimiza el desempeño de la herramienta en cuanto al reconocimiento de habla automático. También mejora sus capacidades para traducir en situaciones:
- Oral-oral: contenido oral en un idioma y contenido oral en el idioma destino.
- Oral-escrito: contenido oral en el idioma original y contenido escrito en el idioma destino.
- Escrito-oral: contenido escrito en el idioma de partida y contenido oral en el idioma destino.
SeamlessExpressive y las sutilezas de la comunicación humana
Se trata de una nueva adición a Seamless Communication. Es un modelo que busca preservar la expresión y complejidades propias del habla en distintos idiomas.
Este elemento va un paso adelante de otras herramientas de traducción al mirar más allá del contenido de una conversación. Está diseñado para llevar las sutilezas del habla humana de un idioma a otro. Este es el caso de las pausas, la velocidad del discurso, el estilo vocal y el tono emocional.
Preservar estos aspectos de la expresión humana entre idiomas es clave, ya que son una parte imprescindible del mensaje. Como sabemos, en la comunicación lo que decimos y cómo lo decimos es igualmente importante. Actualmente, SeamlessExpressive opera en traducciones orales entre inglés, español, alemán, francés, italiano y chino.
SeamlessStreaming: un traductor IA de alta velocidad
Un elemento crítico de la traducción simultánea es la velocidad. Conservar el ritmo de una conversación es vital a la hora de expresarse exitosamente de un idioma a otro. Hoy, las soluciones convencionales necesitan que la persona termine su oración para comunicarla en el idioma destino. En contraste, SeamlessStreaming traduce mientras la persona está hablando.
¿Cómo lo logra? Pues bien, el modelo opera con apenas un par de segundos de latencia. Es decir, que es capaz de traducir prácticamente en tiempo real. Así, esta herramienta tecnológica está muy cerca de actuar como un traductor simultáneo humano en términos de velocidad.
Este nuevo componente del sistema opera:
- Con reconocimiento automático de habla y traducción de oralidad a escritura para casi cien idiomas de partida y destino.
- Con traducción de texto a texto para cerca de cien idiomas de partida y 36 idiomas de destino.
Para finalizar, destacamos que Meta ha hecho públicos estos modelos de traducción simultánea basados en inteligencia artificial. De esta manera, aquellos interesados en investigar en el campo y desarrollar sus propias soluciones a partir de Seamless Communication pueden hacerlo.
Imagen de cabecera: unsplash