Gracias a un test de Google, se ha podido mantener la misma voz del texto original en su consiguiente traducción a otro idioma.
Generalmente, los idiomas suponen un problema comunicativo entre las diferentes personas del mundo. Principalmente porque son, sin duda, la vía comunicativa más eficaz a la hora de querer interactuar unas con otras.
A todos los niveles, los idiomas diferencian a la gente. Se crean y comparten culturas a través de ellos y suelen generar una riqueza global por ahora incalculable.
La capacidad de los seres humanos a la hora de aprenderlos suele ser muy notable, siendo un alto porcentaje del mundo como mínimo bilingüe. Evidentemente, esta teoría la sostienen zonas del mundo donde sus propios idiomas son más inaccesibles, mientras que otros lugares donde sus lenguas son más habladas a nivel global suelen tener cierto recelo a aprender distintas lenguas.
También, más allá de los propios idiomas, todas aquellas reglas basadas en el cómo (entonación, énfasis, etc.) son muchas veces determinantes para llegar a comprender lenguajes ajenos.
Inteligencia artificial para salvar traducciones
Un grupo de investigadores de Google ha creado un traductor, el Translatotron, capaz de devolver la misma voz traducida en otro idioma distinto, para poder salvar problemas como el antes citado, es decir, el del cómo.
Los traductores generalmente escuchan una voz en un idioma y captan el mensaje para devolverlo traducido con una voz impersonal. Pero gracias a esto, se ha llegado al punto de devolver el mensaje traducido con la misma voz que el mensaje original.
El experimento se ha hecho a través de la traducción de una frase en español a inglés. Y el resultado ha sido muy positivo. Porque se ha conseguido conservar la misma voz del hispanohablante en la voz de la traducción al inglés.
Para ello, se han usado tres componentes. El primero utiliza una red neuronal entrenada para poder mapear del espectrograma de audio en el idioma de entrada (español) al espectrograma de audio en el idioma de salida (inglés). El segundo convierte el espectrograma en una onda de audio que se puede reproducir. Y el tercero vuelve a colocar las características vocales del altavoz original en la salida de audio final.
Pese a que ha sido solo un test de prueba, se espera que esta técnica pueda llegar a buen puerto con el fin de comercializarla de manera que todas aquellas personas que lo requieran puedan disponerlo, y con ello entender con todo lujo de detalles el mensaje recibido en un idioma diferente al suyo.
Si quieres escuchar la prueba, puedes hacerlo aquí.