La inteligencia artificial (IA) es una tecnología revolucionaria que, se espera, seguirá creciendo en los próximos años. De hecho, según estadísticas de IDC, el 90% de las apps empresariales comerciales usará IA en 2025.
Entre los principales usos de esta tecnología están las apps de reconocimiento y generación de voz. Tanto así que, según Statista, el número de asistentes de voz digitales (como Alexa o Google Voice) podría superar los 8.400 millones en 2024, cifra superior a la población mundial.
Ahora, Microsoft se ha sumado a la carrera para mejorar este tipo de IA con VALL-E, un novedoso sistema capaz de producir resultados de alta calidad. ¿Qué lo hace tan especial? Descúbrelo a continuación:
¿Qué es VALL-E?
Es una IA desarrollada por Microsoft que es capaz de imitar cualquier voz humana tomando como referencia una grabación de tres segundos.
Una de sus principales características es que está basada en un modelo lingüístico de códec neuronal, un enfoque diferente al de otros generadores de voz. Esto permite lograr una precisión muy superior a la de sus competidores en el mercado.
Además, el entrenamiento del modelo se escaló hasta 60.000 horas de conversaciones en idioma inglés. Microsoft afirma que esto es cientos de veces mayor que los sistemas existentes.
Pero quizá el aspecto más impresionante de la nueva IA de Microsoft sea su capacidad para preservar emociones. La compañía demostró esta función en GitHub, donde puedes encontrar ejemplos de clips de audio en los que el hablante expresa enfadado, diversión, entre otras emociones. Luego, la IA puede recitar el texto conservando el tono.
¿Para qué sirve la nueva IA de Microsoft?
Son muchas las aplicaciones que se le pueden dar a VALL-E. Por ejemplo:
- Ayuda a las compañías a hacer más con menos datos. Esto beneficiará a las industrias donde la síntesis de voz ya hace parte de los procesos productivos, como el comercio minorista, la tecnología financiera y el desarrollo de videojuegos. En estos sectores, no siempre es posible acceder a suficientes muestras de voz para obtener una síntesis de alta calidad, pero VALL-E soluciona este problema.
- Además, puede ayudar a las empresas a reducir el tiempo y esfuerzo necesario para poner en marcha productos que dependen del reconocimiento y generación de voz. Esto es gracias a que el sistema necesita solo tres segundos para producir un resultado de alta calidad.
- En la industria de la generación de contenido, la herramienta puede reducir el tiempo necesario para producir doblajes y lanzar productos audiovisuales.
- Por otro lado, como el sistema puede convertir texto en palabras habladas que suenan extremadamente naturales, se puede usar para agilizar tareas como las llamadas de recordatorio a los clientes, el agendamiento de citas, entre otras.
Integración con GPT 3: un avance con grandes beneficios para las empresas
Finalmente, una de las novedades que puede ser una revolución para las empresas, es que Microsoft está trabajando en una integración con GPT 3. Si es la primera vez que escuchas el término, se trata de un modelo de aprendizaje automático de redes neuronales que solo necesita una pequeña cantidad de texto de entrada para generar grandes volúmenes de texto relevante y sofisticado.
¿Qué tiene que ver esto con VALL-E? En pocas palabras, cuando la integración esté lista, significa que la herramienta de Microsoft se podrá usar con otras tecnologías como ChatGPT. Este es un tipo de chatbot con un modelo lingüístico capaz de interactuar en forma de diálogo conversacional y proporcionar respuestas que pueden parecer humanas.
De este modo, la inteligencia artificial de Microsoft podría ofrecer resultados de voz, además de texto, que sean satisfactorios para los usuarios que visitan un sitio web o un comercio electrónico. Todo esto sin afectar en nada la experiencia del usuario, quien tendrá la sensación de estar hablando con otra persona.
Como puedes ver, el mundo de la IA sigue avanzando a paso fuerte y esto promete grandes ventajas para las empresas. Con la ayuda de estas nuevas herramientas, cada vez es más sencillo optimizar procesos, ahorrar en tiempo y recursos, automatizar tareas e implementar funciones para hacerle la vida más fácil a tus clientes y usuarios. Solo queda una pregunta: ¿cómo puede tu empresa aprovechar estas nuevas tecnologías? Es buen momento para pensar en ello.
Imagen de Unsplash.