clonación de voz VALL-E 2

Microsoft presenta VALL-E 2: la IA de clonación de voz que alcanza la paridad humana

Microsoft ha dado un paso significativo en el campo de la inteligencia artificial con la introducción de VALL-E 2, una versión avanzada de su sistema de clonación de voz. La compañía de Redmond, conocida por su constante innovación en IA, ha anunciado que esta nueva versión puede replicar voces con una precisión que alcanza la «paridad humana».

A pesar de los avances y las aplicaciones potenciales de esta tecnología, su uso estará restringido exclusivamente a fines experimentales y de investigación debido a preocupaciones sobre su posible uso indebido, sobre todo en lo que a ciberataques respecta.

La evolución de VALL-E en la clonación de voz

En los primeros meses de 2023, Microsoft presentó VALL-E, una herramienta de inteligencia artificial diseñada para clonar voces a partir de clips de audio. Aunque la tecnología inicial mostró un alto grado de realismo en la emulación de pronunciación, tono y timbre, todavía tenía margen para mejorar. Sin embargo, con el desarrollo de VALL-E 2, Microsoft ha superado esas limitaciones, logrando una precisión sorprendente gracias al uso de redes neuronales avanzadas y grandes conjuntos de datos de entrenamiento como LibriSpeech y VCTK.

La característica más destacada de VALL-E 2 es su capacidad para generar voces que son prácticamente indistinguibles de las grabaciones reales. Microsoft ha confirmado que esta tecnología puede replicar la voz humana con una precisión impresionante utilizando únicamente tres segundos de audio como referencia. Esta capacidad abre un abanico de posibilidades en campos como la educación, el entretenimiento y la accesibilidad, donde la personalización y la interactividad son clave.

Microsoft, clonación de voz

Preocupaciones sobre el uso indebido

A pesar de los beneficios potenciales, Microsoft ha expresado su preocupación por los riesgos asociados con la tecnología de clonación de voz. La posibilidad de suplantar identidades, difundir información falsa o realizar fraudes digitales es una amenaza real. Debido a estos riesgos, la compañía ha decidido no lanzar VALL-E 2 al mercado ni incorporarlo en productos accesibles al público general.

«Actualmente, no tenemos planes de incorporar VALL-E 2 en un producto o expandir el acceso al público general», afirmaron los investigadores de Microsoft Research Asia. Reconocen que, aunque la tecnología tiene aplicaciones prometedoras, los riesgos potenciales de su uso indebido son significativos.

Microsoft permitirá que VALL-E 2 sea utilizado con fines de investigación bajo estrictas condiciones. Investigadores de la compañía y terceros que obtengan aprobación podrán explorar los límites de esta tecnología de manera segura. Esta decisión busca equilibrar la innovación con la responsabilidad, permitiendo el avance tecnológico mientras se mitigan los riesgos asociados.

paridad humana IA Microsoft

Aplicaciones futuras y seguridad

El uso controlado de VALL-E 2 podría contribuir a importantes avances en la detección de voces sintetizadas y la obtención de consentimiento explícito en contextos donde se imite la voz de una persona. Estos desarrollos son cruciales para asegurar que la tecnología se utilice de manera ética y responsable.

Microsoft ha demostrado consistentemente su compromiso con la inteligencia artificial, como lo evidencian su colaboración con OpenAI y los esfuerzos en el desarrollo de Copilot. La creación de VALL-E 2 es un testimonio de su capacidad para innovar y liderar en este campo, al tiempo que mantiene una postura firme en cuanto a la seguridad y la ética.

RELACIONADOS