música

De textos a música: así funciona la IA para crear canciones

La inteligencia artificial es cada vez más potente. A los grandes hitos que logra cada año hay que sumar nuevas innovaciones en campos que hasta hace poco parecían inaccesibles,como el arte. Este es el caso de MusicLM, un modelo IA desarrollado por Google para crear melodías a partir de parámetros escritos. La música que crea, fácilmente podría servir para una orquesta o banda sonora de una película.    

¿En qué consiste MusicLM, la inteligencia artificial de Google?

El sistema genera música a 24 kHz que se mantiene constante durante minutos. Está entrenado con alrededor de 280.000 horas de melodías, según un artículo publicado por los desarrolladores, y proyecta “el proceso de generación de música condicional como una tarea de modelado jerárquico de secuencia a secuencia”.

El enfoque de MusicLM no es del todo nuevo, ya había sido usado por otras herramientas como Dance DiffusionJukebox e incluso AudioML, desarrollada también por Google. Sin embargo, MusicLM supera notablemente a estos sistemas tanto en calidad de audio como en coherencia.

Eso quedó demostrado en los resultados logrados por este sistema IA, compartidos en una publicación denominada MusicCaps, “un conjunto de datos compuesto por 5.500 pares de música y texto, con descripciones de texto enriquecido proporcionadas por expertos humanos”.

¿Cómo funciona MusicLM? 

El usuario solo tiene que ingresar las indicaciones escritas de lo que desea componer, con ciertos parámetros definidos, incluso subtítulos enriquecidos. En cuestión de segundos tendrá una composición musical de calidad

También puede crear melodías a partir de la descripción de imágenes. En las composiciones de prueba publicadas se ven melodías basadas en obras famosas, como “La persistencia de la memoria” (Salvador Dalí) y “El grito” (Edvard Munch). 

Y, por si fuera poco, también puede condicionar la creación a melodías, pues genera música a partir de composiciones silbadas y tarareadas según el estilo especificado en un pie de texto

IA para crear canciones
Imagen de Unsplash.

MusicLM puede crear cualquier género musical  

De acuerdo con los desarrolladores, el entrenamiento recibido por el sistema y tecnología IA con la que funciona, puede crear composiciones musicales de “complejidad significativa”. Por ejemplocanción de jazz encantadora con un solo de saxofón memorable y un cantante solista” o “Tecno de los años 90 de Berlín con un bajo y una patada fuerte”.

Al escuchar las composiciones de prueba publicadas por Google, no se encuentra diferencia con las melodías que podría crear un ser humano. Son muy coherentes, armónicas e incluyen cualquier variedad de instrumentos. 

El sistema también tiene la capacidad de hacer el trabajo de un DJ: crea melodías con tiempos. O sea, en cada espacio de tiempo de la música es para un fragmento de texto determinado, realizando los cambios de género o ritmo pertinentes.

¿Parece poco? ¿Qué tal composiciones musicales que cuentan una historia, como la banda sonora de una película? También lo hizo. En el listado de productos musicales creados por la herramienta, se oye una linda composición creada con una secuencia de órdenes, como “Hora de meditar, hora de despertar, hora de correr y hora de dar el 100%”.

¿Hasta dónde puede afectar la creación artística? 

Las capacidades de este modelo de IA profundizan el debate sobre cómo influye la tecnología en la música y cómo lo hará en los próximos años. Si bien es cierto MusicLM nunca podrá crear una composición inspirada en el sentimiento que genera una decepción amorosa, sí es cierto que puede hacer una pieza de calidad si un usuario humano le indica las pautas y le explica en detalle en qué consiste este tipo de sentimiento.

Al respecto, los creadores del sistema IA dijeron que no es “necesariamente tan inventivo o musicalmente cohesivo”, como sí lo es un músico.

Por otra parte, esta inteligencia artificial de Google que crea música es un proyecto privado que aún no está disponible para el público, por las implicaciones éticas que pueda tener en la creación artística y los probables problemas de derechos de autor, ya que, según el artículo presentado por los investigadores, al menos el 1% de las composiciones que el sistema generó, se crean directamente desde piezas musicales con las que fue entrenado. Lo publicado por la compañía es apenas una muestra de la investigación y las mejores melodías creadas en el proceso. 

Este tipo de creaciones resultan de lo más interesante. Al igual que ChatGPT, de Open AI, abren nuevos horizontes a las capacidades de la inteligencia artificial, asaltando campos en los que se pensaba que tenía pocas oportunidades.

Imagen de Unsplash.

Sobre el autor

RELACIONADOS

futuro sostenibilidad recommerce

Wayra Sessions: El futuro del Recommerce

La situación es preocupante: solo el 9% de los recursos naturales se reutilizan después de su primer uso. Seguimos dependiendo de esquemas económicos lineales...