Google se está poniendo las pilas en cuanto al desarrollo de nuevos modelos de inteligencia artificial capaces de competir contra aquellos diseñados por OpenAI, Midjourney o compañías similares.
La firma de Mountain View ha anunciado MusiLM, una IA generativa que funciona de una manera muy parecida a DALL-E, pero con una diferencia importante: en vez de diseñar imágenes mediante una breve descripción de texto, genera música.
MusiLM, en concreto, es capaz de producir pistas de audios unos minutos de duración en una calidad de 24 kHz a través de descripciones de texto de diferente complejidad. Lo hace, además, superando “a modelos anteriores tanto en calidad de audio como en la adherencia a la descripción del texto”, explica Google, y puede interpretar tanto diferentes géneros musicales, como el nivel de experiencia del músico, afirma la compañía.
Para poder generar canciones mediante una breve descripción de texto, y según detalla TechCrunch, MusicLM se ha entrenado con hasta 280.000 horas de música. El resultado son pistas con descripciones tan simples como: “canción meditativa, calmante y relajante, con flautas y guitarras. La música es lenta, con un enfoque en crear una sensación de paz y tranquilidad”. O bien, más complejas, como: “una fusión de reggaetón y música electrónica de baile, con un sonido espacial y de otro mundo. Induce la experiencia de estar perdido en el espacio, y la música estaría diseñada para evocar una sensación de asombro y asombro, mientras se puede bailar”.
Una característica interesante de la nueva IA generativa de Google, es que, al crear canciones a través de una descripción de texto, puede —en cierto modo— interpretar musicalmente pinturas famosas mediante fragmentos descriptivos extraídos de portales como WikiPedia. En algunos casos, eso sí, la IA tiende a generar canciones distorsionadas o con una voz sintetizada muy poco agradable.
Notiespartano/800Noticias