OpenAI ha riscontrato un grande successo con ChatGPT grazie alle sue capacità, tra cui la scrittura di abstract accademici, la scrittura di una canzone o di una poesia, un testo letto da un deputato al Congresso USA (con argomento l’IA) e molto altro. Il successo di ChatGPT è stato tale che ha fatto preoccupare persino Google per il futuro del suo motore di ricerca, spingendo l’azienda a sviluppare una versione AI di Google Search insieme ad altri progetti AI. Non stupisce quindi che Google si stia avventurando in un altro territorio, ovvero quello della musica generata dall’intelligenza artificiale. Il gigante della ricerca ha realizzato un bot di intelligenza artificiale in grado di creare musica a partire da descrizioni di testi o persino da descrizioni pittoriche.
Google si riferisce a questo sistema di intelligenza artificiale con il nome di “MusicLM” che viene descritto dai ricercatori di Google come un “modello che genera musica ad alta fedeltà da descrizioni di testo“. Il sistema è in grado di produrre musica a 24 kHz, e rimane a quella frequenza per i minuti successivi.
Affinché MusicLM possa creare musica, è necessario scrivere una richiesta molto dettagliata che indichi gli stili o i generi. L’intelligenza artificiale può anche produrre colonne sonore lunghe che durano fino a cinque minuti e trasformare in musica un breve racconto o una descrizione pittorica. Ad esempio, ha creato una melodia basata su “L’urlo” di Edvard Munch e “La Danza” di Henri Matisse.
I ricercatori hanno però rilevato che l’1% della musica generata dal sistema è stata replicata direttamente dai brani su cui si è formato. Ciò potrebbe destare preoccupazioni circa la capacità di MusicLM di attingere facilmente a materiali esistenti protetti da copyright per creare una propria canzone.
Di conseguenza, Google ha dichiarato di non aver intenzione di rilasciare per ora questo modello al pubblico ma ha messo a disposizione 5.500 coppie musica-testo a chiunque voglia sentire come MusicLM fa il suo lavoro. Questo set di dati è disponibile sulla pagina Github di Google e mostra le richieste di testo e l’audio ottenuto.