Alors que les outils GenAI commencent à transformer l’industrie de la musique de manière incroyable (et dans certains cas, de manière éthiquement problématique), Google intensifie ses investissements en IA pour créer de nouvelles chansons et paroles. Le géant de la recherche a aujourd’hui dévoilé MusicFX, une amélioration de MusicLM, l’outil de création de musique que Google a lancé l’année dernière. MusicFX peut créer des ritournelles jusqu’à 70 secondes de longueur et des boucles musicales, offrant ce que Google prétend être une génération de musique “de meilleure qualité” et “plus rapide”. MusicFX est disponible dans l’AI Test Kitchen de Google, une application qui permet aux utilisateurs d’essayer des systèmes expérimentaux alimentés par IA provenant des laboratoires de l’entreprise. Techniquement, MusicFX a été lancé pour certains utilisateurs en décembre, mais il est désormais généralement disponible.
Comme son prédécesseur, MusicFX permet aux utilisateurs d’entrer une invite textuelle (“deux guitares à cordes de nylon jouant en style flamenco”) pour décrire la chanson qu’ils souhaitent créer. L’outil génère par défaut deux versions de 30 secondes, avec des options pour allonger les pistes (à 50 ou 70 secondes) ou pour coudre automatiquement le début et la fin pour les boucler. Une nouveauté est la suggestion de mots descripteurs alternatifs dans les invites. Par exemple, si vous tapez “style country”, vous pourriez voir un menu déroulant avec des genres comme “style rockabilly” et “style bluegrass”. Pour le mot “catchy”, le menu déroulant pourrait contenir “chill” et “mélodique”.
La génération de musique atteint un niveau où il devient difficile pour cet écrivain de distinguer les sorties.
Sous le champ de l’invite, MusicFX fournit un nuage de mots de recommandations supplémentaires pour les descriptions, les instruments et les tempos pertinents à ajouter (par exemple, “avant garde”, “rapide”, “excitant”, “808 drums”). Alors, comment ça sonne ? Eh bien, lors de mes brefs tests, les échantillons de MusicFX étaient… corrects ? Il faut dire que les outils de génération de musique atteignent un niveau où il devient difficile pour cet écrivain de distinguer les sorties. L’état actuel de l’art produit des pistes étonnamment propres et nettes, mais des pistes qui tendent vers l’ennui, l’inspiration et mélodiquement non concentrées.
Il y a certaines choses que MusicFX ne générera pas, et qui ne peuvent pas être supprimées des pistes générées. Pour éviter de violer les droits d’auteur, Google filtre les invites qui mentionnent des artistes spécifiques ou qui incluent des vocaux. Et il utilise SynthID, une technologie de tatouage inaudible développée par sa division DeepMind, pour rendre clair quelles pistes proviennent de MusicFX. Je ne suis pas certain de la liste maîtresse que Google utilise pour filtrer les artistes et les noms de chansons, mais je n’ai pas trouvé très difficile de la déjouer.
Tout en signalant qu’il est fortement investi dans la technologie musicale GenAI avec MusicFX et TextFX, je me demande si l’obsession de Google de suivre la concurrence plutôt que de répondre aux questions difficiles qui entourent la musique GenAI lui sera bénéfique à la fin. De plus en plus, les pistes faites maison qui utilisent GenAI pour évoquer des sons familiers et des voix qui peuvent être présentées comme authentiques, ou du moins suffisamment proches, deviennent virales. Les maisons de disques ont été rapides à signaler des pistes générées par IA à des partenaires en diffusion tels que Spotify et SoundCloud, invoquant des préoccupations de propriété intellectuelle. Elles ont généralement été victorieuses. Mais il reste encore un manque de clarté sur le fait que la musique “deepfake” viole ou non les droits d’auteur des artistes, des labels et autres détenteurs de droits.