Fr

TECH

AI in je oren, door Nicolas Bataille

Donderdag 14 Maart 2024

AI in je oren, door Nicolas Bataille

Yoko Sound is een Brusselse zangeres die in 2008 haar debuutalbum ‘Not Enemy’ uitbracht. Sinds een paar jaar wil ze graag een tweede album releasen. Om dat huzarenstukje voor elkaar te krijgen, moet ze de juiste composer vinden die samen met haar de muziek voor haar nieuwe nummers kan creëren. Yoko Sound is al zestien jaar mijn partner en ik heb haar onlangs getoond wat de wondere wereld van AI kan doen om deze ambitie te verwezenlijken... Binnen enkele jaren zal ze misschien haar volgende producer gevonden hebben, namelijk zichzelf...

Generatieve AI zal de manier veranderen waarop communicatie- en cultuurmedewerkers geluid creëren en ook hoe ze ernaar luisteren en er in interactie mee gaan.

Een realistische voice-over voor een documentaire, een nieuw nummer van The Beatles, lipsynchronisatie van een serie of film met de stem van de acteur, de sounddesign van een advertentie, de begingeneriek van een podcast, enz. AI opent opnieuw creatieve wegen en ‘ontwricht’ tegelijkertijd weer een andere industrie.
Er zijn drie belangrijke pijlers voor het genereren van audio met behulp van AI: stemmen (met of zonder beelden), geluidseffecten (sfx) en... muziek (met of zonder stemmen). We zullen er dieper op ingaan in dit artikel.

In 2018 kwam Nvidia met zijn Aiva AI als eerste met een oplossing voor het genereren van symfonische muziek. Generatieve AI was nog iets nieuws en ik herinner me dat ik destijds van mijn sokken werd geblazen door deze demo:
Ter info, Nvidia is momenteel de belangrijkste leverancier van zeer krachtige chips voor spelers uit de brede AI-markt. Daardoor begeeft het zich wel op glad ijs, aangezien het concurreert met zijn hieronder vermelde belangrijkste klanten.

Laten we teruggaan naar 2020. Toen startte OpenAI (weer die speler) zijn generatieve model voor het maken van muziek: JukeBox. Ondanks zijn early adopter status, met voor het eerst gegenereerde stemmen van zangers en zangeressen, was zijn succes in niets te vergelijken met dat van ChatGPT een paar jaar later. Jukebox bestaat nog steeds en het is een van de meest geavanceerde oplossingen voor het genereren van muziek met stemmen. Het is echter een complexe tool om mee te werken.
Bij Google wordt er dan weer getalmd. MusicLM, zijn AI voor het genereren van muziek, staat in de steigers, maar bevindt zich nog steeds in de R&D fase. Vorige week heeft het de release van MusicFX, die gebaseerd is op zijn eerder onderzoek, aangekondigd. Die kan audiotracks genereren op basis van een eenvoudige prompt. MusicFX is gebaseerd op drie zogenaamde ‘pre-trained’ taalmodellen en heeft een dataset van maar liefst 280.000 uur muziek.
 
Onlangs is er met Adobe nog een andere tech gigant die zich manifesteert in dit domein bijgekomen. Zijn claim is behoorlijk verleidelijk. Project Music GenAI Control zou de Photoshop van de muziek moeten worden! De tool stelt je vanzelfsprekend in staat om muziek te genereren, maar je kunt vooral bepaalde stukken van wat is gegenereerd bewerken om aldus het eindresultaat via prompts te personaliseren naargelang je behoeftes... We vertrouwen erop dat Adobe zich zal kunnen meten met de andere spelers in deze jungle van aanbieders van AI-oplossingen.
Tot slot zijn er onafhankelijke AI’s zoals Beatoven, Elevenlabs, Loudly en Soundraw. Wat mij betreft springt Suno.ai eruit door zijn eenvoud en snelheid. Als er een tool is waarmee je binnen twee minuten indruk kunt maken op je vrienden, dan is het deze wel.
 
In slechts een paar klikken heb ik de onderstaande ‘MM-Rap’ gegenereerd. Maar de voorwaarden zijn duidelijk: geen streaming op muziekplatformen.
Kortom, het is duidelijk dat alle grote spelers in AI tech geïnteresseerd zijn in geluid.

Het is algemeen bekend dat de muziekindustrie en streamingplatformen integraal deel uitmaken van onze samenleving. Er staat financieel veel op het spel en de auteursrechtelijke beperkingen zullen, net als voor afbeeldingen, een rem vormen op de snelle adoptie van deze technologieën op grote schaal.
 
Na een paar krachtmetingen in de kantoren van advocaten gespecialiseerd in auteursrecht (of niet), denk ik dat we binnenkort de rechten op een door AI gegenereerde track zullen kunnen verwerven, net zoals we dat al lang kunnen met stockfoto’s.

Zal het volgende Yoko Sound album binnenkort in de bakken liggen naast de nieuwste Marvin Gaye en Bob Marley albums? Wait and see.

Volgende week vertel ik je onder andere over een Europees initiatief (eindelijk!) in AI: Mistral.

Archief / TECH