Het spel is op de wagen. Grote internationale artiesten zijn boos, verontwaardigd en bezorgd. Publishers schreeuwen moord en brand en noemen het diefstal van intellectueel eigendom. De platenmaatschappijen zetten de hakken in het zand en de kranten kunnen er geen genoeg van krijgen. Met behulp van Artificial Intelligence gemaakte muziek maakt de tongen los.
Beeld Herald Boer/Fabrique (gegenereerd met Midjourney)
Grote vragen zijn: wat zijn de consequenties van AI voor de muziekwereld? Wat gaan de technologische ontwikkelingen betekenen voor muzikanten, de sector en vooral ook voor het publiek? En hoe gaat dat dan geregeld worden met die rechten? En als we binnen een paar klikken onze eigen songs kunnen maken, volledig afgestemd op onze muzikale voorkeur, wat is dan de toegevoegde waarde van muzikanten? Krijgen de tech-optimisten gelijk als het gaat over de impact van AI?
OOR neemt poolshoogte in de wervelende en luidruchtige wereld van Suno, Udio en andere hemelbestormers; hoe zit het nu precies en wat is er aan de hand? Disclaimer: het is een momentopname.
Daddy’s Car
Het is 2016 en daar is plotseling Daddy’s Car, in elkaar gesleuteld door Sony CSL (Computer Science Laboratories), een fundamenteel onderzoekslaboratorium gevestigd in Tokio en Parijs waarvan het team Music and Artificial Intelligence zich richt op het muzikale domein. Hun missie is het ontwikkelen van gereedschappen voor muzikanten op basis van kunstmatige intelligentie die ten goede komen aan het creatieve proces. Daddy’s Car, te vinden op YouTube, is gebaseerd op alle 219 liedjes van The Beatles.
Met behulp van AI klinkt het resultaat als The Beatles, met kenmerkende samenzang, een melodie die vertrouwd klinkt, tempowisselingen, stemmen die een beetje in de buurt komen en meer zaken die bekend in de oren klinken. Aan het eind wordt God betere het zelfs backspinning toegepast. Knap gemaakt, dat zeker. Toch is Daddy’s Car geen hit geworden om de doodeenvoudige reden dat er eigenlijk geen fluit aan is. Het klinkt meer als 10cc geproduceerd door Jeff Lynne.
Het is over the top en komt bijvoorbeeld niet in de buurt van wat Beatles-persiflageband The Rutles met aanmerkelijk meer (menselijke) intelligentie deed. En de reden is even eenvoudig als hoopgevend: AI kijkt altijd in de achteruitkijkspiegel. Het maakt gebruik van muzikale elementen uit het verleden en creëert nieuwe combinaties.
Een belangrijk kenmerk van The Beatles is dat ze met elk nieuw album, zelfs met elke nieuwe song de neiging hadden om iets nieuws te proberen. Geïnspireerd door wat ze om zich heen zagen en hoorden. Muzikanten reageren doorgaans – vaak onbewust – op wat er gaande is in de wereld. De maatschappelijke context bepaalde in grote mate creatieve beslissingen. Daarbij hadden The Beatles ook lef en humor – allemaal kenmerken die top op heden ten enenmale ontzegd kunnen worden aan AI. AI speelt altijd op safe.
The Concept A.I. Album
Fast foward naar december vorig jaar. In samenwerking met de absolute sterproducer van dit moment, Boi-1da (o.a. Drake, Beyoncé, Kendrick Lamar, Rihanna, Eminem, Nicki Minaj), brengt rummerk Bacardí The Concept A.I. Album uit – best bijzonder, ja. Het album bevat originele nummers gemaakt met behulp van kunstmatige intelligentie software die is getraind op Boi-1da’s persoonlijke catalogus van niet eerder uitgebrachte beats.
Vijf opkomende artiesten – Bellah, Floyd Fuji, Kyle Dion, Blackway en Savannah Ré – werden geselecteerd voor het project en kregen de opdracht om melodieën in te voeren. De AI genereerde nieuwe demo’s door het werk van de artiesten te verweven met het kenmerkende geluid van Boi-1da. Elke artiest mocht de AI-verbeterde nummers aanpassen totdat ze tevreden waren, voordat ze Boi-1da zelf ontmoetten om de productie af te ronden. Een enigszins apart maar ook interessant experimenteel project.
OOR sprak Boi-1da voor de interviewserie Achter De Knoppen – het volledige interview wordt in het najaar gepubliceerd – en vroeg zich af of de release een provocerende daad was? Boi-1da: ‘Mensen zijn soms bang voor de toekomst, bang voor nieuwe dingen. Ik wil juist vooroplopen, daar zit voor mij de lol. Het is onvermijdelijk dat AI eraan komt. Als je niet leert waar het voor staat, sta je voordat je ’t weet op achterstand. Ik ben geïnteresseerd in hoe het werkt en wat je ermee kan.
Bacardí kwam met het idee van de release en het experiment. Ik zag het zelf niet als een provocatieve daad, meer als een leerproces. Het publiek reageerde heel positief. Het voelt een beetje gek als je niet weet hoe het werkt. Het draait om het programmeren en het trainen van de AI. Als puntje bij paaltje komt zal AI nooit muziek kunnen maken op hetzelfde niveau als mensen. Met dezelfde ziel, die kwaliteit en die ideeën. AI is gereedschap.’
In transitie
Terug naar de muziekindustrie, deze is overduidelijk in transitie en dat gaat doorgaans gepaard met pijntjes en dit geval zelfs hevige pijn. Er zijn parallellen te trekken met de komst van Napster in 1999. De van oorsprong file sharing start-up besloot muziek digitaal te gaan distribueren. De website liet het gratis downloaden van mp3’s toe en werd in rap tempo een groot succes. De sector was in de war.
Het wenkend perspectief dat de consument geboden werd, smaakte echter naar meer en ook de pers was lyrisch, op het naïeve af. Die nieuwe wereld waarin alle muziek voor iedereen toegankelijk was, op elk moment, was voelbaar. Het zou achteraf gezien een scharnierpunt zijn in de transitie van de muzieksector.
Niet dat Napster het zou redden op deze manier, ze hadden immers hun zaakjes niet voor elkaar. Ze lieten het toe dat alles gratis weggegeven werd en het was wachten op het moment dat ze een halt zouden worden toegeroepen. Het was echter wel een wake-up call; langzaam begonnen de grote platenmaatschappijen mee te bewegen. En toen de Zweedse internet-entrepreneur Daniel Ek in 2008 Spotify begon waren de hoge heren van de majors klaar om de grote sprong naar online streaming te wagen.
De laatste OOR-cover werd gegenereerd met Midjourney. Het prompt: ‘A photorealistic collage of world famous rock, pop and hiphop artists, from the past and the present, with a summer beach vibe. The artists have to be recognizable. With a small touch of sci-fi movie references in the background.’
Er was simpelweg geen weg terug en eventuele kannibalisering op de verkoop van cd’s en vinyl moest maar voor lief worden genomen. Spotify regelde de rechten met de platenmaatschappijen en de uitgeverijen en het feest kon beginnen. Het geharrewar wat volgde omdat artiesten zich onderbetaald voelden blijkt achteraf een voetnoot in de geschiedenis. Ze zijn bijna allemaal op hun schreden teruggekeerd. Niemand had kunnen voorzien dat het aantal streams per nummer zou kunnen oplopen tot soms boven de miljard. De mensheid consumeert meer muziek dan ooit tevoren.
Er is echter een groot verschil met deze case en wat er nu gaande is. De oplossing toentertijd om streaming toegankelijk te maken voor een groot publiek was helder: de rechten zouden geregeld moeten worden en de manier waarop was ook duidelijk. De huidige situatie is veel gecompliceerder. Ook hier spelen rechten weer een grote rol, maar de oplossing is niet eenvoudig en de verwarring is dus aanmerkelijk groter.
Suno & Udio
Van alle ontwikkelingen van de afgelopen tijd is de komst van AI-muziekapps Suno en Udio wellicht het meest impactvol. Begin april verscheen er een open brief van de Artist Rights Alliance, ondertekend door meer dan 200 artiesten, waaronder Billie Eilish, Nicki Minaj, Katy Perry, R.E.M., Pearl Jam, Elvis Costello en de erven van Bob Marley en Frank Sinatra. De brief was gericht aan technologiebedrijven, digitale dienstverleners en AI-ontwikkelaars en adresseerde de onverantwoordelijke praktijken op het gebied van kunstmatige intelligentie.
Het zou een aanval zijn op de menselijke creativiteit en zou onmiddellijk een halt toe moeten worden geroepen. Hierbij wordt het potentieel van AI niet ter discussie gesteld maar wel het gemak waarmee deze bedrijven meeliften op de creativiteit van anderen. En daar hebben ze natuurlijk een punt, maar de grote vraag is: wanneer is het je laten inspireren (wat mag) en wanneer is het schaamteloos meeliften op de creativiteit van een ander? Dat bepaalt immers hoe de rechten geregeld en vooral verdeeld moeten worden. Tegelijkertijd vragen wij ons hardop af of dat het publiek wat uitmaakt.
Een moreel appel
Hoe zit het dan precies met de rechten? Bedrijven als OpenAI (de moeder van ChatGPT) trainen inmiddels hun modellen op basis van bestaande content van bijvoorbeeld titels als Le Monde, de Financial Times en Associated Press. Deze hebben nu allemaal eieren voor hun geld gekozen en een deal gemaakt met OpenAI. The New York Times en de Chicago Tribune zijn juist aan het procederen tegen het ongeautoriseerd uitlezen van hun content door OpenAI.
Het helpt daarbij niet dat OpenAI geen openheid geeft over de bronnen van de trainingsdata. Billie Eilish en Pearl Jam hebben al aangegeven dat hun muziek of stem niet gebruikt mag worden om hun AI te trainen. Naar verluidt is de Sony Music Group bezig met het sturen van brieven naar meer dan 700 AI-ontwikkelaars en muziekstreamingdiensten waarin wordt verklaard dat het zich ‘afmeldt’ voor het gebruik van hun inhoud bij het trainen van AI-systemen.
Maar kan dit collectief geregeld worden? Spotify heeft laten zien dat het collectief regelen van complexe rechtenkwesties een versnellend effect heeft op de transitie. Maar hoe dan? En wat zijn de barrières?
Benjamin van Werven van advocatenkantoor Walden Grene is jurist en gespecialiseerd in intellectueel eigendom en muziekrecht. Wat is zijn analyse van wat er aan de hand is? ‘Je moet onderscheid maken tussen het invoeren van muziek en dergelijke in het AI-systeem, om die daarvan te laten ‘leren’, en het gebruik van de uitkomst, de ‘output’. Dat invoeren moet worden gezien als het maken van een kopie van het oorspronkelijke werk, waarvoor de toestemming van de rechthebbenden nodig is.
Maar voor de output is auteursrechtelijk (en met betrekking tot de ‘uitvoerende rechten’ op de opnamen) alleen toestemming nodig als het oorspronkelijke werk, al dan niet in bewerkte vorm, te horen is. De ‘stijl’ van een artiest of werk is echter in de meeste landen uitgesloten van bescherming, omdat zo’n bescherming de creativiteit te veel zou beperken. Als je stijlen wel zou beschermen, zouden nieuwe muziekgenres bijvoorbeeld al snel een stille dood sterven omdat die zouden zijn voorbehouden aan degene die daar het eerste mee kwam.
Bovendien bouwen genres vaak op elkaar voort, en als je stijlen monopoliseert, zou die ontwikkeling, en daarmee de creativiteit, juist worden belemmerd. Stijlen kunnen daarom niet beschermd worden, alleen de concrete uitwerking daarvan, zoals een muziekwerk. Als je met Suno bijvoorbeeld een nieuwe track maakt ‘in de stijl van’ een bepaalde artiest, is die output dan ook geen inbreuk op de auteursrechten van die artiest. Dat zal alleen het geval zijn als je het oorspronkelijke werk hoort, maar dat zal Suno niet toestaan.
De brief van de artiesten komt dan ook op mij over als een moreel appel, omdat ze weten dat met het gebruik van de stijl niet veel te doen is. Dat neemt natuurlijk niet weg dat het invoeren van muziek in het AI-systeem wel onrechtmatig kan zijn.’
Parallel aan deze discussie is er de case tussen Scarlet Johansson en Open AI. Bij de introductie van ChatGPT-4o werd een stem gebruikt die als twee druppels water leek op die van Johansson zoals te horen in de film Her. Van Werven hierover: ‘Het kan onrechtmatig zijn als bijvoorbeeld de stem van een bekend persoon wordt gebruikt en daarmee de indruk wordt gewekt dat die persoon daaraan heeft meegewerkt.’
No Surprises
Door AI gegeneerde muziek verrast zelden en er ontbreken wat je noemt vondsten. In het intro van Roxanne van The Police hoor je een ietwat vreemd piano-akkoord en gelach. Het is Sting die op de piano gaat zitten en in de lach schiet terwijl Andy Summers het intro speelt. Het is in de mix gebleven omdat het het intro meer kleur geeft. When Doves Cry van Prince was een kneiter van een hit, super dansbaar. Maar als je goed luistert, hoor je dat er geen bas in zit.
Het is gissen naar het proces in de studio dat heeft geleid tot die hoogst ongebruikelijke, maar voor het geluid bepalende beslissing. In beide gevallen komt een cruciale kwaliteit van HI (human intelligence) om de hoek kijken. Het menselijk brein is in staat om vanuit intuïtie afwijkende, maar ook aantrekkelijke beslissingen te nemen tijdens het creatieve proces. Het streven naar nieuwe vormen van esthetiek is daarbij belangrijk. AI kan esthetiek niet beoordelen, wel kopiëren.
Drie alternatieve resultaten op basis van de prompt waarmee de laatste OOR-cover werd gegenereerd.
Het feit dat AI altijd naar het verleden kijkt, geen lef heeft, risicomijdend is, geen verantwoordelijkheid toont en zeker niet perfect is, maakt eens te meer duidelijk dat er ruimte is voor muzikale pioniers, wegbereiders, durfals en gekkies. Want AI citeert en creëert veel, maar voegt zeer beperkt iets toe aan wat er al is. De angst dat voor een hitsong slechts één geslaagde prompt nodig is, is derhalve ongegrond. Een hit is een hit omdat hij het beter doet dan de andere liedjes van dat moment.
En natuurlijk zullen er toevalstreffers zijn, maar in principe komt bij het gebruik van AI iedereen met dezelfde kwaliteit aanzetten – die wellicht aardig is, maar je niet van je stoel doet vallen. Ter illustratie: tot op heden is geen enkel AI-liedje op de proppen gekomen met een nieuw instrument of een afwijkend gebruik van een bestaand instrument. AI heeft ook nog geen nieuwe trends in muziek gecreëerd behalve zichzelf.
Haaks hierop is het niet ondenkbaar dat de ‘andersom beweging’ ook plaats gaat vinden. De gemiddelde OOR-lezer is betrokken bij wat hij/zij wil horen. Dat ligt anders voor een groot deel van een nieuwe generatie die graag muziek luistert – bij voorkeur de hele dag door – maar hooguit de artiest en de naam van het liedje kan recapituleren. Even een gedachte-experiment: het is geen probleem om een album met songs te genereren in de stijl van Taylor Swift. Dat is een kwestie van tijd en moeite steken in het prompten.
Hierbij kun je ‘Taylor’ over jouw leven, jouw vrienden en jouw besognes laten zingen. De huidige software is gebruiksvriendelijk en toegankelijk voor iedereen – wel even een accountje aanmaken. En dan kun je dus gewoon zelf aan de slag om het resultaat dan vervolgens weer lekker te delen met al je mede-Swifties op de socials. Het zal ons niet verbazen als voor dergelijke ontwikkelingen veel belangstelling is. En wellicht moeten we dat gewoon accepteren.
De kans is overigens groot dat Taylor, of in elk geval haar leger aan advocaten, dat niet leuk gaat vinden. En hoe wordt de koek verdeeld, als jij ook creatief hebt bijgedragen? We zijn benieuwd hoe dit verder gaat en houden u op de hoogte!
Wat wil het publiek?
Zoals hierboven geschetst is de houding van het publiek een niet te onderschatten factor voor de plek die AI-gegenereerde muziek gaat innemen in het muzikale landschap. Muzikanten zijn onder de indruk of zelfs in shock van wat AI kan. Steeds vaker rijst de vraag of muziek wel of niet een ziel moet hebben of emoties moet uitdrukken. En in hoeverre is dat dan wel of niet mogelijk met AI? En je kunt je terecht afvragen in hoeverre de gemiddelde muziekconsument nog geïnteresseerd is in authenticiteit.
Het is niet overdreven om te stellen dat AI-gegenereerde muziek de grote stap is naar de democratisering van het muziekmaken, zoals de smartphone dat gedaan heeft voor de fotografie – iedereen is immers inmiddels tot op zekere hoogte fotograaf. En vanaf nu is iedereen dus ook muzikant.
Het is niet ondenkbaar dat deze AI-liedjes een groot deel van de koek van Spotify gaan opeisen. Muzikanten nú reageren net als de professionele fotografen vijftien jaar geleden toen de smartphone zijn intrede deed. De kwaliteit en integriteit werd ter discussie gesteld, maar het zette hen ook aan het denken – over waar hun toegevoegde waarde dan werkelijk ligt.
‘Kan de computer kunstenaars genereren?’ kopt NRC op 23 mei. Het misverstand dat hier om de hoek komt kijken betreft de verwarring tussen het creëren van nieuwe uitingen enerzijds – iets waar AI heel goed in is – en het duiden van de kwaliteit of relevantie ervan anderzijds. En wellicht ligt hier wel de kern voor een van de grootste menselijke competenties: het beoordelen of wat gemaakt is goed genoeg is.
Boi-1da werd op SXSW afgelopen maart op een panel over AI en muziek gevraagd of hij gebruik zou maken van een AI-muzikant. Zijn antwoord was simpel: ‘Als hij goed is, waarom niet?’ En dan is het toch het menselijk beoordelingsvermogen dat doorslaggevend is.
De vraag is ook of AI ooit in staat is om de echte nuances in teksten te begrijpen en dus ook te kunnen genereren. In Dylans boek The Philosophy Of Modern Song beschrijft hij in het hoofdstukje over London Calling van The Clash het verschil in betekenis van het begrip the river vanuit een Amerikaans perspectief – meestal zoiets als een indrukwekkende, breed meanderende Mississippi – en vanuit het perspectief van dit postpunkmeesterwerkje. The river is hier de Theems in de late jaren zeventig, waarbij de kreet ‘I live by the river’ synoniem is voor de mogelijkheid te ontsnappen uit de misère.
Waarde(n)loos
Een deel van de polemiek over AI-systemen gaat over de onduidelijkheid ten aanzien van een eventueel onderliggend waardestelsel. Waarden vormen de basis van een bedrijf, organisatie, politieke partij, religie of zelfs een land. Het zijn concepten waaraan ons doen en laten wordt weerspiegeld. Het zijn idealen en motieven die in een samenleving of groep de moeite waard worden geacht om na te streven. Ze zijn een antwoord op de vraag: waar geloven wij in? Het is het gemeenschappelijke ‘waarom’ dat een organisatie of groep mensen bindt.
We hebben geen idee of ChatGPT, Suno of Udio wel of niet geloven in duurzaamheid of inclusiviteit om maar eens iets te noemen. Dat verklaart ook waarom er tot op heden geen protestsongs zijn geproduceerd door AI-systemen. AI heeft geen mening.
Gegenereerd met Midjourney door de hoes van John Beltrans Everything At Once toe te voegen aan de prompt van ons cover-beeld. De adaptatie van het abstracte lijnenspel zorgt voor een compleet nieuw beeld.
Het nut en de relevantie van AI ligt overigens anders binnen een context waarbij muziek ondersteunend is of op de achtergrond functioneert. Producer Trevor Horn (geïnterviewd in OOR 12 van vorig jaar) heeft dat scherp voor ogen: ‘Ik voorzie een toekomst voor AI in het produceren van muziek voor film en televisie.
Hierbij is muziek onderdeel van het geheel, het geeft je niet veel ruimte om heel creatief te zijn en je eigen ding te doen. De muziek moet de sfeer van de film volgen, van verdrietig tot angstaanjagend. Dat is wat AI prima kan, per scène is het beoogde effect geframed. En voor het maken van televisie zijn de budgetten beperkt, ik denk dat door AI gefabriceerde muziek daar snel omarmd gaat worden.’
En als je dan bedenkt dat de productiemaatschappijen in deze situatie de rechten dicht bij zichzelf kunnen houden, dan is deze ontwikkeling onvermijdelijk.
De nieuwe rock & roll?
Nick Foster is voormalig head of design bij Google X en noemt zichzelf futures designer, daarnaast is hij ook dj. Foster was even in Nederland voor een keynote speech met als titel On Distortion. Volgens Foster zijn de huidige AI-beeldsystemen duidelijk onvolmaakt. Hij stelt een even eenvoudige als relevante vraag: zit er iets esthetisch en creatief interessants in de onvolmaakte AI-gereedschappen?
Foster tegen OOR: ‘Als we terugkijken en kijken naar de geboorte van de versterker dan komen we uit in 1929 bij een klein bedrijfje genaamd Vega. Zij maakten een draagbare buizenversterker voor reizende muzikanten met banjo’s. Deze waren technisch echter niet heel goed, niet bepaald high fidelity. Gedurende de jaren werd de kwaliteit steeds beter en werd het geluid van de instrumenten steeds beter gereproduceerd. Maar het meest interessant is het feit dat er een hele groep muzikanten was die het gekraak, het geplop en de vervorming van die vroege versterkers heel interessant vonden. De vroege pioniers vonden hier inspiratie en gingen die ‘fouten’ uitvergroten, beheersen en gebruiken.’
‘Gebruik maken van technische tekortkomingen was essentieel bij de geboorte van de rock & roll, de punk, maar ook de hiphop. Het is een rode draad in de muziekgeschiedenis: technische afwijkingen leiden tot nieuwe vormen van creativiteit. Neem nou de Roland TR-808, een vroege drummachine. Roland kon zich voor dit product geen fatsoenlijke memory chip veroorloven. Ze moesten de geluiden kunstmatig maken, omdat ze geen samples konden opslaan en gebruiken. Dat leidde tot behoorlijk slechte en weinig realistische drumgeluiden. Maar zonder die geluiden hadden we bijvoorbeeld geen Sexual Healing van Marvin Gaye gehad.’
‘De vreemde nieuwheid van de percussiesamples prikkelde de nieuwsgierigheid en maakte een bepaalde verkenningsdrang los bij de eerste met rap experimenterende dj’s in New York en bracht hiphop voort – het grootste muziekgenre op aarde vandaag de dag. En dan terug naar AI. AI wordt nu gebruikt om elementen van de bestaande wereld perfect te reproduceren. Maar het is véél interessanter om te kijken naar de dingen die verkeerd gaan. Afbeeldingen geproduceerd door tools als Midjourney en Stable Diffusion bevatten vaak extra vingers, onscherpe randen, vreemde artefacten en vreemde overgangen. Zeker bij AI-video gaat er van alles mis.’
‘De technische mensen die ik ken hebben de neiging om er minnetjes over te doen; ze doen alle mogelijke moeite om de fouten eruit te halen. Maar wat als deze details meer zijn dan alleen fouten? Wat als dat is wat deze tools interessant maakt? Wanneer nieuwe hulpmiddelen worden geïntroduceerd, worden deze doorgaans bekeken door een optimalisatielens, zeker door ondernemers en engineers.’
‘Ik kijk door een art & design lens, ik ben geïnteresseerd in de vuiligheid. Het is de uitdaging muzikanten aan te moedigen hun ogen te openen voor nieuwe kansen, in plaats van stil te staan bij angsten op de korte termijn en de mislukkingen van AI-systemen. Misschien staan we op het punt om de nieuwe rock & roll te ontdekken…’
Wellicht wordt het alleen maar mooier en beter, zoals Judith Rijsenbrij, alias puntjudith (Nederlandstalig / elektronisch) het stelt in de Volkskrant van 29 mei na het horen van AI-gegenereerde tracks: ‘Als je dit hoort, ga je als artiest vanzelf op zoek naar nog meer authenticiteit. Om het zelf beter te doen.’
Met dank aan Leonard Punt en Alfred Bos.
Bronnen: The Philosophy Of Modern Song (Bob Dylan); Artiesten waarschuwen: ‘AI is een ramp, een aanval op de creativiteit’ (NRC, 4 april 2024); Kan de computer kunstenaars genereren? (NRC, 23 mei 2024 ); Hitmachine (Volkskrant, 29 mei 2024)