ID.nl logo
AI zit niet stil: nieuwe toepassingen op het gebied van muziek, video en tekst
© svitlini - stock.adobe.com
Huis

AI zit niet stil: nieuwe toepassingen op het gebied van muziek, video en tekst

Er is de laatste tijd sprake van een ware explosie aan nieuwe toepassingen gebaseerd op kunstmatige intelligentie (AI). In dit artikel laten we je kennismaken met nieuwe tools die voor iedereen gratis beschikbaar zijn.

In dit artikel benoemen we op verschillende gebieden AI-tools die je misschien nog niet kent:

  • Muziek: o.a. MusicGen en Suno AI
  • 3D: Luma AI en Animated Drawings
  • Video: Pika
  • Tekst: Perplexity en SciSpace

Interessant om te lezen: AI: van razendsnelle ontwikkeling tot strikte regulering

We hebben de afgelopen tijd flink wat aandacht besteed aan ChatGPT en de verschillende modellen waarmee je met AI plaatjes kunt maken. Het aantal terreinen waarop je van kunstmatige intelligentie kunt profiteren is alleen nog veel groter en neemt bovendien in rap tempo toe. Meer en meer toepassingen worden ook aangeboden op een manier waardoor ze voor iedereen toegankelijk zijn, bijvoorbeeld als app of online. We hebben een aantal interessante nieuwe ontwikkelingen voor je op een rijtje gezet.

Lees ook: Prompt engineering: zo maak je precies het beeld dat je voor ogen hebt

Muziek

Waar sinds een jaar of drie de AI-modellen om plaatjes mee te maken ons om de oren vliegen, is nu het genereren van muziek een terrein dat volop in beweging is. We hebben eerder al een artikel geschreven over AIVA: Muziek maken? Iedereen kan het met AIVA: de Artificial Intelligence Virtual Artist

De AI van dat systeem zat toen vooral in het slim toepassen van allerlei wetmatigheden op het gebied van compositie. Inmiddels werken de nieuwe modellen meestal op basis van hetzelfde principe als bij de plaatjesmakers. Dat wil zeggen dat allerlei muziek met woorden is beschreven. De AI is vervolgens is getraind met combinaties van geluid en beschrijving.

Plaatjes kun je alleen veel eenduidiger beschrijven dan muziek. De laatste kun je vooral technisch beschrijven, zoals toonsoorten en modulaties, of op basis van instrumentatie. Ook kun je muziek beschrijven op basis van sfeer of stijl. Voor al deze varianten en combinaties daarvan is wel nieuwe AI te vinden. Overigens heeft AIVA (Artificial Intelligence Virtual Artist) zeer recent ook iets dergelijks toegevoegd voor technische beschrijvingen onder de naam text-to-harmony.

MusicGen

Het eerste model dat we willen noemen, is MusicGen van Meta. Met dit programma kun je verschillende soorten beschrijvingen gebruiken. We geven als voorbeeld de prompt Epic power chords in the sequence C, F, C, F minor, G and C in a slow heavy metal ballad. Na ongeveer anderhalve minuut krijgen we dertig seconden muziek die daar keurig aan voldoet. Deze muziek kunnen we bovendien downloaden als wav-bestand.

Alhoewel de geluidskwaliteit best aardig is, missen we wel een kop een staart. Het is muziek die nergens heen gaat. Je kunt wel eerder gemaakte muziek als input gebruiken en het systeem vragen er meer aan vast te breien. Daarnaast kun je MusicGen gebruiken om muziek te arrangeren. Daarvoor upload je een monofoon melodietje dat je bijvoorbeeld maakt op een piano of gitaar. Vervolgens geef je aan voor welke instrumentatie je dat wilt laten arrangeren.

MusicGen maakt muziek op basis van een beschrijving.

Fragment

Mocht je de muziekjes van MusicGen wat aan de korte kant vinden, dan geldt dat helemaal voor Riffusion. Een riff is de benaming voor een korte passage in popmuziek, dus dat is hier ook de bedoeling. Aan de hand van een of twee stilistische beschrijvingen (bijvoorbeeld spanish guitar solo en 50s latin) maakt Riffusion een fragment van zo’n vijf seconden. Dat lijkt weinig, maar als je dat downloadt en slim knipt, kun je dat fragment als bouwsteen gebruiken in muziekeditors die met audio werken.

MusicGen en Riffusion zijn voorbeelden van toepassingen die werken basis van text-to-music. Er zijn ook diensten die kant-en-klare muziekjes voor je maken waarbij jij alleen de criteria kiest. Hier een SoundRaw een voorbeeld van. Dit model maakt muziek volgens de door jou ingestelde instellingen, zoals genre, stemming, gebruiksdoel en instrumentatie. Of je keuzes ook strikt worden opgevolgd, is de vraag.

Enigszins vergelijkbaar is Boomy. Hiermee wordt muziek gemaakt op basis van genre en instrumentatie. Je hebt ook de mogelijkheid om een songtekst toe te voegen, maar daarvoor hebben we een interessanter alternatief in de vorm van Suno AI.

SoundRaw maakt complete instrumentale nummers.

Liedjesbakker

Waar de eerder genoemde tools zich (voornamelijk) richten op instrumentale muziek, is Suno AI een echte liedjesbakker. Via een prompt geef je om te beginnen aan wat voor soort nummer je wilt maken. Een voorbeeld: a cheerful uptempo tune with the feel of summer about a man walking on the beach. Vervolgens krijg je binnen een minuut twee varianten van (het begin van) een nummer dat aan die omschrijving voldoet. Daarbij maakt het systeem zelf een Engelse tekst over het gevraagde onderwerp. De muziek kun je, compleet met zang, downloaden. Je kunt Suno AI ook vragen om meer muziek toe te voegen, al zijn we van die functie nog niet echt onder de indruk.

Echt interessant wordt het wanneer je kiest voor Custom Mode. Het systeem kan daarin een willekeurige tekst voor je genereren, waarbij je zelf een geschikte prompt bedenkt om de muzikale stijl te bepalen. Je kunt ook een eigen tekst invoeren. Dat kan in verschillende talen, ook in het Nederlands. Je kunt je uiteindelijk creatie als audio- en videobestand downloaden. In het videobestand wordt de tekst getoond, zodat je ook buiten Suno kunt meezingen.

Bij Suno AI maak je nummers compleet met zang, zelfs in het Nederlands.

Geen inspiratie?

Er wordt nog genoeg muziek voor jou gemaakt

Ruimtelijk

Een ander gebied waar de ontwikkelingen elkaar in rap tempo opvolgen, is dat van 3D-weergave. We hadden al langere tijd toepassingen die foto’s iets driedimensionaals konden geven, zoals www.leiapix.com. Dat valt alleen in het niet bij de nieuwe mogelijkheden die je bijvoorbeeld vindt bij Luma AI.

Luma AI bestaat uit twee onderdelen. Het eerste heet Genie en kun je omschrijven als text-to-3d. Door het ingeven van een prompt, zoals A statue of a werewolf made of honey, kan de webtoepassing een heus 3D-object voor je maken. Dat kun je vervolgens van alle kanten bekijken.

Voor elke prompt maakt Genie vier objecten. Zit er iets bij dat je bijzonder geslaagd vindt, dan kun je een meer gedetailleerde versie laten maken. Dat kost wel enkele minuten. Eenmaal klaar kun je dit model in verschillende formaten downloaden. Daarna kun je het bijvoorbeeld verder bewerken in het bekende gratis 3D-programma Blender.

In het onderdeel Genie van Luma maak je 3D-objecten op basis van tekst.

Fysieke 3D-producten maken?

Dat doe je met deze 3D-printers

Scanner

Het maken van 3D-objecten op basis van een prompt is handig, maar het is vooralsnog minder ver ontwikkeld dan het maken van plaatjes. Luma AI kent nog wel een ander kunstje: het scannen van bestaande objecten en ruimtes en deze omtoveren tot een interactieve 3D-scène. Hier gaven de Hollywood-studio’s tot voorkort miljoenen aan uit.

Dat scannen gebeurt met een video van het object. In de opnamen bekijk je het object of de ruimte van alle kanten. Daarna maakt Luma er een interactieve scène van die je vrij kunt roteren. Op de site vind je volop voorbeelden, zelfs van complete gebouwen en stadscentra op basis van dronebeelden.

Je kunt dit onderdeel van Luma AI gebruiken via een iOS-app en je kunt je video’s via de website uploaden. Het interactieve formaat van Luma AI gebruikt WebGL. Speciaal voor webontwikkelaars is er de Luma WebGL Library. Daarmee kunnen scènes aan websites worden toegevoegd.

Maak van bestaande voorwerpen een 3D-object met Luma AI.

In beweging

Waar je bij de voorgaande tools alleen het gezichtspunt kon bewegen, gaan de makers van Animated Drawings nog een stapje verder. Met dit online speelgoed maakt AI in hoog tempo allerlei animaties voor je op basis van een enkele tekening van een figuurtje. Dat hoeft geen meesterwerk te zijn, want de toepassing herkent moeiteloos wat kleine kinderen tekenen. Als grootouder kun je ze ongetwijfeld met Animated Drawings vermaken.

Je begint met het uploaden van een foto van de tekening. Daarna identificeert de AI zelf het figuurtje. Er wordt onder meer vastgesteld waar de gewrichten voor de armen en benen zitten. Maakt de AI een fout, dan kun je die handmatig corrigeren. Daarna kan de AI tientallen animaties voor je maken met het figuurtje in de hoofdrol. Deze kun je downloaden als video of delen via mail of sociale media.

Maak leuke animaties op basis van een (kinder)tekening.

Ook leuk: Laat je kinderen creatief kliederen met Tux Paint

Video

Animaties op basis van een tekening zijn natuurlijk leuk, maar je kunt alleen uit voorgebakken bewegingen kiezen. De veelzijdigheid van Pika gaat een stuk verder. Met Pika maak je korte (drie seconden in de gratis versie) videoclips op basis van een tekstprompt.

Alhoewel de resultaten zeker niet tegenvallen, kun je nog meer uit de AI halen door te beginnen met een startafbeelding. Dat kan een foto zijn, een (gescande) tekening of een plaatje dat je met een andere AI hebt gemaakt. Vervolgens geef je in de prompt aan wat voor beweging je wilt zien. Je video’s zijn in een minuutje klaar.

In de gratis versie blijft het bij drie seconden per prompt, maar met een abonnement (vanaf 8 dollar per maand) kun je daar segmenten van vier seconden aan vastplakken. Ook kun je dan de resolutie van video’s vergroten.

Pika kan deze met Dall-E gemaakte glazen gitarist in beweging zetten.

Vraagbaak

Na al dat audiovisuele geweld zouden we bijna vergeten dat er op het gebied van tekst ook heel veel gebeurt. Iedereen kan inmiddels profiteren van het aan ChatGPT verwante Bing Chat, maar waarom zou je je beperken tot één bron? Een interessant alternatief is Perplexity. Hier kun je allerlei vragen stellen, ook in het Nederlands.

Perplexity doet vergelijkbare dingen als Bing Chat. Het kan allerlei vragen beantwoorden, waarbij ook actuele informatie van internet wordt opgehaald. Het kan bekende boeken voor je samenvatten, computercode schrijven en nog veel meer. Ook kan het plaatjes en video vinden die bij je vraag passen.

Een uitstekende chatbot die al je vragen beantwoordt.

Professor

Waar Perplexity een vraagbaak is voor algemene onderwerpen, is SciSpace dat specifiek voor wetenschappelijke kennis. Hier kun je vragen stellen over wetenschappelijke onderwerpen, ook in het Nederlands. Vervolgens citeert SciSpace toonaangevende bronnen over dat onderwerp in de vorm van Engelstalige wetenschappelijke publicaties. Als je dat zware kost vindt, kan SciSpace je ook helpen. Je kunt er namelijk pdf-bestanden (tot 100 MB) uploaden en vervolgens vragen stellen over de inhoud daarvan.

Een andere manier om moeilijke Engelse tekst te bevatten is de functie Paraphrase. Deze kan teksten tot honderdvijftig woorden (vijfhonderd na gratis registratie) herformuleren. Dat kan overigens ook tussen verschillende talen.

SciSpace is je vraagbaak over wetenschappelijke onderwerpen.
Watch on YouTube
▼ Volgende artikel
Review Sony WF-1000XM6 – Dit is je volgende set oordopjes
© Wesley Akkerman
Huis

Review Sony WF-1000XM6 – Dit is je volgende set oordopjes

Wanneer Sony met een nieuwe set premium oordoppen op de proppen komt, dan moet je opletten. Dit Japanse merk is namelijk al jaren marktleider als het gaat om geluidskwaliteit en actieve ruisonderdrukking. Met zijn prijs van 300 euro mikt de fabrikant wederom op het hogere segment, al is dit wel minder dan de adviesprijs van zijn voorganger.

Fantastisch
Conclusie

Het zal ongetwijfeld niemand verbazen, maar dat maakt zo’n beoordeling niet minder waardevol: de Sony WF-1000XM6 is een regelrecht schot in de roos. Qua audiokwaliteit en -beleving hebben we nog niet beter gehoord. Soms klinkt het net alsof de muziek live naast je wordt gespeeld. Het comfort en de app kunnen nog wel beter, maar de grandioze actieve ruisonderdrukking en de fysieke bediening maken een hoop goed. Dit is je volgende set oordopjes!

Plus- en minpunten
  • Audiokwaliteit van hoog niveau
  • Bediening met gevoel van contact
  • Actieve ruisonderdrukking verbeterd
  • Gave en unieke functies
  • Goede batterijduur
  • Genoeg oortips met memory foam
  • App wat gebruiksonvriendelijk
  • Oortips zitten na verloop van tijd minder comfortabel

Prijs: € 299,-
Driverunit:
8,4 mm
Bluetooth:
Versie 5.3
Batterijduur (muziek):
Max. 8 uur (NC AAN) / max. 12 uur (NC UIT)
Oplaadtijd:
Ca. 1,5 uur (oordopjes), ca. 2 uur via usb (case)
Draadloos opladen:
Ja (met oplaadcase)
Waterbestendigheid:
IPX4
Codecs:
SBC, AAC, LDAC, LC3
Multipoint-functie:
Ja
Frequentierespons:
20 Hz - 40.000 Hz (LDAC 96 kHz sampling 990 kbps)
Gewicht:
Ca. 6,5 g per oordopje / ca. 47 g voor de oplaadcase
Afmetingen case:
Ca. 61,6 x 41,1 x 26,5 mm
Inhoud verpakking:
Oplaadcase, geluidsisolerende eartips, usb-kabel

De Sony WF-1000XM6 volgen de XM5 op die het Japanse bedrijf zo’n 2,5 jaar geleden uitbracht. Dat is een flinke periode in het land der oordoppen (of technologie in het algemeen). Daar waar veel fabrikanten inzetten op jaarlijkse releases en complete productgroepen beperkte stappen voorwaarts maken, is het fijn om te zien dat een elektronicaproducent het nog aandurft langer te wachten tussen verschillende uitgaven. Dan heb je tenminste wat te melden of te vertellen.

Met deze versie zet Sony in op een betere noise cancelling, audioweergave, gesprekskwaliteit en ergonomie. Daarnaast brengt de fabrikant stabielere bluetooth-connectiviteit, Google Gemini-integratie en een hogere mate van milieuvriendelijkheid. Zo zijn de antennes langer gemaakt, waardoor de oortjes niet snel de verbinding verliezen, ook niet in drukkere omgevingen zoals een vliegtuig of trein. Dat hebben we aan den lijve ondervonden de afgelopen weken.

©Wesley Akkerman

Meer in contact

Net als bij het vorige model maakt Sony gebruik van memory foam als oortips (het deel dat in je gehoorgang zit). Die hebben als grote voordeel dat ze zich aanpassen aan de vorm van de opening en dus altijd strak en goed zitten. In de doos zitten verschillende opties. Bij ons zit de een net te los, terwijl het formaat daarna juist net wat strak zit. Daardoor kan langer dan twee uur luisteren wat oncomfortabel worden. Maar ze vallen in elk geval niet zomaar uit je oren.

Deze keer kijkt Sony ook naar het ontwerp. De Sony WF-1000XM6-oortjes zijn wat langwerpiger en steken iets verder uit je oren dan z'n voorganger, waardoor je moet oppassen wanneer je een T-shirt of trui uittrekt. Het oppervlak is wat ruwer en dat helpt daadwerkelijk bij de fysieke bediening; het voelt alsof je wat meer in contact bent met de bediening. Muziek pauzeren, actieve ruisonderdrukking activeren – het gaat allemaal erg soepel. Je hoeft ze niet hard in te drukken.

Grammy-winnende engineers

Daarnaast is het fijn dat deze dopjes nog steeds acht uur meegaan op een volle accu. Dat is met actieve ruisonderdrukking aan. Zet je die uit, dan mag je daar nog een paar uur bij optellen. Met de oplaadcase erbij kun je rekenen op 24 tot 30 uur. Dat is misschien niet superveel in vergelijking met sommige concurrenten, maar die zitten dan ook niet boordevol allerlei extra microfoons (vier stuks in dit model) en speciaal ontwikkelde drivers.

©Wesley Akkerman

De drivers zijn natuurlijk medeverantwoordelijk voor het geluid, maar de samenwerking met allerlei gerenommeerde studio's en muziekproducenten helpt daar vanzelfsprekend ook bij. Sony heeft zich laten leiden door een team van Grammy-winnende en Grammy-genomineerde engineers, waaronder Randy Merrill (die werkte met Ed Sheeran), Chris Gehringer (Lady Gaga) en Michael Romanowski (Alicia Keys). Dat zijn niet de minste namen, maar wat merk je daarvan?

Naast je in de kamer

Nou, het grootste compliment dat we een set oordoppen kunnen geven: je hebt de equalizer niet nodig om goed en wel – en in de hoogste kwaliteit! – van je digitale muziek te genieten. De audio klinkt warm, vol en persoonlijk. Dat gaat niet ten koste van de hogere regionen of het middenveld, waardoor die helderheid en nuance bewaakt blijft. Soms lijkt het net alsof iemand op een drumstel naast je in de kamer speelt, zo dichtbij klinken de nummers.

Als je wilt, dan kun je wel een equalizer op de soundstage loslaten. Je kunt dan kiezen uit verschillende profielen, zelf een instelling beheren of Sony het werk uit handen laten nemen. Dan stelt de (helaas soms wat onoverzichtelijke) app de equalizer in op basis van jouw eigen gehoor. Hier kan dat nog weleens ten koste gaan van het basgeluid, waardoor we dat maar achterwege laten, maar het is fijn dat het kan. Het maakt de Sony WF-1000XM6 breed inzetbaar.

©Wesley Akkerman

Gevoel, beleving, emotie

En daar blijft het niet bij qua audio. Want je kunt streamen in hoge resoluties dankzij de LDAC-audiocodec en anders leunen op DSEE Extreme (een algoritme van Sony dat de muziek in kwaliteit opschaalt). Verder is nieuw in deze set dat je audio wat verder weg kunt laten klinken, alsof je in een café of je eigen woonkamer zit. Dat is een vreemde maar oorstrelende ervaring die je moet beleven om het te begrijpen.

We snappen uiteindelijk wel waarom Sony deze functie introduceert. Het kan bijvoorbeeld helpen bij de concentratie. Wij hebben vooral gemerkt dat je er een huiselijk gevoel aan kunt overhouden wanneer je kilometers hoog in de lucht hangt in een vliegtuig, omdat het net lijkt alsof je naar je eigen audioset thuis op de achtergrond luistert. Het gaat hier niet om de beste geluidskwaliteit, maar om een gevoel, een emotie, een beleving. En die is helemaal oké.

Tot slot kijken we nog even naar de actieve ruisonderdrukking. Die is beter dan ooit. Zo hebben we bijna niets van de vliegtuigmotoren gehoord tijdens een recente reis naar Barcelona en komt er ook weinig tot geen geluid vanuit het OV je gehoorgang in. Bepaalde plotselinge hoge tonen komen nog weleens door, maar die blijven moeilijk filterbaar. Al met al is dit wederom een mooie stap voorwaarts, helemaal als je je écht even wilt afsluiten van je omgeving.

Sony WF-1000XM6 kopen?

Het zal ongetwijfeld niemand verbazen, maar dat maakt zo’n beoordeling niet minder waardevol: de Sony WF-1000XM6 is een regelrecht schot in de roos. Qua audiokwaliteit en -beleving hebben we nog niet beter gehoord. Soms klinkt het net alsof de muziek live naast je wordt gespeeld. Het comfort en de app kunnen nog wel beter, maar de grandioze actieve ruisonderdrukking en de fysieke bediening maken een hoop goed. Dit is je volgende set oordopjes!

▼ Volgende artikel
De beste State of Play ooit! - Power-Up Podcast Special
Huis

De beste State of Play ooit! - Power-Up Podcast Special

Zo! Dat was niet alleen de langste, maar voor velen ook meteen de beste State of Play ooit! Met meer dan 25 titels op het menu stond deze showcase vooral bij Simon dik op z’n buik geschreven. Samen met Martin en Jacco blikt hij terug op (bijna) alles wat voorbij kwam, en duiken ze dieper in onder andere: God of War: Sons of Sparta, Kena: Scars of Kosmora, Castlevania: Belmont’s Curse, Project Windless en natuurlijk de aangekondigde John Wick-game! Benieuwd wat de jongens ervan vonden? Check dan als de wiedeweerga deze speciale extra aflevering, baklap!

Watch on YouTube

00:00 Intro
02:20 Ons oordeel
09:20 Project Windless
11:35 Resident Evil Requiem
13:35 Kena: Scars of Kosmora
19:00 Legacy of Kain: Defiance Remastered / Ascendance
22:45 Yakoh Shinobi Ops
27:25 Dead or Alive
31:45 Control: Resonant
36:05 Beast of Reincarnation
37:15 Neva: Prologue
39:05 Star Wars: Galactic Racer
42:35 Metal Gear Solid Collection 2
45:15 Castlevania: Belmont’s Curse
49:15 Silent Hill: Townfall
52:10 John Wick
54:35 God of War Trilogy Remake
56:35 God of War: Sons of Sparta
01:03:00 Horizon Hunters: Gathering
01:04:45 Onze Reddit-aankondiging
01:06:45 Outro

Je kan ook de podcast beluisteren hieronder of via deze link!