ID.nl logo
AI zit niet stil: nieuwe toepassingen op het gebied van muziek, video en tekst
© svitlini - stock.adobe.com
Huis

AI zit niet stil: nieuwe toepassingen op het gebied van muziek, video en tekst

Er is de laatste tijd sprake van een ware explosie aan nieuwe toepassingen gebaseerd op kunstmatige intelligentie (AI). In dit artikel laten we je kennismaken met nieuwe tools die voor iedereen gratis beschikbaar zijn.

In dit artikel benoemen we op verschillende gebieden AI-tools die je misschien nog niet kent:

  • Muziek: o.a. MusicGen en Suno AI
  • 3D: Luma AI en Animated Drawings
  • Video: Pika
  • Tekst: Perplexity en SciSpace

Interessant om te lezen: AI: van razendsnelle ontwikkeling tot strikte regulering

We hebben de afgelopen tijd flink wat aandacht besteed aan ChatGPT en de verschillende modellen waarmee je met AI plaatjes kunt maken. Het aantal terreinen waarop je van kunstmatige intelligentie kunt profiteren is alleen nog veel groter en neemt bovendien in rap tempo toe. Meer en meer toepassingen worden ook aangeboden op een manier waardoor ze voor iedereen toegankelijk zijn, bijvoorbeeld als app of online. We hebben een aantal interessante nieuwe ontwikkelingen voor je op een rijtje gezet.

Lees ook: Prompt engineering: zo maak je precies het beeld dat je voor ogen hebt

Muziek

Waar sinds een jaar of drie de AI-modellen om plaatjes mee te maken ons om de oren vliegen, is nu het genereren van muziek een terrein dat volop in beweging is. We hebben eerder al een artikel geschreven over AIVA: Muziek maken? Iedereen kan het met AIVA: de Artificial Intelligence Virtual Artist

De AI van dat systeem zat toen vooral in het slim toepassen van allerlei wetmatigheden op het gebied van compositie. Inmiddels werken de nieuwe modellen meestal op basis van hetzelfde principe als bij de plaatjesmakers. Dat wil zeggen dat allerlei muziek met woorden is beschreven. De AI is vervolgens is getraind met combinaties van geluid en beschrijving.

Plaatjes kun je alleen veel eenduidiger beschrijven dan muziek. De laatste kun je vooral technisch beschrijven, zoals toonsoorten en modulaties, of op basis van instrumentatie. Ook kun je muziek beschrijven op basis van sfeer of stijl. Voor al deze varianten en combinaties daarvan is wel nieuwe AI te vinden. Overigens heeft AIVA (Artificial Intelligence Virtual Artist) zeer recent ook iets dergelijks toegevoegd voor technische beschrijvingen onder de naam text-to-harmony.

MusicGen

Het eerste model dat we willen noemen, is MusicGen van Meta. Met dit programma kun je verschillende soorten beschrijvingen gebruiken. We geven als voorbeeld de prompt Epic power chords in the sequence C, F, C, F minor, G and C in a slow heavy metal ballad. Na ongeveer anderhalve minuut krijgen we dertig seconden muziek die daar keurig aan voldoet. Deze muziek kunnen we bovendien downloaden als wav-bestand.

Alhoewel de geluidskwaliteit best aardig is, missen we wel een kop een staart. Het is muziek die nergens heen gaat. Je kunt wel eerder gemaakte muziek als input gebruiken en het systeem vragen er meer aan vast te breien. Daarnaast kun je MusicGen gebruiken om muziek te arrangeren. Daarvoor upload je een monofoon melodietje dat je bijvoorbeeld maakt op een piano of gitaar. Vervolgens geef je aan voor welke instrumentatie je dat wilt laten arrangeren.

MusicGen maakt muziek op basis van een beschrijving.

Fragment

Mocht je de muziekjes van MusicGen wat aan de korte kant vinden, dan geldt dat helemaal voor Riffusion. Een riff is de benaming voor een korte passage in popmuziek, dus dat is hier ook de bedoeling. Aan de hand van een of twee stilistische beschrijvingen (bijvoorbeeld spanish guitar solo en 50s latin) maakt Riffusion een fragment van zo’n vijf seconden. Dat lijkt weinig, maar als je dat downloadt en slim knipt, kun je dat fragment als bouwsteen gebruiken in muziekeditors die met audio werken.

MusicGen en Riffusion zijn voorbeelden van toepassingen die werken basis van text-to-music. Er zijn ook diensten die kant-en-klare muziekjes voor je maken waarbij jij alleen de criteria kiest. Hier een SoundRaw een voorbeeld van. Dit model maakt muziek volgens de door jou ingestelde instellingen, zoals genre, stemming, gebruiksdoel en instrumentatie. Of je keuzes ook strikt worden opgevolgd, is de vraag.

Enigszins vergelijkbaar is Boomy. Hiermee wordt muziek gemaakt op basis van genre en instrumentatie. Je hebt ook de mogelijkheid om een songtekst toe te voegen, maar daarvoor hebben we een interessanter alternatief in de vorm van Suno AI.

SoundRaw maakt complete instrumentale nummers.

Liedjesbakker

Waar de eerder genoemde tools zich (voornamelijk) richten op instrumentale muziek, is Suno AI een echte liedjesbakker. Via een prompt geef je om te beginnen aan wat voor soort nummer je wilt maken. Een voorbeeld: a cheerful uptempo tune with the feel of summer about a man walking on the beach. Vervolgens krijg je binnen een minuut twee varianten van (het begin van) een nummer dat aan die omschrijving voldoet. Daarbij maakt het systeem zelf een Engelse tekst over het gevraagde onderwerp. De muziek kun je, compleet met zang, downloaden. Je kunt Suno AI ook vragen om meer muziek toe te voegen, al zijn we van die functie nog niet echt onder de indruk.

Echt interessant wordt het wanneer je kiest voor Custom Mode. Het systeem kan daarin een willekeurige tekst voor je genereren, waarbij je zelf een geschikte prompt bedenkt om de muzikale stijl te bepalen. Je kunt ook een eigen tekst invoeren. Dat kan in verschillende talen, ook in het Nederlands. Je kunt je uiteindelijk creatie als audio- en videobestand downloaden. In het videobestand wordt de tekst getoond, zodat je ook buiten Suno kunt meezingen.

Bij Suno AI maak je nummers compleet met zang, zelfs in het Nederlands.

Geen inspiratie?

Er wordt nog genoeg muziek voor jou gemaakt

Ruimtelijk

Een ander gebied waar de ontwikkelingen elkaar in rap tempo opvolgen, is dat van 3D-weergave. We hadden al langere tijd toepassingen die foto’s iets driedimensionaals konden geven, zoals www.leiapix.com. Dat valt alleen in het niet bij de nieuwe mogelijkheden die je bijvoorbeeld vindt bij Luma AI.

Luma AI bestaat uit twee onderdelen. Het eerste heet Genie en kun je omschrijven als text-to-3d. Door het ingeven van een prompt, zoals A statue of a werewolf made of honey, kan de webtoepassing een heus 3D-object voor je maken. Dat kun je vervolgens van alle kanten bekijken.

Voor elke prompt maakt Genie vier objecten. Zit er iets bij dat je bijzonder geslaagd vindt, dan kun je een meer gedetailleerde versie laten maken. Dat kost wel enkele minuten. Eenmaal klaar kun je dit model in verschillende formaten downloaden. Daarna kun je het bijvoorbeeld verder bewerken in het bekende gratis 3D-programma Blender.

In het onderdeel Genie van Luma maak je 3D-objecten op basis van tekst.

Fysieke 3D-producten maken?

Dat doe je met deze 3D-printers

Scanner

Het maken van 3D-objecten op basis van een prompt is handig, maar het is vooralsnog minder ver ontwikkeld dan het maken van plaatjes. Luma AI kent nog wel een ander kunstje: het scannen van bestaande objecten en ruimtes en deze omtoveren tot een interactieve 3D-scène. Hier gaven de Hollywood-studio’s tot voorkort miljoenen aan uit.

Dat scannen gebeurt met een video van het object. In de opnamen bekijk je het object of de ruimte van alle kanten. Daarna maakt Luma er een interactieve scène van die je vrij kunt roteren. Op de site vind je volop voorbeelden, zelfs van complete gebouwen en stadscentra op basis van dronebeelden.

Je kunt dit onderdeel van Luma AI gebruiken via een iOS-app en je kunt je video’s via de website uploaden. Het interactieve formaat van Luma AI gebruikt WebGL. Speciaal voor webontwikkelaars is er de Luma WebGL Library. Daarmee kunnen scènes aan websites worden toegevoegd.

Maak van bestaande voorwerpen een 3D-object met Luma AI.

In beweging

Waar je bij de voorgaande tools alleen het gezichtspunt kon bewegen, gaan de makers van Animated Drawings nog een stapje verder. Met dit online speelgoed maakt AI in hoog tempo allerlei animaties voor je op basis van een enkele tekening van een figuurtje. Dat hoeft geen meesterwerk te zijn, want de toepassing herkent moeiteloos wat kleine kinderen tekenen. Als grootouder kun je ze ongetwijfeld met Animated Drawings vermaken.

Je begint met het uploaden van een foto van de tekening. Daarna identificeert de AI zelf het figuurtje. Er wordt onder meer vastgesteld waar de gewrichten voor de armen en benen zitten. Maakt de AI een fout, dan kun je die handmatig corrigeren. Daarna kan de AI tientallen animaties voor je maken met het figuurtje in de hoofdrol. Deze kun je downloaden als video of delen via mail of sociale media.

Maak leuke animaties op basis van een (kinder)tekening.

Ook leuk: Laat je kinderen creatief kliederen met Tux Paint

Video

Animaties op basis van een tekening zijn natuurlijk leuk, maar je kunt alleen uit voorgebakken bewegingen kiezen. De veelzijdigheid van Pika gaat een stuk verder. Met Pika maak je korte (drie seconden in de gratis versie) videoclips op basis van een tekstprompt.

Alhoewel de resultaten zeker niet tegenvallen, kun je nog meer uit de AI halen door te beginnen met een startafbeelding. Dat kan een foto zijn, een (gescande) tekening of een plaatje dat je met een andere AI hebt gemaakt. Vervolgens geef je in de prompt aan wat voor beweging je wilt zien. Je video’s zijn in een minuutje klaar.

In de gratis versie blijft het bij drie seconden per prompt, maar met een abonnement (vanaf 8 dollar per maand) kun je daar segmenten van vier seconden aan vastplakken. Ook kun je dan de resolutie van video’s vergroten.

Pika kan deze met Dall-E gemaakte glazen gitarist in beweging zetten.

Vraagbaak

Na al dat audiovisuele geweld zouden we bijna vergeten dat er op het gebied van tekst ook heel veel gebeurt. Iedereen kan inmiddels profiteren van het aan ChatGPT verwante Bing Chat, maar waarom zou je je beperken tot één bron? Een interessant alternatief is Perplexity. Hier kun je allerlei vragen stellen, ook in het Nederlands.

Perplexity doet vergelijkbare dingen als Bing Chat. Het kan allerlei vragen beantwoorden, waarbij ook actuele informatie van internet wordt opgehaald. Het kan bekende boeken voor je samenvatten, computercode schrijven en nog veel meer. Ook kan het plaatjes en video vinden die bij je vraag passen.

Een uitstekende chatbot die al je vragen beantwoordt.

Professor

Waar Perplexity een vraagbaak is voor algemene onderwerpen, is SciSpace dat specifiek voor wetenschappelijke kennis. Hier kun je vragen stellen over wetenschappelijke onderwerpen, ook in het Nederlands. Vervolgens citeert SciSpace toonaangevende bronnen over dat onderwerp in de vorm van Engelstalige wetenschappelijke publicaties. Als je dat zware kost vindt, kan SciSpace je ook helpen. Je kunt er namelijk pdf-bestanden (tot 100 MB) uploaden en vervolgens vragen stellen over de inhoud daarvan.

Een andere manier om moeilijke Engelse tekst te bevatten is de functie Paraphrase. Deze kan teksten tot honderdvijftig woorden (vijfhonderd na gratis registratie) herformuleren. Dat kan overigens ook tussen verschillende talen.

SciSpace is je vraagbaak over wetenschappelijke onderwerpen.

Watch on YouTube
▼ Volgende artikel
Review Poco F8 Ultra – Toptoestel zodra de prijs zakt
© Wesley Akkerman
Huis

Review Poco F8 Ultra – Toptoestel zodra de prijs zakt

De smartphones van Poco zijn over het algemeen goed geprijsd als je kijkt naar wat je ervoor terugkrijgt. De nieuwe Poco F8 Ultra heeft een prijskaartje van minimaal 800 euro. Gaat die regel ook hier op?

Uitstekend
Conclusie

De Poco F8 Ultra oogt uniek, vindt in de subwoofer een handige toevoeging en voelt stevig aan. De door ons geteste Denim Blue-uitvoering heeft bovendien een faux denimlaagje op de achterkant voor extra grip (wat deze variant een paar gram zwaarder maakt dan de zwarte versie). Wel plaatsen we wat kanttekeningen bij de software- en camera-ervaring. De prijs is misschien gevoelsmatig nog wat hoog, zeker voor dit merk. Maar zakt de prijs richting de 600 euro, dan krijg je een toptoestel dat zijn prijs meer dan waarmaakt en waar je langdurig plezier van hebt.

Plus- en minpunten
  • Bose-subwoofer
  • Faux denim achterop
  • Stevig, handzaam en licht
  • Vlotte en overzichtelijke software
  • Gemiddeld tot goed softwarebeleid
  • Batterijduur
  • Kleuren kunnen beter
  • Camera laat te wensen over
  • Bloatware en advertenties
CategorieSpecificatie
Display6,9 inch Amoled-display, 120Hz (adaptief), 3500 nits maximale helderheid
ProcessorSnapdragon 8 Elite Gen 5 (3nm)
Geheugen12 GB of 16 GB LPDDR5X (9600 Mbps)
Opslag256 GB of 512 GB (UFS 4.1)
Batterij6500 mAh met 100W HyperCharge en 50W draadloos laden
Camera achter50 MP hoofdcamera (OIS), 50 MP periscooptelelens (OIS), 50 MP ultragroothoek
Camera voor32 MP met autofocus
VideoTot 8K op 30 fps (achter) / 4K op 60 fps (voor)
SoftwareXiaomi HyperOS 3
BouwIP68 waterbestendig, POCO Shield Glass, 218 (Black) - 220 gram (Denim Blue)
Connectiviteit5G, Wifi 7, Bluetooth 6.0, NFC
Extra'sUltrasone vingerafdrukscanner, Infrarood (IR-blaster), Bose audio

Want wat voor smartphone kun je precies aanbieden als je er net wat meer geld tegenaan gooit? Dat idee heeft een unieke telefoon opgeleverd, voorzien van een denimlook én een extra subwoofer achterop. Gewaagde keuzes, maar in een wereld waarin smartphones steeds meer naar elkaar toe groeien, en in hun identiteitscrisis meer en meer op iPhones gaan lijken, geen verkeerde ontwikkeling. Alleen daarom al zijn we enthousiast over de Poco F8 Ultra (Blue Denim-uitvoering).

Het helpt dan ook zeer dan de subwoofer daar niet alleen voor de show zit. Dit compacte speakertje geeft geluiden en audio meer dan genoeg ruimte om beter tot hun recht te komen vergeleken met reguliere smartphonespeakers. Weg is dat blikkige geluid, dat nu ruimte maakt voor warmere tonen en een bredere soundstage. Klinkt de muziek perfect? Dat kun je niet verwachten, maar we zijn desondanks onder de indruk van de Bose-luidspreker.

©Wesley Akkerman

Uniek en tof

De Poco F8 Ultra ligt prettig in de hand en voelt solide aan dankzij het aluminium frame. Met 220 gram is hij ook niet overdreven zwaar. Het fauxdenim op de achterkant draagt daarbij merkbaar bij aan de grip, waardoor hij niet snel uit je handen glipt. Juist door dat eigenzinnige uiterlijk is dit zo'n smartphone die je liever zonder hoesje gebruikt, ook al loop je daarmee iets meer risico op valschade.

Het grote amoled-paneel van 6,9 inch stelt evenmin teleur. Met zijn hoge resolutie (1.200 bij 2.608 pixels) en verversingssnelheid (120 Hertz) kom je niets tekort en oogt alles scherp en vlot. Het contrast is breed en zwartwaarden zijn diep, maar de kleuren kunnen soms net even wat flets ogen. Dat valt alleen op in directe vergelijkingen met andere smartphones; de kans is heel klein dat dit je hier iets van merkt in het dagelijkse gebruik of als je een minder geoefend oog hebt.

©Wesley Akkerman

©Wesley Akkerman

Wat je mag verwachten

Ook al draait de Poco F8 Ultra niet op de krachtigste processor die Qualcomm te bieden heeft, in de praktijk merk je daar weinig van. De Snapdragon 8 Elite Gen 5 voelt vlot aan bij multitasking en kan games zonder moeite aan, al moet je er wel rekening mee houden dat de Gen 5 warm (niet heet, gelukkig) kan worden wanneer je high-end spellen speelt. Niets om je zorgen over te maken, je zult hier namelijk je vingers niet aan branden.

Ook de accu stelt niet teleur. Met een capaciteit van 6.500 mAh haal je in veel gevallen probleemloos twee dagen, al hangt dat vanzelfsprekend af van hoe intensief je de smartphone gebruikt. Speel je veel games, dan loopt hij sneller leeg, maar opladen gaat razendsnel. Met een geschikte 100w-lader, die je zelf moet aanschaffen, zit de accu binnen ongeveer veertig minuten weer helemaal vol.

0,7x

1x

2x

Camera en software

Toch is niet alles goud wat er blinkt. Onder de juiste lichtomstandigheden maakt de Poco F8 Ultra kleurrijke en gedetailleerde beelden. Zoomen is geen probleem en ook de selfiecam lijkt goed om te gaan met verschillende huidtypen. De groothoeklens presteert echter minder goed: kleuren komen minder goed uit de verf en details vallen weg. De avondmodus stelt teleur, met een overdaad aan exposure, gebrekkige kleurenaccuraatheid en trage vastlegging.

Aangezien Poco een dochteronderneming is van Xiaomi, draait het toestel op HyperOS 3.0. De Poco staat daardoor vol met overbodige en dubbele apps, waaronder die van Xiaomi, waarvan je het gros kunt verwijderen. Ook kom je her en der wat reclame tegen. Verder is het besturingssysteem vlot en overzichtelijk, twee eigenschappen die we extreem belangrijk vinden. Je krijgt tot slot 'maar' vier Android-upgrades, evenals zes jaar aan beveiligingsupdates.

5x

10x

Poco F8 Ultra kopen?

Ondanks de kanttekeningen die we plaatsen bij de software- en camera-ervaringen, zijn er eigenlijk weinig redenen om niet voor de Poco F8 Ultra te kiezen. Hij oogt uniek, vindt in de subwoofer een handige toevoeging en voelt stevig aan. De door ons geteste Denim Blue-uitvoering heeft bovendien een faux denimlaagje op de achterkant voor extra grip (wat deze uitvoering wel een paar gram zwaarder maakt dan de Poco F8 Ultra Black). De prijs is misschien gevoelsmatig nog wat hoog, zeker voor dit merk. Maar zakt de prijs richting de 600 euro, dan krijg je een toptoestel dat zijn prijs meer dan waarmaakt en waar je langdurig plezier van hebt.

52137934

▼ Volgende artikel
Spatial audio: de zin en onzin van 3D-geluid
© ER | ID.nl
Huis

Spatial audio: de zin en onzin van 3D-geluid

Spatial audio, oftewel ruimtelijke audio, belooft een luisterervaring waarbij het geluid niet alleen van links en rechts komt, maar je volledig omringt. Hoewel de marketingkreten je geregeld om de oren vliegen, is de techniek niet in elke situatie even zinvol. In dit artikel ontdek je wanneer ruimtelijke audio je ervaring verrijkt en wanneer je prima zonder kunt.

Vergeet het statische geluid van je oude vertrouwde stereo-set. Met spatial audio krijgt geluid eindelijk de diepte die het verdient. Dankzij slimme algoritmes die de akoestiek van de echte wereld nabootsen, ontsnapt de audio aan je koptelefoon of soundbar. Geluid beweegt vrij door de kamer, waardoor een helikopter in een film ook echt boven je hoofd lijkt te cirkelen. Het is de overstap van een platte foto naar een hologram, maar dan voor je oren.

Bioscoopervaring thuis

De meest logische toepassing voor spatial audio is zonder twijfel de moderne filmervaring. Wanneer je een blockbuster kijkt die is gemixt in formaten zoals Dolby Atmos, komt de techniek pas echt tot leven. Een helikopter die overvliegt of regen die op een dak klatert, krijgt een verticale dimensie die voorheen onmogelijk was met een standaard hoofdtelefoon of een simpele soundbar.

Voor filmliefhebbers die niet de ruimte hebben voor een volledige surround-installatie met fysieke speakers in het plafond, biedt spatial audio een overtuigend en compact alternatief dat de zogenaamde immersie aanzienlijk vergroot.

Spatial audio in de praktijk

Je komt ruimtelijke audiotechnieken op steeds meer plekken tegen, vaak zonder dat je er specifiek naar hoeft te zoeken. In de filmwereld is Dolby Atmos de absolute standaard, waarbij streamingdiensten zoals Netflix en Disney+ deze techniek inzetten om geluidseffecten via een soundbar dwars door je kamer te laten bewegen.

Muziekliefhebbers vinden soortgelijke ervaringen bij Apple Music en Tidal, waar speciale mixes van bekende albums een breder en dieper geluidsveld bieden dan de originele stereoversie. Ook in de gamingwereld is het inmiddels de norm; Sony gebruikt de Tempest 3D-technologie voor de PlayStation 5 om spelers midden in de actie te plaatsen, terwijl Microsoft met Windows Sonic en Dolby Atmos for Headphones vergelijkbare resultaten behaalt op de Xbox en pc.

©ER | ID.nl

Muziek met een extraatje

Voor muziek is het nut van ruimtelijke audio iets genuanceerder en sterk afhankelijk van de productie. Bij klassieke concerten of live-opnames kan de techniek je het gevoel geven dat je midden in de concertzaal zit, waarbij de akoestiek van de ruimte tastbaar wordt. Ook bij moderne popmuziek die specifiek voor dit formaat is geproduceerd, kunnen artiesten creatiever omgaan met de plaatsing van instrumenten of subtiele geluidseffecten.

Toch blijft voor de purist die zweert bij een eerlijke, ongefilterde weergave van een studio-album de traditionele stereomix vaak de voorkeur genieten, omdat spatial audio de oorspronkelijke balans soms onnatuurlijk kan veranderen.

Gaming en de functionele voorsprong

In de wereld van gaming verschuift de waarde van spatial audio van puur esthetisch naar functioneel. Vooral in competitieve shooters is het horen van de exacte positie van een tegenstander een serieus dingetje. Door gebruik te maken van ruimtelijke audio kun je voetstappen boven, onder of achter je nauwkeurig lokaliseren. Dat geeft niet alleen een intensere spelervaring waarbij je volledig wordt opgeslokt door de spelwereld, maar biedt ook een tactisch voordeel dat met standaard audio simpelweg niet te evenaren is. Hierdoor is de techniek voor fanatieke gamers bijna onmisbaar geworden.

Wanneer kun je het beter uitschakelen?

Ondanks de indrukwekkende demonstraties is spatial audio niet altijd de beste keuze. Voor dagelijks gebruik, zoals het luisteren naar podcasts of het kijken van het journaal, voegt de extra ruimtelijkheid weinig toe en kan het de verstaanbaarheid van stemmen zelfs negatief beïnvloeden. Ook bij oudere opnames die door softwarematige kunstgrepen naar ruimtelijk geluid worden omgezet, ontstaat er vaak een hol en onnatuurlijk resultaat. In dergelijke gevallen is een zuivere stereoweergave nog altijd de meest betrouwbare weg naar een prettige luisterervaring.

Populaire merken voor spatial audio

Verschillende fabrikanten lopen voorop in de adoptie van ruimtelijke audiotechnieken. Apple heeft met de integratie in de AirPods Max en AirPods Pro in combinatie Apple Music de techniek toegankelijk gemaakt voor de massa, terwijl Sony met hun 360 Reality Audio een sterk eigen ecosysteem heeft gebouwd dat vooral schittert bij gaming en specifieke streamingdiensten. Daarnaast is Sonos een dominante speler op het gebied van home-entertainment met soundbars die Dolby Atmos ondersteunen. Bose en Sennheiser zijn eveneens belangrijke namen die met hun geavanceerde algoritmes en hoogwaardige hardware zorgen dat de ruimtelijke beleving ook voor de veeleisende luisteraar geloofwaardig blijft.