ID.nl logo
 Kunstmatige intelligentie (AI) in beeld: Stable Diffusion
Huis

Kunstmatige intelligentie (AI) in beeld: Stable Diffusion

De afgelopen maanden veroverde een nieuw stukje kunstmatige intelligentie (oftewel Artificial Intelligence, of AI) de wereld. De naam: Stable Diffusion. Wat is het, wat kan het en hoe kun je met deze grafische AI aan de slag?

Stable Diffusion is in een rap tempo uitgegroeid tot een van de populairste stukjes kunstmatige intelligentie. In dit artikel praat ID.nl jou bij. We behandelen onder andere het volgende:

  • De toegevoegde waarde 
  • Google Colab
  • Parameters
  • Wil jij meer leren over AI? Lees dan: AI genereert video's

Waar de kunstmatige intelligentie (AI) achter Dall-E 2 geheim is, werd enkele maanden geleden een opensource-alternatief gepubliceerd waarmee iedereen – zelfs op vrij bescheiden eigen hardware – afbeeldingen kan maken op basis van een Engelse beschrijving (prompt genaamd). 

Het moois heet Stable Diffusion (of kortweg SD) en de publicatie ervan zorgde voor veel discussie, want sommigen vonden dat je zo’n krachtig stuk gereedschap niet zomaar aan iedereen beschikbaar kunt stellen vanwege mogelijk misbruik. Ondertussen beleven echter miljoenen mensen plezier aan SD en worden er allerlei prachtige nieuwe programma’s omheen gebouwd terwijl dat beoogde misbruik minimaal lijkt. 

In dit artikel bekijken we de verschillende manieren om online of op je eigen pc met SD aan de slag te gaan. 

 Lees ook: Google, Microsoft en ChatGPT: de AI-strijd barst los

Instapmodel 

Omdat SD opensource is, wemelt het ondertussen van de aanbieders. Bij sommige partijen betaal je iets voor het gebruik van hun hardware, maar er zijn online ook gratis mogelijkheden, zoals het absolute instapmodel dat luistert naar de naam VoiceArt en dat iedereen met een smartphone gratis kan gebruiken (iOS, Android ). 

De naam verwijst naar het feit dat je je prompts zelfs kunt inspreken. Intypen kan echter ook en wanneer we A cute kitten invoeren, verschijnt al snel een afbeelding van een jong katje. Ben je niet tevreden over het resultaat, dan tik je simpelweg op het pictogram rechtsboven waarna SD een nieuwe afbeelding genereert. Ben je wel tevreden dan kun je het plaatje onder andere opslaan, mailen en delen via Instagram of Whatsapp.  

Maar hoe kan SD eigenlijk steeds een ander plaatje maken uit één opdracht? 

De eenvoudigste manier om SD te gebruiken is via VoiceArt. 

Toegevoegde waarde 

Een zeer interessant alternatief voor VoiceArt is Wombo Dream. Deze kun je online gebruiken (dream.ai) of via een iOS- of Android-App. Dream draait al langer mee en maakt daarom naast SD gebruik van allerlei oudere AI. Voordat je in Dream een plaatje maakt moet je een visuele stijl kiezen. Kies je voor Realistic dan gebruik je SD in pure vorm. Andere stijlen voegen (onbekende) trefwoorden toe aan je prompt om het uiterlijk te beïnvloeden. Sommige stijlen gebruiken SD en anderen een oudere (en zeer veel tragere) AI. Je merkt dus snel genoeg met welke je te maken hebt.  

Een test 

Als voorbeeld maken we een plaatje met de meer uitgewerkte prompt a painting of a city street at night, a detailed matte painting by Evgeny Lushpin, featured on cg society, american scene painting, matte drawing, matte painting, concept art met stijl Realistic. Zoals je ziet verschijnt het resultaat razendsnel. 

In de app zie je bij sommige stijlen het woord Premium. Deze zijn alleen beschikbaar voor betalende gebruikers (€ 5,49 per maand of eenmalig € 119,99). Betalende gebruikers hebben als bijkomend voordeel dat Dream per prompt vier afbeeldingen genereert en je prompt-geschiedenis onthoudt. Bovendien kunnen ze Dream gebruiken op het Discord-platform. Een nadeel van Dream is dat je geen controle hebt over instellingen en dat uitvoer altijd in portret-formaat is, wat bij SD lang niet altijd ideaal is. Op dit moment rollen de makers van Dream ook DreamBooth uit, een techniek om eigen beeld aan SD toe te voegen. 

Wombo Dream biedt allerlei voorgebakken stijlen. 

Het resultaat valt niet tegen maar het beeldformaat is niet ideaal. 

Van de makers 

Om fondsen te werven voor meer gratis AI biedt het bedrijf achter SD ook een mogelijkheid om de AI online te gebruiken genaamd Dream Studio. In tegenstelling tot de vorige aanbieders heb je hier toegang tot allerlei parameters waarmee je het resultaat kunt beïnvloeden en waar we later op terug komen. Ook kun je gebruik maken van een bestaande afbeelding als startpunt en van inpainting; het veranderen van een deel van een plaatje door middel van een prompt. Na het maken van een account krijg je een aantal gratis credits om het systeem te leren kennen en daarna kun je voor $10 duizend credits kopen, genoeg voor evenveel plaatjes in standaardformaat. 

We testen Dream Studio met een prompt voor een meer abstract werkje: abstract transcendental bubbles, by ernie barnes, michael hutter, don maitz, tim white and craola

In Dream Studio heb je toegang tot allerlei parameters voor meer controle over het resultaat. 

Volop keus 

De laatste gebruiksvriendelijke online aanbieder van SD die we willen noemen is Nightcafe. Ook Nightcafe stelt je in staat om allerlei parameters van SD in te stellen. Bovendien heb je – net als bij Wombo - de beschikking over zogeheten presets waarmee je makkelijk bepaalde visuele stijlen kunt creëren. 

Heb je een gratis account gemaakt bij deze dienst dan heb je als grote voordeel dat je er ook gebruik kunt maken van Dall-e 2 en van oudere modellen zoals VQGAN+CLIP. Zo’n ouder model levert niet het realisme van SD maar kan creatief gezien wel interessant zijn. Bijkomend voordeel van Nightcafe is dat je credits kunt krijgen voor gepubliceerde plaatjes en er daarnaast sowieso dagelijks 5 krijgt. Wil je meer credits gebruiken dan je gratis kunt verdienen dan kun je ofwel een abonnement afsluiten vanaf $9,99 per maand voor 100 credits of credit packs kopen. Dream Studio is aanzienlijk goedkoper maar geeft alleen toegang tot SD. 

Nightcafe is wat duurder maar biedt verschillende AI en geeft dagelijks gratis credits. 

Colab 

Hebben de voorbeelden van de verschillende online aanbieders je belangstelling gewekt maar wil je meer en gratis dan kan dat online via Google Colab. Dankzij het Open Source-karakter van SD wemelt het inmiddels van de afstammelingen en varianten zodat het lastig is om te kiezen welke je het best kunt gebruiken. Een goede is Deforum waarmee je naast plaatjes ook animaties kunt maken (wat wij hier overigens niet zullen doen). 

Er zijn twee vereisten. Je moet een Google-account hebben (en dus een Google Drive) en je moet een account hebben bij Hugging Face. Heb je die niet dan kun je rechtsboven op deze site kiezen voor Sign Up

Nu kun je op huggingface.co/CompVis/stable-diffusion-v-1-4-original het getrainde model van SD downloaden. Log daarvoor zo nodig in en accepteer de voorwaarden. Hierna kun je het bestand sd-v1-4.ckpt (circa 4 GB) downloaden. Ga vervolgens naar je Google Drive en maak daar een map AI en daaronder een map models en een map output. Upload het cktp-bestand naar de map models

Colab gebruiken 1 

Ga nu naar colab.research.google.com/github/deforum/stable-diffusion/blob/main/Deforum_Stable_Diffusion.ipynb.  

Een Colab werkblad bestaat uit verschillende cellen die elk een afspeelknop hebben. Klik op de bovenste (bij NVIDIA GPU). Bij het eerste gebruik moet je toestemming geven om het werkblad uit te voeren. Als de cel is uitgevoerd krijgt deze een groen vinkje. Je ziet nu het type GPU dat je in de gratis versie van Colab toegewezen hebt gekregen, vaak een Tesla T4. Die is krachtig genoeg om SD te gebruiken. Vervang in de tweede cel op de eerste twee regels /content door /AI en voer de cel uit. Zoals je ziet worden de namen van de mappen daaronder automatisch aangepast. Voer nu de derde cel uit (Setup Environment) en als deze klaar is cel 4 (Python Definitions).  

Een Colab script lijkt lastig maar is voornamelijk een kwestie van op afspeelknoppen klikken. 

Colab gebruiken 2 

Heeft cel 4 ook een groen vinkje dan voer je cel 5 uit (Select and Load). Dat duurt eenmalig enkele minuten omdat je model van SD wordt gecontroleerd en er het een ander moet worden geïnstalleerd op het Colab-systeem (dus niet op je eigen pc!). 

Zoals gezegd ondersteunt Deforum animatie en de instellingen daarvoor vind je in cel 6. Meer informatie hierover vind je op dreamingcomputers.com/deforum-stable-diffusion/deforum-stable-diffusion-settings/. Wij voeren cel 6 uit zoals hij is. Let op: de volgende cel (Prompts) heeft nummer 9. Voer ook deze uit. Voer tot slot cel 10 (Run) uit en scroll naar beneden. Je ziet nu achter elkaar twee afbeeldingen verschijnen die corresponderen met de twee rode prompts in cel 9. 

Wil je nieuwe plaatjes maken dan vervang je de rode prompts simpelweg door andere (meer dan twee kan ook) en voer je de cellen 9 en 10 opnieuw uit. Ga je naar je Google Drive dan vind je in de map AI/StableDiffusion mappen met gegenereerde plaatjes. Mocht je instellingen willen bewaren voor een volgend gebruik dan kun je een Colab-werkblad ook kopiëren naar je Google Drive (knop bovenaan werkblad) en hem vervolgens vanaf daar starten.  

De gemaakte plaatjes verschijnen onderaan het script… 

…en op je Google Drive. 

SD Lokaal 

Verreweg de meest veelzijdige manier om SD te gebruiken is op je eigen pc via Stable Diffusion WebUI. Deze werkt al op grafische chips van nVidia met 4 GB geheugen (maar ook op GPU’s van AMD al heeft dat niet de voorkeur). Om WebUI te kunnen gebruiken moeten we enkele voorbereidingen treffen.  

Allereerst downloaden we de Python-versie die wordt genoemd op github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Dependencies. Op moment van schrijven is dat de 64-bit Windows-installer 3.10.6. Start deze, zet een vinkje bij Add Python to PATH en rond de installatie af. De tweede vereiste component is de 64-bit installer van Git die je vindt op git-scm.com/download/win

Open na installatie daarvan een Opdrachtprompt door cmd in het zoekvak van Windows te typen. Vervolgens ga je naar de root van de schijf waar je WebUI wilt installeren (met bijvoorbeeld cd c:\ of cd d:\). Hier geef je het commando git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git dat je desgewenst kunt kopiëren en plakken vanaf de WebUI-site. 

Model installeren 

Er is nu een nieuwe map aangemaakt met de naam Stable-Diffusion-WebUI. Daaronder vind je een map models\Stable-diffusion. We moeten nu de AI downloaden en installeren. Dat kan met de methode die we hierboven beschreven bij Colab voorbereiden, maar op github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Dependencies vind je nog een alternatieve link die geen account bij Hugging Face vereist en een torrent-link. 

Heb je op één van deze manieren sd-v1-4.ckpt gedownload dan kopieer je deze vervolgens naar bovengenoemde map. Optioneel kun je ook nog GFPGAN v1.4 downloaden en deze kopiëren naar de map Stable-Diffusion-WebUI. GFPGAN is een aanvullende AI die gezichten kan verbeteren die SD heeft gemaakt. 

We zijn er bijna. Ga in Verkenner naar Stable-Diffusion-WebUI en dubbelklik op webui-user.bat. Dit bat-bestand zal de rest van de benodigde componenten automatisch downloaden en installeren. De eerste keer duurt dat even. Aan het eind zie je in het cmd-venster een lokaal web-adres http://127.0.0.1:7860/. Kopieer dit, open je browser en plak het in de adresbalk. En daar is je werkende WebUI, waar we bovenin een prompt kunnen invullen die met een klik op Generate tot plaatje wordt omgetoverd. 

Webui-user.bat stelt automatisch alles voor je in. 

Onze eerste creatie in SD op onze eigen WebUI. 

Parameters 1 

Bij VoiceArt en Dream kun je niets zelf aanpassen maar bij Dream Studio, Nightcafe, Colab en WebUI heb je (vrijwel) dezelfde parameters waarmee je afbeeldingen kunt beïnvloeden. We behandelen er enkele aan de hand van WebUI. Onder het promptvak biedt WebUI de optie om ‘negatieve prompts’ op te geven; dingen die je juist niet wilt zien. Dit kan helpen om tekst of lijstjes te vermijden die soms je resultaat ontsieren. 

Sampling Steps bepaalt hoe snel het plaatje wordt gegenereerd. Er is een verband tussen deze parameter en CFG Scale die je wat lager ziet. De standaardwaarden van 7 en 20 werken vaak goed. Een groter aantal Sampling Steps maakt het resultaat niet per se beter maar meestal wel anders. CFG Scale bepaalt hoe strikt SD zich aan de prompt moet houden. Hogere waarden vergen vaak ook wat meer Sampling Steps, bijvoorbeeld 12 en 40 is ook een goede combinatie. 

Spelend met CFG Scale en Sampling Steps kun je resultaten beïnvloeden, zoals hier 7 en 20… 

…of 12 en 40. 

Parameters 2 

Telkens wanneer je op Generate klikt krijg je met dezelfde prompt een ander plaatje omdat het startgetal (seed) willekeurig wordt gekozen. Vul je bij Seed een vast getal in, bijvoorbeeld 100, dan kun je toch nog meer verschillende plaatjes krijgen door een andere Sampling Method te selecteren. Deze bepaalt de manier waarop SD vanaf de oorspronkelijk ruis tot zijn resultaat komt. 

Alhoewel je bij exact dezelfde instellingen ook exact het zelfde plaatje krijgt, zal dit zelfs al afwijken wanneer je de waarden van Width en Height aanpast. Wanneer je aan een prompt wilt gaan sleutelen is het dan ook raadzaam om meteen te beginnen in de gewenste resolutie. 

Met 512x512 zul je altijd het beste resultaat bereiken maar zeker landschapsformaat (bijvoorbeeld 768x512) werkt meestal ook uitstekend. Bij portretformaat (zoals 512x768) moet je vaak wat meer experimenteren met parameters om een overtuigend resultaat te krijgen. Heb je GFPGAN geïnstalleerd dan kun je deze bij Settings/Face restoration activeren. Zet je vervolgens een vinkje bij Restore Faces op het tabblad Txt2Img dan kan deze menselijke portretten voor je verbeteren. Alle afbeeldingen die je maakt worden automatisch opgeslagen in een map outputs onder de programmamap. 

Twee hoofden zijn niet ongebruikelijk in portretmodus. Spelen met parameters kan helpen. 

Afsluiten 

Om WebUI te sluiten ga je naar het venster met de Opdrachtprompt en daar toets je Ctrl-C en antwoord je Y op de gestelde vraag. Vervolgens kun je de Opdrachtprompt en het browservenster sluiten. 

Wil je WebUI later weer gebruiken dan start je opnieuw webui-user.bat en open je in de browser weer http://127.0.0.1:7860/. De vele extra mogelijkheden die WebUI biedt (zoals inpainting, het gebruik van DreamBooth om jezelf aan de AI toe te voegen en meer) moeten we voor nu helaas onbesproken laten maar hopelijk heb je de smaak voldoende te pakken om zelf verder te experimenteren. 

▼ Volgende artikel
AI-agents: zo laat je slimme digitale assistenten zelfstandig taken uitvoeren
© Anwar - stock.adobe.com
Huis

AI-agents: zo laat je slimme digitale assistenten zelfstandig taken uitvoeren

We vinden het intussen al bijna normaal dat generatieve AI-modellen leuke tekeningen kunnen maken en teksten kunnen schrijven. Maar de AI-evolutie staat niet stil: er verschijnen steeds krachtigere AI-agents op die zelfstandig ook diverse taken kunnen aanpakken. Hoe je ze zelf gebruikt of bouwt, lees je in dit artikel.

In het kort

We leggen uit wat AI-agents precies zijn, hoe ze werken en waarin ze verschillen van gewone AI-assistenten. Je ziet voorbeelden van praktische agents die reizen plannen, data analyseren of documenten samenvatten. We bekijken toegankelijke platforms zoals Manus en AgentGPT, maar ook verzamelingen van kant-en-klare agents en tools om zelf een agent te bouwen. Tot slot krijg je inzicht in de voordelen, valkuilen en toekomstige ontwikkelingen van deze technologie.

Lees ook: Chat je met een mens of een AI-bot? 9 manieren om het te testen

Het begrip 'AI-agent' komt misschien wat verwarrend over omdat 'agent' vaak met ordehandhaving of spionage wordt geassocieerd, maar hier betekent het iets heel anders. In de informatica verwijst de term naar een entiteit die namens iemand anders handelt, afgeleid van het Latijnse agere (handelen). Je kunt het vergelijken met een reisagent die taken uitvoert in opdracht van zijn klant.

Een agent is hier een systeem dat autonoom handelt, vaak in opdracht van een gebruiker, om bepaalde en soms complexe taken uit te voeren. Zo zou je een robotstofzuiger een fysieke agent kunnen noemen: hij ziet obstakels, beslist waar hij rijdt en voert deze actie uit. Een e-mailbot is een virtuele agent: hij leest je mails, classificeert ze en beantwoordt bepaalde mails automatisch.

Een AI-agent gaat nog een stap verder en gebruikt kunstmatige intelligentie om beslissingen te nemen – iets wat sommige robotstofzuigers of e-mailbots inmiddels trouwens ook wel doen. Hiervoor gebruikt men ook wel de term 'agentic AI'.

©iRobot

Een robotstofzuiger kun je een fysieke agent noemen.

Werking

Voordat we een paar voorbeelden van een AI-agent bekijken en ook zelf samenstellen, leggen we kort uit hoe zo'n agent werkt. In een eerste fase neemt de agent zijn omgeving waar. Dat kan via visuele input van afbeeldingen of camera's, geluidsdata van een microfoon of spraakopname, numerieke data uit logs of sensors, of via tekst zoals prompts, mail- of chatberichten.

De agent probeert vervolgens deze ruwe invoer te interpreteren. Bij tekst bijvoorbeeld gebeurt dit doorgaans met een groot taalmodel (Large Language Model, kortweg LLM), een deep-learning-systeem dat natuurlijke taal begrijpt en genereert, zoals ChatGPT, Claude of Gemini. Dankzij zo'n LLM kan de agent doelen begrijpen en indien nodig ook opsplitsen in subtaken. Als een taak beperkt blijft tot tekstgeneratie, zoals het beantwoorden van een bericht, volstaat het LLM. Maar vaak zijn er ook externe tools nodig (zogeheten tool calling) om aanvullende of realtime gegevens op te halen of (sub)taken uit te voeren, bijvoorbeeld via API's, zoals voor weerinformatie, databases of andere AI-modellen.

Met een efficiënt geheugensysteem kan de agent tijdens het uitvoeren van taken de resultaten bijhouden, feedback verwerken en daaruit nieuwe subtaken afleiden. Hij kan deze informatie ook bewaren, wat ook bij latere interacties voor meer consistentie zorgt.

Voor- en nadelen

Geoptimaliseerde AI-agents bieden duidelijke voordelen. Ze verhogen vaak de productiviteit doordat ze repetitieve en tijdrovende taken kunnen overnemen. Daarnaast verwerken ze in korte tijd enorme hoeveelheden data en kunnen ze meerdere (sub)taken tegelijk uitvoeren. AI-agents leveren doorgaans nauwkeurige en consistente resultaten en zijn goed schaalbaar. Mits goed geïntegreerd in de workflow, kunnen ze dus flink wat tijd en kosten besparen.

Tegelijk zijn er wel wat dingen waar je op moet letten. AI-agents zijn namelijk vaak afhankelijk van grote hoeveelheden data, waaronder soms privacygevoelige of bedrijfsinformatie. Houd bijvoorbeeld in een bedrijfscontext dus rekening met richtlijnen als de AVG (Algemene Verordening Gegevensbescherming). En omdat veel agents werken met LLM's die getraind zijn op grote hoeveelheden tekst waarin ook vooroordelen en stereotypen voorkomen, kunnen zulke vertekeningen onbewust doorsijpelen in de resultaten en leiden tot discriminerende uitkomsten. Tot slot vraagt het ontwikkelen en trainen van zulke (bedrijfs)systemen de nodige tijd en rekenkracht.

Voor je het goed beseft, kunnen AI-agents ook privacygevoelige data verwerken en is de AVG van kracht.

Van assistent tot agent

Agentic AI is momenteel een actueel onderwerp, waardoor producenten hun AI-oplossingen soms als AI-agents presenteren, terwijl het om eenvoudige(re) AI-assistenten gaat. Dit geldt bijvoorbeeld voor de browserextensie HARPA AI. Na installatie kun je via een knop taken laten uitvoeren op basis van de actuele webpagina en eventueel geüploade afbeeldingen of pdf's. Denk aan uitleg geven, vragen beantwoorden, de pagina samenvatten of herschrijven, data uitlichten en meer.

Handig, maar het is geen autonome agent. HARPA AI voert namelijk alleen taken uit die jij expliciet opgeeft, zonder zelf subdoelen te stellen of complexe workflows te volgen. Er is evenmin sprake van zelfevaluatie of contextopbouw over meerdere stappen. HARPA AI biedt ook een browser-functie (bijvoorbeeld via de opdrachtprompt met een API-sleutel) die enige automatisering en externe aansturing mogelijk maakt, maar dat maakt het nog geen volwaardige AI-agent.

Het onderscheid tussen beide begrippen is evenwel niet altijd duidelijk, vooral niet wanneer de operaties voornamelijk in een 'black box' worden uitgevoerd.

Manus

AI-agents kunnen dus goed bruikbaar zijn in bedrijfsomgevingen, maar ook daarbuiten kun je er je voordeel mee doen. Ga bijvoorbeeld naar www.manus.im (van Chinese origine) en klik op Use cases voor een reeks praktijkvoorbeelden, ingedeeld in rubrieken als Life, Data Analysis en Education. Zo kan deze algemene AI-agent je bijvoorbeeld helpen bij het opstellen van een cursus of het plannen van een reis. Het voorbeeld Trip to Japan in april (in de rubriek Featured) laat dit duidelijk zien. Klik hierop om het volledige proces te kunnen volgen: links de uitvoer, rechts het scherm van de agent. Je kunt ook altijd klikken op Skip to results of Watch again.

Wil je Manus ook zelf proberen, dan kun je met een gratis proefversie met duizend credits aan de slag, na goedkeuring van je aanvraag (de betaalde versie start vanaf 19 dollar per maand, dat is ongeveer 20 euro inclusief btw). We merkten dat zo'n goedkeuring sneller verloopt via de mobiele Manus-app.

Voor de eindgebruiker is het hele proces vrij eenvoudig. Zoals bij een gewone AI-chatbot geef je eerst een uitgebreide prompt met je opdracht. Daarna gaat Manus aan de slag en zie je stap voor stap hoe de taak wordt aangepakt. Je kunt dit proces ook in realtime bijsturen met extra informatie of instructies. Is de hoofdtaak voltooid, dan krijg je een melding, tenzij je credits eerder op zijn of de agent vastloopt op bijvoorbeeld een niet-bereikbare webpagina.

Op onze vraag heeft Manus een veertiendaagse gezinsreis naar Namibië uitgewerkt.

AI-reis naar tevredenheid uitgewerkt?

🧳Dan hoef je zelf alleen nog maar je koffers te pakken!

AgentGPT

Ook met AgentGPT kun je op een toegankelijke manier toe, ook gratis, een AI-agent in je browser gebruiken. Het platform is een gebruiksvriendelijke webinterface (geïnspireerd op Auto-GPT), waarmee je een opdracht kunt lanceren voor een autonome agent die meerdere stappen zelf bedenkt en uitvoert.

Je hoeft enkel een naam voor je agent in te vullen en bij Doel een duidelijke opdracht te schrijven, zoals 'Plan een veertiendaagse rondreis met 4x4 in Namibië' of 'Voer een onderzoek uit naar de duurzaamste bouwmaterialen in Nederland'.

Controleer bij Tools of de benodigde functies zijn ingeschakeld: Image (voor AI-beelden), Search (voor online opzoekwerk), Code (voor scripting) en Connect Your Data. Deze laatste biedt via een account bij SID, een vorm van Retrieval Augmented Generation (RAG), waarbij eigen gegevens van bijvoorbeeld Google Drive of Gmail kunnen worden verwerkt en doorzocht.

Bevestig met de blauwe afspeelknop en de agent gaat meteen aan de slag. Je kunt de deeltaken volgen, pauzeren en via een prompt het proces bijsturen. De kans bestaat dat de agent niet alle stappen voltooit met een gratis account, maar via Summarize kun je wel alvast een tussentijds resultaat bekijken. Voor een uitgebreider abonnement betaal je 40 dollar per maand (ongeveer 43 euro inclusief btw). Bij Settings kun je eventueel ook een OpenAI API-sleutel invoeren als je er een hebt.

AgentGPT kan ook eigen data onderzoeken (hier Google Drive documenten via sid.ai)

Agent-bibliotheken

Op de webpagina van het hierboven vermelde AgentGPT kun je ook uit twintig sjablonen kiezen. Dit zijn kant-en-klare agenten, met prompts gericht op een bepaald taaktype, zoals rapportanalyse, reisplanning of marketing strategieën. Maar er bestaan intussen ook diensten met een bibliotheek AI-agents, zoals Agent.AI. Je kunt zoeken op naam of op tags, binnen categorieën zoals Social, Customer Service, Image en Lifestyle. Filter je op Image, dan krijg je agents zoals Logo Creator, Youtube Thumbnail Generator en MindmapGenerator.

We nemen even Mindmap Generator als voorbeeld. Klik hier op Goagent en geef een geschikte prompt, bijvoorbeeld een onderwerp voor je mindmap. Bevestig met Go en de agent gaat aan de slag. Daarna kies je tussen Fully automatic (waarbij je alles aan de agent overlaat) of Interactive (waarbij je stap voor stap het voorlopige ontwerp kunt aanpassen of uitbreiden).

Ook bij MindStudio vind je een ruime collectie AI-agents, verdeeld in rubrieken zoals Research, Analyze Content, For Creators, For Students en YouTube. Na aanmelding kun je ze vanaf het platform uitvoeren via de knop Run (Pro Agents enkel na betaling) of via een Chromium-browserextensie, zodat de agent direct met een specifieke webpagina kan werken.

Houd er rekening mee dat het onderscheid tussen een slimme AI-assistent en een autonome AI-agent ook hier niet altijd duidelijk is.

Op Agent.AI vind je veel agents (of minstens assistenten), waaronder deze eenvoudige mindmap-generator.

Agentic AI-browsers

We hebben geen glazen bol, maar we zijn ervan overtuigd dat agentic AI zich dit jaar sterk zal doorzetten. De vraag naar autonomere AI-systemen groeit, de technologische basis met modellen als GPT-4.x en Claude 4.x is al aanwezig en de tool-calling-functionaliteit breidt snel uit.

Die evolutie zal zich vermoedelijk ook voortzetten binnen browsers, zoals blijkt uit Opera Browser Operator. Deze AI-agent is netjes geïntegreerd in de Opera-browser en maakt het mogelijk om bijvoorbeeld producten te bestellen, een reis te plannen, tickets te boeken of studiemateriaal te verzamelen zonder dat je zelf iets hoeft te doen (wat overigens wel mogelijk blijft). Op het moment van schrijven is deze functie helaas nog een preview, maar mogelijk zit die functie al in Opera's ontwikkelaarseditie tegen de tijd dat je dit leest.

Een andere vroege ontwikkeling is Anchor Browser, voorlopig alleen beschikbaar als cloud-hosted platform. Na aanmelding krijg je toegang tot een interactieve omgeving waar je AI-gestuurde browserflows kunt opstellen en testen. Bovenaan kies je eerst een taakstructuur, zoals AI Form Filling of Web Research.

Zelf bouwen met MindStudio

Zowel Agent.AI als MindStudio laten je niet alleen bestaande agents gebruiken, maar bieden ook tools om zelf een AI-agent te bouwen. We laten kort zien hoe je dit aanpakt in MindStudio, bijvoorbeeld voor een agent die een webpagina, pdf of YouTube-video samenvat (bij deze laatste door zelf het bijbehorende transcript op te halen).

Ga naar https://app.mindstudio.ai en open links het onderdeel Build. Klik rechtsboven op Create New Agent en zorg dat het tabblad Automations actief is. Klik op het blauwe Start-blok; rechts verschijnen dan enkele configuratie-opties. Wil je de agent beschikbaar maken in de browserextensie van Agent.AI, klik dan bij Run Mode op het pijlknopje en kies Browser Extension. Er verschijnen nu data zoals url, metadata en pageContent, die beschikbaar komen voor de agent.

Klik rechts van het Start-blok op de knop met het plusje om een AI-module toe te voegen. Voor ons voorbeeld kies je Generate Text, een van de meest gebruikte modules. Andere opties zijn Generate Image, User Input, Scrape URL of je klikt op View All Blocks voor alle beschikbare modules. Na selectie van Generate Text zie je rechts bij ModelSettings dat standaard Claude 3.5 Haiku gebruikt wordt. Je kunt ook kiezen uit andere ondersteunde LLM's, waaronder enkele gratis modellen.

Bouw je eigen agent met AI-modules in MindStudio.

Verder uitwerken

Met de LLM geselecteerd kun je rechts nog extra instellingen aanpassen via parameters als Temperature (hoe lager, hoe voorspelbaarder het antwoord), Max Response Size (hoe lager, hoe beknopter het antwoord) en andere. Bovenaan staat het promptvenster waar je een duidelijke instructie voor de LLM geeft, bijvoorbeeld: 'Vertel me alles wat ik moet weten over deze webpagina.'

Om de inhoud van de webpagina door te geven, gebruik je de eerder vermelde variabele pageContent (je kunt deze variabele eerst kopiëren naar het klembord) die je onder je prompt met {{pageContent}} aanroept.

Klik linksboven op Untitled AI Agent en geef je agent een naam. Je kunt ook een korte omschrijving toevoegen en een pictogram kiezen. Klik vervolgens rechtsboven op Preview / Open Draft Agent. Je test je agent door een url in te vullen, op Load Site te klikken en daarna op Run Agent.

Wil je de agent publiceren (en aan de browserextensie koppelen via het knopje met de drie puntjes), dan heb je wel een Pro-versie nodig. Deze kost 12 dollar per maand (ongeveer 13 euro inclusief btw) voor onbeperkte agents, exclusief eventuele kosten voor API-calls van betaalde AI-modellen.

Je agent is klaar: nog snel even proefdraaien.

Automatische prompt

Je kunt ook een bestaande agent dupliceren en deze via Edit snel aanpassen voor een ander doel. Daarnaast is het mogelijk om de prompt automatisch te laten genereren. Klik hiervoor rechtsonder het promptvenster op het bijbehorende knopje en kies Generate. Typ bijvoorbeeld 'Vat deze webpagina uitgebreid en overzichtelijk samen' of 'Analyseer deze X-berichtreeks' en klik opnieuw op Generate. Even later verschijnt een veel uitgebreidere (standaard Engelstalige) prompt, waarbij de opdracht wordt opgesplitst in subtaken, zodat je agent gestructureerder te werk kan gaan. Vergeet ook hier niet de variabele {{pageContent}} toe te voegen.

Op vergelijkbare manier kun je nog veel andere agents maken. Experimenteer gerust met alle beschikbare opties en mogelijkheden.

Je kunt automatisch een uitgebreide prompt laten genereren voor je agent.

Grondig zoeken

Steeds meer generatieve AI-modellen bieden met wat vaak deepsearch wordt genoemd een geavanceerde zoekfunctie aan om diepgaande informatie van internet en andere bronnen op te halen en te analyseren. Daardoor kunnen ze ook meerdere redeneringsstappen uitvoeren en zo tot een nauwkeuriger en uitgebreider antwoord komen.

Zo'n functie vind je onder meer bij ChatGPT (Diepgaand onderzoeken), Gemini (Deep Research) en Grok (DeepSearch en de nog uitgebreidere DeeperSearch). Je kunt deze functies zien als een vorm van agentic AI, omdat ze autonoom complexe taken uitvoeren die normaal menselijke tussenkomst vragen. Afhankelijk van je opdracht (en andere parameters) kan het zoekwerk makkelijk tien minuten of langer duren. Met een gratis account is deze functionaliteit helaas wel beperkt bruikbaar, zeker bij ChatGPT. ChatGPT heeft overigens ook al Operator, een agent die een browser kan gebruiken, maar alleen nog beschikbaar is voor Pro-gebruikers in de VS.

▼ Volgende artikel
Waar voor je geld: 5 krachtige powerbanks voor lange reizen
© ([None] (Photographer) - [None]
Huis

Waar voor je geld: 5 krachtige powerbanks voor lange reizen

In onze rubriek Waar voor je geld helpen we je de slimste keuze te maken. Daarom gaan we een paar keer per week op zoek naar inteessante producten voor een prima prijsje. Dit keer kijken we naar powerbanks met een flinke accucapaciteit die geschikt zijn voor lange(re) reizen en meerdere apparaten tegelijk kunnen opladen.

Met een losse powerbank kun je al je mobiele apparaten op- of bijladen als je onderweg bent en geen andere usb-laders in de buurt hebt. Gelukkig komt dat steeds minder vaak voor, want bijna iedere auto, de meeste moderne treinen en vliegtuigen en ook bussne hebben vaak al een usb-aansluiting bij de stoelen zitten. Toch kan het voor sommige reizen handig zijn om extra stroom mee te kunnen nemen. Wij vonden een aantal mooie modellen voor je.

Mophie Powerstation Pro

Deze oplader beschikt over een USB-C poort die tot 45 W kan leveren via Power Delivery en twee USB-A poorten voor overige apparatuur. In totaal heb je dus vier uitgangen tot je beschikking. De interne batterij heeft een capaciteit van 20.000 mAh. Hiermee kun je niet alleen je mobiele apparaten, maar ook je laptop een aanzienlijke gebruiksduurverlenging geven. De USB-C poort functioneert zowel als in- als uitgang, waardoor je de powerbank zelf ook weer vlot kunt opladen met een geschikte adapter. Die wordt zelf niet meegeleverd, maar wel de benodigde kabel.

Capaciteit: 20.000 mAh
Max vermogen: 45 W
Aantal apparaten: 3

Sandberg All-in-1 Laptop Powerbank 24000

De Sandberg All-in-1 Laptop Powerbank 24000 is een universele energiebron voor al je mobiele apparaten, zelfs je laptop of Macbook. Met zijn krachtige 24.000 mAh accu is er genoeg stroom om een smartphone meerdere keren op te laden of meerdere extra uren werk op de laptop. De powerbank is eenvoudig op te laden in enkele uren met de meegeleverde netadapter of een USB-C-lader. Met de DC-uitgang en 12 verschillende adapters in de verpakking, evenals een USB-snellaadpoort en twee USB-C-poorten, kunnen veel en verschillende soorten apparaten worden opgeladen op maximale snelheid. Als extra functie is er zelfs een ingebouwde draadloze snellader bovenop de powerbank.

Capaciteit: 24.000 mAh
Max vermogen: 84 W
Aantal apparaten: 5

Siltcon Powerbank 30.000 mAh

Deze powerbank valt op door de mogelijkheden. Naast verschillende usb-poorten voor het opladen van je smartphone, e-reader, draadloze oortjes of tablet is deze powerbank ook geschikt voor snelladen met 22,5 Watt, waardoor je telefoon binnen een uur weer helemaal vol is.. De accucapaciteit van 30.000 mAh is ruim voldoende om apparaten maar liefst zeven keer op te laden, maar uiteraard niet allemaal tegelijk. De powerbank werkt met alle Apple- en Android-toestellen en kan tot 5 apparaten tegelijk van stroom voorzien.

Capaciteit: 30.000 mAh
Max vermogen: 22,5 W
Aantal apparaten: 4

iMoshion Powerbank 30.000 mAh 22.5W

Als een zo hoog mogelijke capaciteit voor jou de belangrijkste factor is, dan kun je dit model overwegen. Deze powerbank heeft een interne batterij van maar liefst 30.000 mAh. Dit vertaalt zich naar de mogelijkheid om je apparaten gedurende een langere periode, bijvoorbeeld tijdens een lang weekend weg, van stroom te voorzien zonder de powerbank zelf te hoeven opladen. En extra handig: hij kan ook via zonne-energie worden opgeladen. Je hebt de beschikking over vier uitgangen: één USB-C poort en drie USB-A poorten. Dit maakt het een handige keuze als je nog veel apparaten hebt die de USB-A standaard gebruiken. De poorten ondersteunen verschillende snellaadprotocollen, waaronder Power Delivery en Quick Charge, met een maximaal gecombineerd vermogen van 22.5W. Een LED-display toont de exacte batterijstatus, zodat je altijd weet hoeveel energie er nog over is.

Capaciteit: 30.000 mAh
Max vermogen: 22,5 W
Aantal apparaten: 4

BlueBuilt Powerbank 20.000 mAh 45W

Deze powerbank is ontworpen als een allround oplaadoplossing voor moderne apparaten. Met een capaciteit van 20.000 mAh heb je voldoende stroom bij de hand om je dag door te komen. Het apparaat beschikt over een gebalanceerde set van vier poorten: twee USB-C poorten en twee USB-A poorten. Dit maakt het mogelijk om een brede variëteit aan apparaten gelijktijdig aan te sluiten. Beide USB-C poorten ondersteunen Power Delivery, waarbij één poort een vermogen tot 45W kan leveren. Dit is genoeg om naast je telefoon en tablet ook een kleinere laptop, zoals een MacBook Air, op te laden. De USB-A poorten zijn voorzien van Quick Charge, voor het versneld opladen van compatibele apparaten. De powerbank is uitgerust met een pass-through functie, wat inhoudt dat je de powerbank zelf kunt opladen terwijl deze tegelijkertijd andere apparaten van stroom voorziet.

Capaciteit: 20.000 mAh
Max vermogen: 45 W
Aantal apparaten: 4