MidJourney: wat is het en hoe gebruik je het?
Er is een nieuwe speler in de wereld van kunst en technologie die de aandacht trekt en je hebt de naam vast al eens horen vallen: MidJourney. Deze revolutionaire AI-tool transformeert tekstbeschrijvingen in unieke, hoogwaardige afbeeldingen. Maar wat is MidJourney precies, wat kun je ermee en hoe gebruik je het? In dit artikel geven we antwoord op die vragen en leggen we alles uit wat je moet weten.
In dit artikel leer je wat MidJourney is en wat je er zoal mee kunt. Daarbij gaan we onder meer in op:
-
De geschiedenis van MidJourney
-
De verschillen met concurrerende platforms
-
Hoe je MidJourney gebruikt
-
Hoe je omgaat met prompts
-
Hoe je eigen afbeeldingen gebruikt
-
De verschillende parameters
-
De verschillende modellen
-
Ook lezen: Social media verandert razendsnel door AI
MidJourney is een onafhankelijk onderzoekslab dat met zijn gelijknamige AI-programma momenteel voor een heuse revolutie zorgt in de wereld van kunstmatige intelligentie. Het programma is ontworpen om afbeeldingen te creëren op basis van tekstbeschrijvingen, vergelijkbaar met OpenAI's DALL-E en Stable Diffusion.
Terwijl de onderliggende technologie vermoedelijk is gebaseerd op Stable Diffusion, hebben de makers van MidJourney hun eigen unieke stijl ontwikkeld voor de gegenereerde afbeeldingen die veel aandacht trekken van zowel AI-enthousiastelingen als kunstenaars.
Geschiedenis van MidJourney
David Holz, medeoprichter van Leap Motion, is de drijvende kracht achter MidJourney. Holz is een bekend figuur in de tech-industrie, die in 2010 Leap Motion mede-oprichtte, een bedrijf dat bewegingssensortechnologie produceert voor computers en virtual reality-headsets.
MidJourney debuteerde voor het eerst op 14 maart 2022, toen de Discord-server werd gelanceerd met een verzoek om hoogwaardige foto's op Twitter en Reddit te posten voor de training van dit nieuwe systeem. Sindsdien heeft het bedrijf onvermoeibaar doorgewerkt om zijn algoritmen te verbeteren en verschijnt er om de paar maanden wel een nieuwe versie. Versie 2 van het algoritme werd in april 2022 gelanceerd, gevolgd door versie 3 in juli van hetzelfde jaar. Op 10 november 2022 werd de alfaversie van versie 4 uitgebracht.
Met versie 5, dat verscheen op 16 maart 2023, zette MidJourney opeens reusachtige stappen ten opzichte van concurrerende platforms als DALL-E van OpenAI (dat we inmiddels ook kennen van ChatGPT) en Stable Diffusion. Dat werd nog een pijnlijk duidelijk toen op 4 mei 2023 versie 5.1 werd vrijgegeven, waarmee verrassend realistische afbeeldingen kunnen gegenereerd.
MidJourney in de kunstwereld MidJourney heeft de aandacht getrokken van kunstenaars over de hele wereld, die het gebruiken om unieke en boeiende kunstwerken te creëren. Door de mogelijkheid om gedetailleerde, artistieke afbeeldingen te genereren vanuit eenvoudige tekstprompts, biedt MidJourney een ongeëvenaarde mogelijkheid voor kunstenaars om hun creativiteit te verkennen en te uiten.
Verschillen tussen MidJourney en DALL-E 2 / Stable Diffusion
Hoewel het concept van deze beeldgeneratietools vergelijkbaar is, verschillen de resultaten die sterk van model tot model. Het is daarnaast maar net wat je het meest aanspreekt.
MidJourney vs Dall-E
Hoewel MidJourney en DALL-E 2 beide geweldige kwaliteit leveren, is er een significant verschil in de stijl van afbeeldingen die ze genereren. Afbeeldingen gegenereerd door DALL-E 2 zijn meer schilderachtig. MidJourney streeft naar een meer realistische stijl.
Al met al is MidJourney een stuk beter in het maken van gedetailleerde afbeeldingen.
MidJourney vs Stable Diffusion
MidJourney werkt makkelijker en vereist minder prompt-tinkering in vergelijking met Stable Diffusion, terwijl die laatste het voordeel heeft van opensource-ontwikkeling en dus met specifieke datasets kan worden getraind om te krijgen wat je wilt.
MidJourney heeft niettemin de bovenhand als het gaat om kwaliteit van afbeeldingen die de platforms produceren. Ook de grafische stijl van MidJourney is een stuk aantrekkelijker (al is dat een kwestie van smaak), maar het is ook een van de belangrijkste redenen voor de wereldwijde populariteit. Al de genoemde platforms bevinden zich nog in de bètafase en evolueren voortdurend, dus wie weet welke kant het nog op gaat.
Hoe gebruik je MidJourney AI?
Momenteel kan MidJourney alleen worden benaderd via de Discord-server, dus om het te gebruiken, heb je om te beginnen een Discord-account nodig. Discord is een communicatieplatform dat oorspronkelijk is ontworpen voor gamers, maar nu wordt gebruikt door allerlei soorten online community's – waaronder dus MidJourney. Het biedt spraak-, video- en tekstcommunicatie, evenals gedeelde kanalen om discussies te organiseren.
Om aan de slag te gaan met MidJourney, bezoek je eerst de website en klik je op de knop linksonder om deel te nemen aan het bètaprogramma. Helaas bestaat er geen gratis deelname meer, dus om MidJourney te gebruiken, zul je een betaald abonnement moeten afsluiten.
Daarna moet je een uitnodiging accepteren voor de MidJourney Discord-server. Open of download nu de Discord-app en klik op het bootvormige pictogram van de MidJourney-server. Je kunt elke nieuwkomerskamer met de naam 'newbie' betreden (zichtbaar in de balk links).
Om een afbeelding te maken, moet je eerst het scherm van de MidJourney Bot tevoorschijn toveren. Dat doe je door in de app linksboven op het Discord-logo te klikken. Vervolgens verschijnt er nieuwe balk met daarin je Discord-contacten. Als het goed is, staat daar nu ook de MidJourney Bot tussen. Klik daarop om een chatvenster te openen; dit is de plek waar we met beeldgeneratie aan de slag gaan!
Prompt engineering in MidJourney
Je gebruikt zogenaamde prompts (de gangbare term voor opdrachten) om de MidJourney Bot aan het werk te zetten en afbeeldingen te laten genereren. Prompts dienen trouwens in het Engels te worden ingediend; MidJourney begrijpt (nog) geen Nederlands. Je geeft een tekstbeschrijving van het beeld dat je wilt maken en stuurt daarmee de bot in zijn generatieproces. Of je nu een foto, schilderij of gewoon zomaar een doodle wilt, de prompt kan de bot helpen het exacte type afbeelding te produceren dat jij voor ogen hebt. De prompts worden gebruikt met het /imagine-commando.
Je tikt /imagine in de regel waarin je normaal gesproken een chatbericht verstuurt, gevolgd door Enter. Daarna tik je direct achter het woordje prompt een Engelstalige opdracht (de prompt dus), bijvoorbeeld: photo of a man on a horse (foto van een man op een paard).
Basisprompts zijn zo eenvoudig als een enkel woord, zin of zelfs een emoji. De bot hecht geen waarde aan grammatica of zinsstructuur, maar woordkeuze is enorm belangrijk. Meer specifieke synoniemen werken beter dan generieke, en minder woorden betekent dat elk woord een krachtiger invloed heeft.
Om ervoor te zorgen dat de bot specifieke details genereert, voeg je extra elementen toe. Je schildert als het ware met woorden. Denk aan het onderwerp, het medium, de omgeving, de verlichting, kleur, stemming en compositie. Alles wat ongezegd blijft, wordt gerandomiseerd en geeft MidJourney vrij spel – en de uitkomsten kunnen echt bizar zijn.
Geavanceerde prompts voor MidJourney
Geavanceerde prompts kunnen één of meer afbeeldings-url's, meerdere tekstzinnen en een of meer parameters (zie volgende paragraaf) bevatten. Afbeeldings-url's (links naar foto's die je als voorbeeld wilt gebruiken) kunnen aan een prompt worden toegevoegd om de stijl en inhoud van het eindresultaat te beïnvloeden, en parameters kunnen de manier waarop een afbeelding wordt gegenereerd veranderen, zoals beeldverhoudingen, negatieve prompts, modellen, upscalers en meer.
Bij het uitschrijven van een prompt moet je vooral focussen op wat je in beeld wilt hebben, in plaats van wat je niet wilt zien. Als je een afbeelding genereert van bijvoorbeeld een boerderij, maar je wilt dat er geen koeien te zien zijn, gebruik dan niet 'no cows' in de prompt zelf, maar gebruik geavanceerde prompting met de '--no'-parameter om 'no cows' als negatieve prompt in te zetten. Voorbeeld: image of a farm with animals --no cows.
ChatGPT als prompt engineer Mocht je het zelf lastig vinden om prompts (in het Engels) te schrijven, dan kun je met een beetje hulp van het AI-taalmodel ChatGPT toch de mooiste omschrijvingen creëren. Het enige dat je dan nog hoeft te doen, is ChatGPT vragen een mooie prompt over een bepaald onderwerp voor je te bedenken.
Stel dat je MidJourney een foto van een brandweerman in actie wilt laten genereren. Dan voer je eerst in ChatGPT de volgende prompt in: "Creëer een prompt voor MidJourney. Ik wil graag een foto van een brandweerman in actie laten genereren." Vraag ChatGPT vervolgens de uitkomst naar het Engels te vertalen, waarna je dat kopieert en in MidJourney (of eigenlijk Discord) plakt.
Zie de foto hieronder hoe ChatGPT dat heeft opgepakt. Direct daaronder zie je het resultaat nadat we de prompt aan MidJourney hebben gevoerd.
©ER - ID.nl
Eigen afbeelding als voorbeeld gebruiken
Sinds MidJourney v5 kun je ook eigen afbeeldingen gebruiken om je creaties te beïnvloeden. Dat doe je door je afbeelding naar de Discord-server te uploaden en er een prompt aan te plakken. De resultaten zijn soms verbluffend en soms regelrecht hilarisch.
Om een afbeelding toe te voegen, sleep je die naar Discords chatventer met de MidJourney Bot (of je drukt op het plusje links van de chatregel onderaan), waarna je de afbeelding die je wilt gebruiken opzoekt. Druk daarna op Enter om hem up te loaden. Vervolgens klik je met je rechtermuisknop op de geüploade afbeelding en selecteer je onderaan Kopieer link. Daarna plak je de url van de afbeelding in je prompt (controleer of die url eindigt op .png, .gif of .jpg). Daarna kun je nog wat tekst of parameters toevoegen om je prompt af te maken. Bijvoorbeeld: /imagine [afbeeldings-URL] [jouw prompt].
Je kunt ook bepalen hoeveel invloed je afbeelding heeft op het eindresultaat. Gebruik hiervoor de parameter --iw X, waarbij X een waarde is tussen 0,5 en 2. Standaard is dat 1,0, maar je kunt het verminderen of verhogen door --iw 0,5 of --iw 2 te gebruiken. Let op: het eindresultaat zal geen exacte kopie van jouw afbeelding zijn. Het is meer een invloed, dus verwacht geen perfecte gelijkenis.
MidJourney-parameters
Parameters zijn opties die aan een prompt worden toegevoegd en van invloed zijn op de manier waarop een afbeelding in MidJourney wordt gegenereerd. Deze parameters kunnen de beeldverhoudingen van een afbeelding veranderen, negatieve prompts aangeven of schakelen tussen verschillende MidJourney-modelversies (zie volgende paragraaf). Parameters worden altijd aan het eind van een prompt toegevoegd en er kunnen meerdere parameters aan elke prompt worden toegevoegd. Je gebruikt parameters altijd door eerst twee streepjes (--) te typen. Hieronder een overzicht van de verschillende parameters die MidJourney gebruikt.
Aspect Ratio (--aspect of --ar): Met deze parameter kun je de beeldverhouding van je creatie aanpassen, bijvoorbeeld --ar 16:9 of --ar 2:3.
Chaos (--chaos): Wil je wat meer variatie in je afbeeldingen (MidJourney creëert er namelijk altijd vier)? Verhoog de chaos en laat je verrassen door wat er gebeurt. Kies een getal tussen 0 en 100 (bijvoorbeeld --c 82): hoe hoger het getal, hoe groter de variatie.
No (--no): Als je bepaalde elementen liever niet in je afbeelding wilt zien, is deze parameter je vriend. We hebben al eerder uitgelegd hoe deze parameter werkt.
Quality (--quality of --q): Als je de tijd van het renderen van een afbeelding wilt verkorten, kun je met deze parameter de kwaliteit iets verlagen. Standaard staat hij ingesteld op 1, maar je kun --q .5 of --q .25 gebruiken om het proces te versnellen.
Seed (--seed): Wil je een specifiek startpunt voor je beeldgeneratie, bijvoorbeeld omdat je tevreden bent met een bepaald beeld en verder wilt met een soortgelijke variant? Geef een zelf bedacht seed-nummer op (bijvoorbeeld --seed 12345) en je ziet dat een volgende opdracht met hetzelfde seed-nummer in een zelfde stijl wordt gegenereerd.
Stop (--stop): Met deze parameter kun je de taak vroegtijdig stoppen, wat kan leiden tot wat waziger, maar nog steeds interessante resultaten. Gebruik hiervoor --stop 10 tot en met --stop 100 (waarbij 100 een uitgerenderde versie van de afbeelding is).
Style (--style): Hiermee kun je schakelen tussen verschillende versies van het MidJourney-model. Experimenteer er lekker op los en kijk welke stijl je het best bevalt.
Stylize (--stylize of --s): Wil je de esthetische stijl van MidJourney sterker toepassen op je afbeeldingen? Pas deze parameter aan en zie het verschil. Hier geldt een range van 0-1000, waarbij 100 de standaard is. Hoe hoger je deze optie afstelt, hoe sterker een bepaald zichtbaar is.
Tile (--tile): Deze parameter laat je afbeeldingen genereren die als herhalende tegels kunnen worden gebruikt. Heel erg handig voor het maken van patronen!
Version (--version of --v): Als je een andere versie van het MidJourney-algoritme wilt proberen, is dit de parameter die je nodig hebt.
©ER - ID.nl
Verschillende modellen
MidJourney heeft verschillende versies om uit te kiezen, die door de ontwikkelaar 'modellen' worden genoemd. Het nieuwste en meest geavanceerde model is V5.1, dat uitblinkt in het nauwkeurig interpreteren van natuurlijke taalprompts en het produceren van scherpe afbeeldingen met minder ongewenste artefacten.
Het oudere V5-model was al meer gericht op het produceren van fotografische generaties, terwijl V4, dat de standaard was van november 2022 tot mei 2023, een geheel andere codebasis en AI-architectuur had. Deze versie had in vergelijking met eerdere modellen een geavanceerde kennis van wezens, plaatsen en objecten.
Daarnaast is er het Niji-model, een samenwerking tussen MidJourney en Spellbrush, dat is afgestemd op het produceren van anime en illustratieve stijlen. Het is dan ook vooral geschikt voor het creëren van manga- en anime-achtige afbeeldingen en niet zozeer voor het genereren van fotorealistische creaties.
Je kunt elk model selecteren door de juiste parameter aan het eind van je prompt toe te voegen of door het /settings-commando te gebruiken en een standaard modelversie te selecteren. Experimenteer gerust met de verschillende modellen om te zien welke versie het best bij jouw favoriete stijl past. En vergeet niet: het resulterende beeld valt of staat bij de kwaliteit van jouw ingegeven prompt. De kwaliteit van de gekozen woorden en de samenhang ervan betekent dat het beeld een nauwkeurige weergave is van de prompttekst.
Iedereen is kunstenaar
Zoals je hebt kunnen lezen is MidJourney meer dan alleen een tool. We durven gerust te stelle dat het een revolutie is in de manier waarop we over kunst en creativiteit denken. Door de kracht van AI kunnen we onze verbeelding en fantasie op nieuwe manieren verkennen. Of je nu een door de wol geverfde fotograaf of illustrator bent die op zoek is naar nieuwe manieren om je creativiteit te uiten, of gewoon een AI-enthousiasteling die geïnteresseerd is in de nieuwste technologie, MidJourney heeft iets te bieden voor iedereen. Wij zijn fan in elk geval.