ID.nl logo
De technologie achter deepfake en synthetische media
© Reshift Digital
Huis

De technologie achter deepfake en synthetische media

Je eigen gezicht op een filmpersonage plakken is geestig en vrij onschuldig, een politicus iets laten zeggen wat hij of zij nooit gezegd heeft is al van een andere orde. We hebben het uiteraard over deepfakes. Hoe werkt de technologie achter synthetische media?

Een belangrijk containerbegrip waar deepfakes onder vallen is ‘synthetische media’. Dat staat voor content die niet door mensen is gemaakt, maar door computers gegenereerd. Het gaat bijvoorbeeld om foto’s of video’s die niet echt zijn, maar er wel heel echt uitzien. Maar het kan ook gaan om audio, teksten of virtuele objecten. De content wordt geproduceerd door een algoritme op basis van kunstmatige intelligentie (AI, artificial intelligence). 

Deze AI wordt gevoed en getraind door data, zoals foto’s met verschillende gezichtskenmerken, bewegende beelden van een persoon, teksten, muziek of het interieur van huizen. Hoe groter de dataset, des te beter de vaardigheden van het algoritme worden. Software heeft ten opzichte van mensen het voordeel dat het content met hoge snelheid en op oneindige schaal kan produceren.

Een algoritme kan op basis van een dataset met bijvoorbeeld foto’s van tienduizenden personen de gelaatskenmerken analyseren, zoals de positie en kenmerken van de ogen, neus en mond, wenkbrauwen, haar en bijvoorbeeld moedervlekken. Door die vanuit verschillende hoeken te analyseren ontstaat een 3D-model van het gezicht. 

Op basis daarvan, en de overeenkomsten en verschillen tussen mensen in de dataset, kan het algoritme zelf mensen ‘maken’. Wanneer beelden gecombineerd worden van echte mensen wordt dit een deepfake genoemd. Maar het kan ook op basis van random noise, oftewel pixels.

©PXimport

Face swappen

Een onderdeel dat vaak in het nieuws komt, is een zogenoemde deepfake-video of -foto. Hierbij wordt een persoon gedeeltelijk vervangen door een andere persoon – bijvoorbeeld door het gezicht te verwisselen. Het begrip ‘deepfake’ is een samenvoeging van twee Engelse woorden: ‘deep learning’ en ‘fake’. Deep learning is een onderdeel van ‘machine learning’, dat gebaseerd is op kunstmatige neurale netwerken. Het wordt gebruikt om bestaande afbeeldingen en video te combineren, en delen ervan te integreren. 

Bij veel deepfake-video’s wordt meestal alleen een klein deel van een persoon vervangen: het gezicht. Dit heet een ‘faceswap’. Dit scheelt kostbare rekenkracht en het is beduidend minder complex omdat niet al het haar, lichaam, kleding en de achtergrond hoeft te worden vervangen. In de praktijk worden vaak alleen de gelaatstrekken van een hoofd overgenomen, zoals de ogen, neus, wenkbrauwen, gezichtshaar en mond. Deze worden wel zo aangepast dat de kleur en de belichting van het gezicht overeenkomt met het origineel. 

Het resultaat ziet er vaak verrassend echt uit, zeker wanneer het personen betreft die qua bouw een beetje op elkaar lijken. Een bekend voorbeeld is een scène van Arnold Schwarzenegger in Terminator 2, waarbij het gezicht is vervangen door aartsrivaal Sylvester Stallone. Een faceswap is tegenwoordig zo eenvoudig dat iedere consumentencomputer het kan: er bestaat kant-en-klare opensource-software voor. Ook smartphones zijn krachtig genoeg en er zijn talloze apps, zoals Reface.

Hoe werkt deepfake?

Het manipuleren van bestaande beelden of een faceswap werkt door eerst het bronbeeld uitvoerig te analyseren: de positie en de bewegingen van alle onderdelen van het gezicht worden uitvoerig ontleedt, evenals het licht en de hoek van het gezicht. Alle individuele frames worden apart opgeslagen. Vervolgens gebeurt hetzelfde met het doelbeeld, waarbij de gezichten over elkaar worden gelegd. Hoe groter de dataset aan beelden is, des te beter is het eindresultaat.

Het produceren van een compleet nieuw beeld door een algoritme werkt anders. Dit gebeurt met een techniek die bekend staat als GAN (Generative Adversarial Network). Dit is een klasse van algoritmen voor ongecontroleerd leren. Het werkt door middel van een soort spelscenario waarbij twee neurale netwerken tegen elkaar strijden en samenwerken. 

Het eerste netwerk is de generator, die een beeld genereert (maar het kan ook een tekst of audiofragment zijn). Het tweede netwerk is de discriminator, die is getraind op een grote database van voorbeelden en probeert te detecteren of het beeld echt is, of gefabriceerd door de generator. Dit proces gaat net zo lang door tot het door het eerste netwerk geproduceerde beeld zo goed is, dat het aangemerkt wordt als echt. Het netwerk van de generator traint zichzelf dus als het ware omdat het telkens anticipeert op de afwijzingen van de discriminator. 

Een GAN die op foto’s is getraind, kan zelf beelden genereren die niet van echt te onderscheiden zijn. Deze foto’s of video’s zijn dus niet samengesteld uit echte beelden, zoals bij deepfake, maar volledig op basis van nieuwe pixels gegenereerd. Het gaat dan dus om mensen die in werkelijkheid niet bestaan, maar er wel levensecht uitzien. Voorbeelden zijn te zien op sites als thispersondoesnotexist.com. Voor katten, huiskamers en landschappen bestaat deze techniek ook.

Hollywood

De techniek worden steeds vaker toegepast in Hollywoodfilms. In Terminator Genisys, Captain Marvel, Tron: Legacy, The Irishman en Gemini werden hoofdrolspelers tientallen jaren jonger gemaakt. In 2016 zagen we een jonge Carrie Fisher als prinses Leia in Star Wars: Rogue One en in Episode IX figureerde zij zelfs na haar dood.

Amerikaanse filmmakers overwegen zelfs de in 1955 overleden acteur James Dean, te laten figureren in een nieuwe Vietnamfilm, omdat ze zijn persoon zo goed bij de rol vinden passen. Ook voor tv en op YouTube worden steeds vaker deepfakes gebruikt. Zo zond het Britse tv-netwerk Channel 4 beelden van Koningin Elizabeth uit waarbij ze een TikTok-dans deed. 

In Zondag met Lubach ontkrachtte Gerry Baudet uitspraken die door zijn ‘broertje’ waren gedaan. In december 2020 publiceerde YouTube-kanaal Sassy Justice, van de makers van South Park, een zogenaamd kerstverhaal van President Trump waarin twee rendieren onderling ruzie krijgen over de uitslag van de verkiezingen. De opname lijkt verrassend echt, inclusief de bewegingen, handgebaren, gelaatstrekken en de stem van Trump. 

Tenslotte ontstond onlangs veel reuring nadat De Correspondent een gemanipuleerd filmpje van Mark Rutte online zette, waarin het leek alsof de VVD-politicus ineens wel erg begaan was met het klimaat. Op de stem na zou je het zo geloven! 

Tekst: Jeroen Horlings

▼ Volgende artikel
Wikipedia sluit deal met AI-bedrijven voor toegang tot grote hoeveelheden content
© diy13 - stock.adobe.com
Huis

Wikipedia sluit deal met AI-bedrijven voor toegang tot grote hoeveelheden content

Wikipedia heeft een deal gesloten met bedrijven als Microsoft, Amazon en Mistral AI. Zij gaan voortaan betalen voor toegang tot Wikipedia Enterprise. In ruil krijgen ze toegang tot grote hoeveelheden content uit de online encyclopedie.

De samenwerking werd gisteren aangekondigd – precies op de vijfentwintigste verjaardag van Wikipedia. De samenwerking tussen de encyclopedie en bedrijven als Microsoft, Meta, Amazon, Mistral AI en Perplexity zorgt ervoor dat zij allen gebruik kunnen maken van Wikipedia Enterprise. Het is niet bekend hoeveel deze bedrijven betalen voor hun lidmaatschap.

Wat is Wikipedia Enterprise?

Wikipedia Enterprise is de commerciële tak van Wikipedia waarbij aangesloten bedrijven op grote schaal data aangeleverd krijgen via een API-dienst. Zo kunnen AI-bedrijven, zoekmachines en spraakassistenten op grote schaal betrouwbare data van Wikipedia ontvangen die door machines gelezen kan worden.

Kortgezegd is dit een efficiënte en makkelijke manier voor bedrijven om de informatie uit Wikipedia-pagina's voor hun eigen producten te gebruiken. Daarbij gaat het ook om de meest recente versies van Wikipedia-pagina's, zodat informatie altijd zo nieuw mogelijk en dus relevant is.

Lees ook: Kennis delen? Zo werk je mee aan Wikipedia

Waarom sluiten bedrijven zich bij Wikipedia Enterprise aan?

Hoewel elk bedrijf zijn eigen reden heeft om zich bij Wikipedia Enterprise aan te sluiten, lijken de deze week aangekondigde samenwerkingen vooral te maken te hebben met het gebruik van Wikipedia-info voor AI. Op die manier kunnen AI-bots getraind worden met correcte info van Wikipedia die door mensen is geschreven, waardoor ze steeds slimmer worden en ook steeds meer informatie kunnen bieden.

De samenwerking voelt deels symbolisch: bedrijven laten hun AI-modellen al geruime tijd gebruikmaken van Wikipedia en alle andere bronnen op het internet, waardoor Wikipedia aanzienlijk minder bezoek krijgt vergeleken met enkele jaren geleden. Wikipedia riep AI-bedrijven afgelopen jaar dan ook op te betalen voor het gebruik van Wikipedia-pagina's voor AI-training. Daar hebben Microsoft, Meta, Amazon en consorten nu dus gehoor aan gegeven. Andere bedrijven, zoals Google, hadden zich al aangesloten bij Wikipedia Enterprise.

▼ Volgende artikel
Lego-set gebaseerd op The Legend of Zelda: Ocarina of Time is gelekt
© Lego
Gezond leven

Lego-set gebaseerd op The Legend of Zelda: Ocarina of Time is gelekt

Het was al bekend dat Lego dit jaar met een nieuwe set gebaseerd op Nintendo's populaire gamereeks gaat komen, en nu zijn er zowel details als foto's van de 'The Legend of Zelda: Ocarina of Time'-set opgedoken.

Nieuw op ID: het complete plaatje

Misschien valt het je op dat er vanaf nu ook berichten over games, films en series op onze site verschijnen. Dat is een bewuste stap. Wij geloven dat technologie niet stopt bij hardware; het gaat uiteindelijk om wat je ermee beleeft. Daarom combineren we onze expertise in tech nu met het laatste nieuws over entertainment. Dat doen we met de gezichten die mensen kennen van Power Unlimited, dé experts op het gebied van gaming en streaming. Zo helpen we je niet alleen aan de beste tv, smartphone of laptop, maar vertellen we je ook direct wat je erop moet kijken of spelen. Je vindt hier dus voortaan de ideale mix van hardware én content.

De informatie en afbeeldingen zijn afkomstig van het Reddit-account Brick Tap. Het account plaatste deze op de Lego Leaks-subreddit, en onthulde daarmee dat de set een diorama van het laatste gevecht in The Legend of Zelda: Ocarina of Time is. 

Link neemt het hierin op tegen de kwaadaardige Ganondorf, en beide personages zijn dan ook inbegrepen. Ook Princess Zelda is van de partij, en de doos toont al dat we ook Ganon in zijn demonenvorm kunnen bouwen bij aankoop van de 'The Final Battle: Ocarina of Time'-set.

View post on X

De set is dus nog niet officieel onthuld, maar volgens Brick Tap bevat de doos 1003 steentjes om het eindgevecht uit Ocarina of Time mee na te bouwen. Ook zegt hij dat de prijs 120 euro zal worden. Op 1 maart moet deze Lego-set in de winkels liggen, dus het valt te verwachten dat Lego deze binnenkort officieel uit de doeken doet. 

Vorig jaar werd al bekend dat Lego nog een Legend of Zelda-set uit ging brengen, nadat het bedrijf eerder al een set gebaseerd op de Great Deku Tree uit de Nintendo-franchise had uitgebracht. Die set kon je op twee manieren bouwen: als de Deku Tree uit The Legend of Zelda: Breath of the Wild, of als de versie van Ocarina of Time

Nintendo is zelf ook nog altijd bezig met The Legend of Zelda. Hoewel er nog weinig bekend is over het volgende deel in de reeks, bracht het bedrijf in 2024 The Legend of Zelda: Echoes of Wisdom uit, waarin de titulaire prinses voor het eerst de hoofdrol speelde. Ook heeft het Japanse bedrijf de handen ineen geslagen met Sony Pictures om een live-action Zelda-film te maken, waarvan in 2025 de eerste beelden zijn getoond. De film draait vanaf 7 mei 2027 in de bioscoop.