ID.nl logo
Superefficiënt! Je video ondertitelen of transcriberen met AI
© khunkornStudio - stock.adobe.com
Huis

Superefficiënt! Je video ondertitelen of transcriberen met AI

De introductie van de vraagbaak ChatGPT zorgde een jaar geleden voor een enorme hype, en vormde het startsein voor de lancering van talloze andere op AI gebaseerde producten. Whisper komt uit dezelfde koker als ChatGPT en helpt bij het omzetten van spraak naar tekst, op basis van geavanceerde modellen.

In dit artikel laten we zien hoe je Whisper kunt benutten om een transcriptie of vertaling te maken van een audio- of videobestand. Dat kan online via Google Colab of op je eigen pc.

  • Installeer Whisper via Google Drive
  • Of installeer Whisper op je pc, samen met Python, FFmpeg en PyTorch
  • Download videobestanden
  • Laat Whisper een transcriptie of direct een vertaling maken

Lees ook: Handig: laat je PowerPoint-presentatie realtime vertalen!

Wil je een transcriptie of ondertitels hebben voor bepaalde audio- of videobestanden? Bijvoorbeeld content voor YouTube, opgenomen vergaderingen, een podcast of leerzame video? Dit kan tegenwoordig automatisch én vrijwel foutloos. Het kan natuurlijk al langer, maar er zaten vaak veel missers bij. Dat zie je ook al aan de automatisch gegenereerde ondertitels op YouTube. Het is ook best een uitdaging. De menselijke spraak is erg divers, met veel accenten en dialecten, maar ook verschil in spreeksnelheid en intonatie. Er kunnen bovendien storende achtergrondgeluiden zijn, zoals het verkeer of bouwwerkzaamheden. Een spreker kan onduidelijk overkomen of onzeker zijn. Omdat woorden verschillende betekenissen kunnen hebben, kan ten slotte ook de context onderscheidend zijn.

Zelf een podcast maken?

Een goede microfoon is noodzaak

Geholpen door AI zijn tegenwoordig heel nauwkeurige transcripties mogelijk. Teksten kunnen daarbij ook meteen worden vertaald. Dat laten we zien in dit artikel, waarin we met Whisper (zie kader ‘Wat is Whisper’) aan de slag gaan. We beginnen in de cloud met Google Colab. Daarna maken we vertalingen vanaf een lokale pc. Dit versnelt wellicht je proces en maakt je minder afhankelijk van de cloud.

©bestforbest - stock.adobe.com

Met Whisper kun je gesproken audio omzetten naar tekst.

Wat is Whisper Whisper is een gratis en opensource tool van OpenAI. Deze organisatie ken je wellicht van de vraagbaak ChatGPT of van DALL·E 2, die afbeeldingen kan genereren op basis van een omschrijving. De kracht van Whisper ligt bij het herkennen en omzetten van spraak in audio- en videobestanden. Dit kan voor het Engels en ongeveer honderd andere talen. Je kunt Whisper op je eigen pc installeren. Het programma werkt dan volledig offline. Wel helpt het als je een stevig systeem hebt. Het programma is getraind aan de hand van een grote dataset met veel variaties van menselijke spraak. Mede daardoor kan Whisper nauwkeurige vertalingen maken. Je kunt zelf de omvang van het model kiezen, waarbij een groter model nauwkeuriger is, maar ook fors meer rekenkracht vereist.

1 Benodigdheden

Voor het werken met Whisper heb je niet per se een pc nodig: je kunt cloud computing inzetten. Dat kan – omdat het een Python-project is – zelfs gratis met Google Colab. Daar beginnen we in dit artikel dan ook mee. Wil je niet afhankelijk zijn van een clouddienst, dan kun je Whisper ook lokaal op je pc installeren. De software is namelijk opensource. Voor aanvullende informatie kun je op de GitHub-pagina terecht. Verderop in dit artikel behandelen we een lokale installatie in meer detail. Hiervoor heb je overigens wel een capabel systeem nodig, anders zal het maken van de transcripties erg lang duren. Om het rekenwerk te versnellen, gebruiken we een grafische kaart van Nvidia.

Whisper is opensource en heeft een eigen GitHub-pagina.

2 Verschillende modellen

Je kunt bij het werken met Whisper uit verschillende modellen kiezen, oplopend in omvang. De meertalige modellen heten achtereenvolgens tiny, base, small, medium en large. Als je Whisper gebruikt, moet je één van deze modellen kiezen. Er zijn ook modellen voor alleen het Engels. Deze heten tiny.en, base.en, small.en en medium.en. Hoewel je voor Engels ook gewoon de meertalige modellen kunt gebruiken, zijn deze specifieke Engelstalige modellen wat nauwkeuriger, al merk je dat vooral bij de kleinere modellen tiny.en en base.en. We kiezen in dit artikel steeds voor het medium-model, met voor Engels de .en-versie. Probeer en vergelijk zeker de kleinere modellen als je een minder zwaar systeem of minder tijd hebt.

Er zijn verschillende modellen die invloed hebben op de nauwkeurigheid en snelheid.

3 Google Colab

Je kunt voor weinig geld cpu-kracht in de cloud huren. Voor gpu-kracht betaal je vaak veel meer. Google Colab biedt het allemaal voor niks. In feite is Colab, voluit ‘Colaboratory’, een Python-omgeving in de cloud. Je kunt de omgeving gewoon via een browser benaderen met een gratis Google-account. Door de opmars van grafisch intensieve AI-toepassingen, vaak met Python als basis, is het platform van Google flink in trek. Dat maakt het wat onzeker of deze dienst kan blijven bestaan en gratis blijft. Maar dat geldt voor veel experimentele diensten van de techgigant. Daarom laten we verderop in dit artikel, vanaf stap 10, ook zien hoe je lokaal op je eigen pc kunt werken met Whisper, voor als de stekker eruit gaat.

Google Colab kun je gratis gebruiken met je Google-account.

4 Koppeling Google Drive

We beginnen in Google Drive waar je Colab als app kunt koppelen. Kies daarvoor Nieuw / Meer / Meer apps koppelen. Vul in het zoekveld Google Colaboratory in. Klik op de bewuste app en kies dan Installeren. Na het doorlopen van de stappen is Google Colaboratory gekoppeld aan je Google Drive en kun je het venster sluiten.

Je kunt de app in enkele stappen toevoegen aan je Google Drive.

5 Whisper installeren

Nadat de app is gekoppeld kun je onder Nieuw / Meer direct Google Colaboratory openen. Linksboven kun je de naam van het project (Untitled0.jpynb) veranderen. We maken hier YouTube-demo.jpynb van. Kies in het menu Runtime voor Runtimetype wijzigen. Selecteer onder Hardwareversnelling een gpu. De beschikbaarheid kan variëren. In dit voorbeeld kiezen we T4 GPU. Klik dan op Opslaan. De grafische kracht zal automatisch in ons project worden benut. Plak de onderstaande opdrachten in het tekstvak achter het uitvoerenicoontje en voer het uit. Daarmee worden Whisper en FFmpeg geïnstalleerd. Dit framework zorgt ervoor dat alle denkbare mediabestanden kunnen worden gedecodeerd:

!whisper "energiebesparen.mp4" --model medium

en:

!sudo apt update && sudo apt install ffmpeg
We installeren Whisper en het bekende FFmpeg-framework.

6 Bestand uploaden

We gebruiken enkele bestanden van YouTube (zie kader ‘Bronbestanden voor Whisper’) en geven deze een makkelijke naam om mee te werken, te weten homelab.mp4, zweden.mp4 en energiebesparen.mp4. Om ervoor te zorgen dat je binnen Colab met deze bestanden kunt werken, gaan we ze eerst uploaden. Klik daarvoor op het bestandenicoontje links in Colab. Je kunt de gewenste videobestanden slepen naar het bestandsvenster of uploaden via het uploadicoontje. Zorg er wel voor dat je de originele bestanden ook zelf op je pc hebt. Als je de omgeving verlaat, zal de zogenoemde runtime worden verwijderd. Daarmee verdwijnen ook de geüploade bestanden. Je zult ze de volgende keer opnieuw moeten uploaden. Ook zul je dan overigens weer het correcte runtimetype moeten kiezen en Whisper moeten installeren.

Je kunt mediabestanden uploaden naar Google.

Bronbestanden voor Whisper Je kunt voor Whisper allerlei soorten mediabestanden gebruiken. In dit artikel gebruiken we drie video’s van YouTube met speelduur van zo’n 15 tot 25 minuten. We gebruiken een Engelse video (met Duits accent) van Christian Lempa over zijn Home Lab, een Nederlands vlog van Linda Meijers over wonen in Zweden en een Nederlandse video over het besparen van energie van onze eigen ID.nl waarin meerdere personen aan het woord komen. Via www.x2mate.com downloaden we de YouTube-video’s als mp4-bestand in 720p voor verwerking in Whisper. We hadden eventueel ook alleen de audio in mp3-formaat kunnen downloaden, maar voor de beoordeling is het videobestand met ingebakken audio makkelijker. Whisper maakt namelijk automatisch een ondertitelbestand (in .srt-formaat). Veel videospelers geven dit weer. Hierdoor kun je direct het resultaat beoordelen en eventueel vergelijken met de automatisch gegenereerde ondertitels van YouTube.

7 Transcripties maken

Het is tijd om Whisper aan het werk te zetten met de gekozen videobestanden. Kijk eerst of je Whisper kunt aanroepen met de opdracht !whisper. Je ziet dan ook de optionele parameters. We beginnen met de Engelse video en kiezen het model medium.en. Klik op + Code en voer de onderstaande opdracht in, waarin we zoals je ziet het bestand en het model specificeren:

!whisper "homelab.mp4" --model medium.en

Voor de andere video’s gebruiken we --model medium. Dat is een meertalig model met hoge nauwkeurigheid. De taal zal steeds automatisch worden herkend:

!whisper "zweden.mp4" --model medium

en:

!whisper "energiebesparen.mp4" --model medium

Google had zo’n drie tot zes minuten per video nodig om de transcripties te maken. Na afloop kun je de tekstbestanden downloaden, waaronder het ondertitelbestand (.srt). Vanuit het bestandsvenster kun je alle tekstbestanden downloaden naar je pc.

We zetten Whisper aan de slag om een transcriptie voor de video’s te maken.

8 Vertalingen maken

Wat vaak onderbelicht blijft, is dat Whisper ook tekst kan vertalen. Dat is heel praktisch als je bijvoorbeeld een YouTube-video hebt die internationaal wordt bekeken. Met de opdracht hieronder kun je een Engelstalige transcriptie maken voor een Nederlandstalige video. Het vraagt waarschijnlijk iets meer nabewerking, maar een groot deel van het werk is in ieder geval al voor je gedaan:

!whisper "energiebesparen.mp4" --model medium --task translate --language en
Whisper kan de tekst ook direct voor je vertalen naar bijvoorbeeld het Engels.

9 Resultaat bekijken

De meeste videospelers zullen automatisch ondertitels laten zien als je het ondertitelbestand in dezelfde map zet en ook dezelfde naam geeft als je videobestand. We zien dat de transcripties steeds van hoge kwaliteit zijn. Versprekingen zijn vaak al gecorrigeerd. De video’s zijn ook veel beter te volgen dan met de automatische transcriptie die YouTube zelf aanbiedt. Ook wordt er veel beter en nauwkeuriger gebruikgemaakt van leestekens. Je zult hooguit nog wat kleine aanpassingen willen maken voor bijvoorbeeld enkele woorden die verkeerd zijn geïnterpreteerd. Dat gaat natuurlijk heel eenvoudig in het tekstbestand zelf, maar er zijn ook tools die je voor srt-bestanden kunt gebruiken.

Het ondertitelbestand wordt door veel videospelers direct herkend.

10 Lokale installatie

Een lokale installatie onder Windows is zeker niet lastig, maar er is best wat software vereist om alles te laten werken. Om te beginnen moet je Python downloaden en installeren. Hoewel een wat oudere versie wordt aangeraden, zijn we geen problemen tegengekomen bij gebruik van de meest recente versie 3.12.0. Let er bij de installatie van Python op dat je een vinkje zet bij Add python.exe to PATH. Je kunt Python dan vanuit elke map op de pc aanroepen. Installeer vervolgens ook Git voor Windows. Bij deze installatie kun je alle standaardopties accepteren. Belangrijk is dat Git daarbij ook weer aan het path wordt toegevoegd.

Zorg dat Python wordt toegevoegd aan het path in Windows.

11 Grafische kaart

Heb je een grafische kaart van Nvidia, dan kun je de berekeningen van Whisper flink versnellen, zoals we verderop zullen laten zien. Hiervoor dien je CUDA te installeren. We gebruiken versie 11.8. Selecteer op de downloadpagina Windows met de architectuur x86_64 en selecteer je versie van Windows (doorgaans 10 of 11). De hier gekozen versie van CUDA wordt ook door PyTorch ondersteund, dat we in de volgende stap gaan installeren. Doorloop de installatie. Kies daarbij in het venster Installatieopties voor Aangepast (geavanceerd). Vink vervolgens alle onderdelen uit behalve CUDA. Zo voorkom je dat onder andere de huidige drivers voor je grafische kaart worden vervangen door een oudere versie.

Je hoeft voor dit project alleen CUDA te installeren.

12 FFmpeg installeren

Je hebt voor een lokale installatie ook het framework FFmpeg nodig. Klik op de downloadpagina op het Windows-icoontje en kies Windows builds from gyan.dev. Download het archief (ffmpeg-git-full.7z) en pak het uit met de ingebakken tool van Windows of bijvoorbeeld 7-Zip. Hernoem de map naar ffmpeg en verplaats deze naar de C-schijf. Het bestand ffmpeg.exe bevindt zich dan in C:\ffmpeg\bin. Deze map gaan we aan het path toevoegen. Druk op Windows-toets+R, vul in sysdm.cpl en druk op Enter. Open dan het tabblad Geavanceerd en kies Omgevingsvariabelen. Dubbelklik op Path. In het venster klik je op Nieuw om een pad toe te voegen. Vul dan in: C:\ffmpeg\bin. Bewaar de aanpassingen en herstart je systeem.

We zorgen ervoor dat FFmpeg wordt toegevoegd aan het path.

13 PyTorch

Zet alle videobestanden waarvoor je een transcriptie wil maken in een map. Klik dan in Windows Verkenner rechts op een lege plek in de map en kies Openen in terminal. Als het goed is, kun je nu alle opdrachten uitvoeren voor geïnstalleerde toepassingen, zoals: python --version, ffmpeg en git.

We gaan eerst een recente versie van PyTorch installeren dat nodig is voor Whisper. Ga daarvoor naar de website van PyTorch en kies de opties Stable, Windows, Pip, Python en CUDA 11.8. Kopieer het commando. In dit geval ziet dat er als volgt uit:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

Voer deze opdracht uit in de terminal. Kom je geen problemen tegen, ga dan verder met de volgende opdrachten:

pip3 install setuptools-rust

en:

pip3 install git+https://github.com/openai/whisper.git

De installatie van Whisper is nu als het goed is geslaagd, zodat we in de volgende stap transcripties kunnen gaan maken.

Via de website van PyTorch kun je het commando achterhalen dat nodig is voor de installatie.

14 Whisper starten

De opdrachten voor het maken van de transcriptie verschillen niet van de eerdergenoemde opdrachten in Google Colab:

whisper "homelab.mp4" --model medium.en

of:

whisper "zweden.mp4" --model medium

of:

whisper "energiebesparen.mp4" --model medium

Als CUDA beschikbaar, is zal automatisch de grafische kaart worden gebruikt. Geholpen door een RTX 3080 grafische kaart is de transcriptie voor de video zweden.mp4 met het model medium binnen drie minuten gereed. Dit ligt in lijn met de snelheid via Colab. Heb je geen grafische kaart of geen CUDA? Dan zal de processor worden gebruikt, wat flink veel extra tijd kost (zie kader ‘Grafische kaart sterk aanbevolen’). Je kunt dat zelf ervaren met de optie --device cpu. Dit forceert het gebruik van de processor. Als CUDA wél beschikbaar is, geeft deze opdracht overigens een waarschuwing.

Whisper maakt relatief snel de transcriptie voor de video.

Grafische kaart aanbevolen Transcripties maken met de processor is tijdrovend. Zelfs op een 16-core AMD Ryzen 9 5950X is voor transcriptie van zweden.mp4 ruim twintig minuten nodig. De processor wordt daarbij steeds met zo’n 70 procent belast. Met de RTX 3080 lukt het binnen drie minuten met veel lagere belasting. Een grafische kaart is dus zeker geen overbodige luxe. Dat hoeft geen RTX 3080 te zijn. Er is vooral genoeg VRAM nodig. Een RTX 2060 of RTX 3060 helpt al enorm, maar je zult zeker verschil merken als je een snellere kaart in je systeem prikt. Loop je tegen problemen aan? Je kunt binnen Python controleren of CUDA beschikbaar is. Start daarvoor Python met python. Voer dan na elkaar de volgende opdrachten in. Je krijgt als het goed is True als resultaat: import torch torch.cuda.is_available()

Watch on YouTube
▼ Volgende artikel
CES 2026: Samsung breidt audio-aanbod uit met nieuwe speakers en soundbars
© Sony
Huis

CES 2026: Samsung breidt audio-aanbod uit met nieuwe speakers en soundbars

Op de CES in Las Vegas presenteert Samsung een uitbreiding van zijn audio-aanbod voor 2026. De fabrikant introduceert twee nieuwe Music Studio-speakers en vernieuwt tegelijk zijn Q-serie soundbars. De nadruk ligt op beter samenwerkende apparaten, waarbij tv, soundbar en losse speakers als één systeem functioneren.

Onder de nieuwe producten bevinden zich de Music Studio 5 en Music Studio 7, twee draadloze luidsprekers die zijn ontworpen om zowel zelfstandig als in combinatie met andere Samsung-audioapparatuur te werken. Beide modellen maken deel uit van een breder ecosysteem, waarin meerdere speakers en soundbars aan één tv gekoppeld kunnen worden.

De Music Studio 7 is het meest uitgebreide model. Deze speaker levert 3.1.1-kanaals audio met aparte speakers voor links, rechts, het midden en omhoog gericht geluid. Daardoor ontstaat een ruimtelijker geluidsbeeld dan bij een traditionele stereospeaker, vooral bij films en series. Samsung past technieken toe om overlap tussen kanalen te beperken en de bas gecontroleerd te houden, ook bij hogere volumes. Muziek wordt verwerkt tot 24-bit/96 kHz en dankzij de super tweeter worden ook hoge tonen verder doorgetrokken. De Music Studio 7 is los te gebruiken, maar kan ook worden gecombineerd met extra speakers of een Samsung-tv voor een bredere stereo-opstelling of surroundgeluid.

De Music Studio 5 is compacter. Hij gebruikt een enkele woofer en twee tweeters voor een evenwichtige weergave en is afgestemd op helder geluid bij dagelijks gebruik, zoals muziekstreaming en tv-geluid. Net als het grotere model ondersteunt hij wifi, bluetooth en spraakbediening. Samsung richt zich hier duidelijk op gebruikers die één losse speaker willen, maar wel de optie willen houden om later uit te breiden.

Soundbars

Naast de nieuwe Music Studio-speakers vernieuwt Samsung ook zijn Q-serie soundbars voor 2026. Het topmodel HW-Q990H bestaat uit een uitgebreide set met een 7.0.2.-soundbar, draadloze 4.0.2.-achterspeakers en een ingebouwde subwoofer. Nieuw is onder meer een functie die dialogen nadrukkelijker naar het midden van het scherm verplaatst en een automatische volumeregeling die grote verschillen tussen bronnen voorkomt. Daarnaast introduceert Samsung een all-in-one soundbar, de HW-QS90H, die zonder losse subwoofer werkt. Dankzij het Convertible Fit-ontwerp kun je die plaatsen waar je wilt: je kunt hem op tafel zetten maar ook aan de muur hangen. Een ingebouwde gyrosensor zorgt ervvor dat de kanaaalverdeling automatisch wordt aangepast.

Alle nieuwe audioproducten werken met elkaar samen via Q-Symphony en de SmartThings-app. Daarmee moeten gebruikers eenvoudiger meerdere speakers kunnen combineren en het geluid beter kunnen afstemmen op hun woonkamer.

Wat is Q-Symphony?

Q-Symphony is een techniek van Samsung waarbij de luidsprekers van een compatibele tv actief blijven wanneer je een soundbar of draadloze speakers aansluit. In plaats van de tv-speakers uit te schakelen, laat het systeem alle speakers samenwerken. Q-Symphony verdeelt het geluid automatisch over de beschikbare luidsprekers en houdt rekening met hun plaatsing in de ruimte. Spraak komt daarbij vaak uit de tv zelf, terwijl muziek en effecten via de soundbar en extra speakers worden weergegeven.

Voor 2026 breidt Samsung deze aanpak verder uit. Q-Symphony wordt adaptiever en kan nu tot vijf geluidsapparaten tegelijk aan één tv koppelen, waaronder soundbars en wifi-speakers. Het systeem analyseert de ruimte en past de kanaalverdeling daarop aan, met als doel een duidelijkere dialoog en een nauwkeuriger surroundgeluid. Via wifi en de SmartThings-app zijn bovendien geluidsinstellingen, speaker­groepen en muziekbediening centraal te regelen vanaf een smartphone of tablet.

▼ Volgende artikel
 Microsoft Foto’s: veel meer dan een fotoviewer
© ID.nl
Huis

Microsoft Foto’s: veel meer dan een fotoviewer

Wie denkt dat de Foto’s-app in Windows 11 niet meer is dan een basisviewer, vergist zich. Het programma combineert overzichtelijke organisatie, handige bewerkingstools en slimme koppelingen met andere Microsoft-diensten tot een verrassend veelzijdige tool.

De meeste gebruikers openen Foto’s om simpelweg een jpg- of png-bestand te bekijken. Toch is de app ontworpen als tool om niet alleen foto’s, maar ook video’s te beheren en te bewerken. Bovendien is de AI waarmee Windows 11 uitpakt, ook in deze app geïntegreerd. We bekijken enkele geavanceerde functies. 

Elementen verwijderen

Vaak merk je pas achteraf dat er iets storends op een foto staat: denk aan elektriciteitsdraden, rondslingerende rommel of een ex die je nooit meer wilt zien. In zulke gevallen biedt Foto’s een handige AI-functie: Genererend wissen. In tegenstelling tot het klassieke gummetje dat enkel overschildert, verwijdert deze tool het ongewenste object echt. De achtergrond wordt hierbij automatisch aangevuld alsof het element er nooit is geweest.

Zo werkt het: open de foto en klik op Bewerken. Bovenaan verschijnt de knop met het label AI. Selecteer Genererend wissen. Gebruik de kwast om over het object te gaan dat je wilt verwijderen. Met de schuifregelaar Kwastgrootte bepaal je de dikte van de kwast. Het geselecteerde object krijgt kort een gearceerde overlay en verdwijnt vervolgens netjes uit beeld.

Twee seconden later is de fietser uit beeld verdwenen.

Op twee manieren wissen

Wanneer je een groot object wilt verwijderen, kan het zijn dat je Genererend wissen meerdere keren moet toepassen. Soms blijven er namelijk restanten zichtbaar, maar meestal is dat na een tweede poging verholpen.

Standaard staat de verdwijnkwast op Automatisch toepassen. Schakel je dit uit, dan krijg je twee extra mogelijkheden: Masker toevoegen en Masker verwijderen. Met een masker bedoelt Microsoft de overlay waarmee je aanduidt wat moet verdwijnen. Op die manier kun je nauwkeuriger werken: stukjes overlay toevoegen waar nodig, of juist weghalen als je te veel hebt geselecteerd. Ben je niet tevreden met het resultaat, dan kun je altijd terug via de knop Opnieuw instellen.

We gebruiken de tool Genererend wissen tot we als resultaat een eenzame fietser hebben.

Tekst uit foto’s halen

De nieuwe Foto’s-app beschikt over een ingebouwde tekstherkenningsfunctie. Met behulp van Optical Character Recognition (OCR) haalt de app tekst uit afbeeldingen, zodat je die kunt kopiëren, plakken en bewerken. Handig bij screenshots, maar ook bij handgeschreven notities die netjes genoeg zijn om door de OCR te worden herkend.

Open een afbeelding met tekst in Foto’s. Klik onderaan op Tekst scannen. De app markeert automatisch de tekstgebieden. Klik met de rechtermuisknop op de gevonden tekst en kies Alle tekst selecteren. Er verschijnt een lichtrode overlay over de geselecteerde tekst. Klik opnieuw met de rechtermuisknop en kies Tekst kopiëren. De tekst staat nu op het klembord en kun je in elke toepassing plakken.

Wanneer de tekst is gekopieerd, kun je deze in elke toepassing plakken.

Achtergrond verwijderen

Een nieuwe AI-tool in Foto’s maakt het mogelijk om de achtergrond van een foto transparant te maken. Open de foto en klik op Bewerken. Kies bovenaan de knop Achtergrond. De AI herkent automatisch de voorgrond en achtergrond. De achtergrond wordt vervangen door een schaakbordpatroon, wat aangeeft dat dit gebied transparant is.

Als de automatische selectie te veel of te weinig heeft verwijderd, kun je dit aanpassen met het Hulpmiddel voor achtergrondkwast. Hiermee krijg je een kwast waarmee je maskers kunt toevoegen of verwijderen. Je kunt zowel de grootte als de zachtheid van de kwast instellen. Hoe zachter de kwast, hoe zachter de overgang tussen zichtbaar en transparant wordt.

Om de transparante achtergrond te behouden, moet je de afbeelding opslaan in een indeling die transparantie ondersteunt. Bij Opties voor opslaan kun je bijvoorbeeld kiezen voor png, aangezien de veelgebruikte jpg-indeling geen transparantie ondersteunt.

Zelfs een complexe achtergrond vormt geen probleem.

Vervagen of vervangen

Met dezelfde AI-tool kun je niet alleen de achtergrond transparant maken, maar ook vervagen of vervangen. Wanneer je Achtergrond AI selecteert, markeert Foto’s automatisch het voorgrondobject. In dit voorbeeld kiest de app correct de vrouw als voorgrond. Wil je dat ook het betonnen trapje waarop ze zit deel uitmaakt van de voorgrond? Selecteer dan Hulpmiddel voor achtergrondkwast om het trapje aan de selectie toe te voegen. Vervolgens kun je de optie Onscherp gebruiken. Met de schuifregelaar bepaal je de mate van onscherpte, waardoor een scherptediepte-effect ontstaat.

Er is ook een optie Vervangen. Het resultaat hiervan is beperkt: omdat Foto’s geen lagen ondersteunt zoals Microsoft Paint, kun je geen fotografische achtergrond toevoegen. De optie Vervangen laat je alleen de achtergrond vervangen door een effen kleur.

De dame en het trapje blijven scherp, de achtergrond vervaagt

Vergroten en verkleinen

Vaak wil je de grootte van een afbeelding aanpassen. Foto’s beschikt over een ingebouwde, aanpasbare resizer. Let op: wil je meerdere afbeeldingen tegelijk aanpassen, dan kan dat niet. Batchverwerking wordt niet ondersteund. Bij een geopende afbeelding klik je niet op Bewerken, maar op de drie puntjes bovenaan. In het menu kies je vervolgens Formaat van afbeelding wijzigen.

Je kunt het formaat instellen in pixelwaarden of in percentage. Tegelijk is het mogelijk om de afbeelding naar een andere indeling te converteren, bijvoorbeeld naar jpg of png. Met een schuifregelaar bepaal je de kwaliteit, wat de mate van compressie regelt. Hoe meer compressie, hoe kleiner het bestand, maar ook hoe groter het risico op kleine verstoringen (zogenaamde artefacten).

Onderaan zie je telkens het verschil tussen het huidige en het nieuwe bestand. Deze tool kun je niet alleen gebruiken om afbeeldingen te verkleinen; je kunt ze ook vergroten. Het verhogen van de resolutie heet upscaling of opschalen. Bij zowel upscalen als downscalen wordt automatisch de hoogte-breedteverhouding behouden, zodat de afbeelding niet wordt vervormd.

Door de resolutie en de compressie aan te passen, wordt het afbeeldingsbestand twintig keer kleiner.
Super Resolution

Op sommige computers verschijnt in deze app een knop Super Resolution. Dit is een AI-functie die foto’s automatisch scherper en gedetailleerder maakt. Zo kan een afbeelding van 800 × 600 worden opgeschaald naar 1600 × 1200 of zelfs hoger, terwijl de details grotendeels behouden blijven.

Bovendien corrigeert Super Resolution ook compressie-artefacten.De functie is alleen beschikbaar op pc’s met Copilot en een Neural Processing Unit (npu). Eind vorig jaar verscheen de knop per vergissing ook op apparaten die dit niet ondersteunden. Dat is inmiddels rechtgezet, zodat Super Resolution nu enkel zichtbaar is op geschikte toestellen.

Met Super Resolution helpt AI om je de afbeelding drastisch te upscalen.

Video’s bewerken

Met Microsoft Foto’s kun je ook eenvoudig video’s trimmen. Open de video in de app en die start meteen met afspelen. Linksboven verschijnt een rode knop Knippen. In het venster dat opent, gebruik je onderaan de tijdlijn de verticale indicator om het beginpunt van de video te bepalen. Daarna versleep je de achterste hendel om het eindpunt vast te leggen. Ben je tevreden met de selectie, dan kies je voor Opslaan als kopie (de originele video blijft behouden) of voor Opslaan (de oorspronkelijke video wordt overschreven).

Op de tijdlijn bepaal je eenvoudig het begin- en eindpunt van de video.

Filters en effecten

Zodra je op Bewerken hebt geklikt, kun je de afbeelding verfijnen met de knoppen Aanpassing (het pictogram van de zwart-witte bol) en Filteren (het pictogram van de kwast). Met Aanpassing pas je via schuifregelaars de belichting, kleur en scherpte aan. Zo maak je de kleuren warmer, verhoog je het contrast of voeg je extra helderheid toe. Onder Filteren vind je de functie Automatisch verbeteren en een reeks filters waarmee je de uitstraling van je foto in één klik verandert. Denk aan creatieve zwart-witfilters of effecten die je foto een vintage look geven. Pas je een filter toe, dan kun je de intensiteit traploos aanpassen.

Van elke filter kun je de intensiteit aanpassen.

Diashow

Je kunt in Foto’s heel snel een diashow starten. Selecteer in de galerij de gewenste afbeeldingen, klik er met de rechtermuisknop op en kies Diashow starten. De voorstelling begint onmiddellijk. Beweeg de muis naar boven, dan verschijnt een klein bedieningsvenster waarmee je de diashow kunt pauzeren of hervatten.

Via het muzieknootpictogram krijg je extra instellingen. Je kunt animaties of overgangen inschakelen, de voorstelling in een lus laten afspelen en een achtergrondmuziekje kiezen, bijvoorbeeld: Relaxed, Sentimenteel of Beats. Een belangrijke beperking: de diashow is slechts een tijdelijke weergave op het scherm. Je kunt hem dus niet rechtstreeks als videobestand opslaan. Wil je de slideshow later opnieuw bekijken, dan moet je de stappen opnieuw uitvoeren.

Met een klein regelvenster kun je de eigenschappen van de diashow regelen.

Horizonlijn corrigeren

Het komt vaak voor dat je snel een foto maakt en je focust op de persoon op de voorgrond, zonder te merken dat de horizon scheef staat. Dat kun je eenvoudig corrigeren in Foto’s tijdens de nabewerking. Klik op Bewerken en kies daarna Bijsnijden. Onderaan verschijnt een regelaar waarmee je de foto naar links of rechts kunt draaien. Terwijl je dit doet, verschijnt er een raster met hulplijnen, zodat je de achtergrond precies horizontaal kunt uitlijnen.

Door te roteren en rekening te houden met de hulplijnen, plaats je de horizonlijn perfect vlak.

Gelijkenissen zoeken

Wanneer je een afbeelding opent in Foto’s, zie je onderaan naast de knop Tekst scannen ook de optie Visueel zoeken met Bing. Met één muisklik opent Bing zijn afbeeldingzoeker in de browser en krijg je direct vergelijkbare afbeeldingen te zien. Dit is handig om objecten op basis van een foto te identificeren of om webpagina’s te vinden die exact dezelfde foto gebruiken. Je kunt deze zoekopdracht bovendien aanvullen met zoektermen.

Vanuit Foto’s laat je Bing zoeken naar gelijksoortige afbeeldingen op het web
Weergave 1:1 of 100%

Bovenaan zie je een klein knopje dat mogelijk vragen oproept: Werkelijke grootte, herkenbaar aan het pictogram 1:1. Een afbeelding bestaat uit beeldpuntjes, oftewel pixels, net zoals een computerscherm. Wanneer je de afbeelding via deze knop zodanig vergroot dat ieder beeldpuntje van de afbeelding exact overeenkomt met één pixel op het scherm, spreken we van een 1:1- of een 100%-weergave. Deze weergave is belangrijk om de scherpte van de afbeelding goed te kunnen beoordelen. Op het scherm wordt een foto vaak verkleind weergegeven, waardoor je niet kunt voorspellen of hij bij afdruk scherp zal zijn. Als de foto in Werkelijke grootte scherp oogt, kun je ervan uitgaan dat de kwaliteit in orde is.

Nu wordt de afbeelding op 37% getoond, met de knop 1:1 zien we hem op 100%

Info vragen aan Copilot

In de app vind je rechtsboven ook een knop naar Copilot. Daarmee kun je de AI raadplegen om vragen te stellen over de geselecteerde afbeelding. Open een foto, klik op de Copilot-knop en stel bijvoorbeeld de vraag: “Waar is deze opname gemaakt?” Met wat geluk herkent Copilot de omgeving en geeft hij meteen een verklaring waarom hij denkt dat de foto daar genomen is. Interessant is dat Copilot ook nagaat of je de vraag uit pure nieuwsgierigheid stelt of omdat je van plan bent de plek daadwerkelijk te bezoeken. In dat laatste geval helpt de assistent je verder met de voorbereiding van de reis.

Copilot geeft uitvoerig toelichting bij deze foto.

Exporteren naar Clipchamp

Selecteer in de Foto’s-galerij de afbeeldingen en video’s die je wilt combineren tot één filmmontage. Klik vervolgens met de rechtermuisknop op de selectie en kies de opdracht Een video maken in Microsoft Clipchamp. Daarmee open je Clipchamp, de gratis video-editor die sinds 2021 eigendom is van Microsoft en standaard wordt meegeleverd met Windows 11. Het programma is de opvolger van de oude Video Editor in Foto’s.

Clipchamp is laagdrempelig in gebruik, maar tegelijk krachtig genoeg om snel aantrekkelijke video’s te maken zonder dat je een professioneel pakket zoals Adobe Premiere nodig hebt. De geselecteerde media worden automatisch toegevoegd aan de map Jouw media in Clipchamp. Het enige wat je nog hoeft te doen, is de clips naar de tijdlijn te slepen, de duur van elke clip in te stellen en eventueel overgangen of effecten toe te voegen.