ID.nl logo
Superefficiënt! Je video ondertitelen of transcriberen met AI
© KHUNKORN
Huis

Superefficiënt! Je video ondertitelen of transcriberen met AI

De introductie van de vraagbaak ChatGPT zorgde een jaar geleden voor een enorme hype, en vormde het startsein voor de lancering van talloze andere op AI gebaseerde producten. Whisper komt uit dezelfde koker als ChatGPT en helpt bij het omzetten van spraak naar tekst, op basis van geavanceerde modellen.

In dit artikel laten we zien hoe je Whisper kunt benutten om een transcriptie of vertaling te maken van een audio- of videobestand. Dat kan online via Google Colab of op je eigen pc.

  • Installeer Whisper via Google Drive
  • Of installeer Whisper op je pc, samen met Python, FFmpeg en PyTorch
  • Download videobestanden
  • Laat Whisper een transcriptie of direct een vertaling maken

Lees ook: Handig: laat je PowerPoint-presentatie realtime vertalen!

Wil je een transcriptie of ondertitels hebben voor bepaalde audio- of videobestanden? Bijvoorbeeld content voor YouTube, opgenomen vergaderingen, een podcast of leerzame video? Dit kan tegenwoordig automatisch én vrijwel foutloos. Het kan natuurlijk al langer, maar er zaten vaak veel missers bij. Dat zie je ook al aan de automatisch gegenereerde ondertitels op YouTube. Het is ook best een uitdaging. De menselijke spraak is erg divers, met veel accenten en dialecten, maar ook verschil in spreeksnelheid en intonatie. Er kunnen bovendien storende achtergrondgeluiden zijn, zoals het verkeer of bouwwerkzaamheden. Een spreker kan onduidelijk overkomen of onzeker zijn. Omdat woorden verschillende betekenissen kunnen hebben, kan ten slotte ook de context onderscheidend zijn.

Zelf een podcast maken?

Een goede microfoon is noodzaak

Geholpen door AI zijn tegenwoordig heel nauwkeurige transcripties mogelijk. Teksten kunnen daarbij ook meteen worden vertaald. Dat laten we zien in dit artikel, waarin we met Whisper (zie kader ‘Wat is Whisper’) aan de slag gaan. We beginnen in de cloud met Google Colab. Daarna maken we vertalingen vanaf een lokale pc. Dit versnelt wellicht je proces en maakt je minder afhankelijk van de cloud.

©bestforbest - stock.adobe.com

Met Whisper kun je gesproken audio omzetten naar tekst.

Wat is Whisper Whisper is een gratis en opensource tool van OpenAI. Deze organisatie ken je wellicht van de vraagbaak ChatGPT of van DALL·E 2, die afbeeldingen kan genereren op basis van een omschrijving. De kracht van Whisper ligt bij het herkennen en omzetten van spraak in audio- en videobestanden. Dit kan voor het Engels en ongeveer honderd andere talen. Je kunt Whisper op je eigen pc installeren. Het programma werkt dan volledig offline. Wel helpt het als je een stevig systeem hebt. Het programma is getraind aan de hand van een grote dataset met veel variaties van menselijke spraak. Mede daardoor kan Whisper nauwkeurige vertalingen maken. Je kunt zelf de omvang van het model kiezen, waarbij een groter model nauwkeuriger is, maar ook fors meer rekenkracht vereist.

1 Benodigdheden

Voor het werken met Whisper heb je niet per se een pc nodig: je kunt cloud computing inzetten. Dat kan – omdat het een Python-project is – zelfs gratis met Google Colab. Daar beginnen we in dit artikel dan ook mee. Wil je niet afhankelijk zijn van een clouddienst, dan kun je Whisper ook lokaal op je pc installeren. De software is namelijk opensource. Voor aanvullende informatie kun je op de GitHub-pagina terecht. Verderop in dit artikel behandelen we een lokale installatie in meer detail. Hiervoor heb je overigens wel een capabel systeem nodig, anders zal het maken van de transcripties erg lang duren. Om het rekenwerk te versnellen, gebruiken we een grafische kaart van Nvidia.

Whisper is opensource en heeft een eigen GitHub-pagina.

2 Verschillende modellen

Je kunt bij het werken met Whisper uit verschillende modellen kiezen, oplopend in omvang. De meertalige modellen heten achtereenvolgens tiny, base, small, medium en large. Als je Whisper gebruikt, moet je één van deze modellen kiezen. Er zijn ook modellen voor alleen het Engels. Deze heten tiny.en, base.en, small.en en medium.en. Hoewel je voor Engels ook gewoon de meertalige modellen kunt gebruiken, zijn deze specifieke Engelstalige modellen wat nauwkeuriger, al merk je dat vooral bij de kleinere modellen tiny.en en base.en. We kiezen in dit artikel steeds voor het medium-model, met voor Engels de .en-versie. Probeer en vergelijk zeker de kleinere modellen als je een minder zwaar systeem of minder tijd hebt.

Er zijn verschillende modellen die invloed hebben op de nauwkeurigheid en snelheid.

3 Google Colab

Je kunt voor weinig geld cpu-kracht in de cloud huren. Voor gpu-kracht betaal je vaak veel meer. Google Colab biedt het allemaal voor niks. In feite is Colab, voluit ‘Colaboratory’, een Python-omgeving in de cloud. Je kunt de omgeving gewoon via een browser benaderen met een gratis Google-account. Door de opmars van grafisch intensieve AI-toepassingen, vaak met Python als basis, is het platform van Google flink in trek. Dat maakt het wat onzeker of deze dienst kan blijven bestaan en gratis blijft. Maar dat geldt voor veel experimentele diensten van de techgigant. Daarom laten we verderop in dit artikel, vanaf stap 10, ook zien hoe je lokaal op je eigen pc kunt werken met Whisper, voor als de stekker eruit gaat.

Google Colab kun je gratis gebruiken met je Google-account.

4 Koppeling Google Drive

We beginnen in Google Drive waar je Colab als app kunt koppelen. Kies daarvoor Nieuw / Meer / Meer apps koppelen. Vul in het zoekveld Google Colaboratory in. Klik op de bewuste app en kies dan Installeren. Na het doorlopen van de stappen is Google Colaboratory gekoppeld aan je Google Drive en kun je het venster sluiten.

Je kunt de app in enkele stappen toevoegen aan je Google Drive.

5 Whisper installeren

Nadat de app is gekoppeld kun je onder Nieuw / Meer direct Google Colaboratory openen. Linksboven kun je de naam van het project (Untitled0.jpynb) veranderen. We maken hier YouTube-demo.jpynb van. Kies in het menu Runtime voor Runtimetype wijzigen. Selecteer onder Hardwareversnelling een gpu. De beschikbaarheid kan variëren. In dit voorbeeld kiezen we T4 GPU. Klik dan op Opslaan. De grafische kracht zal automatisch in ons project worden benut. Plak de onderstaande opdrachten in het tekstvak achter het uitvoerenicoontje en voer het uit. Daarmee worden Whisper en FFmpeg geïnstalleerd. Dit framework zorgt ervoor dat alle denkbare mediabestanden kunnen worden gedecodeerd:

!whisper "energiebesparen.mp4" --model medium

en:

!sudo apt update && sudo apt install ffmpeg

We installeren Whisper en het bekende FFmpeg-framework.

6 Bestand uploaden

We gebruiken enkele bestanden van YouTube (zie kader ‘Bronbestanden voor Whisper’) en geven deze een makkelijke naam om mee te werken, te weten homelab.mp4, zweden.mp4 en energiebesparen.mp4. Om ervoor te zorgen dat je binnen Colab met deze bestanden kunt werken, gaan we ze eerst uploaden. Klik daarvoor op het bestandenicoontje links in Colab. Je kunt de gewenste videobestanden slepen naar het bestandsvenster of uploaden via het uploadicoontje. Zorg er wel voor dat je de originele bestanden ook zelf op je pc hebt. Als je de omgeving verlaat, zal de zogenoemde runtime worden verwijderd. Daarmee verdwijnen ook de geüploade bestanden. Je zult ze de volgende keer opnieuw moeten uploaden. Ook zul je dan overigens weer het correcte runtimetype moeten kiezen en Whisper moeten installeren.

Je kunt mediabestanden uploaden naar Google.

Bronbestanden voor Whisper Je kunt voor Whisper allerlei soorten mediabestanden gebruiken. In dit artikel gebruiken we drie video’s van YouTube met speelduur van zo’n 15 tot 25 minuten. We gebruiken een Engelse video (met Duits accent) van Christian Lempa over zijn Home Lab, een Nederlands vlog van Linda Meijers over wonen in Zweden en een Nederlandse video over het besparen van energie van onze eigen ID.nl waarin meerdere personen aan het woord komen. Via www.x2mate.com downloaden we de YouTube-video’s als mp4-bestand in 720p voor verwerking in Whisper. We hadden eventueel ook alleen de audio in mp3-formaat kunnen downloaden, maar voor de beoordeling is het videobestand met ingebakken audio makkelijker. Whisper maakt namelijk automatisch een ondertitelbestand (in .srt-formaat). Veel videospelers geven dit weer. Hierdoor kun je direct het resultaat beoordelen en eventueel vergelijken met de automatisch gegenereerde ondertitels van YouTube.

7 Transcripties maken

Het is tijd om Whisper aan het werk te zetten met de gekozen videobestanden. Kijk eerst of je Whisper kunt aanroepen met de opdracht !whisper. Je ziet dan ook de optionele parameters. We beginnen met de Engelse video en kiezen het model medium.en. Klik op + Code en voer de onderstaande opdracht in, waarin we zoals je ziet het bestand en het model specificeren:

!whisper "homelab.mp4" --model medium.en

Voor de andere video’s gebruiken we --model medium. Dat is een meertalig model met hoge nauwkeurigheid. De taal zal steeds automatisch worden herkend:

!whisper "zweden.mp4" --model medium

en:

!whisper "energiebesparen.mp4" --model medium

Google had zo’n drie tot zes minuten per video nodig om de transcripties te maken. Na afloop kun je de tekstbestanden downloaden, waaronder het ondertitelbestand (.srt). Vanuit het bestandsvenster kun je alle tekstbestanden downloaden naar je pc.

We zetten Whisper aan de slag om een transcriptie voor de video’s te maken.

8 Vertalingen maken

Wat vaak onderbelicht blijft, is dat Whisper ook tekst kan vertalen. Dat is heel praktisch als je bijvoorbeeld een YouTube-video hebt die internationaal wordt bekeken. Met de opdracht hieronder kun je een Engelstalige transcriptie maken voor een Nederlandstalige video. Het vraagt waarschijnlijk iets meer nabewerking, maar een groot deel van het werk is in ieder geval al voor je gedaan:

!whisper "energiebesparen.mp4" --model medium --task translate --language en

Whisper kan de tekst ook direct voor je vertalen naar bijvoorbeeld het Engels.

9 Resultaat bekijken

De meeste videospelers zullen automatisch ondertitels laten zien als je het ondertitelbestand in dezelfde map zet en ook dezelfde naam geeft als je videobestand. We zien dat de transcripties steeds van hoge kwaliteit zijn. Versprekingen zijn vaak al gecorrigeerd. De video’s zijn ook veel beter te volgen dan met de automatische transcriptie die YouTube zelf aanbiedt. Ook wordt er veel beter en nauwkeuriger gebruikgemaakt van leestekens. Je zult hooguit nog wat kleine aanpassingen willen maken voor bijvoorbeeld enkele woorden die verkeerd zijn geïnterpreteerd. Dat gaat natuurlijk heel eenvoudig in het tekstbestand zelf, maar er zijn ook tools die je voor srt-bestanden kunt gebruiken.

Het ondertitelbestand wordt door veel videospelers direct herkend.

10 Lokale installatie

Een lokale installatie onder Windows is zeker niet lastig, maar er is best wat software vereist om alles te laten werken. Om te beginnen moet je Python downloaden en installeren. Hoewel een wat oudere versie wordt aangeraden, zijn we geen problemen tegengekomen bij gebruik van de meest recente versie 3.12.0. Let er bij de installatie van Python op dat je een vinkje zet bij Add python.exe to PATH. Je kunt Python dan vanuit elke map op de pc aanroepen. Installeer vervolgens ook Git voor Windows. Bij deze installatie kun je alle standaardopties accepteren. Belangrijk is dat Git daarbij ook weer aan het path wordt toegevoegd.

Zorg dat Python wordt toegevoegd aan het path in Windows.

11 Grafische kaart

Heb je een grafische kaart van Nvidia, dan kun je de berekeningen van Whisper flink versnellen, zoals we verderop zullen laten zien. Hiervoor dien je CUDA te installeren. We gebruiken versie 11.8. Selecteer op de downloadpagina Windows met de architectuur x86_64 en selecteer je versie van Windows (doorgaans 10 of 11). De hier gekozen versie van CUDA wordt ook door PyTorch ondersteund, dat we in de volgende stap gaan installeren. Doorloop de installatie. Kies daarbij in het venster Installatieopties voor Aangepast (geavanceerd). Vink vervolgens alle onderdelen uit behalve CUDA. Zo voorkom je dat onder andere de huidige drivers voor je grafische kaart worden vervangen door een oudere versie.

Je hoeft voor dit project alleen CUDA te installeren.

12 FFmpeg installeren

Je hebt voor een lokale installatie ook het framework FFmpeg nodig. Klik op de downloadpagina op het Windows-icoontje en kies Windows builds from gyan.dev. Download het archief (ffmpeg-git-full.7z) en pak het uit met de ingebakken tool van Windows of bijvoorbeeld 7-Zip. Hernoem de map naar ffmpeg en verplaats deze naar de C-schijf. Het bestand ffmpeg.exe bevindt zich dan in C:\ffmpeg\bin. Deze map gaan we aan het path toevoegen. Druk op Windows-toets+R, vul in sysdm.cpl en druk op Enter. Open dan het tabblad Geavanceerd en kies Omgevingsvariabelen. Dubbelklik op Path. In het venster klik je op Nieuw om een pad toe te voegen. Vul dan in: C:\ffmpeg\bin. Bewaar de aanpassingen en herstart je systeem.

We zorgen ervoor dat FFmpeg wordt toegevoegd aan het path.

13 PyTorch

Zet alle videobestanden waarvoor je een transcriptie wil maken in een map. Klik dan in Windows Verkenner rechts op een lege plek in de map en kies Openen in terminal. Als het goed is, kun je nu alle opdrachten uitvoeren voor geïnstalleerde toepassingen, zoals: python --version, ffmpeg en git.

We gaan eerst een recente versie van PyTorch installeren dat nodig is voor Whisper. Ga daarvoor naar de website van PyTorch en kies de opties Stable, Windows, Pip, Python en CUDA 11.8. Kopieer het commando. In dit geval ziet dat er als volgt uit:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

Voer deze opdracht uit in de terminal. Kom je geen problemen tegen, ga dan verder met de volgende opdrachten:

pip3 install setuptools-rust

en:

pip3 install git+https://github.com/openai/whisper.git

De installatie van Whisper is nu als het goed is geslaagd, zodat we in de volgende stap transcripties kunnen gaan maken.

Via de website van PyTorch kun je het commando achterhalen dat nodig is voor de installatie.

14 Whisper starten

De opdrachten voor het maken van de transcriptie verschillen niet van de eerdergenoemde opdrachten in Google Colab:

whisper "homelab.mp4" --model medium.en

of:

whisper "zweden.mp4" --model medium

of:

whisper "energiebesparen.mp4" --model medium

Als CUDA beschikbaar, is zal automatisch de grafische kaart worden gebruikt. Geholpen door een RTX 3080 grafische kaart is de transcriptie voor de video zweden.mp4 met het model medium binnen drie minuten gereed. Dit ligt in lijn met de snelheid via Colab. Heb je geen grafische kaart of geen CUDA? Dan zal de processor worden gebruikt, wat flink veel extra tijd kost (zie kader ‘Grafische kaart sterk aanbevolen’). Je kunt dat zelf ervaren met de optie --device cpu. Dit forceert het gebruik van de processor. Als CUDA wél beschikbaar is, geeft deze opdracht overigens een waarschuwing.

Whisper maakt relatief snel de transcriptie voor de video.

Grafische kaart aanbevolen Transcripties maken met de processor is tijdrovend. Zelfs op een 16-core AMD Ryzen 9 5950X is voor transcriptie van zweden.mp4 ruim twintig minuten nodig. De processor wordt daarbij steeds met zo’n 70 procent belast. Met de RTX 3080 lukt het binnen drie minuten met veel lagere belasting. Een grafische kaart is dus zeker geen overbodige luxe. Dat hoeft geen RTX 3080 te zijn. Er is vooral genoeg VRAM nodig. Een RTX 2060 of RTX 3060 helpt al enorm, maar je zult zeker verschil merken als je een snellere kaart in je systeem prikt. Loop je tegen problemen aan? Je kunt binnen Python controleren of CUDA beschikbaar is. Start daarvoor Python met python. Voer dan na elkaar de volgende opdrachten in. Je krijgt als het goed is True als resultaat: import torch torch.cuda.is_available()

Watch on YouTube
▼ Volgende artikel
🍂 Voorbereiden op de herfst: deze tuintaken doe je in september
© Elena Elisseeva
Huis

🍂 Voorbereiden op de herfst: deze tuintaken doe je in september

Het is september, en dat betekent dat de nazomer ten einde loopt. Het licht wordt zachter, de avonden koeler en veel planten maken zich klaar voor de herfst. Dit is de maand om nog nieuw groen te planten, vaste planten te verjongen en hagen bij te knippen. Ook het gazon, de moestuin en de vijver vragen nu aandacht. Met een paar gerichte klussen zorg je dat je tuin gezond de herfst en winter ingaat.

In dit artikel ontdek je welke tuinactiviteiten je in september mag doen: 🍂 Dit kun je zaaien en planten in september 🍂 Haal de snoeischaar maar tevoorschijn 🍂 Extra snoeitips 🍂 Planten en gras in september 🍂 Blad ruimen 🍂 Werk in de moestuin

Lees ook: Van januari tot en met december: dit doe je elke maand in de tuin

Dit kun je zaaien en planten in september

In september kan er nog veel de grond in. Bosanemonen, herfst- en winterakonieten en cyclamen doen het goed wanneer je ze nu plant, net als groenblijvers die de tuin ook in de koude maanden kleur geven. Koop je een boom, let er dan op dat het blad nog stevig en fris oogt. Een boompje dat al kaal aan het worden is, kun je beter niet planten.
Wie volgend voorjaar een bloemenzee wil, zaait in deze periode korenbloemen, goudsbloemen en klaprozen. Ook vaste planten die al jaren op dezelfde plek staan, kun je nu delen om ze te verjongen. Wil je een groenblijver verplaatsen, dan is dit de juiste tijd: de grond is nog warm genoeg voor de wortels om zich goed te herstellen.

©Leika production

Haal de snoeischaar maar tevoorschijn

Veel planten kun je nu nog een knipbeurt geven. Begin bij kuipplanten die buiten staan, want snoeiwonden genezen beter in de buitenlucht. Ook hagen kun je in september mooi in vorm brengen. Werk van onder naar boven en knip ze licht taps toe, zodat ook de onderste takken voldoende licht krijgen. Geef daarna wat compost zodat de haag sterk de winter ingaat.
Lavendel kort je ongeveer tien centimeter in, de Japanse wijnbes die vrucht heeft gedragen knip je helemaal terug en hortensia's ontdoe je van de stugge bloemen. Bij bomen en struiken verwijder je aangetast blad. Daarnaast is het slim om wekelijks uitgebloeide bloemen van dahlia's, rozen en andere zomerbloeiers weg te knippen. Zo blijft de tuin verzorgd en verklein je de kans op ziektes.

©SKT Studio

Extra snoeitips

Kies voor een droge dag, zonder felle zon en zonder dreigende vorst. Snoei net boven een knop. Wijst die naar binnen, dan groeit de nieuwe tak ook die kant op. Een knop die naar buiten wijst zorgt ervoor dat de tak zich die richting op ontwikkelt.

Lees ook: Welke snoeischaar voor welke tuinklus?

Planten en gras in september

Sommige planten hebben juist nu extra zorg nodig. Camelia's en rododendrons vormen in september hun knoppen voor volgend jaar en hebben daarom voldoende water nodig. Tweejarige planten zoals vingerhoedskruid kun je verplaatsen naar een nieuwe plek in je tuin. Hoge bloeiers als zonnebloemen, dahlia's en herfstasters geef je steun, zodat ze niet bezwijken onder de eerste herfststormen.
Het gazon vraagt een andere aanpak dan in de zomer. Maai het gras wat hoger en zaai waar nodig bij. Verticuteer eerst om mos en dood gras te verwijderen. Kies een zaadmengsel dat past bij zon of schaduw, afhankelijk van de ligging van je tuin. Heb je in augustus niet bemest, dan is dit hét moment om dat alsnog te doen. Vul kuilen aan en houd je terras vrij van onkruid en mos.

Blad ruimen

In september beginnen bomen hun bladeren te verliezen. Laat ze niet liggen op het gazon, want daardoor krijgt het gras te weinig lucht en licht en kunnen schimmels ontstaan. Ook in de vijver kan blad problemen geven doordat het zuurstofgehalte van het water afneemt. Houd daarom gazon, terras en vijver zoveel mogelijk bladvrij.

Werk in de moestuin

Ook in de moestuin valt er nog genoeg te doen. Boontjes moeten tijdig worden geplukt om taaie peulen te voorkomen. Tomaten die nog groen zijn leg je op een zonnige plek zodat ze verder kunnen rijpen. September is ook de maand van de appel- en perenoogst. Maak er compote, sap of een taart van, of bewaar ze op een koele plek. Verder kun je winterpostelein en raapstelen zaaien, zodat je later in het seizoen nog kunt oogsten.

Mooie appeloogst?

Tijd voor appeltaart!
▼ Volgende artikel
Bookmarks beheren en doorzoeken met Hoarder
© adragan
Huis

Bookmarks beheren en doorzoeken met Hoarder

Wil je wat orde brengen in je verzameling bookmarks? Het zelf te hosten Hoarder is hiervoor een mooie optie. Bookmarks, maar ook notities, afbeeldingen en ideeën kun je in overzichtelijke lijsten opslaan, die je van labels kunt voorzien en doorzoeken. Zelfs grotere verzamelingen zijn geen probleem, dankzij de optionele AI-functies. Deze benutten de API van OpenAI. In dit artikel lees je hoe je alles opzet!

Dit artikel in het kort

In dit artikel leer je hoe je Hoarder installeert, instelt en gebruikt om je bookmarks, notities en afbeeldingen te beheren. We laten zien hoe je AI inzet om automatisch labels en samenvattingen te maken. Ook komen handige functies aan bod zoals zoeken, lijsten maken en hoogtepunten markeren.

Lees ook: Bladwijzers onder controle: de beste bookmarkmanagers op een rij

Voor het bewaren van bookmarks bestaan diverse handige toepassingen, waaronder Pocket (https://www.getpocket.com) en het minder bekende Raindrop.io (https://www.raindrop.io). Het relatief jonge Hoarder mag in het lijstje naar onze mening niet ontbreken. Hierin kun je onder meer bookmarks, notities en afbeeldingen bewaren, waarna je de volledige inhoud kunt doorzoeken. Ook kun je items organiseren door labels toe te voegen of lijsten te maken. Dankzij de optionele koppeling met OpenAI kun je materiaal automatisch van labels voorzien, maar ook bijvoorbeeld vragen om een artikel samen te vatten. Je kunt Hoarder volledig zelf hosten. Dit geeft je meer controle en maakt het privacyvriendelijk. Voor de installatie kun je onder meer Docker Compose gebruiken, wat we ook in dit artikel doen. Er zijn browserextensies voor Chrome en Firefox, wat het toevoegen van artikelen op internet met de gewenste labels veel makkelijker maakt. Verder zijn er mobiele apps voor Android en iOS, zodat je ook onderweg je bookmarks kunt raadplegen. 

1 Installatie

Er zijn meerdere installatiemethoden, die in de documentatie uitgebreid aan bod komen (https://docs.hoarder.app). De aanbevolen installatiemethode is via Docker Compose, waar we ook hier voor kiezen. De installatie van Docker Compose is vaker behandeld en ook online vind je diverse handleidingen, zoals voor Ubuntu 24.04 (https://www.kwikr.nl/ubntdock).

In de volgende stappen gaan we de bestanden docker-compose.yml en .env maken. We raden een systeem met ongeveer 2 GB werkgeheugen aan. Ook als je Hoarder binnen een container in Proxmox VE gaat installeren, moet je zoveel toewijzen, want 1 GB is net te weinig. Log in via SSH, maak een mapje voor Hoarder en navigeer naar deze map. Hierin gaan we de bestanden voor Docker plaatsen.

In de documentatie vind je diverse installatiemethoden voor Hoarder.

2 Docker

De snelste manier om te starten, is het downloaden van het YAML-bestand voor Docker Compose. Geef daarvoor de onderstaande opdracht vanaf de Opdrachtprompt:

wget https://raw.githubusercontent.com/hoarder-app/hoarder/main/docker/docker-compose.yml

Het bestand voor Docker Compose hoef je niet aan te passen. Wel is een bestand met omgevingsvariabelen nodig. Dit bestand kun je maken en bewerken met de opdracht nano .env. Zet hierin om te beginnen de volgende regels:

HOARDER_VERSION=release
NEXTAUTH_SECRET=super_random_string
MEILI_MASTER_KEY=another_random_string
NEXTAUTH_URL=http://localhost:3000

Bij NEXTAUTH_URL kun je localhost vervangen door het ip-adres van het systeem waarop Hoarder draait. De twee willekeurige strings kun je zelf bedenken of genereren met deze opdracht:

openssl rand -base64 36

Start ten slotte de container met:

docker compose up -d

Je kunt Hoarder nu openen via http://ipadres:3000, waarbij je ipadres dan vervangt door het echte ip-adres van het systeem. Bij toekomstige updates kun je Hoarder stoppen met:

docker compose down

Daarna kun je met deze opdracht de images vernieuwen:

docker compose pull

Om vervolgens met deze laatste opdracht alles weer in de lucht te brengen:

docker compose up -d

Via een bestand kun je enkele omgevingsvariabelen opgeven voor Hoarder.

3 Toegang OpenAI

Het is niet verplicht om de AI-functies te gebruiken, maar het is wel een leuke en nuttige toevoeging, zeker als je veel bookmarks gaat toevoegen. De kosten zijn bovendien zeer laag. Voor de meeste mensen is OpenAI de beste keuze, hoewel Ollama ook een optie is (zie kader 'Keuze tussen OpenAI of Ollama'). Om OpenAI te gebruiken, moet je toegang tot de API regelen. Hiervoor ga je naar https://platform.openai.com. Log in met een bestaand account, zoals het account dat je voor ChatGPT gebruikt, of maak een nieuw account. Ga dan naar https://www.kwikr.nl/oakey en kies Create new secret key. Vul bij Name een beschrijvende naam in, zoals Hoarder. Dit maakt de sleutel beter herkenbaar, mocht je deze in de toekomst willen verwijderen. Kies bij Project de optie Default project. Klik dan op Create secret key. De sleutel wordt nu gemaakt en slechts eenmalig getoond; bewaar deze dus goed! Open dan het bestand .env en voeg de volgende regel toe:

OPENAI_API_KEY=sleutel

Herstart nu Hoarder zodat de nieuwe configuratie actief wordt. Blijf nog even in de omgeving van OpenAI, want we moeten wat credits aanschaffen.

Maak een API-sleutel aan voor toegang tot OpenAI.

Keuze tussen OpenAI of Ollama

Om gebruik te maken van de AI-functies van Hoarder kun je naar voorkeur OpenAI gebruiken of een lokale installatie van Ollama met een groot taalmodel. Kies je voor OpenAI, dan wordt standaard het model GPT4o-mini gebruikt, dat naar schatting ongeveer 8 miljard parameters heeft. Wil je Ollama gebruiken, dan zijn (afhankelijk van je hardware) de kleinere modellen Gemma 3 met 1 miljard parameters (1b) en DeepSeek R1 met 1,5 miljard parameters (1.5b) goede opties.

Voor de meeste mensen zal OpenAI de meest logische keuze zijn. Het is veel eenvoudiger op te zetten en werkt meestal sneller en nauwkeuriger. Bovendien blijven de kosten zeer laag. Tijdens het maken van dit artikel daalde het saldo maar met enkele centen. Volgens Hoarder zelf kun je voor minder dan $1 ongeveer 3000 bookmarks van labels voorzien of ruim 1000 afbeeldingen laten analyseren.

4 Credits aanschaffen

Je hebt credits nodig om met de OpenAI-API te werken. Dit gebruik staat los van een eventueel abonnement op ChatGPT. Ga hiervoor naar Billing of rechtstreeks via https://www.kwikr.nl/oabill. De eerste keer moet je een betaalmethode toevoegen via Add payment details. Vul hier je creditcardgegevens in. Klik daarna op Continue. Begin met een klein bedrag, bijvoorbeeld 10 dollar. Dit is waarschijnlijk meer dan je ooit nodig zult hebben voor Hoarder. De optie voor automatisch opwaarderen, kun je daarom het best uitzetten, om risico's te beperken. Bevestig ten slotte de betaling.

Desgewenst kun je limieten configureren. Naast Hoarder zijn er overigens ook steeds meer andere toepassingen die de API van OpenAI kunnen gebruiken. Dat maakt de inzetbaarheid dus een stuk breder! Denk aan chatbots, schrijfhulpjes en automatiseringstools. Het is handig om voor elk project een aparte API-sleutel te maken, om het beheersbaar te houden.

Voeg wat credits toe, zodat je de API van OpenAI kunt gebruiken.

5 Registratie

We beginnen met het maken van een beheeraccount. Open daarvoor Hoarder door in je browser naar http://ipadres:3000 te gaan. Ga op het inlogscherm naar Sign up om een eerste account te maken. Dit eerste account krijgt altijd beheerrechten (administrator). Wil je Hoarder in het Nederlands gebruiken, klik dan op je profielicoontje rechtsboven, ga naar User Settings en kies achter Options bij Interface Language voor Dutch. Alles is nu in het Nederlands. In het vervolg gaan we Hoarder in deze taal gebruiken.

Via de instellingen kun je Hoarder op het Nederlands instellen.

 6 Gebruikers beheren

Je krijgt als beheerder speciale functies die je ziet als je via je profielicoontje naar Admin Instellingen gaat. Zo kun je onder Gebruikerslijst nieuwe gebruikers toevoegen met de gewenste rol. Als beheerder kun je bovendien het wachtwoord voor gebruikers opnieuw instellen. Als je echter als beheerder je wachtwoord kwijtraakt, is dat ingewikkelder omdat je dit via de database moet doen. Bewaar het wachtwoord dus goed!

Gebruikers kunnen zich bij de standaardinstellingen overigens ook aanmelden via het inlogscherm. Wil je dat voorkomen, voeg dan de volgende regel aan het bestand .env toe:

DISABLE_SIGNUPS=true

Herstart Hoarder met deze opdracht, zodat de nieuwe configuratie actief wordt:

docker compose up -d

Je kunt als beheerder eenvoudig extra gebruikers toevoegen.

7 Instellingen

We zullen kort enkele instellingen doornemen. Klik daarvoor op je profielicoontje en ga naar Gebruikersinstellingen. Onder AI Instellingen zie je een preview van de prompts die worden gebruikt voor de verschillende AI-mogelijkheden, zoals het genereren van labels en maken van samenvattingen.

Je kunt hier extra regels aan toevoegen, zodat de prompts worden aangepast. Zo kun je bijvoorbeeld voor Nederlandstalige labels en samenvattingen zorgen (zie kader 'Nederlandse labels en samenvattingen').

Onder RSS Abonnementen kun je RSS-feeds toevoegen. Verder kun je bookmarks exporteren als JSON-bestand of importeren vanuit diverse andere toepassingen, waaronder Pocket, Linkwarden (waar we eerder in Computer!Totaal over schreven) of je browser (zoals Chrome en Firefox). Ook alle links die je al in je browser hebt bewaard, kun je dus gemakkelijk overzetten naar Hoarder. Verder kun je sleutels maken voor de API van Hoarder, defecte links bekijken en webhooks aanmaken.

Via de instellingen kun je bookmarks exporteren of importeren.

Nederlandse labels en samenvattingen

Je kunt AI forceren om Nederlandse labels en samenvattingen te maken, onder Gebruikersinstellingen / AI Instellingen. Daarvoor moet je bovenaan extra regels toevoegen. Elke regel bevat de extra prompttekst en de prompt waaraan dit moet worden toegevoegd. Kies bijvoorbeeld Alle tags voor alle prompts voor het maken van labels of Samenvatting voor de samenvattingenprompt. Toegevoegde regels verschijnen meteen in de preview onderaan. De prompts vragen standaard om Engelse labels en samenvattingen. Om dit te 'vernederlandsen' zul je dus heel expliciet moeten zijn, zoals in deze regel voor Alle tags. Hierin vragen we ook om generieke termen naar kleine letters om te zetten:

The tags language must be in dutch. Convert generic terms to lowercase. Keep casing intact for anything that's a proper noun, brand, acronym or product.

Verder voegen we deze regel toe aan de prompt voor Samenvatting, waarbij we heel expliciet aangeven dat de samenvatting in het Nederlands moet zijn.

The summary language must be in dutch even if told otherwise! Remove all English!

Je kunt uiteraard experimenteren met deze instellingen. Om het in actie te zien kun je alle huidige AI-labels opnieuw laten genereren. Hiervoor ga je naar Admin Instellingen / Acties.

8 Bookmarks toevoegen

Op de openingspagina van Hoarder zie je de laatste toegevoegde bookmarks. Je kunt nieuwe items toevoegen via het vak. Je kunt hier ook afbeeldingen naartoe slepen, waarvan de tekst via OCR wordt omgezet, zodat dit (ook) doorzoekbaar wordt. Verder krijgen afbeeldingen en ook teksten die je toevoegt automatisch labels door AI.

In het menu (met de drie puntjes) zie je extra opties. Zo kun je een bookmark markeren als favoriet of deze toevoegen aan een of meerdere lijsten, die je via het menu aan de linkerkant kunt aanmaken en beheren. Om de inhoud en details voor een bookmark te bekijken, klik je op het icoontje met twee pijltjes voor een grotere weergave.

Ook toegevoegde afbeeldingen worden automatisch van labels voorzien door AI.

Voor je papieren boeken

De mooiste boekenleggers

9 Details bekijken

Als je de details voor een bookmark opent, zie je links een voorbeeld met de content uit de cache en een optie om de gemaakte schermopname te bekijken. Rechts kun je via Samenvatten met AI een samenvatting laten maken door AI. Ook zie je hier de labels die door jouzelf of AI zijn toegevoegd. Verder zie je een vak om een notitie te schrijven en enkele extra opties. Onderaan kun je de bookmark opslaan als favoriet, archiveren of verwijderen.

Met de hulp van OpenAI kun je een automatische samenvatting maken.

Extensies voor Chrome en Firefox

Hoarder heeft extensies voor de browser Chrome en Firefox. Na het toevoegen van de extensie geef je eenmalig het serveradres op en je accountgegevens. Als je een interessant artikel tegenkomt, hoef je alleen op het icoontje van Hoarder te klikken. De labels worden via AI automatisch toegevoegd, al kan dit wel enkele seconden duren, en soms iets langer, maar je hoeft hier niet op te wachten. Via het venster kun je zelf nog labels toevoegen of het artikel aan een lijst toevoegen.

10 Hoogtepunten

Een handige extra mogelijkheid is de zogenoemde hoogtepunten. Hierbij open je eerst de grotere weergave voor de bookmark. In het voorbeeld links kun je nu een stuk tekst selecteren. Vervolgens kies je een passende kleur (geel, rood, groen of blauw). Hierna wordt automatisch een zogenoemd hoogtepunt opgeslagen. Je ziet deze rechts bij de details. Als je via het menu van Hoarder naar Hoogtepunten gaat, zie je alle gemaakte hoogtepunten. Via Source kun je ook het gerelateerde artikel opvragen. Hoogtepunten zijn een handige manier om belangrijke details van artikelen te bewaren.

Hoogtepunten helpen je om belangrijke details van items te bewaren.

11 Zoeken

Wat Hoarder zo krachtig maakt, is dat je de volledige tekst van alle opgeslagen inhoud kunt doorzoeken via de balk aan de bovenkant. Dat gaat niet alleen om titels of beschrijvingen, maar ook om de volledige inhoud van de opgeslagen links en notities.

Je kunt in je zoekopdracht ook filters gebruiken. Met is:fav zoek je bijvoorbeeld alleen binnen je favorieten, het filter is:tagged zoekt naar items die een of meer labels hebben en is:inlist zoekt naar items die in een of meerdere lijsten zijn opgenomen.

Met #label kun je naar een bepaald label zoeken. Merk op dat labels hoofdlettergevoelig zijn. De labels Technologie en technologie worden daardoor als afzonderlijke labels beschouwd. Dit vraagt dus enige zorgvuldigheid bij het invoeren van labels. Dit kun je wel afvangen door de prompts voor AI aan te passen, zoals we hebben uitgelegd.

Behalve via de zoekfunctie kun je uiteraard ook via de toegekende labels bepaalde items terugvinden. Hiervoor ga je naar Labels. Je kunt hier de labels die op elkaar lijken desgewenst samenvoegen. Daarvoor klik je eerst op Drag & Drop Samenvoegen. Daarna sleep je een label naar een ander label.

Met de krachtige zoekfunctie kun je alle inhoud gemakkelijk doorzoeken.

Toegang van buitenaf met de app

Je kunt Hoarder prima alleen op je lokale netwerk gebruiken, wat ook het veiligst is. Maar zeker als je ook de apps gaat gebruiken, is het praktisch om toegang onderweg mogelijk te maken, buiten je lokale netwerk. Zet in dat geval wel de registratiemogelijkheid voor gebruikers uit. Een goede optie is het opzetten van een VPN-verbinding, waarmee je meteen ook alle andere toepassingen in je netwerk kunt gebruiken. Maar je kunt ook een reverse-proxy opzetten. Gebruik bijvoorbeeld Nginx Proxy Manager om al je hosts via een browser te beheren. Of werk met het wat complexere Traefik en voeg labels toe binnen Docker. De app is vooral nuttig voor het 'consumeren' van content, omdat je binnen de app heel snel toegang tot al je bookmarks en lijsten hebt.