ID.nl logo
Paperless-ngx: zoek en gij zult vinden
© ImageFlow - stock.adobe.com
Huis

Paperless-ngx: zoek en gij zult vinden

Wil je orde scheppen in je verzameling documenten, zoals je administratie, polissen of handleidingen? Of heb je nog een stapel dossiers om door de scanner te halen voor een digitaal archief? Paperless-ngx is een van de mooiste toepassingen hiervoor, met uitgebreide zoek- en indexeringsmogelijkheden. Het is geschikt voor pdf-bestanden, biedt tekstherkenning met OCR en kan met nog veel meer bestandsformaten overweg.

In dit artikel laten we zien hoe je met Paperless-ngx je documenten kunt digitaliseren, doorzoeken en beheren:

  • Installeer Paperless-ngx via Docker Compose op je eigen systeem of NAS
  • Pas de ingestelde mappen en netwerkpaden aan in het docker-compose.yml-bestand
  • Start de containers, maak een superuser aan en log in op je dashboard
  • Upload documenten via drag-and-drop of plaats ze in de consume-map
  • Wijs documenten een type, correspondent en labels toe voor slimme filtering
  • Bewerk documenten handmatig of in bulk om metadata aan te vullen
  • Sla veelgebruikte filters op voor snel hergebruik

Lees ook: Zoek de verschillen! Zo ontdek je snel of de inhoud van jouw mappen écht hetzelfde is

Hoewel je je administratie, polissen of handleidingen netjes in mapjes kunt bewaren, zul je soms het overzicht missen, en anders wel een goede zoekfunctie. Een documentbeheersysteem als Paperless-ngx kan een heel goede hulp zijn. Het maakt het indexeren en doorzoeken van documenten veel eenvoudiger. Er is ondersteuning voor uiteenlopende bestandsformaten, waaronder natuurlijk pdf-bestanden, maar ook Office-documenten en afbeeldingen. Zo kun je het nóg flexibeler inzetten. Je kunt documenten organiseren en indexeren op documenttype of met de hulp van labels. Dankzij OCR (Optical Character Recognition) kan tekst in documenten worden herkend en doorzoekbaar gemaakt.

De software is opensource en kent een vrij lange geschiedenis. Voor de oorsprong van Paperless-ngx moeten we terug naar 2015. De Britse softwareontwikkelaar David Quinn zette toen het Python-project Paperless op voor persoonlijk gebruik, maar het ging aan zijn eigen populariteit ten onder. Het leverde meer dan 500 forks op (!), waarvan Paperless-ng de voornaamste versie was. Die bracht veel veranderingen en een flink vernieuwde gebruikersinterface. Ook dit project kreeg een opvolger, genaamd Paperless-ngx (Next Generation eXtended), dat nu door de gemeenschap wordt onderhouden.

In dit artikel laten we zien hoe je Paperless-ngx kunt installeren en gebruiken. Je kunt het systeem zelf hosten, bijvoorbeeld via Docker Compose. Dat maakt het privacy-vriendelijk. Voor het beheer is alleen een browser nodig.

1 Wat heb je nodig?

Paperless-ngx, of kortweg Paperless, is een relatief licht programma. Het kan genoeg kan hebben aan een Raspberry Pi, maar het heeft wel baat bij een krachtiger systeem. Dat zal in ieder geval de verwerkingstijd aanzienlijk verkorten.

Zorg in elk geval voor betrouwbare opslag en een back-upstrategie. Qua database kun je kiezen uit SQLite, MariaDB (MySQL) en PostgreSQL. Voor licht gebruik op Raspberry Pi of NAS heeft SQLite de voorkeur. Maar voor intensief gebruik of een krachtiger systeem is PostgreSQL geschikter en dat is ook de aanbevolen keuze voor nieuwe installaties. Voor aanvullende informatie kun je terecht op GitHub of raadpleeg je de documentatie.

Raadpleeg de website van Paperless voor meer informatie.

2 Installatie

De aanbevolen installatiemethode is via Docker Compose. De installatie van Docker en Docker Compose is vaker aan bod gekomen. Online vind je ook gidsen, zoals voor Ubuntu 24.04.

Voor Paperless zijn twee bestanden nodig: docker-compose.yml en docker-compose.env. Je kunt via deze website voorbeelden downloaden. Het .yml-bestand beschrijft de containers en het .env-bestand bevat enkele omgevingsvariabelen.

Paperless-ngx kan samenwerken met Apache Tika, als je een van de Docker Compose-voorbeelden met -tika in de naam gebruikt. Tika is een opensource-bibliotheek voor de analyse van documenten en tekstextractie uit die documenten. Als je deze variant kiest, kun je veel meer bestandsformaten lezen en converteren naar pdf (via een tool genaamd Gotenberg), zodat je ze vervolgens kunt gebruiken binnen het documentbeheersysteem. Dit gaat onder meer om de bekende Office-documenten (Word, Excel en PowerPoint), e-mailberichten en zip-bestanden.

Tika is overigens niet nodig als je alleen tekst uit pdf-bestanden wilt halen. Daarvoor wordt standaard Tesseract OCR gebruikt. Via deze GitHub-pagina vind je varianten voor de verschillende databases, en met of zonder Apache Tika.

Wij kiezen docker-compose.postgres-tika.yml als basis en het standaard bestand docker-compose.env. In beide bestanden gaan we in de volgende paragrafen nog aanpassingen maken.

Gebruik een van de bestanden voor Docker Compose als voorbeeld.

3 Aanpassen compose-bestand

In je docker-compose.yml zie je een opsomming van alle containers. Dat zijn bij onze setup broker, db, webserver, gotenberg en tika. Hierin zul je wellicht enkele aanpassingen willen maken. We beginnen onder volumes: waar je verwijzingen naar de belangrijkste mappen ziet:

- data:/usr/src/paperless/data
- media:/usr/src/paperless/media
- ./export:/usr/src/paperless/export
- ./consume:/usr/src/paperless/consume

Standaard wordt de lokale map ./consume gebruikt, die wordt aangemaakt als deze nog niet bestaat. Het programma wacht geduldig op nieuwe documenten die in deze map worden geplaatst, bijvoorbeeld handmatig of via een netwerkscanner. Je kunt de map eventueel aanpassen, zodat in plaats van de lokale map bijvoorbeeld een mount naar een NAS wordt gebruikt, bijvoorbeeld:

- /mnt/nas/temp/Scans:/usr/src/paperless/consume

Paperless verwerkt bestanden in de genoemde map automatisch en verplaatst ze naar media (hier een Docker-volume) waar je handmatig een back-up voor kunt maken (zie kader ‘Back-ups maken van je documenten’).

Een laatste aandachtspunt is de standaardpoort (8000) voor de webserver onder ports:. Bij een potentieel conflict kun je dit aanpassen zodat op de host bijvoorbeeld 8010 wordt gebruikt:

- 8010:8000

We maken enkele aanpassingen in het bestand voor Docker Compose.

Back-ups maken van je documenten

Het is raadzaam een back-up van je documenten te bewaren. Paperless biedt hiervoor meerdere opties. Ten eerste kun je documenten exporteren. De export omvat alle relevante gegevens, waaronder de documenten zelf, thumbnails, metagegevens en inhoud van de database. Hiervoor geef je in de map met Paperless de volgende opdracht: docker compose exec -T webserver document_exporter ../export

Bij Docker kun je ook kiezen om een back-up van de volumes te maken. Deze vind je op de meeste systemen onder /var/lib/docker/volumes. De belangrijkste voor de hier besproken setup zijn paperless_media met alle documenten en paperless_pgdata met de PostgreSQL-database.

4 Aanpassen variabelen

Het bestand docker-compose.env bevat optionele omgevingsvariabelen. We maken hier enkele aanpassingen in. Je kunt het gedownloade bestand als uitgangspunt nemen. Voor de regels die je gaat gebruiken moet je uiteraard het commentaarteken (#) weghalen. Eerst stellen we de correcte tijdzone in:

PAPERLESS_TIME_ZONE=Europe/Amsterdam

Verder geven we aan wat de primaire taal is voor het verwerken van documenten met OCR. Als alle documenten in het Nederlands zijn, gebruik je:

PAPERLESS_OCR_LANGUAGE=nld

Heb je documenten in meerdere talen, bijvoorbeeld Nederlands en Engels? Dan kun je die zoals hieronder combineren. Bij verwerking met OCR wordt nu gezocht naar een match met Nederlands of Engels. Dit vraagt wel meer verwerkingskracht.

PAPERLESS_OCR_LANGUAGE=nld+eng

Standaard zijn alle taalbestanden voor Engels, Duits, Italiaans, Spaans en Frans geïnstalleerd. De Nederlandse taal moet nog wel expliciet worden geïnstalleerd. Daarvoor gebruik je de volgende omgevingsvariabele:

PAPERLESS_OCR_LANGUAGES=nld

Merk op dat je Paperless als rootgebruiker moet uitvoeren om die laatste regel te kunnen gebruiken.

We passen via de omgevingsvariabelen wat opties aan voor OCR.

5 Container starten en updaten

Voordat je de container start, is het handig om eerst alle gebruikte images voor de containers op te halen met:

docker compose pull

Je hebt een zogenoemde superuser nodig om in te kunnen loggen. Die kun je maken met:

docker compose run --rm webserver createsuperuser

Er wordt om een gebruikersnaam, e-mailadres en wachtwoord gevraagd. Vul eventueel tijdelijk een eenvoudig wachtwoord in, wat je later kunt aanpassen. Start daarna de container met:

docker compose up -d

Updates voor Paperless kun je eenvoudig installeren door eerst de nieuwe images op te halen met:

docker compose pull

Vernieuw daarna de container met:

docker compose up -d

Wil je iets wijzigen? Stop dan eerst de container met:

docker compose down

Start daarna de container met de nieuwe configuratie.

Via enkele opdrachten kun je images vernieuwen of de containers starten.

6 Dashboard

Je kunt nu via http://ipadres:8000 (of het door jou aangepaste poortnummer) inloggen bij Paperless. Gebruik het account dat je hiervoor hebt aangemaakt. Je komt dan in het dashboard. Op je dashboard zie je een knop om de rondleiding te starten. Dit geeft een indruk van de belangrijkste opties binnen Paperless.

Als je rechtsboven op je naam klikt en naar Mijn profiel gaat, kun je eventueel je wachtwoord veranderen naar een sterker wachtwoord of je gegevens aanvullen. Ook kun je hier optioneel tweestapsverificatie aanzetten, waarvoor je een app als Google Authenticator of Aegis kunt gebruiken. Deze extra beveiliging is vooral aanbevolen als je gevoelige informatie gaat uploaden, zoals je administratie of garantiebewijzen.

Je komt na het inloggen in je dashboard, waar je een rondleiding kunt starten.

Paperless-AI

Paperless-ngx heeft zelf geen echte AI-opties. Dat is jammer, want omdat een groot taalmodel vaak uitblinkt in het verwerken van tekst, zou het goed kunnen helpen bij bijvoorbeeld het indexeren van documenten of het voeren van conversaties over de inhoud. Met Paperless-AI is er een losstaand initiatief dat je voor dit doel kunt gebruiken in combinatie met Paperless-ngx. Zo kun je bijvoorbeeld automatisch labels toevoegen, het documenttype bepalen en vragen over documenten stellen. Je kunt OpenAI of Ollama gebruiken als backend voor AI.

7 Document toevoegen

We voegen om te beginnen een document toe in de vorm van een pdf-bestand. Dat kan op meerdere manieren. Om te beginnen zie je op je dashboard een vak voor uploads waar je via Selecteren een of meerdere bestanden kunt kiezen. Maar je kunt de bestanden ook naar dat vak slepen of gewoon naar een willekeurige pagina in Paperless in de browser. Een andere manier is om ze in de consume-map te plaatsen. Als je een scanner gebruikt, kun je ervoor zorgen dat de scanner ze zelf in die map zet.

Na het uploaden wordt het bestand verwerkt. Op je dashboard zie je een melding van verwerkte documenten. Ook worden de gegevens bij Statistieken bijgewerkt. Als voorbeeld hebben we enkele handleidingen toegevoegd, inclusief enkele gescande documenten.

Via de beheerdersomgeving kun je documenten uploaden.

8 Gegevens voor documenten

Normaal ben je wellicht gewend om bestanden in mapjes onder te verdelen. In Paperless werkt dat anders, maar ben je wel veel flexibeler, omdat je allerlei details kunt invullen waar je vervolgens op kunt filteren. De belangrijkste details zijn documenttype, correspondent en labels.

Via het documenttype geef je aan wat voor soort document het is, zoals een contract, factuur, handleiding of polis. Een correspondent is in feite de afzender of partij die het document heeft verstuurd, zoals KPN bij een telefooncontract. Met labels kun je vrijelijk verdere details verstrekken om op te filteren. Tijdens het bewerken van een document kun je onder andere nieuwe labels toevoegen, maar je kunt ze ook beheren via de opties in het menu onder Beheren.

Je kunt allerlei informatie toevoegen in de vorm van labels.

9 Documenten bewerken

Als je naar Documenten gaat, zie je de toegevoegde documenten die je individueel of in bulk kunt bewerken. Hoewel tekst bijvoorbeeld al doorzoekbaar is, is het zinvol om gegevens van documenten aan te vullen. Onder elk document zie je opties om deze te openen, een preview te bekijken of te downloaden.

Open eerst een document. Je ziet rechts een voorbeeld en links kun je gegevens aanpassen. Op het tabblad Details kun je correspondenten, documenttypes en labels kiezen. Gebruik het plusteken voor nieuwe details, zoals een nieuw label. Verder kun je een serienummer voor je archief opgeven, wat je kan helpen om het makkelijker terug te vinden. Merk op dat je in de navigatiekolom steeds een lijst met documenten ziet die momenteel zijn geopend voor bewerking.

Je kunt per document gegevens toevoegen.

10 Zoeken en filteren

Heb je een aantal documenten bewerkt, dan kun je wat beter de zoek- en filteropties gaan verkennen onder Documenten. Bovenaan kun je uit drie weergavestijlen kiezen: als lijst, of als kleine of grote kaart. Via de zoekbalk kun je de titel of inhoud van de tekst doorzoeken. En via filters kun je bijvoorbeeld bepaalde documenttypen of labels zichtbaar maken, of een datumbereik kiezen.

Heb je bijvoorbeeld voor handleidingen het documenttype handleiding gebruikt en het label camera voor camerahandleidingen, dan kun je deze via dit documenttype en label eenvoudig boven water halen. Je kunt ook labels uitsluiten, bijvoorbeeld: alle documenten met het label camera, maar niet met het label drone. Wil je terug naar een weergave met alle documenten, dan kies je Filters terug zetten.

Via filters kun je in detail de gewenste documenten naar voren halen.

11 Weergave opslaan

Een combinatie van filters kun je handig als een zogenoemde weergave opslaan. Stel dat je de camerahandleidingen vaak nodig hebt. Dan maak je de selectie zoals in de vorige stap. Daarna kies je rechtsboven voor Weergaven en vervolgens Opslaan als. Vul nu een naam in voor de weergave en vink naar voorkeur de opties Toon in de zijbalk en Toon op het dashboard aan, om hier nog sneller toegang toe te krijgen.

Een weergave kun je opslaan als je die vaker nodig hebt.

12 Foutmeldingen oplossen

We liepen bij één document tegen een foutmelding aan bij het renderen door Ghostscript. Dit komt omdat het gerelateerde OCRmyPDF strikter is geworden in hoe het omgaat met renderfouten bij conversies. Als Ghostscript een fout tegenkomt, zal OCRmyPDF de verwerking stoppen. Wil je dat het doorgaat met een mogelijk onbetrouwbaar resultaat? Dan kun je een aanpassing in het bestand docker-compose.yml maken. Voeg bij de container genaamd webserver, onder het kopje environment, de volgende regel toe:

PAPERLESS_OCR_USER_ARGS: '{"continue_on_soft_render_error": true}'

Dit heeft in onze situatie het probleem verholpen. Merk op dat Paperless het originele document standaard ook behoudt. Importproblemen kun je overigens terugzien onder Bestandstaken en foutmeldingen zie je onder Logbestanden. Ook kun je de logs via Docker bekijken. Met docker ps zie je een lijst met actieve containers. Geef daarna de opdracht docker logs gevolgd door de ID of naam van de container, bijvoorbeeld:

docker logs paperless-webserver-1

Heb je een ander probleem? Paperless heeft op de website een sectie met mogelijke problemen en oplossingen.

Via de opdrachtprompt kun je uitgebreide logbestanden bekijken.

Geavanceerde mogelijkheden

Er zijn nog enkele geavanceerde mogelijkheden, die in sommige situaties nuttig zijn. Zo kun je een opslagpad kiezen. Dat is in feite de locatie waar het document fysiek wordt opgeslagen in het bestandssysteem. Ook kun je rechten instellen, waarmee je kiest wie de eigenaar is en welke gebruikers of welke groep gebruikers het document mogen bekijken en/of bewerken.

Onder Aangepaste velden kun je zelf velden toevoegen met een naam en gegevenstype. Hier kun je desgewenst ook op filteren. Voor je handleidingen zou je bijvoorbeeld een aangepast veld van het type boolean kunnen maken, waarmee je aangeeft of je het bewuste apparaat nog gebruikt. Daarna kun je filteren op alleen de gebruikte apparaten.

Onder Workflows kun je aangepaste regels instellen die helpen bij het organiseren en verwerken van documenten. Verder kun je een e-mailaccount toevoegen, om documenten die je per e-mail ontvangt automatisch te verwerken, met specifieke regels.

▼ Volgende artikel
Europese chatbots gaan de concurrentie aan met ChatGPT
© Ranazain - stock.adobe.com
Huis

Europese chatbots gaan de concurrentie aan met ChatGPT

‘Weg met Amerikaanse tech!’ Onze afhankelijkheid van Amerikaanse technologische producten en -diensten stuit een groeiend aantal Europeanen steeds meer tegen de borst. Overstappen op Europese alternatieven lijkt daarom een logische keuze, maar dat is makkelijker gezegd dan gedaan. Europese chatbots zijn lastig te vinden, terwijl kunstmatige intelligentie een steeds grotere rol in de maatschappij lijkt te gaan spelen.

In dit artikel lees je:
  • Waarom Europa zo afhankelijk is van Amerikaanse AI-chatbots

  • Welke risico’s dat met zich meebrengt voor privacy en digitale soevereiniteit

  • Hoe Europese alternatieven als Le Chat (Mistral AI) en Lumo (Proton) proberen tegenwicht te bieden

  • Wat de EU doet om een eigen AI-industrie van de grond te krijgen

ChatGPT van OpenAI, Gemini van Google, Copilot van Microsoft, Grok van xAI of Claude van Anthropic. Als je aan een AI-chatbot denkt, is de kans groot dat een van deze diensten als eerste bij je te binnen schiet. Dat is niet zo vreemd, want het zijn op dit moment de populairste chatbots. Een andere interessante overeenkomst is dat ze allemaal afkomstig zijn uit de Verenigde Staten.
Onlangs kwam er een scheurtje in die Amerikaanse AI-dominantie: de chatbot van het Chinese DeepSeek haalde ineens de voorpagina’s. Voor het eerst leek een niet-Amerikaanse chatbot het te kunnen opnemen tegen de gevestigde orde uit de VS. Dat was goed nieuws voor inwoners van China, aangezien Amerikaanse chatbots daar worden geblokkeerd. Met de komst van DeepSeek kregen Chinezen dus eindelijk toegang tot een geavanceerde AI-bot.
Wij Europeanen hebben wel gewoon toegang tot Amerikaanse AI-modellen. Dat is maar goed ook. Voor de meeste Amerikaanse onlinediensten, zoals WhatsApp, OneDrive of Gmail, zijn er prima Europese alternatieven te vinden. Alleen voor AI-chatbots is dat een stuk lastiger.

Afhankelijk van Amerika

Het verlangen naar de ‘Europeanisering’ van ons internetgebruik is de afgelopen maanden sterk gegroeid. Dat komt vooral door een daling in het vertrouwen in onze samenwerking met Amerika. De huidige Amerikaanse president ziet de EU meer als concurrent dan als partner. Het kan dus riskant zijn om een onvoorspelbaar land zo veel macht over ons (bedrijfs)leven te geven.
Niet alleen privé gebruiken we Amerikaanse diensten, ook op het werk zijn veel producten afkomstig uit de VS, zoals Microsoft Office, Gmail en Slack. In de meeste organisaties kun je AI-chatbots aan dat rijtje toevoegen. Volgens onderzoekers groeit onze AI-afhankelijkheid de komende jaren ook nog eens gestaag verder.

In een hoop werkvelden, waaronder de militaire sector, is kunstmatige intelligentie mogelijk binnen de kortste keren onmisbaar. Het baart experts dan ook zorgen dat wij als Europa momenteel geen enkele controle hebben over deze belangrijke technologie. Ze vrezen dat de VS op een dag besluit om Amerikaanse AI-diensten voor ons te blokkeren. Dan hebben tal van bedrijven ineens een groot probleem.

Volgens het Future of Jobs Report groeit onze AI-afhankelijkheid de komende jaren gestaag door.

Zorgen om privacy

In het verleden is al meerdere keren gebleken dat buitenlandse AI-bedrijven het niet zo nauw nemen met de privacy van hun gebruikers. Zo zou OpenAI zonder toestemming de data van EU-gebruikers hebben gebruikt voor het trainen van ChatGPT. Ook is duidelijk dat AI-chatbots gevoelige gegevens van gebruikers lekken, doordat ze ingevoerde tekst als trainingsdata opslaan en later met andere gebruikers delen.

Daarnaast wordt er gevreesd dat overheden de gegevens die gebruikers met AI-modellen delen, kunnen opeisen. In het privacybeleid van DeepSeek staat bijvoorbeeld dat het persoonsgegevens (denk aan chat- en zoekgeschiedenis en zelfs de toetsaanslag) in China opslaat. Volgens de wetten van het land heeft de Chinese overheid het recht om gegevens op te eisen van binnenlandse bedrijven wanneer zij daarom vraagt. Veel regeringen hebben hun werknemers dan ook verboden om DeepSeek op hun werktelefoons te installeren.

DeepSeek vermeldt nadrukkelijk dat je gegevens naar China worden verstuurd.

Moeilijke markt

Er zijn dus genoeg redenen om over te willen stappen op Europese alternatieven voor AI-diensten, maar dan moeten die er dus wel zijn. De Amerikaanse techindustrie is een stuk groter dan de Europese. EU-bedrijven beginnen daardoor met een grote achterstand en moeten met veel minder middelen een gelijkwaardig product zien te ontwikkelen. We zijn natuurlijk gewend aan de kwaliteit van de Amerikaanse tegenhangers. Slechts weinig mensen en bedrijven zijn bereid om over te stappen op een inferieur alternatief.

Hoe ingewikkelder (en dus duurder) het is om een dienst op te zetten, hoe moeilijker het is om Europese varianten te vinden. En laat het nou net zo zijn dat specifiek het opzetten en trainen van AI-modellen ontzettend prijzig is. Je hebt gigantische datacenters nodig om de vele peperdure, specialistische hardware-installaties 24/7 te kunnen laten draaien. Het trainen van AI-modellen verbruikt bovendien enorme hoeveelheden elektriciteit en de hitte die daarbij vrijkomt, moet dagelijks met miljoenen liters water worden gekoeld.

Er zijn in Europa maar weinig bedrijven voorhanden die bereid zijn om zulke investeringen te doen. Dat komt deels doordat de grote investeerders in Amerika zitten, waardoor start-ups moeilijk aan startkapitaal kunnen komen. Verder zijn de lonen in de VS hoger en is de loonbelasting lager, waardoor ook veel van het toptalent op AI-gebied dáár te vinden is. Daar komt ook nog de strenge regelgeving van de EU bij, die bedrijven kan afschrikken om te innoveren.

Toch is er sinds kort voorzichtig beweging zichtbaar op de Europese AI-markt. Steeds meer bedrijven werken aan eigen taalmodellen en chatbots die binnen de Europese wetgeving opereren en beter aansluiten op onze privacywaarden. Het gaat vaak nog om kleinschalige initiatieven met beperkte rekenkracht, maar ze laten wel zien dat Europa niet stilzit. Zo verschenen er de afgelopen maanden eindelijk enkele concrete voorbeelden van Europese chatbots die de concurrentie durven aan te gaan met Amerika: het Franse Le Chat van Mistral AI en het Zwitserse Lumo van Proton. Hun aanpak verschilt, maar beide projecten tonen dat ook binnen Europa ruimte ontstaat voor kunstmatige intelligentie op eigen voorwaarden.

Nederlandse chatbot

In Europa lijken dus vooral Frankrijk en Zwitserland druk bezig met kunstmatige intelligentie, maar wist je dat ook Nederland aan de weg timmert met een eigen chatbot? In opdracht van de overheid wordt al een paar jaar gewerkt aan GPT-NL, een bot die zich specifiek moet richten ‘op de waarden van Europa en Nederland’. De makers willen er bijvoorbeeld voor zorgen dat alle trainingsdata auteursrechtenvrij is en dat het model duurzaam wordt getraind.

GPT-NL is niet bedoeld als serieuze concurrent van de bekende chatbots, maar dient als ‘veilig alternatief’ voor gebruikers die met gevoelige informatie werken, zoals overheidsinstanties of scholen. Het budget (13,5 miljoen euro) en de rekenkracht komen in de verste verte niet in de buurt van de miljarden die een ChatGPT uitgeeft aan het trainen van zijn krachtigste modellen. In de benchmarks komt Neerlands trots er daardoor waarschijnlijk bekaaid vanaf. Maar dat weten we pas zeker als de bot begin 2026 beschikbaar komt.

Le Chat: Concurrent uit Frankrijk

Het Franse Mistral AI bracht eerder dit jaar onder de toepasselijk genaamde chatbot Le Chat een directe concurrent voor de gevestigde orde uit. Deze bot, beschikbaar voor Android, iOS en webbrowsers, maakt gebruik van volledig zelfgetrainde AI-modellen en staat dus voor een groot deel los van de VS. De hardware wordt nog wel geleverd door Amerikaanse fabrikanten. De gegevens worden echter opgeslagen op Europese servers en moeten daarmee voldoen aan strenge Europese privacywetten. Zo mag Mistral volgens de Algemene verordening gegevensbescherming (AVG) je gegevens niet buiten de EU beschikbaar maken. Er moet een juridisch zwaarwegende reden zijn om de gegevens met de overheid te mogen delen.

Mistral AI doet grootse beloften op zijn website.

Hoe goed is Le Chat?

Voor de privacy is Le Chat dus een interessante keuze, maar hoe presteert Mistral in vergelijking met de concurrentie? Uit onze eigen tests blijkt dat Le Chat op de eerste plaats nog niet zo heel vaardig is in het Nederlands. Bij het schrijven van een Sinterklaasgedicht komt de chatbot met veel kromme zinnen, terwijl ChatGPT (naast wat rare rijmpjes) wel consequent kloppende zinnen aan elkaar rijgt. Datzelfde geldt voor zaken die de Nederlandse cultuur aangaan. Als we vragen om suggesties voor klassieke verjaardagshapjes, zegt Le Chat dat we miniquiches en sushi moeten serveren. ChatGPT begrijpt de opdracht beter en raadt ons oer-Hollandse blokjes kaas met mosterd, leverworst en haring op roggebrood aan.

Ook uit onafhankelijke benchmarks blijkt dat Le Chat het vaak moet afleggen tegen Amerikaanse en Chinese modellen. Benchmarks meten hoe chatbots presteren in een breed scala aan taken, bijvoorbeeld op het gebied van wereldkennis, wetenschappelijk redeneren, wiskunde en programmeren.

Mistral Large 2, het model dat momenteel voor Le Chat wordt gebruikt, krijgt van de grootste AI-vergelijkingssite, Artificial Analysis, een gemiddelde intelligentiescore van 38. Vrijwel alle andere AI-chatbots behalen hogere scores. Het huidige standaardmodel van ChatGPT, GPT-4o, verschilt met zijn score van 41 niet veel van Le Chat. Alleen OpenAI biedt ook een Pro-abonnement aan voor 24 dollar waarmee gebruikers toegang krijgen tot geavanceerdere modellen, zoals o3, die juist een topscore van 69 behaalt.

Mistral biedt ook een betaald abonnement (15 dollar), maar daarbij krijgen gebruikers alleen een hogere daglimiet bij het genereren van teksten en afbeeldingen. Ook kun je dan aangepaste chatbots te maken, bijvoorbeeld een bot die altijd antwoordt als een rapper. Betalende gebruikers krijgen dus geen geavanceerder AI-model.

In het Nederlands dichten moet je niet aan Le Chat overlaten.

Het intelligentieniveau van Le Chat ligt lager dan vrijwel alle andere populaire chatbots.

Lumo: Protons privacygerichte alternatief

Sinds juli 2025 is Proton – bekend van Proton Mail en Proton VPN – met zijn eigen AI-chatbot Lumo op de markt gekomen. Daarmee voegt het bedrijf zich bij de kleine maar groeiende groep Europese spelers die een antwoord proberen te bieden op de Amerikaanse dominantie. Lumo profileert zich nadrukkelijk als een privacyvriendelijk alternatief dat de waarden van de Europese digitale soevereiniteit belichaamt.

De chatbot is gebouwd op open-sourcemodellen, waaronder Nemo, OpenHands, OLMO en Mistral Small, en draait volledig op Europese servers. Dat betekent dat alle gegevens binnen de grenzen van de EU blijven en dus onder de strenge AVG-regels vallen. Proton garandeert dat gesprekken niet worden gelogd en uitsluitend lokaal versleuteld worden opgeslagen, zodat zelfs het bedrijf zelf er geen toegang toe heeft. De dienst gebruikt geen enkele gebruikersinput om zijn modellen verder te trainen, iets wat bij Amerikaanse chatbots nog altijd de norm is.

©Proton

Wie wil, kan de webzoekfunctie inschakelen om actuele informatie op te vragen, maar standaard staat die uit. Daardoor werkt Lumo iets minder up-to-date dan ChatGPT of Gemini, maar het voorkomt dat de dienst ongezien data doorsluist naar externe bronnen. Ook kun je bestanden uploaden voor analyse, die vervolgens via Proton Drive worden verwerkt en net als e-mails en documenten volledig end-to-end-versleuteld blijven.

Lumo kent nog beperkingen. Zo kan de chatbot minder context onthouden dan de grote Amerikaanse modellen en ontbreken geavanceerde multimodale functies, zoals spraakinteractie of beeldherkenning. Toch is de komst van Lumo van grote symbolische waarde: eindelijk heeft Europa een concreet alternatief dat niet draait om schaal of winst, maar om vertrouwen, transparantie en privacy. Het laat zien dat innovatie ook kan ontstaan vanuit principes in plaats van marketingbudgetten – al zal de tijd moeten uitwijzen of dat genoeg is om het tegen de reuzen uit Silicon Valley op te nemen.

Andere Europese AI-modellen

Mistral is niet het enige Europese bedrijf dat AI-modellen heeft uitgebracht. Zo heeft de Duitse OpenGPT-X zijn taalmodel Teuken 7B opensource uitgebracht. Dat is specifiek getraind om de 24 officiële talen van de Europese Unie optimaal te kunnen beheersen. Je hebt ook het Italiaanse iGenius. Hiermee worden ‘veilige’ AI-producten ontwikkeld met eigen taalmodellen voor industrieën waarbij de naleving van de Europese AI Act van groot belang is.
Ook OpenEuroLLM, een samenwerkingsverband tussen universiteiten, bedrijven en verenigingen als SURF, heeft al verschillende taalmodellen gepubliceerd. OpenEuroLLM wil in de toekomst kunnen concurreren met Amerika en China. Geen van deze bedrijven heeft alleen al chatbots gebouwd met hun zelfgetrainde modellen. Daarin is Mistral AI vooralsnog de enige, als we de verzamelwebsite European Alternatives mogen geloven.

OpenGPT-X heeft zijn AI-modellen op het deelplatform Hugging Face geplaatst.

Kleine tekortkomingen

Een veelgehoorde klacht van AI-fanaten is dat Le Chat minder flexibel is dan de niet-EU-bots. Zo kan de chatbot minder context verwerken, waardoor de dienst niet geschikt is om een verslag van honderden pagina’s samen te vatten. Ook ontbreekt de mogelijkheid voor spraakgesprekken en kan de bot geen tekst lezen op afbeeldingen die je opstuurt. Je kunt Le Chat wel vragen om plaatjes te maken, maar daarvoor gebruikt de dienst het Flux Pro-model van een Duitse start-up. Dat model levert behoorlijke resultaten, al zijn de nieuwste beeldgeneratoren van ChatGPT en Google Gemini nog beter in het uitvoeren van complexe opdrachten en het leesbaar schrijven van tekst.

Ook Lumo is op dit vlak nog beperkt: de chatbot kan geen beelden genereren of analyseren en mist functies als spraakinteractie of uitgebreide contextherkenning. Proton richt zich voorlopig bewust op een veilige basisfunctionaliteit in plaats van op toeters en bellen. In vergelijking met Le Chat is Lumo dus minder veelzijdig, maar wel consistenter in zijn focus op privacy en databeveiliging.

AI-actieplan

Al met al kunnen Le Chat en Lumo op sommige punten aardig meekomen met hun Amerikaanse tegenhangers, maar op veel fronten blijven ze nog achter. De gemiddelde gebruiker kan er prima mee uit de voeten, al zullen bedrijven pas overstappen als Europese bots krachtiger worden en meer taken aankunnen. Om dat te bereiken zijn forse investeringen nodig. De Europese Unie beseft dat inmiddels ook. In april werd een actieplan gepresenteerd dat Europa moet helpen uit te groeien tot wereldleider op het gebied van kunstmatige intelligentie. Daarin belooft Brussel de bouw van vijf gigafabrieken voor de ontwikkeling van geavanceerde AI-modellen, investeringen in cloudcapaciteit en datacenters, en steun voor Europese start-ups. Na jaren van afwachten lijkt Europa zich dus eindelijk op te maken voor een inhaalslag. Met de komst van spelers als Mistral AI (Le Chat) en Proton (Lumo) krijgt het continent stap voor stap meer grip op zijn digitale toekomst. Misschien is dat bescheiden begin precies wat nodig is om ooit echt onafhankelijk te worden van Silicon Valley.

▼ Volgende artikel
Bescherm je data: voorkom digitale beveiligingslekken
© The 2R Artificiality - stock.ado
Huis

Bescherm je data: voorkom digitale beveiligingslekken

Op elke website, in elke app en zelfs in de supermarkt laat je digitale sporen achter. Deze worden door bedrijven verzameld en doorverkocht en helaas gebeurt dat vaak op een slecht beveiligde manier. Het gevolg? Datalekken die je privacy en je geld in gevaar brengen. Gelukkig kun je je gegevens met een paar gerichte maatregelen zelf beschermen.

In dit artikel leer je:
  • Hoe je je digitale voetafdruk opspoort en verkleint.

  • Waarom een wachtwoordmanager en tweestapsverificatie essentieel zijn.

  • Welke rechten je hebt onder de AVG en hoe je die gebruikt.

  • Hoe je veilig bestanden deelt met versleutelde diensten.

  • Wat een VPN doet en hoe je dat inzet tegen datadieven.

  • Hoe je met monitoring en alerts nieuwe datalekken snel opvangt.

Een goede bescherming van je gegevens begint met het vaststellen welke gegevens er al van je rondzwerven. Daarna beslis je wat écht bewaard moet blijven en vervolgens dicht je elk lek met slimme hulpmiddelen. In dit artikel leiden we door het hele proces. We starten met een snelle inventarisatie van je digitale voetafdruk. Denk aan ongebruikte accounts, verborgen toestemmingen en vergeten wachtwoorden.

Vervolgens gaan we aan de slag: van wachtwoordmanagers en tweestapsverificatie tot versleutelde bestandsdeling en VPN’s. Tot slot kijken we naar je wettelijke rechten onder de AVG (Algemene Verordening Gegevensbescherming) en laten we zien hoe je die in je voordeel kunt inzetten. Zo groeit je beveiliging organisch mee met elke stap die je zet. Je minimaliseert de risico’s en pakt je regie terug!

Digitale voetafdruk

Elk beveiligingsplan begint met inzicht. Open daarom eerst op je computer Instellingen, kies Privacy en beveiliging en bekijk alle categorieën om te zien welke apps toegang hebben tot je locatie, camera en microfoon. Noteer wat je niet verwacht had.

Ga vervolgens naar je e-mail en zoek op trefwoorden als ‘registratie’, ‘bevestig je account’ en ‘privacyverklaring’. Zo spoor je vergeten accounts op, bijvoorbeeld de webshop waar je vijf jaar geleden een cadeautje bestelde. Bezoek tot slot de website Have I Been Pwned en vul je e-mailadres in. De dienst toont of je gegevens in bekende datalekken zitten.

Geef elke vondst een kleurcode: groen voor veilig, oranje voor opletten en rood voor directe actie. Met dit kleurenoverzicht zie je in een oogopslag waar het gevaar zit. Sla het bestand lokaal op, niet in de cloud, en bescherm het met een wachtwoord. Nu je precies weet welke gegevens rondzwerven, kun je gericht maatregelen nemen in plaats van schieten met hagel. Zo bespaar je tijd en mis je geen verborgen risico.

Controleer goed welke apps en programma’s toegang hebben tot welke gegevens.

Onkraakbare wachtwoorden

Een uniek en lang wachtwoord voor elk account is de simpelste en beste bescherming. Installeer daarom een wachtwoordmanager zoals Bitwarden (https://bitwarden.com) of 1Password (https://1password.com). Maak eerst een hoofdwachtwoord van minstens zestien tekens dat geen bestaand woord bevat; combineer hoofdletters, leestekens en een zin die je alleen zelf begrijpt. Open daarna de manager en klik op Nieuwe login of Add Item, plak de url, vul gebruikersnaam in en laat de generator een wachtwoord van vijfentwintig willekeurige tekens maken.

Je kunt ook een volledige lijst met wachtwoorden importeren uit je browser. Sla het op en activeer Autofill in de browserextensie. Wis direct het oude, zwakke wachtwoord en gebruik de functie Password Health om overgebleven duplicaten op te sporen. Dankzij de versleutelde kluis verlaat geen enkel wachtwoord je apparaat onversleuteld; alleen jij bezit de sleutel. Vergeet niet regelmatig een back-up van de kluis te exporteren naar een versleuteld usb-station voor extra zekerheid. Zo voorkom je dat één lek al je accounts in gevaar brengt en kun je wachtwoorden probleemloos blijven vernieuwen.

De wachtwoordmanager is een onmisbare tool om al je online-accounts veilig te houden.

Jouw wettelijke rechten

De Algemene Verordening Gegevensbescherming (AVG) geeft je meer macht dan je misschien denkt. Artikel 15 garandeert het recht op inzage: elk bedrijf moet je op aanvraag een overzicht leveren van alle gegevens die het over jou bewaart, inclusief de herkomst en de bewaartermijn. Artikel 16 geeft recht op rectificatie, bijvoorbeeld wanneer je adres verkeerd gespeld staat.

Het bekendste is artikel 17: het recht op gegevens verwijderen. Daarmee mag je laten wissen wat voor de oorspronkelijke dienst niet langer noodzakelijk is. Artikel 20, tot slot, verplicht bedrijven tot dataportabiliteit: je krijgt je gegevens in een leesbaar formaat zodat je soepel kunt overstappen naar een concurrent. Zodra je zo’n verzoek indient, moet de organisatie binnen een maand reageren of gemotiveerd uitstel vragen. Houd de correspondentie goed bij, want de bewijslast ligt bij het bedrijf. Door deze rechten actief te gebruiken, dwing je organisaties tot zorgvuldige omgang met jouw data en verklein je zo structureel het lekkagerisico op zowel de korte als de lange termijn. 

Tweestapsverificatie

Helaas is zelfs een fantastisch wachtwoord kwetsbaar wanneer een bedrijf een datalek heeft. Activeer daarom altijd een tweestapsverificatie, ook wel multi-factor authentication genoemd. Veel diensten bieden deze optie aan. Ga naar de beveiligingsinstellingen van je account, bijvoorbeeld Account / Beveiliging / Tweestapsaanmelding, en kies voor een authenticator-app.

Installeer op je telefoon een gratis app als Google Authenticator. Klik op QR-code scannen, houd de camera boven het scherm en bevestig. De app toont nu elke dertig seconden een nieuwe zescijferige code. Voer die in op het webformulier en sla de herstelcodes op in een offline-document.

Voor kritieke accounts, zoals je cloudopslag of crypto-wallet, gebruik je bij voorkeur een hardware-sleutel als YubiKey. Steek de sleutel in de usb-poort, druk op het lampje en log in zonder een code over te typen. Dankzij de FIDO2-standaard wordt phishing onmogelijk, omdat de sleutel de url controleert voordat hij tekent. Zo combineer je gemak met een ijzersterke tweede factor die indringers buitenhoudt. Bewaar een reservesleutel op een andere locatie zodat verlies of diefstal je niet buitensluit.

Met tweestapsverificatie leg je een extra beveiligingslaag over je inloggegevens.

Profiel opschonen met dataverzoek

Bedrijven zijn verplicht je gegevens te verwijderen zodra je daarom vraagt, maar ze doen het meestal niet uit zichzelf. Log in op ieder oud account dat je in het begin van dit artikel vond, open de privacy-instellingen en zoek naar Account verwijderen, of iets soortgelijks.

Staat de knop er niet, stuur dan via het contactformulier of het e-mailadres een AVG-verzoek: vraag om inzage, correctie of verwijdering van je persoonsgegevens. Vermeld je gebruikersnaam en mailadres, en als onderwerp iets als Verzoek op grond van artikel 17 AVG.

Licht kort toe wat je precies wilt en schrijf dat je binnen een maand een bevestiging verwacht en dat je anders de Autoriteit Persoonsgegevens inschakelt. Bewaar een pdf van het verzoek. Ontvang je na dertig dagen geen reactie, stuur dan een herinnering met de oorspronkelijke mail als bijlage.

Bij hardnekkige weigering vul je online een klachtenformulier in bij de toezichthouder. Door deze juridische drietrapsaanpak verminder je je digitale voetafdruk drastisch en leg je tegelijk druk op organisaties om hun beveiliging te verbeteren. Voeg tot slot een herinnering in je agenda zodat je de opvolging niet vergeet. 

Veilig en tijdelijk delen

Je wilt een scan van je paspoort opsturen naar een overheidsinstelling, of een map met familiefoto’s delen met oma. Gebruik dan nooit onbeveiligde e-mailbijlagen. Kies in plaats daarvan voor een end-to-end-versleutelde dienst als Wormhole.

Sleep het bestand naar het tabblad en beperk de download tot één keer. Kopieer de link, plak hem in een bericht en stuur het wachtwoord via een ander kanaal. Wie te laat klikt, krijgt een 404-fout, waardoor je geen nieuwsgierige meelezers meer hebt.

Werk je in Windows, open dan een willekeurige map, klik met rechts op een bestand, ga naar OneDrive / Delen, kies via de drie puntjes Instellingen voor delen en voeg een Wachtwoord en Vervaldatum toe. Door tijd, wachtwoord en versleuteling te combineren geef je kwaadwillenden geen kans. Bovendien bespaar je opslagruimte omdat het bestand niet in talloze inboxen blijft zweven.

Er zijn online heel veel diensten voor het veilig versturen van bestanden. Wormhole is er eentje van.

Virtueel privénetwerk

Openbare hotspots in hotels en cafés zijn een paradijs voor datadieven. Zodra je onversleuteld verkeer verstuurt, kan iedereen in het netwerk meelezen. De eenvoudigste bescherming is het inschakelen van een virtueel privénetwerk. Installeer op je laptop en mobiel bijvoorbeeld de opensource-dienst Mullvad of het commerciële NordVPN.

Open de app, klik op Snel verbinden en verifieer dat het slot-pictogram in de menubalk verschijnt. Activeer daarnaast de optie Kill Switch zodat je verbinding blokkeert zodra de tunnel wegvalt. Voor extra zekerheid kun je in je browser de ingebouwde optie Altijd beveiligde verbindingen gebruiken activeren, die je vindt via Instellingen / Privacy en beveiliging. In Firefox heet de optie Alleen-HTTPS-modus. Test je opstelling via de site DNSLeakTest. Verschijnt je eigen provider niet, dan zit je goed. Zo browse je veilig, zelfs op een open wifinetwerk.

Met een killswitch laat je automatisch de verbinding met internet of een bepaalde app verbreken om je gegevens veilig te houden.

Welke wachtwoordmanager past bij jou?

Niet elke wachtwoordkluis werkt hetzelfde. Bitwarden is opensource, draait in de cloud en laat je onbeperkt wachtwoorden synchroniseren tussen alle apparaten. De broncode is publiek, waardoor beveiligingsonderzoekers snel fouten kunnen melden.

  • LastPass was populair, maar lekte in 2022 versleutelde kluizen, waarna criminelen brute-forceaanvallen begonnen.

  • 1Password combineert cloudopslag met een extra geheime sleutel die uitsluitend lokaal wordt bewaard.

  • KeePass slaat je kluis alleen lokaal op en vereist handmatig kopiëren naar andere systemen, ideaal voor mensen die maximale controle willen.

  • Tot slot is NordPass interessant door de optie om wachtwoorden te delen via een versleuteld kanaal, handig binnen gezinnen.

Kijk bij je keuze naar prijs, opensource-status, exportmogelijkheden en ondersteuning voor hardware-sleutels. Installeer een proefversie, importeer twintig willekeurige log-ins en test de auto-invulfunctie op je belangrijkste websites. Voelt de workflow soepel en krijg je geen valse waarschuwingen? Dan heb je jouw ideale match gevonden zonder concessies aan veiligheid te doen.

Monitoren én reageren

Beveiliging is geen eenmalige klus. Stel dus alerts in die automatisch waarschuwen wanneer jouw gegevens op straat liggen. Klik op Have I Been Pwned bovenaan op Notify me en vul je e-mailadres in. De dienst mailt je voortaan zodra je mailadres opduikt in een nieuw lek.

Voeg daarnaast domeinmonitoring toe voor je eigen website als je die hebt. Als er een waarschuwing verschijnt, open je direct de wachtwoordmanager, genereer je een nieuw wachtwoord en controleer je of tweestapsverificatie actief is. Noteer het incident in je kleurenoverzicht.

Reageer je snel, dan is de kans klein dat cybercriminelen al hebben toegeslagen. Zo bouw je een continue verdedigingslinie die meegroeit met het dreigingslandschap. Maak er een maandelijkse routine van. Dan zijn al je accounts, ook de oude, veilig.

Voorkomen is beter dan genezen: stel notificaties in wanneer je e-mailadres in een hack voorkomt.

Pak de regie over je data!

Datalekken horen bij het digitale leven, maar hun impact bepaal jij. Door eerst je voetafdruk in kaart te brengen, vervolgens unieke wachtwoorden en tweestapsverificatie toe te passen en je apparaten te versleutelen, sluit je de belangrijkste toegangspoorten. Veilige bestandsdeling, een betrouwbare VPN en een periodieke schoonmaak dichten de resterende kiertjes. Met automatische monitoring en hulp van de AVG is er een goede basis. Geen enkele maatregel staat op zichzelf; samen vormen ze een flexibel schild dat meebeweegt met nieuwe dreigingen. Begin vandaag, ervaar morgen al meer gemoedsrust en bespaar geld en ongemak op de lange termijn.