ID.nl logo
Datacenters: vloek of zegen?
© ALASTAIR WIPER
Huis

Datacenters: vloek of zegen?

Zonder data geen technologie, en zonder datacenters geen data. De wereld draait op digitalisering. Elk bericht dat je stuurt, iedere film die je streamt, elke betaling die je doet: ze staan allemaal ergens opgeslagen. Datacenters zijn cruciaal voor onze manier van leven, maar zulke enorme parken met servers en harde schijven nemen veel ruimte in en slurpen energie. De overheid zit met datacenters in z’n maag. Technologie willen we allemaal, maar willen we daar de prijs voor betalen die nodig is?

Data is het kloppende hart van de moderne wereld. Zonder data geen technologie, en zonder datacenters geen data. Simpel gezegd: datacenters zijn cruciaal voor onze manier van leven. Maar wat zijn de kosten van deze datacenters? In dit artikel vertellen we je:

  • Wat datacenters zijn
  • Hoe datacenters werken
  • Wat de nadelen van datacenters zijn
  • Wat de voordelen van datacenters zijn

Meer weten over online data-opslag? Lees dan: Dit zijn de beste gratis clouddiensten van 2022

Dat die smartphone in je broekzak, clouddienst, streamingservice of socialmedia-platforms die je iedere dag gebruikt hun gegevens ergens moeten opslaan, is niet meer dan logisch. Maar diep onder het gebruiksgemak zit een wereld van enen en nullen verstopt die zo gigantisch is dat het invloed uitoefent op de energiehuishouding, werkgelegenheid en infrastructuur overal ter wereld.

Datacenters, en vooral de enorme hyperscale-varianten, drukken hun stempel op de samenleving. De berg data die we met z’n allen gebruiken, neemt afmetingen aan die alleen nog verwerkt kunnen worden door gigantische installaties. Zulke datacenters zijn overal ter wereld te vinden, en ook in Nederland hebben we een paar hyperscales staan.

De vraag naar nog meer datacenters vanuit techbedrijven als Meta, Microsoft en Google blijft groeien. De regering heeft die aanvragen voorlopig op een laag pitje gezet, maar met het immer uitdijende internet is de nood hoog.

Datacenters

Datacenters zijn fysieke gebouwen of opstellingen die gegevens verwerken en opslaan. Dat kan op velerlei manieren: de serverruimte op je werk is al een voorbeeld van een datacenter. Kleinere bedrijven kunnen het doorgaans prima af met hun eigen serverruimte, maar naarmate de hoeveelheid data die een bedrijf of instantie verwerkt groeit, is er meer ruimte nodig.

Daarom bestaan er centrale hubs die server- en opslagruimte verhuren aan meerdere bedrijven. Ziekenhuizen, clouddiensten, banken, universiteiten: ze zijn allemaal klant bij een van deze datacenters. Ze zijn perfect ingericht om grote hoeveelheden gegevens te verwerken, en zijn meestal voorzien van meerdere back-upsystemen om de continuïteit van de dienst te garanderen.

Een gemiddeld datacenter is helemaal niet zo’n imposant gebouw. Foto: NorthC Datacenters.

Hyperscales

Denken we nog een stap groter, dan stappen we in de wereld van de hyperscales. Hyperscale-datacenters zijn het summum van opslagruimte. Er zijn er over de hele wereld inmiddels zo’n zevenhonderd gebouwd; de helft staat in de Verenigde Staten, maar Azië is aan een gestage opmars bezig. In Nederland hebben we drie van deze enorme bouwwerken staan. Hyperscale-datacenters zijn doorgaans gekoppeld aan een enkel bedrijf, en het gebruik ervan is alleen weggelegd voor de echte techgiganten.

Je kunt je voorstellen dat Google, met zijn zoekmachine, besturingssystemen, socialmedia-diensten, e-mailservices en tal van andere digitale faciliteiten niet zomaar bij een doodgewoon datacenter kan aankloppen. Daarom bouwen techgiganten vaak hun eigen datacenters, zo groot dat ze tegen de grenzen van het toelaatbare aanlopen: hyperscales zijn de laatste tijd onderwerp van discussie als het gaat om lokale infrastructuur en energieverbruik.

Hyperscale-datacenters zijn immense gebouwen, vaak specifiek voor één bedrijf gebouwd. Foto: Interxion a Digital Realty Company.

AMS-IX Een speciale vermelding verdient AMS-IX. Hoewel de afkorting klinkt als een vliegveld, is het misschien nog wel een belangrijkere hub dan Schiphol. AMS-IX staat voor Amsterdam Internet Exchange. Het is het grootste internetknooppunt van Nederland, en zelfs een van de grootste ter wereld. AMS-IX is niet per se gekoppeld aan een enkel bedrijf, en valt daarom misschien niet geheel onder de definitie ‘hyperscale datacenter’, maar de infrastructuur is vergelijkbaar – de gegevens die AMS-IX verwerkt, worden opgeslagen in verschillende datacenters. AMS-IX is goedbeschouwd niets anders dan een enorm kruispunt waar internetverkeer van over de hele wereld wordt verstuurd en ontvangen. Zonder zulke knooppunten is internationaal internetverkeer op de schaal zoals we het nu gebruiken onmogelijk.

Op een doordeweekse middag gaat er iedere seconde zo’n 8000 terabyte aan data door de exchange. Op piekmomenten, rond een uur of negen ‘s avonds, is dat zelfs meer dan 10.000 TB, oftewel 10 miljoen gigabyte. Op de website van AMS-IX kun je live meekijken met de datastromen.

AMS-IX verwerkt iedere seconde miljoenen gigabytes aan data.

Datacenters in Nederland

Los van internet exchanges, serverruimtes en andere kleinere datacenters zijn er op dit moment in Nederland drie actieve hyperscale-datacenters te vinden. Twee daarvan staan in Middenmeer, in de Noord-Hollandse gemeente Hollands Kroon. Daar, in de polders van de Wieringenmeer, hebben zowel Google als Microsoft een hyperscale-datacenter gebouwd. Microsoft heeft plannen voor een tweede hyperscale, en ook bedrijven als Netflix en Amazon hebben interesse getoond in een plekje in de polder, al staan die ontwikkelingen op dit moment op een laag pitje. Inmiddels is Microsofts hyperscale gegroeid tot ruim 110 hectare en Google doet er nog eens 71 hectare bovenop. In totaal is in Middenmeer 750 hectare gereserveerd voor datacenters. Google heeft nog een tweede hyperscale in Nederland, in het Groningse Het Hogeland, nabij de Eemshaven .

Techbedrijven bouwen maar al te graag datacenters in Nederland vanwege het robuuste elektriciteitsnet en de relatief korte afstand tot AMS-IX, waardoor data sneller en gemakkelijker over de wereld kunnen worden verstuurd. België blijft daarentegen flink achter op het gebied van hyperscales: Google is de enige grote speler die een significant aantal wat grotere datacenters in België heeft staan. In Europa lijken alleen Tsjechië en Portugal een minder aantrekkelijke locatie voor het bouwen van hyperscales.

Googles datacenter in de Eemshaven is een van de drie hyperscales in Nederland.

Binnenin een datacenter

Van buitenaf zien de meeste datacenters eruit als kale, anonieme grijze gebouwen, maar binnenin is alles een toonbeeld van hightech en efficiency.

Het belangrijkste onderdeel is de serverruimte. Daar staan de fysieke schijven waarop alle data zijn opgeslagen. Die serverruimtes hebben hun eigen klimaatsystemen, zodat er altijd onder de juiste temperatuur en luchtvochtigheid kan worden gewerkt. De volgende stap is de ruimte waarin de verbindingen met de servers van de klanten en met het internet worden gelegd – altijd dubbel, zodat de verbinding tijdens storingen niet wordt verbroken.

Elders in het gebouw is de energievoorziening te vinden. Datacenters draaien voor het grootste deel op groene energie, in het geval van de datacenters in Nederland opgewekt door windmolenparken. Wel is er een noodstroomvoorziening op basis van batterijen en een aggregaat voor als er tijdelijke storingen optreden.

Ook onmisbaar zijn de koelsystemen, die ervoor zorgen dat de serverruimtes niet oververhit raken. Tegenwoordig wordt zelfs de restwarmte gebruikt om kantoren en huizen mee te verwarmen. Het brandveiligheidssysteem zorgt ervoor dat bij de minste rookontwikkeling een mengsel van gassen wordt ingezet om verspreiding te voorkomen. Verder hebben grote datacenters eigen kantoren, en is er een operationeel centrum om de dagelijkse gang van zaken in goede banen te leiden.

Een datacenter bestaat uit veel meer dan alleen een verzameling harde schijven. Foto: Digital Realty.

Nadelen

Het mag duidelijk zijn dat datacenters, en dan vooral de hyperscale-varianten, ontzettend belangrijk zijn voor grote (tech)bedrijven. Met de hoeveelheid diensten die Google, Microsoft en andere aanbieden, zijn deze centrale hubs onmisbaar.

Maar niet iedereen is even blij met de komst van zulke enorme gebouwen. Ten eerste neemt een datacenter veel fysieke ruimte in. In een dichtbevolkt land als Nederland is ruimte schaars, zelfs in de Noord-Hollandse en Groningse polders. Daarbij gebruikt een hyperscale-datacenter een immense hoeveelheid energie – daarover later meer (afbeelding 5). Die energie wordt deels opgewekt door windmolens, maar inwoners van dorpen nabij zulke windmolenparken zien weinig van die voordelen terug, en kampen voornamelijk met de nadelen. Doordat datacenters grotendeels automatisch opereren, is het effect op de werkgelegenheid relatief beperkt.

Groen of niet, niet iedereen is altijd even bij met de komst van datacenters.

Zeewolde Toen Meta, het moederbedrijf van onder andere Facebook, Instagram en WhatsApp, aankondigde een hyperscale-datacenter te gaan bouwen in Zeewolde, in Flevoland, was de algemene stemming nog positief. Er was veel onbebouwd land in de gemeente, en met name de bouw van het complex zou de komende jaren voor flink wat werkgelegenheid zorgen. Tegen het einde van 2021 stemde de gemeenteraad dan ook in met de komst van het datacenter.

Maar de stemming sloeg al snel om. Lokale partijen maakten zich sterk voor het tegenhouden van de bouw, en na winst van Leefbaar Zeewolde bij de gemeenteraadsverkiezingen begin dit jaar, werd de strijd tegen de bouw verhevigd. Men voelde zich nog eens gesterkt door het feit dat een deel van de grond die gebruikt zou worden voor het datacenter eigendom is van het Rijksvastgoedbedrijf. Daardoor worden er extra eisen aan onder andere de duurzaamheid van de bebouwing gesteld – eisen waaraan Meta, naar later bleek, moeilijk kon voldoen. In maart van dit jaar werd na een stemming in de Tweede Kamer besloten tot het tijdelijk pauzeren van de plannen, en in juni trok Meta zelf definitief een streep door de bouw van het datacenter.

Zeewolde

Toen Meta, het moederbedrijf van onder andere Facebook, Instagram en WhatsApp, aankondigde een hyperscale-datacenter te gaan bouwen in Zeewolde, in Flevoland, was de algemene stemming nog positief. Er was veel onbebouwd land in de gemeente, en met name de bouw van het complex zou de komende jaren voor flink wat werkgelegenheid zorgen. Tegen het einde van 2021 stemde de gemeenteraad dan ook in met de komst van het datacenter.

Maar de stemming sloeg al snel om. Lokale partijen maakten zich sterk voor het tegenhouden van de bouw, en na winst van Leefbaar Zeewolde bij de gemeenteraadsverkiezingen begin dit jaar, werd de strijd tegen de bouw verhevigd. Men voelde zich nog eens gesterkt door het feit dat een deel van de grond die gebruikt zou worden voor het datacenter eigendom is van het Rijksvastgoedbedrijf. Daardoor worden er extra eisen aan onder andere de duurzaamheid van de bebouwing gesteld – eisen waaraan Meta, naar later bleek, moeilijk kon voldoen. In maart van dit jaar werd na een stemming in de Tweede Kamer besloten tot het tijdelijk pauzeren van de plannen, en in juni trok Meta zelf definitief een streep door de bouw van het datacenter.

De plannen waren in een vergevorderd stadium, maar het datacenter van Meta in Zeewolde komt er niet.

Energieverbruik

Een van de meest genoemde argumenten die tegenstanders inzetten om de komst van meer datacenters te voorkomen, is het energieverbruik. En dat is niet zonder reden. Volgens gegevens uit 2020 zijn datacenters in Nederland verantwoordelijk voor een kleine drie procent van het totale nationale elektriciteitsgebruik. Een groot deel daarvan, tot wel 88 procent, is groene energie (afbeelding 6). In Nederland gevestigde datacenters gebruiken 3,2 miljard kilowattuur aan elektriciteit. Kijken we naar het totale energieverbruik, dus niet alleen elektriciteit, dan zijn datacenters verantwoordelijk van 0,39% van het totaal. Omdat datacenters bijna volledig elektrisch werken, is de CO2-uitstoot te verwaarlozen: de gehele sector was in het afgelopen decennium verantwoordelijk voor slechts 0,0063% van de totale CO2-uitstoot.

Datacenters gebruiken veel water, voornamelijk voor de koeling van de serverruimtes. Volgens het CBS gebruikt de sector Informatie en Communicatie, waar datacenters onder vallen, ongeveer een miljoen kubieke meter water per jaar. Dat komt neer op 0,088 procent van het totale watergebruik in Nederland.

In de wetenschap dat we ieder jaar meer data en technologie gebruiken, zou je verwachten dat ook het energieverbruik van datacenters een vlucht neemt. Dat blijkt niet het geval. Datacenters zijn geen logge gebouwen, maar kunnen relatief snel worden aangepast. De afgelopen jaren zijn veel aanpassingen gedaan om de efficiëntie van datacenters te verbeteren, waardoor het totale energieverbruik ongeveer gelijk is gebleven – en dat in een periode waarin het internetverkeer sinds 2010 is vervijftienvoudigd. Een migratie van de Rijksoverheid, waarbij de zestig eerder gebruikte datacenters werden ingeruild voor vijf nieuwe, grotere exemplaren, deed het energieverbruik halveren.

©ALASTAIR WIPER

Googles datacenter bij de Eemshaven draait voor een groot deel op windenergie

Werkgelegenheid

Volgens gegevens uit 2021 hebben in Nederland op dit moment zo’n elfduizend mensen een baan die direct of indirect verbonden is aan een datacenter (afbeelding 7). Ongeveer de helft daarvan staat letterlijk op de loonlijst bij een datacenter. Daarbij kun je in eerste instantie denken aan IT’ers, maar er zijn ook specialisten op het gebied van beveiliging, brandveiligheid, stroomvoorziening en koeling. De andere helft staat onder contract bij bedrijven die primair producten of diensten leveren aan datacenters: ontwerpers en bouwkundigen, maar ook marketeers en juridische specialisten. Hoewel nieuwe hyperscales voorlopig in de ijskast staan, is de verwachting dat dit aantal de komende jaren snel zal toenemen: kleinere, minder specialistische datacenters worden in hoog tempo gebouwd.

Wereldwijd is de verwachting dat er tot 2025 in deze sector ruim 300.000 banen bij komen. Dat is nog los van de bouwbedrijven en ontwerpers die moeten worden ingehuurd om de realisatie van datacenters mogelijk te maken. Voor Europa zal het om ongeveer 80.000 banen gaan.

Op dit moment werken er zo’n elfduizend mensen direct of indirect bij een datacenter. Foto: Interxion a Digital Realty Company.

Vloek of zegen?

Datacenters op zichzelf zijn onmisbaar voor de manier waarop we ons leven leiden. Zonder datacenters is er geen Facebook, geen Netflix en geen internet. Techbedrijven groeien almaar door, en al die miljarden gigabytes aan informatie die we dagelijks versturen en ontvangen, moet ergens worden opgeslagen.

Grote bedrijven zouden het liefst zien dat dat in enorme, gecentraliseerde hyperscale-centra wordt gedaan, maar daar is niet iedereen even blij mee. Hoewel hyperscales een minder grote voetafdruk hebben als het gaat om uitstoot en energieverbruik dan je in eerste instantie zou verwachten, is de teneur dat Nederland simpelweg te klein is om vol te bouwen met serverparken.

De drie hyperscales in Nederland die op dit moment operationeel zijn, zorgen voor werkgelegenheid, maar dat is niet de grootste winst. Door de aanwezigheid van hyperscales wordt het vestigingsklimaat voor bedrijven een stuk positiever. Voeg daar AMS-IX aan toe, een van de grootste internet exchanges ter wereld, en het is niet zo gek dat veel techbedrijven zich heel graag in Nederland willen vestigen.

Toch gaan er steeds meer stemmen op om de bouw van nog meer enorme datacenters tegen te houden, en ook de politiek is inmiddels zeer terughoudend. Voorlopig doen we het dus met de drie hyperscale-datacenters die we op dit moment hebben staan. In hoeverre dat invloed heeft op de positie van Nederland in de technologische wereldeconomie, moet de toekomst uitwijzen.

Nieuwe hyperscales komen er voorlopig niet, maar de bestaande datacenters draaien gewoon door.

▼ Volgende artikel
Waar voor je geld: 5 fonduesets voor een gezellige avond
© M.studio - stock.adobe.com
Huis

Waar voor je geld: 5 fonduesets voor een gezellige avond

Bij ID.nl zijn we gek op producten waar je niet de hoofdprijs voor betaalt. Daarom gaan we een paar keer per week voor je op zoek naar zulke aanbiedingen. Met Kerst en Oud en Nieuw voor de deur is het weer tijd om te bedenken wat je wil gaan eten. Wat dacht je van fondueen? Met deze vijf fonduesets maak je indruk op je vrienden en familie.

Met een fondueset smelt je de lekkerste kazen en dep je je broodje of vlees in bouillon of kaas. Fonduesets zijn de ultieme sfeermakers voor de feestdagen, of het nu met vrienden is of familie en of je kiest voor romige kaas, bouillon of chocolade; het is op en top genieten. Een absolute must-have voor elke levensgenieter en perfect voor de feestdagen. Wij vonden vijf betaalbare fonduesets voor je.

Boska Elektrische Fondueset Pro - 8 personen

De Boska Elektrische Fondueset Pro is ontworpen voor liefhebbers van kaas‑ en vleesfondue. De set bestaat uit een geëmailleerde gietijzeren pot met een inhoud van circa 2,15 liter, waardoor je genoeg ruimte hebt voor een volledige kaasfondue of bouillon. Het verwarmingselement is elektrisch en beschikt over een instelbare thermostaat; hierdoor kun je de temperatuur naar wens aanpassen voor verschillende soorten fondue. Een handig indicatielampje laat zien wanneer het element aan staat. De pot staat op een stevige basis en heeft een extra lang snoer van twee meter, zodat je hem makkelijk midden op tafel plaatst. Bij de set worden acht fonduevorken geleverd die zijn voorzien van gekleurde markeringen. De combinatie van gietijzer en emaille zorgt voor een gelijkmatige warmteverdeling en eenvoudige reiniging.

Swissmar Lausanne 11‑delige fondueset - 6 personen

De Zwitserse fabrikant Swissmar levert met de Lausanne een 11‑delige fondueset die is gericht op traditioneel fonduen. De set bestaat uit een koperen pan met een geëmailleerde binnenkant en een zware RVS‑branderschaal. Doordat koper de warmte snel opneemt en verdeelt, is de fondue snel op temperatuur. De pan staat op een robuuste stalen houder waarin een brander met regelaar zit; hiermee pas je de vlamsterkte aan voor kaas‑, bouillon‑ of chocoladefondue. In de doos zitten verschillende accessoires, waaronder zes vorkjes en een branderschaal. Deze set is niet elektrisch, waardoor je hem zelfs buiten of op de camping kunt gebruiken.

Mäser Fondueset - 4 personen

De fondueset van Mäser bestaat uit een roestvrijstalen pan met bijbehorende brander. Roestvrij staal is slijtvast en eenvoudig te reinigen; je kunt de pan na gebruik in de vaatwasser zetten. De set heeft een inhoud van rond één liter, voldoende voor een kaas‑ of chocoladefondue voor een klein gezelschap. Er worden meerdere fonduevorkjes meegeleverd met gekleurde puntjes om ze te onderscheiden. Dankzij de stevige basis staat de pan stabiel op tafel, terwijl de gelijkmatige warmteverdeling voorkomt dat de inhoud aanbrandt. Omdat het geen elektrisch toestel is, gebruik je de brander met brandgel of spiritus.

Baumalu 385050 fondueset - 6 personen

Deze fondueset van Baumalu bestaat uit een zware gietijzeren pan die op een decoratieve houten plaat staat. Gietijzer houdt de warmte goed vast en is geschikt voor zowel kaas‑ als chocoladefondue. De bijgeleverde brander plaats je onder de pan; je regelt de vlamsterkte met een draaiknop. Omdat de pot stevig op de houten plaat staat, blijft hij stabiel en kras je niet op de tafel. In de set zitten fonduevorkjes met houten handvatten.

Tristar FO‑1107 Fonduepan - 8 personen

De Tristar FO‑1107 is een elektrische fondueset met een inhoud van ongeveer 1,5 liter. Je gebruikt deze pan voor verschillende soorten fondue, zoals kaas, bouillon of chocolade. Het verwarmingselement levert circa 1000 watt en heeft een instelbare thermostaat, zodat je de temperatuur kunt aanpassen aan het type fondue. Een indicatielampje geeft aan wanneer het apparaat actief is. De pan heeft een antiaanbaklaag, een cool‑touch handgreep en staat op een antislipvoet voor extra stabiliteit. Er worden acht fonduevorkjes meegeleverd en door de ring bovenop blijven de vorkjes op hun plek tijdens het fonduen.

▼ Volgende artikel
Van papier tot pixels: altijd je administratie op orde
© px.palette
Huis

Van papier tot pixels: altijd je administratie op orde

Papieren facturen, garantiebonnetjes, contracten en andere documenten slingeren al snel overal rond. Waarom niet alles digitaal bewaren, zodat je het in enkele klikken terugvindt? In dit artikel vind je gratis tools en praktische tips om je administratie te scannen, te taggen, doorzoekbaar te maken en veilig op te slaan zonder veel gedoe.

Wat gaan we doen?

We geven diverse tips en tools om administratieve en andere papieren documenten efficiënt en ordelijk te digitaliseren. Dat gaat van scannen en OCR’en tot organiseren, automatiseren, back-uppen en meer.

Tip 1: Scanner

Stel, je wilt een hele reeks documenten digitaliseren, zoals garantiebewijzen of facturen. We gaan ervan uit dat je een scanner in huis hebt, eventueel als onderdeel van een all-in-one-printer. Zo’n toestel is goed geschikt voor stabiele, rechte scans, en een (soms optionele) documentinvoer maakt het extra handig bij grotere aantallen. Je scant het best op zo’n 300 dpi, in grijswaarden of kleur, en bewaart het resultaat bij voorkeur als pdf. Helaas genereert de meegeleverde scansoftware vaak alleen pdf’s met een afbeelding van de tekst, waardoor je die later niet kunt doorzoeken of kopiëren.

©OttoPles

Er bestaan ook heel wat printers met een ingebouwde scanner.

Tip 2: NAPS2

Gebruik in dit geval beter scansoftware met geïntegreerde OCR, zoals het gratis en opensource NAPS2 (www.naps2.com, Windows, macOS en Linux). Start de app, klik op Nieuw profiel en op Apparaat kiezen om je scanner te selecteren. Je kunt kiezen uit drie drivertypes: WIA (ingebouwd in Windows, beperkt), TWAIN (krachtiger) en ESCL (voor moderne netwerk- of wifi-scanners, vergelijkbaar met Apple AirScan). Doorgaans kies je voor TWAIN. Stel de scanopties in en open Geavanceerd voor extra instellingen. Typ een profielnaam en bevestig met OK.

Klik nu op de knop OCR en download de gewenste talen, zoals Dutch en English. Plaats een vinkje bij PDFs doorzoekbaar maken middels OCR en kies taal en modus (Snel of Beste). Vink ook de andere opties aan en druk op Scannen.

Klik daarna op het pijlknopje bij PDF opslaan en kies PDF-instellingen. Vul bij Standaard bestandspad een bestandsnaam in – gebruik eventueel ‘placeholders’ als $(YY)-$(MM)-$(DD) – en kies bij Compatibiliteit bij voorkeur PDF/A, zoals PDF/A-2b. Dit formaat slaat namelijk alle lettertypes, kleurprofielen en structuurinformatie in het bestand zelf op, wat ‘garandeert’ dat je het document ook jaren later nog in zijn oorspronkelijke vorm te zien krijgt. Vink Onthoud deze instellingen aan, klik op OK, selecteer de scans en kies PDF opslaan. Het is trouwens ook mogelijk om een (niet-doorzoekbaar) pdf-bestand in NAPS2 te importeren, dit vervolgens te OCR’en en als PDF/A te bewaren.

NAPS2 is prima opensource-scansoftware, met geïntegreerde meertalige OCR-module.

Pdf-printer

De focus van dit artikel ligt op papieren brondocumenten, maar we willen zeker ook (de gratis versie van) PDFCreator vermelden (www.pdfforge.org/pdfcreator). Je kunt deze namelijk als virtuele printer installeren om zo allerlei documenttypen om te zetten naar PDF(/A).

Start na installatie de app, open het tabblad Printer, vink PDFCreator aan en kies via de moersleutel het bestaande profiel PDF/A (archiefbestand). Bevestig met Opslaan en sluit de app. Open nu een document in een willekeurige toepassing, open het afdrukvenster en selecteer PDFCreator als printer. Een dialoogvenster opent waarin je het document meteen kunt opslaan als PDF/A-bestand (standaardversie 2b, maar dit is aanpasbaar via het uitklapmenu).

Je kunt zo’n virtuele printer ook inzetten om documenten automatisch als PDF/A op te slaan in een zelf te bepalen map. Maak hiervoor in PDFCreator op het tabblad Profielen een nieuw profiel aan (bijvoorbeeld PDF/A in map Facturen), kies bijvoorbeeld PDF/A-2b als formaat en geef tevens een specifieke opslaglocatie op. Koppel dit profiel op het tabblad Printer aan een nieuwe virtuele printer (bijvoorbeeld PDF/A-facturen). Zo maak je meerdere profielen en printers aan, waarbij elk PDF/A-bestand automatisch in een andere map terechtkomt.

Je kunt ook meerdere virtuele printers aanmaken, telkens met een aangepast profiel.

Tip 3: Mobiel

Een vlakbedscanner is zeker handig, maar niet noodzakelijk, want je kunt tegenwoordig ook prima scannen met je smartphone. Met de juiste app wordt het beeld automatisch ge-OCR’d en indien nodig rechtgetrokken. Een van de betere apps is Adobe Scan, beschikbaar via www.kwikr.nl/adobescan of in de appstore van Android en iOS.

Installeer en start de app. De gratis versie volstaat meestal, al laat de betaalde versie (circa 10 euro per maand) je onder meer tot 100 pagina’s per bestand scannen (in plaats van 25) en pdf’s exporteren naar Office 365-formaten.

Meld je aan, bijvoorbeeld via je Google-account, en tik op Scan. Je kunt het resultaat onder meer uitsnijden, roteren en de helderheid en het contrast aanpassen. Kies Blijven scannen voor extra pagina’s of tik op PDF opslaan zodra je klaar bent. De pdf belandt standaard in je Adobe-account (https://acrobat.adobe.com), maar je kunt het bestand ook delen of (via Meer) bijvoorbeeld opslaan in Google Drive. Het pdf-bestand is standaard doorzoekbaar, controleer bij Voorkeuren of Tekstherkenning uitvoeren op opgeslagen PDF wel is ingeschakeld, maar het is geen PDF/A. Wil je dat, dan kun je het bestand alsnog omzetten met reeds eerder vermelde, gratis tools als NAPS2 of PDFCreator (zie ook kader ‘Pdf-printer’).

Met (het gratis) Adobe Scan kun je ook meerdere pagina’s laten OCR’en en in één pdf bewaren.

Tip 4: Tags koppelen

Om naderhand snel het gewenste document te kunnen terugvinden, zorg je er dus allereerst voor dat je documenten doorzoekbaar zijn (bij pdf’s kan dit via OCR: zie tip 2). Je kunt gerust ook zelf extra trefwoorden, zeg maar digitale kleefbriefjes, aan je documenten koppelen.

Met een tool als TagSpaces (www.tagspaces.org, Windows, macOS en Linux) tag je in één keer meerdere bestanden en mappen met eigen trefwoorden. Bestaande tags voeg je simpelweg toe door ze naar bestanden te slepen. TagSpaces heeft ook een krachtige zoekfunctie waarmee je snel documenten met de juiste tag(s) terugvindt.

Handig zijn ook ‘smart tags’: je bepaalt dan zelf de criteria, waarna nieuwe bestanden automatisch de juiste tags krijgen. Deze tags kun je opslaan in aparte sidecar-bestanden (JSON) of je voegt ze achteraan de bestandsnaam toe: een bestand als aanpassing.pdf bijvoorbeeld wordt dan iets als aanpassing[huur indexering].pdf. De betaalde Pro-versie (42 euro per jaar) heeft enkele geavanceerde opties, zoals het toekennen van tags op basis van lokale AI-taalmodellen.

TagSpaces is een krachtige taggingtool, maar met een zekere leercurve.

Tip 5: Tags zoeken

Vind je TagSpaces toch wat overkill, dan zijn er andere manieren om documenten van (doorzoekbare) trefwoorden te voorzien. Je kunt in Verkenner (met sneltoets F2) trefwoorden toevoegen aan de bestandsnaam, maar het kan ook anders. Klik met rechts op een bestand of selectie, kies Eigenschappen en open het tabblad Details. Afhankelijk van het bestandstype kun je hier tags toevoegen bij velden als Titel, Onderwerp, Labels, Categorieën en Opmerkingen. Dit werkt goed bij bijvoorbeeld Office-bestanden en afbeeldingen, maar pdf-documenten laten zich minder makkelijk taggen. Dit kan bijvoorbeeld wel bij het aanmaken van zo’n document vanuit NAPS2 of PDFCreator. Bij deze laatste kun je bij een profiel titel, auteur, onderwerp en trefwoorden meegeven.

Vanuit de Verkenner kun je vervolgens zoeken op deze tags, ook in pdf-bestanden (ook al zijn ze niet zichtbaar op het tabblad Details). Navigeer naar de juiste map of het station en typ in de zoekbalk van de Verkenner labels:<trefwoord>.

Werkt dit niet, dan ontbreekt waarschijnlijk een geschikt zoekfilter. Je kunt zo’n Adobe-IFilter alsnog installeren via deze link. Je kunt dit controleren vanuit het Configuratiescherm: open Indexeringsopties, klik op Geavanceerd en scrol op het tabblad Bestandstypen naar pdf. Daar hoort PDF Filter (of eventueel Reader Search Handler) te staan, en Eigenschappen en inhoud van het bestand indexeren moet zijn ingeschakeld. Zorg er tevens voor dat alle gewenste mappen zijn opgenomen bij Deze locaties beheren (via de knop Wijzigen).

Met het juiste filter kun je ook vanuit de Verkenner naar tags binnen pdf-documenten zoeken.

Tip 6: Opslagstructuur

Je documenten zijn nu doorzoekbaar en mogelijk ook getagd, maar er is nog een derde belangrijk aspect: bewaar alles met logische bestandsnamen in een doordachte mappenstructuur.

Voor bestandsnamen plaats je de belangrijkste info, zoals projectnaam en/of datum, liefst vooraan. Gebruik de ISO-notatie (JJJJ-MM-DD), zodat je bestanden makkelijk chronologisch sorteert. Zoals vermeld in tips 4 en 5 kun je de naam aanvullen met trefwoorden, gescheiden door een koppelteken of onderstrepingsteken (vermijd spaties of speciale tekens). Eventueel voeg je achteraan een versienummer toe, zoals _v1. Een voorbeeld is 2025-08-31_Huurcontract_Appartement_v1.pdf.

Breng de bestanden onder in een logische structuur, bijvoorbeeld op datum, per project of klant, of per categorie (zoals Huis, Werk, Gezondheid, Financieel enzovoort). Je zult merken: dankzij consistente map- en bestandsnamen vind je documenten sneller terug.

Sneller zoeken binnen een logische mappenstructuur (en met labels).

Tip 7: Organisatietool

Je hebt een logische mappenhiërarchie opgezet, maar je moet natuurlijk ook zorgen dat documenten in de juiste map terechtkomen. Externe hulp van een organisatietool als het gratis Dropit (www.dropitproject.com, werkt nog onder Windows 11) of File Juggler (www.filejuggler.com, betaalde versie 44 euro) kan daarbij handig zijn. We bekijken kort deze laatste.

Start de geïnstalleerde tool op en klik op Add rule (of eerst op Add rule group als je de regels wilt categoriseren). Stel dat je alle pdf’s die in de map \gedeeld terechtkomen automatisch wilt verplaatsen op basis van trefwoorden. Vul dan Description in en klik op de knop met drie puntjes bij Monitor om de bronmap te kiezen. Via het tandwielpictogram kun je eventueel Examine everything regularly <frequentie> between checks instellen, wat ook goed werkt voor gedeelde netwerkmappen.

Klik daarna op de plus-knop bij If en stel het filtercriterium in, bijvoorbeeld: Any of the following / Other / PDF Properties / Keywords. Bevestig met Insert en geef het trefwoord op bij Contains / Text. Je kunt via de plus-knop extra filters instellen en kiezen tussen Any of All of the following.

Leg nu de gewenste actie vast bij Then: klik op de plusknop, kies bijvoorbeeld Move file en vul de doelmap in bij to. Bewaar je filter met Save and close. Op het tabblad Rules klik je op de pijlknop naast je filter om het te activeren. Test het resultaat.

Organiseer je bestanden automatisch op basis van eigen, gecombineerde zoekfilters.

DMS

Met de tips rond doorzoekbaar maken, taggen en ordenen uit dit artikel, en met tools als TagSpaces en File Juggler, raak je al ver. Wil je je administratie nog professioneler organiseren, dan kom je uit bij een volwaardig Document Management System, kortweg DMS. Flexibele opensource-tools zijn bijvoorbeeld Papermerge en Paperless NGX. Beide installeer je het makkelijkst op Windows via Docker (Docker Desktop for Windows, met WSL2).

Na installatie bereik je het browserdashboard van de tool standaard via http://<ip-adres>:8000. Beide tools bieden OCR aan om gescande documenten doorzoekbaar te maken. Je documenten kunnen ook automatisch worden verwerkt op basis van eigen filters, en er zijn krachtige zoekopties ingebouwd. Beide tools kun je meteen uitproberen via een online demo (log in met demo / demo).

Een krachtig DMS als Paperless-ngx maakt het bijhouden van je administratie veel efficiënter.

Tip 8: Zoektool

Zoals gezegd laat de ingebouwde zoektool in Windows je met de juiste filters en instellingen ook zoeken naar metadata, zoals trefwoorden in pdf’s. Met zoekfilters en operatoren zijn zelfs complexe opdrachten mogelijk, zoals labels:factuur auteur:Toon van Daele grootte:>300kB gewijzigdop:dit jaar. Echt gebruiksvriendelijk of handig is deze functie helaas niet. Je bent dan beter af met een tool als Agent Ransack (alias Filelocator Pro, www.mythicsoft.com/agentransack). Ook de gratis Lite-versie ondersteunt netwerkshares, Booleaanse operatoren, reguliere expressies en zoeken naar metadata via IFilter.

Start de tool, zet deze op Expert en open het tabblad Hoofd. Vul bij Bevat tekst je zoekterm in en bij Zoek in het gewenste station of de map. Eventueel kun je ook filters instellen voor Grootte en Gewijzigd Na / Voor. Op het tabblad Datum voeg je extra tijdsfilters toe en op het tabblad Opties vink je zeker Office en PDF documenten aan. Vul je bij Bevat tekst een pdf-trefwoord in, dan vindt Agent Ransack ook de bijbehorende bestanden. In het tabblad Treffers (rechtsonder) zie je bij gevonden bestanden bijvoorbeeld Keywords: <gezocht_trefwoord>. Met een dubbelklik open je meteen het bestand.

Agent Ransack laat gecombineerde en krachtige filters toe en zoekt ook in metadata.

Tip 9: Back-ups

Je administratie digitaliseren is een goed idee, maar dit is pas veilig met een degelijke back-upstrategie. Het best hanteer je hier de 3-2-1-regel: drie datakopieën (hoofdversie en twee back-ups), op twee soorten media, waarvan minstens één kopie op een andere locatie. Zo bescherm je je data tegen hardwarestoringen, ransomware, brand en diefstal.

Een uitstekende gratis en opensource back-uptool is Duplicati (www.duplicati.com, Windows en macOS), die we zelf al jaren dagelijks geautomatiseerd gebruiken voor back-ups naar zowel een netwerkschijf (NAS) als de cloud (Google Drive).

Installeer het gedownloade msi-bestand. Klik na afloop met rechts op het programma-pictogram in het Windows-systeemvak en kies Open om het browserdashboard te starten. Verschijnt First Run Setup, klik dan op Yes en stel een wachtwoord in. Je kunt Duplicati in je browser openen via http://localhost:8200. Wil je ook toegang vanaf een andere pc in je netwerk, open Instellingen in Duplicati en vink Remote toegang toestaan aan, zodat het dashboard bereikbaar is via http://<intern_ip-adres>:8200. Klik vervolgens op +Back-up toevoegen, laat Een nieuwe back-up instellen geselecteerd en vul een naam in. Schakel bij opslag buiten je netwerk versleuteling in. Geef vervolgens doel- en bronlocatie op en bepaal wanneer en hoe vaak de back-up wordt uitgevoerd. Duplicati maakt standaard incrementele back-ups, waarbij alleen nieuwe of gewijzigde data worden opgeslagen, waardoor het back-upvolume beperkt blijft.

Duplicati is een betrouwbare, gebruiksvriendelijke en flexibele back-uptool.

Tip 10: Beveiliging

Een goede back-upstrategie is cruciaal om je data veilig te bewaren, maar veiligheid draait ook om privacy. De beste manier om te voorkomen dat onbevoegden inzage krijgen in je (medische, financiële …) gegevens is versleuteling. In tip 9 vermeldden we al dat je in Duplicati back-ups automatisch kunt versleutelen met sterke AES-256-encryptie. Maar ook de data op je originele opslaglocatie wil je wellicht beveiligen.

Hiervoor kun je een gratis opensource-tool als VeraCrypt gebruiken, die naast containerbestanden ook complete partities of schijven kan versleutelen met sterke algoritmen als AES-256. We hebben niet de ruimte hier verder op in te gaan, maar hier vind je meer uitleg. Ook handig is Cryptomator om via je lokale synchronisatiemap data te versleutelen bij cloudopslagdiensten als Google Drive, OneDrive of Dropbox. Je vindt hier meer uitleg daarover.

Daarnaast kun je voor diverse documenttypes ook individuele bestanden beveiligen met een wachtwoord, al is dit vaak minder robuust dan een volledig versleutelde opslaglocatie. Dit kan bijvoorbeeld vanuit verschillende Office-applicaties, maar ook met pdf-tools zoals NAPS2 (bij PDF-instellingen vink je PDF versleutelen aan) en PDFCreator (bij Profielen, via Actie toevoegen / Versleuteling).

Ook in NAPS2 kun je pdf-documenten met een wachtwoord beveiligen.