ID.nl logo
Programmeren in Python met ChatGPT - Deel 3
© Dahina - stock.adobe.com
Huis

Programmeren in Python met ChatGPT - Deel 3

In deel 2 van deze artikelreeks leerde je hoe je verslagen van vergaderingen kon samenvatten met de OpenAI-API in de programmeertaal Python. Maar je kunt nog meer: het taalmodel achter ChatGPT is in staat om teksten te analyseren en daaruit besproken onderwerpen te halen. Zo kun je documenten automatisch op onderwerp ordenen.

In dit derde deel laten we ChatGPT onze teksten analyseren om daaruit de onderwerpen te extraheren, zodat we zelf gemakkelijker onze teksten kunnen taggen of ordenen:

  • Eerst zorgen we ervoor dat de juiste bestanden gevonden worden
  • Daarna laten we de bestanden analyseren
  • Tot slot zorgen we ervoor dat de gevonden onderwerpen worden omgezet in tags

Lees ook: Weg met de chaos! Organiseer je bestanden met TagSpaces

Code downloaden In deze workshop worden wat voorbeelden van stukken code gegeven. Omdat overtikken van code erg foutgevoelig is, kun je die code beter downloaden en daarna bekijken of kopiëren. Via deze link kun je twee bestanden downloaden: het bestand extract_tags.py (dat het eindresultaat van deze workshop bevat) en het bestand gptcode-dl3.txt (dat alle losse opdrachten uit deze hele aflevering bevat).

In deel 2 zagen we al dat ChatGPT veel meer kan dan gewoon conversaties voeren. Het taalmodel draait zijn hand bijvoorbeeld niet om voor de taak om teksten samen te vatten. We kunnen dat principe in nog veel extremere vorm doorzetten: vraag om de besproken onderwerpen van een tekst te geven in enkele woorden. Dat is ideaal om automatisch tags aan teksten toe te kennen om ze daarna sneller terug te vinden. In dit deel realiseren we dit met de OpenAI-API in Python waar je ondertussen al wat vertrouwd mee bent.

Alle bestanden doorlopen

Kopieer het Python-script summarize_docx_files.py uit deel 2. Dit bestand gebruiken we als basis en passen we hier aan. Vervang allereerst de systeemprompt in het begin:

SYSTEM_PROMPT = "Beschrijf de vijf belangrijkste onderwerpen die in de volgende tekst besproken zijn."

We gaan de systeemprompt later nog verder aanpassen, want zoals we in de vorige delen van de reeks hebben gezegd, moet die prompt zo specifiek mogelijk zijn. Maar we moeten ergens beginnen.

Voor het samenvatten van verslagen gingen we ervan uit dat alle Word-bestanden zich in dezelfde directory bevonden. Nu willen we veel meer bestanden verwerken, ook als ze zich in subdirectory’s bevinden. Daarom veranderen we de functie process_docx_files in:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via .

Met rglob krijgen we een lijst van alle paden die op .docx eindigen. We controleren dan nog voor de zekerheid of het om een bestand gaat en niet om een directory waarvan de naam eindigt op .docx. Daarna lezen we de inhoud met de functie read_docx die we vorige keer hadden gemaakt.

Sla in Visual Studio Code met Ctrl+S het script op onder de naam extract_tags.py en open een opdrachtregelvenster met het menu Terminal / New Terminal. Voer het programma hierin als volgt uit:

python extract_tags.py directorymetdocumenten

Vervang directorymetdocumenten door het daadwerkelijke pad waarin al je te analyseren documenten staan.

Grotere bestanden analyseren

Als je dit nu toepast op een directory met grotere documenten, crasht je Python-programma met een foutmelding zoals:

openai.error.InvalidRequestError: This model's maximum context length is 4097 tokens. However, your messages resulted in 4202 tokens. Please reduce the length of the messages.

Dat is een beperking van het model gpt-3.5-turbo, dat maar iets meer dan 4000 tokens kan verwerken. Met een ander model kunnen we meer tokens verwerken, maar allereerst willen we dat het programma niet meer crasht en gewoon doorgaat met de volgende teksten als één specifieke tekst te lang is. Vervang daarom de regel print(get_completion(text, SYSTEM_PROMPT)) helemaal op het einde door:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via .

Voor elk document dat te groot is, krijgen we nu nog altijd de foutmelding. Maar het programma gaat dan verder met het volgende document.

Zoals gezegd kunnen we ook nog het model in het begin van het programma vervangen:

DEFAULT_MODEL = "gpt-3.5-turbo-16k"

Dit 16K-model ondersteunt vier keer zoveel tokens, maar je betaalt er wel twee keer zoveel voor per token.

De taalmodellen van OpenAI bestaan in verschillende versies. Wil je langere documenten analyseren, dan betaal je meer.

Van onderwerpen naar tags

Als je de voorgaande code uitvoert, krijg je volledige zinnen of korte steekwoorden terug met beschrijvingen van de onderwerpen. Dat is niet onze bedoeling. We moeten dus in de systeemprompt duidelijk maken wat we wél willen: korte tags van één of twee woorden:

SYSTEM_PROMPT = "Geef de vijf belangrijkste tags die de volgende tekst beschrijven. Elke tag is één of twee woorden lang. Scheid de tags van elkaar door een komma."

Het resultaat is deze keer wel wat we verwachten, al slipt er soms een tag van drie woorden door. Maar als dat iets als ‘Raspberry Pi Pico’ is, zien we dat door de vingers. Als we deze tags verder willen verwerken, moeten we ze wel consistent maken. Daarvoor schrijven we een extra functie.

Nabewerking

Een voorbeeld maakt dit duidelijk. Stel dat ons programma de volgende tags uit een tekst haalt: Zigbee, Z-Wave, Bluetooth Mesh, Thread, Domoticaprotocollen. Dan willen we daar een lijst van maken met tags zigbee, z-wave, bluetooth-mesh, thread en domoticaprotocollen. Dat doen we met de volgende functie:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via .

De parameter tags is gewoon een string zoals ‘Domoticacontroller, Home Assistant, Raspberry Pi, Domoticatoestellen, Installatie’ die we van de OpenAI-API terugkrijgen. We splitsen die op elke komma, waardoor we een lijst met tags krijgen. Voor elke tag in die lijst halen we met strip() eerst alle spaties in het begin en eind weg, zetten we met lower() alle letters om naar kleine letters en vervangen we dan elke spatie in het midden door een koppelteken (-).

Om nu de tags te normaliseren, vervangen we de regel print(get_completion(text, SYSTEM_PROMPT)) op het einde van het script door:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via .

Je krijgt nu voor elk document de tags te zien in de vorm van een lijst in Python:

['zigbee', 'z-wave', 'bluetooth-mesh', 'thread', 'domoticaprotocollen']

Artikelen per tag

Tot nu toe gebruiken we de tags gewoon als een heel beknopte samenvatting van documenten. Maar we kunnen het ook omdraaien: na het extraheren van alle tags, kunnen we aan elke tag de documenten koppelen die door deze tag worden beschreven. Zo kunnen we achteraf heel eenvoudig opvragen welke documenten bij een specifieke tag horen.

Hoe doen we dit? Daarvoor vervangen we de hele for-lus op het einde van het programma door de volgende code:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via .

We maken dus eerst een lege dictionary documents aan. Daarna lopen we weer door alle bestanden met hun overeenkomstige tekst. We vragen aan de OpenAI-API om de tags uit te tekst te extraheren en we normaliseren die. Voor elke tag bekijken we dan of die al in de dictionary zit. Zo nee, dan voegen we die toe met als bijbehorende waarde een lege lijst. Daarna voegen we het pad van het geanalyseerde document aan die tag toe.

Uiteindelijk wanneer we alle bestanden op deze manier hebben geanalyseerd, bevat de dictionary documents tags met een lijst van bijbehorende bestanden. Die laten we nu tag na tag zien. En zo weet je onmiddellijk welke documenten je nodig hebt als je meer over een onderwerp wilt weten!

Kijk welke documenten over specifieke tags gaan.

Volgende week maandag het vierde deel van deze reeks! Hierin laten we ChatGPT in Python teksten vertalen en geschreven opdrachten omzetten in een computertaal.

Lees ook:

▼ Volgende artikel
CES 2026: eufy S2 robotstofzuiger met ingebouwde luchtverfrisser
© eufy | Anker Innovations
Huis

CES 2026: eufy S2 robotstofzuiger met ingebouwde luchtverfrisser

Tijdens CES 2026 heeft eufy, het smart living-merk van Anker Innovations, de eufy S2 gepresenteerd. Opvallend aan deze robotstofzuiger/dweiler is dat hij een ingebouwde luchtverfrisser heeft, waarbij je kunt kiezen uit drie geuren.

De eufy S2 gebruikt de HydroJet 2.0-techniek, waarbij een langwerpige dweil zichzelf continu schoonmaakt met 360 omwentelingen per minuut. Het station gebruikt geëlektrolyseerd water, wat zorgt voor een glanzend resultaat en minder bacterievorming. De AeroTurbo 2.0-motor levert een constante zuigkracht van 30.000 pascal, terwijl een druk van 15 newton helpt om ook hardnekkig vuil los te krijgen.

Slim navigeren doet de robotstofzuiger met CleanMind AI, dat via 3D-mapping kamers en oppervlakken herkent en zo zijn route aanpast. Dankzij een uitschuifbare arm en Carpet Master-technologie reinigt de S2 ook tapijten tot 53 millimeter hoog. Opvallend is de ingebouwde geurfunctie. De robot kan drie verwisselbare geuren verspreiden: citrus-basilicum, bamboe-salie of bergamot-lychee. Je huis wordt dus niet alleen schoon, maar ruikt ook nog eens heerlijk fris.

De S2 is ontworpen voor minimaal onderhoud. De tanks voor schoon en vuil water zijn ruim bemeten, en filters reinigen zichzelf grotendeels automatisch. Zo blijft het schoonmaken beperkt tot het leegmaken van het station – de rest doet de robot zelf.

©eufy | Anker Innovations

Prijs en beschikbaarheid

De eufy S2 heeft een adviesprijs van 1499 euro en is vanaf 4 februari 2026 verkrijgbaar.

Wat doet geëlektrolyseerd water?

Geëlektrolyseerd water is eigenlijk gewoon kraanwater dat tijdelijk wordt geactiveerd met een zwakke elektrische stroom. In het basisstation wordt het water kortstondig omgezet in een mild desinfectiemiddel: door elektrolyse worden watermoleculen en mineralen gesplitst, waarbij onder meer hypochlorigzuur ontstaat. Die stof breekt bacteriën en micro-organismen af, op een manier die vergelijkbaar is met hoe het menselijk immuunsysteem ziekteverwekkers aanpakt.

Het voordeel van deze technologie in een robotstofzuiger zoals die van eufy is dat ze hygiënisch schoonmaakt zonder chemische middelen. De robot gebruikt het actieve water om de dweil voortdurend te reinigen en de vloer te dweilen, waarbij tot 99,9 procent van de bacteriën verdwijnt. Omdat de werking vanzelf verdwijnt en het water weer terugkeert naar zijn oorspronkelijke staat, blijven er geen resten of dampen achter. Dat maakt het een veilige oplossing voor huishoudens met kinderen of huisdieren.

▼ Volgende artikel
CES 2026: Acer brengt razendsnelle wifi 7 en 5G naar je woonkamer en onderweg
© Acer
Huis

CES 2026: Acer brengt razendsnelle wifi 7 en 5G naar je woonkamer en onderweg

Op zoek naar de ultieme verbinding? Acer onthult tijdens CES vier nieuwe netwerkproducten met de nieuwste wifi 7- en 5G-technologie. Van een krachtige Predator-router voor gamers tot slimme mesh-systemen en een mobiele hotspot.

Acer heeft tijdens CES in Las Vegas het assortiment aan netwerk- en connectiviteitsproducten uitgebreid met vier nieuwe apparaten. Het gaat om een 5G CPE-router gericht op gaming, twee wifi 7 mesh-routers voor thuis en kleine kantoren, en een draagbare 5G-hotspot voor mobiel gebruik. Met deze introducties speelt de fabrikant in op de eeuwige vraag naar snellere en stabielere verbindingen, zowel binnenshuis als onderweg. Alle aangekondigde producten maken gebruik van de laatste wifi 7- en 5G-technologieën en zijn bedoeld voor diverse gebruiksscenario's, zoals vaste thuisnetwerken tot flexibel werken op locatie.

©Acer

De Predator Connect X7S 5G kan overweg met 5G én wifi 7.

5G en wifi 7 in één router

De Predator Connect X7S 5G CPE is een router voor gebruikers die hoge eisen stellen aan netwerkprestaties, zoals gamers en streamers. Het apparaat combineert mobiele 5G-connectiviteit met tri-band wifi 7, waarbij gebruik wordt gemaakt van de 2,4GHz-, 5GHz- en 6GHz-banden. Hierdoor kan de router volgens Acer downloadsnelheden tot 4,67 Gbps via 5G ondersteunen, wat vooral relevant is op locaties waar glasvezel ontbreekt of beperkt beschikbaar is. Door meerdere banden tegelijk te benutten, kan de verbinding stabiel blijven wanneer meerdere apparaten actief zijn.

Naast de draadloze mogelijkheden beschikt de Predator Connect X7S over functies die gericht zijn op het beheren van netwerkverkeer. Via Hybrid Quality of Service en ondersteuning voor Intel Killer Prioritization Engine kan bandbreedte worden toegewezen aan toepassingen die gevoelig zijn voor vertraging, zoals online games of videostreaming. De router ondersteunt zowel 5G als 4G LTE via een nano-SIM en kan daarnaast overschakelen naar een bekabelde 2,5 Gbps Ethernet WAN-verbinding als back-up. Daarmee is het apparaat bedoeld als centrale netwerkoplossing voor vaste én mobiele internetverbindingen binnen één huishouden.

©Acer

De Acer Connect Ovia T360 (links) en de T520 (rechts) zijn wifi 7 mesh-routers voor appartementen en middelgrote woningen.

Mesh-routers voor woningen en kleine kantoren

Voor vaste netwerken introduceert Acer de Connect Ovia T360 en T520, twee wifi 7 mesh-routers met verschillende configuraties. De T360 is een dual-band model dat gebruikmaakt van 2,4 GHz en 5 GHz en per knooppunt een dekking tot circa 90 vierkante meter biedt. Deze uitvoering richt zich vooral op appartementen en kleinere woningen waar een stabiele basisdekking volstaat. De T520 voegt daar een extra 6GHz-band aan toe en vergroot de dekking per knooppunt tot ongeveer 110 vierkante meter, wat deze router geschikter maakt voor grotere woningen of omgevingen met veel gelijktijdige verbindingen.

Beide mesh-systemen zijn ontworpen om dode zones in huis of kantoor te verminderen door meerdere knooppunten te laten samenwerken. Ondersteuning voor wifi 7-functies zoals Multi-Link Operation maakt het mogelijk om meerdere frequentiebanden tegelijk te gebruiken, wat kan bijdragen aan lagere latentie en een hogere doorvoersnelheid. Extra knooppunten kunnen eenvoudig worden toegevoegd, waarbij apparaten automatisch overschakelen naar het sterkste signaal wanneer gebruikers zich door de ruimte bewegen. Naast draadloze verbindingen bieden de routers ook snelle LAN- en WAN-poorten voor apparaten die je liever bekabeld gebruikt.

©Acer

Met de Acer Connect M4D geniet je (bijna) overal ter wereld van een snelle internetverbinding.

Mobiele hotspot voor onderweg

Met de Connect M4D 5G Mobile WiFi richt Acer zich op gebruikers die ook buiten huis of kantoor een fatsoenlijke internetverbinding willen. Deze compacte hotspot kan een 5G-verbinding delen met maximaal zestien apparaten tegelijk via dual-band wifi 6. Dat maakt het apparaat geschikt voor zakelijk reizen, woon-werkverkeer of situaties waarin tijdelijk een eigen netwerk nodig is. De ingebouwde batterij heeft volgens Acer een gebruiksduur tot 15 uur, wat genoeg moet zijn voor een volledige werkdag zonder opladen.

De M4D ondersteunt verschillende SIM-opties, waaronder nano-SIM, eSIM en virtuele SIM, waardoor gebruikers tussen providers en regio's kunnen wisselen zonder van hardware te veranderen. Je kunt het apparaat ook inzetten als wifi-extender of via usb-tethering koppelen aan laptops met verschillende besturingssystemen. Met het optionele dockingstation verander je de hotspot in een compacte vaste router met een bekabelde LAN-aansluiting. Op het gebied van beveiliging zijn onder meer WPA2- en WPA3-codering, firewallfuncties en vpn-ondersteuning aanwezig, terwijl software-updates automatisch via het netwerk worden uitgevoerd.

Centraal beheer en beveiliging

Alle nieuwe Predator- en Acer Connect Ovia-producten maken gebruik van dezelfde Acer Connect-app voor installatie en beheer. Via deze app kun je mesh-knooppunten configureren, verbonden apparaten beheren en gastnetwerken instellen via een smartphone. Daarnaast biedt Acer een uniforme set beveiligingsopties, waaronder WPA3-versleuteling, ouderlijk toezicht en firewall-instellingen.

Alle hierboven genoemde apparaten worden in juni in de Benelux verwacht. Exacte prijzen en definitieve specificaties volgen. Volgens Acer wordt aanvullende informatie over lokale beschikbaarheid en configuraties later via de regionale verkoopkanalen bekendgemaakt.