ID.nl logo
Programmeren in Python met ChatGPT - Deel 3
© Dahina - stock.adobe.com
Huis

Programmeren in Python met ChatGPT - Deel 3

In deel 2 van deze artikelreeks leerde je hoe je verslagen van vergaderingen kon samenvatten met de OpenAI-API in de programmeertaal Python. Maar je kunt nog meer: het taalmodel achter ChatGPT is in staat om teksten te analyseren en daaruit besproken onderwerpen te halen. Zo kun je documenten automatisch op onderwerp ordenen.

In dit derde deel laten we ChatGPT onze teksten analyseren om daaruit de onderwerpen te extraheren, zodat we zelf gemakkelijker onze teksten kunnen taggen of ordenen:

  • Eerst zorgen we ervoor dat de juiste bestanden gevonden worden
  • Daarna laten we de bestanden analyseren
  • Tot slot zorgen we ervoor dat de gevonden onderwerpen worden omgezet in tags

Lees ook: Weg met de chaos! Organiseer je bestanden met TagSpaces

Code downloaden In deze workshop worden wat voorbeelden van stukken code gegeven. Omdat overtikken van code erg foutgevoelig is, kun je die code beter downloaden en daarna bekijken of kopiëren. Via deze link kun je twee bestanden downloaden: het bestand extract_tags.py (dat het eindresultaat van deze workshop bevat) en het bestand gptcode-dl3.txt (dat alle losse opdrachten uit deze hele aflevering bevat).

In deel 2 zagen we al dat ChatGPT veel meer kan dan gewoon conversaties voeren. Het taalmodel draait zijn hand bijvoorbeeld niet om voor de taak om teksten samen te vatten. We kunnen dat principe in nog veel extremere vorm doorzetten: vraag om de besproken onderwerpen van een tekst te geven in enkele woorden. Dat is ideaal om automatisch tags aan teksten toe te kennen om ze daarna sneller terug te vinden. In dit deel realiseren we dit met de OpenAI-API in Python waar je ondertussen al wat vertrouwd mee bent.

Alle bestanden doorlopen

Kopieer het Python-script summarize_docx_files.py uit deel 2. Dit bestand gebruiken we als basis en passen we hier aan. Vervang allereerst de systeemprompt in het begin:

SYSTEM_PROMPT = "Beschrijf de vijf belangrijkste onderwerpen die in de volgende tekst besproken zijn."

We gaan de systeemprompt later nog verder aanpassen, want zoals we in de vorige delen van de reeks hebben gezegd, moet die prompt zo specifiek mogelijk zijn. Maar we moeten ergens beginnen.

Voor het samenvatten van verslagen gingen we ervan uit dat alle Word-bestanden zich in dezelfde directory bevonden. Nu willen we veel meer bestanden verwerken, ook als ze zich in subdirectory’s bevinden. Daarom veranderen we de functie process_docx_files in:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via deze pagina.

Met rglob krijgen we een lijst van alle paden die op .docx eindigen. We controleren dan nog voor de zekerheid of het om een bestand gaat en niet om een directory waarvan de naam eindigt op .docx. Daarna lezen we de inhoud met de functie read_docx die we vorige keer hadden gemaakt.

Sla in Visual Studio Code met Ctrl+S het script op onder de naam extract_tags.py en open een opdrachtregelvenster met het menu Terminal / New Terminal. Voer het programma hierin als volgt uit:

python extract_tags.py directorymetdocumenten

Vervang directorymetdocumenten door het daadwerkelijke pad waarin al je te analyseren documenten staan.

Grotere bestanden analyseren

Als je dit nu toepast op een directory met grotere documenten, crasht je Python-programma met een foutmelding zoals:

openai.error.InvalidRequestError: This model's maximum context length is 4097 tokens. However, your messages resulted in 4202 tokens. Please reduce the length of the messages.

Dat is een beperking van het model gpt-3.5-turbo, dat maar iets meer dan 4000 tokens kan verwerken. Met een ander model kunnen we meer tokens verwerken, maar allereerst willen we dat het programma niet meer crasht en gewoon doorgaat met de volgende teksten als één specifieke tekst te lang is. Vervang daarom de regel print(get_completion(text, SYSTEM_PROMPT)) helemaal op het einde door:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via deze pagina.

Voor elk document dat te groot is, krijgen we nu nog altijd de foutmelding. Maar het programma gaat dan verder met het volgende document.

Zoals gezegd kunnen we ook nog het model in het begin van het programma vervangen:

DEFAULT_MODEL = "gpt-3.5-turbo-16k"

Dit 16K-model ondersteunt vier keer zoveel tokens, maar je betaalt er wel twee keer zoveel voor per token.

De taalmodellen van OpenAI bestaan in verschillende versies. Wil je langere documenten analyseren, dan betaal je meer.

Van onderwerpen naar tags

Als je de voorgaande code uitvoert, krijg je volledige zinnen of korte steekwoorden terug met beschrijvingen van de onderwerpen. Dat is niet onze bedoeling. We moeten dus in de systeemprompt duidelijk maken wat we wél willen: korte tags van één of twee woorden:

SYSTEM_PROMPT = "Geef de vijf belangrijkste tags die de volgende tekst beschrijven. Elke tag is één of twee woorden lang. Scheid de tags van elkaar door een komma."

Het resultaat is deze keer wel wat we verwachten, al slipt er soms een tag van drie woorden door. Maar als dat iets als ‘Raspberry Pi Pico’ is, zien we dat door de vingers. Als we deze tags verder willen verwerken, moeten we ze wel consistent maken. Daarvoor schrijven we een extra functie.

Nabewerking

Een voorbeeld maakt dit duidelijk. Stel dat ons programma de volgende tags uit een tekst haalt: Zigbee, Z-Wave, Bluetooth Mesh, Thread, Domoticaprotocollen. Dan willen we daar een lijst van maken met tags zigbee, z-wave, bluetooth-mesh, thread en domoticaprotocollen. Dat doen we met de volgende functie:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via deze pagina.

De parameter tags is gewoon een string zoals ‘Domoticacontroller, Home Assistant, Raspberry Pi, Domoticatoestellen, Installatie’ die we van de OpenAI-API terugkrijgen. We splitsen die op elke komma, waardoor we een lijst met tags krijgen. Voor elke tag in die lijst halen we met strip() eerst alle spaties in het begin en eind weg, zetten we met lower() alle letters om naar kleine letters en vervangen we dan elke spatie in het midden door een koppelteken (-).

Om nu de tags te normaliseren, vervangen we de regel print(get_completion(text, SYSTEM_PROMPT)) op het einde van het script door:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via deze pagina.

Je krijgt nu voor elk document de tags te zien in de vorm van een lijst in Python:

['zigbee', 'z-wave', 'bluetooth-mesh', 'thread', 'domoticaprotocollen']

Artikelen per tag

Tot nu toe gebruiken we de tags gewoon als een heel beknopte samenvatting van documenten. Maar we kunnen het ook omdraaien: na het extraheren van alle tags, kunnen we aan elke tag de documenten koppelen die door deze tag worden beschreven. Zo kunnen we achteraf heel eenvoudig opvragen welke documenten bij een specifieke tag horen.

Hoe doen we dit? Daarvoor vervangen we de hele for-lus op het einde van het programma door de volgende code:

De code kun je bekijken in het bestand gptcode-dl3.txt, te downloaden via deze pagina.

We maken dus eerst een lege dictionary documents aan. Daarna lopen we weer door alle bestanden met hun overeenkomstige tekst. We vragen aan de OpenAI-API om de tags uit te tekst te extraheren en we normaliseren die. Voor elke tag bekijken we dan of die al in de dictionary zit. Zo nee, dan voegen we die toe met als bijbehorende waarde een lege lijst. Daarna voegen we het pad van het geanalyseerde document aan die tag toe.

Uiteindelijk wanneer we alle bestanden op deze manier hebben geanalyseerd, bevat de dictionary documents tags met een lijst van bijbehorende bestanden. Die laten we nu tag na tag zien. En zo weet je onmiddellijk welke documenten je nodig hebt als je meer over een onderwerp wilt weten!

Kijk welke documenten over specifieke tags gaan.

Volgende week maandag het vierde deel van deze reeks! Hierin laten we ChatGPT in Python teksten vertalen en geschreven opdrachten omzetten in een computertaal.

Lees ook:

▼ Volgende artikel
Waar voor je geld: 5 vriezers met een grote inhoud van minstens 100 liter
© andov
Huis

Waar voor je geld: 5 vriezers met een grote inhoud van minstens 100 liter

Bij ID.nl zijn we dol op kwaliteitsproducten waar je niet de hoofdprijs voor betaalt. Een paar keer per week speuren we daarom binnen een bepaald thema naar zulke deals. Met een aparte vriezer kun je extra veel eten invriezen en voor langere tijd bewaren. Wij zochten vier vrijstaande vriezers voor je met een inhoud van minstens 100 liter.

Bij een koelkast is het vriesvak meestal beperkt van formaat. Kies je voor een losse vriezer, dan heb je veel meer ruimte. Modellen met meer dan 100 liter zijn geen uitzondering. Wij hebben vijf stuks voor je gevonden met flink wat ruimte.

Whirlpool W55ZM 112 W 2 N

De Whirlpool heeft een netto inhoud van 103 liter. Met een hoogte van 83,8 cm is het apparaat geschikt voor plaatsing onder een aanrechtblad. De vriezer beschikt over twee transparante lades en een vriesvak met klep. De draairichting van de deur is omkeerbaar, waardoor de vriezer flexibel te plaatsen is. De W55ZM heeft een invriescapaciteit van 4,5 kg per 24 uur en een bewaartijd bij stroomuitval van 16 uur. De vriezer behoort tot klimaatklasse SN-T, wat betekent dat hij goed functioneert bij omgevingstemperaturen tussen +10°C en +43°C, maar niet geschikt is voor onverwarmde ruimtes als een schuur of garage. Gezien het formaat is hij ook eerder geschikt voor plaatsing in de keuken.

Jaarlijks energieverbruik: 170 kWh
Netto inhoud: 103 liter
Bewaartijd bij stroomuitval:
16 uur
Geschikt voor schuur of garage
: Nee

Bosch GSN29VLEP 

Deze vrieskast heeft een royale inhoud van 200 liter en is afgewerkt in een roestvrijstalen look, waardoor hij er strak uitziet in elke keuken. Binnenin vind je vier handige, doorzichtige vrieslades, waaronder een extra ruime BigBox-lade voor grotere producten zoals pizza's of diepvriesgroenten. Dankzij de Supervriezen-functie worden nieuwe etenswaren snel ingevroren. Bij een eventuele stroomuitval hoef je je geen zorgen te maken: de vriezer houdt je producten tot wel 25 uur op de juiste temperatuur.

Jaarlijks energieverbruik: 221 kWh
Netto inhoud: 200 liter
Bewaartijd bij stroomuitval: 25 uur
Geschikt voor schuur of garage: Nee

Inventum VR1420

De Inventum VR1420 is een vrijstaande vrieskast met een netto inhoud van 160 liter. Hij beschikt over drie transparante lades en twee vriesvakken met kleppen. De draairichting van de deur is omkeerbaar, waardoor de vriezer flexibel te plaatsen is. Met een invriesvermogen van 7,2 kg per 24 uur en een bewaartijd bij stroomuitval van 9 uur biedt de VR1420 betrouwbare prestaties. Het geluidsniveau bedraagt 42 dB, wat als normaal wordt beschouwd voor dit type apparaat. De vriezer is geschikt voor plaatsing in ruimtes met temperaturen tot -10°C, zoals een garage. Het energielabel van de VR1420 is E, met een jaarlijks energieverbruik van 235 kWh.

Jaarlijks energieverbruik: 235 kWh
Netto inhoud: 160 liter
Bewaartijd bij stroomuitval: 9 uur
Geschikt voor schuur of garage: Ja

Beko RFNE448E45W

Deze Beko heeft een netto inhoud van maar liefst 404 liter. Met een hoogte van 192 cm, een breedte van 70 cm en een diepte van 77 cm biedt deze vriezer dus ruime opslagmogelijkheden. Het apparaat heeft acht transparante vrieslades, waaronder een ruime lade voor het opslaan van grotere producten. De draairichting van de deur kan aangepast worden aan de plaatsingsruimte. Bij stroomuitval blijft de temperatuur tot 30 uur op een veilig niveau. Deze vriezer is echter niet geschikt voor de schuur of garage. Wel heeft deze vriezer een iets zuiniger energielabel dan de meeste apparaten die hier besproken zijn, namelijk D.

Jaarlijks energieverbruik: 233 kWh
Netto inhoud: 404 liter
Bewaartijd bij stroomuitval: 30 uur
Geschikt voor schuur of garage: Nee

AEG OAG7M281EX

De AEG OAG7M281EX is een vrijstaande vrieskast uit de 7000-serie met een netto inhoud van 278 liter. Dankzij de NoFrost-technologie hoef je nooit meer handmatig te ontdooien. De MultiFlow-luchtcirculatie zorgt voor een stabiele temperatuur en luchtvochtigheid in de hele vriezer, wat de kwaliteit van je voedsel beschermt. De vriezer is uitgerust met vijf transparante lades en twee uitneembare glazen legplanken, wat flexibiliteit biedt bij het opbergen van grotere items. Dankzij de elektronische bediening met LED-indicatie kun je de temperatuur en andere instellingen precies regelen. De invriescapaciteit bedraagt 13 kilogram per 24 uur, ruim voldoende om ook na een grote boodschappenronde alles snel in te vriezen.

Jaarlijks energieverbruik: 248 kWh
Netto inhoud: 278 liter
Bewaartijd bij stroomuitval: 15 uur
Geschikt voor schuur of garage: Nee

▼ Volgende artikel
Review JBL Tour One M3 – Zeer complete hoofdtelefoon
© Rens Blom
Huis

Review JBL Tour One M3 – Zeer complete hoofdtelefoon

De JBL Tour One M3 is een over-ear-hoofdtelefoon met ANC-modus, waarin hij zoveel mogelijk omgevingsgeluiden minimaliseert om jou rustig te laten luisteren naar muziek of een podcast. JBL voorziet de hoofdtelefoon van nog veel meer functies. In deze review lees je onze ervaringen met de JBL Tour One M3 na drie weken intensief gebruik.

Uitstekend
Conclusie

De JBL Tour One M3 biedt premium draagcomfort, een uitstekende accuduur en krachtig geluid in een strak jasje. De ANC-modus werkt effectief, maar moet verschillende andere hoofdtelefoons voor zich dulden. Tot slot de Smart Tx: een slim ontworpen gadget waar de een veel plezier aan gaat beleven, en waar een ander geen behoefte aan heeft. Goed dat JBL de Tour One M3 met en zonder Smart Tx aanbiedt, voor een prijs vanaf 350 euro. Een stevige prijs, maar een gerechtvaardigde prijs naar onze mening.

Plus- en minpunten
  • Prettig, vouwbaar ontwerp
  • Geluidskwaliteit
  • Veel functies
  • Optionele Smart Tx-gadget kan echt nuttig zijn
  • ANC-modus is goed maar moet sommige concurrenten voor zich dulden

JBL heeft voor velen een wat stoerder imago, onder andere door de focus op krachtige luidsprekers en oordopjes en marketing gericht op een jongere doelgroep. Daar horen ook speciale hoofdtelefoons bij. De Tour One M3 is wat dat betreft een minder typisch JBL-product, want deze luxe hoofdtelefoon past qua adviesprijs (350 euro), uitstraling en functies meer bij mensen die in alle rust willen genieten. Bijvoorbeeld in de trein of in het vliegtuig. Ja, de Tour One M3 is zeker interessant voor (zaken)reizigers. Een domein waar traditioneel vooral Bose en Sony sterk in zijn.

Ontwerp en draagcomfort

De JBL Tour One M3 oogt zakelijk in zijn blauwe (getest), zwarte of zandachtige kleur en valt prettig over onze oren heen. De hoofdband is zacht en irriteert niet na een paar uur luisteren. We krijgen dan wel wat warme oren. Je kunt de bluetooth-hoofdtelefoon opvouwen. De knoppen op de schelpen voor de bediening vergen wat gewenning om op de tast te vinden, maar werken naar behoren.

©Rens Blom

Ook de meegeleverde opbergdoos is strak, sterk gebouwd en geeft een premium gevoel. In de doos zitten genoeg kabels om de hoofdtelefoon bekabeld te gebruiken, ook in het vliegtuig. Een usb-c-oplaadkabel is uiteraard ook aanwezig.

©Rens Blom

Geluidskwaliteit en ANC-modus

Heel belangrijk aan een dure hoofdtelefoon is de geluidskwaliteit. We vallen met de deur in huis: die is heel goed bij de JBL Tour One M3. De hoofdtelefoon klinkt krachtig, duidelijk en best ruimtelijk. Altijd knap aangezien de oorschelpen over je oren heen vallen en het geluid dus heel duidelijk je oren in gaat.

Wat we ook fijn vinden is dat JBL geen extra nadruk legt op de bas, iets dat het merk wel doet bij producten die meer op jongeren gericht zijn. Podcasts klinken ook lekker realistisch.

We zijn ook fan van de uitgebreide equalizer in de JBL Headphones-app die je op je smartphone kunt installeren. Wie raad weet met een equalizer, kan lekker pingelen in de app om de geluidskwaliteit van de Tour One M3 meer naar eigen hand te zetten.

©Rens Blom

De app van JBL biedt heel veel functies.

De ANC-modus is effectief in het onderdrukken van omgevingsgeluiden, vooral repetitieve geluiden als vliegtuigmotoren (wanneer we in het vliegtuig zitten) of voorbijrazende auto's (als we op circa dertig meter van een drukkere weg wandelen). We merken echter ook dat de Sonos Ace en Sony WH-1000XM5 nog beter zijn in het minimaliseren van niet-repetitieve geluiden, zoals luid pratende mensen achter je in het vliegtuig, joelende kinderen in de trein of knisperende verpakkingen in een kantoortuin. Met de JBL Tour One M3 op horen we dergelijke geluiden meer dan met de twee andere genoemde hoofdtelefoons. Voor onze volgende langere vlieg- en treinreizen kiezen we daarom liever voor een van die andere modellen. Niet omdat de accuduur van de Tour One M3 tegenvalt – die is ruim voldoende – maar vanwege de demping van omgevingsgeluid.

©Rens Blom

Accuduur

Over die accuduur gesproken: de Tour One M3 gaat zeker 35 uur mee bij het luisteren naar muziek met de ANC-modus aan. Zonder ANC komen daar nog tientallen uren bij. Opladen doet de hoofdtelefoon snel via zijn usb-c-poort. Vijf minuten opladen is goed voor ruim drie uur muziek luisteren.

Smart Tx is interessante gadget

Dan nog even over de Smart Tx, het kleine rechthoekige apparaatje dat werkt met de hoofdtelefoon. De Smart Tx heeft een accu die in de praktijk meerdere werkdagen meegaat, of langer als je de hoofdtelefoon minder vaak gebruikt. Op het aanraakgevoelige schermpje van de gadget zie je nuttige informatie over het gebruik van de hoofdtelefoon en je muziek. Je kunt ook allerlei instellingen veranderen. Met deze gadget binnen handbereik hoef je de JBL-app op je smartphone eigenlijk niet te openen.

©Rens Blom

Maar de gadget kan – gelukkig – meer. Je kunt 'm namelijk bekabeld via usb aansluiten op vele typen audiobronnen, van een computer en televisie tot het inflight-entertainmentsysteem in het vliegtuig. Na het koppelen en aanzetten van de Smart TX maakt deze automatisch verbinding met je Tour One M3 en stuurt het geluid draadloos door. Zo kun je dus een film kijken op het vliegtuigschermpje zonder dat je per ongeluk de kabel uit je hoofdtelefoon trekt als je je dekentje lekker warm om je benen vouwt.

©Rens Blom

Ook noemenswaardig is dat de Smart Tx ondersteuning biedt voor Auracast, een relatief nieuwe bluetooth-functionaliteit waarmee je geluid van één apparaat kunt streamen naar meerdere ondersteunde hoofdtelefoons, oordopjes en luidsprekers. JBL zet al langer in op Auracast, wat de Smart Tx-gadget extra nuttig maakt voor wie al andere moderne JBL-producten gebruikt.

Spreken de functies van de Smart Tx je niet aan? Je kunt de Tour One M3 los kopen voor een adviesprijs van 349 euro of in combinatie met de Smart Tx voor 399 euro. Fijn dat JBL je niet verplicht laat betalen voor een gadget die je misschien niet hoeft.

©Rens Blom

Conclusie: JBL Tour One M3 kopen?

De JBL Tour One M3 biedt premium draagcomfort, een uitstekende accuduur en krachtig geluid in een strak jasje. De ANC-modus werkt effectief, maar moet verschillende andere hoofdtelefoons voor zich dulden. Tot slot de Smart Tx: een slim ontworpen gadget waar de een veel plezier aan gaat beleven, en waar een ander geen behoefte aan heeft. Goed dat JBL de Tour One M3 met en zonder Smart Tx aanbiedt, voor een prijs vanaf 350 euro. Een stevige prijs, maar een gerechtvaardigde prijs naar onze mening.