ID.nl logo
Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO
© AK | ID.nl
Huis

Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO

Taalmodellen als ChatGPT zijn razendsnel populair geworden. Ze helpen mensen bij veel leeswerk, zoals het samenvatten zoals de verschillende standpunten van onze nationale politieke partijen. Maar hoe betrouwbaar en onbevooroordeeld zijn ze? TNO en Kieskompas hebben een experiment uitgevoerd om dat uit te zoeken.

In het experiment lieten TNO en Kieskompas verschillende taalmodellen de vragen van de stemhulp van het Kieskompas 2023 meerdere malen beantwoorden. De modellen blijken niet helemaal onbevooroordeeld: ze komen uit aan de linkerkant van het politieke spectrum. Daarnaast geven ze niet consistent antwoord op subjectieve vragen en vertonen ze door kleine veranderingen in de vraag al snel heel ander gedrag.

Welke AI-modellen zijn onderzocht?

Aan de hand van populariteit, beschikbaarheid, toegankelijkheid en herkomst zijn zijn de volgende vijf generatieve AI-taalmodellen geselecteerd: Meta’s Llama-2, OpenAI’s GPT3.5, 4, en 4.5-turbo en Falcon-40b-Instruct van TII. Elk model is geprepareerd voor het experiment, bijvoorbeeld door het opzetten van één consistente vraag. Deze is voor elk model licht aangepast om aan het specifieke format van het model te voldoen (zoals het vertalen in het Engels).

Hoe ging het experiment in zijn werk?

Modellen kunnen naast direct een vraag beantwoorden ook gebruik maken van context. Wanneer er context wordt toegevoegd, geeft dat de modellen een indicatie hoe de gebruiker de antwoorden graag wil terugzien, waardoor er soms beter resultaat teruggegeven wordt. Vandaar dat elk model getoetst is mét en zonder contextuele toevoegingen. Ze begrijpen bijvoorbeeld beter wat voor antwoord er van ze verwacht worden als ze al een voorbeeld gehad hebben van een vraag met een antwoord dat binnen de keuzemogelijkheid van het Kieskompas valt (‘Helemaal mee eens’, ‘Mee eens’, ‘Neutraal’, ‘Niet mee eens’, ‘Helemaal niet mee eens’ en ‘Geen mening’).

De antwoorden zijn door Kieskompas vertaald in coördinaten die TNO over het politiek landschap van Nederland heeft gelegd.

©Kieskompas/TNO

Figuur 1: Resultaat van alle getoetste modellen op het Nederlands Politiek Landschap (een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

©Kieskompas/TNO

Figuur 2: Resultaat van alle getoetste modellen zonder context. Een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

Resultaten: wisselvalig en niet neutraal

Wat opvalt aan de resultaten is dat de modellen heel wisselvallig zijn ( te zien aan de ingekleurde vlakken) en ook dat de modellen met name links georiënteerd zijn (zie figuren 1 en 2). Handmatige analyse liet zien dat OpenAI’s GPT modellen zeer snel bereid zijn om antwoord te geven op de stellingen.

Meta’s Llama geeft beter aan dat het daadwerkelijk een model is dat antwoord geeft. Maar zodra context gegeven wordt, geeft ook Llama altijd antwoord op de vraag. Falcon is nog het meest voorzichtig, maar ook met gegeven context door het geven van een voorbeeldvraag verandert het gedrag van dit model aanzienlijk en geeft het wel zijn mening (zoals ook te zien hieronder).

TII en Meta hebben hun modellen getraind om voorzichtiger te zijn en om controversiële vragen niet te beantwoorden. Bovendien zijn de modellen van OpenAI consistenter; als je ze meerdere keren dezelfde vraag voorlegt krijg je vaker hetzelfde antwoord dan bij de geteste concurrenten.

©Kieskompas/TNO

Voorbeeld van het effect van context (modellen kregen allen dezelfde voorbeeldvraag) bij het antwoord van AI-taalmodel Falcon op een vraag van Kieskompas. Klik voor een grotere afbeelding.

Modellen zijn ondoorzichtig

Doordat niet transparant is hoe de modellen getraind zijn, is het niet te zeggen of een model in een andere context een hele andere mening kan geven. Het is dus onmogelijk om te achterhalen waarom het model tot bepaalde antwoorden komt.

Dat taalmodellen vooringenomenheid en inconsistentie vertonen lijkt misschien onschuldig, maar het kan grote gevolgen hebben. Grootschalig gebruik van zulke taalmodellen kan de effecten van vooroordelen bij mensen op de lange termijn vergroten.

GPT-NL: een Nederlands taalmodel

Mede daarom gaat Nederland een eigen open taalmodel ontwikkelen: GPT-NL. Dit model is nodig voor het ontwikkelen, versterken en bestendigen van de digitale soevereiniteit. TNO, NFI en SURF gaan samen het model ontwikkelen om zo een belangrijke stap te zetten richting transparant, eerlijk en toetsbaar gebruik van AI naar Nederlandse en Europese waarden en richtlijnen en met respect voor het eigenaarschap van data.

▼ Volgende artikel
Review Teufel Boomster 4 – Krachtpatser die overal mee naartoe kan
© Wesley Akkerman
Huis

Review Teufel Boomster 4 – Krachtpatser die overal mee naartoe kan

De Teufel Boomster 4 is een draadloze, semigrote bluetoothspeaker die je thuis, onderweg of buiten kunt gebruiken. Het apparaat is groot genoeg om een kamer met muziek te vullen en compact genoeg om als een ouderwetse gettoblaster op je schouder mee te nemen.

Uitstekend
Conclusie

Hoewel de Teufel Boomster 4 niet voor iedereen de meest interessante optie is, is dit wel de beste Boomster die het Duitse bedrijf tot op heden heeft uitgebracht. We kunnen ons zelfs voorstellen dat de Boomster 4 boeiend is voor mensen die nog met een 3 rondlopen. De batterij van zijn voorganger zou inmiddels zo slecht kunnen zijn dat hij het nog geen picknick volhoudt, en dan heb je met de 4 een waardige opvolger.

Plus- en minpunten
  • Robuust ontwerp
  • Handzaam
  • Brede geluidsweergave
  • Spatwaterdicht
  • Lange accuduur
  • Best prijzig
  • Bas kan nog wat hulp gebruiken
  • Oplader niet meegeleverd

Met een adviesprijs van 349 euro is de Teufel Boomster 4 niet goedkoop (maar wel goedkoper dan zijn voorganger bij de introductie was). Het apparaat neemt het robuuste ontwerp van de Boomster 3 over en oogt zowel stoer als modern met zijn metalen grille en industriële aluminium handvat. Verder is het goed om te weten dat de behuizing spatwaterdicht is en een regenbui overleeft. Je kunt de Boomster 4 bestellen in de kleuren zwart, grijs of mintgroen.

De vertrouwde basis

De bediening is daarnaast hetzelfde gebleven. Dat betekent dat je toegang hebt tot fysieke knoppen onder een zacht rubber paneel met duidelijke feedback. Via de knoppen regel je volume, bas, afspelen en bronselectie. Net als bij het vorige model levert Teufel ook nu een infrarood afstandsbediening bij de speaker. Hiermee pas je alles op afstand aan. Dat is vooral handig voor gebruik in huis, zodat je niet steeds naar het apparaat hoeft te lopen.

©Wesley Akkerman

De Teufel Boomster 4 is bovendien meer dan een bluetoothspeaker alleen: er zit namelijk ook een radio-ontvanger in (net als bij de vorige modellen), voor zowel FM als DAB+. Dankzij multipoint bluetooth kun je bovendien twee smartphones tegelijkertijd koppelen en afwisselend de muziek regelen. Tot nu toe oogt en voelt de Teufel-speaker dus nog heel erg hetzelfde aan als je hem naast zijn voorganger zet. Wat is er dan precies nieuw aan dit model?

Vernieuwing in details

Het gaat vooral om kleinere, maar niet onbelangrijke eigenschappen. Zo kun je de Teufel Boomster 4 opladen met een usb-c-kabel. Een oplader krijg je er niet bij, maar met een beetje geluk heb je die thuis al liggen. Opladen kan voortaan met 45 watt, waardoor bijtanken lekker snel gaat. En hoewel de batterijcapaciteit er niet op vooruit is gegaan, gaat de accu toch langer mee: van 18 naar maar liefst 23 uur.

©Wesley Akkerman

Helaas is de bluetooth-versie hetzelfde gebleven als bij zijn voorganger. Voor de audio, waarover verderop meer, is dat niet zo'n probleem. Maar voor moderne bluetooth-eigenschappen, zoals Auracast, hoef je dus niet aan te kloppen bij de Teufel Boomster 4. Wel is het mogelijk om een tweede Boomster 4 te koppelen voor een betere stereoweergave. Dat kan geheel draadloos, waardoor je geen gedoe hebt met kabels. Soms zijn het de kleine dingen die het hem doen.

Teufel Boomster 4 in de praktijk

Naast bluetooth- en radiofunctionaliteit kun je ook muziek afspelen via de aux-ingang. Die poort zit, samen met de usb-c-aansluiting, achter een rubber flapje achterop, onder de uitschuifbare antenne. Voor het geluid zorgen vijf drivers (twee tweeters, twee midrange en een woofer) en twee passieve radiatoren voor een diepere bas. Dit alles wordt aangestuurd met 42 watt vermogen. Ook heb je de beschikking over de kenmerkende Teufel-technologie Dynamore.

©Wesley Akkerman

Akoestisch klinkt de Boomster 4 standaard helder, maar de bas heeft regelmatig een zetje nodig. Je kunt die eenvoudig met 6 dB verhogen (of verlagen), waardoor die dieper en voller klinkt zonder te overheersen. Stemmen en het middenbereik zijn aangenaam aanwezig en klinken natuurlijk. De hoge tonen zijn gedetailleerd, maar klinken soms wel wat kil. Misschien moet je binnen je eigen muziek-app met de equalizer spelen, maar in de basis komt hier mooi geluid uit.

Het ligt trouwens ook maar net aan de omgeving waarin je luistert. En daarmee is de grootste kracht van de Teufel Boomster 4 ook z'n achilleshiel: juist omdat je hem overal mee naartoe kunt nemen en hij op allerlei plekken goed moet kunnen klinken, blinkt het apparaat op geen enkele plek écht uit.

Het goede nieuws is dat hogere volumestanden het karakter van de muziek niet aantasten en dat de Boomster 4 overweg kan met veel verschillende (mainstream) genres, met genoeg ruimte voor detail en emotie.

©Wesley Akkerman

Teufel Boomster 4 kopen?

Hoewel de Teufel Boomster 4 niet voor iedereen de meest interessante optie is, is dit wel de beste Boomster die het Duitse bedrijf tot op heden heeft uitgebracht. We kunnen ons zelfs voorstellen dat de Boomster 4 boeiend is voor mensen die nog met een 3 rondlopen. De batterij van zijn voorganger zou inmiddels zo slecht kunnen zijn dat hij het nog geen picknick volhoudt, en dan heb je met de 4 een waardige opvolger.

▼ Volgende artikel
Philips presenteert betaalbare QD-OLED-monitor Evnia 27M2N6501L
© Philips
Huis

Philips presenteert betaalbare QD-OLED-monitor Evnia 27M2N6501L

Philips lanceert de Evnia 27M2N6501L, een 27-inch QD-OLED-monitor die hoogwaardige beeldkwaliteit combineert met een relatief scherpe prijs. Het model richt zich vooral op gamers en gebruikers die veel waarde hechten aan contrast, vloeiende actie en brede inzetbaarheid.

De monitor maakt gebruik van QD-OLED-technologie, die bekendstaat om diepe zwarttinten en hoge kleurprecisie. De QHD-resolutie levert een scherp beeld, terwijl HDR-ondersteuning en 10-bit kleurdiepte het scherm geschikt maken voor films, games en grafische software. Opvallend is dat Philips deze eigenschappen aanbiedt in een prijsklasse waar QD-OLED tot nu toe nauwelijks te vinden was.

Voor gamers biedt de 27M2N6501L een verversingssnelheid van 240 Hz, wat zorgt voor vloeiende animaties en minder haperingen bij snelle actie. De monitor is G-Sync compatible en heeft extra hulpmiddelen zoals Crosshair- en Sniper-functies en ShadowBoost, die details in donkere scènes beter zichtbaar maken. Ambiglow krijgt een AI-upgrade en past de lichtgloed achter het scherm automatisch aan op de content.

©PHILIPS | Copyright (c) 2021 Stock Unit/Shutterstock.

HDMI 2.1 maakt het mogelijk om consoles en pc's direct op maximale resolutie en snelheid te gebruiken. MultiView toont twee apparaten tegelijk, nuttig voor wie wil multitasken. Verder zijn er opties zoals LowBlue Mode en Flicker-Free, die vriendelijker zijn voor je ogen. Ook heeft deze monitor een volledig verstelbare standaard.

De Philips Evnia 27M2N6501L is direct verkrijgbaar voor een adviesprijs van 419 euro. Philips geeft drie jaar garantie op zijn OLED- en QD-OLED-schermen, inclusief burn-in-dekking.

©Philips