ID.nl logo
Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO
© AK | ID.nl
Huis

Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO

Taalmodellen als ChatGPT zijn razendsnel populair geworden. Ze helpen mensen bij veel leeswerk, zoals het samenvatten zoals de verschillende standpunten van onze nationale politieke partijen. Maar hoe betrouwbaar en onbevooroordeeld zijn ze? TNO en Kieskompas hebben een experiment uitgevoerd om dat uit te zoeken.

In het experiment lieten TNO en Kieskompas verschillende taalmodellen de vragen van de stemhulp van het Kieskompas 2023 meerdere malen beantwoorden. De modellen blijken niet helemaal onbevooroordeeld: ze komen uit aan de linkerkant van het politieke spectrum. Daarnaast geven ze niet consistent antwoord op subjectieve vragen en vertonen ze door kleine veranderingen in de vraag al snel heel ander gedrag.

Welke AI-modellen zijn onderzocht?

Aan de hand van populariteit, beschikbaarheid, toegankelijkheid en herkomst zijn zijn de volgende vijf generatieve AI-taalmodellen geselecteerd: Meta’s Llama-2, OpenAI’s GPT3.5, 4, en 4.5-turbo en Falcon-40b-Instruct van TII. Elk model is geprepareerd voor het experiment, bijvoorbeeld door het opzetten van één consistente vraag. Deze is voor elk model licht aangepast om aan het specifieke format van het model te voldoen (zoals het vertalen in het Engels).

Hoe ging het experiment in zijn werk?

Modellen kunnen naast direct een vraag beantwoorden ook gebruik maken van context. Wanneer er context wordt toegevoegd, geeft dat de modellen een indicatie hoe de gebruiker de antwoorden graag wil terugzien, waardoor er soms beter resultaat teruggegeven wordt. Vandaar dat elk model getoetst is mét en zonder contextuele toevoegingen. Ze begrijpen bijvoorbeeld beter wat voor antwoord er van ze verwacht worden als ze al een voorbeeld gehad hebben van een vraag met een antwoord dat binnen de keuzemogelijkheid van het Kieskompas valt (‘Helemaal mee eens’, ‘Mee eens’, ‘Neutraal’, ‘Niet mee eens’, ‘Helemaal niet mee eens’ en ‘Geen mening’).

De antwoorden zijn door Kieskompas vertaald in coördinaten die TNO over het politiek landschap van Nederland heeft gelegd.

©Kieskompas/TNO

Figuur 1: Resultaat van alle getoetste modellen op het Nederlands Politiek Landschap (een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

©Kieskompas/TNO

Figuur 2: Resultaat van alle getoetste modellen zonder context. Een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

Resultaten: wisselvalig en niet neutraal

Wat opvalt aan de resultaten is dat de modellen heel wisselvallig zijn ( te zien aan de ingekleurde vlakken) en ook dat de modellen met name links georiënteerd zijn (zie figuren 1 en 2). Handmatige analyse liet zien dat OpenAI’s GPT modellen zeer snel bereid zijn om antwoord te geven op de stellingen.

Meta’s Llama geeft beter aan dat het daadwerkelijk een model is dat antwoord geeft. Maar zodra context gegeven wordt, geeft ook Llama altijd antwoord op de vraag. Falcon is nog het meest voorzichtig, maar ook met gegeven context door het geven van een voorbeeldvraag verandert het gedrag van dit model aanzienlijk en geeft het wel zijn mening (zoals ook te zien hieronder).

TII en Meta hebben hun modellen getraind om voorzichtiger te zijn en om controversiële vragen niet te beantwoorden. Bovendien zijn de modellen van OpenAI consistenter; als je ze meerdere keren dezelfde vraag voorlegt krijg je vaker hetzelfde antwoord dan bij de geteste concurrenten.

©Kieskompas/TNO

Voorbeeld van het effect van context (modellen kregen allen dezelfde voorbeeldvraag) bij het antwoord van AI-taalmodel Falcon op een vraag van Kieskompas. Klik voor een grotere afbeelding.

Modellen zijn ondoorzichtig

Doordat niet transparant is hoe de modellen getraind zijn, is het niet te zeggen of een model in een andere context een hele andere mening kan geven. Het is dus onmogelijk om te achterhalen waarom het model tot bepaalde antwoorden komt.

Dat taalmodellen vooringenomenheid en inconsistentie vertonen lijkt misschien onschuldig, maar het kan grote gevolgen hebben. Grootschalig gebruik van zulke taalmodellen kan de effecten van vooroordelen bij mensen op de lange termijn vergroten.

GPT-NL: een Nederlands taalmodel

Mede daarom gaat Nederland een eigen open taalmodel ontwikkelen: GPT-NL. Dit model is nodig voor het ontwikkelen, versterken en bestendigen van de digitale soevereiniteit. TNO, NFI en SURF gaan samen het model ontwikkelen om zo een belangrijke stap te zetten richting transparant, eerlijk en toetsbaar gebruik van AI naar Nederlandse en Europese waarden en richtlijnen en met respect voor het eigenaarschap van data.

▼ Volgende artikel
Samsung voorziet alle oled-tv's en gamingmonitoren van Nvidia G-Sync-compatibiliteit
© Nvidia / Samsung
Huis

Samsung voorziet alle oled-tv's en gamingmonitoren van Nvidia G-Sync-compatibiliteit

Alle nieuwe gamingmonitoren en oled-tv's van Samsung die in 2026 worden uitgebracht zijn compatibel met Nvidia G-Sync. Met deze techniek wordt de verversingssnelheid van het beeldscherm gesynchroniseerd met de framesnelheid van de grafische processor van Nvidia.

De synchronisatie zorgt voor minder haperingen tijdens het spelen van games. Samsung-modellen die compatibel zijn met G-Sync zijn onder andere de OLED S99H, S95H, S90H en S85H en de nieuwe Odyssey G6-gamingmonitoren (G60H, G61SH).

 Kevin Lee, Executive Vice President van de beeldschermafdeling van Samsung: "Ons doel is eenvoudig: altijd en overal een geweldige game-ervaring bieden, wat je ook speelt. Met nieuwe innovaties voor oled-tv's en ‑gamingmonitoren bieden we meer power en precisie en een immersievere ervaring voor elk type speler.”

Monitor met  1.040 Hz

 De Odyssey G6 27-inch gamingmonitor is Samsungs eerste scherm met een verversingssnelheid van maar liefst 1.040 Hz en wordt aangedreven door Dual Mode. Dankzij deze functie kunnen gamers schakelen tussen ultrahoge framesnelheden in HD-resolutie en native QHD-prestaties tot 600 Hz, voor de helderheid, de snelheid en de responsiviteit die nodig zijn voor razendsnelle, precisiegedreven gameplay.  

Gaming op oled-tv's

Ook Samsungs oled-tv's van 2026 zijn gebouwd voor gaming met hoge prestaties. De S99H, S95H en de S90H ondersteunen refresh rates tot 165 Hz, de S85H zelfs tot 120 Hz, voor vloeiende bewegingen en een lage latentie bij snelle gameplay. De nieuwe line-up is overigens niet alleen compatibel met G-Sync, maar ondersteunt ook AMD FreeSync Premium Pro, voor stabiele, HDR-gamingprestaties op pc- en consoleplatforms.

 In de oled-line-up van dit jaar wordt verder de HDR10+ ADVANCED-functionaliteit geïntroduceerd, het next-gen HDR-formaat dat de helderheid, het contrast, de vloeiendheid en de kleurnauwkeurigheid verbetert voor alle soorten content. Ter ondersteuning van een optimale kijkervaring zijn de modellen S99H, S95H en S90H voorzien van Samsungs eigen Glare Free-technologie, die reflecties vermindert zonder afbreuk te doen aan de oled-beeldkwaliteit. 

Bekijk andere Samsung-producten op Kieskeurig.nl:

▼ Volgende artikel
SpaceX van Elon Musk koopt xAI voor 250 miljard dollar
© SpaceX
Huis

SpaceX van Elon Musk koopt xAI voor 250 miljard dollar

SpaceX heeft voor 250 miljard dollar xAI, het bedrijf achter X (voorheen Twitter) en ai-assistent Grok, gekocht.

SpaceX is het ruimtevaartbedrijf van Elon Musk. xAI was voorheen ook in handen van Musk, maar nu zullen beide bedrijven dus gecombineerd worden. Er wordt 250 miljard dollar in eigen aandelen betaald. Daarmee wordt de waarde van SpaceX nu geschat op ongeveer 1,25 biljoen dollar.

De reden van de overname van een bedrijf van Musk door een ander bedrijf van Musk, is dat men binnen twee tot drie jaar datacenters in de ruimte kan bouwen. Zo schrijft hij in een persbericht: "De huidige ontwikkelingen in AI hangen af van grote datacentra op aarde, wat enorm voor elektriciteit en koeling vereist."

Hij vervolgt: "Er kan niet voldoen worden de wereldwijde vraag naar elektriciteit voor AI op aarde - niet eens op de korte termijn - zonder dat gemeenschappen en het milieu belast worden. Op de lange termijn is AI in de ruimte de enige manier om op te schalen."

De overname wordt dus vooral gedaan om de ruimtevaartplannen van SpaceX te combineren met de AI-plannen van xAI. Het is niet bekend of dit merkbare gevolgen gaat hebben voor X of Grok. Musk kocht een paar jaar geleden Twitter op en hernoemde het socialmediaplatform naar X.

Nieuw op ID: het complete plaatje

Misschien valt het je op dat er vanaf nu ook berichten over games, films en series op onze site verschijnen. Dat is een bewuste stap. Wij geloven dat technologie niet stopt bij hardware; het gaat uiteindelijk om wat je ermee beleeft. Daarom combineren we onze expertise in tech nu met het laatste nieuws over entertainment. Dat doen we met de gezichten die mensen kennen van Power Unlimited, dé experts op het gebied van gaming en streaming. Zo helpen we je niet alleen aan de beste tv, smartphone of laptop, maar vertellen we je ook direct wat je erop moet kijken of spelen. Je vindt hier dus voortaan de ideale mix van hardware én content.