ID.nl logo
Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO
© AK | ID.nl
Huis

Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO

Taalmodellen als ChatGPT zijn razendsnel populair geworden. Ze helpen mensen bij veel leeswerk, zoals het samenvatten zoals de verschillende standpunten van onze nationale politieke partijen. Maar hoe betrouwbaar en onbevooroordeeld zijn ze? TNO en Kieskompas hebben een experiment uitgevoerd om dat uit te zoeken.

In het experiment lieten TNO en Kieskompas verschillende taalmodellen de vragen van de stemhulp van het Kieskompas 2023 meerdere malen beantwoorden. De modellen blijken niet helemaal onbevooroordeeld: ze komen uit aan de linkerkant van het politieke spectrum. Daarnaast geven ze niet consistent antwoord op subjectieve vragen en vertonen ze door kleine veranderingen in de vraag al snel heel ander gedrag.

Welke AI-modellen zijn onderzocht?

Aan de hand van populariteit, beschikbaarheid, toegankelijkheid en herkomst zijn zijn de volgende vijf generatieve AI-taalmodellen geselecteerd: Meta’s Llama-2, OpenAI’s GPT3.5, 4, en 4.5-turbo en Falcon-40b-Instruct van TII. Elk model is geprepareerd voor het experiment, bijvoorbeeld door het opzetten van één consistente vraag. Deze is voor elk model licht aangepast om aan het specifieke format van het model te voldoen (zoals het vertalen in het Engels).

Hoe ging het experiment in zijn werk?

Modellen kunnen naast direct een vraag beantwoorden ook gebruik maken van context. Wanneer er context wordt toegevoegd, geeft dat de modellen een indicatie hoe de gebruiker de antwoorden graag wil terugzien, waardoor er soms beter resultaat teruggegeven wordt. Vandaar dat elk model getoetst is mét en zonder contextuele toevoegingen. Ze begrijpen bijvoorbeeld beter wat voor antwoord er van ze verwacht worden als ze al een voorbeeld gehad hebben van een vraag met een antwoord dat binnen de keuzemogelijkheid van het Kieskompas valt (‘Helemaal mee eens’, ‘Mee eens’, ‘Neutraal’, ‘Niet mee eens’, ‘Helemaal niet mee eens’ en ‘Geen mening’).

De antwoorden zijn door Kieskompas vertaald in coördinaten die TNO over het politiek landschap van Nederland heeft gelegd.

©Kieskompas/TNO

Figuur 1: Resultaat van alle getoetste modellen op het Nederlands Politiek Landschap (een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

©Kieskompas/TNO

Figuur 2: Resultaat van alle getoetste modellen zonder context. Een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

Resultaten: wisselvalig en niet neutraal

Wat opvalt aan de resultaten is dat de modellen heel wisselvallig zijn ( te zien aan de ingekleurde vlakken) en ook dat de modellen met name links georiënteerd zijn (zie figuren 1 en 2). Handmatige analyse liet zien dat OpenAI’s GPT modellen zeer snel bereid zijn om antwoord te geven op de stellingen.

Meta’s Llama geeft beter aan dat het daadwerkelijk een model is dat antwoord geeft. Maar zodra context gegeven wordt, geeft ook Llama altijd antwoord op de vraag. Falcon is nog het meest voorzichtig, maar ook met gegeven context door het geven van een voorbeeldvraag verandert het gedrag van dit model aanzienlijk en geeft het wel zijn mening (zoals ook te zien hieronder).

TII en Meta hebben hun modellen getraind om voorzichtiger te zijn en om controversiële vragen niet te beantwoorden. Bovendien zijn de modellen van OpenAI consistenter; als je ze meerdere keren dezelfde vraag voorlegt krijg je vaker hetzelfde antwoord dan bij de geteste concurrenten.

©Kieskompas/TNO

Voorbeeld van het effect van context (modellen kregen allen dezelfde voorbeeldvraag) bij het antwoord van AI-taalmodel Falcon op een vraag van Kieskompas. Klik voor een grotere afbeelding.

Modellen zijn ondoorzichtig

Doordat niet transparant is hoe de modellen getraind zijn, is het niet te zeggen of een model in een andere context een hele andere mening kan geven. Het is dus onmogelijk om te achterhalen waarom het model tot bepaalde antwoorden komt.

Dat taalmodellen vooringenomenheid en inconsistentie vertonen lijkt misschien onschuldig, maar het kan grote gevolgen hebben. Grootschalig gebruik van zulke taalmodellen kan de effecten van vooroordelen bij mensen op de lange termijn vergroten.

GPT-NL: een Nederlands taalmodel

Mede daarom gaat Nederland een eigen open taalmodel ontwikkelen: GPT-NL. Dit model is nodig voor het ontwikkelen, versterken en bestendigen van de digitale soevereiniteit. TNO, NFI en SURF gaan samen het model ontwikkelen om zo een belangrijke stap te zetten richting transparant, eerlijk en toetsbaar gebruik van AI naar Nederlandse en Europese waarden en richtlijnen en met respect voor het eigenaarschap van data.

▼ Volgende artikel
Kingdom Come: Deliverance 2 vanaf 3 maart op Xbox Game Pass
Huis

Kingdom Come: Deliverance 2 vanaf 3 maart op Xbox Game Pass

Microsoft heeft de Xbox Game Pass-toevoegingen van de rest van februari en begin maart aangekondigd. Daaronder valt ook de geprezen game Kingdom Come: Deliverance 2.

De line-up werd via Xbox Wire aangekondigd. Het eerste deel in de openwereldreeks waarin spelers een middeleeuws avontuur beleven kwam enkele dagen geleden al naar Xbox Game Pass, zo werd eerder deze maand aangekondigd. Dat het vervolg - dat vorig jaar verscheen - al zo kort daarna op Game Pass verschijnt, mag dus een verrassing heten.

Hieronder zijn de toevoegingen van de komende weken te vinden, waaronder twee spellen die al sinds gisteren op Xbox Game Pass zijn verschenen:

Aerial Knight’s DropShot (Xbox Series-consoles, pc, cloud en handheld) – Sinds gisteren speelbaar via Game Pass Ultimate, PC Game Pass

Avatar: Frontiers of Pandora (Xbox Series-consoles, pc, cloud en handheld) – Sinds gisteren speelbaar via Game Pass Ultimate, PC Game Pass

Avowed (Xbox Series-consoles, pc en cloud) – Sinds gisteren ook speelbaar via Xbox Game Pass Premium

Death Howl (Xbox Series-consoles, pc, cloud en handheld) – Vanaf 19 februari speelbaar via Game Pass Ultimate, Premium, PC Game Pass

EA Sports College Football 26 (Xbox Series-consoles en cloud) – Vanaf 19 februari speelbaar via Game Pass Ultimate

The Witcher 3: Wild Hunt – Complete Edition (console en cloud) – Vanaf 19 februari speelbaar via Game Pass Ultimate, Premium

TCG Card Shop Simulator (Game Preview) (Xbox Series-consoles, pc, cloud en handheld) – Vanaf 24 februari speelbaar via Game Pass Ultimate, Premium, PC Game Pass

Dice A Million (pc) – Vanaf 25 februari speelbaar via Game Pass Ultimate, PC Game Pass

Towerborne (volledige versie) (console, pc en handheld) – Vanaf 26 februari speelbaar via Game Pass Ultimate, Premium, PC Game Pass

Final Fantasy 3 (Xbox Series-consoles, pc en cloud) – Vanaf 3 maart speelbaar via Game Pass Ultimate, Premium, PC Game Pass

Kingdom Come: Deliverance 2 (Xbox Series-consoles, pc en cloud) – Vanaf 3 maart speelbaar via Game Pass Ultimate, Premium, PC Game Pass

Microsoft heeft daarnaast laten weten dat de volgende games op 28 februari van Xbox Game Pass verdwijnen:

  • Monster Train (console, pc en cloud)

  • Expeditions: A MudRunner Game (console, pc en cloud)

  • Injustice 2 (console, pc en cloud)

  • Middle Earth: Shadow of War (console, pc en cloud)

View post on X
▼ Volgende artikel
Highguard-website offline, game werd gefinancierd door Tencent
© Wildlight Entertainment
Huis

Highguard-website offline, game werd gefinancierd door Tencent

In navolging van de grootschalige ontslagronde bij Highguard-ontwikkelaar Wildlight Entertainment, blijkt nu de officiële website van de game offline te zijn. Daarnaast is gelekt dat het Chinese Tencent blijkbaar de ontwikkeling van de game financierde.

Wanneer men op moment van schrijven naar de officiële website van Highguard gaat, valt er te lezen dat de website "op dit moment niet beschikbaar is". De reden daarvoor is niet gegeven, en de ontwikkelaar heeft de situatie niet opgehelderd.

Onlangs bleek dat er een grootschalige ontslagronde bij ontwikkelaar Wildlight Entertainment plaatsvond. Het management bevestigde de ontslagronde, al gaf het geen precieze details. Een voormalige ontwikkelaar sprak in ieder geval over het ontslag van "het grootste gedeelte van het team". Samen met de website die nu offline is lijkt de toekomst van de pas uitgekomen multiplayergame dus op losse schroeven te staan.

Ook opvallend is dat volgens Game File-schrijver Stephen Totilo het gigantische Chinese bedrijf Tencent - specifiek dochteronderneming TiMi Studio Group - de belangrijkste geldverstrekker was voor de ontwikkeling van Highguard. Voorheen werd er geen informatie gegeven over hoe de game precies gefinancierd werd, en het is niet bekend waarom dit geheim gehouden werd.

View post on X

Over Highguard

Highguard is de debuutgame van Wildlight Entertainment. De game viel op voorhand vooral op omdat er een trailer van werd getoond aan het einde van The Game Awards eind vorig jaar. Die positie is meestal gereserveerd voor grote aankondigingen en aankomende games, en sommige kijkers vonden Highguard daar niet tot behoren.

Sinds eind vorige maand is Highguard speelbaar via Steam. De game ontving veel negatieve gebruikersrecensies, al heeft dat Wildlight niet tegengehouden om updates uit te blijven brengen. Rond release bereikte het spel een indrukwekkende gelijktijdige spelerspiek van bijna 100.000 mensen op Steam, maar inmiddels hangen de gelijktijdige spelersaantallen onder de vijfduizend. Lees hier meer informatie over Highguard.