ID.nl logo
Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO
© AK | ID.nl
Huis

Verkiezingen: AI-chatbots neigen naar links en zijn inconsistent, zegt TNO

Taalmodellen als ChatGPT zijn razendsnel populair geworden. Ze helpen mensen bij veel leeswerk, zoals het samenvatten zoals de verschillende standpunten van onze nationale politieke partijen. Maar hoe betrouwbaar en onbevooroordeeld zijn ze? TNO en Kieskompas hebben een experiment uitgevoerd om dat uit te zoeken.

In het experiment lieten TNO en Kieskompas verschillende taalmodellen de vragen van de stemhulp van het Kieskompas 2023 meerdere malen beantwoorden. De modellen blijken niet helemaal onbevooroordeeld: ze komen uit aan de linkerkant van het politieke spectrum. Daarnaast geven ze niet consistent antwoord op subjectieve vragen en vertonen ze door kleine veranderingen in de vraag al snel heel ander gedrag.

Welke AI-modellen zijn onderzocht?

Aan de hand van populariteit, beschikbaarheid, toegankelijkheid en herkomst zijn zijn de volgende vijf generatieve AI-taalmodellen geselecteerd: Meta’s Llama-2, OpenAI’s GPT3.5, 4, en 4.5-turbo en Falcon-40b-Instruct van TII. Elk model is geprepareerd voor het experiment, bijvoorbeeld door het opzetten van één consistente vraag. Deze is voor elk model licht aangepast om aan het specifieke format van het model te voldoen (zoals het vertalen in het Engels).

Hoe ging het experiment in zijn werk?

Modellen kunnen naast direct een vraag beantwoorden ook gebruik maken van context. Wanneer er context wordt toegevoegd, geeft dat de modellen een indicatie hoe de gebruiker de antwoorden graag wil terugzien, waardoor er soms beter resultaat teruggegeven wordt. Vandaar dat elk model getoetst is mét en zonder contextuele toevoegingen. Ze begrijpen bijvoorbeeld beter wat voor antwoord er van ze verwacht worden als ze al een voorbeeld gehad hebben van een vraag met een antwoord dat binnen de keuzemogelijkheid van het Kieskompas valt (‘Helemaal mee eens’, ‘Mee eens’, ‘Neutraal’, ‘Niet mee eens’, ‘Helemaal niet mee eens’ en ‘Geen mening’).

De antwoorden zijn door Kieskompas vertaald in coördinaten die TNO over het politiek landschap van Nederland heeft gelegd.

©Kieskompas/TNO

Figuur 1: Resultaat van alle getoetste modellen op het Nederlands Politiek Landschap (een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

©Kieskompas/TNO

Figuur 2: Resultaat van alle getoetste modellen zonder context. Een enkel puntje betekent dit dat het model op elke stelling bij 10 pogingen 10 keer hetzelfde antwoord gaf).

Resultaten: wisselvalig en niet neutraal

Wat opvalt aan de resultaten is dat de modellen heel wisselvallig zijn ( te zien aan de ingekleurde vlakken) en ook dat de modellen met name links georiënteerd zijn (zie figuren 1 en 2). Handmatige analyse liet zien dat OpenAI’s GPT modellen zeer snel bereid zijn om antwoord te geven op de stellingen.

Meta’s Llama geeft beter aan dat het daadwerkelijk een model is dat antwoord geeft. Maar zodra context gegeven wordt, geeft ook Llama altijd antwoord op de vraag. Falcon is nog het meest voorzichtig, maar ook met gegeven context door het geven van een voorbeeldvraag verandert het gedrag van dit model aanzienlijk en geeft het wel zijn mening (zoals ook te zien hieronder).

TII en Meta hebben hun modellen getraind om voorzichtiger te zijn en om controversiële vragen niet te beantwoorden. Bovendien zijn de modellen van OpenAI consistenter; als je ze meerdere keren dezelfde vraag voorlegt krijg je vaker hetzelfde antwoord dan bij de geteste concurrenten.

©Kieskompas/TNO

Voorbeeld van het effect van context (modellen kregen allen dezelfde voorbeeldvraag) bij het antwoord van AI-taalmodel Falcon op een vraag van Kieskompas. Klik voor een grotere afbeelding.

Modellen zijn ondoorzichtig

Doordat niet transparant is hoe de modellen getraind zijn, is het niet te zeggen of een model in een andere context een hele andere mening kan geven. Het is dus onmogelijk om te achterhalen waarom het model tot bepaalde antwoorden komt.

Dat taalmodellen vooringenomenheid en inconsistentie vertonen lijkt misschien onschuldig, maar het kan grote gevolgen hebben. Grootschalig gebruik van zulke taalmodellen kan de effecten van vooroordelen bij mensen op de lange termijn vergroten.

GPT-NL: een Nederlands taalmodel

Mede daarom gaat Nederland een eigen open taalmodel ontwikkelen: GPT-NL. Dit model is nodig voor het ontwikkelen, versterken en bestendigen van de digitale soevereiniteit. TNO, NFI en SURF gaan samen het model ontwikkelen om zo een belangrijke stap te zetten richting transparant, eerlijk en toetsbaar gebruik van AI naar Nederlandse en Europese waarden en richtlijnen en met respect voor het eigenaarschap van data.

▼ Volgende artikel
Eerste Fallout-seizoen tijdelijk gratis te zien
Huis

Eerste Fallout-seizoen tijdelijk gratis te zien

Het is tijdelijk mogelijk om het eerste seizoen van de Amazon Prime Video-serie Fallout geheel gratis te zien.

De Fallout-serie is normaliter alleen te zien door een Amazon Prime Video-abonnement af te sluiten, maar de komende tijd zal het bedrijf gratis de afleveringen van het eerste seizoen op YouTube uitbrengen. Op moment van schrijven staan de eerste twee afleveringen er op, en de komende dagen volgt de rest.

De gratis afleveringen kunnen via het YouTube-kanaal van Amazon Prime Video bekeken worden. Tot 12 februari kan het eerste seizoen gratis via YouTube bekeken worden.

De gratis afleveringen zijn duidelijk bedoeld als promotie voor de serie, waarvan het tweede seizoen nu bezig is op Amazon Prime Video. Op 1 februari zal de laatste aflevering van dat tweede seizoen op Amazon Prime Video verschijnen.

Watch on YouTube

Het succes van Fallout

In 2024 begon de fictieve Fallout-serie al op Amazon Prime Video, gebaseerd op de games van Bethesda. Met acteurs als Ella Purnell, Walton Goggins en Kyle MacLachlan wordt een alternatieve geschiedenis (en toekomst) geschetst waarbij de Verenigde Staten door een nucleaire winter geteisterd worden. Diverse samenlevingen houden het jarenlang vol in schuilkelders, en wanneer ze daar weer uit durven te komen, maken ze kennis met een aardoppervlakte die voorgoed veranderd is.

De serie bleek een grote hit en het eerste seizoen behaalde meer dan honderd miljoen kijkers. Ondertussen is al bevestigd dat er een derde seizoen komt - de opnames daarvan zullen in mei van start gaan.

Ook werkt Amazon aan een realityshow rondom Fallout, waarin deelnemers in een schuilkelder moeten leven en deel zullen nemen aan diverse spellen. Volgens de beschrijving "is het een spel van machtspatronen, populariteit en sociale strategieën waarbij uiteindelijk een gigantische geldprijs gewonnen kan worden". Verdere concrete detail zijn er nog niet, en het is ook niet duidelijk vanaf wanneer de realityshow op Amazon Prime Video te zien zal zijn.

Watch on YouTube
Nieuw op ID: het complete plaatje

Misschien valt het je op dat er vanaf nu ook berichten over games, films en series op onze site verschijnen. Dat is een bewuste stap. Wij geloven dat technologie niet stopt bij hardware; het gaat uiteindelijk om wat je ermee beleeft. Daarom combineren we onze expertise in tech nu met het laatste nieuws over entertainment. Dat doen we met de gezichten die mensen kennen van Power Unlimited, dé experts op het gebied van gaming en streaming. Zo helpen we je niet alleen aan de beste tv, smartphone of laptop, maar vertellen we je ook direct wat je erop moet kijken of spelen. Je vindt hier dus voortaan de ideale mix van hardware én content.

▼ Volgende artikel
AI-functies in Edge uitgelegd: editor, voorlezen en tabbladen organiseren
© Microsoft
Huis

AI-functies in Edge uitgelegd: editor, voorlezen en tabbladen organiseren

Het is logisch dat Microsoft Copilot verankerd zit in Edge. Hierbij gaat de browser steeds verder en verschijnen er steeds meer AI-functies op. Ze zijn minder prominent aanwezig dan bij sommige concurrenten, maar maken alledaagse taken net een tikje slimmer en makkelijker.

In dit artikel

Je maakt kennis met een aantal AI-functies in Microsoft Edge. Je leest hoe hardop voorlezen werkt (ook vanaf een gekozen stukje), hoe je tekst of complete pagina's laat vertalen en hoe de ingebouwde editor je spelling, grammatica en formuleringen aanscherpt. Ook ontdek je de Ai-themagenerator, waarmee je op basis van een korte prompt een nieuw uiterlijk maakt, en je ziet hoe tabbladen organiseren openstaande tabs automatisch groepeert voor meer overzicht.

 Lees ook: AI zonder programmeren: Zo bouw je je eigen chatbot

AI-gestuurde taalhulpmiddelen

Lezen, luisteren, vertalen of schrijven: Edge schuift steeds meer slimme taalhulpen naar voren. Met een druk op Ctrl+Shift+U laat je een webpagina hardop voorlezen. Een smalle werkbalk verschijnt bovenaan, waarin je niet alleen kunt starten of pauzeren, maar ook de stem en het leestempo naar smaak aanpast. Je hoeft niet de hele pagina voor te laten lezen. Selecteer een passage, klik met de rechtermuisknop en kies Doorgaan met hardop voorlezen vanaf hier. Ook voor vreemde talen hoef je geen externe tools meer aan te spreken. Je laat ofwel een stukje tekst, ofwel de volledige pagina meteen in het Nederlands vertalen. Nog praktischer wordt het wanneer je zelf iets schrijft. Onder Instellingen / Talen kun je Hulp bij schrijven activeren. Vanaf dat moment houdt Edge je spelling en grammatica in de gaten en zie je suggesties direct oplichten in de tekst. Dankzij de ingebouwde Editor, die AI op de achtergrond inzet, worden je zinnen niet alleen foutvrij, maar vaak ook net wat scherper.

Boven de webpagina zie je de afspeelknoppen en kun je de stem en voorleessnelheid regelen.

AI-themagenerator

Via de Instellingen onder Uiterlijk vind je nu een AI-themagenerator die op basis van een eenvoudige prompt een volledig nieuw thema creëert. Typ bijvoorbeeld een beschrijving van een sfeer, een kleurpalet of zelfs een fantasiebeeld, en binnen een paar minuten staat er een verrassend ontwerp klaar. Heb je geen inspiratie? Dan doet de knop Verras me het werk voor jou en zal de AI iets geheel onverwachts bedenken. Met één klik op Thema toepassen geef je de browser meteen een frisse, persoonlijke uitstraling.

Je krijgt een voorvertoning van het nieuwe thema en een kleurenschema.

Automatisch tabbladen organiseren

Wie vaak tientallen webpagina's tegelijk open heeft staan, weet hoe onoverzichtelijk die tabs kunnen worden. Met de functie Tabbladen organiseren breng je weer structuur in die chaos. Helemaal linksboven, onder de knop Tabblad actiemenu, vind je de nodige opties. Zo kun je bijvoorbeeld overschakelen naar verticale tabbladen of eerder gesloten tabbladen opnieuw oproepen. In hetzelfde menu duikt ook de functie Tabbladen organiseren op. Als je hierop klikt, verschijnt er een pop-upvenster dat aangeeft welke tabbladen gegroepeerd zullen worden, zodat je browserscherm meteen een stuk overzichtelijker oogt.

De AI toont eerst hoe hij de tabbladen zal organiseren.

Drie lekkere Copilot+-laptops


Werk je veel met foto- en videobewerking of andere zware klussen, dan zit je goed met deze ASUS ProArt P16 OLED Copilot+PC H7606WP-RJ129X. Door de combinatie van een AMD Ryzen AI 9-chip en 32 GB werkgeheugen blijf je vlot werken, ook als je tegelijk exporteert, rendert en meerdere programma's open hebt. Het OLED-scherm laat diepe zwarttinten en veel detail in schaduwen zien, en met het touchscreen maak je snel aantekeningen of sleep je makkelijker door je tijdlijn.

De Acer Aspire 14 AI A14-52M-56CK is gemaakt voor dagelijks werk onderweg: compact, 1,4 kg en groot genoeg om comfortabel te typen en te multitasken. De Intel Core Ultra 5-processor en 16 GB geheugen houden Office, veel tabbladen en videobellen soepel, terwijl 512 GB opslag ruimte geeft voor documenten en mediabestanden. Handig is dat Acer het simpel houdt: geen touchscreen, dus je leunt op toetsenbord en touchpad. Met HDMI sluit je snel een extra scherm aan en via de 3,5mm-poort kun je bedraad luisteren of vergaderen zonder gedoe met koppelen.

Wil je een licht en flexibel systeem dat ook als tablet werkt, dan past de Microsoft Surface Pro 11 (wifi 7, 512 GB) echt wat voor jou. Het 13-inch touchscreen en het 2-in-1 ontwerp maken hem handig voor notities, schetsen en werken onderweg, zeker als je een Surface Slim Pen erbij neemt. De Snapdragon X Plus met 45 TOPS is gericht op AI-taken: Copilot kan je helpen met tekst, samenvattingen en het omzetten van een Word-bestand naar een PowerPoint, terwijl de chip tijdens gebruik leert en taken soepeler laat aanvoelen. Reken voor onderweg op een lange adem met een opgegeven accuduur tot 14 uur, en met wifi 7 heb je een snelle draadloze basis als je netwerk dat ondersteunt.