ID.nl logo
AI pakt veel data van sociale media: kun je daar iets tegen doen?
© ant - stock.adobe.com
Huis

AI pakt veel data van sociale media: kun je daar iets tegen doen?

Veel bedrijven die een eigen AI aanbieden, kopen of gebruiken data die gebruikers delen op sociale media om hun diensten te trainen. Daardoor is de kans groot dat jouw gegevens (zoals posts, foto’s en blogs) in de grote informatiebak met datapunten belanden.

Niemand wil dat zijn gegevens of bestanden ongevraagd in een trainngsmodel van AI terechtkomen. De grote vraag is dan: kun je hier iets tegen doen?

Het antwoord daarop is "Ja, maar ..." In dit artikel leggen we uit wat je kunt doen, wat het probleem is en wie zich er schuldig aan maken.

Lees ook: AI: van razendsnelle ontwikkeling tot strikte regulering

Aangezien we veel sociale media gratis gebruiken, verdienen aanbieders aan ons als klanten door onze gegevens (al dan niet geanonimiseerd) door te verkopen. Dat is een feit waar veel mensen al van op de hoogte zijn: als een dienst gratis is, dan ben jij het product. Dat socialmediabedrijven een stap verdergaan, is minder duidelijk. Want veel van dat soort ondernemingen verkopen hun gegevens tegenwoordig ook aan AI-bedrijven, die hun taalmodellen (en andere diensten) daar vervolgens mee kunnen trainen.

Al die data belanden dan in een grote informatiebak met datapunten. Iedereen die weleens iets op het internet achtergelaten heeft, heeft daar iets aan toegevoegd. Bewust of onbewust, bedoeld of onbedoeld. En dat maakt dit best een omstreden ontwikkeling. Het maakt ook niet uit of het om chatbots of generatieve AI gaat: de bedrijven werken op eenzelfde wijze. De New York Times is inmiddels een rechtszaak begonnen tegen ChatGPT-eigenaar OpenAI, omdat die zonder toestemming de artikelendatabase gebruikt zou hebben om de chatbot te trainen.

Geen zin in AI, maar wel in een digitale gesprekspartner?

Een slimme speaker is altijd klaar voor een praatje!

©bongkarn - stock.adobe.com

Gebruikersdata sociale media naar AI-bedrijven

Nu gaat dat laatste voorbeeld over een journalistieke krant, maar het laat wel zien dat er veel wrijving is. Een voorbeeld dichter bij huis voor veel internetgebruikers is waarschijnlijk Twitter (we hebben nog een beetje moeite met de naam X).

In het aangepaste privacybeleid staat tegenwoordig dat het platform gebruikersdata kan gebruiken voor het trainen van AI. Om welke AI-dienst het precies gaat, is niet duidelijk, maar waarschijnlijk die van eigenaar Elon Musk zelf. Daarnaast betreft het 'alleen openbare data, en geen dm’s of andere privézaken'.

Twitter is niet het enige sociale medium dat z’n handen hieraan vuilmaakt. Eind 2023 maakte Meta (bekend van Facebook) bekend dat het gebruikersdata gebruikt voor het trainen van generatieve AI (waarmee je zelf afbeeldingen, teksten en meer maakt). Maak je dus gebruik van Facebook, Instagram of Threads, dan worden je posts gebruikt. Ook voor het trainen van Meta’s chatbot, een ontwikkeling die we ook bij TikTok en Snapchat zien. De bot van Snapchat, genaamd My AI, gebruikt daarnaast de gesprekken om zichzelf verder te ontwikkelen.

Eén van de grootste boosdoeners is misschien wel Reddit. Het grootste internetforum op aarde sloot een deal met Google, dat daardoor toegang krijgt tot alle gebruikersdata en posts voor het trainen van AI-modellen.

Van YouTube weten we dat het kunstmatige intelligentie gebruikt voor het aanbevelen van video’s. En hoewel andere bedrijven soms die video’s gebruiken om hun AI te trainen, is het niet zo dat YouTube dat op dit moment doet. Tot slot is het zo dat partijen als Tumblr en Wordpress ook op het punt staan data te verkopen aan Midjourney en OpenAI.

©bloomicon

Wat kun je hiertegen doen?

Soms voelt het alsof je machteloos bent tegenover al die grote bedrijven die producten aanbieden waar je in de loop der tijd aan gewend bent geraakt. Maar je kunt je wapenen met kennis én je kunt er in sommige gevallen iets tegen doen. Zo kun je bijvoorbeeld beginnen bij deze handige tool van de Washington Post, waarin je kunt zien welke sociale media deel uitmaken van de dataset waarmee Google Bard getraind is. Reddit laat bijna acht miljoen tokens achter, terwijl Wordpress goed is voor 14.000 en Tumblr voor 1,6 miljoen tokens.

Verder kun je bij sommige diensten voorkomen dat je data gebruikt worden. Mocht je je bij Meta willen afmelden voor het gebruik van je data, dan kun je daarvoor dit formulier invullen. Hiermee voorkom je dat derde partijen je data gebruiken; onduidelijk is of je daarmee ook Meta zelf beperkt. En bij Tumblr kun je via de bloginstellingen een schuifregelaar omzetten waarmee je voorkomt dat je data door derde partijen geraadpleegd wordt. Profielen op Instagram, Twitter en meer kun je privé maken, zodat de data niet openbaar zijn – maar garanties kunnen we niet geven.

De beste manier om te voorkomen dat je data gebruikt wordent voor het trainen van AI, is de accounts overal te verwijderen. Nu snappen we dat zoiets niet altijd een optie is. Maar als je dergelijke diensten niet gebruikt, dan kunnen andere mensen daar ook niet mee aan de haal gaan. Waarschijnlijk ben al te laat voor alle gegevens die reeds in de informatiebak beland zijn. Dat is dan jammer voor de vakantiekiekjes uit 2010. Maar voor het vervolg is verwijderen dus de beste optie – misschien ook een goed moment voor je persoonlijke social media purge.


▼ Volgende artikel
Slachtoffers Odido-datalek hebben geen automatisch recht op compensatie
Huis

Slachtoffers Odido-datalek hebben geen automatisch recht op compensatie

Telecombedrijf Odido laat weten dat mensen geen automatisch recht op compensatie hebben nadat hun gegevens via een datalek afgelopen week op straat zijn gekomen.

In het weekend van 7 en 8 februari vond een cyberaanval plaats op de website van Odido, waarbij criminelen toegang kregen tot een klantcontactsysteem. De criminelen hebben een bestand kunnen downloaden met daarop gegevens van klanten. Het zou om gegevens van mogelijk 6,2 miljoen klanten kunnen gaan.

Onder de gegevens die zijn gestolen, vallen mogelijk de volledige naam, het adres en de klantnummers van klanten. Ook de mobiele nummers, IBAN-rekeningnummers, geboortedata, e-mailadressen en identificatiegegevens (waaronder rijbewijs- en paspoortnummers) kunnen zijn buitgemaakt.

Odido benadrukte kort na het lek dat er geen scans van identiteitsbewijzen zijn gelekt, noch wachtwoorden, factuurgegevens of belgegeven. Mensen kunnen daarbij gebruik blijven maken van de diensten van Odido, maar er wordt wel aangeraden dat klanten alert zijn op vreemde sms'jes of e-mails, zeker als daar links in staan.

Geen automatisch recht op compensatie

Op een speciale pagina met informatie over het datalek heeft Odido inmiddels meer informatie gegeven over het lek en diverse vragen beantwoord. Er staat ook een vraag en antwoord bij over mogelijke compensatie voor klanten wanneer data van de klant is gelekt.

Odido schrijft: "Een datalek geeft niet automatisch recht op compensatie. Onze inspanningen zijn er momenteel op gericht om juist te voorkomen dat klanten op enige manier schade zouden ondervinden als gevolg van dit incident. We hebben klanten proactief geïnformeerd zodat zij extra alert kunnen zijn op eventueel verdachte signalen. Dit is in lijn met het advies van het Centraal Meldpunt Identiteitsfraude (CMI) van de Rijksoverheid."

Het antwoord vervolgt: "Het CMI benadrukt bovendien dat niet automatisch sprake is van identiteitsfraude of dat met de gestolen gegevens identiteitsfraude kan worden gepleegd. Ook meldt het CMI dat met de betrokken gegevens niet zomaar een lening, bankrekening of telefoonabonnement kan worden afgesloten. Ook kan er geen nieuw identiteitsbewijs mee worden aangevraagd. Daarvoor zijn immers extra controles nodig, zoals een echt identiteitsbewijs, je DigiD of de inloggegevens van je bank."

Op de website staat nog een vraag over compensatie, met daarbij nadrukkelijk vermeld dat sommige 'cybersecurity-experts' claimen dat men recht heeft op compensatie. Ook daarop wordt gemeld dat "een datalek geen automatisch recht op compensatie geeft".

▼ Volgende artikel
Streamtips: nieuwe films en series –The Night Agent en 56 Days
Huis

Streamtips: nieuwe films en series –The Night Agent en 56 Days

De streamingdiensten staan weer vol met nieuwe releases. Geen stress, wij hebben het kaf van het koren gescheiden. Zo weet je precies welke films en series je deze week niet mag missen.

Prometheus | Netflix | 16 februari

Prometheus, regisseur Ridley Scotts Alien-prequel, speelt zich af in de late 21e eeuw. Een team van wetenschappers onder leiding van Dr. Elizabeth Shaw (Noomi Rapace) reist af naar een planeet waar zich mogelijk de stichters van het menselijk ras bevinden. Uiteraard heeft hun uitstapje rampzalige gevolgen. Prometheus heeft nooit zo’n beklemmende, bloedstollende sfeer als Alien, maar is zeker spannend genoeg om je aandacht vast te houden en is bovendien echt een plaatje om naar te kijken.

56 Days (seizoen 1) | Amazon Prime Video | 18 februari

In de gloednieuwe thrillerserie 56 days kruipen Dove Cameron en Avan Jogia in de huid van Ciara Wyse en Oliver Kennedy, twee mensen die een passievolle relatie beginnen nadat ze elkaar in de supermarkt hebben ontmoet. 56 dagen na hun ontmoeting, wordt er een onherkenbaar lichaam ontdekt en vreest de politie dat hun turbulente liefdesverhaal is uitgemond in moord. Hoe dieper ze in de zaak duiken, hoe meer grimmige geheimen worden onthuld.

Watch on YouTube

The Night Agent (seizoen 3) | Netflix | 19 februari

Het derde seizoen van The Night Agent (niet te verwarren met The Night Manager, te zien op Amazon Prime Video) is vanaf deze donderdag te zien op Netflix. The Night Agent is gebaseerd op het gelijknamige boek van Matthew Quirk en volgt FBI-agent Peter Sutherland (Gabriel Basso). Tijdens zijn nachtdienst krijgt hij een telefoontje waarmee hij in een gevaarlijke samenzwering rond een mol in het Witte Huis belandt. Hij stort zich in een jacht op de verrader, terwijl hij voormalig tech-CEO Rose Larkin (Luciane Buchanan) beschermt tegen de mensen die haar oom en tante hebben vermoord.

Watch on YouTube

Once Upon a Time in the West | Netflix | 20 februari

Een van de beste westerns ooit gemaakt, Once Upon a Time in the West, verschijnt deze vrijdag op Netflix. Deze klassieker van regisseur Sergio Leone begint op een treinstation in het stadje Flagstone, waar een mysterieuze man met een mondharmonica (Charles Bronson) heeft afgesproken met de huurling Frank (Henry Fonda). Frank is echter nergens te bekennen en heeft drie handlangers gestuurd die ‘Harmonica’ opwachten. Geen van de drie komt levend uit de confrontatie en Harmonica raakt verwikkeld in de machtsstrijd rondom de meedogenloze opmars van de spoorwegen en outlaws. Once Upon a Time in the West is vanwege zijn trage, sfeervolle stijl en iconische muziek van Ennio Morricone absoluut het kijken waard voor elke filmliefhebber.

Watch on YouTube

The Addams Family | Netflix | 20 februari

The Addams Family is gebaseerd op de strip van Charles Addams en volgt de bizarre titulaire Addams-familie: Gomez, Morticia, hun kinderen Pugsley en Wednesday, Uncle Fester, Grandma Addams, hun butler Lurch en de lopende hand Thing. Deze animatiefilm uit 2019 richt zich vooral op de twee kinderen, terwijl zij zoeken naar een manier om zichzelf te zijn. Gomez bereidt Pugsley voor op de "Sabre Mazurka", een zwaardvechtceremonie die elke Addams moet ondergaan, maar hij bakt er niks van. Ondertussen is Wednesday benieuwd naar de andere meisjes van haar leeftijd en begint ze, tot de schrik van haar moeder, zelfs kleur te dragen. Deze versie van The Addams Family bereikt niet de hoogtes van de live-action verfilming uit de jaren negentig, maar is toch vermakelijk om naar te kijken.