ID.nl logo
Huis

Hoe computers foto's herkennen via deep learning

Er zijn vele redenen waarom het handig is om automatisch beelden te kunnen herkennen. Naast de wetenschappelijke uitdaging is er ook de enorme groei van video en foto’s online. Op Facebook alleen al worden op dit moment per minuut 136.000 foto’s gepubliceerd. Het zoeken in deze gigantische verzamelingen vergt uiterst slimme technologie: deep learning.

Bij de foto’s die we maken met onze smartphones en digitale camera’s bestaat de enige informatie vaak uit generieke metadata zoals datum, tijd, type toestel en eventueel gps-coördinaten.

In veel gevallen weten we niet wat er op die foto’s staat en is de enige manier om daarachter te komen, de foto’s bekijken. Tenminste, tot voor kort.

De afgelopen jaren zien we een sterke groei in het onderzoek naar deep learning en ook een aantal startups het gebied van deep learning, het geautomatiseerd in kaart brengen van de inhoud van visuele content, het zogenoemde taggen.

Gezichtsherkenning

De afgelopen jaren hebben we al kennisgemaakt met gezichtsherkenning in foto’s. Google Picasa (nu vervangen door Google Photo’s) was een van de eerste programma’s (voor het grote publiek) dat dit kon.

De reden voor Google om dit te doen was aan de ene kant het ontwikkelen van nieuwe technologie, maar er was ook een commerciële overweging: door het aanbieden van deze functie kun je je verzameling foto’s beter doorzoeken en ga je hopelijk meer gebruikmaken van de diensten van Google.

Een andere partij die heel duidelijk de waarde kent van een verzameling foto’s is stockfotoleverancier iStock. Iedere foto die de dienst online aanbiedt is voorzien van tussen de 20 en 50 tags die de inhoud beschrijven. Dit taggen wordt grotendeels door mensen gedaan met behulp van een standaardlijst van tags. Afhankelijk van de foto zijn tags in gebruik die het onderwerp (vrouw, auto), de sfeer (vrijheid) of het concept beschrijven.

De waarde van tags

Alle tags helpen je om de foto te vinden doordat ze zoektermen bevatten. Zonder deze zoektermen is de omvangrijke verzameling van iStock veel minder waardevol, je zou dan alle foto’s moeten gaan bekijken.

Afhankelijk van de wijze van publicatie en uit welke fotoverzameling wordt gekozen, kan het gebruik van een foto van enkele euro’s tot honderden euro’s kosten. Er is dus ook echt een businessmodel: beter vindbaar betekent meer omzet. De tags overlappen qua inhoud, omdat dit de vindbaarheid vergroot. In het praktijkvoorbeeld aan het einde van het artikel gaan we zelf de foto uit het kader analyseren en kijken zelf welke tags er worden gegenereerd.

Opvallend is dat er zowel stemmingen of gevoelens (Freedom) zijn getagd, als harde feiten zoals Mountain Range. Sommige tags worden handmatig toegevoegd op basis van de informatie van de fotograaf (locatie, leeftijd modellen en etniciteit).

Hoe werkt deep learning?

Deep learning is qua technologie niet echt nieuw, in die zin dat er al jaren aan gewerkt wordt. Het herkennen van objecten is een technologie die teruggaat tot de jaren 50 met Rosenblatt’s Perceptron, een systeem geïnspireerd door de werking van het menselijk brein. Voordat deep learning en geautomatiseerde herkenning rond 2012 met de opmars begon zijn, zijn er diverse technologieën ontwikkeld die het mogelijk maken om te selecteren op bepaalde aspecten.

Dit waren op regels gebaseerde systemen. Een voorbeeld is herkenning van seksueel getinte afbeeldingen waar de aanwezigheid van een hoog percentage huidkleurige pixels een indicatie is om een afbeelding als zodanig te labelen. Hier zit ook de makke, een close-up van een gezicht zal waarschijnlijk als seksueel getint wordt aangemerkt. Een mens moet op dat moment de uiteindelijke beslissing nemen bij de classificatie.

Ook andere op regels gebaseerde modellen werden gebruikt om afbeeldingen te taggen. Zo zijn de grote aanwezigheid van gele pixels (zandkleurig) en blauwe pixels (water, lucht) een indicatie van een mogelijke strandopname. Regels zijn echter beperkt doordat zij altijd uitgaan van een vooraf beschreven situatie. Dat maakt modellen die erop gebaseerd zijn inflexibel.

Deep learning is het vermogen van een computer om kennis te vergaren zonder expliciet te worden geprogrammeerd.

-

In 2012 begon het tijdperk van deep learning. Dat beschrijft het vermogen van een computer of systeem om te leren (kennis vergaren) zonder expliciet te worden geprogrammeerd. Geautomatiseerde beeldherkenning werkt met het voeden van een systeem met een groot aantal voorbeelden, waarna het in staat moet zijn om soortgelijke voorbeelden te beoordelen. Het bestaat uit de software die kan leren, in dit geval het in kaart brengen van afbeelding met daarbij de kennis wat in de afbeelding te zien is (berg, auto, vrouw, zomer). Dit wordt gebundeld in een model. Dit model kan specifiek zijn, zoals bij auto’s, of meer generiek. In het laatste geval ziet het model wel dat het een auto is, maar waarschijnlijk niet het merk.

Deze technologie is trouwens niet alleen geschikt voor beeldverwerking, ook handschriftherkenning, ocr (optical character recognition) en spraakherkenning zijn geschikte toepassingen. Ook hierbij geldt dat het gaat om het herkennen van woorden, handschriften enzovoort.

Herkennen

Herkennen van objecten is kinderspel. Letterlijk zelfs: op jonge leeftijd leren we objecten te herkennen en maken we verbindingen tussen een object en de naam. We beginnen met iets een ‘ding’ te noemen (of zelfs ‘dat’), dan wordt het een ‘vogel’ en eindigen, afhankelijk van onze kennis, bij bijvoorbeeld een mus. Wanneer een specifiek type vogel wordt geleerd dan wordt die soort toegevoegd.

Daarnaast kijken we naar kenmerken. Daarbij maken we al snel een hele slimme inschatting: we herkennen de basisvorm (vleugels, snavel) en classificeren het dier als een vogel, ook al hebben we deze vogel nog nooit gezien. We leren objecten herkennen doordat we dus niet ‘absoluut’ kijken maar relatief. We kijken meer naar generieke aspecten dan naar specifieke zaken. Als je een kind vraagt om een huis te tekenen is de kans groot dat het een vierkant blok wordt met een driehoek erboven. Dat is de essentie van een huis, raam, schoorsteen en deur horen daar ook bij. Dat wordt aangeleerd en helpt om zaken te kunnen classificeren.

Een computer kijkt niet naar het totaalplaatje, maar deelt het beeld op in kleine vierkantjes. Bij ieder vierkant wordt gekeken of er een vorm of kleur op staat die het kent (van de voorbeelden waarmee het getraind is, bijvoorbeeld een stukje van een wiel. Op na een aantal van deze analyses worden de stukjes bij elkaar gelegd en vormen bijvoorbeeld een of twee wielen. Op dat moment neemt de waarschijnlijkheid toe dat het een vervoersmiddel is (want die hebben vaak wielen). Het zou ook een hoepel kunnen zijn, wat ook rond is, dus als een hoepel ook een bekend object is neemt daarvan ook de waarschijnlijkheid toe.

Als alle afzonderlijke zaken uiteindelijk zijn bekeken en opgesteld, komt er bijvoorbeeld uit dat het vanwege het herkennen van twee wielen en een stuur zeer waarschijnlijk een fiets is. Als het systeem nog meer objecten kent met wielen, niet zijnde een fiets, zal het daar ook nog een waarschijnlijkheid aan verbinden.

Een computer kijkt niet naar het totaal plaatje maar deelt het beeld op inkleine vierkantjes.

-

Trainen

Zoals gezegd wordt het ‘leren’ van het systeem gedaan door het aanbieden van een aantal afbeeldingen met tags (de ‘ground truth’) die worden gebruikt om het model te maken. Later in dit artikel gaan we zelf aan de slag met geautomatiseerde beeldherkenning. We gebruiken hiervoor de api’s van Clarifai, een bedrijf dat is gespecialiseerd in geautomatiseerde beeldherkenning. Clarifai wordt gebruikt bij stockfotografie bedrijven zoals 500px en Pond5 om het taggen van stockfoto’s te ondersteunen en te versnellen. Clarifai biedt een volledige suite van diensten inclusief het zelf maken van een model.

Een model zoals dat van Clarifai is getraind met miljoenen foto’s. Clarifai gebruikt meerdere modellen, generiek (breed) of meer specifiek, inclusief een model met de titel NSFW. Op dit moment is het nog niet haalbaar om alle concepten en objecten in een model onder te brengen, dan zou de analyse te lang duren.

Het hoofdmodel van Clarifai identificeert meer dan 11.000 generieke concepten zoals objecten, concepten en gevoelens. Vooral dit laatste is subjectief omdat bijvoorbeeld vrijheid moeilijk te definiëren is als visuele vorm.

Als je een verkeerd model (met kennis) gebruikt bij een afbeelding, bijvoorbeeld een model voor voedsel met een foto van een tropisch strand, levert dat geen of foute tags op. Het model kent tenslotte niet de zaken die in de foto’s staan. In het generieke model wordt wel voedsel als tag herkend maar is een specifiek model nodig om daar verfijning in aan te brengen (bijvoorbeeld pizza).

Hoewel we op dit moment volgens sommigen bijna op menselijk niveau beeldherkenning kunnen doen is er nog voldoende ruimte voor verbetering. Een van die gebieden is het ‘voor de gek houden’ van het systeem. Het blijkt redelijk eenvoudig om beelden fout te laten classificeren, door bijvoorbeeld zoekpatronen mee te nemen. Hierdoor kan het systeem beweren dat een afbeelding met 99,99 procent zekerheid een bepaalde voorstelling is, terwijl het in feite nergens op lijkt. Het systeem zou kunnen worden getraind met ‘anti afbeeldingen’ om dit tegen te gaan.

Tekst: Rob Blaauboer

▼ Volgende artikel
Waar voor je geld: 5 grote 65 inch 4K smart-tv's voor minder dan 600 euro
© jon anders wiken
Huis

Waar voor je geld: 5 grote 65 inch 4K smart-tv's voor minder dan 600 euro

Bij ID.nl zijn we gek op producten waar je niet de hoofdprijs voor betaalt. Een paar keer per week speuren we daarom binnen een bepaald thema naar zulke deals. Waar je een paar jaar geleden nog de hoofdprijs betaalde voor een goede 65 inch smart-tv, zijn deze tv's nu al een stuk betaalbaarder. Wij vonden vijf exemplaren die voor minder dan 600 euro te koop zijn.

Een 65 inch 4K smart-tv is natuurlijk de ultieme televisie voor het kijken van series en films in de hoogste kwaliteit. Voordeel is verder ook dat je niet al te dicht op je scherm hoeft te zitten: voor een 65 inch televisie geldt een afstand vanaf zo'n drie tot drieënhalve meter. En dankzij de smart-functionaliteit heb je toegang tot tal van streamingdiensten. Wij bekeken de mooiste modellen die je voor minder dan 600 euro kunt kopen.

LG 65UR73006LA

Voor wie houdt van heldere beelden en natuurlijke kleuren is de LG 65UR73006LA.AEUQ een prima keuze. Het 4K-paneel met ondersteuning voor HDR10 en HLG laat films en series mooi uitkomen. Wat direct opvalt is het brede kijkhoekpaneel, zodat je vanuit elke hoek goed beeld hebt. Drie HDMI 2.1-poorten zijn aanwezig, handig voor bijvoorbeeld een spelcomputer of soundbar. Het geluid is degelijk, met 20 watt RMS, al kan een extra speaker geen kwaad. De televisie zelf is niet overdreven dik, ongeveer 57 mm, en draait op WebOS dat vlot en makkelijk werkt.

Besturingssysteem: WebOS
Aantal HDMI-poorten
: 3
Audio-output (RMS)
: 20W

TCL 65C655 Pro

Deze TCL 65C655 Pro is een goede keus als je graag series kijkt of een filmavond houdt. Dankzij de QLED-techniek komen de kleuren mooi tot leven en ook HDR10+ en Dolby Vision helpen mee voor extra diepte. Google TV zorgt ervoor dat je toegang hebt tot de meeste (streaming-)apps van Netflix tot YouTube. Het geluid springt eruit: met 50 watt RMS en een ingebouwde subwoofer krijg je een stevig geluid. De tv zelf is daardoor wel een tikje dikker, zo’n 80 mm. Er zijn drie HDMI-poorten voor het aansluiten van extra apparaten.

Besturingssysteem: Google TV
Aantal HDMI-poorten
: 3
Audio-output (RMS)
: 50W

Hisense 65A7NQ

Ben je iemand die vooral van gemak houdt? De Hisense 65A7NQ biedt precies dat. De tv is simpel in gebruik, draait op het VIDAA-besturingssysteem en start razendsnel op. Met zijn 4K-beeld en ondersteuning voor Dolby Vision zie je mooie kleuren en scherpe beelden. Er zijn drie HDMI-poorten, voldoende voor al je apparaten. De tv heeft een redelijk slank ontwerp, ongeveer 80 mm dik. Het geluid van 20 watt RMS is prima voor dagelijks gebruik, al klinkt het met een soundbar net even beter.

Besturingssysteem: VIDAA U
Aantal HDMI-poorten
: 3
Audio-output (RMS)
: 20W

Samsung QE65Q80DAT

Wat deze Samsung QE65Q80DAT meteen bijzonder maakt, is het strakke ontwerp en de Direct Full Array-achtergrondverlichting. Daardoor zijn de zwarttinten diep en het contrast sterk. De tv is heel geschikt voor wie sportwedstrijden of actiefilms kijkt. Hij heeft vier HDMI 2.1-poorten en een krachtig geluid van 40 watt RMS, wat zorgt voor een volle klank bij films. Het scherm is vrij dun, met 54 mm, en draait op het vertrouwde Tizen-besturingssysteem dat soepel werkt.

Besturingssysteem: Tizen
Aantal HDMI-poorten
: 4
Audio-output (RMS)
: 40W

Philips 65PUS7609/12

Bij de Philips 65PUS7609/12 draait het om eenvoud en betaalbaarheid. De beeldkwaliteit is prima voor dagelijks gebruik, met 4K-resolutie en ondersteuning voor Dolby Atmos voor beter geluid. De tv werkt met Titan OS, dat simpel is en vlot laadt. Er zijn drie HDMI 2.1-poorten, genoeg om bijvoorbeeld een spelcomputer of extra box aan te sluiten. De tv is iets dikker dan sommige andere modellen, ongeveer 92 mm, en levert 20 watt RMS geluid. Philips is voor deze serie afgestapt van Google TV en levert de modellen nu met Titan OS.

Besturingssysteem: Titan OS
Aantal HDMI-poorten
: 3
Audio-output (RMS)
: 20W

▼ Volgende artikel
Brug te laag? Bocht te krap? Met campernavigatie verloopt je reis wél probleemloos
© ID.nl
Mobiliteit

Brug te laag? Bocht te krap? Met campernavigatie verloopt je reis wél probleemloos

Ga je op vakantie met je camper of met de caravan? Dan wil je vooral ontspannen rijden, zonder zorgen over te lage viaducten, smalle haarspeldbochten of weggetjes waar je amper kunt keren. Toch gebruiken veel mensen nog steeds een standaard autonavigatie, terwijl die niet is afgestemd op de afmetingen en het rijgedrag van een groter of zwaarder voertuig. In dit artikel lees je wat campernavigatie anders doet – en waarom dat handig is.

📍 Wat het verschil is tussen gewone navigatie en campernavigatie 📍 Waarom standaard navigatie niet altijd geschikt is voor campers of caravans 📍 Welke problemen speciale campernavigatie voorkomt 📍 Welke extra functies campernavigatie biedt 📍 Wanneer campernavigatie echt nodig is 📍 Waar je op moet letten als je campernavigatie wilt kopen 📍 Waarom een groter scherm handig is in een camper

Lees ook: Een airco in je caravan of camper? Dit zijn de mogelijkheden!

Een gewone navigatie – los toestel of via smartphone – is gebouwd voor personenauto's. Je voert een bestemming in, kiest eventueel tussen snelste of kortste route, en krijgt aanwijzingen gebaseerd op normale verkeersregels en gangbare voertuigafmetingen. Voor dagelijks gebruik werkt dat prima. Maar zodra je met een grote camper of een caravan op pad gaat, kom je al snel beperkingen tegen. Denk aan tunnels met een beperkte doorrijhoogte, wegen met maximale asdruk of gewichtslimiet, scherpe bochten in bergachtig gebied of dorpskernen waar je amper kunt keren of parkeren. Een standaard navigatie houdt daar geen rekening mee. Dat kan onderweg voor behoorlijk wat stress zorgen, of in het slechtste geval zelfs voor schade.

Wat doet campernavigatie anders?

Een speciaal campernavigatiesysteem is ontworpen met campers en auto's met aanhanger in gedachten. Je voert vooraf de lengte, breedte, hoogte en het gewicht van je combinatie in. Op basis daarvan worden alleen routes getoond die ook echt geschikt zijn voor jouw voertuig. En dat maakt een wereld van verschil.

Zo vermijd je automatisch bruggen waar je niet onderdoor kunt, te smalle weggetjes in dorpjes of natuurgebieden, steile hellingen waar je niet comfortabel kunt rijden of keren en wegen waar een caravan officieel niet is toegestaan. Veel campernavigaties bieden ook aanvullende functies. Denk aan filters voor campings, servicepunten of camperplaatsen, kaarten die je offline kunt gebruiken in gebieden zonder bereik, weergave van hellingspercentages en scherpe bochten onderweg en waarschuwingen voor zijwind, milieuzones of tolwegen. Sommige systemen kun je zelfs koppelen aan een achteruitrijcamera, wat handig is bij parkeren of keren op krappe plekken.

Wat je bij campernavigatie ook vaak ziet: een groter scherm dan bij standaard modellen. Dat is geen luxe, maar een bewuste keuze. De zitpositie in een camper is meestal hoger en wat verder van het dashboard af. Een scherm van 7 inch of groter zorgt dan voor beter overzicht en leesbaarheid, zonder dat je moet turen of knijpen met je ogen. Zeker als je tijdens het rijden snel de kaart of de aanwijzingen wilt checken, is dat een voordeel.

©GARMIN International ©2022

Voorbeelden uit de praktijk

Stel: je rijdt met een camper door de Ardennen. De kortste route volgens je telefoon gaat dwars door een dorpje met een smal bruggetje en steile oprit. Een standaard navigatie stuurt je daar zonder waarschuwing heen. Een campernavigatie herkent de beperkingen en kiest een alternatieve route via een doorgaande weg, ook al is die iets langer. Of je rijdt in Zuid-Frankrijk met een caravan achter je auto. Je komt bij een tunnel waar voertuigen hoger dan 2,60 meter niet doorheen mogen. Een gewone navigatie weet dat niet – een campernavigatie voorkomt dit soort problemen.

Is het altijd nodig?

Als je met een compacte buscamper reist die nauwelijks groter is dan een gewone auto, heb je in de praktijk minder snel last van beperkingen. Maar zodra je camper langer of hoger is, of je met een flinke caravan rijdt, wordt specifieke navigatie al snel een stuk comfortabeler – en veiliger. Ook voor langere reizen of tochten buiten West-Europa is het verschil merkbaar. Niet elk land signaleert hoogte- of gewichtsbeperkingen even duidelijk. Dan is het prettig als je navigatie dat voor je bijhoudt.

Campernavigatie kopen? Hier moet je op letten

Niet elk navigatiesysteem voor campers biedt dezelfde functies. Let daarom goed op de specificaties voordat je iets aanschaft. Controleer of je de voertuigafmetingen (lengte, breedte, hoogte, gewicht) kunt invoeren. Alleen dan kan het systeem echt rekening houden met obstakels op de route. Kijk ook naar het kaartmateriaal: is het actueel en dekt het voldoende landen? Zeker als je buiten West-Europa reist, is dat belangrijk. Sommige modellen bieden gratis kaartupdates, anderen niet. Let daarnaast op of er specifieke camper-POI's in het systeem zitten, zoals camperplaatsen, servicestations of campings. Ook de gebruikersinterface speelt een rol: is het systeem vlot te bedienen, ook als je onderweg bent? En niet onbelangrijk: hoe groot is het scherm? Bij voorkeur is dat minstens 7 inch. Een groter scherm is niet alleen prettiger tijdens het rijden, maar maakt het ook makkelijker om in een oogopslag hellingen, bochten en alternatieven te overzien. Ten slotte: als je al een achteruitrijcamera hebt, controleer dan of deze te koppelen is aan het systeem. Dat maakt het manoeuvreren op een krappe camping een stuk makkelijker.

Fijne vakantie!

Een campernavigatie lijkt op het eerste gezicht misschien een extra uitgave, maar het levert je onderweg vooral rust en gemak op. Geen stress over bruggen, geen gedoe bij keren, en geen verrassingen bij tunnels of bergwegen. Zeker als je vaker met je camper of caravan op pad gaat, is het een investering die je reis een stuk comfortabeler en ontspannen maakt.

P.S. Ook handig als je vaak op pad bent:

Een compacte camping-wasmachine