ID.nl logo
Alles over Google Gemini, Googles antwoord op ChatGPT
Huis

Alles over Google Gemini, Googles antwoord op ChatGPT

De markt voor generatieve AI-modellen is inmiddels een drukbevolkt speelveld. Met razend populaire tools zoals ChatGPT en Microsofts Copilot kan een techgigant als Google natuurlijk niet achterblijven. Googles antwoord is Gemini, een geavanceerd taalmodel dat diverse taken kan aanpakken. Maar wat houdt Gemini precies in? Hoe kan het worden ingezet? En weet Google hiermee de concurrentie te overtreffen?

Google Gemini is het resultaat van Google Deepmind en Research, en bestaat in drie vormen:

✧ Gemini Ultra is het boegbeeld van Google en is een betaalde optie ✧ Gemini Pro is daar een een afgeslankte vorm van ✧ Gemini Nano is dan weer een compact model voor smartphonegebruik, zoals de Google Pixel 8 Pro

Omdat Google Gemini multimodaal is, kan het systeem meer dan alleen tekst genereren.

Als je de laatste twaalf maanden op het internet gezeten hebt, dan ben je de term ongetwijfeld weleens tegengekomen: generatieve AI, oftewel kunstmatige intelligentie waarmee je zelf allerlei soorten content genereert, nakijkt of aanpast. Het bekendste voorbeeld is ChatGPT, maar inmiddels hebben we ook Google Gemini. Dit AI-model is ontwikkeld door het AI-onderzoekslab van Google, genaamd Deepmind, in samenwerking met Google Research. De kunstmatige intelligentie is beschikbaar in drie smaken, die we hieronder zullen behandelen.

Lees ook: 5 alternatieven voor de ChatGPT-app

Dit is Google Gemini

Allereerst Gemini Ultra, dat fungeert als het boegbeeld. Hiermee laat Google precies zien wat het bedrijf in huis heeft als het gaat om generatieve kunstmatige intelligentie. Daar vlak onder hangt Gemini Pro, een versie die je het best kunt omschrijven als een afgeslankte vorm van Ultra. Tot slot is er Gemini Nano, een versie die is bedoeld voor smartphones, zoals de Google Pixel 8 Pro. Google Gemini is van oorsprong multimodaal, wat betekent dat het model niet alleen met tekst werkt, maar ook overweg kan met audio, afbeeldingen, video’s en programmeertalen.

Dat gaat iets verder dan je in eerste instantie zou denken. Om een compleet beeld te geven: Google Gemini is in de basis in staat allerlei vormen van informatie te begrijpen, bewerken en combineren. Zo kun je een foto uploaden en vragen: "Wat gebeurt er op deze foto?" Gemini omschrijft dan wat er in de foto te zien is. Ondertussen kun je extra vragen blijven stellen, terwijl Gemini onthoudt wat de eerste prompt was. Al die context wordt vervolgens meegenomen in vervolgvragen, waardoor er een compleet beeld kan ontstaan van de vraagstukken die je hebt. Gemini kan dus – zoals het er nu naar uitziet – overweg met complexe reeksen aan prompts. Dat dankt de chatbot aan z’n specifieke training, waarbij tekst, afbeeldingen, video’s en audio uit één bron komen.

In de meeste gevallen is het zo dat chatbots training krijgen op basis van meerdere bronnen, waar teksten, afbeeldingen, video’s en meer vanuit verschillende datasets komen. Google Gemini hoeft dus geen informatie achteraf samen te voegen.

Niet meer zo letterlijk

In theorie zou deze manier van informatie vergaren moeten leiden tot een betere chatbot. Google Gemini kan zodoende namelijk ‘intuïtiever’ te werk gaan. Als je hem de opdracht zou geven een afbeelding te maken op basis van bepaalde beeldspraak, dan zou de bot dat niet meer letterlijk nemen (zoals nu vaak nog het geval is, en mits er ondersteuning is voor de taal waarin je hem wilt gebruiken). 'Een boom van een kerel' zou in dit geval geen afbeelding moeten opleveren van een boom met een gezicht, maar daadwerkelijk een man die lang en breed is. Overigens is beeldgeneratie vooralsnog niet mogelijk in de huidige versie Gemini, al werkt Google daar op de achtergrond hard aan.

Afbeelding gemaakt met Microsoft Copilot, dat werkt op basis van ChatGPT4.

Je komt de naam Gemini trouwens ook tegen bij andere digitale producten van Google, waardoor er wellicht wat verwarring kan ontstaan. Er zijn immers ook Gemini-apps die werken op mobiele apparaten en het web. Voorheen lanceerde Google die software onder de noemer Google Bard, maar die moet nu dus plaatsmaken voor de naam en het product Gemini. Wat je daar als gebruiker van merkt? Nou, los van de naam in de praktijk misschien niet zo heel veel, omdat je de producten nog steeds op dezelfde manier gebruikt. Maar achter de schermen is de technologie anders, waardoor de producten beter werken.

De verschillende versies

Hoewel zo’n pakket met AI-diensten dan ineens heel onoverzichtelijk lijkt, is dit geen vreemde aanpak van Google. De Amerikaanse advertentiegigant presenteert wel vaker producten en diensten die op elkaar lijken, maar in de basis weinig met elkaar te maken hebben. Maar goed, met Google Gemini kun je dus een hoop zaken genereren en (laten) aanpassen. Om goed te kunnen begrijpen wat Google Gemini in zijn mars heeft, moeten we per versie bekijken wat de opties zijn. Gemini is in elk geval ontworpen om op elk (soort) apparaat te kunnen werken.

Gemini Ultra is het grootste taalmodel binnen deze reeks, ontworpen voor complexe taken. Op het moment van schrijven voert Google nog tests uit met Ultra, maar nu al presteert het model beter dan bijvoorbeeld ChatGPT-4. Gemini Pro biedt een balans tussen schaalbaarheid en prestaties, en fungeert als tool die allerlei soorten taken op zich kan nemen. Op dit moment fungeert Pro als basis voor de Google Gemini-chatbot, die voorheen door het leven ging als Google Bard. Qua prestaties is Gemini Pro vergelijkbaar met ChatGPT-3.5 Turbo.

Gemini uitproberen op een Pixel?

Kijk hier voor de beste deals!

En dan hebben we nog Google Gemini Nano. Deze versie draai je straks lokaal op een smartphone, zoals een Pixel-apparaat. In theorie betekent het dat de slimme assistent aan boord van jouw smartphone sneller op vragen en opdrachten kan reageren dan wanneer een chatbot eerst nog met een externe server contact legt. Momenteel werkt Gemini Nano al op een Google Pixel 8 Pro, waardoor gebruikers toegang krijgen tot slimme antwoorden (die voor je gegenereerd worden) wanneer ze gebruikmaken van het Google-toetsenbord. Dat werkt (anno maart 2024) nog niet in Nederland.

Lees ook: AI-instapcursus: dit kun je allemaal doen met ChatGPT

De verschillen tussen die versies

Het verschil tussen al die versies zit 'm in het aantal parameters dat ze tot hun beschikking hebben. Hoe meer meetbare waarden, hoe beter een chatbot kan omgaan met complexe verzoeken. Helaas is het zo dat Google – en ook andere bedrijven – de kaarten met dergelijke informatie dicht tegen de borst houdt. Tenzij dergelijke aanbieders een reden vinden om die informatie te delen natuurlijk. Google Gemini Nano is in elk geval in twee varianten te gebruiken: een met 1,8 miljard en een met 3,25 miljard verschillende datapunten.

Momenteel heeft Google nog altijd geen exacte cijfers bekendgemaakt omtrent het aantal parameters voor Gemini Pro en Gemini Ultra. We kunnen echter wel een grove schatting doen, als we kijken naar wat de concurrentie momenteel uitvreet. Zo beschikt ChatGPT-3 over 175 miljard parameters, terwijl LLaMA 2 (van Facebook-moederbedrijf Meta) het moet doen met maximaal 65 miljard stuks. ChatGPT loopt hierin dus voor op LLaMA 2. We kunnen ons niet voorstellen dat Google daar onder zit – maar wellicht vindt het bedrijf binnenkort de ruimte om er meer over te vertellen.

Waar haalt Google Gemini zijn informatie vandaan? Onder meer een gigantische dataset met biljoenen punten aan tekst, audio en meer. Maar ook archieven aan websites, afbeelding-tekstdatabases en eigen databronnen zoals Google Boeken.

Waar komen we Google Gemini tegen?

Het kan zijn dat je straks Googles eigen apps gebruikt met ondersteuning van Google Gemini. De AI is echter vanaf het begin af aan opgebouwd als basis voor andere ontwikkelaars, die hun producten de nodige boost op basis van kunstmatige intelligentie kunnen geven. Het grote voordeel – ten opzichte van de concurrentie – is dat die apps en diensten direct geïntegreerd kunnen worden met een veelheid aan internetdiensten, zoals de cloud en webhosting. Met deze stap wil Google een voet tussen de deur krijgen van de AI-markt, die vooral gedomineerd wordt door OpenAI.

OpenAI is het bedrijf achter de verschillende versies van ChatGPT. Daar kun je op dit moment van alles mee, zoals vakanties plannen, je eigen chatbot mee maken en afbeeldingen mee genereren. Bovendien gebruiken andere bedrijven (zoals Microsoft) ChatGPT als basis voor hun eigen AI-diensten. Neem bijvoorbeeld Microsoft Copilot, waar je zelf ook afbeeldingen mee kunt maken. Dat zijn kansen die Google niet wil laten liggen. Je zult dus mogelijk niet direct in aanraking komen met de software, maar wel indirect en in allerlei verschillende applicaties.

▼ Volgende artikel
Waarom je tv-beeld onnatuurlijk oogt (en hoe je dat oplost)
© DC Studio
Huis

Waarom je tv-beeld onnatuurlijk oogt (en hoe je dat oplost)

Je hebt net een klein fortuin uitgegeven aan een gloednieuwe 4K- of zelfs 8K-televisie. Je installeert hem, start je favoriete filmklassieker en zakt onderuit op de bank. Maar in plaats van een bioscoopervaring bekruipt je het gevoel dat je naar een goedkope soapserie of een homevideo zit te kijken. De acteurs bewegen vreemd soepel, de actiescènes lijken versneld en de magie is ver te zoeken. Geen zorgen, je televisie is niet stuk. Hij doet eigenlijk iets te goed zijn best.

Dit fenomeen is zo wijdverspreid dat er een officiële term voor is: het 'soap opera effect'. In technische kringen wordt dit ook wel bewegingsinterpolatie of 'motion smoothing' genoemd. Hoewel fabrikanten deze functie met de beste bedoelingen in hun televisies bouwen, is het voor filmfanaten vaak een doorn in het oog. Gelukkig is het eenvoudig op te lossen... als je tenminste weet waar je moet zoeken.

Nooit meer te veel betalen? Check
Kieskeurig.nl/prijsdalers!

Wat is het 'soap opera effect' precies?

Om te begrijpen wat er misgaat, moeten we kijken naar hoe films worden gemaakt. De meeste bioscoopfilms en veel dramaseries worden opgenomen met 24 beelden per seconde. Die snelheid geeft films hun karakteristieke, dromerige uitstraling. Een beetje bewegingsonscherpte hoort daarbij; dat is wat onze hersenen associëren met 'cinema'. Moderne televisies verversen hun beeld echter veel vaker: meestal 60 of zelfs 120 keer per seconde.

Om dat verschil te overbruggen, verzint je slimme televisie er zelf beelden bij. De software kijkt naar beeld A en beeld B, en berekent vervolgens hoe een tussenliggend beeld eruit zou moeten zien. Dit voegt de tv toe aan de stroom. Het resultaat is een supervloeiend beeld waarin elke hapering is gladgestreken.

Voor een voetbalwedstrijd of een live-uitzending is dat geweldig, omdat je de bal en spelers scherper kunt volgen. Maar bij een film zorgt die kunstmatige soepelheid ervoor dat het lijkt alsof je naar een achter de schermen-video zit te kijken, of dus naar een soapserie zoals Goede Tijden, Slechte Tijden, die traditioneel met een hogere beeldsnelheid werd opgenomen. De filmische illusie wordt hierdoor verbroken.

©ER | ID.nl

De winkelmodus is ook een boosdoener

Naast beweging is er nog een reden waarom het beeld er thuis soms onnatuurlijk uitziet: de beeldinstellingen staan nog op standje zonnebank. Veel televisies staan standaard in een modus die 'Levendig' of 'Dynamisch' heet. Deze stand is ontworpen om in een felverlichte winkel de aandacht te trekken met knallende, bijna neon-achtige kleuren en een extreem hoge helderheid. Bovendien is de kleurtemperatuur vaak nogal koel en blauw, omdat dat witter en frisser oogt onder tl-licht. In je sfeervol verlichte woonkamer zorgt dat echter voor een onrustig beeld waarbij huidtinten er onnatuurlijk uitzien en details in felle vlakken verloren gaan.

Hoe krijg je de magie terug?

Het goede nieuws is dat je deze 'verbeteringen' gewoon kunt uitzetten. De snelste manier om van het soap opera effect en de neonkleuren af te komen, is door in het menu van je televisie de beeldmodus te wijzigen. Zoek naar een instelling die Film, Movie, Cinema of Bioscoop heet. In deze modus worden de meeste kunstmatige bewerkingen, zoals bewegingsinterpolatie en overdreven kleurversterking, direct uitgeschakeld of geminimaliseerd. Het beeld wordt misschien iets donkerder en warmer van kleur, maar dat is veel dichter bij wat de regisseur voor ogen had.

Sinds kort hebben veel moderne televisies ook de zogeheten Filmmaker-modus. Dat is de heilige graal voor puristen. Als je deze modus activeert, zet de tv met één druk op de knop alle onnodige nabewerkingen uit en respecteert hij de originele beeldsnelheid, kleuren en beeldverhouding van de film.

Wil je de beeldmodus niet volledig veranderen, maar alleen dat vreemde, soepele effect kwijt? Dan moet je in de geavanceerde instellingen duiken. Elke fabrikant geeft het beestje een andere naam. Bij Samsung zoek je naar Auto Motion Plus of Picture Clarity, bij LG-televisies ga je naar TruMotion, bij Sony naar Motionflow en bij Philips naar Perfect Natural Motion. Door deze functies uit te schakelen of op de laagste stand te zetten, verdwijnt het goedkope video-effect en krijgt je film zijn bioscoopwaardige uitstraling weer terug.

▼ Volgende artikel
Chrome Remote Desktop: ideaal voor ondersteuning op afstand
© ER | ID.nl
Huis

Chrome Remote Desktop: ideaal voor ondersteuning op afstand

Een apparaat op afstand bedienen hoeft geen geld te kosten en is verrassend eenvoudig. Of je nu bestanden wilt openen, technische problemen wilt oplossen of meerdere toestellen wilt beheren: met Chrome Remote Desktop kan het allemaal, gratis en zonder gedoe.

De helper begint

Een groot voordeel van Chrome Remote Desktop is de brede compatibiliteit: het werkt met Windows, macOS, Linux en ChromeOS. Bovendien is het veilig – verbindingen worden versleuteld – en je hebt alleen een Chrome-browser nodig. We beginnen aan de kant van degene die op afstand toegang wilt tot een andere computer, degene die ondersteuning biedt vanaf computer A. Op computer A opent de gebruiker Chrome en surft naar https://remotedesktop.google.com. Daar verschijnen twee opties: Dit scherm delen en Verbinding maken met een andere computer. Omdat computer A support wil geven aan een extern apparaat, kiest de gebruiker voor de tweede optie. In dat scherm verschijnt een veld om een toegangscode in te geven, de code volgt zo meteen.

Degene die support geeft, gebruikt het onderste vak.

Acties voor de hulpvrager

Op computer B, de computer die toegang zal verlenen, moet de gebruiker ook in Chrome surfen naar dezelfde website. Daar kiest hij voor de optie Dit scherm delen. Voordat dat mogelijk is, moet Chrome Remote Desktop eerst worden gedownload en geïnstalleerd. De gebruiker klikt daarvoor op de ronde blauwe knop met het witte downloadpijltje. Hiermee wordt een Chrome-extensie geïnstalleerd. Na de installatie verschijnt in het vak Dit scherm delen een blauwe knop met de tekst Code genereren. Wanneer de gebruiker daarop klikt, wordt een toegangscode van 12 cijfers aangemaakt. Die code geeft hij of zij door aan gebruiker A.

Wie support krijgt, moet de code via een berichtje of telefoontje doorgeven.

Scherm delen

Op computer A geeft de gebruiker de code op in Chrome Remote Desktop. Vervolgens wacht hij tot gebruiker B bevestigt dat A toegang mag krijgen tot zijn scherm. Zodra dat is gebeurd, verschijnt het volledige bureaublad van computer B in een nieuw Chrome-venster op computer A. Door dit venster schermvullend weer te geven, kan A probleemloos handelingen uitvoeren op de pc van B. Voor de veiligheid beschikken beide gebruikers over een knop om de sessie op elk moment te beëindigen. Uiteraard is een stabiele internetverbinding noodzakelijk. Daarnaast krijgen beide partijen de melding dat ze klembordsynchronisatie kunnen inschakelen. Hiermee wordt het mogelijk om eenvoudig tekst of bestanden te kopiëren en te plakken tussen beide apparaten.

Gebruiker A krijgt het volledige scherm van B in een Chrome-venster te zien.