ID.nl logo
Alles over Google Gemini, Googles antwoord op ChatGPT
Huis

Alles over Google Gemini, Googles antwoord op ChatGPT

De markt voor generatieve AI-modellen is inmiddels een drukbevolkt speelveld. Met razend populaire tools zoals ChatGPT en Microsofts Copilot kan een techgigant als Google natuurlijk niet achterblijven. Googles antwoord is Gemini, een geavanceerd taalmodel dat diverse taken kan aanpakken. Maar wat houdt Gemini precies in? Hoe kan het worden ingezet? En weet Google hiermee de concurrentie te overtreffen?

Google Gemini is het resultaat van Google Deepmind en Research, en bestaat in drie vormen:

✧ Gemini Ultra is het boegbeeld van Google en is een betaalde optie ✧ Gemini Pro is daar een een afgeslankte vorm van ✧ Gemini Nano is dan weer een compact model voor smartphonegebruik, zoals de Google Pixel 8 Pro

Omdat Google Gemini multimodaal is, kan het systeem meer dan alleen tekst genereren.

Als je de laatste twaalf maanden op het internet gezeten hebt, dan ben je de term ongetwijfeld weleens tegengekomen: generatieve AI, oftewel kunstmatige intelligentie waarmee je zelf allerlei soorten content genereert, nakijkt of aanpast. Het bekendste voorbeeld is ChatGPT, maar inmiddels hebben we ook Google Gemini. Dit AI-model is ontwikkeld door het AI-onderzoekslab van Google, genaamd Deepmind, in samenwerking met Google Research. De kunstmatige intelligentie is beschikbaar in drie smaken, die we hieronder zullen behandelen.

Lees ook: 5 alternatieven voor de ChatGPT-app

Dit is Google Gemini

Allereerst Gemini Ultra, dat fungeert als het boegbeeld. Hiermee laat Google precies zien wat het bedrijf in huis heeft als het gaat om generatieve kunstmatige intelligentie. Daar vlak onder hangt Gemini Pro, een versie die je het best kunt omschrijven als een afgeslankte vorm van Ultra. Tot slot is er Gemini Nano, een versie die is bedoeld voor smartphones, zoals de Google Pixel 8 Pro. Google Gemini is van oorsprong multimodaal, wat betekent dat het model niet alleen met tekst werkt, maar ook overweg kan met audio, afbeeldingen, video’s en programmeertalen.

Dat gaat iets verder dan je in eerste instantie zou denken. Om een compleet beeld te geven: Google Gemini is in de basis in staat allerlei vormen van informatie te begrijpen, bewerken en combineren. Zo kun je een foto uploaden en vragen: "Wat gebeurt er op deze foto?" Gemini omschrijft dan wat er in de foto te zien is. Ondertussen kun je extra vragen blijven stellen, terwijl Gemini onthoudt wat de eerste prompt was. Al die context wordt vervolgens meegenomen in vervolgvragen, waardoor er een compleet beeld kan ontstaan van de vraagstukken die je hebt. Gemini kan dus – zoals het er nu naar uitziet – overweg met complexe reeksen aan prompts. Dat dankt de chatbot aan z’n specifieke training, waarbij tekst, afbeeldingen, video’s en audio uit één bron komen.

In de meeste gevallen is het zo dat chatbots training krijgen op basis van meerdere bronnen, waar teksten, afbeeldingen, video’s en meer vanuit verschillende datasets komen. Google Gemini hoeft dus geen informatie achteraf samen te voegen.

Niet meer zo letterlijk

In theorie zou deze manier van informatie vergaren moeten leiden tot een betere chatbot. Google Gemini kan zodoende namelijk ‘intuïtiever’ te werk gaan. Als je hem de opdracht zou geven een afbeelding te maken op basis van bepaalde beeldspraak, dan zou de bot dat niet meer letterlijk nemen (zoals nu vaak nog het geval is, en mits er ondersteuning is voor de taal waarin je hem wilt gebruiken). 'Een boom van een kerel' zou in dit geval geen afbeelding moeten opleveren van een boom met een gezicht, maar daadwerkelijk een man die lang en breed is. Overigens is beeldgeneratie vooralsnog niet mogelijk in de huidige versie Gemini, al werkt Google daar op de achtergrond hard aan.

Afbeelding gemaakt met Microsoft Copilot, dat werkt op basis van ChatGPT4.

Je komt de naam Gemini trouwens ook tegen bij andere digitale producten van Google, waardoor er wellicht wat verwarring kan ontstaan. Er zijn immers ook Gemini-apps die werken op mobiele apparaten en het web. Voorheen lanceerde Google die software onder de noemer Google Bard, maar die moet nu dus plaatsmaken voor de naam en het product Gemini. Wat je daar als gebruiker van merkt? Nou, los van de naam in de praktijk misschien niet zo heel veel, omdat je de producten nog steeds op dezelfde manier gebruikt. Maar achter de schermen is de technologie anders, waardoor de producten beter werken.

De verschillende versies

Hoewel zo’n pakket met AI-diensten dan ineens heel onoverzichtelijk lijkt, is dit geen vreemde aanpak van Google. De Amerikaanse advertentiegigant presenteert wel vaker producten en diensten die op elkaar lijken, maar in de basis weinig met elkaar te maken hebben. Maar goed, met Google Gemini kun je dus een hoop zaken genereren en (laten) aanpassen. Om goed te kunnen begrijpen wat Google Gemini in zijn mars heeft, moeten we per versie bekijken wat de opties zijn. Gemini is in elk geval ontworpen om op elk (soort) apparaat te kunnen werken.

Gemini Ultra is het grootste taalmodel binnen deze reeks, ontworpen voor complexe taken. Op het moment van schrijven voert Google nog tests uit met Ultra, maar nu al presteert het model beter dan bijvoorbeeld ChatGPT-4. Gemini Pro biedt een balans tussen schaalbaarheid en prestaties, en fungeert als tool die allerlei soorten taken op zich kan nemen. Op dit moment fungeert Pro als basis voor de Google Gemini-chatbot, die voorheen door het leven ging als Google Bard. Qua prestaties is Gemini Pro vergelijkbaar met ChatGPT-3.5 Turbo.

Gemini uitproberen op een Pixel?

Kijk hier voor de beste deals!

En dan hebben we nog Google Gemini Nano. Deze versie draai je straks lokaal op een smartphone, zoals een Pixel-apparaat. In theorie betekent het dat de slimme assistent aan boord van jouw smartphone sneller op vragen en opdrachten kan reageren dan wanneer een chatbot eerst nog met een externe server contact legt. Momenteel werkt Gemini Nano al op een Google Pixel 8 Pro, waardoor gebruikers toegang krijgen tot slimme antwoorden (die voor je gegenereerd worden) wanneer ze gebruikmaken van het Google-toetsenbord. Dat werkt (anno maart 2024) nog niet in Nederland.

Lees ook: AI-instapcursus: dit kun je allemaal doen met ChatGPT

De verschillen tussen die versies

Het verschil tussen al die versies zit 'm in het aantal parameters dat ze tot hun beschikking hebben. Hoe meer meetbare waarden, hoe beter een chatbot kan omgaan met complexe verzoeken. Helaas is het zo dat Google – en ook andere bedrijven – de kaarten met dergelijke informatie dicht tegen de borst houdt. Tenzij dergelijke aanbieders een reden vinden om die informatie te delen natuurlijk. Google Gemini Nano is in elk geval in twee varianten te gebruiken: een met 1,8 miljard en een met 3,25 miljard verschillende datapunten.

Momenteel heeft Google nog altijd geen exacte cijfers bekendgemaakt omtrent het aantal parameters voor Gemini Pro en Gemini Ultra. We kunnen echter wel een grove schatting doen, als we kijken naar wat de concurrentie momenteel uitvreet. Zo beschikt ChatGPT-3 over 175 miljard parameters, terwijl LLaMA 2 (van Facebook-moederbedrijf Meta) het moet doen met maximaal 65 miljard stuks. ChatGPT loopt hierin dus voor op LLaMA 2. We kunnen ons niet voorstellen dat Google daar onder zit – maar wellicht vindt het bedrijf binnenkort de ruimte om er meer over te vertellen.

Waar haalt Google Gemini zijn informatie vandaan? Onder meer een gigantische dataset met biljoenen punten aan tekst, audio en meer. Maar ook archieven aan websites, afbeelding-tekstdatabases en eigen databronnen zoals Google Boeken.

Waar komen we Google Gemini tegen?

Het kan zijn dat je straks Googles eigen apps gebruikt met ondersteuning van Google Gemini. De AI is echter vanaf het begin af aan opgebouwd als basis voor andere ontwikkelaars, die hun producten de nodige boost op basis van kunstmatige intelligentie kunnen geven. Het grote voordeel – ten opzichte van de concurrentie – is dat die apps en diensten direct geïntegreerd kunnen worden met een veelheid aan internetdiensten, zoals de cloud en webhosting. Met deze stap wil Google een voet tussen de deur krijgen van de AI-markt, die vooral gedomineerd wordt door OpenAI.

OpenAI is het bedrijf achter de verschillende versies van ChatGPT. Daar kun je op dit moment van alles mee, zoals vakanties plannen, je eigen chatbot mee maken en afbeeldingen mee genereren. Bovendien gebruiken andere bedrijven (zoals Microsoft) ChatGPT als basis voor hun eigen AI-diensten. Neem bijvoorbeeld Microsoft Copilot, waar je zelf ook afbeeldingen mee kunt maken. Dat zijn kansen die Google niet wil laten liggen. Je zult dus mogelijk niet direct in aanraking komen met de software, maar wel indirect en in allerlei verschillende applicaties.

▼ Volgende artikel
Ontwerp van Nothing Phone (4a) onthuld
Huis

Ontwerp van Nothing Phone (4a) onthuld

Het Britse bedrijf Nothing heeft het design van de aankomende nieuwe smartphone Phone (4a) onthuld.

Dat deed het bedrijf gisteren via social media. De smartphone komt op 5 maart uit. In de tweet hieronder is het ontwerp alvast te zien, met de typische drukke achterkant die we inmiddels gewend zijn van het bedrijf.

De aankomende Phone (4a) heeft een zogeheten 'Glyph Bar'. Dit is een micro-led-paneel aan de zijkant, die mensen zelf kunnen programmeren om ze in verschillende patronen te laten knipperen. Het gaat om de vierkantjes aan de rechterzijde, naast het camera-eiland. De led-lampjes zijn volgens het bedrijf 40 procent feller dan die op de Phone (3a).

Over de precieze technologie van de Nothing Phone (4a) zijn nog geen aankondigingen gedaan, maar volgens geruchten krijgt de smartphone een Snapdragon 7s Gen 4-chip. Er zal ook een duurdere en snellere Phone (4a) Pro verschijnen, al is daar het uiterlijk nog niet van onthuld.

Officieel wordt de Phone (4a) op 5 maart onthuld.

View post on X
▼ Volgende artikel
Waarom je monitor op het moederbord aansluiten je pc vertraagt
© Provokator
Huis

Waarom je monitor op het moederbord aansluiten je pc vertraagt

Je sluit je nieuwe monitor aan, de pc start op, maar de prestaties in zware programma's en games vallen vies tegen. In dit artikel ontdek je waarom de aansluiting op je moederbord de grafische kracht van je computer negeert en hoe je dat direct oplost voor maximale rekenkracht.

Het is een klassieke fout bij het opbouwen van een werkplek: de videokabel in het eerste gat steken dat je tegenkomt aan de achterzijde van je computerkast. Vaak belandt de kabel dan in een van de poorten van het moederbord, terwijl de krachtige videokaart een verdieping lager ongebruikt blijft. Dit misverstand ontstaat omdat beide aansluitingen identiek ogen, maar de interne route die de data aflegt verschilt als dag en nacht. Daarom leggen we je uit hoe je het volledige potentieel van je hardware benut en waarom die extra investering in je grafische kaart anders weggegooid geld is.

De interne omweg via de processor

Als je de HDMI- of DisplayPort-kabel in het moederbord plugt, dwing je de computer om de geïntegreerde grafische chip van de processor te gebruiken (mits die is ingeschakeld via het BIOS). Wij hebben dat uiteraard nog even getest en merkten dat alles inderdaad veel minder soepel aanvoelt zodra de processor deze dubbelrol moet vervullen. In plaats van dat de data direct naar de gespecialiseerde kernen van de videokaart gaat, moet de processor nu zowel de algemene berekeningen als de visuele output verwerken.

Dat veroorzaakt een een hoop warmte in de behuizing en de ventilatoren van de CPU beginnen sneller te loeien om de extra last op te vangen. Het is al met al een onhandige route waarbij de dure videokaart onderin je kast simpelweg geen signaal doorgeeft aan je scherm.

©stas_malyarevsky

Hier moet je de HDMI-kabel dus níét in steken als je de beste prestaties wilt.

Aansluiting heeft wel degelijk een functie

Er zijn echter specifieke scenario's waarin deze aansluiting juist je beste vriend is, bijvoorbeeld tijdens het stellen van een diagnose als er iets opeens niet werkt. Als je pc bijvoorbeeld geen beeld geeft via de videokaart, is inpluggen op het moederbord de enige manier om te controleren of de rest van je systeem nog wel functioneert.

Ook voor een eenvoudige kantoormonitor, die alleen wordt gebruikt voor tekstverwerking en e-mail, volstaat de interne chip van de processor en is een dedicated videokaart niet eens nodig. Deze route bespaart energie en houdt de pc stiller, omdat de zware videokaart (als die er is) in een diepe slaapstand kan blijven. Voor een secundair scherm waarop je alleen statische informatie zoals een chatvenster of Spotify in beeld hebt, kan deze configuratie zelfs een slimme manier zijn om de hoofdvideokaart te ontlasten van onnodige basistaken.

Verlies grafische rekenkracht

Zodra je echter een zware taak start, zoals videobewerking of een moderne game, loopt de pc direct tegen een muur aan. De geïntegreerde graphics hebben namelijk geen eigen snel geheugen en snoepen zodoende rekenkracht van het werkgeheugen van je systeem. Je merkt dat aan haperende beelden, een lage framerate en textures die traag laden.

Zo kan het gebeuren dat een krachtige gaming-pc, die normaal gesproken honderd frames per seconde (100 fps) haalt, via de moederbordaansluiting terugvalt naar een onwerkbare diavoorstelling van minder dan 10 fps. De hardware is aanwezig, maar de snelweg naar het scherm is afgesloten, waardoor je in feite maar een fractie van de capaciteit krijgt waarvoor je hebt betaald.

Situaties waarin je deze aansluiting sowieso moet vermijden

Het aansluiten op het moederbord is een absolute dealbreaker voor iedereen die met visuele content werkt of veeleisende games speelt. Als je voor honderden euro's een videokaart hebt aangeschaft, is het een kostbare vergissing om de monitor ergens anders in te pluggen.

Ook bij het gebruik van een 4K-monitor kan de interne chip de verversingssnelheid vaak niet bijbenen, waardoor je naar een schokkerig beeld zit te kijken terwijl je hardware veel vloeiender kan presteren. Voor creatieve professionals die software gebruiken voor 3D-rendering is het gewoon onmogelijk om te werken; de software zal vaak zelfs een foutmelding geven omdat de benodigde grafische bibliotheken niet worden ondersteund door de standaard processor-chip.

De snelle poorten zitten meestal verder naar onderen en zijn doorgaans horizontaal gepositioneerd.

Zo vind je de juiste poort

Kijk eens goed naar de achterkant van je computerkast om te bepalen of je de volle snelheid benut. De aansluitingen van het moederbord staan altijd verticaal in een blok met andere poorten, zoals usb en ethernet. De aansluitingen van de videokaart zitten een stuk lager en staan horizontaal in een aparte sleuf. Zit je kabel in het bovenste blok, dan werk je op de 'reservemotor'.

Verplaats de kabel naar de horizontale poorten onderaan en je zult direct horen dat de pc anders reageert bij het opstarten. Soms moet je na deze wissel de pc even herstarten, zodat de drivers de nieuwe configuratie herkennen en de resolutie optimaal kunnen instellen voor jouw specifieke beeldscherm.

Klaar voor optimale prestaties?

Het aansluiten van een monitor op het moederbord in plaats van de videokaart zorgt ervoor dat de grafische rekenkracht van de pc onbenut blijft omdat het systeem terugvalt op de beperkte interne chip van de processor. Dat leidt tot een drastische afname in prestaties bij games en zware software, aangezien de gespecialiseerde hardware van de videokaart volledig wordt gepasseerd. Voor een optimale ervaring moet je de monitor altijd in de horizontale poorten van de videokaart prikken. Alleen in noodgevallen of bij eenvoudiger kantoortaken is de moederbordaansluiting een bruikbaar alternatief.