Nieuwe versie van AI-model Claude Opus zegt eerlijk wanneer hij iets niet weet

Anthropic heeft gisteren versie 4.8 van Claude Opus uitgebracht. Dit vernieuwde AI-model zou eerlijk toegeven wanneer hij iets niet weet, in plaats van bijvoorbeeld een foutief antwoord geven.

Over de gehele linie is Opus 4.8 maar een kleine verbetering ten opzichte van het vorige maand uitgekomen Opus 4.7, met iets betere scores op de benchmarks voor het taalmodel. Anthropic claimt echter dat de nieuwe versie van Claude Opus vooral eerlijker is.

Volgens het bedrijf komt het wel vaker voor dat AI-modellen het antwoord op een vraag van de gebruiker niet weten, maar geven ze toch antwoord, ook al klopt het niet. Soms vertellen AI-modellen dat een taak die ze hebben gekregen progressie boekt, terwijl dat ook niet altijd het geval is.

Claude Opus 4.8 zou hier veel eerlijk in zijn. Het model zou minder vaak uitspraken doen die het niet kan ondersteunen met gevonden informatie, en zou eerlijker zijn dat het niet helemaal zeker is van het werk dat hij doet. Volgens een rapport is het dan ook vier keer minder waarschijnlijk dat Opus 4.8 een fout in code gebruikt om daar vervolgens zelf niets over te zeggen.

Gebruikers kunnen zelf ook meer invloed uitoefenen op hoeveel werk Opus 4.8 precies in een taak steekt. Ondanks dat kan het vernieuwde Claud toch grotere werkzaamheden verrichten, en zelfs andere subagenten aansturen die allerlei werkzaamheden uitvoeren. Claude Opus 4.8 is inmiddels uitgerold naar de apps.