Zo werken de algoritmes van Spotify
Iedere week op maandag krijg je als Spotify-gebruiker een lijstje voorgeschoteld met muziek die het beste bij jou smaak moet passen. Veel muziekliefhebbers zijn zeer te spreken over deze befaamde Discover Weekly-lijst: de nieuwe nummers sluiten daadwerkelijk aan op hun smaak. Hoe doet Spotify dat toch? In dit artikel duiken we dieper in de algoritmes van de populaire muziekdienst.
Laten we meteen maar de illusie wegnemen dat Spotify enkel kijkt naar de muziek die je luistert. De algoritmes van de muziekdienst gaan veel verder dan dat. Er wordt niet alleen gekeken naar je luistergedrag, maar ook naar de artiestenpagina’s die je bezocht hebt en welke afspeellijsten je zelf hebt aangemaakt.
Spotify heeft drie verschillende strategieën om tot het volledige profiel van een luisteraar te komen.
1. Collaborative filtering
In deze methode worden gebruikers zoveel mogelijk gegroepeerd. Dit laat zich het makkelijkste verklaren door een voorbeeld. Stel jij bent fan van de nummers ABC en D, terwijl je buurman erg te spreken is over de nummers BCD en E. De collaboratieve filter zegt vervolgens: “jullie vinden allebei drie dezelfde nummers leuk (BC en D), dus jullie vertonen overeenkomsten. Daardoor is de kans groot dat jij ook andere nummers van je buurman leuk vindt.”
Hierdoor zal Spotify je buurman aanbevelen om nummer A te luisteren, terwijl jij de aanbeveling krijgt om nummer E eens op te zetten. Simpel, toch?
2. Natural Language Processing
Voor deze methode struint Spotify het internet af: nieuwsartikelen, blogs en andere teksten over muziek worden geïnspecteerd, om erachter te komen wat mensen schrijven over bepaalde artiesten of nummers. Welke bijvoeglijke naamwoorden komen vaak voor als er bijvoorbeeld over The Beatles wordt geschreven? En welke artiesten worden vaak nog meer genoemd in artikelen over The Beatles?
Worden The Beatles en de Rolling Stones vaak genoemd in één artikel, dan neemt Spotify aan dat er ergens overeenkomsten zijn. Wordt Zweedse popmuziek vaak genoemd in artikelen over ABBA? Dan wordt gekeken naar welke bands nog meer een relatie hebben met Zweedse popmuziek. De vergelijkingen gaan uiteraard nog veel dieper dan dit, maar het idee is duidelijk.
©PXimport
3. Audio-analyse
Het derde model houdt vooral rekening met nieuwe muziek. Over nieuwe nummers is nog maar weinig te vinden op internet en mensen hebben deze liedjes nog niet vaak beluisterd. De eerste twee modellen schieten dus tekort als je ook nieuwe liedjes wil ontdekken.
De audio-analyse is het antwoord. Dit model maakt gebruik van een neuraal netwerk, dat je kunt zien als een soort gezichtsherkenning voor muziek. Een nummer wordt als het ware door het netwerk gehaald en wat overblijft zijn kenmerken van dat liedje, waaronder tempo, volume, ritme en toon. Op deze manier kan Spotify de fundamentele overeenkomsten zien tussen nummers onderling en zo beter bepalen wat jij als luisteraar nog meer leuk kunt vinden.
Uiteraard zijn de aanbevelingsmodellen onderdeel van een groter ecosysteem van Spotify, maar ze geven wel een beeld van hoe het algoritme van de muziekdienst er ongeveer uitziet.