Alles over audio-codecs: Ogg Vorbis vs MP3
Muziek wordt vaak gecomprimeerd om opslagruimte te beperken of om zonder al te veel kwaliteitsverlies op lagere bandbreedte te kunnen streamen. Hiervoor zijn verschillende audio-codecs ontwikkeld, met mp3 als een van de oudste en bekendste. Efficiënte opvolgers staan al klaar, zoals Ogg Vorbis, dat door Spotify wordt ingezet, en het verliesvrije flac. Hoe verhouden deze audio-codecs zich tot elkaar?
De bekendste vorm van audiocompressie is mp3 van Fraunhofer IIS. De audio-codec werd in de loop van de jaren negentig populair op internet en lange tijd beschermd door patenten. Het ontbreken van een patentvrije methode voor audiocompressie was de belangrijkste reden voor de ontwikkeling van Ogg Vorbis.
Daarbij is Ogg het containerformaat dat ook andere multimedia kan omvatten, en Vorbis de eigenlijke audio-codec. Het formaat wordt onderhouden door de Xiph.Org Foundation. Het is veel ‘jonger’ dan mp3 en werkt efficiënter. Er is met Opus inmiddels ook een veelgeprezen opvolger.
Digitale muziek is vrijwel altijd gecomprimeerd omdat het origineel voor veel toepassingen te groot is én omdat er gemakkelijk veel winst mee kan worden geboekt. Nemen we de cd als uitgangspunt, dan is een perfecte kopie (bijvoorbeeld met een programma als Exact Audio Copy) ongeveer 700 MB groot. Comprimeren kan zonder enig kwaliteitsverlies met een ‘lossless’ audio-codec zoals flac (Free Lossless Audio Codec), vergelijkbaar met het ‘zippen’ van bestanden. Dat brengt de omvang met zo’n 30 tot 50 procent terug.
Vaker wordt een ‘lossy’ audio-codec zoals mp3, aac, Ogg Vorbis of Opus gebruikt. Er is dan – afhankelijk van de kwaliteitsinstelling – wel een beetje kwaliteitsverlies, maar er is ook veel minder opslagruimte nodig én minder bandbreedte voor het streamen. Het wordt al snel een factor tien kleiner.
Frequenties
Even terug naar de basis van de cd. Er is, berekend op wat het menselijk oor kan horen, gekozen om met een frequentie van 44,1 kHz samples van 16 bit te nemen. Deze digitale voorstelling van het analoge signaal heet ook wel pulscodemodulatie (pcm). Zonder compressie vraagt een minuut zo’n 10 MB met voor streamen een bitrate van 1.400 kbit/s. Met compressie kan dit worden teruggebracht tot bijvoorbeeld 128 kbit/s en, bij een efficiënte audio-codec, meer dan acceptabel klinken.
Bij het moderne hi-res audio zijn die getallen overigens heel anders. Meestal wordt dan een bit-diepte van 24 bit genomen en samplefrequentie van 96 kHz of zelfs 192 kHz. Bij 96 kHz is per minuut al 35 MB ruimte nodig of 4.600 kbit/s en bij 192 kHz zelfs 9.200 kbit/s. Dat kan met audiocompressie uiteraard wel omlaag, maar het is bij hi-res audio juist gebruikelijk om dat niet te doen en een lossless audio-codec als flac te gebruiken.
©PXimport
Is hi-res audio zinvol of dure schijfvulling? Zuiver theoretisch is het overvloedig. Het dynamisch bereik – de marge tussen de stilste en luidste piek – is bij cd-kwaliteit (16 bit) al 96 dB en zelfs dat wordt zelden benut door te luid ‘afmixen’. De samplefrequentie bepaalt het frequentiebereik en hoeft ook niet hoger, omdat cd-kwaliteit het hele spectrum van 20 Hz tot 20 kHz al afvangt. Meer kan het menselijk oor niet waarnemen en kunnen ook de beste luidsprekers niet (zuiver) weergeven.
Weliswaar wordt hi-res audio vaak wel als beter ervaren, maar dat komt dan door bijvoorbeeld een betere productiekwaliteit. De oprichter van Ogg Vorbis, Christopher Montgomery (roepnaam Monty), haalt hi-res audio in een uitgebreide blog onderuit en stelt zelfs dat het vervelende neveneffecten in het geluid kan hebben. Er zijn uiteraard verschillende meningen.
Bitrates
De bitrate die voor ‘cd-kwaliteit’ nodig is, verschilt sterk per audio-codec. Bij mp3 ga je al snel naar 320 kbit/s, terwijl bij modernere audio-codecs als aac en Ogg Vorbis 192 of 256 kbit/s al kan volstaan. Dat komt omdat audio-codecs steeds worden verbeterd en dus efficiënter zijn; daar werken al decennialang honderden wetenschappers aan. De achterliggende algoritmen zijn zeer complex.
De basis is psycho-akoestiek, de wetenschap hoe hersenen geluiden begrijpen. Er worden bijvoorbeeld hoge frequenties weggehaald die we toch niet waarnemen; bij mp3 wordt zelfs weinig boven de 16 kHz bewaard. Dat geldt ook voor snelle overgangen of een zacht geluid dat vrijwel tegelijk met een hard geluid optreedt. Verder wordt gezocht naar herhalende patronen, zoals stiltes. Door de complexiteit zijn patenten en licenties vrij gangbaar voor audio-codecs.
Bij Ogg Vorbis kan in theorie wel een constante bitrate worden gekozen, maar dat is niet gebruikelijk en wordt ook ontmoedigt. Doorgaans wordt juist voor een constante kwaliteit gekozen. Hierbij zijn er elf kwaliteitsniveaus, variërend van -1 tot 10. De bitrate is niet constant en hangt onder meer af van de complexiteit van de muziek. Bij benadering komt niveau 0 ongeveer overeen met 64 kbit/s, niveau 5 met ongeveer 160 kbit/s en niveau 10 levert omstreeks 500 kbit/s. Het niveau 5 benadert cd-kwaliteit, bij niveau 6 is het verschil met een originele cd al vrijwel niet meer hoorbaar.
©PXimport
Voordelen en nadelen van Ogg Vorbis
Heel nuttig is dat in Ogg Vorbis ook tags worden ondersteund, vergelijkbaar met id3-tags bij mp3, maar nog flexibeler. Ook kan een bestand niet alleen een linker- en rechterkanaal dragen voor stereogeluid, maar tot 255 aparte kanalen – handig voor surround-geluid of meerdere taalsporen. Bovendien werkt Ogg Vorbis met samplefrequenties van 8 kHz tot maar liefst 192 kHz.
In potentie ondersteunt de audio-codec ook het zogenaamde ‘bitrate peeling’, waarmee een reeds gecomprimeerd audiobestand kan worden geconverteerd naar (of gestreamd op) een lagere kwaliteit. Het heeft dan dezelfde kwaliteit als wanneer het direct in die kwaliteit zou worden gecomprimeerd.
Ondanks de vele voordelen, zoals het ontbreken van patenten en licentiekosten, een goed gedocumenteerd bestandsformaat er opensource-bibliotheken, lijkt het niet zo gangbaar als bijvoorbeeld mp3 en aac. Toch wordt het ongemerkt vaak gebruikt. Bijvoorbeeld in games voor audio of chat, door Spotify voor haar streamingdienst en door TomTom voor spraakcommando’s.
Een nadeel is de matige ondersteuning in software en hardware. Daarom is in de podcastwereld mp3 nog steeds het meest gebruikt, met aac als beoogde opvolger. Het zou zelfs kunnen dat mp3, nu de patenten zijn verlopen (de laatste in april 2017), weer terrein gaat winnen, al heeft de Xiph.Org Foundation met het zeer efficiënte Opus vermoedelijk wel weer een sterke troef in handen.