Musikdeling Lydkomprimering

Producenter praler af "CD-kvalitets" lyd, hvilket vil sige 16-bits lydsystem med en samplingfrekvens på 44,1 kHz, men skal lyden transporteres over internettet, så er den gode kvalitet et problem, da den også bruger betydelige mængder af plads. - Det er matematisk uundgåeligt: ​​44100 16-bits prøver per sekund vil give 88.200 'bytes' data (da der er 8 bits i en byte) i sekundet - og det dobbelte (176.400 bytes per sekund) i et stereosignal. Så for at optage et minuts stereolyd kræves 10.584.000 bytes - 10 megabyte! Der være behov for reducere lydfilens størrelse pga. pladsmangel og begrænsede system ressourcer. Ikke mindst på internettet, hvor pladsen på web-servere er begrænset og dyr og overførslen via nettet er følsomt overfor datamængden.

Komprimerede lydformater

Mp3 var formatet der først brød igennem og gjorde komprimerede musikfiler populære og kickstartede musikdeling på nettet. Windows Media Audio - .WMA - er et andet format der er blevet meget udbredt pga. styresystemets udbredelse. Endelig er der det åbne format Ogg Vorbis - .ogg - der de seneste år har vundet udbredelse på bl.a. Wikipedia. Alle formater benytter flere forskellige komprimeringsteknikker som inddeles efter om der mistes data eller ej. - De tre formater benytter alle dels en perceptuel kodning med tab samt en Huffman kodning uden tab af data.

Komprimering uden tab

Strategier hvor data pakkes uden tab kaldes på engelsk lossless og vi kender dem især fra zipfiler. Ulempen ved at komprimere på denne måde er udelukkende at der skal bruges tid/processorkraft på at pakke og udpakke data.

Den grundlæggende startegi er prefix code, hvor man omkoder data, så der ikke er koder for alle mulige værdier, men kun for de værdier, der rent faktisk bruges i en fil. Skal der eks. gemmes en digital sang med kun 8 toner, så er det kun nødvendigt med koder for disse og ikke de 80 andre, så der bruges 3 bit per tone i stedet for 7 bit.

Prefix Code kan forbedres med Huffman Kodning, hvor de værdier der optræder flest gange gemmes med det mindst mulige binære tal. Her tildeles også kun "prefix koder" til de værdier der rent faktisk bruges, men derudover bruges den mindst mulige binære værdi at gemme den værdi, der optræder hyppigst, næstmindste til den næsthyppigste osv. Det kan der spares 10-30% på pladsen alt efter hvor skævt værdierne fordeler sig.

Tone A E C D F H
3 bit Præfix kode 001 010 011 100 101 111
Huffman kode 1 011 010 001 0001 0000


Eksempel på komprimering af sang med 6 toner,hvor A optræder hyppigst, så C osv.


Lav selv Huffman Coding

Læs og lav opgaver om Huffman Coding - på engelsk
ulpgc.es - Huffman Coding

Komprimering med tab

Den mest oplagte måde at nedjustere lydfilers størrelse på, er at nedjustere frekvens og bitdybde. - Det er dog også den mest problematiske i forhold til musik, da det vil give hørbart tab. I stedet for benytter komprimerede formater sig af en teknikken perceptuel kodning, der analysere lyden og udelader de dele af lyden, der ikke kan høres af det menneskelige øre. I første omgang er det lyde, hvis frekvenser ligger over og under det område øret kan opfange, som det også sker for lyde over 22.000 herz på Cd'er. Men derudover fjernes også lyde som overdøves af andre lyde i en grad, så det alligevel ikke kan opfanges af lytteren.

Formater & Kvalitet Ændring af frekvens

audacity-aendr-hz-jsb.png
  1. Åbn en lydfil i cd-kvalitet i en konverteringsprogram eller i [Audacity] og eksporter/gem den i forskellige formater: mp3, wav, ogg, wma…
  2. Lyt til filerne og vurder om og hvordan der kan høres forskel på kvaliteten
  3. Lav en hitliste, hvor de formater der lyder bedst står øverst

Lav evt. en samlet hitliste til sidst i klassen og find ud af om det er de samme "fejl" eleverne hører.

Medmindre andet er angivet, er indholdet af denne side licenseret under Creative Commons Attribution-NonCommercial 3.0 License