Digitaal witboek voor opname witboek
De meeste audiofielen begrijpen niet precies hoe de digitale opname werkt, dus sta me toe dat ik wat licht werp op het onderwerp. Omdat ik uw niveau van technische kennis niet ken, zal ik beginnen met de basisprincipes. Het spijt me dat ik me verontschuldig als een deel van dit is herzien, dus ik verzoek u om geduld te hebben met mij.
Ik zal het vooral hebben over lineaire PCM (Pulse Code Modulation) opname omdat dit het formaat is dat door CD's wordt gebruikt. Er zijn andere digitale systemen (zoals SACD en DSD), maar die zijn niet zo goed als lineaire PCM, zijn over het algemeen niet commercieel beschikbaar, dus ik zal ze maar kort noemen.
De lineaire PCM-standaard die door CD's wordt gebruikt, wordt in detail gespecificeerd in het "Red Book" dat door de ingenieurs van Sony en Phillips is ontwikkeld toen ze de CD in de jaren tachtig uitvonden. Ik zal gedurende de hele discussie vaak naar deze standaard verwijzen.
De Red Book ingenieurs wilden een digitaal opnamesysteem produceren dat de muziek perfect zou reproduceren -- maar met een minimum aan data zodat ze de opnametijd op een CD konden maximaliseren. Ze hebben de prestaties niet in gevaar gebracht, maar ze gebruikten ook niet meer gegevens dan nodig was.
Analoge opnames van de dag werden op vele manieren gecompromitteerd. Met name de frequentiebandbreedte van LP's en FM-multiplex uitzendingen was beperkt van 30 Hz tot 15 KHz. De S/N (signaal-ruisverhouding) was beperkt tot ongeveer 40 dB. Zelfs de beste studio, open-reel cassettedecks konden nauwelijks een bandbreedte van 20 Hz - 20 KHz bereiken met een S/N van 68 dB. Eind jaren zeventig kreeg de betere tape-oxideformuleringen de S/N tot 72 dB. Geen enkel analoog systeem kon het volledige dynamische bereik van een symfonieorkest vastleggen. Geen enkele had een stille achtergrond.
Analoge cassettedecks hebben veel flutter veroorzaakt door imperfecte capstanlagers, niet-ronde capstan-assen en tape scrape flutter (waarbij de tape in kleine schokken over de tapekop beweegt). LP's werden geplaagd door "wow" als gevolg van excentriciteiten in de schijven, veroorzaakt door het feit dat het middelste gat niet perfect concentrisch is met de groeven van de platen. Zowel wow als flutter zijn onnauwkeurigheden en variaties in de frequentie.
De bandendekken hadden ook last van amplitude flutter, veroorzaakt door variaties in de dikte van de tape coating. Als u een steady state toon van een audiogenerator zou opnemen, zou u bij een goed cassettedeck +/- 2 dB fluctuaties in de uitvoer zien. Deze flikkering is gemakkelijk te horen op muziek met aanhoudende tonen. Een goed voorbeeld is langzame, aanhoudende pianomuziek.
De frequentierespons van deze analoge opnamesystemen was niet alleen beperkt tot slechts een deel van het menselijk gehoor, maar de lineariteit van de frequentierespons was vrij slecht. Het is typisch voor het zien van frequentierespons variaties groter dan plus/minus 3 dB.
Alsof dit alles nog niet erg genoeg was, overschreden de THD (Total Harmonic Distortion) en IMD (InterModulation Distortion) van analoge opnamesystemen vaak meerdere procenten. Als gevolg daarvan klonken analoge opnames altijd duidelijk anders dan de live microfooningang. Analoge bandrecorders konden gewoonweg niet nauwkeurig muziek opnemen, opslaan en weergeven.
LP's hadden aanzienlijk slechtere prestaties dan open reel tape. Dus tegen de tijd dat u een opname maakte op analoge tape en deze vervolgens overbracht naar een vinyl LP, waren de verzamelde fouten ernstig. Het resultaat was dat de LP's op een audiosysteem heel anders werden afgespeeld dan de oorspronkelijke, live-optredens. Een veel betere manier om muziek op te nemen was nodig. De reden dat digitale opname werd ontwikkeld was om de ernstige problemen en beperkingen van analoge opname op te lossen.
De ingenieurs van Sony en Phillips die de digitale opname hebben uitgevonden, besloten een digitaal systeem te produceren dat al deze problemen zou oplossen. Dit betekende dat de S/N van het nieuwe systeem groter moest zijn dan 86 dB. Dit is minimaal nodig om het volledige dynamische bereik van een symfonieorkest te produceren, dat is ongeveer 72 dB. De geluidsvloer moet minimaal 10 dB lager zijn dan die van een symfonieorkest om een stil geluid te produceren.
achtergrond. Dus ze namen plaats op een S/N met een zeer conservatieve 96 dB, wat 10 dB beter was dan het vereiste minimum.
De technici wilden het volledige frequentiebereik van het menselijk gehoor vastleggen en reproduceren, zodat hun CD 20 Hz tot 20 KHz kon opnemen. Eigenlijk is de aard van een CD van dien aard dat hij tot op het niveau van DC, dat wil zeggen nul Hz, kan worden opgenomen. Maar de hoge tonen zijn beperkt tot het uiterste van het menselijk gehoor bij 20 KHz.
De meeste volwassenen kunnen 20 KHz niet horen. Maar de Red Book-ingenieurs hebben geen compromissen gesloten, dus hebben ze de frequentierespons helemaal naar 20 KHz geduwd. Ter vergelijking, analoge opnames waren beperkt tot 15 KHz.
Ze drongen aan op een extreem lineaire frequentierespons. Plus/minus 3 dB produceert zeer duidelijke fouten in het gereproduceerde geluid, wat simpelweg niet acceptabel was. Daarom werd de Red Book-frequentierespons gespecificeerd als beter dan 0,1% over de gehele bandbreedte.
De Red Book-ingenieurs zouden geen kortetermijnfrequentie- en amplitudevariaties accepteren. Ze vonden de gebruikelijke analoge wow- en flutterfouten bij analoog meer dan 2%. Deze fouten verpesten het realisme van het geluid en konden niet worden geaccepteerd. Om dit probleem op te lossen, gebruikten de ingenieurs een kwartsklok in plaats van mechanische apparaten om de frequentie en amplitude te vergrendelen tot ongelooflijk lage niveaus -- minder dan 0,001%!
Tot slot moest de THD en IM vervorming van het systeem worden gereduceerd tot een fractie van een procent. Een typische CD-speler zal een digitale vervorming hebben die veel minder dan een duizendste van een procent bedraagt. De gebruikelijke beperking op vervorming zal de inherente vervorming van de analoge in- en uitgangsbufferversterkers zijn, die veel meer zal zijn dan de vervorming die het digitale systeem produceert.
Laten we nu eens kijken hoe een digitaal systeem werkt om alle bovenstaande problemen op te lossen. Je hebt zeker de twee belangrijkste specificaties van een PCM systeem genoteerd. Dit zijn de sampling rate en de bitdiepte. Wat doen deze precies en hoe werken ze?
De meeste audiofielen begrijpen volledig verkeerd hoe ze werken. Ze denken bijvoorbeeld dat de sampling rate de "resolutie" van het systeem bepaalt. Ze stellen zich voor dat de bemonsteringsfrequentie bepaalt hoe vaak de golfvorm in één seconde wordt bemonsterd en dat de golfvorm vervolgens tijdens het afspelen als discrete punten wordt gereconstrueerd. Zij stellen zich dan verder voor dat deze punten met elkaar verbonden zijn door rechte lijnen die in de digitale golfvorm "traptreden" vormen.
Op basis van deze visie op digitale opname is het volkomen begrijpelijk dat deze audiofielen zouden concluderen dat een digitale golfvorm informatie mist in vergelijking met de oorspronkelijke analoge golfvorm -- en dat de digitale golfvorm niet glad is. Ze zouden verder aannemen dat een hogere bemonsteringsfrequentie meer detail aan de golfvorm zou geven, waardoor de "resolutie" en nauwkeurigheid van die golfvorm zou toenemen.
Hun visie is totale fantasie. Digitale systemen werken gewoon niet op die manier.
Het doel van een DAC (Digital to Analog Converter) is in het bijzonder om een perfect gladde, volledige en nauwkeurige golfvorm te produceren. Er zijn absoluut geen "traptreden" in een digitale golfvorm. In feite produceert een digitaal registratiesysteem een veel nauwkeurigere golfvorm van het oorspronkelijke signaal dan welk analoog systeem dan ook.
Als u hieraan twijfelt, wil ik u erop wijzen dat als er "traptreden" in de golfvorm waren, de vervorming extreem hoog zou zijn (meer dan 50% THD). Maar de vervorming in digitale signalen is veel lager dan in welk analoog systeem dan ook, en meet in het slechtste geval slechts een paar duizendste van 1%, terwijl analoge opnamesystemen enkele procenten meten.
Kortom, een digitaal systeem produceert een in wezen perfecte en complete golfvorm. Er zitten geen stappen in. Het is nauwkeuriger dan de golfvorm die door een analoog registratiesysteem wordt geproduceerd.
Dus als de sampling rate niet de "resolutie" bepaalt, wat doet het dan precies? Voordat ik het uitleg, wil ik er eerst op wijzen dat er in de audiotechniek niet zo'n specificatie bestaat als "resolutie". Dit is een andere audiofiele mythe. Daarom definieert de sampling rate niet de resolutie, maar de hoogste audiofrequentie die het systeem kan vastleggen, opslaan en reproduceren.
In een lineair PCM-systeem moet de bemonsteringsfrequentie twee keer de hoogste frequentie van belang zijn (bekend als de Nyquist-frequentie). Aangezien de Red Book-ingenieurs 20 KHz muziek wilden reproduceren, moesten ze de muziek tweemaal zo vaak samplen als dat - 40 KHz.
U zult merken dat Red Book CD's niet samplen bij 40 KHz. Het samplen bij 44,1 KHz. Waarom?
Een beetje extra bandbreedte is nodig omdat het digitale systeem geen hogere frequenties moet krijgen dan de Nyquist-frequentie, omdat deze het systeem in verwarring zullen brengen en veel vervorming zullen veroorzaken. Daarom moeten alle frequenties boven de 20 KHz worden geëlimineerd door een filter. Dit wordt een "anti-aliasing filter" genoemd.
Het anti-aliasing filter zal wat extra bandbreedte nodig hebben om te werken. Door gebruik te maken van een digitaal filter konden de Red Book ingenieurs de hoge frequenties bij 96 dB/octaaf van de hoge frequenties afrollen, waardoor ze slechts 4,1 KHz extra bemonstering nodig hadden om dit filter te kunnen gebruiken.
Merk op dat dit betekent dat het digitale systeem in het ergste geval (20 KHz) slechts twee keer de golfvorm zal bemonsteren. Dus als de audiofiel gelooft dat digitale systemen "traptreden" in de golfvorm produceren, dan zou een sinusgolf van 20 KHz daadwerkelijk worden gereproduceerd als een blokgolf.
Maar het is gemakkelijk te zien dat dit niet waar is. Voer een sinusgolf van 20 KHz in een digitaal systeem zoals een digitale signaalprocessor of digitale crossover en observeer de output ervan op een oscilloscoop. De digitale
componenten zullen het analoge signaal via een A/D-converter door een A/D-converter voeden om het te digitaliseren, en vervolgens via een DAC terugsturen om het terug naar analoog te converteren. Het signaal zal dus door een paar digitale converters zijn gegaan. Als audiofielen correct waren, zou je een blokgolf zien aan de uitgang van de DAC. Maar in plaats daarvan zult u zien dat de uitgang een perfecte sinusgolf is van verdwijnend lage vervorming -- het zal geen blokgolf zijn.
Kortom, lineaire PCM heeft geen "ontbrekende stukken" of "traptreden" in de golf. Het hele doel van een DAC is om de golf volledig nauwkeurig te reconstrueren en met nagenoeg geen
vervorming. Dat doen ze prachtig.
Dus waar past upsampling in dit beeld? Om te beginnen wil ik wijzen op het voor de hand liggende, dat wil zeggen dat je achteraf geen informatie kunt toevoegen of "ontbrekende stukken" van een golfvorm kunt vervangen. Dus upsampling kan geen nauwkeurige muzikale informatie produceren waar oorspronkelijk geen enkel stuk werd opgenomen, dan kan men een drop-out op analoge tape reconstrueren.
Dus wat is de waarde van upsampling? Niet veel eigenlijk. Maar weet je nog dat er extra sampling nodig was om een stukje bandbreedte te produceren voor het anti-aliasing filter dat ik eerder al noemde? Het was slechts 4,1 KHz breed en vereiste dat een digitaal "brick wall" filter gebruikt moest worden bij 96 dB/octaaf. Dit bespaarde dataruimte op de CD.
Sommige audiofielen geloven dat zo'n steil filter het geluid degradeert - ook al werkt het filter in het supersonische bereik, dat ver boven de frequenties ligt die mensen kunnen horen. Zij geloven dat een geleidelijker, analoog filter beter zal klinken. Door de datastroom te upsamplen, kunnen ze alle bandbreedte toevoegen die ze willen en zo kunnen ze analoge filters gebruiken.
Is het effect van analoge anti-aliasing filters te horen? Het is duidelijk dat alles wat geen frequenties produceert in het bereik van het menselijk gehoor niet hoorbaar is. Maar dat weerhoudt sommige audiofielen er niet van te geloven dat ze de effecten van supersonische filters kunnen horen. Dus sommige fabrikanten van CD-spelers gebruiken upsampling-denken dat audiofielen zal bevallen.
Laten we nu eens kijken naar de woordlengte. Red Book CD's werken met 16 bits. Waarom? Welk effect heeft het aantal bits op het geluid?
Simpel gezegd, de woordlengte definieert de S/N van het systeem. Elke bit is 6 dB S/N waard.
Zoals eerder vermeld, heeft men een S/N van minimaal 86 dB nodig om een stille achtergrond te produceren. Zestien bits produceren een S/N van ongeveer 96 dB, wat ongeveer 10 dB beter is dan nodig.
In de echte wereld produceren de meeste CD-spelers om vele technische redenen, waaronder de behoefte aan "dither" en het feit dat maar heel weinig analoge elektronica een S/N van 96 dB kan produceren, slechts een S/N van ongeveer 92 dB. Maar dit levert nog steeds een stille achtergrond en een volledig dynamisch bereik op en is veel beter dan welk ander analoog opnamesysteem dan ook.
De Red Book-ingenieurs hebben het aantal bits gekozen dat nodig is om een stille achtergrond te bereiken en het volledige dynamische bereik van alle muziek op te nemen. Ze gebruikten niet meer bits dan nodig was, en er werden ook geen extra bits toegevoegd die ruimte zouden verspillen aan de gegevens. Simpel gezegd, 16 bits is het aantal bits dat nodig is om muziek met een perfect stille achtergrond weer te geven. Ik weet zeker dat je het ermee eens bent dat alle goed opgenomen CD's een stille achtergrond hebben. U hoort geen ruis en ruis zoals bij analoge opnames.
Waarom zou iemand dan meer dan 16 bits willen gebruiken? Wat zou dit je opleveren?
Veel audiofielen geloven dat het gebruik van 24 bits betere opnames oplevert. Maar als je er op wordt aangedrongen om uit te leggen waarom dit zo is, kunnen ze het je niet vertellen.
De waarheid is dat 24 bits een digitale S/N van 144 dB zullen produceren. Merk op dat ik "digitale" S/N zei. In werkelijkheid kunnen we niet naar een digitaal signaal luisteren. We moeten het omzetten naar analoog om het via een luidspreker af te spelen. Er is geen analoog systeem dat een 144 dB S/N kan produceren. De stilste analoge elektronica kan ongeveer 120 dB zijn.
Maar de stilste microfoons hebben een S/N van slechts 92 dB dankzij het Browning Effect. Dit is het geluid dat wordt veroorzaakt door de trillingen van luchtmoleculen bij kamertemperatuur die het membraan van een microfoon raken en een kleine hoeveelheid ruis maken. Het is dus vrijwel onmogelijk om muziek op te nemen met een S/N van meer dan 92 dB.
Een digitale S/N die groter is dan dat heeft geen praktisch nut bij het afspelen van muziek. Een stille achtergrond is immers stil en het is onmogelijk om de stilte nog stiller te maken. Het toevoegen van bits bij het afspelen is dus gewoon een verspilling van dataruimte.
Hoewel het geen zin heeft om meer dan 16 bits te gebruiken bij het afspelen, is er een goede reden om meer dan 16 bits te gebruiken bij het maken van een live-opname. Begrijp dat om het volledige dynamische bereik van een 16-bits systeem te krijgen, u het dynamische bereik van de muziek nauwkeurig in het 16-bits "venster" moet plaatsen. Als het opnameniveau te laag is, gebruikt u niet het volledige 16-bits bereik en hoort u achtergrondgeluiden op stille passages van muziek. Als u het niveau te hoog hebt, overschrijdt u het maximale niveau dat door de 16 bits wordt bepaald en zal er een enorme vervorming optreden.
Nu zal de opnametechnicus bij het afspelen van muziek altijd de niveaus kennen en het is voor hem eenvoudig om zijn opname correct in een 16-bits venster te plaatsen. Maar bij het opnemen - vooral bij het opnemen van live concerten - is het maximale geluidsniveau niet precies bekend. Dus de opnameniveaus moeten conservatief zijn, omdat het overschrijden van het maximale digitale opnameniveau zal resulteren in een enorme vervorming die de opname zal ruïneren.
Dus voor het opnemen, is het het beste om wat extra hoofdruimte te hebben. Daarom gebruiken opnamestudio's 20 of 24-bits opnamesystemen.
De extra hoofdruimte die wordt geboden door meer bits is ook nuttig wanneer de opnametechnicus het mengen en verwerken moet doen waar egalisatie gewenst kan zijn. Het stimuleren van de energie bij sommige frequenties met behulp van egalisatie vereist meer bits en kan de maximale digitale limiet overschrijden. Zodra de opname is gemaakt, gemengd en verwerkt, kan het eindproduct vervolgens nauwkeurig in een 16-bits venster worden geplaatst, zodat het een stille achtergrond heeft.
Dus voor het opnemen is een 20-bits of 24-bits systeem zinvol. Maar het heeft gewoon geen zin om meer dan 16 bits te gebruiken voor het afspelen.
Dit brengt het onderwerp "High Resolution" (Hi-Rez) audio ter sprake. Veel audiofielen geloven dat hogere sampling rates en meer bits de "resolutie" van de opname verhogen. Dit is volslagen onzin om alle redenen die ik hierboven heb uiteengezet. De Red Book CD standaard maakt in wezen perfect nauwkeurige opnames en het verhogen van de sampling rate en woordlengte maakt de opname niet perfecter.
De nieuwste rages in sampling rate is het gebruik van 96 KHz of zelfs 192 KHz sampling. 96 KHz neemt geluiden op tot 40 KHz (80 KHz vangt het 40 KHz geluid op en de overige 16 KHz worden gebruikt voor het anti-aliasing filter). 192 KHz sampling neemt 80 KHz geluiden op (160 KHz sampling vangt 80 KHz geluiden op terwijl de overige 32 KHz worden gebruikt voor het anti-aliasing filter).
Denk daar nu eens over na. Wat heeft het voor zin om 40 KHz geluiden op te nemen? Geen muziekmicrofoons boven de 20 KHz, dus de extra 20 KHz die beschikbaar is in een 40 KHz opnamesysteem vangt gewoon supersonische ruis op en verspilt 50% van de dataruimte.
Een 192 KHz sampling systeem is nog erger. Volledig 75% van de bandbreedte wordt gebruikt om supersonische ruis op te nemen en verspilt 75% van de dataruimte.
Uiteraard worden deze hogere bemonsteringsfrequenties ook gecombineerd met 24 bits. De verspilde dataruimte is dus veel groter dan alleen beschreven als men ongeveer 30% meer dataruimte nodig heeft voor de extra bits.
Verbazingwekkend is dat deze zogenaamde "Hi-Rez"-opnames de geluidskwaliteit daadwerkelijk aantasten. Dit komt omdat de supersonische ruis intermodulatieproducten (beatfrequenties) lager in het audiobereik zal produceren.
Zo zullen bijvoorbeeld ruisfrequenties bij 37 KHz en 38 KHz samen interageren om intermodulatiefrequenties te vormen bij 1 KHz, een frequentie die mensen kunnen horen. Hi-rez opnames zullen dus daadwerkelijk ruis en vervorming in de audiobandbreedte produceren, wat het geluid doet afnemen en op andere manieren geen verbetering in het geluid oplevert.
Gelukkig is de hoeveelheid vervorming en ruis die deze systemen toevoegen klein genoeg dat de meeste mensen het niet kunnen horen. Gevoelige instrumenten zoals een vervormingsanalysator laten echter gemakkelijk de gebreken zien.
Er is een interessant artikel over dit onderwerp dat je vast en zeker zult waarderen. Hier is een directe link naar dit artikel:
http://drewdaniels.com/audible.pdf
DSD en SACD digitale formaten werken anders dan PCM-codering. Ze produceren wel degelijk stappen in de muzikale golfvorm, omdat ze geen DAC gebruiken om de golfvorm glad te strijken. Daardoor zijn ze extreem rumoerig en hebben ze een hoog vervormingsniveau.
Om deze problemen aan te pakken, gebruiken technici "noise shaping" om de ruis en vervorming naar het supersonische gebied te verplaatsen, zodat we het niet kunnen horen. Het resultaat is dat ze net zo goed klinken als een CD. Ze meten niet zo goed als een CD, en hun gebreken zijn nog steeds aanwezig, maar een mens kan hun gebreken niet horen.
Omdat DSD en SACD geen DACD gebruiken om een gladde golfvorm te produceren, moeten ze met extreem hoge snelheid samplen om de "traptreden" in hun golfvormen klein genoeg te maken om de vervorming op een redelijk laag niveau te houden. Daarom moet de bemonsteringsfrequentie van deze formaten meerdere MHz bedragen. DSD-monsters op 2,8 MHz en sommige van de nieuwere DSD-formaten kunnen tot 8 MHz hoog zijn.
Bemonstering bij zulke hoge frequenties vereist een enorme hoeveelheid gegevensopslag. Aangezien gegevensopslag geld kost, is het zeer onwaarschijnlijk dat deze formaten breed geaccepteerd zullen worden of dat de grote platenmaatschappijen muziek op dit formaat zullen uitbrengen. Het is gewoon zinvoller om een DAC- en PCM-codering te gebruiken om opnames te maken die technisch beter zijn en minder gegevens gebruiken dan DSD. Verwacht dus niet dat DSD de markt zal overnemen, net zo min als de inmiddels verdwenen SACD.
Digitale opnamesystemen produceren gewoon veel nauwkeuriger opnamen dan analoge opnames. Daarom worden alle moderne opnames gemaakt met behulp van digitale apparatuur. En omdat digitale opnames in wezen perfect zijn, kunnen ze herhaaldelijk worden gekopieerd zonder dat dit ten koste gaat van de kwaliteit.
Ter vergelijking, de ernstige gebreken in de analoge opname betekenen dat elke kopie aanzienlijk slechter is dan de kopie waarvan ze is gemaakt. Tegen de tijd dat een analoge opname meerdere malen is gekopieerd, is de geluidskwaliteit zo slecht dat deze niet meer te beluisteren is. Het zou nu duidelijk moeten zijn waarom digitale opnames beter klinken dan analoge opnames.
Als digitale opname nauwkeuriger is, waarom denken sommige audiofielen dan dat analoge opnames beter klinken? De oorzaak van het slechte geluid van digitale opnames wordt veroorzaakt door de slechte kwaliteit van de opname. Met andere woorden, vuilnis in krijgt u vuilnis buiten, hoe nauwkeurig het opnamesysteem ook is.
De meeste opnames van vandaag de dag zijn "gemanipuleerd" om goed te klinken in auto's. Om dit te doen, zijn ze sterk gecomprimeerd, hun frequentierespons is veranderd en ze hebben veel kunstmatige nagalm. Zulke zwaar bewerkte opnames klinken niet natuurlijk wanneer ze via een hoogwaardig audiosysteem worden gereproduceerd.
Veel van de oude opnames die u op LP's vindt, zijn gemaakt voordat er goedkope mengapparatuur beschikbaar was. Sommige oude opnames werden dus op een zeer eenvoudige en zuivere manier opgenomen in een uitstekende akoestische omgeving in plaats van in steriele opnamestudio's. De meeste oude opnames werden opgenomen op een zeer eenvoudige en pure manier, in plaats van in een steriele opnamestudio. Hierdoor klinken deze opnames zeer natuurlijk en realistisch.
Dit betekent dat veel moderne digitale opnames vreselijk klinken, ondanks de perfectie van digitale opnames. Veel oude opnames klinken prachtig, ondanks de fouten van analoge opnames.
Omdat audiofielen geen geldige tests doen, begrijpen ze niet wat de oorzaak is van het slechte geluid dat ze horen. Ze maken dus verkeerde aannames. Zij gaan ervan uit dat het het digitale opnamemedium is dat de oorzaak is van de slechte geluidskwaliteit, terwijl het in feite de aard van de opname is die fout is.
Kortom, digitale opname is veel beter dan analoge opname. Alleen digitale opname kan nauwkeurig muziek opnemen, daarom gebruiken alle serieuze opnametechnici digitale apparatuur.
Tot nu toe heb ik de meest pure en gebruikelijke vorm van digitale opname besproken - lineaire PCM. Maar de kosten van gegevensopslag en -transmissie brengen ons bij wat het meest populaire digitale formaat aan het worden is: MP3.
MP3 maakt gebruik van complexe computeralgoritmen om de hoeveelheid benodigde gegevens te verminderen. De algoritmes zijn zeer gedetailleerd en complex en er is onvoldoende tijd om ze in dit opus in detail te bespreken. Het volstaat te zeggen dat MP3 in staat is om geluid van hoge kwaliteit op te nemen en tegelijkertijd de vereisten voor gegevensopslag en -overdracht drastisch te verminderen in vergelijking met lineaire PCM (of DSD) opname. Het gebruik van MP3 is de reden waarom iPods kan opslaan duizenden nummers en waarom je kunt luisteren naar muziek via het internet.
Bij het bespreken van MP3 is het essentieel om te begrijpen dat de opnamekwaliteit wordt bepaald door de datasnelheid van MP3. De datasnelheid bepaalt de hoeveelheid gegevens die per seconde wordt verwerkt en heeft een grote invloed op de geluidskwaliteit. De datasnelheid wordt gemeten in KBPS (KiloBytes per seconde). In principe betekent dit dat hogere datasnelheden de geluidskwaliteit verbeteren ten koste van de hogere data-opslagvereisten.
De relatie tussen datasnelheid en geluidskwaliteit betekent dat je de term "MP3" niet zomaar kunt gebruiken zonder ook de datasnelheid te specificeren. Een lage datasnelheid MP3 klinkt heel anders dan een hoge datasnelheid MP3, dus de twee zijn enorm verschillend. Daarom kunnen audiofielen niet zomaar een algemene uitspraak doen zoals "MP3 klinkt slecht". Fouten zijn te horen in lage datasnelheid MP3, maar hoge datasnelheid MP3 kan foutloos klinken.
Specifiek de datasnelheden van 64 KHz en lager zijn een belangrijk compromis voor de geluidskwaliteit. U kunt duidelijk een verschil horen tussen de bron en de opname bij lage datasnelheden. Het type muziek en de inherente hoeveelheid compressie heeft een grote invloed op of u het verschil kunt horen, maar over het algemeen zijn lage datasnelheden alleen aanvaardbaar voor spraak - niet voor muziek.
Wanneer u echter 128 KBPS en hogere datasnelheden bereikt, wordt het vrij moeilijk om het verschil tussen de bron en de opname te horen. In mijn tests met groepen "gouden oor"-audiofielen, konden de meesten geen verschil tussen de bron en de opname ontdekken wanneer een 128 KBPS datasnelheid werd gebruikt.
128 KBPS is echter niet helemaal perfect. De mogelijkheid om storingen te horen is sterk afhankelijk van het bronmateriaal. Typische "pop" opnames met veel percussieve geluiden klinken over het algemeen perfect bij 128 KBPS. Het meest kritische materiaal was stil orkestraal werk. Een aanhoudende pianotoets was de meest belastende test en de meeste luisteraars konden een klein verschil horen bij 128 KHz datasnelheden.
Als u wilt dat MP3-opnamen precies zo klinken als de bron, moet u 192 KBPS of hoger gebruiken. 192 KBPS wordt beschouwd als "CD-kwaliteit". Geen mens kan het verschil horen tussen een MP3 in dat tempo (of hoger) en een CD.
Merk op dat, omdat de meeste audiofiele tests de variabelen in hun tests niet kunnen controleren, ze gemakkelijk bedrogen worden. Ze horen bijvoorbeeld vaak verschillen in het geluid en geven de schuld voor deze verschillen op het opnameformaat, terwijl het formaat in de meeste gevallen niet verantwoordelijk is voor de verschillen.
Als u dit nog niet hebt gedaan, is het essentieel dat u mijn "Testing White Paper" leest om dit te begrijpen. Als ik zeg dat geen mens een verschil kan horen tussen een MP3 op 192 KHz, dan is dit waar -- maar alleen als de luistertest alle variabelen goed controleert.
Sommige van de betere on-line muziekbronnen zoals www.pandora.com geven je de mogelijkheid om MP3 te selecteren op 192 KBPS. Andere on-line muziekbronnen gebruiken alleen hoge datasnelheden. Bijvoorbeeld, www.mog.com streamt met 320 KBPS. Dus zorg ervoor dat u de datasnelheid bekijkt die gebruikt wordt door uw favoriete on-line muziekbron. U kunt er zeker van zijn dat als u een geschikte hoge datasnelheid gebruikt, de geluidskwaliteit in wezen perfect zal zijn.
Sommige audiofielen geloven dat MP3 slecht klinkt. Maar de waarheid is dat het precies zo klinkt als de bron zolang de datasnelheid 192 KBPS of hoger is. Dit is een goede zaak omdat de toekomst van muziek online is en muziekdiensten MP3 zullen blijven gebruiken om gegevens te bewaren.
Kortom, je hoeft geen hi-rez opnames te kopen. De kwaliteit van de CD is zo nauwkeurig dat je geen verschil kunt horen tussen een goed opgenomen CD en de originele microfooningang. Daarom is het onmogelijk om beter geluid uit een andere bron te krijgen. Maar aangezien de toekomst van de muziek online is, krijgt u uw muziek in MP3-formaat. Zolang het een hoge datasnelheid heeft, zal het ook foutloos klinken.