PCM - die sogenannte "Pulse Code Modulation"
Ist sie wirklich besser als herkömmliche analoge Technik ?
von Arndt Klingelnberg im Herbst 1982 - Die PCM-Technik hat von allen Seiten viel Vorschußlorbeeren geerntet.
Dabei wurde manchmal zuviel verallgemeinert und das theoretisch Mögliche oft kritiklos als praktisch auch realisierbar oder sogar als bereits realisiert angenommen. Unsere Erfahrung zeigt, daß oft genug zu euphorisch das „Neue Digital-Zeitalter" heraufbeschworen wurde. Allerdings, enttäuscht sein muß man von PCM sicherlich auch nicht.
Der nachfolgende Bericht soll die Vorbehalte gegenüber PCM, die ungewohnten Qualitätskriterien, aber auch die neuartigen Möglichkeiten der digitalen Aufzeichnung aufzeigen.
.
Die Meßmethoden
Liest man die Angaben in Prospekten über alle möglichen PCM-Geräte, so verblüffen die außerordentlich günstigen Angaben für Frequenzgang, Klirrgrad und Rauschabstand. Werden dann noch Daten eines CC-Cassettenrecorders zum Vergleich danebengestellt, so ist der Bluff perfekt.
Hier werden Äpfel mit Birnen verglichen oder, wenn man so will, Platin mit Neusilber. Will man die zwei so extrem unterschiedlichen Systeme miteinander vergleichen, so muß man Einschränkungen berücksichtigen, die sich aus dem praktischen Betrieb und aus der Physiologie des menschlichen Gehörs ergeben.
Außerdem ist ein CC-Cassettenrecorder natürlich auch ein schlechtes Vergleichsobjekt zu einer PCM-Anlage, die als vollprofessionell oder doch zumindest als halbprofessionell eingestuft werden muß. Sinnvoll als Vergleichsobjekt ist dann schon eher ein Zweispur-Spulentonband-Gerät, Bandgeschwindigkeit 19 oder 38 cm/s und dem heutigen Stand der Technik entsprechend mit einem Rauschverminderungssystem versehen (z. B. Dolby-B).
Bei PCM-Anlagen treten völlig andersartige nichtlineare Verzerrungen
auf, als wie wir sie von analogen Tonbandgeräten her gewohnt sind (siehe den Artikel über verzerrungen). Auch das Rauschen hat eine andere Amplitudenstatistik und spektrale Verteilung als das von üblichen Magnetbandgeräten. Dies soll in den nächsten Abschnitten dargestellt werden. Gleichzeitig wollen wir dabei auch die Parameter aufführen, die bei PCM-Anlagen unterschiedlichen Qualitäts- bzw. Preis-Niveaus auftreten können.
Das Tonbandgerät
Nach (den sehr niedrig angesetzen Maßstäben der) DIN 45.500 gilt für das analoge Magnetbandgerät als oberer Grenzpunkt der ausnutzbaren Systemdynamik der Pegel für einen kubischen Klirrgrad von 3%.
Bei Tonbandgeräten haben wir es dabei mit einer sogenannten weichen Verzerrung zu tun, d. h. ein Sinus-Meßsignal wird bei Übersteuerung nur ganz leicht in seiner Kurvenform verändert. Wenn man das Signal auf dem Oszillographen-Schirm betrachtet, so wird die Kuppe des Sinussignals flacher, die Gesamtkurvenform bleibt aber (zumindest für den Betrachter) nu rleicht abgerundet bzw. „weich". Führt man eine Hörprobe im mittleren Frequenzbereich durch (200 bis 1000 Hz), so wird man die Verzerrung erst dann als wirklich unangenehm bezeichnen, wenn die Klirrwerte bereits über 10% liegen.
Dies gilt aber, wie gesagt, nur für einzelne Sinustöne. Bei stark obertonhaltigen Signalen, insbesondere aber auch bei mehreren gleichzeitig klingenden Tönen können Verzerrungen schon bei mittleren Aufnahmelautstärken festgestellt werden.
In jedem Fall bleibt aber festzuhalten, daß man ein Magnetband in besonderen Situationen durchaus bis zu extrem hohen Werten aussteuern kann, was übrigens professionelle Tontechniker in einigen Fällen sogar bewußt tun (z.B. große Baßtrommel). Die durch den weichen Verzerrungseinsatz sich ergebende Übersteuerungsreserve sollte natürlich normalerweise auch wirklich nur als solche angesehen werden, d.h. gute HiFi-Aufnahmen sollten unterhalb des Aufnahmepegels liegen, der 3% Klirrgrad entspricht.
Im Hochtonbereich setzt die Übersteuerung je nach Bandgeschwindigkeit bereits relativ früh ein, es zeigt sich aber auch insbesondere hier, daß sehr viele Hörer starke Verzerrungseffekte (Pegelkompression) tolerieren. So werden Übersteuerungen von über 10dB noch nicht als unangenehm empfunden, von manchen noch nicht einmal festgestellt. Auch hier ist also das Ohr wieder relativ tolerant gegenüber der analogen Magnetband-Aufzeichnung.
Systemdynamik = Systemdynamik?
Beim Ruhegeräuschspannungsabstand (so nennt man den Systemdynamik-Bereich beim analogen Bandgerät) gelten 70dB nach der üblichen HiFi-Meßmethode (Effektivwert, A-Bewertung) als rauscharm, Werte von 76dB werden dann schon fast als rauschfrei bezeichnet. Voraussetzung hierbei ist allerdings noch, daß auch die Dynamik im oberen Hochtonbereich mithalten kann, d. h. der Wert der Höhendynamik bei 14 kHz sollte nicht mehr als 10dB unter dem des Geräuschspannungsabstands liegen.
Werden die obengenannten Werte nur mit einem Rauschverminderungssystem erreicht, so sind dessen spezielle Eigenschaften zu berücksichtigen; in keinem Fall kann der durch das Rauschverminderungssystem erzielte Gewinn voll in der Praxis genutzt werden. Einige dieser Systeme sind nicht fähig, das Hintergrundrauschen (im Gegensatz zum Rauschen in den Pausen) ausreichend zu vermindern. Bei manchen Rauschverminderungssystemen kann im Hochtonbereich ein deutliches Rauschen herausgehört werden, wenn die tiefen Töne nur leise sind.
Modulationsrauschen
Es gibt auch noch eine andere Form des Rauschens bei Magnetbandgeräten, das Modulationsrauschen. Dadurch, daß die Information nur durch eine endlich große und zudem etwas variierende Zahl einzelner Magnetteilchen in der Bandschicht gespeichert wird, erhöht sich das Rauschen im Frequenzbereich oberhalb und unterhalb eines aufgenommenen Tones (der Ton wird durch ein Rauschsignal amplitudenmoduliert). Das Modulationsrauschen kann nur in seltenen Fällen direkt gehört werden, aber es führt zu einer gewissen Rauheit des Klangs, weiterhin werden feinere Einzelheiten einer Klangstruktur möglicherweise durch dieses Rauschen überdeckt, der Gesamtklang wird von einem leichten Schleier belegt.
Messungen an PCM-Systemen
PCM-Systeme verhalten sich bei Übersteuerung ähnlich wie moderne Verstärker. Sie funktionieren bis zu einer gewissen Aussteuerung fast völlig einwandfrei, um dann aber sofort nach Überschreiten der Aussteuerungsgrenze deutlich wahrnehmbare Verzerrungen aufzuweisen. Hierbei handelt es sich ebenfalls vornehmlich um kubische Verzerrungen, der Unterschied besteht jedoch darin, daß die Oberschwingungen hoher Ordnung nicht mehr vernachlässigt werden können. Bei einem analogen Bandgerät wird man gerade noch kleine Anteile von Oberschwingungen 5. Grades und vielleicht sogar auch noch Oberschwingungen 7. Grades feststellen können, in jedem Fall dominiert dort aber die Oberschwingung 3. Grades.
Bei PCM-Systemen kann man bei einer Frequenzanalyse der harmonischen Verzerrungen außer der Oberschwingung 3. Grades noch sehr deutliche Anteile von Oberschwingungen 5., 7., 9., 11., 13., . . . Grades feststellen. Je weiter eine Oberschwingung (bzw. ein Oberton) vom Grundton entfernt liegt, desto leichter ist sie vom Ohr wahrnehmbar. Solche Verzerrungsanteile werden bei Musikaufnahmen leicht als unnatürlich entlarvt.
Aussteuerungs-Sicherheitsreserve
Hieraus ergibt sich ganz klar, daß der Übersteuerungsbereich in jedem Fall bei Aufnahmen gemieden werden muß. In der Praxis zeigt sich, daß die Nenn-aussteuerungsgrenze 6dB unter der absoluten Aussteuerungsgrenze liegen sollte, bei Live-Aufnahmen ist sicherlich eine noch größere Sicherheitsreserve notwendig.
Der Rundfunk schlägt für digitale Systeme sogar eine Nenn-Aussteuerungsgrenze vor, die 12dB unterhalb der absoluten Aussteuerungsgrenze liegt.
Bei analoger Magnetbandaufzeichnung gehen die Verzerrungen bei kleiner werdender Aussteuerung systembedingt auf verschwindend kleine Werte zurück. Dies gilt auch für Verstärker, wenn man einmal von den tückischen Übernahmeverzerrungen (Cross-Over) absieht.
Mehr Verzerrungen bei kleinerer Aussteuerung
Ganz anders ist dies nun bei PCM. Durch systembedingte Eigenschaften nehmen die Verzerrungen bei kleinerer Aussteuerung zu! Weiterhin ist es auch bei kleinen Aussteuerungswerten so, daß Verzerrungen höheren Grades mit deutlichem Anteil vorhanden sind. Die Verzerrungen sind also bei PCM gegenüber der analogen Aufzeichnung unterhalb eines bestimmten Aussteuerungsniveaus einerseits meßtechnisch größer und andererseits auch gehörphysiologisch prinzipiell störender.
Bei diesem Effekt kommt PCM aber zum Glück zugute, daß das Ohr bei sehr geringen Lautstärken für Verzerrungen generell unempfindlicher wird.
Bei mittleren Lautstärken dagegen ist das Ohr gegenüber Verzerrungen besonders sensibel. PCM klingt daher bei besonders lauter Wiedergabeeinstellung während mittellauter Passagen möglicherweise unsauber, während die übliche analoge Tonbandaufnahme eher bei mittellauter Wiedergabeeinstellung bei lauten Passagen unsauber klingt. Dieser mögliche negative Effekt bei PCM kann daher auch erst auf einer guten HiFi-Anlage festgestellt werden, die hohe Abhörlautstärken erlaubt.
Anzumerken ist noch, daß die Größe dieser Verzerrungen natürlich von der Bauart des PCM-Gerätes abhängen, zudem aber auch größere individuelle Unterschiede von Geräteexemplar zu Geräteexemplar (Fertigungstoleranzen) und auch je nach Zeitpunkt (Temperatureffekte) auftreten können.
Nichtharmonische Verzerrungen
Wurde bisher immer von harmonischen Verzerrungen gesprochen (das sind Verzerrungen, die der natürlichen Obertonreihe eines Tones entsprechen), so wurde dabei auch an Intermodulations- und Differenztonverzerrungen gedacht. Diese haben prinzipiell die gleiche Ursache, allerdings sind die sich ergebenden Mischtöne nicht harmonisch. Bei PCM-Systemen gibt es im Gegensatz zu Verstärkern und analogen Bandgeräten auch nichtharmonische Verzerrungen völlig anderer Art.
Aliasing, das Problem digitaler Systeme
Bei digitalen Systemen werden Spannungswerte immer nur zu ganz bestimmten Zeitpunkten erfaßt, man spricht hier vom Abtasten. Speist man in das digitale System eine Frequenz ein, die höher ist als die Hälfte dieser Abtastfrequenz, so kann das digitale System diese Frequenz nicht mehr richtig erfassen, es „spiegelt" die Eingangsfrequenz symmetrisch zur halben Abtastfrequenz.
Gebräuchliche PCM-Systeme arbeiten bei 44,1 kHz, die Hälfte der Abtastfrequenz beträgt also 22,05 kHz. Speist man in dieses System nun einen Ton von 25 kHz ein, so wird letzten Endes am analogen Ausgang nur ein Ton von 19,1 kHz ausgegeben (25 kHz gespiegelt an 22,05 kHz), 43 kHz würden gespiegelt 1,1 kHz ergeben usw. Das Auftreten von Tönen neuer Frequenzen wird vom Ohr natürlich relativ leicht erkannt und dementsprechend auch unangenehm bewertet.
Aufwendige Filter vor und hinter den Wandlern
In digitalen Systemen verwendet man daher am Eingang vor dem Analog-Digital-Wandler ein aufwendiges Filter, das alle Signale, deren Frequenz die halbe Abtastfrequenz übersteigt, extrem stark abschwächt. Im Englischen bezeichnet man dieses Tiefpaßfilter als Anti-Aliasing-Filter, die Frequenzspiegelung als Aliasing. Aber auch an anderer Stelle treten Aliasing-Schwierigkeiten auf, die weit weniger leicht vermindert werden können.
Durch Nichtlinearitäten bei der Digital-Analog-Umwandlung können harmonische Obertöne (bzw. auch Mischtöne) entstehen, die oberhalb dieser Spiegelfrequenz liegen. Am analogen Ausgang erscheint dann aber ihre Frequenz gespiegelt als nichtharmonische Verzerrungskomponente, auffällig für das Ohr.
Um Nichtlinearitäten bei der Digital-Analog-Umwandlung zu vermeiden, muß ein "Deglitcher"-Schaltkreis vorgesehen werden. Nur wenn dieser Chip sorgfältig konstruiert wird, kann das digitale System für hohe HiFi-Ansprüche eingesetzt werden. Über den „Deglitcher" werden wir zu einem späteren Zeitpunkt ausführlich berichten.
Bitte viele bit!
Ein „bit" ist die kleinste digitale Informationseinheit. Bei professionellen PCM-Systemen werden je Spannungswert 16 bit zur digitalen Darstellung benötigt. Übliche HiFi-Systeme kommen mit 14 bit aus, HiFi-Billig-Systeme, wie Satelliten-Rundfunk und PCM auf Compact-Cassetten, sollen auf 12 bit beschränkt bleiben. Je besser die Auflösung, also je höher die verfügbare bit-Anzahl für jeden abgetasteten Spannungswert, desto niedriger liegt das Rauschen und desto niedriger können die Verzerrungen auch bei mittleren Aufnahmepegeln sein.
Unterschiede können vorliegen in einer vollinearen oder gestuften (nichtlinearen) Umwandlung. Im letzten Fall spricht man dann nicht von echten 14 bit, sondern von 12 + 2 bit oder statt echten 16 bit von 14 + 2 bit. Weiterhin gibt es Unterschiede im Offset, in der Linearität, im Temperaturgang, in der Monotonie der Umwandlung. Diese Eigenschaften können sehr bestimmend für die Klangqualität sein. Wir werden sie in der Folge noch speziell erklären.
Fehlerkorrektur
Digitale Systeme zeichnen sich fast alle durch eine automatische Fehlerkorrektur aus. Damit bei Ausfall auch nur eines bits nicht ein möglicherweise völlig falscher Spannungswert wiedergegeben wird, was stark auffällig wäre, müssen Methoden gefunden werden, den digitalen Übertragungsweg und das Speichermedium abzusichern. Dies geschieht durch die zusätzliche Aufzeichnung von digitalen Informationen, die eine nachträgliche Wiederherstellung „verlorengegangener" bits ermöglichen.
Hierzu zeichnet man die Fehlerkorrekturinformation „P", „Q" und „CRC" auf, was zusätzlich ungefähr 50% Speicherplatz benötigt. Damit eine solche Fehlerkorrektur auch wirklich effektiv arbeiten kann, muß die digitale Information zeitlich und örtlich leicht getrennt gespeichert werden.
Interleaving
Zusammengehörende digitale Worte werden durch „Interleaving" nicht direkt nebeneinander gespeichert. Wird ein Speicherbereich zerstört (mehrere Worte), so werden durch diesen Trick nicht inhaltlich zusammengehörige Worte gleichzeitig zerstört. Aus den benachbarten Worten kann die zerstörte Information wieder digital ohne Fehler hergestellt werden.
Interpolation
Treten aber so gehäuft Fehler auf, daß die vollständige digitale Wiederherstellung der Worte nicht mehr gegeben ist, so muß der Fehler näherungsweise korrigiert werden. Bei einfachen PCM-Prozessoren kann dies analog geschehen, bei hochwertigen Prozessoren wird das ein Rechenkreis digital vornehmen (Interpolation). Die Güte dieser näherungsweisen Fehlerkorrektur (oder auch nur einer einfachen Fehlerüberbrückung) hat einen deutlich hörbaren Einfluß auf die Klangqualität, dies aber natürlich nur, wenn die digitale Information so schlecht gespeichert wurde, daß sie nicht mehr einwandfrei erkannt werden konnte.
Eine solche näherungsweise Korrektur funktioniert zufriedenstellend bei niedrigen Frequenzen, wird jedoch oberhalb einem Viertel der Abtastfrequenz fast gänzlich versagen. Je nach Güte der Interpolation können bei mittleren Frequenzen jedoch sehr unterschiedliche Ergebnisse erreicht werden.
Die Abtastfrequenz
Immer wieder wurde die Abtastfrequenz im Zusammenhang mit der Klangqualität genannt. Durch sie wird nicht nur der Übertragungsbereich eingeschränkt, sondern auch eben die Häufigkeit und Störwirkung durch Aliasing und die Auswirkung der Fehlerinterpolation hängen von der Abtastfrequenz ab. Es gilt: je höher, desto besser (aber auch desto teurer, was die Geräte betrifft und den Speicherbedarf, also den Bandverbrauch).
Das Fazit - von "PCM - besser als Analogtechnik?"
Es können durchaus wesentliche Klangunterschiede zwischen PCM-Systemen auftreten. Nicht immer muß ein PCM-System zwangsläufig besser sein als ein analoges System, zumindest nicht gehörmäßig. Um eine der analogen Konkurrenz wirklich überlegene Klangqualität und Zuverlässigkeit zu erreichen, sind konstruktiv besondere Lösungen notwendig, die auch in Zukunft nicht „superbillig" werden. Die nun begonnene Großserienfertigung einiger spezieller Schaltungen im Zusammenhang mit der in den letzten Jahren gewonnenen Erfahrung ermöglichen bezahlbare Preise und weniger „Kinderkrankheiten" in Hinsicht auf die Zuverlässigkeit und die Klangqualität.
Qualitative Unterschiede wird es auch bei PCM weiterhin geben, Testberichte werden weiterhin notwendig sein, ja von uns sogar noch mehr Aufwand erfordern als bei analogen Systemen.
Der ganz wesentliche Vorteil von PCM liegt aber im professionellen Bereich, und zwar im Kopieren, im Kopieren ohne jeden Qualitätsverlust, prinzipiell sogar mit einem möglichen Qualitätsgewinn durch die digitale Fehlerkorrektur beim Kopieren von einem schon leicht (!) beschädigten Speichermedium auf ein anderes.
a. k.
.