Hier ein sehr verständlicher Artikel über die PCM Technik
von Gert Redlich im Dez. 2020 - Den Begriff - was ist PCM - finden Sie auf den anderen Seiten hier im Museum und den setze ich mal voraus. Es geht um die subjektive Qualitätsprüfung mit dem menschlichen Ohr, also wie weit kann das Ohr (natürlich beide Ohren) eines geübten Tonstudio-Profis Unterschiede erkennen und auch als solche qualitativ seriös bewerten.
Ich lernte in den letzten 10 Jahren immer wieder "High-Ender" kennen, die sogar Unterschiede wahrgenommen hatten, die von der gleichen CD kamen. Ich hatte da etwas geschummelt und bewußt verdeckt die Quelle A mit der gleichen Quelle A verglichen. So einfach war das. Aber lassen Sie uns hören, wie die Profis vom IRT, dem Institut für Rundfunktechnik, das damals gemacht hatten, denn die wollten die Wahrheit rausfinden, sehr ähnlich zu dem Polydor Laborbericht über die relativ hohen Verzerrungen bei Langspielplatten.
Das Verstehen der PCM Technik samt der psychologisch erfassbaren Qualität und der Bewertung dient auch bei müßigen Diskussionen mit sogenannten High-Endern und deren natürlich selbst festgestelltem absolutem Gehör, sich leise schmunzelnd aus dieser Diskussion zurück zu ziehen und den beharrlich und beratungsresistent vertretenen Träumen und Mythen zu lauschen.
.
Subjektive Qualitätsbeurteilung bei Übertagungen von Tonprogrammen hoher Qualität mit PCM-Systemen
von Horst Jakubowski - 1973 - Institut für Rundfunktechnik, Hamburg
Die Deutsche Bundespost hat ein PCM-System zur Übertragung von Tonprogrammen hoher Qualität entwickelt. Im IRT-Hamburg wurden subjektive Untersuchungen durchgeführt, um zu prüfen, ob dieses Übertragungssystem den Qualitätsansprüchen des Rundfunks gerecht wird. Weiterhin wurden Möglichkeiten des Einsatzes subjektiver Bewertungsverfahren bei Übertragungssystemen niedriger Bitrate untersucht.
.
- Anmerkung : Die Deutsche Bundespost hatte die Hoheit über die (alle?) Leitungen "von Ort zu Ort" außer bei den Stromtrassen und den Bundesbahn Signalleitungen. Dazu gehörten (und gehören) auch die Rundfunkleitungen (und damals auch die Fernseh-Richtfunkstrecken) von Rundfunk-Studio zu Rundfunk-Studio und Sender zu Sender und natürlich gegen ein lukratives "Entgelt" (oder auch gegen eine "Gebühr").
- Das war ein sehr einträgliches Geschäftsmodell, weil es ein Monopol war. Um das weiter zu hegen und zu "pflegen", entwickelten ein oder zwei DBP-Labors technische Zusatzgeräte für solche Übertragungen, um nicht zu weit hinter der Technik her zu hinken, was man der (grauen) DBP immer wieder vorwarf.
.
1. Einleitung
Viele Jahre Erfahrung mit der Übertragung analoger tonfrequenter Signale haben dazu geführt, daß man Güteparameter, wie z.B. lineare und nichtlineare Verzerrungen, Geräuschspannungsabstände u.a.m. in vereinbarter Meßtechnik objektiv erfassen kann und in der Lage ist, daraus auf die subjektiven Auswirkungen dieser Störungen zu schließen.
Diese Erfahrungen fehlen noch bei digitalen Tonübertragungssystemen, da hierbei Störkom- ponenten auftreten, die der analogen Technik fremd sind. Diese systemspezifischen Störgrößen lassen sich zwar zum Teil auch objektiv erfassen, es fehlt jedoch der Bezug zum subjektiven Empfinden.
2. Besonderheiten des Störsignals bei PCM-Systemen
In einem 10 bit-System z.B. stehen nur 2hoch10 = 1024 verschiedene Codezeichen zur Verfügung, um die momentane Amplitudengröße des zu übertragenden Signals zu kennzeichnen, d.h. im Moment der Abfrage des Analogsignals muß der ermittelte Amplitudenwert einer von 1024 Amplitudenstufen zugeordnet werden (PAM und Quantisierung).
Dieser entstandene Wert kann von dem analogen Momentanwert um maximal eine halbe Stufe abweichen (Bild 1). Das Ergebnis ist eine Störungskomponente, die Quantisierungsgeräusch genannt wird.
Die Quantisierungsstufen
Die Größe dieses Störsignals ist abhängig von der Zahl der zur Verfügung gestellten Quantisierungsstufen, also von der Feinheit der "Rasterung".
Bei einer linearen Quantisierung, d.h. konstanten Stufengrößen über dem ganzen Dynamikbereich, ist die Größe des Störsignals konstant, d.h. das Verhältnis Nutz/StörSignal wächst mit steigender Nutzsignalamplitude.
Die Quantisierungsstufengrößen können aber auch nichtlinear verteilt werden, derart, daß auf Kosten einer feineren Stufung bei kleinen Nutzsignalamplituden, die großen Amplituden grober quantisiert werden.
Im Bild 2 ist schematisch der Verlauf des Störabstandes bei linearer und nichtlinearer Quantisierung (13 Segmentkennlinie) bei einem 10 bit-System gezeigt.
.
Forderungen für analoge und digitale Übertragungssysteme
Für den Entwickler eines PCM-Systems zur Übertragung von tonfrequenten Signalen hoher Qualität stellt sich die Frage, wieviel Quantisierungsstufen und welche Verteilung erforderlich sind. Legt man die international festgelegten Forderungen für den Geräuschabstand auf Übertragungsstrecken zugrunde, so kann man die Zahl der notwendigen Quantisierungsstufen errechnen, die zur Erfüllung dieser Forderungen führen.
Dabei wird jedoch vorausgesetzt, daß Forderungen, wie sie für analoge Übertragungssysteme gelten, auch für digitale Systeme gültig sind. Ob diese Voraussetzung gerechtfertigt ist, soll eine kurze Betrachtung der Struktur des Störsignals zeigen.
Das wesentlichste Kennzeichen ist die feste Verknüpfung von Stör- und Nutzsignal, und zwar in zweierlei Weise:
.
- 1. Ein Störsignal tritt nur dann auf, wenn ein Nutzsignal vorhanden ist und
- 2. die Struktur dieses Störsignals ändert sich mit der Struktur des Nutzsignals.
.
Sinussignale ./. Tonprogrammsignale
Ist das Nutzsignal ein reines Sinussignal konstanter Frequenzen und Amplitude, so weist das Störsignal ein mehr oder weniger dichtes Linienspektrum auf, hat also den Charakter eines Tones mit starken nichtlinearen Verzerrungen.
Verändert das Nutzsignal sowohl Frequenz als auch Amplitude, so ändert sich der Klangeindruck des Störsignals, und je statistischer die Nutzsignaländerungen sind, desto statistischer wird die Struktur des Störsignals und nimmt schließlich den Charakter eines Rauschens an. Die zu übertragenden Tonprogrammsignale füllen das ganze Gebiet zwischen diesen beiden extremen Möglichkeiten.
Analoge Störspannungen stören
Auf einen weiteren systemspezifischen Effekt sei hingewiesen. In den angelieferten analogen Signalen können bereits Störspannungen enthalten sein, die aufgrund niedrigen Pegels und niedriger Frequenz (z.B. 50 Hz), bedingt durch die frequenzabhängige Empfindlichkeit des menschlichen Ohres, subjektiv nicht wahrnehmbar sind.
Diese Signale können jedoch die niedrigste Amplitudenschwelle des Quellencodierers gerade überschreiten. Das Ergebnis wäre eine Zeitfunktionsänderung; aus einem 50 Hz- Sinussignal würde ein Rechtecksignal, das aufgrund seines hohen Oberwellengehalts in den Bereich höherer Ohr-Empfindlichkeit hinein greift und nun zur subjektiven Erkennbarkeit führt.
Aus diesen Beispielen ist zu erkennen, daß der Charakter des Störgeräusches in einem PCM-System sich von den Geräuschspannungen in analogen Systemen erheblich unterscheidet und eine subjektive Untersuchung notwendig ist, ob die rechnerisch als notwendig ermittelte Quantisierungsstufenzahl tatsächlich zu einer zufriedenstellenden Übertragungsqualität führt.
Ein zwingender Grund für Hörtests
Die Einführung einer nichtlinearen Quantisierungsstufen- Verteilung zum Zwecke der Einsparung von Übertragungsbandbreite (Momentanwert-kompander) ist ein zweiter Grund für die Durchführung von Hörtests, denn die nichtlineare Quantisierung bedeutet, daß die rechnerisch als notwendig ermittelte Quantisierungsstufengröße nur bei sehr kleinen Nutzsignalamplituden zur Verfügung steht.
Je größer diese werden, desto grober wird die Quantisierung, so daß z.B. der Störspannungsabstand konstant bleibt (Bild 2, Kurve b). Dieser Störspannungsabstand ist bei einer Sinusspannung, und nur dabei, objektiv meßbar, aber einen Anhalt, ob bei dem gemessenen Abstand die Störspannung subjektiv wahrnehmbar ist, kann er nicht geben.
3. Subjektive Prüfung des PCM-Ubertragungssystems der DBP
Im IRT vorgenommene subjektive Abhörversuche sollten klären, ob durch das von der DBP entwickelte PCM-Übertragungssystem das Programmaterial erkennbare Qualitätseinbußen erleidet. Im internationalen Rahmen wird ein lineares 14 bit-System als Bezugssystem zur Qualitätsbeurteilung vorgeschlagen.
Aus der Erfahrung heraus, daß in einem solchen System das Quantisierungsgeräusch subjektiv nicht mehr wahrnehmbar ist, wurde bei den Untersuchungen im IRT das Signal am Ende der PCM-Strecke mit dem Originalsignal verglichen und getestet, ob zwischen beiden Signalen erkennbare Qualitätsunterschiede bestehen.
Das PCM-System arbeitete bei diesen Untersuchungen im Kurzschluß, d.h. zwischen Geber und Empfänger befand sich keine Übertragungsstrecke, so daß der Einfluß dort eventuell hervorgerufener Bit-Fehler auf das Klangbild aus der Untersuchung ausgeklammert werden konnte.
Große Unterschiede bei den kleinen und großen Pegeln
Bei sehr kleinen Pegeln, < 36dB unter der systembedingten Maximal-Aussteuerungsgrenze (+12dBmo), arbeitet die Anlage entsprechend einer 14 bit-Technik (Bild 2, Kurve b), d.h. der Quantisierungsgeräuschabstand (unbewertet) vom Grenzaussteuerungspegel ist 86dB.
Zieht man in Betracht, daß der von der DBP gewählte Arbeitspunkt für Vollaussteuerung (+9dBmo) aus Übersteuerungsgründen 3dB unter der Grenzaussteuerung liegt, so heißt das, daß der Quantisierungsgeräuschpegel für alle Signale < 33dB unter Vollaussteuerungspegel konstant -74dBmo ist.
Bei für Vollaussteuerung normalem Abhörpegel ist ein Störeffekt dieses Quantisierungsgeräuschpegels nicht zu erwarten und konnte auch nicht nachgewiesen werden.
.
Bei sehr großen Signalpegeln dagegen, Pegeln zwischen +6dBmo und +12dBmo, bewirkt die Kompandierung, daß das System praktisch in einer 8 bit-Technik arbeitet, d.h. für diesen Pegelbereich liegt der Quantisierungsgeräuschpegel bei -38dBmo und es stellt sich die Frage, ob solch grobquantisierte Signale hörbare Qualitätseinbußen erleiden.
Eine Untersuchung der DBP an einem 220Hz- Sinuston (Bild 3) hat ergeben, daß das Quantisierungsgeräusch bei hohen Pegeln sehr deutlich wahrnehmbar ist /1/.
Nutzen einer Preemphasis (Vorverzerrung)
Durch die Einführung einer Preemphasis (nach CCITT), mit einer zusätzlichen Dämpfung um 5dB, wird eine erhebliche Minderung des Quantisierungsgeräusches bewirkt, so daß nur noch bei allerhöchsten Pegeln ein wahrnehmbarer Unterschied zwischen dem Originalsinussignal und dem über das PCM-System gegebenen Signal verbleibt.
Die Untersuchungen im IRT sollten nun zeigen, welchen Einfluß eine grobe Quantisierung (bei hohen Signalpegeln) auf echte Programmsignale hat und inwieweit eine Preemphasis zur Qualitätsverbesserung führt. Eine Prüfung verschiedenen Programmaterials auf Erkennbarkeit des Quantisierungsgeräusches ergab als kritischstes Testobjekt Klaviermusik großer Durchsichtigkeit, d.h. harte Anschläge großen Pegels mit anschließenden, nicht durch neue Anschläge verdeckten Abklingvorgängen. Ohne Einsatz einer Preemphasis ist bei solchen Signalen bei Vollaussteuerung das Quantisierungsgeräusch deutlich wahrnehmbar.
In einem Hörtest die Qualitätsminderung untersuchen
In einem Hörtest sollte nun genau wie bei dem DBP-Sinussignal-Test die Qualitätsminderung gegenüber dem Originalsignal in Abhängigkeit vom Signalpegel bei Einsatz einer Preemphasis untersucht werden.
Testpersonen wurden danach ausgesucht, daß sie nicht nur ein gutes Gehör hatten, sondern daß sie außerdem den speziellen Klangeffekt des Quantisierungsgeräusches genau kannten.
Doch selbst bei Vollpegel und der Möglichkeit im Klipp-Klapp Originalsignal und das Signal nach dem PCM-System unmittelbar vergleichen zu können, konnte keine höhere Entscheidungssicherheit als 50% erreicht werden, d.h. beide Signale waren nicht voneinander zu unterscheiden.
.
Damit entfiel die Möglichkeit, Qualitätsänderungen in Abhängigkeit vom Aussteuerungspegel zu untersuchen und damit erübrigte sich eigentlich auch ein beabsichtigter Vergleich verschiedener Preemphasen im Hinblick auf eine zu erreichende Qualitätssteigerung.
Es wurde trotzdem noch eine Preemphasis untersucht, wie sie von der RAI /2/ als für diesen Zweck besonders günstig angegeben wurde (Bild 4).
Die Quantisierungsgeräusche
In bezug auf Quantisierungsgeräusche war zwischen den beiden Vergleichssignalen wiederum kein Unterschied wahrnehmbar. Bei Verwendung von Programmaterial mit starken Anteilen hoher Frequenzen zeigte sich jedoch gegenüber der von der DBP verwendeten Preemphasis eine höhere Rate an Systemübersteuerungen.
Eine dritte Preemphasis, vom IRT gewählt, hat den gleichen Hub wie die der DBP, hebt jedoch den mittleren Frequenzbereich von 400 ... 1000 Hz noch nicht so stark an, um dann etwas steiler auf gleiche Anhebung zu hohen Frequenzen hinzukommen. Gegenüber der Preemphasis der DBP ergaben sich jedoch keine wahrnehmbaren Vorteile.
Eine Kettenschaltung mehrerer solcher PCM-Systeme
Als ein noch schärferes, betrieblich sehr interessierendes Kriterium wurde abschließend noch eine Kettenschaltung mehrerer solcher PCM-Systeme untersucht. Dazu wurde eine dreifache Iteration über das PCM-System vorgenommen.
Zu diesem Zweck wurde ein Mono-Signal auf einer Stereobandmaschine aufgezeichnet, Spur 1 direkt, Spur 2 über das PCM-System. Von diesem Band wurde eine zweite Kopie und davon dann eine dritte Kopie gemacht, jeweils Spur 1 direkt, Spur 2 über das PCM-System. Nach der 3. Iteration wurden beide Signale in einem Hörtest verglichen.
Zwischen beiden Spuren war bei den als empfindlich akzeptierten KlavierSignalen kein Unterschied erkennbar. Es ist allerdings zu beachten, daß diese Iteration nicht ganz identisch ist mit einer Kettenschaltung dreier PCM-Strecken.
Durch die Zwischenspeicherung auf Band wird von Umschnitt zu Umschnitt der Geräuschspannungsabstand verringert und so ein durch die Iteration eventuell doch erkennbar werdendes Quantisierungsgeräusch wieder verdeckt.
Auch das IRT kann nicht ewig testen
Das dem IRT zur Verfügung stehende Programmaterial war in seiner Auswahl begrenzt. Es kann nicht ausgeschlossen werden, daß es nicht erfaßte Programmbeispiele gibt, bei denen die vorliegenden Versuchsergebnisse nicht zutreffen. Da aber Ergebnisse resultierend aus Untersuchungen solcher Signale nur einen Bewegungsspielraum zwischen denen vom IRT ermittelten und denen von der DBP am Sinussignal erhaltenen haben können, kann man annehmen, daß von ihrer Struktur her ihr Anteil am Gesamtprogramm geringfügig und der Grad der eventuellen Hörbarkeit des Quantisierungsgeräusches vernachlässigbar sein müßte.
4. Subjektive Bewertung bei Systemen niedriger Bit-Zahl
Bei den vorangegangenen Untersuchungen wurde als Bewertungsmaßstab das Kriterium angesetzt, ob eine Veränderung zwischen den Eingangs- und Ausgangssignalen einer PCM-Übertragungsstrecke subjektiv erkennbar ist.
In jüngster Zeit hat sich ein weiteres Einsatzgebiet der PCM-Technik aufgetan, das der digitalen Verzögerungssysteme (wir sprechen von digitalem Hall). Zum Zwecke der Verzögerung tonfrequenter Signale wird das Analogsignal mittels PCM-Technik in ein Digitalsignal verwandelt, in Schieberegistern gespeichert und nach gewünschter Verzögerungszeit wieder in ein Analogsignal zurückgewandelt.
Da bei diesen Systemen gefordert wird, mehrere verschiedene Verzögerungszeiten zur Verfügung zu haben, d.h. sie müssen mehrere D/A-Wandler besitzen, ist der Einsatz eines z.B. linearen 14 bit-Systems oder eines Systems wie das der DBP aus Kostengründen im Moment noch nicht vertretbar. Es wird deshalb mit Systemen weit geringerer Bitrate gearbeitet, wodurch es zu subjektiv wahrnehmbaren Störungen des Nutzsignals kommen kann.
Bei der subjektiven Beurteilung eines solchen Systems heißt die Fragestellung nicht mehr: Ist eine Änderung gegenüber dem Originalsignal erkennbar oder nicht, sondern: Wie groß ist der systembedingte Störanteil.
Die Suche nach einem Kennwert
Es wäre erstrebenswert, resultierend aus subjektiven Messungen, einen Kennwert angeben zu können, der die Übertragungsqualität eines Systems charakterisiert, denn die objektiven Messungen können bei der Verschiedenartigkeit der angewandten Techniken wiederum kein Qualitätsmaßstab sein. Da im IRT schon mehrere Systeme dieser Art untersucht worden sind, wurde auch diese Problematik untersucht.
Aus der digitalen Sprachübertragungstechnik sind Beurteilungsverfahren bekannt, die darauf hinauslaufen, das Signal am Ende der PCM-Strecke zu vergleichen mit dem Eingangssignal, dem ein künstlicher Störanteil hinzugefügt wird.
Stellt man diesen Störanteil so ein, daß beide Signale subjektiv einen gleichgestörten Eindruck ergeben, so kann das Verhältnis von eingestelltem Nutz/Störsignalpegel als Kennwert für das PCM-System angegeben werden.
Testweise weißes Rauschen hinzumischen
Im einfachsten Fall (Bild 5a) mischt man dem Vergleichssignal weißes Rauschen additiv dazu. Der Störsignalcharakter der PCM-Strecke und der des Vergleichskanals ist dabei so verschieden, daß die meisten Versuchspersonen sich außerstande erklärten, beide Signale auf gleichgestörten Eindruck bringen zu können. Die Streuungen in den Ergebnissen waren so groß, daß kein Kennwert daraus gewonnen werden konnte.
Um ein typisches Merkmal des PCM-Störsignals besser darzustellen, das Auftreten nur wenn ein Nutzsignal vorhanden ist, wurden Nutz- und Störsignal erst multiplikativ gemischt (Bild 5b), das Produkt wurde dann additiv dem Nutzsignal hinzugefügt.
Der Störeindruck wird dem PCM-Signal ähnlicher, die Streuungen der Ergebnisse sind dennoch zu groß. Erst zusätzlich mittels totaler Klippung aus dem Nutzsignal genommener Klirrprodukte (Bild 5c), die dem Vergleichssignal zugefügt wurden, konnte eine Ähnlichkeit erreicht werden, die Vergleiche zuließ, deren Ergebnisse nur noch geringen Streuungen unterworfen waren.
Bei allen Tests konnte kein Gütekennwert ermittelt werden
Es wurden auch noch komplexere Annäherungen an das PCM-Störsignal untersucht, dennoch führen derartige Vergleichsverfahren nicht zu dem erhofften Gütekennwert, da einmal zur Erreichung befriedigender Ähnlichkeit zwischen PCM- und Vergleichssignal der Aufwand der Generierung des Vergleichssignals so groß wird, daß eine einfache Definition dessen nicht mehr möglich wird.
Zum anderen können mit einem solchen Vergleichssignal lineare und nichtlineare Codierungssysteme nicht gleichgut nachgebildet werden. Und als letztes zeigt sich, daß der subjektiv erhaltene Kennwert sehr stark von der Struktur des Nutzsignals abhängt und diese Struktur kann sich, anders als bei reiner Sprachübertragung, in sehr weiten Grenzen ändern.
5. Schlußfolgerungen
Die subjektiven Untersuchungen des IRT an dem PCM-Ubertragungs-system der DBP haben gezeigt, daß bei einem 10 bit - 13 Segment-Kompandersystem die Verwendung einer Preemphasis erforderlich ist.
Die gewählte Form der Preemphasis führte dazu, daß auch bei sehr kritischen Programmaterial das Originalsignal und das Signal nach Passieren des PCM-Systems subjektiv nicht unterscheidbar ist. Wird die Auswirkung auf eine Systemübersteuerung außer acht gelassen, bringen auch kleine Varianten der Preemphasis keine Qualitätsunterschiede mit sich. Eine Kettenschaltung dreier PCM-Strecken führt nach diesen Untersuchungen ebenfalls zu keiner erkennbaren Qualitätseinbuße.
Bei PCM-Systemen niedriger Bitrate ist je nach angewandter Technik das Quantisierungsgeräusch u. U. hörbar. Einfache Verfahren zur Gewinnung eines subjektiven, die Übertragungsqualität beschreibenden und für alle derartigen Systeme gültigen Bewertungs faktors haben sich als nicht realisierbar erwiesen.
Literaturhinweise
.
- /1/ Horst Hessenmüller: The Transmission of Broadcasting Programms in a Digital Integrated Network - IEEE Transactions on Audio and Electroacoustics Volume AU-21 Number 1 February, 1973 pp. 17-20
- /2/ D. Sabatino: Results of Subjective Tests on PCM Co-Decoded High-Quality Sound Signals - Radiotelevisione Italiana Technical Report no. 72/11/E
.