"Audio-Wissen von 1974" - Die Themen dieser Artikel sind:
Was war mit der analogen Audio-Studio-Technik machbar und was sollte bzw. mußte ein Toningenieur wissen und gelernt haben. Daß viele dieser Themen (wir schreiben zur Zeit 2016) bereits 35 Jahre alt sind und durch die schleichende Digitalisierung völlig überholt sind, bedeutet nicht, daß sich die physikalischen Grundlagen wesentlich geändert haben.
.
B. V. Einschwingvorgänge
Einschwingvorgänge stellen mehr oder weniger schnelle Änderungen der Schallintensität oder des Schalldruckes dar, wobei der zeitliche Verlauf, das heißt die Funktion des Einschwingens, sehr verschieden sein kann. Da jeder auf das Ohr einwirkende Schallvorgang zeitlich begrenzt ist, muß er zwangsläufig auch mit Einschwingvorgängen behaftet sein.
Wie wir unter B. III. 1.3 sahen, folgt das Gehör jedoch ebenfalls nicht trägheitslos diesen Vorgängen. Das führt zu einer Überlagerung der ohreigenen und der auf das Ohr einwirkenden Einschwingvorgänge. Hier interessiert uns vor allem die Einschwingzeit des Ohres, die die Grenze der Wahrnehmbarkeit kürzester Einschwingvorgänge aufzeigt. Darüber hinaus ist noch die Kenntnis des Unterscheidungsvermögens des Gehörs gegenüber Einschaltvorgängen zwar gleicher Einschaltzeit, aber unterschiedlichen Funktionsverlaufes von Interesse.
.
B. V. 1. Physiologische Einschwingzeit des Ohres
Zur Feststellung der physiologischen Einschwingzeit des Ohres hat man einen Ton kurz hintereinander einmal sprunghaft mit äußerst kleiner Zeitkonstante und einmal mit einer beliebig einstellbaren Zeitkonstante eingeschaltet und dabei die letztere fortlaufend so lange verkleinert, bis gerade kein Unterschied mehr zwischen beiden zu hören war. Diese Zeit wurde als physiologische Einschwingzeit definiert. Untersuchungen [83] zufolge liegt sie im gesamten Frequenzbereich von 50 Hz bis 10.000 Hz bei oder etwas unter 0,25 ms.
B. V. 2. Unterscheidungsvermögen bei verschiedenen Einschaltvorgängen
Zur Ermittlung des Unterscheidungsvermögens des Gehörs für Einschaltvorgänge zwar gleicher Einschaltzeit, aber unterschiedlichen Funktionsverlaufes wurden die Schaltzeiten zweier Anklingvorgänge verschiedener Funktion so lange gleichmäßig verkürzt, bis kein Unterschied mehr festgestellt werden konnte. Bei diesen Untersuchungen stellte sich heraus, daß Einschaltzeiten bis zu 10ms herab das amplitudenmäßig verschiedene Anschwellen der beiden geschalteten Töne auch noch als solches gehörmäßig wahrnehmen lassen, jedoch Klangfarbenunterschiede kaum empfunden werden.
Daran schließt sich nach kürzeren Einschaltzeiten hin ein Übergangsbereich an, in dem sowohl noch das Anschwellen als auch schon das zwischen beiden Einschaltvorgängen verschiedenartige Frequenzspektrum als Klangfarbenunterschied wahrgenommen wird.
Unterhalb dieses Übergangsbereiches äußert sich die unterschiedliche Einschaltfunktion nur noch als Klangfarbenunterschied. Den angegebenen Untersuchungen zufolge konnte im Frequenzbereich von 100 Hz bis 10.000 Hz bei einer Einschaltzeit von etwa 2 ms der unterschiedliche Verlauf zweier Einschaltfunktionen gerade noch als zwei Knacke mit voneinander abweichender Klangfarbe wahrgenommen werden.
B. V. 3. Verwischungsschwelle
Bei der Schallwiedergabe in einem Raum ragen oft wenige genügend lautstarke Reflexionen aus dem Anhalluorgang heraus und treffen erst mit einer endlichen Verzögerungszeit nach dem Eintreffen des direkten, von der Schallquelle herrührenden Schalles beim Zuhörer ein. Die Größe der Verzögerungszeit, bei der gerade noch keine Trennung zwischen direktem und reflektiertem Schall wahrgenommen wird, bei der sich also die Reflexion noch nicht nachteilig auswirkt, nennt man Veriuischungsschipelle. Sie ist von der Nachhallzeit, dem Intensitätsverhältnis des reflektierten Schalles zum direkten Schall und der Klangfarbe des reflektierten Schalles abhängig [103] und schwankt praktisch zwischen 50 ms und 100 ms. Grundsätzlich sind solche echoartigen Erscheinungen unerwünscht, da sie zu einer Herabsetzung der Verständlichkeit bei sprachlichen und der Durchsichtigkeit bei musikalischen Darbietungen führen.
B. VI. Räumliches Hören
Zu den bereits behandelten Empfindungsgrößen eines Schallvorganges:
- Tonhöhe,
- Lautstärke und
- Klangfarbe,
treten nun als letztes noch diejenigen, die aus dem Richtungs- und Entfernungsempfinden beim Hören resultieren.
Auch sie sind für den Gesamteindruck eines akustischen Ereignisses von ausschlaggebender Bedeutung. Ist das räumliche Hören gestört, zum Beispiel durch eine einkanalige elektroakustische Übertragung, so wird das je nach dem übertragenen Schallereignis als mehr oder weniger unnatürlich empfunden. Der Grad der Unnatürlichkeit ist dabei von der Anzahl und der Ausdehnung der Originalschallquellen abhängig.
Weiterhin erlaubt das Richtungshören, daß sich das Gehör auf eine interessierende Schallquelle konzentrieren kann, so daß Nebengeräusche im Bewußtsein viel weniger stark registriert werden als es ihrem tatsächlichen Schalldruck am Ohr des Zuhörers entspricht.
Davon kann man sich leicht überzeugen, wenn man bei einer musikalischen Darbietung in einem Konzertsaal anstelle eines im Raum befindlichen Zuhörers das Mikrofon aufstellt und der Zuhörer nunmehr das übertragene Schallereignis am Lautsprecher verfolgt. Die einkanalige Wiedergabe ist dann durch die Nebengeräusche, zum Beispiel Husten und Stühleknarren, in einem hohen Maße gestört, obwohl man diese Störgeräusche an der gleichen Stelle im Saal viel weniger störend wahrnimmt.
Diesen Erscheinungen wollen wir uns nachfolgend ausführlicher zuwenden, wobei gleich vorweggenommen werden soll, daß die Wahrnehmbarkeit der für das räumliche Hören entscheidenden Größen zum Teil auf neue, durch das zweiohrige Hören ermöglichte Empfindungen, zum Teil aber auch auf typische Erscheinungsformen der bereits bekannten Empfindungsgrößen, zum Beispiel der Klangfarbe, zurückgeführt werden kann.
B. VI. 1. Richtungshören
Die Richtung eines einfallenden Schalles ist einerseits durch eine vertikale und andererseits durch eine horizontale Abweichung von einer horizontalen Achse definiert, die die beide Ohren verbindende Gerade in der Mitte senkrecht schneidet. Indem bei normaler Kopfhaltung die Ohren in einer horizontalen Ebene liegen, können wir auch nur den horizontalen Anteil des Richtungswinkels wahrnehmen. Zur Feststellung des vertikalen Winkels bedarf es erst einer entsprechenden Schräghaltung des Kopfes.
Zu einer Wahrnehmung der Richtung, aus der der Schall in bezug auf die jeweilige Kopfhaltung einfällt, könnten schon rein überlegungsmäßig die an beiden Ohren auftretenden Unterschiede der Laufzeit und Intensität eines ankommenden Schalles führen.
Sie lassen im Zentralnervensystem den neuen Eindruck des Richtungshörens entstehen. Ferner ist festgestellt worden, daß die um den Kopf herum frequenzabhängig erfolgende Beugung der Schallwellen, die eine Klangfarbenänderung zur Folge hat, zu einer erfahrungsgemäßen Richtungswahrnehmung führt [104, 105].
.
B. VI. 1.1. Richtungswahrnehmung durch Laufzeitunterschiede
Hier interessiert zunächst die Größe des praktisch auftretenden Zeitunterschiedes At in Abhängigkeit vom Winkel xp des einfallenden Schalles. Unter Zugrundelegung eines Kopfes in Kugelform mit einem Durchmesser von 20cm ergibt sich der Zeitunterschied aus Bild 52.
Diese Funktion ist in Bild 53 dargestellt [106, 107]. Daraus geht hervor, daß der maximale Zeitunterschied, das heißt, der zwischen einem von vorn oder von hinten und einem genau seitlich einfallenden Schall, etwa 0,8 ms betragen kann.
Grundsätzlich soll noch bemerkt werden, daß es ohne weiteres möglich ist, diese Laufzeitunterschiede auch durch Phasenwinkelunterschiede auszudrücken. Das ist jedoch nicht zweckmäßig, weil die letzteren frequenzabhängig sind.
Bezüglich der Wahrnehmbarkeit kleinster Richtungsänderungen zeigt sich praktisch, daß diese mit einem Schwellwertwinkel von etwa 2° bis 3° dann am günstigsten ist, wenn der Schall von vorn einfällt. Bei seitlich einfallendem Schall steigt der Schwellwertwinkel auf 12° bis 18° an. Daraus kann in Verbindung mit Gleichung (37) abgeleitet werden, daß das Ohr für gleiche Laufzeitunterschiede unabhängig von der Einfallsrichtung die gleiche Empfindlichkeit besitzt.
.
B. VI. 1.2 RichtungsWahrnehmung durch Intensitätsunterschiede
Unterschiede zwischen den auf beide Ohren wirkenden Schallintensitäten können einmal dadurch zustande kommen, daß eines der beiden Ohren der Schallquelle näher benachbart ist und infolge einer, zum Beispiel quadratisch erfolgenden, Abnahme der Schallenergie auch stärker beschallt wird. Dieser Einfluß wird aber mit zunehmender Entfernung von der Schallquelle rasch geringer.
Bei größeren Entfernungen überwiegt der Einfluß der Beugungserscheinungen (siehe Abschnitt A. III. 1.4.5), die zwangsläufig zu einem frequenzabhängigen Intensitätsunterschied des an beiden Ohren wirksamen Schalles führen müssen. Da eine Beugung erst dann auftritt, wenn die Wellenlänge der einwirkenden Frequenz in die Größenordnung des Hindernisses kommt, im vorliegenden Falle in die des Ohrabstandes von etwa 20cm, sind Intensitätsunterschiede bei tiefen Frequenzen unterhalb 300 Hz ausschließlich auf den zuerst genannten Einfluß zurückzuführen.
Beide Einflüsse, von denen der eine entfernungsabhängig und der andere frequenzabhängig verläuft, müssen zu einem verwickelten Zusammenhang zwischen der Richtung des einfallenden Schallereignisses und dem Unterschied des an beiden Ohren auftretenden Schallpegels führen.
In Bild 54 ist die experimentell ermittelte Änderung der Schallpegeldifferenz in Abhängigkeit vom Einfallswinkel mit verschiedenen Frequenzen als Parameter dargestellt [108]. Daraus geht der nicht einfache Zusammenhang schon deshalb hervor, weil zum Beispiel bei einer Frequenz von 1100 Hz eine Schwenkung der Schallquelle von vorn (vom Zuhörer ausgesehen) nach der Seite die Schallpegeldifferenz zunächst bis auf 12dB ansteigen, dann aber wieder auf etwa 8dB abnehmen läßt. Es besteht demzufolge, zumindest bei dieser Frequenz und größeren Einfallswinkeln als 30°, keine eindeutige Zuordnung zwischen der Größe der Schallpegeldifferenz und der des Einfallswinkels. Betrachten wir jedoch die Zusammenhänge bis zu einem Winkel von 30°, so läßt sich aus Bild 54 leicht erkennen, daß in diesem Bereich der Logarithmus des Intensitätsverhältnisses dem Einfallswinkel proportional ist.
Der Proportionalitätsfaktor k ist Bild 54 zufolge von der Frequenz abhängig. Diese Frequenzabhängigkeit ist in Bild 55 besonders herausgestellt [109].
Diese etwas undurchsichtigen Verhältnisse legen nahe, nicht den Intensitätsunterschied diskreter Frequenzen, sondern den von Spektren der häufigsten Schallereignisse für diese Betrachtungen heranzuziehen. Sprachmessungen haben dabei die in Bild 56 gezeigten Kurven [110] ergeben. Die Linearität des Zusammenhanges zwischen der Schallpegeldifferenz und dem Einfallswinkel ist danach bis zu einem Einfallswinkel von 50° gegeben. Dem bereits genannten Schwellwertwinkel von 3° steht hier eine Schallpegeldifferenz von etwa A L = 0,5 dB gegenüber. Als Proportionalitätsfaktor wurde hier ein Wert von k-0,032 wirksam, der durch die unterschiedlichen Intensitätsanteile der einzelnen Frequenzen bei Sprache bedingt ist.
B. VI. 1.3 Richtungswahrnehmung durch Klangfarbenunterschiede
Die vorgenannten frequenzabhängigen Intensitätsunterschiede haben beim Hören von Klängen oder Geräuschen gleichfalls Klangfarbenunterschiede zur Folge. Zur Verdeutlichung dieses Einflusses stellt man die Schallpegeldifferenz im Gegensatz zu Bild 56 besser in Abhängigkeit von der Frequenz, mit dem Einfallswinkel als Parameter, dar (Bild 57).
B. VI. 1.4 Beiträge der Laufzeit-, Intensitäts- und Klangfarbenunterschiede zu dem Gesamt- Richtungshören
Da nach den vorangegangenen Betrachtungen drei verschiedene Faktoren zur Wahrnehmbarkeit der Schalleinfallsrichtung führen können, liegt die Frage nahe, in welchem Maße jeder an dem Gesamtrichtungshören beteiligt ist. Die in der Literatur anzutreffenden Angaben [19, 106, 109, 111] gehen zum Teil weit auseinander. Das ist darauf zurückzuführen, daß die Größe des jeweiligen Beitrages nicht nur frequenzabhängig ist, da zum Beispiel bei Frequenzen unterhalb 300 Hz die Richtungswahrnehmung fast ausschließlich auf dem Laufzeitunterschied beruhen muß und auch noch individuell verschieden sein kann. Außerdem ist das Gehör in der Lage, bei Fehlen eines dieser Beiträge die restlichen stärker für die Richtungswahrnehmung heranzuziehen.
.
Töne unter 1000 Hz
Der Laufzeitunterschied als Kriterium für den Einfallswinkel entfällt dann, wenn es sich um konstant anhaltende reine Töne oder Klänge mit einer Grundfrequenz von f > 1000 Hz handelt. Bei einer Frequenz von etwa 1700 Hz besteht kein merkbarer Phasenunterschied und damit auch kein merkbarer Laufzeitunterschied mehr zwischen dem auf beide Ohren einwirkenden Ton, da dessen Wellenlänge dann gleich dem Ohrabstand von etwa 20 cm ist.
Der Laufzeitunterschied kann jedoch auch bei höheren Frequenzen dann wirksam werden, wenn es sich um nichtstationäre Töne oder Klänge, besonders aber um schnelle Ein- und Ausschwingvorgänge handelt. Daß der Laufzeitunterschied einen wesentlichen Beitrag zum Richtungshören leistet, wird auch dadurch bewiesen, daß unter Wasser ein genau seitlich einfallender Schall nur mit etwa 15° Abweichung von vorn einzufallen scheint. Das ist aufgrund der etwa viermal so großen Schallgeschwindigkeit im Wasser, die den Laufzeitunterschied auf ein Viertel reduziert, auch ungefähr zu erwarten.
Eine Schallquelle auf dem Mantel eines Rotationshyperboloides
Bei den bisherigen Betrachtungen wurde völlig außer acht gelassen, daß eine Schallquelle, gleichgültig, ob sie sich um 20° von der Symmetrielinie abweichend vor oder um 160° hinter dem Zuhörer befindet, zumindest den gleichen Laufzeitunterschied hervorruft. Das gilt nicht nur für diesen speziellen Fall, sondern für alle Punkte, die sich auf einem Kegelmantel (genauer: dem Mantel eines Rotationshyperboloides) befinden, dessen Achse mit der beide Ohren verbindenden Achse identisch ist und dessen Spitze in der Mitte zwischen beiden Ohren liegt. Das würde bedeuten, daß wir nicht zwischen von vorn und von hinten einfallendem Schall unterscheiden könnten.
Daß wir es praktisch doch können, beruht auf der Richtwirkung beider Ohren [112], die sich in Bild 54 durch die zum 90°-Winkel unsymmetrisch verlaufenden Kurven ausdrückt. Die Unterscheidung zwischen von vorn und von hinten einfallendem Schall ist also auf die Frequenzabhängigkeit der Intensitätsunterschiede in Verbindung mit der Richtcharakteristik des Ohres zurückzuführen.
Eine Unterscheidung zwischen ebenfalls von vorn und hinten und zusätzlich von oben und unten einfallendem Schall erfolgt letztlich auch dadurch, daß sich der Kopf ganz unbewußt stets in einer gewissen Bewegung befindet. Aus der dabei erfolgenden Änderung der Laufzeit- und Intensitätsunterschiede kommt es dann unbewußt zu einer genauen Richtungsunterscheidung [19, 113].
B. VI. 2 Wahrnehmbarkeit der Schallquellenentfernung
Zunächst soll gleich betont werden, daß die Entfernung einer Schallquelle bei einohrigem Hören mit fast der gleichen Sicherheit festgestellt werden kann wie bei zweiohrigem Hören. Es bedarf deshalb auch nicht einer stereofonischen elektroakustischen Übertragungsanlage, um den richtigen Entfernungseindruck übertragen zu können. Die Wahrnehmbarkeit der Entfernung stellt einen neuen Höreindruck dar, der ähnlich wie das Richtungshören auch wieder auf verschiedene Einflüsse zurückgeführt werden kann.
B. VI. 2.1 Entfernungswahrnehmung durch Hallerscheinungen
Das Verhältnis von direktem Schall zu den fast stets vorhandenen Hallerscheinungen (Echo und Nachhall) trägt unter Berücksichtigung der Richtcharakteristik des Ohres zu einem Entfernungsempfinden mit bei. Während in der Natur vorwiegend Echoerscheinungen auftreten, ist in geschlossenen Räumen der Nachhall von größerer Bedeutung.
Grundsätzlich gilt hierfür, daß mit größer werdendem Verhältnis von indirektem Schall (Nachhall) zu dem direkten Schall der Eindruck einer größeren Entfernung erweckt wird. Das gilt auch dann, wenn durch technische Maßnahmen, zum Beispiel bei der elektroakustischen Übertragung mit künstlichem Nachhall, bei gleichbleibender Entfernung das genannte Verhältnis geändert wird. Der Entfernungseindruck verändert sich dann in Abhängigkeit vom künstlich hinzugefügten Nachhall.
B. VI. 2.2 Entfernungswahrnehmung durch Klangfarbenunterschiede
Klangfarbenänderungen führen neben den Hallerscheinungen vorwiegend zu einem Entfernungsempfinden im Fernfeld. Das kommt - wie jeder schon selbst festgestellt haben wird - dadurch zustande, daß durch die größere Beugbarkeit hoher Frequenzen ihr Anteil im Spektrum mit zunehmender Entfernung von der Schallquelle abnimmt. Der Schall erhält damit einen zunehmend dumpferen Charakter. Ein typisches Beispiel hierfür ist das Donnergrollen eines weit entfernten Gewitters, im Gegensatz zum Donner heller Klangfarbe bei nahem Einschlag.
B. VI. 2.3 Entfernungswahrnehmung durch Lautstärkeänderungen
Da nicht ohne weiteres von der empfundenen Lautstärke auf die Entfernung einer Schallquelle geschlossen werden kann - Schallquellen großer Leistung und großer Entfernung und umgekehrt solche geringer Entfernung und kleiner Leistung können beispielsweise gleichlaut wahrgenommen werden -, beschränkt sich das absolute Entfernungsempfinden auch nur auf solche Schallquellen, deren Lautstärke erfahrungsgemäß bekannt ist, und deren Schalleistung auch stets gleich bleibt.
Bedeutungsvoller wird diese Fähigkeit, wenn es darum geht, eine Entfernungsänderung mit einer Lautstärkeänderung abzuschätzen. Ein anschwellender Ton wird auch dann stets als näherkommend und ein abebbender Ton als sich entfernend empfunden, wenn diese Lautstärkeänderung - dem Zuhörer bekannt - künstlich hervorgerufen wird.
Das Ohr besitzt keinerlei Einrichtung, um auch die Ausdehnung einer einzelnen Schallquelle zu erfassen. Selbst in solchen Fällen, in denen durch eine größere Anzahl von Schallquellen - die insgesamt auch als eine Schallquelle großer Ausdehnung aufgefaßt werden könnten - der Schall aus mehreren Richtungen einfällt, kommt es nicht zu dem Eindruck einer größeren Schallquelle.
Wenn praktisch dennoch mitunter das Gefühl für die Größe einer Schallquelle erzeugt wird, so beruht das auf rein psychologischen Vorgängen, die mit der geometrischen Ausdehnung einer Schallquelle nichts zu tun haben. Im allgemeinen führt das dazu, daß tiefe Frequenzen das Gefühl für eine Schallquelle großer, hohe Frequenzen dagegen das für eine Schallquelle kleiner Ausdehnung vortäuschen. Dabei wird die Schallquelle noch als um so größer empfunden, je reiner der Ton ist. Geräusche mit besonders energiereichen hohen Frequenzanteilen lösen also das Gefühl kleinster Schallquellengröße aus. Diese Erscheinungen haben mit dem räumlichen Hören direkt nichts zu tun.
B. VII. Wahrnehmbarkeit von Verzerrungen
Jedes Schallereignis ist auf dem Übertragungsweg von der Schallquelle bis zum Gehör verfälschenden Einflüssen (Verzerrungen) ausgesetzt, wobei hier grundsätzlich unter dem Begriff „Übertragungsweg" sowohl Einrichtungen, die der rein räumlichen Überbrückung (gegebenenfalls unter Verwendung von Hochfrequenz), als auch der zeitlichen Überbrückung (Schallspeichereinrichtungen) dienen, verstanden werden sollen.
Nicht zuletzt verursacht auch das Gehör selbst in beachtlichem Ausmaß sowohl lineare Verzerrungen (Kurven gleicher Lautstärke, Bild 44), als auch nichtlineare Verzerrungen [97] (Nachweis bei den „Verdeckungserscheinungen").
Da jede Schallwahrnehmung mit diesen Gehörverzerrungen behaftet sein muß, fehlt praktisch überhaupt jeder Vergleich zu verzerrungsfreien Zuständen. Die Gehörverzerrungen werden deshalb, solange keine krankhafte Veränderung eingetreten ist, auch nicht als störend empfunden. Sie setzen lediglich die Wahrnehmbarkeit der außerhalb des Gehörs verursachten Verzerrungen herab. Diese Auswirkung interessiert aber den Tontechniker ganz besonders, da er unter anderem daraus die Anforderungen an hochwertige Übertragungsgeräte hinsichtlich der zulässigen Verzerrungen ableiten kann.
B. VII. 1. Lineare Verzerrungen
.
B. VII. 1.1 Dämpfungsverzerrungen
In der Studiotechnik dient zweckmäßigerweise als Gradmesser des Einflusses von Dämpfungsverzerrungen die Erhaltung der Klangtreue. Bild 58 soll überschlägig zeigen, wie groß die von einer Zuhörergruppe empfundene Qualitätseinschränkung in Prozent ist, gemessen in Abhängigkeit von der unteren und oberen Grenzfrequenz des gesamten Übertragungsweges bei der Übertragung von Musik.
Die Einengung des Frequenzbereiches wurde dabei so vorgenommen, daß nach einer Herabsetzung der oberen Grenzfrequenz die untere Grenzfrequenz soweit verändert wurde, daß das Produkt aus beiden Grenzfrequenzen konstant blieb. Praktisch hat sich nämlich gezeigt, daß bei einem konstanten Produkt fo • fu von etwa 400.000 bis 500.000 der Klangcharakter des übertragenen Schallereignisses noch am wenigsten verfälscht wird, da dann kein zu „heller" oder zu „dunkler" Gesamteindruck bei der Wiedergabe auftritt.
Bild 58 ist zu entnehmen, daß eine qualitative vollkommen ungeschmälerte und damit frei von Dämpfungsverzerrungen erfolgende Musikübertragung ein Frequenzband von 40 bis 15.000 Hz erfordert. Wird dagegen ein „Qualitätsverlust" von 10% zugelassen, so liegen die Grenzfrequenzen bereits bei 90 und 7000 Hz.
Die Silbenverständlichkeit
Zur Kennzeichnung des Einflusses der Dämpfungsverzerrungen auf Sprachübertragungen findet man in der Literatur allgemein nur die Silbenverständlichkeit in Abhängigkeit von der unteren und oberen Grenzfrequenz dargestellt. Das ist selbstverständlich in der Studiotechnik nicht ausreichend, da es hier ja nicht nur auf eine Verständlichkeit ankommt, sondern genau wie bei der Musikübertragung auch auf die Erhaltung der Natürlichkeit des Klangbildes.
Aufgrund des - im Verhältnis zur Musik - geringeren Frequenzumfanges der menschlichen Sprache (Bild 43) ist zu erwarten, daß ein gegenüber der ersteren schmaleres Frequenzband trotzdem zu einer gleichen Beurteilung der Übertragungsqualität hinsichtlich der Dämpfungsverzerrungen führt. Das gilt nach diesem Bild besonders augenfällig für die untere Grenzfrequenz bis etwa 100 Hz.
Die in Bild 43 eingezeichneten Kreise sind hier noch von besonderer Bedeutung. Sie geben die untere beziehungsweise obere Grenzfrequenz bei der Frequenzbeschneidung von vorgeführten Instrumentenklängen, Sprache und Geräuschen mittels Hoch- und Tiefpässen an, bei der 80% der Zuhörer die Änderung des Gesamtklanges bemerkten [115]. Diese Eintragungen bestätigen die bereits anhand von Bild 58 getroffene Feststellung, daß eine völlig ungeschmälerte Musikübertragung einen Übertragungsbereich von 40 bis 15.000 Hz erfordert. Dabei werden Abweichungen von der Geradlinigkeit des Frequenzganges im Bereiche hoher und mittlerer Frequenzen bereits bei ±4dB und bei tiefen Frequenzen bei ±10dB wahrgenommen [116].
B. VII. 1.2 Laufzeitverzerrungen
Wie schon im Abschnitt B.I. angeführt, sind wegen der dort erläuterten Funktionsweise unseres Gehörs Phasenverzerrungen von stationären Klängen nicht wahrnehmbar, denn das Ohr besitzt keine Einrichtung, um die Phasenunterschiede zwischen den einzelnen Frequenzen des Klangspektrums registrieren zu können. Bei den für die Empfindung von Klängen wichtigen Ein- und Ausschwingvorgängen - die Musikinstrumente unterscheiden sich neben ihrer unterschiedlichen Anzahl von Oberschwingungen vor allem durch ihre voneinander abweichenden Einschwingvorgänge [117] - können jedoch auch die Phasenverzerrungen zwischen den Teilschwingungen des einschwingenden Klanges gehörmäßig in Erscheinung treten.
Phasenverzerrungen kontra Laufzeitverzerrungen
Das setzt allerdings voraus, daß sich der Einschwingvorgang über einen längeren Zeitraum als die physiologische Einschwingzeit des Gehörs von etwa 0,25ms erstreckt. Ist diese Voraussetzung aber erfüllt, was fast ausschließlich der Fall sein wird, so können die phasenverschobenen Teiltöne des Klangspektrums zu einem zeitlich ebenfalls verschobenen Einschwingen des Ohres bei diesen Teiltönen führen. Da es dabei offenbar nur auf die frequenzunabhängige Größe dieser zeitlichen Verschiebung und weniger auf die Größe der Phasenverzerrung ankommt, spricht man hier besser von Laufzeitverzerrungen.
Diese Laufzeit-Verzerrungen müssen sich aber nach unseren Überlegungen für die Dauer des Einschwingens als eine Klangfarbenänderung bemerkbar machen. Der für ein Instrument charakteristische Klang des Ein- und Ausschwingens wird somit verändert.
Die physiologische Einschwingzeit des Ohres
Mit der Kenntnis der physiologischen Einschwingzeit des Ohres ist jedoch noch keine Aussage über die tatsächlich gerade noch wahrnehmbare Laufzeitverzerrung, das heißt die Laufzeitdifferenz zwischen zwei Teiltönen verschiedener Frequenz oder zwei verschiedenen Klängen, verbunden.
Versuche mit zwei abgestrahlten Tönen, deren Frequenz f1 = konstant == 1000 Hz und F2 = variabel waren und von denen einer beliebig verzögerbar beim Zuhörer eintraf, haben beim sprunghaften Einschalten die in Bild 59 gezeigte Abhängigkeit der eben hörbaren Laufzeitdifferenz At von der Frequenz fz ergeben. Geht man vom sprunghaften Einschalten zu einem Verlauf des Einschaltvorganges nach einer e-Funktion über, so stellt sich eine proportional mit der Zeitkonstanten r der Einschaltfunktion verminderte Wahrnehmbarkeit ein, das heißt der Wert At steigt proportional mit x an.
Werden anstelle von Einzelfrequenzen die Worte im Freien sprechender Redner übertragen und die Gesamtspektren mit Hilfe eines Hoch- und Tiefpasses in jeweils zwei Teile mit gleicher Schnittfrequenz aufgeteilt, so ergeben sich bei drei verschiedenen Sprechern für die Grenzen der gerade noch wahrnehmbaren Laufzeitdifferenzen in Abhängigkeit von der Schnittfrequenz Kurven nach Bild 60.
Die geringsten wahrnehmbaren Laufzeitverzerrungen liegen auch hier im Frequenzbereich von 500 bis 2000 Hz bei etwa 10 ms. Befindet sich die Originalschallquelle dagegen innerhalb eines Raumes, so wird - entsprechend den bereits weiter oben im Zusammenhang mit der Zeitkonstanten angestellten Betrachtungen über die veränderte Wahrnehmbarkeitsgrenze - auch durch die Nachhallzeit des Raumes die Wahrnehmbarkeit von Laufzeitverzerrungen herabgesetzt.
Versuche mit handelsüblichen Schallplatten ergaben für die gerade noch wahrnehmbare Laufzeitdifferenz bei einer Schnittfrequenz von 600 Hz bei Sprache At « 30ms bis 40ms, bei Gesang 45ms und bei Musik 70ms [118]. Diese Werte werden abermals höher, wenn sich nicht nur bei der Aufnahme die Schallquelle, sondern bei der Wiedergabe auch noch der Hörer in einem nachhallbehafteten Raum befindet.
B. VII. 2. Nichtlineare Verzerrungen
Die Hörbarkeit der durch eine nichtlineare Verzerrung neu gebildeten Frequenzen hängt von mehreren Einflüssen, in ganz besonders starkem Maße jedoch von der Wiedergabelautstärke und den ursprünglichen Frequenzen des Schallereignisses ab.
Diese Abhängigkeit ist die Folge der stark frequenzabhängig verlaufenden Schwellwertkurve (Bild 44) und der vorwiegend lautstärkeabhängigen Verdeckungserscheinungen (Bild 48). Da sich wegen der verwickelten Zusammenhänge für die gerade wahrnehmbare nichtlineare Verzerrung kein einheitlicher Wert angeben läßt, liegt die Frage nahe, welche Klänge und Klanggemische gegenüber den Nichtlinearitäten des Übertragungsweges am empfindlichsten und wie groß die bei ihnen eben wahrnehmbaren Verzerrungen sind.
Der empfindlichste Klang
Zunächst zur Frage des empfindlichsten Klanges. Aus dem ganzzahligen Verhältnis der Harmonischen zur Grundwelle eines einfachen Klanges ergibt sich, daß dieser gegenüber nichtlinearen Verzerrungen am unempfindlichsten sein muß. Die neuen Töne, die durch die Verzerrungen hinzukommen, stimmen in ihrer Frequenz mit den bereits vorhandenen Teiltönen überein, oder sie bilden weitere Harmonische.
Es ändern sich also lediglich der Oberwellengehalt und die Amplitude der einzelnen, bereits im Originalklang enthaltenen Harmonischen. Da die Harmonie des Klangbildes nicht geändert wird, tritt auch keine Störung ein, so daß nichtlineare Verzerrungen eines einzelnen Klanges durch die Veränderung der Klangfarbe erst bei einer Mindeständerung von etwa 10 bis 30% der Amplitude eines Teiltones merkbar werden [119].
Doppeltöne oder Klanggemische
Anders liegen die Verhältnisse bei Doppeltönen oder Klanggemischen, bei denen auch Differenz- und Summentöne gebildet werden, deren Frequenzen nicht harmonisch zu den einzelnen Teiltönen liegen. Es hat sich gezeigt, daß Doppeltöne mit einem Frequenzverhältnis von 2:3 (Quinte) besonders empfindlich gegenüber nichtlinearen Verzerrungen sind [120]. Das ist vor allem dann der Fall, wenn eine leichte, dem Hörer gar nicht auffallende Verstimmung vorliegt, da dann die Schwebungen zwischen den Differenztönen die Wahrnehmbarkeit der Verzerrungen sehr begünstigen [121].
Aus Untersuchungen mit reinen Tönen im Quintenabstand sind die in Bild 61 dargestellten Kurven hervorgegangen [122]. Diese Kurven geben die Verzerrungswerte - ausgedrückt durch die Klirrkoeffizienten k% und kz - in Abhängigkeit von der Frequenz und dem Schallpegel an, die sich beim Abhören bei direkter Umschaltung zwischen unverzerrtem und verzerrtem Klang eben wahrnehmen lassen. Sie werden deshalb auch analog zur Schwellwertkurve als Klirrschwellen bezeichnet.
Zu bemerken wäre noch, daß sich dabei die Frequenzabhängigkeit auf die mittlere Frequenz bezieht.
Aus ähnlichen Untersuchungen [123], die die obigen Ergebnisse im wesentlichen bestätigten, wurde die in Bild 62 dargestellte Abhängigkeit der Klirrschwellen von der Frequenz ermittelt. Dabei wurden für k% und ks jeweils die kleinsten, ohne Rücksicht auf den Schallpegel überhaupt wahrnehmbaren Werte eingetragen und die zugehörigen kritischen Lautstärken vermerkt [124]. Die beiden Kurven dieses Bildes zeigen ganz besonders deutlich, daß zumindest bei Frequenzen unter 100 Hz quadratische Verzerrungen erst bei viel höheren Werten als kubische Verzerrungen wahrgenommen werden. Von den auf Musikinstrumenten gespielten Klängen erwiesen sich Flötenzweiklänge als die empfindlichsten. Die Hörbarkeitsgrenze lag hier bei k2 = 1% und k3 = 0,3% [125].
B. VII. 3. Modulationsverzerrungen
Das Auftreten von Modulationsverzerrungen, das heißt sowohl von Amplituden- als auch Frequenzmodulationsverzerrungen, setzt die Modulation eines Trägers durch eine Modulationsschwingung voraus (siehe Abschnitt A. I. 3). Es zeigt sich nun, daß neben der Trägerfrequenz fQ vor allem die Größe der Modulationsfrequenz fm ausschlaggebend für die Wahrnehmbarkeit der Modulationsverzerrungen ist. Das ist auch leicht erklärbar, da zum Beispiel eine sehr niedrige Modulationsfrequenz [fm < 1 Hz) nur langsame Lautstärke- beziehungsweise Tonhöhenschwankungen zur Folge hat, deren Erkennbarkeit von der Gedächtnisleistung des menschlichen Gehörs abhängig ist. Unser Gedächtnis ist aber für das Lautstärke- und Tonhöhenempfinden gegenüber einem unmittelbaren Vergleich dieser Größen sehr wenig entwickelt.
Mit ansteigender Modulationsfrequenz wurde ab 1 Hz eine Wahrnehmbarkeit der Modulationsverzerrungen festgestellt [126], wie sie die Kurven in Bild 63a für eine Trägerfrequenz von fß = 1.000 Hz und in Bild 63b für fQ = 4.000 Hz in Abhängigkeit von der Modulationsfrequenz mit verschiedenen Lautstärken als Parameter zeigen.
Diese Wahrnehmbarkeitsgrenzen werden hier als Amplitudengrenzmodulation beziehungsweise Frequenzgrenzmodulation bezeichnet, wobei als Ordinatenmaßstab für die Amplitudenmodulation der Modulationsgrad m und für die Frequenzmodulation
AfQ der Modulationsindex: Aqp -- genannt wurde.
Mehr über die "Grenzmodulation"
Aus den Bildern ist vorerst bei etwa 4 Hz ein Minimum in den Kurven für die Amplitudengrenzmodulation zu erkennen. Dieses Minimum kommt dadurch zustande, daß nach tieferen Frequenzen zu eine Verschlechterung der Wahrnehmung durch die schon angeführte begrenzte Gedächtnisleistung und nach höheren Frequenzen durch den schnelleren Wechsel der Amplitude des Trägers, dem das Gehör infolge seiner Trägheit nicht mehr zu folgen vermag, zunächst ebenfalls eine Verminderung der Erkennbarkeit eintritt.
Bei der Modulationsfrequenz von etwa 4 Hz ist also auch die Wahrnehmbarkeit von Amplitudenmodulationsverzerrungen vorerst am besten, wobei die Amplitudenmodulation auch noch als eine Lautstärkeschruankung zu erkennen ist.
Das gleiche gilt analog für die Frequenzmodulation. Sie ist bei dieser Frequenz ebenfalls noch als Tonhöhenschruankung wahrnehmbar. Aus Bild 63 ist dieses Minimum für die Frequenzmodulation nur deshalb nicht zu erkennen, weil nicht der Frequenzhub Af, sondern der Modulationsindex aufgetragen wurde, was für die noch folgenden Vergleichsbetrachtungen zwischen Amplituden- und Frequenzmodulation wiederum günstiger ist. Der reine Frequenzhub als Maßstab ergäbe bei den niedrigsten Frequenzen einen ähnlichen Kurvenverlauf wie bei der Amplitudenmodulation.
Nach höheren Modulationsfrequenzen hin, ab etwa 15 Hz, führen jedoch die Lautstärke- und Tonhöhenschwankungen zu einer Rauhigkeit des Tones; durch diese sind dann beide auch nur noch erkennbar, so daß in der Hörwirkung kein Unterschied mehr zwischen einer Frequenzmodulation und einer Amplitudenmodulation besteht, obwohl die Werte der Grenzmodulation noch voneinander abweichen (Bild 63b).
Modulationsgrad und Modulationsindex
Beträgt die Modulationsfrequenz etwa ein Zehntel der Trägerfrequenz, so fließen die Grenzmodulationswerte ineinander über. Voraussetzung für dieses Treffen der Kurven für die Amplituden- und Frequenzgrenzmodulation bilden allerdings die in Bild 63 benutzten Ordinatenmaßstäbe Modulationsgrad und Modulationsindex. Dadurch werden die Kurven miteinander vergleichbar. Diese Frequenzgrenze wird als die Phasengrenzfrequenz Fph bezeichnet [127]. Ihre Abhängigkeit von der Trägerfrequenz ist aus Bild 64 zu ersehen.
Oberhalb der Phasengrenzfrequenz ist entsprechend Bild 63 ein bedeutender Abfall der Grenzmodulationskurven und damit ein Anstieg der Wahrnehmbarkeit der Modulationsverzerrungen zu verzeichnen. Der Ton wird hier als ausgesprochen rauh oder heiser empfunden. Mit ansteigender Trägerfrequenz zeigt sich ebenfalls eine zunehmende Wahrnehmbarkeit, wie aus dem Vergleich der Kurven in beiden Bildern hervorgeht. Die Erkennbarkeit von Modulationsverzerrungen liegt danach schon bei bei 80 Phon.
Dieses Verhalten des Gehörs ist dadurch zu erklären, daß bei höheren Modulationsfrequenzen die Wahrnehmbarkeit der Modulationsverzerrungen, genau wie die der nichtlinearen Verzerrungen, von der Erkennbarkeit der neu gebildeten, im Originalton oder Originalklang nicht vorhandenen Frequenzen abhängt. Waren es bei den nichtlinearen Verzerrungen die Differenz-und Summenfrequenzen, so sind es bei den Modulationsverzerrungen die Seitenbcmdfrequenzen.
Die Erkennbarkeit der Seitenbänder hängt demzufolge ebenfalls wieder in starkem Maße von ihren Frequenzen und der Abhörlautstärke ab, da der Verlauf der Schwellwertkurve und die Verdeckungserscheinungen hier den gleichen Einfluß ausüben. Besonders letztere führen dann zu einer Herabsetzung der Wahrnehmbarkeit, wenn die Modulationsfrequenz gleich der Trägerfrequenz wird, da in diesem Fall die Frequenz des unteren Seitenbandes zu Null wird, während die des oberen Seitenbandes bei höheren Lautstärken verdeckt ist.
Bezüglich der direkten Wahrnehmung von Lautstärke- und Tonhöhenschwankungen ist an dieser Stelle noch deren Abhängigkeit von der Trägerfrequenz interessant. Da, wie wir bereits gesehen hatten, die beste Wahrnehmbarkeit bei einer Modulationsfrequenz fm = 4 Hz gegeben ist, war es sinnvoll, dementsprechende Untersuchungen [128] auch bei dieser Modulationsfrequenz durchzuführen.
In Bild 65 ist nun zunächst die Abhängigkeit der Amplitudengrenzmodu-lation von der Trägerfrequenz und dem Schallpegel dargestellt. Aus den Kurven geht hervor, daß bei einem relativ großen Schallpegel von L = 85 dB die Wahrnehmbarkeit am günstigsten ist. Dabei sind selbst in dem relativ großen Frequenzbereich von 500 Hz bis 8.000 Hz noch Lautstärkeschwankungen mit einem Modulationsgrad von 2 bis 3% erkennbar.
.
Grenzen für die Wahrnehmbarkeit
Dagegen sinkt die Wahrnehmbarkeit in dem gleichen Frequenzbereich auf m = 15% ab, wenn der Schallpegel nur 20dB über der Hörschwelle liegt.
Analoge Untersuchungen [128] bezüglich der erkennbaren Tonhöhenschwankungen führten zu den in Bild 66 abgebildeten Kurven. Aus ihrem Verlauf ist zu entnehmen, daß bei einem Schallpegel von +85dB im Frequenzbereich von 500 Hz bis 8000 Hz Tonhöhenschwankungen von bereits 0,2% wahrnehmbar sind. Diese Wahrnehmbarkeit verschlechtert sich jedoch ebenfalls mit fallendem Schallpegel. Bei L = 20dB sind nur Tonhöhen-Schwankungen von 0,6% wahrnehmbar.
Die Störwirkung derartiger Verzerrungen
Mit den festgestellten Grenzen für die Wahrnehmbarkeit der Modulationsverzerrungen ist jedoch noch nichts über die Störwirkung derartiger Verzerrungen ausgesagt. Sie muß ja auch je nach dem übertragenen Schallereignis, zum Beispiel Musik oder Sprache, sehr stark schwanken [129]. Da die erzeugten Seitenbandfrequenzen fast ausnahmslos nicht harmonisch zur Trägerfrequenz liegen, gelten hier nicht die bei den nichtlinearen Verzerrungen gewonnenen Erkenntnisse bezüglich reiner Töne und Klänge. Im Gegensatz dazu hat sich bei der Störwirkung der Modulationsverzerrungen gezeigt, daß sie bei anhaltenden reinen Tönen am größten ist [130].
Das wirkt sich besonders dann aus, wenn die Tonwiedergabe in einem geschlossenen Raum erfolgt, da sich hier stehende Wellen ausbilden, die Maxima- und Minimastellen an verschiedenen Orten des Raumes zur Folge haben. Ändert sich infolge einer Frequenzmodulation die Frequenz des Dauertones, so ändern diese Stellen ihre Lage im Raum. Am Ort eines Zuhörers, an dem sich in einem bestimmten Zeitpunkt beispielsweise eine Maximalamplitude befand, kann sich im ungünstigsten Fall im nächsten Zeitpunkt ein Minimum einstellen. Dieser Zuhörer hat dann den Eindruck einer im Rhythmus der Tonhöhenschwankung wechselnden Lautstärke. Durch diese Umsetzung in Lautstärkeschwankungen ist in Räumen bei diskreten Frequenzen eine sehr empfindliche Registriermöglichkeit der Frequenzmodulationsverzerrungen gegeben.
Wahrnehmbarkeit von Gleichlaufschwankungen
Glücklicherweise besitzen alle natürlichen Schallereignisse ein umfangreiches Frequenzspektrum, dessen einzelne Frequenzanteile laufend ihre Amplitude ändern.
Aus diesem Grund ist die Wahrnehmbarkeit von Gleichlaufschwankungen auch im Raum wesentlich herabgesetzt. Trotzdem besteht noch eine Abhängigkeit von der Art des aufgezeichneten Schallereignisses; zum Beispiel werden Gleichlaufschwankungen bei Klaviermusik viel besser wahrgenommen als bei Tanzmusik.
Bild 67 zeigt die von einer Gruppe von Personen abgegebene Gütebeurteilung eines übertragenen Klavierkonzertes, das durch entsprechende technische Maßnahmen beliebig amplitudenmoduliert werden konnte. Gleiche Untersuchungen wurden aber auch bei Sprachmodulation vorgenommen. Die Beurteilung erfolgte dabei mit fünf Gütestufen, wobei sich die Klammerwerte auf die Beurteilung der Verständlichkeit bei Sprache beziehen. Die Kurven mit den Gütestufen 1 und 2 wurden durch direkten Vergleich mittels Umschaltung zwischen modulierter und unmodulierter Übertragung ermittelt, während die Kurven mit den Gütestufen 3 bis 5 bei ausschließlich modulierter Übertragung gewonnen wurden.
An den in Bild 67 gezeigten Kurven ist zunächst augenfällig, daß sie in ihrer Tendenz mit den in Bild 63 gezeigten Kurven übereinstimmen. Im wesentlichen geht aber daraus hervor, daß eine hochwertige Übertragung bei einer Modulationsfrequenz von 1000 Hz bis 5000 Hz nur mit einer Amplitudenmodulationsverzerrung von m = 2%, dagegen bei 100 Hz mit etwa m = 20% behaftet sein darf.