stereoplay Kompendium 1988 - "Grundlagen der HiFi-Technik"
Es müsste aber "Grundlagen der Akustik" heißen.
von Gert Redlich im Januar 2014 - Unter der Chefredaktion von Karl Breh wurden ab 1984 bis etwa 1988 in jede Ausgabe der stereoplay so ziemlich in der Mitte blaue Seiten mit Grundlagen-Wissen eingeklebt. Diese Seiten wurde später nach Abschluß der ganzen Artikel in einem Kompendium zusammengefaßt. Nach meiner Meinung sind diese Artikel hier nicht Hifi spezifisch sondern allgemeine akustische Grundlagen. Einige Artikel verlangen volle Aufmerksamkeit und gezieltes "Verstehen Wollen" für diese hochkomplexe Materie. Die einzelnen Verfasser haben sich dennoch bemüht, immer wieder mit plausiblen Beispielen nachzuhelfen. Der Inhalt des Kompendiums steht hier.
.
Grundlagen der HiFi-Technik IX (9)
Über das Hören II
Die letzte Folge wies den Zusammenhang zwischen dem effektiven Schalldruckpegel und dem subjektiv empfundenen Lautstärkepegel auf.
Er wird experimentell mit einer ausreichenden Anzahl Versuchspersonen ermittelt, wobei ein 1000 Hertz Ton veränderbaren Schalldruckpegels als Bezug dient.
Was ist "gleich laut" ?
Die Testpersonen müssen angeben, bei jeweils welchem Schalldruckpegel sie einen Ton anderer Frequenz als gleich laut empfinden.
Beide Töne besitzen dann definitionsgemäß den gleichen Lautstärkepegel in Phon. Die Darstellung der Versuchsergebnisse in Abhängigkeit von der Frequenz und dem Schalldruckpegel führt zu den Kurven gleichen Lautstärkepegels in Phon (stereoplay 8/1984, Seite 118).
Die Hörschwelle
Die Kurve ganz unten dieser Kurvenschar gibt an, bei welchem Schalldruckpegel die verschiedenen Töne des Tonfrequenzbereichs für das menschliche Ohr gerade hörbar werden. Aus diesem Grunde heißt diese Kurve auch Hörschwelle.
.
Das Ohr: Empfänger mit gewaltigem Dynamikbereich
Zwischen 1.000 und 2.000 Hertz liegt der Schalldruck der Hörschwelle bei 2 x 10 hoch -5 Newton pro Quadratmeter, der Schalldruckpegel beträgt definitionsgemäß 0, denn
Formel
Die Schmerzgrenze
Zwischen 2 • 10 hoch 6 und 2 • 10 hoch 7 N/m2 liegt die Schmerzgrenze. Schalldrücke dieser Größe (startender Düsenjäger, Kesselschmiede, aber auch nicht wenige Diskotheken) verursachen Schmerzen und auf die Dauer Gehörschäden.
7 Zehnerpotenzen werden besser logarithmisch dargestellt
Als Empfangsorgan verarbeitet das menschliche Ohr demnach einen Schalldruckbereich von sieben Zehnerpotenzen, also das Verhältnis von 1 zu 10 Millionen. Die Umrechnung mittels Logarithmus und die Angabe in Dezibel führen dazu, daß die Schalldruckpegel wesentlich übersichtlicher von 0 bis 140 Dezibel SPL variieren.
Lautstärke und Lautheit als Maß für die Empfindung
Eine Erhöhung des Schalldruckpegels um 10 Dezibel beziehungsweise des Lautstärkepegels um 10 Phon (bei 1 Kilohertz) wird als doppelte Lautstärke empfunden. Zwei Schallquellen gleichen Schalldruckpegels (zum Beispiel von 60 Dezibel) klingen aber nicht doppelt so laut wie eine allein. Vielmehr beträgt der Gesamtschalldruckpegel
Formel
Doppelt ist aber nicht doppelt
Der Schalldruckpegel wächst also nur um 6 Dezibel und nicht um 10, was doppelter Lautstärke entspräche. Die Schallintensität, die dem Quadrat des Schalldrucks proportional ist, wächst bei doppelter Lautstärke sogar nur um 3 Dezibel — sie ist der Schallenergie und Schallleistung proportional.
Aus diesem Sachverhalt erklärt sich der Wunsch nach einer Skala, bei der eine Verdoppelung des Zahlenwertes auch einer Verdoppelung des Lautstärkeempfindens, also der Lautheit entspricht.
Die "sone"-Skala
Dies leistet die ebenfalls empirisch ermittelte sone-Skala (Bild 1). Versuche zeigten, daß es zweckmäßig ist, einer Lautstärke von 40 Phon die Lautheit von 1 sone zuzuordnen. Einem doppelt so laut empfundenen Schallereignis entspricht dann die Lautheit von 2 sone und einem vierfach so laut empfundenen die Lautheit von 4 sone.
Es sind "nicht lineare" Zusammenhänge
Der Zusammenhang zwischen Lautstärke und Lautheit ist nicht linear. Bei geringen Lautstärken nimmt das Lautheitsempfinden schneller zu als bei höheren. Oberhalb von 40 Phon entspricht einer Zunahme der Lautstärke von 10 Phon die Verdoppelung der Lautheit.
Frage :
Wieviel Violinen spielen doppelt so laut wie eine einzige?
Eine Violine allein erzeuge eine Lautstärke von 60 Phon, was 4 sone entspricht. Um die Lautheit auf 8 sone zu verdoppeln, muß die Lautstärke um 10 Phon von 60 auf 70 Phon erhöht werden.
Dies leisten 10 Violinen, denn
Formel
100 Violinen würden 16 sone und 1000 Violinen ganze 32 sone erzeugen. Jetzt wird wohl klar, weswegen ein Symphonieorchester 16 erste, 14 zweite Violinen, 12 Bratschen, 10 Violoncelli und 8 Kontrabässe beschäftigt, wenn es in voller Besetzung aufspielt.
1200 "cents" sind eine Oktave;
das Ohr hört schon 5 "cents"
Wichtig für die Auslegung der Lautstärkesteller von HiFi-Verstärkern ist die Frage, wie groß Pegeländerungen der Lautstärke mindestens sein müssen, damit sie das Ohr überhaupt wahrnimmt. Auch hier ergaben Versuche mit Testpersonen, daß Schalldruckänderungen von 12% oder Intensitätsänderungen von 26% entsprechend 1 Dezibel gerade gut hörbar sind. Zumindest gilt dies bei mittleren Frequenzen und Pegeln.
Die Skalenteilung von Schalldruckpegel und Lautstärke sieht praktischerweise so aus, daß ihre Einheit (1 Dezibel oder 1 Phon) gerade der Wahrnehmbarkeitsschwelle für Lautstärkeunterschiede entspricht. Deswegen besitzen die Lautstärkesteller von HiFi-Verstärkern (Lautstärke-Potentiometern) tunlichst logarithmische Kennlinien.
Eine andere Gehörschwelle betrifft Frequenzunterschiede:
Wie weit müssen zwei Töne auseinanderliegen, damit das Ohr sie als getrennte Töne wahrnimmt? Der Musiker nennt das Frequenzverhältnis zweier Töne Intervall. Verhalten sich die Frequenzen zweier Töne zum Beispiel wie 2:1, so entspricht ihr Intervall einer Oktave. Die Unterteilung der Oktave in 1.200 gleiche Stufen führt zum "cent", der internationalen Einheit des Intervalls. Das Intervall x in "cent" zweier Töne mit den Frequenzen f2 und f1 berechnet sich daher nach folgender Formel:
Formel 1 und 2
Für die "Oktave" ergeben sich aus dieser Formel mit dem Wert 2:1 für f2:f, die definitionsgerechten 1.200 "cents", für die reine "Quint" f2:ft = 3:2 danach 702 "cents" und für den temperierten Halbton f2:f, = 53:50 demnach 100 "cents".
Ein mit 2 Umdrehungen je Minute oder um 6% zu schnell laufender Plattenspieler transponiert die auf der Platte aufgezeichnete Musik um 100,9 "cents", das heißt um einen Halbton, nach oben.
Wann kann das Ohr die Töne trennen ?
Nun zur Beantwortung der Frage, wieviel "cents" ein Intervall bei verschiedenen Frequenzen zählen muß, damit das Ohr die Töne trennen kann. Im Bereich 1050 bis 4200 Hertz — das entspricht dem Tonhöhenbereich c3 bis c5 — ist die Empfindlichkeit für das Intervallhören mit nur 5 "cents" am größten; das ist nur ein Fünfhundertstel eines temperierten Halbtons.
Zu höheren und zu tieferen Frequenzen nimmt die Empfindlichkeit erwartungsgemäß ab. Sie beträgt beim großen C (65,4 Hertz) und beim c7 (16.744 Hertz) nur noch 15,6 "cents".
Unterscheiden sich im empfindlichsten Bereich zwei Töne nur um 5 cents, trennt sie das Ohr bereits. Beim großen C müssen sie hierfür um 0,6 Hertz und beim c7 um nicht weniger als 150 Hertz auseinanderliegen.
Empfindlichkeit gegenüber Tonhöhenschwankungen
Die für die HiFi-Wiedergabe wichtigere Empfindlichkeit des Ohres gegenüber Tonhöhenschwankungen hängt mit dem Intervallhören zusammen, nur daß hierfür noch zwei weitere Einflußgrößen vorliegen:
Die Frequenz, mit der die Tonhöhenschwankung erfolgt (Modulationsfrequenz), und die Lautstärke. Daß sie auch von der Frequenz des schwankenden Tones (Trägerfrequenz) abhängt, ist nach dem Vorausgegangenen ohnehin klar.
Die Tonhöhenschwankungen nach "Feldtkeller und Zwicker"
Das Bild 2 zeigt den nach Feldtkeller und Zwicker experimentell ermittelten Zusammenhang. Das Ohr erweist sich Tonhöhenschwankungen gegenüber am empfindlichsten, wenn die Modulationsfrequenz, das heißt die Frequenz, mit der die Schwankung erfolgt, 4 Hertz beträgt. Das Bild zeigt die Kurvenschar der Hörschwellen in Abhängigkeit von der Trägerfrequenz f0 (x-Achse) und der Lautstärke (y-Achse). Als Parameter dienen die relativen Tonhöhenschwankungen delta f/f0.
Schwankt die Tonhöhe bei der Trägerfrequenz f0 = 3.000 Hertz um ±3 Hertz, beträgt
Formel
Dies entspricht der Kurve ganz oben (mit dem Zahlenwert 2 bezeichnet). Aus ihrem Verlauf ergibt sich, daß die maximale Empfindlichkeit gegenüber den von der DIN 45500 als Mindestwert geforderten 0,2% Tonhöhenschwankungen bei einer Lautstärke von 70dB dann vorliegt, wenn die Trägerfrequenz geringfügig über 3.000 Hertz liegt. Dies macht verständlich, warum die relativen Tonhöhenschwankungen in der HiFi-Meßtechnik mit der Trägerfrequenz 3.150 Hertz zu messen sind.
Die Verdeckung eines Tons durch einen anderen oder durch Rauschen
Schon die tägliche Erfahrung lehrt, daß ein sehr lautes Schallereignis ein leiser auf das Ohr einwirkendes teilweise oder ganz verdecken kann. Vielleicht ziehen manche Diskotheken den Schallpegel ihrer zu rhythmischen Zuckungen anregenden Musik auch deshalb bis an die Schmerzgrenze hoch, damit schon gar niemand auf die Idee kommt, sich unterhalten zu müssen.
Aber der Verdeckungseffekt spielt auch bei sehr viel subtileren Dingen eine Rolle. Komponisten und Arrangeure, die Melodien instrumentieren, müssen darüber Bescheid wissen, wenn sie nicht riskieren wollen, daß beabsichtigte Effekte erst gar nicht zur Geltung kommen.
Es gibt eine natürliche Grenze
Das bei HiFi-Wiedergabe noch sinnvolle Pianissimo findet dort seine natürliche Grenze, wo der leiseste Ton sozusagen unter die Decke des eventuell vorhandenen Restrauschens schlüpft und dadurch dem Ohr entschwindet. Auch Umgebungsgeräusche, die sich weder im Konzertsaal geschweige denn im privaten Wohnraum ganz vermeiden lassen, setzen der Ausweitung der Dynamik bis in die Nähe der natürlichen Hörschwelle schon eine weit frühere Grenze.
Die Mithörschwelle
Bild 3 zeigt die Mithörschwelle eines Tons variabler Frequenz (Testton), wenn gleichzeitig ein 80 Phon lauter Störton von 1 Kilohertz mitmischt. Im Frequenzbereich bis 500 Hertz ist der Testton hörbar, sobald er die Ruhehörschwelle überschreitet. Im Frequenzbereich 500 Hertz bis 1 Kilohertz verdeckt der 1-Kilohertz-Ton den Testton, der, um hörbar zu sein, bis zu 50 Dezibel Anhebung verlangt. Das ist auch zwischen 1 und 2 Kilohertz der Fall.
Über den Differenzton
Eine weitere Anhebung des Testtons in diesem Frequenzbereich macht nicht diesen hörbar, sondern einen Differenzton, dessen Frequenz unterhalb der des Störtons liegt. Erst oberhalb einer neuen, höheren Schwelle erscheint neben dem Störton der Testton selbst wieder, zusammen mit dem Differenzton.
Die "Schwebung"
Fällt die Frequenz des Testtons mit der des Störtons zusammen oder beträgt sie nahezu das Doppelte oder Dreifache, treten in einem weiten Bereich des Schallpegels Schwebungen auf.
Diese Frequenzgebiete sind in Bild 3 dunkel gerastert. Erst bei Frequenzen über 10 Kilohertz verschwindet die Verdeckung des Testtons durch den Störton wieder ganz. Die Mithörschwelle fällt dann wieder mit der normalen Hörschwelle zusammen, wie bei tiefen Frequenzen.
Ermittlung der Hörschwelle mit Weißem Rauschen
Einen Verdeckungseffekt bewirkt auch Weißes Rauschen, das näherungseise als Zwischenstationsrauschen bei UKW-Empfang auftritt, das aber auch vorliegt, wenn ein Verstärker rauscht. Die Ermittlung der Hörschwelle im Übertragungsbereich bei Vorhandensein von Weißem Rauschen unterschiedlicher Pegel führt zu der aus Bild 4 ersichtlichen Kurvenschar. Sie zeigt den Pegel, den ein Sinuston veränderlicher Frequenz haben muß, um durch das Rauschen hindurch hörbar zu werden. Als Parameter dient der Rauschpegel LWR. Zwar wirkt sich die Verdeckung auf hohe Töne um rund 10 Dezibel stärker aus als auf tiefe, aber die Mithörschwelle verläuft wesentlich linearer als die Ruhehörschwelle.
Für die HiFi-Praxis bedeutet dies, daß Weißes Rauschen leise Töne verdeckt — hohe stärker als tiefe — was auf eine Einengung der übertragbaren Dynamik hinausläuft: Das in Dezibel ausgedrückte Verhältnis der größten zur leisesten noch hörbaren Lautstärke verringert sich.
Es geht auch umgekehrt
Erfreulicherweise kann auch umgekehrt ein sehr lauter Ton oder Klang leises Rauschen verdecken, ein Effekt, den verschiedene Rauschunterdrückungsschaltungen zu nutzen wissen.
Die Richtcharakteristik
Die Richtcharakteristik: Fähigkeit des Ohres, Schallquellen zu orten
Anders als das Auge, das nur über einen bestimmten Sehwinkel verfügt, nimmt das Ohr Schallereignisse aus allen Richtungen wahr. Beid-ohriges, das heißt binaurales Hören vorausgesetzt, verfügt das Ohr dennoch über die Fähigkeit des Richtungshörens und somit der Orientierung im Raum.
Eine Ursache für diese Fähigkeit ist Bild 5 zu entnehmen. Bei um den Winkel a zur Blickrichtung seitlich versetzter Schallquelle muß der Schall zum abgewandten Ohr die Wegstrecke delta l mehr zurücklegen als zum zugewandten Ohr. Daher gelangt er um das Zeitintervall delta l später zum abgewandten Ohr.
Die Laufzeitdifferenz
Abgesehen von der Intensitätsabnahme infolge des längeren Wegs und Abschattung des abgewandten Ohrs durch den Kopf trägt auch die Laufzeitdifferenz
Formel
(c = Schallgeschwindigkeit) zur Ortung der Schallquelle bei. Für einen Winkel alfa = 30 Grad und einen Ohrabstand d = 0,17 Meter ergibt sich delta l - d • sin alfa = 0,085 Meter und daraus die Laufzeitdifferenz
Formel
Der Hörwinkel oder auch Ortungswinkel
Das menschliche Gehirn wertet diese Differenz aus und setzt sie in einen Ortungswinkel um. Diese Fähigkeit funktioniert bis herab zu 3 • 10 hoch-5 Sekunden, was einem Hörwinkel von nur 3 Grad entspricht.
Tatsächlich beruht das räumliche Hören auf der gleichzeitigen Auswertung von Pegel- und Laufzeitdifferenzen. Nach dem Gesetz der ersten Wellenfront ortet das Ohr den Schall aus der Richtung der zuerst eintreffenden Schallwelle, sobald die Laufzeit des Schalls von den beiden Boxen zum Hörer sich um mehr als 1 Millisekunde unterscheidet. Dies würde bedeuten, daß der Abstandsunterschied des Stereo-Hörers von den beiden Lautsprechern 34 Zentimetern nicht überschreiten darf.
Kompensation durch Schallverspätung
Doch die Schallverspätung am einen Ohr läßt sich durch die Lautstärkeverminderung am anderen kompensieren und umgekehrt. Nur diesem Effekt ist es zu verdanken, daß bei stereofonem Hören die nutzbare Hörzone nicht punktförmig ist. Bild 6 zeigt die Richtcharakteristiken des menschlichen Gehörs bei binauralem Hören für vier verschiedene Frequenzen.
Erkennen von vorne und hinten
Den Ohrmuscheln ist es zu verdanken, daß von hinten einfallender Schall um bis zu 15 Dezibel schwächer wahrgenommen wird, außer im Bereich um 2 Kilohertz, in dem wohl Beugungseffekte um die Ohrmuschel die Dämpfung verhindern.
Diese frequenzabhängige Richtungscharakteristik (Abschattung des Ohres) führt beim Hören des Originals zu deutlichen Klangfarbenunterschieden und unterstützt entscheidend das Richtungshören.
Ein erstaunliches Auflösungsvermögen
Alles in allem genommen: Das menschliche Gehör verfügt über ein erstaunliches Auflösungsvermögen für Schalleinfallsrichtungen. Im Winkelbereich ±45 Grad zur Blickrichtung sind Stufungen von jeweils 3 Grad feststellbar, im Winkelbereich 45 bis 90 Grad Stufungen von 4,5 Grad.
Als nicht minder leistungsfähig erweist sich das zeitliche Auflösungsvermögen des Ohrs: Um sich auf einen Richtungswechsel zwischen zwei Schallquellen einzustellen, benötigt das Ohr etwa 150 Millisekunden, auf Richtungswechsel zwischen vorne und hinten reagiert es mit einer Zeitverzögerung von 250 Millisekunden. Diese Zeiten entsprechen der Dauer extrem kurzer Noten.
und noch ein Rückblick auf die Evolution
Die Fähigkeit des menschlichen Gehörs, unter dem Evolutionsdruck des Überlebenskampfes entwickelt, erweist sich auch als hochspezialisiert für raumgliederndes Durchhören komplexer Schallereignisse, wie sie große Symphonieorchester erzeugen. Das aber versteht sich fast von selbst, denn der Mensch schuf die Kunstmusik nach seinen eigenen Maßstäben, zu denen auch die Eigenschaften des Gehörsinns zählen.
Karl Breh
In der nächsten Folge:
Ohreigenschaften und HiFi-Technik, Anatomie des Ohres und was das Gehirn zum Hörvorgang beiträgt.