Hifi-Stereophonie 1980 Heft 09 - ein neues Thema:
Situation und Perspektiven der PCM-Aufzeichnungstechnik
Ein Interview mit Dieter Thomsen von Professional Audio bei SONY
Dieter Thomsen, geb. 1934, studierte Hochfrequenz- und Fernmelde- technik an der Ingenieurschule Gauß in Berlin. Nach dem Ingenieur- examen arbeitete er als "Toningenieur" (?) zunächst bei der Teldec, ab 1970 bei der Seon-Musikfilm GmbH, bei der er mit der Durchführung von Produktionen klassischer Musik betraut war. Von 1978 an arbeitete er als HiFi-Redakteur bei der Zeitschrift „ Funkschau".
Seit Beginn 1980 ist Dieter Thomsen Leiter der Abteilung Professional Audio bei der Firma Sony, Köln.
.
Situation und Perspektiven der PCM-Aufzeichnungstechnik
Wir befinden uns im Herbst 1980. - Das ist eine ganz frühe Äußerung eines Mannes an der Quelle. SONY hatte einen großen Informationsvorsprung, weil dort ein Menge Innovationen in die Tat umgesetzt wurden, auch das Umwandeln von analogen Ton-Signalen in PCM - in beide Richtungen.
Frage an Herrn Thomsen :
Herr Thomsen, worin bestehen nach Ihrer Ansicht die entscheidenden Vorteile digitaler Tonaufzeichnung gegenüber der Analogtechnik?
Die entscheidenden Vorteile der digitalen Aufzeichnung gegenüber analogen Verfahren sind sehr vielfältig: Die wichtigsten sind ein höherer nutzbarer Dynamikbereich, was besonders im Studiobereich wichtig ist für die Nachbearbeitung, geringerer Klirrfaktor, der nur noch in der Größenordnung von sehr guten Endverstärkern liegt, kein Modulationsrauschen, fast unmeßbare Intermodulation, keine Aussteuerungsbegrenzung durch Sättigungserscheinungen des Magnetbandes, keine oder doch mindestens unmeßbar geringe Gleichlaufschwankungen, keine Phasenschwankungen zwischen den Kanälen, linealglatter, sehr eng tolerierter Frequenzverlauf sowie unbegrenzte Kopierbarkeit der Signale in der digitalen Domäne.
.
Frage an Herrn Thomsen :
Können Sie uns einen Überblick geben über den derzeitigen Stand der Technik auf diesem neuen Sektor?
Hierbei müssen wir unterscheiden zwischen dem professionellen Anwendungsbereich und dem Sektor der Heimanwendung. Auf dem professionellen Sektor existiert derzeit eine noch reichlich verwirrende Vielfalt von unterschiedlichen Systemen wie auch von verschiedenen Standards. Hier wäre für die nächste Zukunft wenigstens eine Zwischenlösung wünschenswert, wobei die verschiedenen Hersteller zwar unterschiedliche Geräte bauen, aber alle mit einem einheitlichen, genormten Digitalsignal arbeiten. Hierfür hat Sony bereits im Februar 1980 auf der AES-Convention in London einen Normungsvorschlag gemacht, der aus einem 32-bit-Wort besteht und die unmittelbare Kommunikation zwischen verschiedenen Geräten gestattet, auch wenn diese mit verschiedenen Bitraten arbeiten.
Bei diesem Vorschlag werden zu dem eigentlichen, 16 bit umfassenden Wort weitere 16 bit hinzugefügt, die auf verschiedene Weise genutzt werden können. Beispielsweise können hier fünf zusätzliche Informationsbit eingefügt werden, so daß man insgesamt ein 21-bit-lnformationswort erhält, das theoretisch eine Dynamik von 126 dB ermöglicht.
Wahlweise können aber auch anstelle weiterer Informationsbit sogenannte „User"-bit eingefügt werden, die es ermöglichen, zusätzliche Informationen, beispielsweise über Art und Zeitpunkt der Aufnahme, hinzuzufügen. Ebenso ist denkbar, daß hier eine zusätzliche Fehlerkorrektur eingefügt wird, eine Fehlerkorrektur, die in diesem Falle nicht auf das Band zielt, sondern auf Fehler innerhalb der Übertragungskette, also z.B. Leitungsstörungen in einem Datenbus-System.
Hinzu kommt noch die Möglichkeit, bei jedem Wort ein zusätzliches Synchronsignal einzufügen, so daß auch über lange Strecken keine zusätzliche Synchronleitung erforderlich ist. Das gesamte Format ist seriell, das heißt, ein komplettes Stereosignal kann im Multiplexbetrieb über eine einzige Leitung übertragen werden. Hierdurch ist auch die Übertragung von Mehrkanalinformationen möglich, also beispielsweise einer 32-Kanal-Studioaufzeichnung. Dieses Format hat nichts mit der Art der Bandaufzeichnung zu tun, sondern wäre dann ein universelles Format, das z. B. auch für Peripherie, die im Studio gebraucht wird, wie Nachhallgeräte, digitale Filter oder Entzerrer angewendet werden kann.
.
Frage an Herrn Thomsen :
Welche Abtastfrequenz ist nach ihrer Meinung für die Praxis am besten geeignet, und gibt es in dieser Frage bereits eine Einigung?
Bezüglich der Abtastfrequenzen gibt es einige Punkte, an denen wir - ich möchte beinahe sagen, aus historischen Gründen - nicht vorbeikommen. Hier haben wir einmal die Frequenz von 32 kHz, die die Bundespost bei ihren Übertragungssystemen einsetzt. Wenn man diese 32 kHz als Abtastfrequenz verwenden würde, hieße das, daß man eine Übertragungsbandbreite hätte bis etwa 15 kHz; und hier streiten sich nun schon die Leute, die sagen, wir brauchen ein wirtschaftliches System, und auf der anderen Seite die Industrie, die sagt, wir müssen eigentlich etwas anbieten, das zukunftssicher ist und auch höheren Ansprüchen genügt.
Insofern wird also die Industrie nicht von den heute schon vielfach angewendeten 44,1 kHz nach unten abgehen. Eine Einigung konnte allerdings bislang noch nicht erzielt werden, aber die in der Praxis verwendeten Frequenzen liegen ziemlich dicht beeinander. Als mittlerer Wert wären hier die bereits erwähnten 44,1 kHz zu nennen, die bei der heutigen Aufzeichnungstechnik auf Videorecorder nach PAL-Norm zugeschnitten ist.
Wir halten diesen Wert von 44,1 kHz für ausreichend. Filteraufwand und Nutzbandbreite stehen in einem vernünftigen Verhältnis zueinander. Jede Forderung nach größerer Bandbreite kann nur mit einer Erhöhung der Speicherdichte bzw. des Bandverbrauchs sowie teureren A/D-und D/A-Konvertern erfüllt werden.
Daneben gibt es noch weitere „Kandidaten" für eine Abtastfrequenz, die bei größeren internationalen Schallplattenfirmen gewissermaßen als Hausnorm verwendet oder eingeführt wurden. In diesen Fällen wurde die Abtastfrequenz zu möglichst runden Zahlen gewählt, die man auch geradzahlig in eine andere verwandeln kann. Dazu zählen Abtastfrequenzen wie 50 kHz, 48 kHz, 40 kHz. Diese Systeme haben jedoch in keinem Fall allgemeine Bedeutung erlangt. Für ein allgemein verwendbares System, wie es von Sony und einigen anderen Firmen schon heute verkauft wird, d.h. ein System, das aus einem Digitalprozessor und einem Videorecorder besteht, ist man an eine Forderung gebunden, nämlich, daß dieses vom Recorder aufgezeichnete Pseudovideosignal in ein Videoformat hineinpassen muß.
Dabei kommt uns die Tatsache sehr entgegen, daß das NTSC-Signal eine ableitbare Frequenz enthält von 44,056 kHz und daß das PAL-Signal eine dicht daneben liegende Frequenz enthält von 44,1 kHz. Diese beiden Frequenzen, die gewissermaßen die Hauptfrequenzen sind diesseits und jenseits des Atlantik, sind sehr nahe miteinander verwandt. Man könnte, wenn man die Prozessoren standardisieren wollte, hier ebenso wie in den USA und in Japan die Frequenz von 44,1 kHz verwenden und hätte somit bereits eine Frequenz, die im PAL-Standard gut zu verwerten wäre.
Der PAL-Standard sollte deshalb herangezogen werden, weil man ja heute schon im Prinzip auf einen PAL-Videorecorder auch im Heimbereich hochwertige PCM-Aufnahmen aufzeichnen kann. Im Studiobereich sind dagegen die Abtastfrequenz und ihr Bezug zu irgendwelchen Fernsehnormen relativ uninteressant.
Es ist jedoch zu erwarten, daß es eines Tages eine Brücke geben wird zwischen der Studiotechnik und der Heimaufzeichnung, nämlich dort, wo wir einmal einen digitalen Massenträger haben werden. Das ist wahrscheinlich die digitale Audioschallplatte. An diese ist die Forderung zu stellen, daß sie überall in der Welt gleichermaßen abspielbar sein sollte. Sie muß also in beide Frequenzraster (PAL wie auch NTSC) hineinpassen. Und da bieten sich die genannten 44,1 kHz als geradezu ideal an, weil die Abweichung zwischen dem PAL und dem NTSC-Signal unter 0,1% liegt. Das bedeutet, daß ein in Deutschland mit dem PAL-System und einer Abtastfrequenz von 44,1 kHz aufgenommenes Digitalband in USA nach dem NTSC-System mit 44,056 kHz abgespielt werden kann.
Der Frequenzunterschied wird sich natürlich auf die Tonhöhe auswirken, der Unterschied liegt jedoch weit unter der Hörbarkeitsgrenze und macht einen Spielzeitfehler von nur etwa 0,1% aus. Nach unserer Auffassung ist deshalb die Abtastfrequenz von 44,1 kHz optimal geeignet, Grundlage für einen weltweiten Standard zu sein, sowohl für Bildplattengeräte als auch für Bandaufzeichnungen mit Videorecordern.
.
Frage an Herrn Thomsen :
Gibt es hinsichtlich der Auflösung bzw. der Dynamik bereits eine Einigung, also beispielsweise auf ein 14-bit- oder 16-bit-Format oder andere?
Auch hier liegt noch keine internationale Normung vor, weltweit ist eine Vielzahl von Experimentierversionen in Betrieb. Im Studiobereich setzt sich jedoch immer mehr die Version mit 16-bit-Auflösung durch, die dem Toningenieur genügend Freiheit gibt hinsichtlich der Übersteuerungsreserven, so daß die Aufnahmen auch nachträglich noch weiterbearbeitet werden können, ohne daß zuviel an Geräuschspannungsabstand geopfert wird. Grundsätzlich gilt es festzustellen, daß für Heimwiedergabe heute nicht mehr Dynamik erforderlich ist, als man von einer guten Schallplatte bekommt.
Es geht hierbei also nur um ein Aufzeichnungsmedium und darum, im Studio ein Instrument zur Verfügung zu haben, das mehr Möglichkeiten bietet als z.B. analoge Hilfsmittel wie Companderverfahren, die dann wieder andere Nachteile haben. Das derzeitige Programm von Sony umfaßt 16-bit-Geräte mit einem für Uraufnahmen ausreichenden Dynamikumfang von über 95dB und 14-bit-Prozessoren mit etwa 85dB Dynamik.
Frage an Herrn Thomsen :
Kann man heute schon absehen, ob in nächster Zukunft eine Einigung auf ein einheitliches System möglich sein wird?
Es ist anzunehmen, daß die „digitale Liga" zwischen Studer und Sony auch im Hinblick auf eine Einigung auf dieses System beschlossen worden ist.
Ein genauer Zeitpunkt kann jedoch noch nicht genannt werden.
.
Frage an Herrn Thomsen :
Wie groß etwa ist der Prozentsatz heute an neuen Aufnahmen, die bereits in dieser Technik gemacht werden?
Hierüber Zahlen zu bekommen ist sehr schwierig. Es gibt Werte von CBS, die besagen, daß dort derzeit 90% der Neuaufnahmen im Bereich Klassik nach diesem Verfahren gemacht werden. Weiterhin macht die Polygram ebenfalls einen erheblichen Prozentsatz ihrer Neuaufnahmen aus dem Bereich der Klassik in digitaler Technik. Im Popmusikbereich spielt sich dagegen die Aufnahmetechnik etwas anders ab, wobei das Uroriginal im allgemeinen auf einer Mehrkanalmaschine erstellt wird, die aber in PCM mit der unverzichtbaren digitalen Schneidtechnik noch sehr teuer ist.
Gegenwärtig erfolgt die Uraufnahme mindestens 16-, oftmals aber auch 24-oder 32-kanalig, wird dann geschnitten und auf das endgültige Masterband abgemischt. Hierbei muß jedoch berücksichtigt werden, daß die Frage der Dynamik im Popbereich gar nicht so interessant ist. Die Dynamik ist bei Popaufnahmen im allgemeinen recht gering, andererseits darf man bei den Vorteilen der digitalen Aufzeichnung nicht immer nur die Dynamik betrachten, sondern es gibt ein ganzes Bündel von weiteren Vorteilen, die ich eingangs bereits genannt habe, wie z.B. Wegfall der Gleichlaufschwankungen, phasenstarre Aufzeichnung, keine Intermodulationen und kein Modulationsrauschen, die gerade bei den etwas aus dem Rahmen fallenden Spektren, die man bei der heutigen Popmusik hat, wichtig sind.
Denken Sie z. B. an Synthesizer, bei denen auch hochtonenergiereiche Schallanteile vorhanden sind, die normale oder natürliche Musikinstrumente gar nicht haben. Hierbei bietet natürlich die digitale Aufzeichnung erhebliche Vorteile, z.B., was die Sauberkeit auf der Platte anbetrifft. Dies wird nach meiner Überzeugung auch von den Popmusikfans honoriert, und es gibt ja auch schon einige Digitalaufnahmen auf diesem Sektor.
Frage an Herrn Thomsen :
Wie beurteilen Sie die Entwicklungsaussichten auf dem Heimgerätesektor?
Der Heimgerätebereich ist ja auch ein Markt der Zukunft. Den Markt zu attackieren lohnt sich erst dann, wenn genügend Interesse besteht. Dieses Interesse kann man aber nur dadurch erwecken, daß man Quellen anbietet, die es sich lohnt aufzunehmen. Solange diese nicht vorhanden sind, geht eigentlich die Qualität der PCM-Heimaufnahme völlig daran vorbei.
Beispielsweise kann die Überspielung einer guten Schallplatte heute ohne weiteres mit einem Offenspulengerät oder mit einem hochwertigen Cassettenrecorder mit Metallband erfolgen, so daß es sich einfach nicht lohnt, hierfür PCM-Technik einzusetzen, weil die Quelle nicht die nötige Qualität bietet. Solange keine „künstlerische" Quelle für diese Art von Produktion vorhanden ist, ist auch die Notwendigkeit für PCM-Aufzeichnungsgeräte nicht gegeben.
Die Erfahrung zeigt, daß die Heimaufzeichnung überwiegend nicht auf eigenes, kreatives Schaffen zielt, sondern auf möglichst einfaches Kopieren oder Reproduzieren von vorhandenen Quellen, also Rundfunk oder Schallplatten. Solange diese nicht in der erforderlichen, adäquaten Qualität angeboten werden, erscheinen PCM-Aufzeichnungen sinnlos.
Wenn jedoch eines Tages ein digitaler Tonträger zur Verfügung stehen wird, so kann man möglicherweise den Eingang des digitalen Cassettenrecorders direkt anschließen an den Ausgang des Digitalplattenspielers und kopiert somit die Platte. Ein Schritt auf ein derartiges Gerät hin in Europa wird gerade zum gegenwärtigen Zeitpunkt in Japan getan. Dort sind die in der japanischen Elektronikindustrie vereinten Hersteller dabei, einen Standard für die PAL-Aufzeichnung auf Heimvideorecorder zu schaffen, d.h., es wird vermutlich eines Tages Prozessoren geben, die an ihrem Ausgang ein PAL-Signal zur Verfügung stellen, das auf jedem beliebigen Videorecorder nach PAL-Standard aufgezeichnet werden kann [vgl. Test in diesem Heft: Sharp PCM-Prozessor RX-1].
Darüber hinaus wird es, wenn erst einmal ein solcher Standard festliegt, mit Sicherheit eines Tages ein digitales Cassettendeck geben, das intern ähnlich arbeitet wie ein Videorecorder und in das der digitale Prozessor gleich eingebaut ist.
Wir hätten also dann nur noch eine Einheit, die den Prozessor und das eigentliche Aufzeichnungsgerät umfaßt. Für solche Geräte werden dann auch hochintegrierte Schaltungen zur Verfügung stehen, die die erforderliche Analog-Digital-Wandlung durchführen oder die eine vollständige Fehlerkorrekturschaltung beinhalten. Wenn man diese Schaltungen in genügend großer Stückzahl wird herstellen können, geht auch der Preis hierfür, ähnlich wie wir dies bei Taschenrechnern erlebt haben, rapide zurück. D. h., wir könnten nach meiner Meinung bereits in etwa zwei Jahren ein digitales Aufzeichnungsgerät für den Heimgebrauch haben, ähnlich einem Cassettenrecorder, das in der Größenordnung unter 5.000 DM liegen könnte.
Das Interview führte mth. (Michael Thiele) im Herbst 1980 !
.