Möchtest du wissen, wie sich die Bit-Tiefe auf die Audioqualität und andere Aufnahmeparameter auswirkt? Bist du unsicher, welche Bit-Tiefe am besten für Aufnahme, Bearbeitung und Mastering geeignet ist? Und überrascht es dich, dass höhere Bit-Tiefen nicht unbedingt besser klingen? Dann bist du hier genau richtig!
Die Bedeutung der Bit-Tiefe
Die Bit-Tiefe ist so etwas wie ein Messinstrument für digitale Speicherung. Sie gibt an, wie viele digitale Informationen in einer Audiosample enthalten sind. Mit zunehmender Bit-Tiefe steigt auch die Genauigkeit der digitalen Darstellung einer analogen Schallwelle.
Eine höhere Bit-Tiefe führt außerdem zu einem größeren Dynamikumfang der Aufnahme und einem niedrigeren Rauschpegel.
Allerdings kann das menschliche Ohr kaum Unterschiede zwischen verschiedenen Bit-Tiefen wahrnehmen. Die Unterschiede liegen hauptsächlich in der Präzision dieser digitalen Messungen.
Die Ursprünge der Bit-Tiefe: Grundlagen der digitalen Audiotechnik
Um das Konzept der Bit-Tiefe vollständig zu verstehen, ist es wichtig, das Wesen digitaler Audioaufnahmen zu erfassen. Eine akustische Schallwelle ist eine kontinuierliche Bewegung von Energie, die durch ein Medium übertragen wird. Bei digitalen Audioaufnahmen wird diese kontinuierliche Information in fragmentierte Messungen umgewandelt, die als binäre Daten (Einsen und Nullen) dargestellt werden und als Samples bezeichnet werden.
Ein Analog-Digital-Wandler (A/D-Wandler) erfasst diese Messungen mit einer bestimmten Geschwindigkeit, die als Samplerate bezeichnet wird. Die Samplerate definiert die Anzahl der Samples pro Sekunde, und jedes Sample enthält eine Zahl, die die Amplitude einer Wellenform zu einem bestimmten Zeitpunkt repräsentiert. Die möglichen Werte zur Darstellung der Amplitude werden durch die Anzahl der binären Stellen oder Bits bestimmt, aus denen jedes Sample besteht.
Je höher die Bit-Tiefe ist, desto genauer wird die analoge Schallwelle digital reproduziert. Bits werden von Computern in Byte-Folgen oder Gruppen von acht Bits verarbeitet, und ein oder mehrere Bytes ergeben ein digitales Wort. Die Länge der digitalen Wörter kann variieren, normalerweise in Vielfachen von acht, zum Beispiel 16 Bit, 24 Bit, 32 Bit usw.
Die Anzahl der Bits in einem digitalen Wort, oder die Bit-Tiefe, bestimmt die Genauigkeit der Messungen der Amplituden der Samples. Mit einer Bit-Tiefe von 16 Bits gibt es beispielsweise 65.536 mögliche Werte für ein einzelnes Audiosample. Mit einer Bit-Tiefe von 24 Bits gibt es 16.777.216 mögliche Werte, was fast 256-mal mehr Möglichkeiten zur Beschreibung eines Audiosamples bedeutet.
Gibt es Vorteile einer höheren Bit-Tiefe?
Ja, eine höhere Bit-Tiefe ermöglicht es einem System, die subtilen Schwankungen und Nuancen in der Wellenform präzise aufzuzeichnen und wiederzugeben.
Wenn die Bit-Tiefe zu niedrig ist, wird das Signal aufgrund zu großer Abtastintervalle ungenau umgewandelt und es gehen wichtige Details verloren.
Außerdem besteht eine direkte Beziehung zwischen der Bit-Tiefe und dem Dynamikumfang: Wenn die Bit-Tiefe zunimmt, erhöht sich auch der Dynamikumfang.
Wie ist das möglich?
Die Bit-Tiefe gibt an, wie viele binäre Stellen pro Sample erfasst werden. Dadurch bestimmt sie das Signal-Rausch-Verhältnis und somit den Gesamtdynamikumfang der Aufnahme.
Mit zunehmender Bit-Tiefe gibt es einen größeren Dynamikumfang und einen niedrigeren Rauschpegel.
Gibt es eine quantifizierbare Dynamik pro Bit-Tiefe?
Ja! Jedes Bit repräsentiert 6 dB Dynamik. Eine 16-Bit-Aufnahme hat beispielsweise einen Dynamikumfang von 96 dB, während eine 24-Bit-Aufnahme einen Dynamikumfang von 144 dB hat.
Was ist ein 32-Bit-Float und brauche ich das?
32-Bit-Float ist eine Bit-Tiefe, die mit einer ganz anderen Rechenweise codiert wird. Die Gleitkommadarstellung ist flexibler in der Darstellung des Signals, verlangt jedoch mehr Rechenleistung der CPU.
Ein 32-Bit-Float entspricht im Wesentlichen einer 24-Bit-Aufnahme, die über 8 zusätzliche Bits für einen erweiterten Dynamikumfang verfügt.
Im Gegensatz zu anderen Bit-Tiefen gibt es keine festgelegte maximale Lautstärke und somit kein Clipping bei sehr lauten Signalen.
Allerdings sind 32-Bit-Float-Aufnahmen etwa ein Drittel größer als 24-Bit-Dateien. Dies ist jedoch kein Problem, da die Speicherkapazität von SSDs weiterhin wächst, während die physikalische Größe abnimmt.
Ein größeres Problem ist jedoch, dass nur wenige Hardware-Recorder das 32-Bit-Float-Aufnahmeformat unterstützen, während viele verschiedene Software-Anwendungen dies tun, darunter ProTools, LogicPro und Audacity.
Muss man also mit dieser Bit-Tiefe aufnehmen? Es ist nicht unbedingt notwendig, aber es ist gut, wenn deine Ausrüstung es unterstützt, du ausreichend Speicherplatz hast und du zusätzlichen Spielraum für deine Aufnahmen möchtest. Der Industriestandard ist jedoch 24 Bit.
Die Informatik hinter 32-Bit-Float
16-Bit- und 24-Bit-Audio werden in der Festkommadarstellung codiert. Bei der Festkommadarstellung handelt es sich um eine Methode zur Darstellung von Dezimalzahlen in binärer Form, bei der eine konstante Anzahl von Bits links und rechts des Dezimalpunkts vorhanden ist.
32-Bit-Float wird hingegen in der Gleitkommadarstellung dargestellt. Dabei handelt es sich im Grunde genommen um eine Zahl, die in wissenschaftlicher Notation dargestellt wird, also mit einem Exponenten. Jedes Sample kann mit 32 Bits repräsentiert werden, aber die Bits können je nach dargestellter Bruchzahl schwanken.
Was bedeutet das? Gemäß dem IEEE-754-Standard für die Informatik wird 1 Bit für das Vorzeichen (positiv oder negativ) verwendet, 8 Bits für den Exponenten und 23 Bits für den Bruchteil. Die 8 Bits für den Exponenten können je nach dargestelltem Bruchteil variieren oder “floaten”.
Der Nachteil: Nicht jede Dezimalzahl kann genau als Gleitkommazahl ausgedrückt werden.
Bei typischen Bit-Tiefen ist der numerische Abstand zwischen Werten gleichmäßig, da es nur eine begrenzte Anzahl von Möglichkeiten gibt, die Dezimalzahl in Festkommadarstellung auszudrücken.
Bei der Gleitkommadarstellung ändern sich die Abstände zwischen den Werten proportional zum Audiosignal, was zu Rundungsfehlern führt. Im Allgemeinen haben größere Gleitkommawerte größere Rundungsfehler als kleinere Gleitkommawerte.
FAQ
Können wir Unterschiede zwischen Aufnahmen mit unterschiedlichen Bit-Tiefen wahrnehmen?
Kurze Antwort: Nicht wirklich, obwohl einige behaupten, dass es möglich ist (hier kommt der Bestätigungsfehler ins Spiel).
Es gibt einen deutlichen Unterschied in der Audioqualität zwischen 8-Bit- und 16-Bit-Aufnahmen, aber danach gibt es keine hörbaren Veränderungen.
Hier sind zwei Videos: eines mit einer 8-Bit-Aufnahme und eines mit demselben Audio in 16-Bit. Hörst du diesen Unterschied? (Hinweis: Das ganze Rauschen!)
Die meisten Menschen glauben, dass die Audioqualität von 24-Bit besser ist als von 16-Bit – zumindest aus Sicht der Genauigkeit und wissenschaftlichen Korrektheit.
Aber die Qualität mit einer höheren Zahl gleichzusetzen, ist nicht wahrnehmbar.
Während es einen größeren Dynamikumfang und weniger Rauschen gibt, kann das menschliche Ohr kaum einen Unterschied zwischen den beiden wahrnehmen. Das Rauschen in einer 16-Bit-Aufnahme ist für uns sogar unhörbar! Also, was ist der Sinn?
Der Vorteil liegt hauptsächlich im Studio-Monitoring und der Bearbeitung. 24-Bit-Audio eignet sich mindestens besser zum Überwachen und Bearbeiten, da es ermöglicht, bei höheren Pegeln zu hören, bevor Verzerrungen auftreten.
Zu diesem Zweck hat 32-Bit gegenüber 24-Bit-Audio einen Vorteil.
Wenn ich den Unterschied nicht hören kann und meine Zuhörer ihn nicht hören können, welches ist das Mindestmaß an Bit-Tiefe für Aufnahme und Mastering?
Trotz der Tatsache, dass die Welt von CDs weitergezogen ist, ist 16-Bit-Audio immer noch relativ gängig – zumindest für die Verbreitung. Der Industriestandard für die Aufnahme ist jedoch in der Regel 24-Bit-Audio – was uns zur nächsten wichtigen Frage bringt.
Wenn du dich dazu entscheidest, bei einer höheren Bit-Tiefe als der Bit-Tiefe des Verbreitungsformats aufzunehmen, musst du wahrscheinlich Dither anwenden, um den Dynamikumfang des Mixes beim Ausdrucken nicht einschränken zu müssen.
Was ist Dither und was bewirkt es?
Dither ist Rauschen. Das ist es. Aber warum sollten wir Rauschen hinzufügen, wenn wir unsere Bit-Tiefe reduzieren? Wenn die Bit-Tiefe reduziert wird, wird die Quantisierungsverzerrung (Rauschen) stärker sichtbar. Wir fügen also Rauschen zu einem Signal hinzu, um das Quantisierungsrauschen weniger auffällig zu machen. Aber was ist Quantisierungsverzerrung?
Quantisierungsverzerrung oder -rauschen entsteht durch Rundungsfehler, wenn ein ADC versucht, eine kontinuierliche oder unendliche analoge Quelle diskret in digitaler Form zu messen und zu replizieren.
Eine anspruchsvolle Aufgabe, die viele Rundungsfehler erzeugt, da die kontinuierliche Quelle viele Bereiche hat, die oberhalb und unterhalb der Spitzen und Täler der analogen Quelle schwanken, aber die Einsen und Nullen haben ihre Grenzen.
Die Rundungsfehler nehmen bei einer höheren Bit-Tiefe ab, da die Anzahl der Bits angibt, wie viele diskrete Werte zur Speicherung von Amplitudenpegeln zur Verfügung stehen. Wenn du jedoch deine Bit-Tiefe für die Verbreitung reduzieren musst, führst du eine Zunahme von Rundungsfehlern in dein Signal ein.
Wie macht Dither das Quantisierungsrauschen weniger auffällig?
Erinnern wir uns daran, dass Rauschen zufällig ist – eine Eigenschaft, die in diesem speziellen Fall zu unserem Vorteil genutzt werden kann. Wenn du zufälliges Rauschen mit einem zu quantisierenden Signal mischst, fügst du dem Signal genügend Variationen hinzu, um das Originalmaterial zu erhalten.
Idealerweise möchtest du Dither hinzufügen, das völlig unabhängig von dem zu quantisierenden Signal ist, oft als dekorreliert bezeichnet. Wenn dies geschieht und eine angemessene Menge an Dither vorhanden ist, kann jede Probe auf- oder abgerundet werden, abhängig vom Eingang. Dadurch wird nicht nur das ursprüngliche Signal bewahrt, sondern auch die Verzerrung im Inhalt begrenzt.
Manche Dither-Plug-Ins erwähnen das Noise-Shaping. Was ist das?
Noise-Shaping ist im Wesentlichen eine Anwendung eines EQs, um das Hinzufügen von Dither zu einem Signal weniger hörbar zu machen. Dies ist hauptsächlich bei 8- oder 16-Bit anwendbar, wo die Hinzufügung von Rauschen viel offensichtlicher sein wird.
Die meisten Dither-Plug-Ins, wie die Standard-Plug-Ins der DAWs, bieten mehrere Noise-Shaping-Kurven an.
Bei 24-Bit ist das Hinzufügen von Dither so leise, dass es auch ohne Noise-Shaping nicht hörbar ist. Aber die Verwendung wird immer noch dazu beitragen, jede Quantisierungsverzerrung zu entfernen. In diesem Fall ist jedoch ein Dither-Typ mit einer dreieckigen Wahrscheinlichkeitsverteilung (TPDF) oder ein flacher Dither sehr viel anwendbarer.
Fazit
Die Bit-Tiefe ist ein wichtiger Parameter in der digitalen Audiotechnik, da sie die Genauigkeit der digitalen Form der kontinuierlichen analogen Schallwelle bestimmt. Die Bit-Tiefe beschreibt die Speicherkapazität für Informationen innerhalb einer Audio-Sample. Und mit zunehmender Bit-Tiefe steigt die Genauigkeit der Reproduktion der Schallwelle in binärer Form.
Die Bit-Tiefe bestimmt den Dynamikumfang und den Rauschpegel eines Signals. Sie bestimmt auch die Menge an Quantisierungsrauschen oder Verzerrung, die aufgrund von Rundungsfehlern entstehen kann, wenn eine kontinuierliche Welle in binärer Form umgewandelt wird.
Ingenieure nehmen, bearbeiten und mastern in der Regel mit 24 Bit oder höher auf. Die Endprodukte werden jedoch oft in 16-Bit-Form verbreitet. Dies erfordert vom Mastering-Engineer die Zugabe von Dither, um das durch die Reduzierung der Bit-Tiefe verursachte Quantisierungsrauschen zu verringern. Obwohl die Gleitkommabit-Tiefen wie 32 und 64 Bit existieren, bieten sie nur wenige Vorteile, hauptsächlich für Monitoring und Bearbeitung.
Trotz der Tatsache, dass eine höhere Bit-Tiefe eine genauere Wiedergabe einer analogen Schallwelle ermöglicht, kann das menschliche Ohr viele dieser Unterschiede zwischen Einsen und Nullen kaum wahrnehmen. Wir hören vielleicht weniger Rauschen, aber die Schallwelle ist im Ohrkanal nicht klarer oder genauer – nur auf dem Computerbildschirm.
Hoffentlich hast du in diesem Artikel etwas Neues gelernt und ihn genossen – zumindest ein bisschen!