Serie: Musik-Streamer - Audioqualität

  Ralf Hersel   Lesezeit: 19 Minuten  🗪 4 Kommentare

Bei der Qualität der Musikwiedergabe scheiden sich die Geister. In diesem Artikel erklären wir die Musikqualität.

serie: musik-streamer - audioqualität

Bei den meisten Artikeln in unserer Serien über Musik-Streamer spielt die Audioqualität eine Rolle. Manche sind mit der Radio- oder CD-Qualität zufrieden, andere möchten die Lieblingssongs gerne in HiRes-Qualität geniessen. Dabei handelt es sich um ein heikles Thema. Zum einen gibt es die subjektive Empfindung der Musikqualität, die davon abhängt, was einem genügt und was die eigenen Ohren leisten können. Zum anderen gibt es viele technische Einschränkungen, die den Hörgenuss mindern.

Mit diesem Artikel versuche ich etwas Klarheit in die Welt der Audioqualitäten zu bringen. Ich bin mir sicher, dass ich die Kritik vieler Leser und Tontechnikerinnen auf mich ziehen werde; doch das ist mir egal. Wer keinen gesteigerten Wert auf die Qualität seiner Musikwiedergabe legt, kann an dieser Stelle aufhören zu lesen. Alle anderen versuche ich in die Geheimnisse der Audioqualität einzuweihen.

Die Theorie

Sorry, aber jetzt wird es langweilig, aber wichtig. Wenn es um die Qualität von digitaler Musik geht, gibt es ein paar Kenngrössen, die man verstehen sollte. Im Wesentlichen geht es um fünf Parameter:

  • Abtastrate (Sampling Rate)
  • Bit Tiefe (Sampling Tiefe)
  • Komprimierung (Dateiformat)
  • Datenübertragungsrate (Bit Rate)
  • Codec

Hier seht ihr ein Diagramm aus Audacity von irgendeiner Audiodatei:

Auf der X-Achse steht die Zeit und auf der Y-Achse der Pegel.

Abtastrate (Sampling Rate)

Bei der Abtastung einer Audiodatei wird die Aufnahme in Zeitscheiben zerschnitten. Das kann man sich gut vorstellen, wenn man sich die Striche im oben gezeigten Diagramm als Abfolge von vertikalen blauen Linien vorstellt. Die Abtastrate wird in "Abtastvorgänge pro Sekunde" gemessen. Bei CD-Qualität wird die Aufnahme in 44100 Stücke pro Sekunde unterteilt. Das wird als 44.1 kHz bezeichnet. 'Pro Sekunde' muss man nicht angeben, weil die Einheit Hertz bereits 'pro Sekunde' definiert ist. Oft liest man höhere Abtastraten, wie 48 kHz, 96 kHz oder 192 kHz. Je höher der Wert, desto feiner wird das Audiosignal zeitlich abgebildet.

Bit Tiefe (Sampling Tiefe)

Auf vielen Internetseiten werden die Abtastrate und die Bit Tiefe miteinander vermischt und verwechselt. Bei der Bit Tiefe geht es nur um einen einzigen blauen Strich (siehe Diagramm), den die Abtastung als kleine Zeitscheibe aus der Audiodatei herausgeschnitten hat. Wir betrachten (bei 44.1 kHz Abtastrate) den 44100sten Teil einer Sekunde. Die Bit Tiefe gibt nun an, wie genau diese Zeitscheibe aufgelöst wird. Hier gibt es üblicherweise Werte von 8, 12, 16, 24 oder 32 Bit. Meistens sieht man die Angabe von 16 oder 24 Bit. 16 Bit erlaubt eine Auflösung der Zeitscheibe in 65'536 Werte, während man bei 24 Bit auf 16'777'216 Werte kommt. Das ist eine 256-mal höhere Auflösung als bei 16 Bit.

Beim Musik-Streamer Qobuz findet man zum Beispiel eine solche Qualitätsangabe:

Dieser Song hat eine Abtastrate von 192 kHz (Zeitscheiben) bei einer Bit Tiefe von 24 Bit (Auflösung einer Zeitscheibe). Das nennt man dann Hi-Res (hohe Auflösung) und ist wesentlich besser als die CD-Qualität mit 44 kHz und 16 Bit.

Die bisher erläuterten Parameter beziehen sich auf die Produktion einer digitalen Audio-Datei. Ob diese Qualität bei euch ankommt, hängt jedoch (mindestens) von drei weiteren Kriterien ab: dem Dateiformat, der Datenübertragungsrate und dem Codec. Bei den folgenden Kapiteln kann ich nicht in die Tiefe gehen, weil das den Umfang dieses Artikels sprengen würde. Daher fasse ich mich kurz.

Dateiformat (Komprimierung)

Jeder kennt die vielen verschiedenen Dateiformate für Audio-Dateien: WAV, MP3, FLAC usw. Anstatt hier hunderte Formate zu erklären, beschränke ich mich auf die drei grossen Unterschiede. Man unterscheidet zwischen unkomprimierten und komprimierten Formaten. Dabei geht es um die Dateigrösse. Bei den komprimierten Formaten wird zwischen verlustfrei und verlustbehaftet unterschieden. Bei den Unkomprimierten kennt man das Rohformat PCM und die WAV-Dateien.

Beim Musikstreaming und der lokalen Datenablage spielen diese Formate eine untergeordnete Rolle, weil sie selten angeboten werden und die Dateigrössen riesig sind. Interessanter wird es bei den komprimierten Formaten. Bei diesen beschränke ich mich auf MP3 und FLAC.

Das MP3-Format ist eines der Bekanntesten im Audio-Bereich. MP3 (korrekt heisst es MPEG-1/2 Audio Layer III) gibt es seit 1991. Es ist ein Verfahren zur verlustbehafteten Kompression digital gespeicherter Audiodaten. MP3 bedient sich dabei der Psychoakustik, mit dem Ziel, nur für den Menschen wahrnehmbare Signalanteile zu speichern. Dadurch wird, bei nicht (oder kaum) verringert wahrgenommener Audioqualität, eine starke Reduktion der Datenmenge möglich.

Bei der Bit Rate (siehe nächstes Kapitel) gibt es viele Stufen, die von 32 kBit/s bis zu 320 kBit/s reichen. Alles unterhalb von 128 kBit/s ist für das Musikhören irrelevant.

  • 128 kBit/s ist Radioqualität
  • 196 kBit/s ist CD-Qualität
  • 320 kBit/s ist HiRes

Wohl gemerkt, hier geht es eigentlich nicht um die Qualität der eigentlichen Digitalisierung, sondern um die Komprimierung der Audiodatei. Natürlich leidet die Qualität, je geringer die Bit Rate ist.

Beim FLAC-Format (Free Lossless Audio Codec) handelt es sich um ein freies Verfahren zur verlustfreien Komprimierung von Audiodateien. FLAC kennt 9 wählbare Kompressionsstufen, die jeweils für eine bestimmte Auswahl an Parameterkombinationen stehen. Die höheren Stufen wirken sich nur gering auf die Reduzierung der Dateigröße aus, dafür steigt jedoch die benötigte Rechenzeit überproportional an; die Dekodiergeschwindigkeit bleibt hingegen nahezu konstant. FLAC-Dateien haben eine Auflösung (Bit Tiefe) von 24 Bit bei einer Abtastrate von 192 kHz. Technisch möglich wären bis zu 32 Bit und über 300 kHz. Zum Vergleich: CDs werden mit 16 Bit und 44,1 kHz wiedergegeben. Bei den Musikstreamern findet man bestenfalls die Qualität 25 Bit bei 192 kHz (siehe vorheriges Bild). Das ist HiRes.

Datenübertragungsrate (Bit Rate)

Die Bit Rate wird oft mit der Abtastrate (Sampling Rate) verwechselt. Im Gegensatz zur Abtastrate, die in kHz gemessen wird, handelt es sich bei der Bit Rate um eine Übertragungsgeschwindigkeit, die in kbit/s gemessen wird. Somit gibt die Bit Rate an, wie viele Daten pro Sekunde bei euch ankommen.

Eine verlustfrei komprimierte Musikdatei wird zwischen 320 kbit/s und 5000 kbit/s übertragen (FLAC). CD-Qualität wird mit ca. 1411 kbit/s bei einer Abtastrate von 44,1 kHz und 16 Bit Tiefe und zwei Kanälen übertragen. An diesem Beispiel seht ihr, woher die Verwirrung stammt. Die Zahlenwerte von Abtastrate und Datenübertragungsrate ähneln sich sehr, obwohl die Einheiten völlig unterschiedlich sind.

Ich bewege mich hier auf dünnem Eis und bin gespannt, was die Tontechniker unter den Lesern dazu kommentieren werden.

CODEC

Bei einem Codec handelt es sich um eine Software zum Kodieren bzw. Enkodieren von Datenströmen. Das kann für die Umwandlung zwischen Formaten nützlich sein, wird aber üblicherweise für eine Umwandlung von analogen zu digitalen Signalen, oder umgekehrt eingesetzt.

In den bisherigen Kapiteln habe ich die Digitalisierung von Musik beschrieben (Abtastrate und Bit Tiefe), sowie die Komprimierung und Datenübertragung (Dateiformat und Bit Rate) behandelt. Beim Codec geht es darum, wie aus eurer Musikdatei tatsächliche Musik in den Lautsprechern wird. Auch das ist sehr vereinfacht ausgedrückt, aber was soll es. Es gibt Codecs (proprietäre und freie) wie Sand in der Wüste, weshalb ich mich auf einen konkreten Fall beschränke. Dabei geht es um die Übertragung eines Audiostreams via Bluetooth an Lautsprecher. Die Übertragung findet von einem Notebook (Manjaro, GNOME) mit dem Musikstreamer Qobuz in Firefox zu Nubert nuPro X-6000 RC Aktivlautsprechern statt.

Sobald die Lautsprecher eingeschaltet und die Bluetooth-Verbindung aufgebaut ist, kann man im Terminal überprüfen, was Sache ist. Dazu dient dieser Befehl: pactl list sinks

Die Ausgabe verrät einiges über die Verbindung:

Ziel #1
    Status: SUSPENDED
    Name: bluez_sink.CC_90_93_20_2F_AF.a2dp_sink
    Beschreibung: nubert X-4 2FAF
    Treiber: module-bluez5-device.c
    Abtastwert-Angabe: s24le 2ch 44100Hz
    Kanalzuordnung: front-left,front-right
    Besitzer-Modul: 22
    Stumm: nein
    Lautstärke: front-left: 65536 / 100% / 0.00 dB,   front-right: 65536 / 100% / 0.00 dB
            Verteilung 0.00
    Basis-Lautstärke: 65536 / 100% / 0.00 dB
    Quellen-Monitor: bluez_sink.CC_90_93_20_2F_AF.a2dp_sink.monitor
    Latenz: 0 usec, eingestellt 0 usec
    Flags: HARDWARE HW_VOLUME_CTRL DECIBEL_VOLUME LATENCY 
    Eigenschaften:
        bluetooth.protocol = "a2dp_sink"
        bluetooth.codec = "aptx_hd"
        device.description = "nubert X-4 2FAF"
        device.string = "CC:90:93:20:2F:AF"
        device.api = "bluez"
        device.class = "sound"
        device.bus = "bluetooth"
        device.form_factor = "speaker"
        bluez.path = "/org/bluez/hci0/dev_CC_90_93_20_2F_AF"
        bluez.class = "0x240414"
        bluez.alias = "nubert X-4 2FAF"
        device.icon_name = "audio-speakers-bluetooth"
    Profile:
        speaker-output: Lautsprecher (Typ: Lautsprecher, Priorität: 0, Verfügbarkeit unbekannt)
    Aktive Profile: speaker-output
    Formate:
        pcm

Wie ihr unter Eigenschaften seht, kommt hier der AptX-HD Codec zum Einsatz.  AptX ist eine proprietäre Familie von Audio-Codecs der Firma Qualcomm. Obwohl proprietär, wird dieser Codec von GNU/Linux-Distributionen unterstützt, falls Pipewire als Audio-Server bei euch läuft, was bei den aktuellen Distros der Fall sein sollte. Evtl. muss man Repos mit unfreien Treibern einschalten.

"Pipewire bietet Unterstützung für A2DP-Sink-Profile mit SBC/SBC-XQ, AptX, LDAC oder AAC-Codecs und HFP/HSP", sagt das Arch-Wiki.

Beim Codec aptX wird ein effizienteres Verfahren zur Komprimierung von Audiodaten eingesetzt. Die zur Verfügung stehende Bandbreite wird also besser ausgenutzt. Das dabei eingesetzte Verfahren heisst Adaptive Differential Pulse Code Modulation (ADPCM). Die Datenübertragungsrate bei Bluetooth-Audiostreams liegt mit aptX bei 352 kBit/s und erhöht sich mit aptX-HD auf 576 kBit/s. Bei einer Auflösung (Bittiefe) von 16 oder 24 Bit und einer Abtastfrequenz von 44,1 oder 48 kHz wird so CD-ähnliche Qualität erreicht. Daher gibt es im Grunde auch für anspruchsvolle Hörer:innen keinen Grund mehr, Bluetooth zu meiden.

Hier die genauen Spezifikationen entsprechend den Angaben von Qualcomm im Überblick:

Selbstverständlich gibt es noch hunderte andere Codecs. Für diesen Theorie-Teil sollte die Erklärung jedoch genügen.

Die Praxis

Herzlichen Glückwunsch, wenn ihr bis hierhin gelesen habt. Ich habe viel über die Theorie geschrieben, um euch die Grundlagen nahezubringen. Hoffentlich war es einigermassen verständlich und richtig. Nun stellt sich die Frage, was das für die Praxis bedeutet. Die Antwort darauf ist einfach: Ihr möchtet beim Genuss eurer Lieblingsmusik eine möglichst hohe Tonqualität bekommen.

Falls ihr wissen möchtet, mit welcher Qualität eine Audiodatei ausgestattet ist, empfiehlt sich der Befehl mediainfo im Terminal:

mediainfo Yello\ -\ Part\ Love.flac

General
Complete name                            : Yello - Part Love.flac
Format                                   : FLAC
Format/Info                              : Free Lossless Audio Codec
File size                                : 24.1 MiB
Duration                                 : 3 min 43 s
Overall bit rate mode                    : Variable
Overall bit rate                         : 906 kb/s
Album                                    : Touch Yello
Track name                               : Part Love
Track name/Position                      : 07
Performer                                : Yello
Genre                                    : Electronic
Recorded date                            : 2009

Audio
Format                                   : FLAC
Format/Info                              : Free Lossless Audio Codec
Duration                                 : 3 min 43 s
Bit rate mode                            : Variable
Bit rate                                 : 906 kb/s
Channel(s)                               : 2 channels
Channel layout                           : L R
Sampling rate                            : 44.1 kHz
Bit depth                                : 16 bits
Compression mode                         : Lossless
Stream size                              : 24.1 MiB (100%)
Writing library                          : libFLAC 1.2.1 (2007-09-17)
MD5 of the unencoded content             : ED252385F3C880FE85D90F0DA918AB0A

Der Befehl gibt euch Informationen über die relevanten Qualitätsparameter:

  • Abtastrate (Sampling Rate)
  • Bit Tiefe (Sampling Tiefe)
  • Komprimierung (Dateiformat)
  • Datenübertragungsrate (Bit Rate)
  • Codec

Hier ist ein Blindtest mit sechs verschiedenen Songs, die jeweils in diesen Qualitäten hörbar sind:

  • schlecht: 128 kbps mp3 (Radio-Qualität)
  • gut: 320 kbps mp3 (CD-Qualität)
  • optimal: WAV (das unkomprimierte Original)

Beim Test könnt ihr auf die beste Qualität klicken, worauf ihr das Ergebnis zu sehen bekommt. Falls ihr keine Unterschiede hört, könnt ihr diesen ganzen Artikel knicken; er ist nicht relevant für eure Ohren. Mir ist es gelungen, in vier Fällen die WAV-Datei herauszuhören. Ich gebe jedoch zu, dass es sehr schwierig war.

Ich selbst habe auch einen Hörtest erstellt. Ausgangspunkt ist die erste Datei in der Liste. Diese habe ich mit Audacity in zwei Stufen verschlechtert. Wenn ihr die Hörproben anklickt, müsst ihr einen Moment warten, bis der Nextcloud-Audioplayer erscheint.

Hörprobe Format Abtastrate Bit Tiefe Bit Rate
Sehr gut flac 96 kHz 24 bit 3341 kbps
Gut mp3 48 kHz 16 bit 192 kbps
Schlecht mp3 44 kHz 16 bit 128 kbps

Nach diesen Tests bin ich mir unschlüssig. Beim Schreiben dieser Serie habe ich sehr viel Musik gehört und verglichen. Insbesondere habe ich dieselben Titel bei verschiedenen Musikstreamern angehört und konnte erhebliche Unterschiede feststellen. Meine Vermutung ist, dass es noch von sehr viel mehr Parametern abhängt, als ich in diesem Artikel beschrieben habe. Gerade bei Pop-Stücken oder bei alten Produktionen hört man häufig eine schlechte Leistung der Toningenieure.

Fazit und Empfehlung

Es ist gut, zu wissen, was die Angaben zur Tonqualität bedeuten. Ich hoffe, dass dieser Artikel etwas Klarheit gebracht hat. Beim praktischen Hörvergleich kommen jedoch weitere Faktoren ins Spiel: was leisten eure Kopfhörer/Lautsprecher, wie gut sind eure Ohren und interessiert euch die Tonqualität überhaupt.

Falls ihr euch ein Musikstreaming-Abo leisten möchtet, empfehle ich folgendes Vorgehen: klickt euch einen kostenlosen Premium-Account für einen Monat (diesen könnt ihr sofort wieder kündigen, damit ihr es am Ende des Monats nicht vergesst). Den Account könnt ihr einen Monat lang testen. Dann sucht ihr nach euren Lieblingssongs, schaut auf die angebotene Audioqualität (falls sie überhaupt angezeigt wird), und vertraut euren Ohren. Vergleicht denselben Titel bei den verschiedenen Streaming-Anbietern. Mit dieser Methode findet ihr schnell heraus, welche Qualität euch wichtig ist und wer sie bedienen kann.

Achtung, dabei geht es nur um die Tonqualität, nicht jedoch um die vielen anderen Aspekte bei den Musikstreaming-Diensten.

Quellen:

https://de.wikipedia.org/wiki/Abtastrate

https://de.wikipedia.org/wiki/Samplingtiefe

https://de.wikipedia.org/wiki/Audioformat

https://de.wikipedia.org/wiki/Daten%C3%BCbertragungsrate

https://de.wikipedia.org/wiki/MP3

https://de.wikipedia.org/wiki/Free_Lossless_Audio_Codec

https://blog.teufel.de/was-ist-eigentlich-flac/

https://en.wikipedia.org/wiki/Audio_codec

https://www.aptx.com/aptx-hd

https://helpguide.sony.net/high-res/sample1/v1/en/index.html

Tags

Musik, Musik-Streamer, audio, Qualität, Audio-Qualität, HiRes

garfield121
Geschrieben von garfield121 am 18. März 2024 um 11:47

Bei den verlustbehafteten Codecs sind neben MP3 noch Ogg-Vorbis und AAC zu nennen. Die sind etwas neuer im Vergleich zu MP3, bedeutet etwas bessere Qualität bei gleicher Bitrate.

Viele Quellen sagen, das Spotify Ogg-Vorbis verwendet (Desktop-Client, nicht Web-Player). Leider ist mir nicht gelungen, das zu verifizieren, der Befehl pactl zeigt das nicht (?)

Bluetooth ist noch komplexer, weil der Stream dafür neu "verpackt" oder sogar resampled wird.

Alex
Geschrieben von Alex am 18. März 2024 um 13:32

Letzter Satz: genau, das ist mir tatsächlich auch erst in den letzten Wochen klar geworden. Auch durch die Artikel hier auf der Seite. Optimal wäre für Bluetooth dann wohl der LDAC-Codec.

Noch optimaler wäre vermutlich eine kabelgebundene Übertragung. Aber das hängt dann vermutlich wieder vom DAC ab, der dabei zum Einsatz kommt.

Es ist wirklich kompliziert... ;-)

kamome
Geschrieben von kamome am 20. März 2024 um 16:37

Vor allem wäre dann noch opus zu nennen, den (ungefähr) alle anderen in den Schatten stellt ;)

Ralf Hersel Admin
Geschrieben von Ralf Hersel am 18. März 2024 um 22:23

Mir ist klar, dass es neben WAV, FLAC und MP3 noch viele andere Formate gibt. Es hätte den Umfang des Artikels gesprengt, wäre ich darauf eingegangen. Kabelgebundene Verbindungen sind immer vorzuziehen.