Optimaler Klang für Telefon und Co.

Mediendienst / 26.5.2011

Telefonate und Videokonferenzen in einer Klangqualität, die der direkten Kommunikation sehr nahe kommt, das gelingt mit einem neuen Audiocodierverfahren – fast so also säßen sich die Gesprächspartner direkt gegenüber.

Bild: Marc Gayer, Manfred Lutzky und Markus Schnell
© Foto Dirk Mahler

Den Diplom-Ingenieuren Marc Gayer, Manfred Lutzky und Markus Schnell (v.l.n.r.) gelang es mit Audiocodierverfahren, die Telefonie entscheidend zu verbessern.

mp3 fürs Telefon: Wer an die Sprachqualität vieler Telefongespräche denkt, hält das für eine gute Idee. Insbesondere Videotelefonate sind so manches Mal unfreiwillig komisch, da durch den Zeitverzug in der Übertragung die Gesprächspartner gleichzeitig anfangen zu sprechen. Grund dafür sind hohe Verzögerungszeiten und die schlechte Qualität, mit der solche Gespräche bislang übertragen werden. Also ging es darum, die Qualität zu verbessern und gleichzeitig die Verzögerungszeit zu minimieren. Die Technologie, die das möglich macht, heißt Low Delay Advanced Audio Coding, kurz AAC-LD. Entwickelt wurde sie von einem Team um Marc Gayer, Manfred Lutzky und Markus Schnell vom Fraunhofer-Institut für Integrierte Schaltungen IIS in Erlangen.

Das IIS ist bekannt für mp3, das Audiocodierverfahren, mit dem es gelang, die Größe von Musik- oder anderen Audiodateien stark zu reduzieren, ohne den Klang zu verschlechtern. Etwas ähnliches für Telefon und Co. umzusetzen, war leichter gesagt als getan. »Der Algorithmus benötigt eine gewisse Zeit, um die Daten zu komprimieren und am anderen Ende der Leitung wieder zu dekomprimieren. Dafür braucht das Verfahren Daten, die in der Zukunft liegen. Das kann dazu führen, dass interaktive Kommunikation nur schwer möglich ist«, erklärt Markus Schnell. Mehrere Jahre hat das Team am IIS den Algorithmus immer weiter verbessert, um die Verzögerung, englisch delay, zu verkürzen und gleichzeitig die Qualität nicht zu verschlechtern. Der Trick: »Wir haben versucht, diesen Bereich, der in die Zukunft schaut, immer weiter zu minimieren und nur noch die Daten der Gegenwart zu verarbeiten. Das haben wir so lange gemacht, bis ein Optimum aus Qualität und Delay gefunden wurde«, so Schnell.

Eine Technologie – viele Anwendungen

Das Ergebnis kann sich hören lassen: Nur noch etwa 15 Millisekunden beträgt die Verzögerung beim Enhanced Low Delay AAC, einer weiter perfektionierten Variante des Advanced Audio Codings. In dieser extrem kurzen Zeit schafft es der Algorithmus, Audiodaten auf weniger als ein Dreißigstel ihres ursprünglichen Umfangs zu reduzieren, ohne gravierende Abstriche in der Klangqualität. Aufgrund seiner enormen Leistungsfähigkeit hat sich das Kodierungsverfahren bereits in vielen Bereichen durchgesetzt, erläutert Marc Gayer: »AAC Low Delay ist heutzutage eigentlich der Standard für viele Videokonferenz-Anlagen. Aber auch im Rundfunk, etwa bei Liveübertragungen im Sport, kommt das Verfahren verstärkt zum Einsatz.«

Der Vorteil der verbesserten Sprachübertragung kommt beispielsweise auch in Smartphones zum Klingen, etwa dem iPhone4 und im iPad2. Dort wird insbesondere die Telefonie per Bild unterstützt. Eine ganz besondere Anwendung haben die Entwickler für das EU-Projekt TA2 »Together Anywhere, Together Anytime« – geschaffen. Hier ging es darum, die Kommunikation zwischen sozial nahestehenden Gruppen zu fördern. Entstanden ist ein System, das zum Beispiel gemeinsames Spielen über Städte- oder Ländergrenzen hinweg ermöglicht. »Dank der optimierten Bild- und Tonqualität entsteht der Eindruck, die weit voneinander entfernten Spielpartner säßen sich nicht per Bildschirm, sondern direkt gegenüber«, sagt Manfred Lutzky.

Derzeit arbeiten am IIS über 120 Wissenschaftler und Ingenieure an Audio- und Multimediatechnologien. Stellvertretend für das gesamte Team erhalten Marc Gayer, Manfred Lutzky und Markus Schnell den Joseph-von-Fraunhofer-Preis 2011.