Kommunikation und Wissen – Audiovisuelle Signalverarbeitung

HD-Videos, Musik oder mehrere Megapixel große Fotos schicken wir mittlerweile problemlos über die Datenleitungen. Innerhalb von wenigen Minuten landen die verschiedensten Dateitypen im Netz oder auf unseren Festplatten. Fraunhofer-Forscher arbeiten an modernen Verarbeitungs- und Kompressionsverfahren und sorgen so für immer höhere Qualität bei noch niedriger Dateigröße.

Kommunikation und Wissen

Referenzprojekte - Audiovisuelle Signalverarbeitung

Audioformat MP3 (MPEG Layer 3)

Das Buch entlarvt manche Mythen und stellt eine Vielzahl von Halbwahrheiten zur mp3-Geschichte richtig., 5.0.2

Das MP3 (MPEG Layer 3) Audioformat codiert und speichert Musik ohne hörbare Verluste. Das Verfahren spart Speicherplatz und macht dadurch eine schnelle Übertragung möglich. MP3 ist zu einem Weltstandard und einer deutschen Visitenkarte im Ausland mit breiter kultureller und finanzieller Bedeutung. Die Fraunhofer-Gesellschaft und die Friedrich-Alexander-Universität Erlangen-Nürnberg gründeten zudem im Juli 2008 gemeinsam die »International Audio Laboratories Erlangen«, bei der MP3-Patentgewinne ein weiteres Forschen an Audio- und Multimediatechnik möglich machen.

mehr Info

Das Buch »Die mp3-Story« 

Videokompression H.265 High Efficiency Video Coding (HEVC)

Bild zum Herunterladen
© Foto Fraunhofer HHI

Mit LTE und dem Kompressionsstandard HEVC sind lange Ladezeiten beim mobilen Videogucken passé.

High Efficiency Video Coding auch HEVC,H.265 oder MPEG-H genannt, ist eine gemeinsame Entwicklung zur hocheffizienten Videokompression der ISO/IEC Moving Picture Experts Group (MPEG) und der ITU-T Video Coding Experts Group (VCEG). H.265 erzielt im Vergleich zum Vorgänger H.264 eine doppelt so hohe Kompression bei subjektiv gleichbleibender Videoqualität.

mehr Info

Audio Mining für Mediatheken, Archive und Medienbeobachtung

Bild: Screenshot der Mediathek
© Foto Fraunhofer IAIS

Der optimierte Internetauftritt der ARD Mediathek bietet Nutzern neue Suchmöglichkeiten und Funktionen.

Texte können im Internet leicht durchsucht werden. Beim gesprochenen Wort in Bewegtbildaufnahmen ist das nicht ohne weiteres möglich. Die Texte sind schwerer zugänglich und können nicht in Suchmaschinen gefunden werden. Das macht Videoportale und Mediatheken zu geschlossenen Systemen. Open-up-Technologien, die auf automatischer Spracherkennung basieren, machen Bewegtbild-Inhalte verwendbar wie Texte auf Webseiten. Basierend auf einer Audio-Mining-Lösung des Fraunhofer IAIS hat der ARD seine Mediathek überarbeitet. Jetzt können die Tonspuren des audiovisuellen Datenbestandes gezielt durchsucht werden. Durch die »In-Clip-Search« kann eine im Clip markierte Stelle gefunden und als Videozitat per Email verschickt und in Websites integriert werden.

mehr Info

Fraunhofer-Verbund IUK-Technologie

Der größte europäische IUK-Forschungsverbund bietet mit seinem breiten Technologie-Spektrum maßgeschneiderte IT-Lösungenen und kompetente Beratung aus einer Hand.