Binaurale Kopfhörer-Wiedergabe mit Head-Tracking
Bericht vom Regionalgruppentreffen in Berlin
Text: Sebastian Fischer – Fotos: Georg Fett
Text: Sebastian Fischer – Fotos: Georg Fett
Das Thema der Stunde war also Lokalisation. Und genau diese war es auch, die uns anfänglich einige Probleme bereitet hat – die Lokalisation des Veranstaltungsortes, um genau zu sein. Ein anfängliches Missverständnis, wo das Treffen tatsächlich stattfinden sollte, ließ sich allerdings schnell klären. Und so begann unser spannendes Regionalgruppentreffen nur leicht verspätet im Berlin Open Lab. Dieses ist ein Kooperationsprojekt zwischen UdK und TU Berlin und befindet sich in einem Gebäude der UdK am Einsteinufer in Charlottenburg.
Stefan Weinzierl gab uns einen Überblick, an welchen Themen im Berlin Open Lab gearbeitet und geforscht wird. Das Forschungsgebiet beschreibt man mit dem Oberbegriff der „akustischen Simulation“ am besten. Vor allem binaurale Systeme (also Wiedergabesysteme über Kopfhörer) stehen im Vordergrund. Im Verlauf des Tages konnten wir zwei solcher Systeme selbst ausprobieren. Sie unterschieden sich durch die Anzahl der Freiheitsgrade, also der Möglichkeiten, wie sich der Rezipient / die Rezipientin im Raum bewegen kann, wobei das binaurale System die Wiedergabe per Head- Tracking entsprechend anpasst. Das erste System bietet drei Freiheitsgrade, ist also ein System, das horizontale und vertikale Kopfdrehungen und ein Kippen des Kopfes nach rechts und links bei der Kopfhörerwiedergabe berücksichtigt.
Das zweite System mit sechs Freiheitsgraden bezieht auch Bewegungen der hörenden Person in allen drei Dimensionen im Raum mit ein. Bei beiden Systemen wird die Kopfhörerwiedergabe über eine im Computer berechnete Simulation so angepasst, dass das akustische Geschehen für den Hörenden trotz der Bewegungen am ursprünglichen Platz bleibt. Es wird also ein akustisches Ereignis oder auch Musik über Kopfhörer so wiedergegeben, dass es in der Simulation durch akustische Raumnachbildung, Head- Tracking und andere Maßnahmen so dicht an das tatsächliche Ereignis herankommt, dass der Zuhörer im Idealfall keinen Unterschied zur Wirklichkeit mehr feststellen kann.
Zur theoretischen Grundlage dieser Systeme gab uns Johannes Arend eine Einführung. Den Kunstkopf als erstes binaurales Aufnahmeverfahren kennt wohl jeder. Und auch Head- Related Transfer Function (HRTF) und Binaural Room Impulse Response (BRIR) sind wohl vielen ein Begriff. Diese beiden bilden die Grundlage für die Binaural- Synthese und beziehen kopfbasierte, richtungsabhängige sowie raumakustische Parameter in die Berechnung ein. Nun wird der Kunstkopf ausgetauscht gegen ein Spherical Microphone Array (SMA), also eine Kugel, in die möglichst viele Mikrofone als Array eingelassen sind. Kombiniert man diese Elemente mit einem Head- Tracking- Kopfhörer und Rechenleistung, entsteht ein Wiedergabesystem mit drei Freiheitsgraden (3- DoF, Degrees of Freedom). Damit werden Bewegungen des Kopfes des Rezipienten / der Rezipientin in alle Richtungen berücksichtigt, solange die Person statisch an einem Platz sitzt oder steht. Dieses System konnten die Teilnehmer und Teilnehmerinnen sich auch anhören. Dazu stand das Eigenmike von mh acoustics mit 64 integrierten Mikrofonen im benachbarten Gang bereit, welches das akustische Geschehen abnahm. Im Versuchsraum konnte die 3D- Simulation live über Kopfhörer mitgehört werden.
Das zweite System ging noch einen Schritt weiter: Hiermit konnte sich der Hörer frei im Raum bewegen, hatte also insgesamt sechs Freiheitsgrade (6- DoF). Die computerbasierte Berechnung dahinter ist komplexer, da nun auch noch Standortparameter durch Tracking des Hörers in die Live- Simulation mit einfließen. Für jeden Standort benötigt man generell eine zuvor gemessene BRIR oder muss diese algorithmisch herstellen. Berechnungen per Software wie Matlab, Unreal Engine und liveRAZR liegen bei dem vorgestellten System zugrunde, aber auch Max/MSP, Sparta AmbiRoomSim und IEM RoomEncoder werden häufig für die algorithmische Bestimmung der binauralen Signale verwendet.
Um die Qualität der akustischen Simulation zu beurteilen, ist es in dem Versuchsaufbau möglich, zwischen der binauralen Simulation auf Kopfhörern sowie einer Lautsprecherwiedergabe hin- und herzuschalten. Man hört beispielsweise aus einem der Lautsprecher eine Stimme, schaltet auf die binaurale Simulation um, und es hört sich so an, als käme die Stimme weiterhin aus dem Lautsprecher. Selbst, wenn man sich auf den Lautsprecher zubewegt, ihn umkreist oder kniend hört, ist die Simulation so gut, dass man denkt, der Schall käme aus dem Lautsprecher. Die Teilnehmer waren sehr überrascht, wie echt die Binaural- Synthese klingt, und mussten sich durch Abnehmen des Kopfhörers vergewissern, dass tatsächlich dieser, nicht jedoch der Lautsprecher spielte. Bei diesem handelte es sich übrigens um den AKG K 1000, der nicht auf dem Ohr aufliegt, sondern davor „schwebt“. Somit ist das Ohr nicht von der Umgebung abgeschottet. n den ITU-R Radio Regulations benannt ist.
Alles in allem bot der Nachmittag einen interessanten Einblick, der zeigte, wohin die Reise geht. Vor allem in den Bereichen Gaming, Virtual Reality (VR) und Augmented Reality (AR) werden die gezeigten oder ähnliche Systeme sicherlich ein neuer Standard werden, da hier das überzeugende immersive Erlebnis im Vordergrund steht. Auch der Musikmarkt verändert sich ständig und strebt nach Immersivität, die gute binaurale Systeme weiter und immer notwendiger bedingen wird.
Vielen Dank an Theodor Przybilla für die Organisation sowie an Stefan Weinzierl und Johannes Arend für den interessanten Einblick in ihre Arbeit.
Das Interesse an der Veranstaltung war sehr hoch; eine große Gruppe traf sich im Berlin Open Lab