Mathematik für die Ohren

Wiener Schallforscher wollen die Signalverarbeitung präziser und schneller machen. Sie wenden dabei die mathematische »Frame«- Theorie auf akustische Probleme an.

Mathematik fuer Ohren
Schließen
Mathematik fuer Ohren
(c) Die Presse (Clemens Fabry)

Wenn Kriminalisten mutmaßliche Verbrecher abhören, dann ist das oft nicht einfach: Denn meist wird heutzutage per Handy telefoniert– und das Sprachsignal wird auf dem Weg vom Sprecher durch das Handy zum Sendemasten kodiert und vereinfacht. Trotzdem soll das Gesprochene einem bestimmten Sprecher zugeordnet werden – es soll also trotz aller Vereinfachungen nach einem bestimmten Menschen klingen.

Dies ist nur eins von vielen Problemen, mit welchen Schallforscher im digitalen Zeitalter zu tun haben. Peter Balazs arbeitet am Institut für Schallforschung der Akademie der Wissenschaften (ÖAW) und erklärt, welche weiteren Probleme bei der kriminalistischen Sprechererkennung auftauchen: „Das Signal des Handys ist ja auch abhängig davon, wie viele Leute gerade über den Sendemasten telefonieren, wie weit das abgehörte Handy vom Sender entfernt ist und wie gut die Verbindung ist.“

Balazs leitet seit drei Jahren die Gruppe „Mathematik und Signalverarbeitung in der Akustik“, hat im Sommer dieses Jahres einen der renommierten „START-Preise“ erhalten (Forschungsförderung bis zu 1,2 Millionen Euro über sechs Jahre) und will das Problem des gestörten Handysignals mit neuen Methoden angehen.


Zufällig reingerutscht. „Hier liegen zwei Systeme übereinander: Einerseits das System des Vokaltrakts des Sprechers, also der Weg des Schalls von den Stimmbändern bis zu den Lippen. Andererseits das System der Signalkodierung, der Netzverbindung etc. Durch mathematische Methoden kann man diese Systeme besser trennen, auf dass das hier interessante System – der Vokaltrakt des Sprechers – besser identifiziert werden könne“, sagt Balazs.

Besucht man den jungen Mann in seinem Labor in Wien, sieht man, wie ernst er die Mathematik nimmt. Immerhin hat er dieses Fach auf Diplom und Lehramt studiert und ist quasi zufällig in die Schallforschung reingerutscht – er kam ursprünglich als Softwareprogrammierer an das ÖAW-Institut in der Wiener Wohllebengasse. Nun prangt in seinem Büro eine riesige grüne Tafel, auf der hunderte Formeln und Gleichungen mit Kreide notiert sind: an manchen Stellen weggewischt und neu drübergekritzelt. Auch stapeln sich Notizhefte voller handgeschriebener Mathematikformeln auf seinem Schreibtisch: Das ist die analoge Grundlage dessen, was später moderne digitale Anwendungen verbessern kann.

„Vieles berechne ich einfach, weil ich es schön finde“, gibt Balazs zu. „Aber alle Fragestellungen haben irgendeine Verbindung zu Anwendungen.“ So zeigt er etwa das Ergebnis eines vor Kurzem abgeschlossenen WWTF-Projekts, bei dem die abstrakte „Frame-Theorie“ in eine praktische Anwendung übertragen wurde. Die Frame-Theorie ist eine mathematische Herangehensweise bei der Signalverarbeitung, die über derzeitige Modellierungsmethoden weit hinausgeht. Hier diente dieser mathematische Weg dazu, Schallaufnahmen besser verarbeitbar zu machen. Allerdings muss das theoretisch gut fundierte Konzept erst noch in die angewandte Forschung transferiert werden.

„Mein Ziel ist es, die Akustik besser mit Mathematik und Signalverarbeitung zu verbinden“, sagt Balazs. Die Verbindungen gäbe es zwar ansatzweise, aber meist nur auf ein bestimmtes Problem bezogen: „Für ähnliche andere Probleme sind diese mathematischen Modelle dann nicht anwendbar. Oft sind Methoden auch nicht präzise durch Formeln beschrieben: Das macht die daraus errechneten Anwendungen unpräzise, nicht sehr effizient und langsam.“ Balazs vergleicht die bisherigen Verbindungen von Mathematik und Signalverarbeitung mit der Akustik als „Black Box“: „Man weiß zwar, dass es funktioniert. Aber man versteht nicht wirklich, warum.“


Unverstandene Black Boxes. Daher braucht es mehr Mathematiker und Forscher aus unterschiedlichsten Disziplinen, um neue Methoden für die Akustik zu entwickeln: „Dann bekommt man relevante Ergebnisse, die für Anwendungen interessant sind.“ Bisher zeigt hauptsächlich das Feld der numerischen Akustik vor, wie sinnvoll sich Mathematik und Schallmessungen verbinden lassen: z.B. bei der Messung an Lärmschutzwänden oder der Ausbreitung von Vibrationen in unterschiedlichen Materialien.

Doch in den Bereichen der Psychoakustik (wie ein Mensch akustische Signale wahrnimmt) und der Phonetik (wie Sprache aus Lauten aufgebaut ist) wimmelt es von „Black Boxes“, die neue mathematische Lösungsansätze notwendig haben. Die Frame-Theorie, die Schallaufnahmen in kleinste Einzelteile zerlegen kann, ist hier ein sehr guter Ansatz.

„Im Vergleich zur herkömmlichen Signalanalyse, die mit sogenannten ,Basen‘ rechnet, hat man mit ,Frames‘ mehr Optionen“, so Balazs. Er zeigt am Computer eine bunte Grafik, in der verschiedene Frequenzen über eine Zeitachse dargestellt werden. Ein Klick – und es ertönt „Jump“ von Van Halen. „Das ist eine Zeit-Frequenz-Darstellung: Hier erkennt man das Schlagzeug, die Stimme des Sängers und das Keyboard“, erklärt Balazs, der selbst Schlagzeuger ist, an dem Tag übrigens ein „Kiss“-T-Shirt trägt und früher als Tontechniker auf Konzerten gearbeitet hat. Man kann jeden Punkt dieser Darstellung quasi in „Quanten“ zerlegen: „Mit ,Frames‘ hat man mehr Koeffizienten zur Verfügung, das System wird redundant. Bei dem Basen-Ansatz wird jede Information eins zu eins auf Koeffizienten übertragen: Wenn einer verloren geht, kann man die Information nicht wieder bekommen. Im Frames-Ansatz gelingt das aber schon: Daher ist diese Rechenart viel resistenter gegenüber Störungen.“

Als kleine Spielerei klickt Balazs weiter am Computer herum und zeigt die Anwendung des „Frame-Multipliers“: Kurz darauf hat er die Stimme des Sängers herausgefiltert – und „Jump“ erklingt ohne Gesang.

„Mp3 ist z.B. ein Kodierungsverfahren, das auf Maskierung basiert“, erklärt Balazs. „Dabei werden Signalteile mit mehr oder weniger Bits kodiert, je nachdem, wie wichtig sie für das menschliche Gehör sind. Wir wollen ähnliche Dinge mit Zeit-Frequenz-Darstellungen machen und diese besser an das menschliche Gehör anpassen. Hier wollen wir nur jene Teile darstellen, die vom Menschen wahrgenommen werden.“


Reflexionsarmer Raum. Dazu muss man das menschliche Gehör aber immer besser vermessen. Balazs führt in den Keller der Labors: Hier wird es immer leiser; hinter jeder Tür, die sich schließt, bleiben Störgeräusche draußen, bis man endlich im Hightech-Messraum angekommen ist. „Bitte nicht auf die Schaumstoffflächen steigen, die sind wirklich teuer“, sagt sein Kollege Michael Mihocic. Die aus Tonstudios bekannten Schalldämmer aus Schaumstoffnoppen machen den Messraum reflexionsarm – hier hört der Proband wirklich nur das, was die Forscher ihm ins Ohr spielen.

Gesammelt werden hier psychoakustische und physikalische Daten: Ein Bogen von 22 Lautsprechern umgeben den Probanden. In seinem Ohr wird per Mini-Mikrofon gemessen, wie das Schallsignal ankommt, wenn es von rechts oben, links unten, schräg vorne etc. kommt. Dadurch, dass unsere Ohren links und rechts sind, können wir die Richtung des Schalls recht gut erkennen. Aber die Wahrnehmung, ob ein Signal von oben oder unten kommt, ist nur davon abhängig, wie der Schall auf die Ohrmuschel trifft und wie Kopf und Körper den Schall abschirmen.

Die korrekte Messung solcher Details ist z.B. dafür notwendig, damit auch bei Hörgeräten und Cochlea-Implantaten die Wahrnehmung, wo der Schall herkommt, besser funktioniert. Die mathematischen Berechnungen von Balazs' Gruppe führten in Zusammenarbeit mit anderen Wissenschaftlern am Institut nun dazu, dass jeder einzelne Proband bei den Messungen nicht mehr eine Stunde im „reflexionsarmen“ Raum völlig still und unbewegt sitzen muss, sondern nur mehr eine Viertelstunde.

Tritt man aus dem Messraum heraus, bemerkt man so richtig, wie viele Störgeräusche uns im Alltag begleiten. So kann man sich vorstellen, wie viele Anwendungen für die Mathematik und Signalverarbeitung von Balazs' Team möglich sind: Sei es, das Rauschen in Handyübertragungen zu verringern, die Messungen von Lärmschutzwänden zu verbessern – oder einen Kriminellen anhand seiner Handygespräche sicherer dingfest zu machen.

gehör & Sprache

Die Psychoakustik erforscht, wie ein Mensch akustische Signale wahrnimmt. Das physikalische Signal sind die Schallwellen: Diese Signale (mit Parametern wie Amplitude, Frequenz, Bandbreite, Dauer) werden auf dem Weg zum Innenohr verändert. Dort nimmt man das Gehörte mit Parametern wie Lautstärke, Tonhöhe, Rauheit, Klangfarbe etc. wahr.

Die Phonetik erforscht, wie Sprache aus Lauten zusammengesetzt ist.
Dabei wird untersucht, wie der
Sprechapparat (von den Stimmbändern bis zu den Lippen) aufgebaut ist, wie welche Laute entstehen und wie daraus Sprache gebildet wird.

("Die Presse", Print-Ausgabe, 13.11.2011)

Kommentar zu Artikel:

Mathematik für die Ohren

Schließen

Sie sind zur Zeit nicht angemeldet.
Um auf DiePresse.com kommentieren zu können, müssen Sie sich anmelden ›.

Meistgelesen