Das digitale Daten-Wörterbuch

„Viele halten die Analyse von Daten für relativ einfach“, sagt Karin Schnass. „Doch tatsächlich liegen Daten kaum so vor, wie man sich das theoretisch vorstellt.“
„Viele halten die Analyse von Daten für relativ einfach“, sagt Karin Schnass. „Doch tatsächlich liegen Daten kaum so vor, wie man sich das theoretisch vorstellt.“(c) Steinlechner
  • Drucken

Die Mathematikerin Karin Schnass arbeitet in ihrem vom Wissenschaftsfonds geförderten START-Preis-Projekt daran, Daten optimal auszuwerten: mittels Dictionary Learning.

Eigentlich ist die Physik schuld, dass Karin Schnass Mathematikerin geworden ist. Im Gymnasium erschloss sich ihr in diesem Fach so einiges nicht wirklich. Damit haderte die naturwissenschaftlich interessierte Klosterneuburgerin. „Bis ich in der 8. Klasse draufkam, dass ich den Mathe-Stoff aus diesem Jahr schon in der 5. Klasse gebraucht hätte, um Physik zu verstehen.“ Mathematik war ihr ohnehin stets leicht gefallen, und mit dieser neuen Perspektive des Physik-Wissenslücken-Schließens durfte es ruhig ein bisschen mehr sein. Also biss sie sich durch die trockene Anfangszeit dieses Studiums und lernte die Welt der Zahlen zu lieben. „Die ist wunderschön“, findet sie. „Mathematik ist ja nicht nur für die Technik wichtig, sie ist eine Kunst.“

Heute beschäftigt sich die 37-Jährige mit den Herausforderungen der Datenanalyse. Denn Bits und Bytes produzieren wir alle unablässig. Ob es die 350 Millionen hochgeladener Facebook-Fotos pro Tag sind oder das Petabyte pro Sekunde, die der Teilchenbeschleuniger am Cern aufzeichnet (siehe auch Beitrag auf Seite 31): Nur ein Bruchteil der weltweiten Datenflut kann derzeit analysiert werden. Die Methode, mit der Schnass Bilder, Audio- oder andere Dateien auswertet, heißt Dictionary Learning. Seit 2014 läuft dazu ihr START-Preis-Projekt an der Uni Innsbruck. „Dictionary Learning kann man sich vorstellen wie eine Maschine, in die man viele Beispiele einer Datenklasse hineinsteckt und die dann einen geeigneten Bausteinsatz für die ganze Datenklasse ausspuckt.“ Der ist sozusagen das Dictionary, das Wörterbuch.

Jedes Puzzleteil ist ein eigenes Bild

Ein Foto etwa wird in viele quadratische Puzzlestücke zerlegt. Alle sind gleich groß, meist acht mal acht Pixel. „Diese Stücke sind die Datenquelle, aus denen der von uns entwickelte Algorithmus lernt.“ Und zwar erkennt er in ihnen eigene Bildchen in derselben Pixelgröße. Deren Anzahl legen die Forscher fest. Doch schon wenige reichen aus, um alle möglichen Puzzleteile des Ursprungsbildes zusammenzubauen, auch bei lückenhaften Stellen.

Mit freiem Auge ist dann kein Fehler mehr zu erkennen. „Nehmen wir ein zerknülltes Foto“, veranschaulicht Schnass. „Die Risse darin sind Leerstellen, und die möchten wir füllen. Hier kommt uns zugute, dass Fotos etwas Konkretes abbilden. „Wenn wir dem Algorithmus sagen, wo das Bild zerstört ist, erkennt er die Dictionary-Struktur und liefert uns unbeschädigte Teile.“ Damit können sie und ihr Team die kaputten Stellen wiederherstellen.

Daten seien wie Punkte in hochdimensionalen Räumen, erklärt Schnass. „Weil sie jedoch nicht beliebig, sondern auf bestimmte Weise angeordnet sind, etwa auf einer Linie, können wir aus den vorhandenen Informationen auf das Gesamte schließen. Auch wenn nicht alle Daten lückenlos verfügbar sind.“ Bei der Computertomografie werde das schon angewandt. Auch mit weniger Messungen könne der Computer nach diesem Prinzip das Gesamtbild ausrechnen. Der Patient müsse weniger lange in die Röhre, und es senke die Strahlenbelastung. Denkbar sei auch der Einsatz in Szenarien, in denen die vorhandene Energie begrenzt sei: Müsse etwa ein Mars-Rover nur die nötigsten Messungen vornehmen, halte die Batterie länger.

„Wollte lieber Ingenieurin werden“

Nach dem Studium in Wien hat Schnass an der ETH Lausanne in Signalverarbeitung promoviert. „Ich wollte lieber Ingenieurin werden und keinesfalls Bank- oder Versicherungsmathematikerin.“ Danach war sie Postdoc am RICAM in Linz. Den Grundstein für ihr heutiges Thema legte ein Schrödinger-Stipendium des Wissenschaftsfonds FWF, durch das sie mit ihrem damaligen Lebensgefährten, einem Italiener, und den beiden gemeinsamen Kindern nach Sassari auf Sardinien gehen und an der dortigen Universität forschen konnte. „Die vielen Ideen von damals arbeite ich in meinem START-Projekt immer noch auf.“ In Tirol ist sie seit Herbst 2014. „Es hat gut gepasst, sesshaft zu werden, bevor meine Tochter in die Schule kam“, sagt sie und hofft nun auf eine Verlängerung ihres Projekts. Zurzeit arbeitet sie an der Verbesserung ihrer Algorithmen und an weiteren möglichen Einsatzgebieten.

ZUR PERSON

Karin Schnass (37) studierte Mathematik an der Uni Wien, promovierte 2009 an der ETH Lausanne und arbeitete danach zwei Jahre am Johann Radon Institute for Computational and Applied Mathematics (RICAM) der Akademie der Wissenschaften in Linz. Dann forschte sie als Erwin-Schrödinger-Stipendiatin des Wissenschaftsfonds FWF an der Universität Sassari in Italien, bevor sie 2014 mit einem START-Preis an die Uni Innsbruck wechselte.

Alle Beiträge unter: diepresse.com/jungeforschung

("Die Presse", Print-Ausgabe, 03.03.2018)

Lesen Sie mehr zu diesen Themen:


Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.