Ratloses Google Translate: „Genosse“ oder „Schwuler“?

(c) REUTERS
  • Drucken

Der Übersetzungsdienst nutzt seit Herbst das neuronale Netzwerk GNMT - und wählte als erste verfügbare Sprache dafür Chinesisch. Beispiele zeigen, wo Googles künstliche Intelligenz nach wie vor versagt.

In verschiedensten Sprachen waren die Erpresserbriefe jener Hacker verfasst, die im Mai den Krypto-Trojaner WannaCry in die Welt setzten und damit Hunderttausende Rechner lahmlegten. Für ihre Übersetzungen verwendeten sie Analysen zufolge offenbar das Übersetzungsprogramm von Google, Google Translate.

Tatsächlich gibt es nichts Praktischeres, um halbwegs einfache Texte rasch und halbwegs verständlich in andere Sprachen zu übersetzen. Geht es um einfache Standardsätze, ist die Software bereits erstaunlich leistungsfähig. Kein Wunder, dass sie in den Alltag von Menschen in aller Welt Einzug hält. Bis hin zu einer Krankenschwester in Wales, die jüngsten Nachrichten zufolge ihren Dienst mit Hilfe von Google Translate versah, weil sie kaum Englisch verstand – was die Behörden dann doch als Sicherheitsgefährdung einstuften . . .

Übersetzen in 103 Sprachen. Dennoch, und auch wenn über kuriose Ergebnisse von Google Translate nach wie vor leicht lachen ist: Die raschen Fortschritte dieses Übersetzungsprogramms in den letzten Jahren sind erstaunlich. Seit elf Jahren existiert der Dienst, mittlerweile ist er in 103 Sprachen verfügbar. Während einer Übersetzung sucht er in Millionen Texten nach ähnlichen Mustern, um die beste Übersetzung zu finden. Und er stützt sich immer stärker auf künstliche Intelligenz – in deren Erforschung Google viel Geld investiert, zum Teil auf Umwegen: Über 40 Millionen Dollar etwa hat Google in die Sprachlern-App Duolingo investiert; Duolingo wiederum arbeitet intensiv an künstlicher Intelligenz, um Übersetzungen und Sprachlernen zu vereinfachen.

Einen großen Sprung hat Google Translate im Herbst vergangenen Jahres gemacht. Es verwendet nun das selbstlernende Google Neural Machine Translation-System (GNMT), das wie ein Mensch übersetzen lernen soll. Dieses neuronale Netzwerk übersetzt statt einzelner Wörter oder Satzteile ganze Sätze, und hat seine Schöpfer schon überrascht – indem es etwa sogenannte Zero-Shot-Übersetzungen bewerkstelligt: Wenn GNMT etwa dazu trainiert wird, zwischen Deutsch und Vietnamesisch und zwischen Deutsch und Koreanisch zu übersetzen, dann lernt das System selbst, von Koreanisch zu Vietnamesisch zu übersetzen – ohne dass es je mit Trainingsübersetzungen zwischen diesen Sprachen gefüttert worden wäre.

Bislang ist das neue GNMT-System allerdings erst für zwölf Sprachen im Einsatz: Englisch, Französisch, Deutsch, Spanisch, Portugiesisch, Chinesisch, Japanisch, Koreanisch, Türkisch, Russisch, Hindi und Vietnamesisch. Die allererste Sprache, mit der Google sein neues GNMT-System eingeführt hat, war Chinesisch. Vielleicht wollte der Konzern damit prahlen, wie leistungsfähig das neue System war, vielleicht spielen wirtschaftliche Überlegungen eine Rolle. Vermutlich ist es auch ein Versuch, ein Signal zu setzen gegen den bekannten „Eurosprachzentrismus“ von Google Translate. Das System bietet zwar Übersetzungen für über hundert Sprachen an, die Qualität schwankt aber je nach gewählter Sprachkombination enorm; und die Qualität der Übersetzungen, das haben auch vergleichende Untersuchungen vor der Einführung des neuen neuronalen Netzwerks gezeigt, ist bei europäischen Sprachen in der Regel viel höher als bei asiatischen.

Schwierig: der Wortschatz-Wandel. Wie steht es aber nun um die Qualität der Übersetzungen aus dem Chinesischen ins Englische mit GNMT? Der aus Peking stammende Journalist und Germanist Ming Shi hat sie untersucht – und gezeigt, wie schwer sich Googles künstliche Intelligenz gar nicht so sehr in der Syntax, sondern vor allem im lexikalischen Bereich tut. „Der Alltagswortschatz des Chinesischen ist einer rasanten gesellschaftlichen Entwicklung ausgesetzt. Niemand weiß, welche Wörter, die gerade noch in aller Munde waren, schon wieder Schnee von gestern sind“, schreibt Ming Shi in einem Beitrag von Oktober 2016 in der „Zeit“. Er bestätigt, was sich auch bei anderen Sprachen zeigt: Google Translate schafft es nach wie vor und trotz selbstlernender Systeme nur sehr bedingt, die jeweilige Bedeutung aus dem situativen Kontext zu erschließen. Ein Beispiel dafür, dass diese Schwäche für Google-Translate-Nutzer auch politisch heikel werden kann: „Tongzhi“, der „Genosse“, sei für die KP Chinas seit jüngstem wieder die allein gültige Anrede für Parteimitglieder, schreibt Ming Shi. Seit über einem Jahrzehnt heiße aber genau dasselbe „tongzhi“ für Chinesen „Homosexueller“.

Fakten

Google & Leo. Google übersetzt kostenlos Wörter, Sätze, Webseiten in über 100 Sprachen, soweit die Werbung, die Übersetzungen sind aber unterschiedlich brauchbar. Leo hingegen ist recht verlässlich und wird immer vielfältiger.

Babbel. Kostenpflichtige E-Learning-Plattform für webbasiertes Lernen von 14 Sprachen. Für Verspielte und Freunde der Lautmalerei.

("Die Presse", Print-Ausgabe, 04.06.2017)

Lesen Sie mehr zu diesen Themen:


Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.