Google baut die letzte Bibliothek

GERMANY BOOK FAIR
GERMANY BOOK FAIREPA
  • Drucken

Der Internet-Gigant stellt alle Bücher früherer Zeiten ins Internet und verwirklicht damit einen alten Menschheitstraum. Noch gibt es die Sprachbarrieren – aber auch sie werden fallen.

Er lebte vor 2300 Jahren, aber es ist erst acht Jahre her, dass die Scanner von Google begonnen haben, seinen Traum in unvorstellbarem Tempo in die Tat umzusetzen. Alles Wissen der Welt wollte PtolemaiosII. in der Hauptstadt seines Reichs vereinen. Dafür kaufte er Bücher in Athen und anderen Zentren der Gelehrsamkeit oder ließ sie sich von anderen Herrschern schicken, und was nicht auf Griechisch war, ließ er übersetzen. Ptolemaios war nicht zimperlich. Sämtliche Schiffe im Hafen von Alexandria ließ er nach Büchern durchsuchen, beschlagnahmte sie und gab nur Kopien zurück. Auch von den Originalmanuskripten des Sophokles, Aischylos und Euripides erhielt der Staat Athen nur Abschriften wieder. Auch das wird manche an Google erinnern.

Das von Nazis zerstörte „Mundaneum“

Eine halbe Million Bücher soll die Bibliothek von Alexandria schließlich enthalten haben, bevor sie der Legende nach in Flammen aufging; in Wirklichkeit weiß man weder wann noch wie sie genau zerstört wurde. Jedenfalls hat der Traum ihre Vernichtung überdauert und in den großen mittelalterlichen Klosterbibliotheken ebenso weitergelebt wie in den Enzyklopädien der Aufklärung. Deren Erfinder Denis Diderot wollte, dass „die Arbeit der vergangenen Jahrhunderte nicht nutzlos für die kommenden Jahrhunderte gewesen sei“. Das Motto könnte auch für den Belgier Paul Otlet gelten. Er richtete in Brüssel ein „Mundaneum“ ein, in dem alles Wissen der Welt auf Karteikarten verzeichnet werden sollte. Bis 1934 waren es zwölf Millionen Stück, bevor die Nazis einen Teil der Karten vernichteten.

Zu den Erben des „Mundaneums“ gehören das Internet, Wikipedia – und das Google Library Project, das früher Google Book Search hieß. Die Idee dahinter: Alle existierenden Bücher sollen gescannt und im Internet verfügbar gemacht werden, und – was die Wirkung noch einmal sagenhaft potenziert – sie sollen per Volltextsuche als Teil des Internets durchsuchbar sein. Es begann vor zehn Jahren als noch geheimes Projekt der Google-Gründer Larry Page und Sergey Brin. Zwei Jahre später, 2004, lieferte Google.com in Zusammenarbeit mit großen US-amerikanischen Bibliotheken die ersten Suchergebnisse aus gescannten Büchern. Im März 2012 verkündete Google dann die Überschreitung der 20-Millionen-Grenze. Das entspricht immerhin schon zwei Drittel aller Bücher, die im ersten halben Jahrhundert nach Erfindung des Buchdrucks gedruckt worden sind.

Neu: Der „Staubsauger-Scanner“

Die Gesamtzahl aller katalogisierten Bücher auf der Welt bezifferte Google übrigens am 5. August 2010 mit rund 130 Millionen. Das klingt viel, aber die Digitalisierung wird auch immer schneller. Erst vor wenigen Tagen präsentierte Google-Ingenieur Dany Qumsiyeh eine Art „Staubsauger-Scanner“, der automatisch umblättert und bis zu 1000 Seiten dicke Bücher in etwa 90 Minuten vollautomatisch digitalisiert.

Jeder, der zunächst begeistert über seinen zufällig „erklickten“ Fund ein Buch im Internet durchblättert, um es nach kürzester Zeit wieder frustriert über die vielen fehlenden Seiten wegzuklicken, weiß, wie eingeschränkt der Zugang zu den bereits erfassten Büchern derzeit ist. Wäre es nach Google gegangen, hätte das Unternehmen einfach alle Werke aus den Bibliotheksbeständen gescannt, bei denen es kein ausdrückliches Nein gegeben hat, nun ist es umgekehrt: Google muss mit allen Verlagen detaillierte Verträge aushandeln.

Aber auch wenn noch völlig ungewiss ist, welche Lösungen für jüngere Werke im Urheberrechtsstreit zwischen Autoren, Verlagen und Google letztendlich gefunden werden: Allein, dass wir in naher Zukunft auf den gesamten rechtefreien Buchbestand von der Erfindung des Buchdrucks bis ins 19. Jahrhundert zugreifen werden können, sprengt die Vorstellungskraft früherer Jahrhunderte.

Madrid, Barcelona, Lyon, München, Wien – etliche europäische Bibliotheken kooperieren schon mit Google. Die Österreichische Nationalbibliothek hat 2010 begonnen, ihren urheberrechtsfreien Bestand bis zum Jahr 1860 vom US-Unternehmen digitalisieren zu lassen. „Es ist die größte Public-private-Partnership, die wir in Österreich je hatten“, sagt ÖNB-Direktorin Johanna Rachinger im Gespräch mit der „Presse“. „Google zahlt die 30 Millionen Euro, das hätten wir sonst selbst finanzieren müssen.“ 100.000 Exemplare wurden schon nach Deutschland geliefert und dort gescannt, bis 2017 sollen es sechsmal so viele sein. Praktisch ist auch, dass die Bücher vor dem Scannen gereinigt und restauriert werden.

Die „Demokratisierung des Wissens“

Dass Google die Inhalte gratis zur Verfügung stellen muss, ist natürlich vertraglich festgelegt. „Es ist ein riesiger Schritt in Richtung Demokratisierung des Wissens, wenn diese Inhalte, die bisher so schwer zugänglich waren, über das Internet in aller Welt abrufbar werden“, meint Rachinger. „Und es bringt auch der Wissenschaft enorme Vorteile.“

Was tun mit den Sprachgrenzen? Die meisten Österreicher hätten im Moment nichts davon, wenn Millionen arabischer, türkischer oder japanischer Bücher frei im Netz stünden. Aber die Übersetzungsprogramme kommen langsam, aber sicher einem weiteren Menschheitstraum näher, der Überwindung der Sprachgrenzen. Die automatische Übersetzung ist schon unvergleichlich weiter, als Gratisversionen auf Google oder Yahoo glauben lassen. Das verdankt sich nicht zuletzt den Textmassen, die das Internet bereithält. In den 1940er-Jahren hielt man es noch für ausreichend, Computer mit Vokabeln und Grammatikregeln zu füttern, um sie in professionelle Übersetzer zu verwandeln. Heute weiß man, dass Sprache viel zu komplex dafür ist. Die Forschung arbeitet nun vor allem statistisch. Auch dafür rafft Google Sprachdaten aller Art an sich, woher immer es sie nur kriegen kann.

Nach der Lösung ist vor der Lösung

Wenn das gesamte in Büchern enthaltene Wissen vergangener Jahrhunderte bald im Internet zu finden ist: Wie wird es strukturiert werden, wie werden sich die Suchmöglichkeiten etwa mithilfe des semantischen Webs entwickeln, wie frei wird das Wissen wirklich? Googles Lösung der Menschheitsfrage, wie man das „Wissen der Welt“ allen zugänglich machen kann, wirft neue Probleme auf. Aber das haben Lösungen so an sich.

("Die Presse", Print-Ausgabe, 24.11.2012)

Lesen Sie mehr zu diesen Themen:

Mehr erfahren

Finanz- und Schuldenkrise
New Articles

Eine Entgiftung der gesamten Eurozone ist möglich

Die Finanz- und Schuldenkrise braucht ein Bündel an Maßnahmen. Eine Lösung ist möglich, wenn Erleichterungen für die Sanierung von Haushalten mit wirtschaftlichen Stimulierungen einhergehen.
Medikamente als Trittbrettfahrer
Wissenschaft

Medikamente als Trittbrettfahrer

Wie bringt man dringend benötigte Heilmittel in die hintersten Winkel der Erde? Auf dem Rücken dessen, was ohnehin überall hingebracht wird: Coca-Cola.
Klimawandel
Umwelt

Klimawandel: CO2 ist Teil der Lösung

Das Ziel, schnell genug auf CO2-freie Techniken umsteigen zu können, wird immer unrealistischer. Ohne CO2-Management, in Form von CCS oder Power-to-Gas, werden die Klimaziele nicht erreicht werden.
Claudia Bandion-Ortner
Österreich

Nie wieder Endlosverfahren

Meinl, Grasser und Co. warten seit Jahren auf Entscheidungen der Justiz. Doch Wirtschaftsstrafverfahren könnten deutlich schneller laufen.
Museumsquartier
Internet

Usability-Checklist, Städte-Wiki und Gratis-Downloads

Im Wiener MQ wurden die Siegerprojekte des Netidee-Bewerbs 2012 präsentiert. Die Preisträger haben nun ein Jahr Zeit, ihre Projekte in die Praxis umzusetzen.

Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.