Google baut die letzte Bibliothek

23.11.2012 | 18:50 |  ANNE-CATHERINE SIMON (Die Presse)

Der Internet-Gigant stellt alle Bücher früherer Zeiten ins Internet und verwirklicht damit einen alten Menschheitstraum. Noch gibt es die Sprachbarrieren – aber auch sie werden fallen.

Drucken Versenden AAA
Schriftgröße
Kommentieren

Er lebte vor 2300 Jahren, aber es ist erst acht Jahre her, dass die Scanner von Google begonnen haben, seinen Traum in unvorstellbarem Tempo in die Tat umzusetzen. Alles Wissen der Welt wollte PtolemaiosII. in der Hauptstadt seines Reichs vereinen. Dafür kaufte er Bücher in Athen und anderen Zentren der Gelehrsamkeit oder ließ sie sich von anderen Herrschern schicken, und was nicht auf Griechisch war, ließ er übersetzen. Ptolemaios war nicht zimperlich. Sämtliche Schiffe im Hafen von Alexandria ließ er nach Büchern durchsuchen, beschlagnahmte sie und gab nur Kopien zurück. Auch von den Originalmanuskripten des Sophokles, Aischylos und Euripides erhielt der Staat Athen nur Abschriften wieder. Auch das wird manche an Google erinnern.

 

Das von Nazis zerstörte „Mundaneum“

Eine halbe Million Bücher soll die Bibliothek von Alexandria schließlich enthalten haben, bevor sie der Legende nach in Flammen aufging; in Wirklichkeit weiß man weder wann noch wie sie genau zerstört wurde. Jedenfalls hat der Traum ihre Vernichtung überdauert und in den großen mittelalterlichen Klosterbibliotheken ebenso weitergelebt wie in den Enzyklopädien der Aufklärung. Deren Erfinder Denis Diderot wollte, dass „die Arbeit der vergangenen Jahrhunderte nicht nutzlos für die kommenden Jahrhunderte gewesen sei“. Das Motto könnte auch für den Belgier Paul Otlet gelten. Er richtete in Brüssel ein „Mundaneum“ ein, in dem alles Wissen der Welt auf Karteikarten verzeichnet werden sollte. Bis 1934 waren es zwölf Millionen Stück, bevor die Nazis einen Teil der Karten vernichteten.

Zu den Erben des „Mundaneums“ gehören das Internet, Wikipedia – und das Google Library Project, das früher Google Book Search hieß. Die Idee dahinter: Alle existierenden Bücher sollen gescannt und im Internet verfügbar gemacht werden, und – was die Wirkung noch einmal sagenhaft potenziert – sie sollen per Volltextsuche als Teil des Internets durchsuchbar sein. Es begann vor zehn Jahren als noch geheimes Projekt der Google-Gründer Larry Page und Sergey Brin. Zwei Jahre später, 2004, lieferte Google.com in Zusammenarbeit mit großen US-amerikanischen Bibliotheken die ersten Suchergebnisse aus gescannten Büchern. Im März 2012 verkündete Google dann die Überschreitung der 20-Millionen-Grenze. Das entspricht immerhin schon zwei Drittel aller Bücher, die im ersten halben Jahrhundert nach Erfindung des Buchdrucks gedruckt worden sind.

 

Neu: Der „Staubsauger-Scanner“

Die Gesamtzahl aller katalogisierten Bücher auf der Welt bezifferte Google übrigens am 5. August 2010 mit rund 130 Millionen. Das klingt viel, aber die Digitalisierung wird auch immer schneller. Erst vor wenigen Tagen präsentierte Google-Ingenieur Dany Qumsiyeh eine Art „Staubsauger-Scanner“, der automatisch umblättert und bis zu 1000 Seiten dicke Bücher in etwa 90 Minuten vollautomatisch digitalisiert.

Jeder, der zunächst begeistert über seinen zufällig „erklickten“ Fund ein Buch im Internet durchblättert, um es nach kürzester Zeit wieder frustriert über die vielen fehlenden Seiten wegzuklicken, weiß, wie eingeschränkt der Zugang zu den bereits erfassten Büchern derzeit ist. Wäre es nach Google gegangen, hätte das Unternehmen einfach alle Werke aus den Bibliotheksbeständen gescannt, bei denen es kein ausdrückliches Nein gegeben hat, nun ist es umgekehrt: Google muss mit allen Verlagen detaillierte Verträge aushandeln.

Aber auch wenn noch völlig ungewiss ist, welche Lösungen für jüngere Werke im Urheberrechtsstreit zwischen Autoren, Verlagen und Google letztendlich gefunden werden: Allein, dass wir in naher Zukunft auf den gesamten rechtefreien Buchbestand von der Erfindung des Buchdrucks bis ins 19. Jahrhundert zugreifen werden können, sprengt die Vorstellungskraft früherer Jahrhunderte.

Madrid, Barcelona, Lyon, München, Wien – etliche europäische Bibliotheken kooperieren schon mit Google. Die Österreichische Nationalbibliothek hat 2010 begonnen, ihren urheberrechtsfreien Bestand bis zum Jahr 1860 vom US-Unternehmen digitalisieren zu lassen. „Es ist die größte Public-private-Partnership, die wir in Österreich je hatten“, sagt ÖNB-Direktorin Johanna Rachinger im Gespräch mit der „Presse“. „Google zahlt die 30 Millionen Euro, das hätten wir sonst selbst finanzieren müssen.“ 100.000 Exemplare wurden schon nach Deutschland geliefert und dort gescannt, bis 2017 sollen es sechsmal so viele sein. Praktisch ist auch, dass die Bücher vor dem Scannen gereinigt und restauriert werden.

 

Die „Demokratisierung des Wissens“

Dass Google die Inhalte gratis zur Verfügung stellen muss, ist natürlich vertraglich festgelegt. „Es ist ein riesiger Schritt in Richtung Demokratisierung des Wissens, wenn diese Inhalte, die bisher so schwer zugänglich waren, über das Internet in aller Welt abrufbar werden“, meint Rachinger. „Und es bringt auch der Wissenschaft enorme Vorteile.“

Was tun mit den Sprachgrenzen? Die meisten Österreicher hätten im Moment nichts davon, wenn Millionen arabischer, türkischer oder japanischer Bücher frei im Netz stünden. Aber die Übersetzungsprogramme kommen langsam, aber sicher einem weiteren Menschheitstraum näher, der Überwindung der Sprachgrenzen. Die automatische Übersetzung ist schon unvergleichlich weiter, als Gratisversionen auf Google oder Yahoo glauben lassen. Das verdankt sich nicht zuletzt den Textmassen, die das Internet bereithält. In den 1940er-Jahren hielt man es noch für ausreichend, Computer mit Vokabeln und Grammatikregeln zu füttern, um sie in professionelle Übersetzer zu verwandeln. Heute weiß man, dass Sprache viel zu komplex dafür ist. Die Forschung arbeitet nun vor allem statistisch. Auch dafür rafft Google Sprachdaten aller Art an sich, woher immer es sie nur kriegen kann.

 

Nach der Lösung ist vor der Lösung

Wenn das gesamte in Büchern enthaltene Wissen vergangener Jahrhunderte bald im Internet zu finden ist: Wie wird es strukturiert werden, wie werden sich die Suchmöglichkeiten etwa mithilfe des semantischen Webs entwickeln, wie frei wird das Wissen wirklich? Googles Lösung der Menschheitsfrage, wie man das „Wissen der Welt“ allen zugänglich machen kann, wirft neue Probleme auf. Aber das haben Lösungen so an sich.

("Die Presse", Print-Ausgabe, 24.11.2012)

Testen Sie "Die Presse" 3 Wochen lang gratis: diepresse.com/testabo

Mehr aus dem Web

7 Kommentare

Google-Chutzpe

Die eingescannten Bücher sind nicht vollständig lesbar. Ausschnitte können nicht kopiert werden. Aber ein Kaufangebot für irgendwelche Google-Geräte kann angeklickt werden.
Auch in welcher Bibliothek das Buch steht, ist nicht angeführt.
Auf diesem angeblichen altruistischen Weg will Google Geld machen.
Hier ein neuer Versuch der Google-Welt zum Wissensmonopol.
Selbst Journalisten wehren sich nicht.

Sie sind nur dann nicht lesbar,

wenn die Rechte der Autoren noch nicht abgelaufen sind - da gibt es leider keine Möglichkeit.

Re: Sie sind nur dann nicht lesbar,

Bei abgelaufenen Rechten leider nur dann, wenn sie bei Googgle kaufen.
Siehe die Benutzungsbedingungen.
Die ÖNB sieht einem freien Zugang vor. Wahrscheinlich nur theoretisch.

10

urheberrecht und patent

Wären mit max. 20 jahren (eine generation) zu beschränken!
Wer bis dahin seine idee /wissen nicht nutzen bzw. die kosten nicht refinanzieren könne sollte es anderen überlassen. Zum wohle nachfolgender und lebender generationen.
Das wäre ein fortschritt, für alle menschen.

und

was ist mit Rechten von Autoren die noch leben? Ich würde da zuerst gefragt werden wollen...

Re: und

Lesen hilft... z.B. obigen Artikel.

Den Staubsauger scanner gibt es seit 10 Jahren..

...das Geraet wurde an der Uni Graz zur kontaktlosen Digitalisierung von wertvollen Buechern entwickelt (und patentiert)....

AnmeldenAnmelden