Twitter-Archiv: Bibliothek der Geschwätzigkeit

(c) REUTERS (MAX ROSSI)
  • Drucken

Die US Library of Congress archiviert alle veröffentlichten Tweets der Welt und will sie der Öffentlichkeit zugänglich machen, jedoch noch ohne Idee, wie man sie aufbereitet. Wem nützt das eigentlich?

Noch kann keiner auf die unfassbar große Datenmenge zugreifen, doch die Rechercheanfragen stapeln sich bereits, behauptet die Library of Congress in einer Blognachricht auf ihrer Homepage. Nicht ohne Stolz präsentiert sie ihre jüngste Anschaffung: die Twitter Collection. Im April 2010 hatte die zweitgrößte Bibliothek der Welt (größte ist die British Library in London) mit dem Kurznachrichtendienst Twitter vertraglich vereinbart, alle bis dahin veröffentlichten Tweets zu archivieren und der Öffentlichkeit zugänglich zu machen.

Seither war es ruhig geworden, mehrere Blogs hatten vermutet, das Projekt wurde wegen Undurchführbarkeit wieder aufgegeben. Doch weit gefehlt: In zwei Tranchen hat die auf Social-Media-Daten spezialisierte amerikanische Firma Gnip seither die unglaubliche Datenmenge von 171 Milliarden Kurznachrichten an die Bibliothek übermittelt. Und täglich werden es mehr, denn der Vertrag wurde unlängst verlängert. Nun fließt alle drei Tage eine Milliarde neuer Meldungen ins Library-Datenarchiv. Derzeit ergibt das ein 133,2 Terabyte großes Archiv der Geschwätzigkeit.

Rechenschieber für die Tweets

Dass die Daten derzeit noch nicht zugänglich sind, liegt daran, dass die Library of Congress noch immer an einer Technologie tüftelt, mit der die Datenmenge sinnvoll genutzt werden kann. Nach einem modernen Rechenschieber für die Tweet-Auswertung. Noch würde die Suche in der Datenmasse 24 Stunden dauern, behaupten Datenbankexperten. Aber wem soll dieses um täglich eine halbe Milliarde neuer Nachrichten wachsende Archiv nützen? Wozu Kurznachrichten archivieren, die vielleicht ewig im Internet gespeichert sein werden? Die Library of Congress hat mit Fragen wie diesen gerechnet und gibt Antworten darauf: Die Idee sei gereift, weil sich gezeigt hätte, dass sich soziale Medien für viele Menschen als wichtigstes Werkzeug der Kommunikation etabliert haben. Mit dem Archiv wolle man künftigen Generationen und Forschern die Möglichkeit geben, „sich ein gründlicheres Bild von heutigen Kommunikationsformen, Dialogen, Trends“ zu machen.

Vermutlich ist der überwiegende Teil der gesammelten Nachrichten von überschaubarer Relevanz für die Nachwelt, in ihrer Gesamtheit könnten sie aber interessante Erkenntnisse bringen. Und vor allem: Wie soll man die Tweets speichern, wenn nicht in ihrer Gesamtheit? Wer würde sich die Mühe machen, die vielleicht denkwürdigen darunter, wie jenes von Barack Obama nach seiner Wiederwahl im November („Four more years“), auszusieben? awa

("Die Presse", Print-Ausgabe, 09.01.2013)

Lesen Sie mehr zu diesen Themen:


Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.