9. Januar 2013

170 Milliarden Tweets - die Library of Congress hat Probleme mit der Archivierung

Eine amerikanische Zeitung nennt es schlicht den "Turmbau von Babbel" - statt "Babel".

Die US-Bibliothek "Library of Congress" hat bereits vor einiger Zeit beschlossen, alle öffentlich abgesetzten Tweets zu archivieren, die seit der Gründung von Twitter 2006 verschickt wurden. Es sind insgesamt 170 Milliarden - und jeden Tag kommt eine halbe Milliarde hinzu. Die damit beauftragte Firma hat Ende 2012 nun ein zweites Datenpaket an die Bibliothek übermittelt. Es ist über 100 Terabyte groß. Und diese Datenmenge bereitet der Bibliothek jetzt Schwierigkeiten. Um dieses Archiv zugänglich zu machen, würde sie Tausende Server benötigen. Derzeit dauert eine Suchanfrage in den Tweets 24 Stunden.

Ziel des Projekts ist es, die Kommunikationsgewohnheiten der Menschen im 21. Jahrhundert erforschen zu können - so wie Historiker heute alte Briefe oder Zeitungen auswerten.

"The Tower of Babble" in der "Chicago Tribune"

Die Online-Ausgabe der "Süddeutschen Zeitung" kommentiert die Archivierung von Tweets

Quelle: DRadio Wissen Lizenz: Creative Commons Licence: Namensnennung, keine kommerzielle Nutzung, keine Bearbeitung (BY-NC-CD)