Stand: 03.01.2017 19:00 Uhr  | Archiv

Big Data: Gefahren für Journalisten

von Melanie Stein
Bild vergrößern
Der Informatiker David Kriesel konnte durch die systematische Analyse von veröffentlichen Artikeln viele Erkenntnisse über "Spiegel Online" gewinnen.

Auf dem Hackerkongress 33c3 in Hamburg ist er einer der Lieblinge gewesen: David Kriesel speichert seit zwei Jahren alle Artikel von "Spiegel Online". Seine Analyse demonstrierte, was man mit solchen Daten anfangen und herausfinden kann. Deutlich wurde auch, dass Daten allein wenig aussagekräftig sind. Bei Vorurteilen sind Fehlinterpretation vorprogrammiert.

"Was ihr veröffentlicht, entscheidet der Gegner"

"Wenn ihr etwas online stellt, dann wisst ihr nicht, was das ist - das entscheidet der Gegner“, sagte David Kriesel nach seinem Vortrag auf dem Hamburger Hackerkongress zu ZAPP. Der Wissenschaftler hat zwei Jahre lang Artikel von "Spiegel Online" heruntergeladen. Mit seiner Analyse von knapp 100.000 Beiträgen auf dem Kongress des "Chaos Computer Clubs" wollte er auf die Gefahr von Big Data, also riesigen Datenmengen, aufmerksam machen. 

Mittlerweile gehört die Auswertung des Informatikers mit mehr als 20.000 Youtube-Klicks zu den erfolgreichsten Talks des 33c3-Kongresses. Sein Vortrag ist nicht nur unterhaltsam und lehrreich. Er enthält auch eine Medienkritik, die derzeit auf vielen Webportalen Zuspruch erfährt. ZAPP sprach mit "Spiegel Online" über die Thesen, die der Wissenschaftler aus seinem Datensatz zieht.

"Kulturredakteure schlafen länger"

"Wer von euch denkt, dass die Leute aus dem Kulturressort morgens gern ein bisschen länger pennen, als die anderen", fragte Kriesel das Publikum im Hamburger Kongresszentrum. Die Mehrheit der 1.600 Zuschauer im Saal hob die Hand. Mit Blick auf seine Daten sieht Kriesel die Annahme bestätigt: "Aber zum Ausgleich gehen die auch früher nach Hause.“

Indem der Informatiker die gespeicherten Artikel nach Kategorien wie Veröffentlichungszeitpunkt, Artikellänge oder Ressort auswertet, kommt er zu Schlüssen wie diesen. Das Bild vom gemütlichen Kulturredakteur kann die Redaktion selbst aber nicht bestätigen: "Viele Ressorts bei 'Spiegel Online' arbeiten im Schichtbetrieb: Klassische News-Ressorts wie Politik, Wirtschaft und Panorama starten früher und sind auch länger besetzt“, sagt Verlagssprecher Michael Grabowski. Dass ein Ressort wie "Kultur" nicht auf minutengenaue Aktualität setze, empfindet die Redaktion als "normal und sinnvoll". Die unterschiedlichen Veröffentlichungszeitpunkte kommen nach Unternehmensangaben also allein wegen des Schichtbetriebs zustande.

Schlafen Kulturredakteure länger?
"Russenbashen ist erlaubt"

Brisant ist vor allem Kriesels Interpretation der Kommentierbarkeit von Artikeln: "Zu Nahostkonflikt und Israel hat man bei fast allen Artikeln die Klappe zu halten", so Kriesel in seinem Vortrag. "Russenbashen" sei hingegen erlaubt. Mithilfe der Verschlagwortung von Artikeln hat der Informatiker Themenbereiche heraus gefiltert, die selten kommentiert werden dürften. Seine Schlussfolgerung: "Das sieht insgesamt so aus, als verböte Spiegel Online zu denjenigen Themen die Kommentierung, bei denen zu erwarten ist, dass die Meinungen der Leser politisch nicht opportun sind."  Kriesel glaubt, die "westliche Filterbubble" anhand der Daten sichtbar gemacht zu haben.

Der Verlag sieht das anders: "Die Inhalte der Forum-Postings zur Ukraine-Krise waren vielfach pro-russisch, pro-Putin, anti-amerikanisch und gegen Angela Merkel gerichtet"“, sagt Grabowski und relativiert somit die Annahme, das Portal würde unerwünschte Lesermeinungen filtern. "Wir aktivieren das Forum bei Themen wie Israel, Islamismus, Flüchtlinge, Terror und Justiz im Gros der Fälle vor allem deswegen nicht, weil wir 'Hate Speech' nicht dulden wollen und können, und diese Themen leider anfällig für Hetzkommentare sind."

Daten allein schaffen keine Fakten

Auch hinsichtlich der Unternehmensstrategie sind sich Kriesel und "Spiegel Online" uneins. Laut Kriesel dampfe der Verlag Ressorts mit traditionell längeren Artikeln wie "Wissenschaft" oder "UniSpiegel" zugunsten von Output-starken Rubriken wie "Politik" ein. "Spiegel Online" legt es eher auf Reichweite und Abdeckungsbreite an, als auf Tiefe“, so der Computerwissenschaftler. Der Verlag hingegen erklärt, es sei zu kurz gesprungen, die Artikelmengen und -längen in direktem Zusammenhang zu Personalstärken zu setzen: "Der Rückgang der Textmenge im Ressort 'Wissenschaft' kann auch dadurch erklärt werden, dass die Recherchetiefe hier gestiegen ist“, so der Unternehmenssprecher.

Kriesel selbst sagte nach seinem Vortrag gegenüber ZAPP: "Alle Folgerungen, die ich heute aus den Daten ziehe, können theoretisch auch falsch sein." In seinem Vortrag wies er außerdem darauf hin, dass die Interpretation von großen Datenmengen in der Hand des Gegners liege. Doch auch wenn sich Kriesel wohl kaum als Gegner von "Spiegel Online" betrachtet, verdeutlichen seine Ausführungen, dass Datenmengen ohne eine Prüfung von Sachverhalten zu Fehldeutungen führen können - vor allem dann, wenn Vorurteile im Spiel sind.

"Kriesels Vortrag zu Recht einer der Lieblinge"

Insgesamt zeigte sich die Redaktion von "Spiegel Online" jedoch zufrieden mit Kriesels Analyse. "Der Vortrag war zu Recht einer der Lieblinge auf dem 33c3", so Sprecher Michael Grabowski. "Er liefert schöne bildhafte Beispiele dafür, was man aus öffentlich verfügbaren Daten an Erkenntnissen gewinnen kann."

Besonders aufschlussreich empfindet der Verlag die Erkenntnis, dass aus "scheinbar harmlosen Metadaten sehr sensible, völlig private Informationen gewonnen werden können." Kriesel hatte anhand der Publikationszeitpunkte von Autoren abgeleitet, wann welcher Autor Urlaub nahm. Und vor allem: Wer gemeinsam Urlaub machte.

Weitere Informationen

Das Internet der Dinge und wie man es einhegt

Die Hacker auf dem Jahrestreffen des Chaos Computer Clubs in Hamburg sehen das Internet der Dinge kritisch. Sie wollen mehr Aufklärung - und forderten Warnhinweise etwa auf Toastern. mehr

Hacker-Treffen: Den Sicherheitslücken auf der Spur

Bis Freitag trifft sich die Hacker-Szene in Hamburg, um über Computer-Trends zu diskutieren. Mehr als 12.000 Teilnehmer werden beim Chaos Communication Congress erwartet. (27.12.2016) mehr

Dieses Thema im Programm:

ZAPP | 30.12.2016 | 15:20 Uhr

Mehr Nachrichten

01:45
Hamburg Journal
02:32
Schleswig-Holstein Magazin
00:36
Hallo Niedersachsen