Stand: 05.06.2020 06:00 Uhr

"Google Trends": Such-Daten nicht aussagekräftig

von Eva Köhler, Isabel Lerch, Marvin Milatz, Jan Strozyk und Claus Hesseling

Bild vergrößern
Doch nicht so zuverlässig? Eine Analyse von Google Trends zeigt, dass diese Informationen kaum ernsthafte Rückschlüsse zulassen.

Unter dem Stichwort "Google Trends" stellt der Tech-Konzern Statistiken zum Suchverhalten seiner Nutzerinnen und Nutzer ins Internet. "Wenn ihr wissen wollt, was im Netz gerade los ist, guckt ihr auf Google Trends" - so klang es, als Google den Dienst im Zuge der Bundestagswahl 2017 in einem Video präsentierte. Die Informationen bewirbt der Konzern als Gradmesser dafür, was Menschen in bestimmten Regionen aktuell interessiert.

Wissenschaftler nutzen diese Daten, Wirtschafts-Experten und Ermittler ebenso. Auch in Redaktionen ist Google Trends als Recherche-Werkzeug beliebt. Als in den USA im Jahr 2016 ein neuer 20-Dollar-Schein mit dem Konterfei der Aktivistin Harriet Tubman eingeführt wurde, titelte die "Washington Post": "Wenn Sie nicht wissen, wer Tubman ist, sind Sie nicht allein" - Grundlage für den Artikel waren Daten von Google Trends. Und kurz nach dem Brexit-Referendum 2016 resümierte die "Welt" auf Grundlage von Google Trends, dass die Briten sich wohl erst rund zwei Stunden nach Schließung der Wahllokale Gedanken über die historische Dimension des EU-Referendums machten.

Daten nicht zuverlässig

Im Rahmen seiner groß angelegten "News Initiative" geht der Konzern aktiv auf Journalistinnen und Journalisten zu und vermarktet Google Trends als Recherche-Mittel. Offenbar mit wachsendem Erfolg: Dutzende Artikel beschäftigten sich im Zuge der Corona-Krise mit den Trend-Daten zum Suchverhalten der Deutschen. Mal humorvoll: die "Badische Zeitung" etwa wertete aus, in welchen Regionen nach "Toilettenpapier" gesucht wird, und in welchen nach "Klopapier". Mal ernsthafter, wie das Jugendportal "bento", das darüber schrieb, "wie Corona unseren Alltag verändert hat".

Allerdings ist fraglich, ob die von Google gelieferten Daten überhaupt eine Aussagekraft haben: Journalisten und Journalistinnen des NDR haben zusammen mit dem Big-Data-Beratungsunternehmen "Hase & Igel" sowie Wissenschaftlern der Universitäten Oldenburg und Hannover Hinweise darauf gefunden, dass die Daten, die Google Trends anzeigt, nicht zuverlässig sind. Immer wieder führten identische Suchabfragen, durchgeführt zu verschiedenen Zeitpunkten, zu zum Teil eklatant unterschiedlichen Ergebnissen. Reproduzierbar waren die Ergebnisse von Google Trends nur in bestimmten Konstellationen.

Landeskriminalämter nutzen Google Trends

Dabei klingt die Mechanik von Google Trends bestechend einfach: Der Konzern, der als Quasi-Monopolist Milliarden von Suchanfragen im Internet verarbeitet, nutzt die dadurch gesammelten Informationen, um zu zeigen, für was sich Menschen interessieren. Ist das Stichwort "Trump" gerade besonders beliebt? Suchen die Menschen in einer Region gerade häufig nach "trockener Husten" oder "Fieber"? Bis in das Jahr 2015 betrieb Google selbst sogar einen Dienst namens "Flu Trends", der den Verlauf von Grippewellen voraussagen sollte. Der Service wurde eingestellt, wohl weil die Daten nicht zuverlässig gewesen sind.

Das ist mehr als eine Spielerei: Die daraus gewonnenen Vergleichswerte veröffentlichte beispielsweise der Sachverständigenrat Wirtschaft für einen Corona-Report. An der Heinrich-Heine-Universität Düsseldorf haben Forscher mithilfe von Google Trends eine Analyse zum Verlauf von Nasennebenhöhlenentzündungen durchgeführt. Auf Anfrage des NDR erklärte das Landeskriminalamt Bayern, Recherchen mit Google Trends würden "regelmäßig im Rahmen von Ermittlungen durchgeführt", auch wenn die Ergebnisse im Vergleich zu anderen Methoden einen geringen Stellenwert aufweisen. Andere Landeskriminalämter bestätigten den Einsatz ebenfalls.

Starke Schwankungen

Die vom NDR und den anderen Analysten nun entdeckten Diskrepanzen in den Ergebnissen von Google Trends werfen die Frage auf, inwiefern die Daten überhaupt etwas über das Suchverhalten der Nutzer aussagen. In Hunderten automatisiert abgerufenen Stichproben konnten Reporterinnen und Reporter für einige Stichworte starke Schwankungen bei den Ergebnissen feststellen, auch bei historischen Daten.


Sah die Auswertung an einem Tag noch so aus, als hätten Menschen in der Vorwoche einen Suchbegriff stark abgefragt, zeigte der Trend für dasselbe Wort und den identischen Abfrage-Zeitraum am nächsten Tag nach unten. Die Analyse bezieht sich zunächst auf die Google-Trend-Daten für Deutschland. Es gibt in den Daten aber auch Hinweise darauf, dass auch Google Trends in den USA - etwa zum Suchbegriff Donald Trump - vom gleichen Phänomen betroffen sein könnte. Hier sind die Schwankungen vergleichsweise gering, aber dennoch vorhanden.

Das Problem besteht offenbar darin, dass Google nicht in der Lage ist, alle Suchanfragen systematisch aufzubereiten und daraus die Beliebtheit einzelner Begriffe zu errechnen. Daher behilft sich der Konzern damit, nur Stichproben auszuwerten. Aus diesen sogenannten Samples rechnet Google dann auf das vermeintliche Gesamt-Volumen hoch - offenbar sind die Samples derart unterschiedlich, dass sie nicht für einen Vergleich taugen.

Daten könnten in die Irre führen

Matthias Spielkamp beobachtet für die Organisation Algorithmwatch Tech-Konzerne wie Google. Dass die Daten von Google Trends teilweise unzuverlässig sind, überrascht ihn nicht. "Wir beobachten das ständig - es wird angekündigt, als könnte da nichts schief gehen und als seien die Dinge immer 100-prozentig zuverlässig. Wenn man sie dann aber testet, stellt man fest: Das ist überhaupt nicht so." Deswegen fordert Spielkamp Zugang zu den Daten der Plattform, "damit Außenstehende etwa herausfinden können: Läuft da was schief?". Eine Forderung, der Google bislang nach eigenen Angaben aus Gründen des Geschäftsgeheimnisses und des Datenschutzes nicht nachkommt.

Auf Anfrage erklärt Isabelle Sonnenfeld, Leiterin des Google News Lab: "In der Google-Suche werden jeden Tag Milliarden von Suchanfragen bearbeitet, deshalb ist die in Google Trends verwendete Stichprobe ausreichend. Würden wir in Google Trends nicht mit Stichproben sondern dem gesamten Datensatz aller Suchanfragen arbeiten, wäre eine Verarbeitung aufgrund der Datenmenge nicht mehr möglich."

Zu den Schwankungen schreibt Sonnenfeld: "Wenn ein Suchbegriff in der betrachteten Periode nur ein sehr geringes Suchvolumen aufweist, kann es hier zu kleinen Abweichungen auch in abgeschlossenen Zeiträumen kommen." Dazu gibt es auch andere Einschätzungen, etwa die von Jan Schoenmakers, Geschäftsführer bei der Agentur "Hase & Igel". Gerade im Bereich Marketing und Webseiten-Optimierung verließen sich viele Menschen beruflich auf Google-Trends-Daten. "Wenn ich darauf Entscheidungen aufbaue, kann ich in die Irre geführt werden", so Schoenmakers.

Weitere Informationen

Corona: Google wertet Bewegungsdaten aus

Die Hamburgerinnen und Hamburger strömen trotz Ausgangsbeschränkungen in die Parks und Grünanlagen. Das zeigt eine Auswertung der gesammelten Bewegungsdaten von Google. mehr

Dämpfer für Google durch Hamburgs Datenschützer

Google stoppt vorerst die Auswertung von Aufnahmen aus Sprachassistenten durch Mitarbeiter. Damit reagiert der Internet-Konzern auf einen Vorstoß des Hamburgischen Datenschutzbeauftragten. mehr

Schutzmacht: Verlage EU-weit gegen Google

Eine EU-weite Reform des Urheberrechts und die Einführung eines Leistungsschutzrechtes sollen Verlage endlich am Gewinn von Google & Co. beteiligen. Doch die Pläne sind umstritten. mehr

Schlau: Google & Co. ködern Journalismus

Mit "Instant Articles" und der "Digitale News Initiative" buhlen Facebook bzw. Google um die Medienhäusern, um hochwertigen Content zu bekommen. Zum Stand der Dinge. mehr

Dieses Thema im Programm:

NDR Info | Aktuell | 05.06.2020 | 14:00 Uhr