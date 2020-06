Stand: 30.06.2020 17:00 Uhr

Wenn der smarte Lautsprecher mit dem Tatort-Kommissar spricht von Svea Eckert, Eva Köhler, Jan Lukas Strozyk und Henning Wirtz

Smartspeaker - sie stehen in vielen Haushalten in Deutschland und hören ständig zu. Doch was hören sie mit? Dieser Frage ist NDR Reporterin Svea Eckert nachgegangen und hat sich aus ihrem Benutzerkonto alle Informationen heruntergeladen, die Amazons smarter Lautsprecher "Echo" über sie gespeichert hat. Immer wieder findet die Reporterin dort Aufzeichnungen privater Gespräche: Kindergeschrei und eine Erzählung über den vergangenen Urlaub finden sich hier und lassen die Belauschte etwas ratlos zurück. Denn das Aktivierungswort "Alexa" ist auf der Aufnahme nicht zu hören.

Forschen beschallen elf Smartspeaker mit TV-Sendungen

Lautsprecher wie Amazons Echo, Googles Home Mini oder Apples Homepod sollten nur auf die festgelegten Aktivierungswörter reagieren: auf "Alexa", "Amazon", "Echo", "Computer", "Ok Google" oder "Hey Siri". Ob das so ist, wollten jetzt Forscher der Ruhr-Universität Bochum und des Bochumer Max-Planck-Instituts für Sicherheit und Privatsphäre wissen und haben dafür ein Experiment entwickelt.

Sie stellten elf Smartspeaker für gut drei Wochen in einen Raum und spielten englisch- und deutschsprachige TV-Sendungen ab, um so eine möglichst realistische Wohnzimmer-Atmosphäre zu schaffen und echte Sprache zu simulieren. Sieben Tage lang beschallte die Forschungsgruppe die Lautsprecher in einer Dauerschleife mit deutschsprachigen TV-Sendungen: "Stranger Things", "Big Bang Theory", "Tatort", "Traumschiff", "Tagesschau".

In sieben Tagen aktivierten sich die Smartspeaker 180 Mal

Das Ergebnis: Beim Abspielen von deutschsprachigen TV-Sendungen schalteten sich die Smartspeaker regelmäßig ein: 180 Mal in sieben Tagen interpretierte einer der Smartspeaker einen Fernseh-Dialog als Aktivierungswort.

Amazons Echo Dot, der auf den Begriff "Amazon" reagieren soll, aktiviert sich, als der Tagesschau-Sprecher das Wetter vorliest: "Am Sonntag Schauer, im Süd-Osten regnet es länger." Die Formulierung "am Sonntag" aktiviert den Smartspeaker, erinnert offenbar an "Amazon". Ähnliches passiert bei "ich schon", das für die Geräte wie das Aktivierungswort "Echo" klingt. Es geschieht beim Tatort, als einer fragt: "Habt ihr die Kugel?", und Googles Home Mini "Ok Google" interpretiert sowie beim Traumschiff, als eine Frau "Daiquiri für alle" ausruft und Apples Homepod "Hey Siri" versteht.

Der Grund für diese versehentlichen Aktivierungen liegt in der Funktionsweise der klugen Lautsprecher, erklärt Dorothea Kolossa. Sie ist Professorin für kognitive Signalverarbeitung an der Ruhr-Universität Bochum: "Ein- und derselbe Mensch sagt das Keyword immer wieder unterschiedlich und auch verschiedene Menschen - mit Dialekten - sprechen Wörter unterschiedlich aus". Damit ein smarter Lautsprecher erkennt, dass er gemeint ist, muss er also auch bei unsauberer Aussprache reagieren. Das macht ihn fehleranfällig und sorgt dafür, dass er auch auf Stimmen aus TV-Sendungen anspricht.

"Künstliche Intelligenz lernt aus Fehlern"

Doch was bedeutet das für die Smartspeaker und deren Nutzung - in Unternehmen sowie in privaten Haushalten? Der Hamburgische Datenschutzbeauftragte Johannes Caspar sieht die Nutzung von Smartspeakern kritisch. Damit ein smarter Lautsprecher, ein Computer, Sprache versteht, muss er lernen. Dahinter steht eine sogenannte Künstliche Intelligenz. Und, so Caspar: "Künstliche Intelligenz lernt aus Fehlern. Insofern ist dieses fehlerhafte hineinhorchen auf Dauer ein Punkt, der immer weniger ein Problem werden dürfte, wenn diese Systeme weiter lernen. Aber im Moment sind wir in einer Situation, in der es bei diesen Systemen sehr häufig Falschaktivierungen gibt."

Welche Medien bieten Inhalte für Amazons Smartspeaker an? Seit der Markteinführung des ersten Smartspeakers von Amazon 2015 sind die Geräte in deutschen Haushalten und auch für Medienhäuser zum Standard geworden. Für Amazons "Echo" finden sich alleine in der Rubrik "Nachrichten" mehr als 800 eigens für den Sprachassistenten entwickelte Apps, darunter auch die Apps großer Medien: Die Tagesschau, ZDF Heute, das Handelsblatt, der Spiegel, der WDR, der NDR - sie alle liefern Nachrichten für Amazons smarten Lautsprecher.

Weniger Falschaktivierungen bei Apple und Google

Das Experiment zeigt: Bei Apple und Google gibt es weniger Falschaktivierungen als bei Amazon. Das liegt vor allem an der Art der Aktivierungswörter. Gerade bei den deutschsprachigen Tests hat sich gezeigt, dass "Computer", "Amazon" und "Echo" sich als Aktivierungswort nicht eignen. Besser ist es, im Deutschen das Aktivierungswort "Alexa" auszuwählen - um die fehlerhaften Aufzeichnungen zumindest zu minimieren.

Die Firmen kennen das Problem: Auf NDR Anfrage erklärt Google, englischsprachige Nutzer könnten die Kontrolle über die Empfindlichkeit der Hotword-Erkennung ihres Geräts entsprechend den Bedürfnissen der Nutzer einstellen - außerdem würden Sprachaufnahmen nur manuell verarbeitet, wenn Nutzer ihre Sprach- und Audioeinstellungen aktiviert haben. Apple erklärt: "Wir konzentrieren uns darauf, so viel wie möglich auf dem Gerät selbst zu erledigen und die Menge an Daten, die wir mit Siri sammeln, zu minimieren." Außerdem verwendeten sie eine zufällige Kennung, um Daten während der Verarbeitung zu verfolgen, statt die Apple-ID oder die Telefonnummer, so der Konzern.

Amazon verweist darauf, dass die Sprachaufzeichnungen niemals mit kundenspezifischen Informationen verknüpft würden. Warum sie aber so schwache Aktivierungswörter wie "Computer" oder "Amazon" anböten? "Wir wollen, dass die Kunden die Möglichkeit haben, das für sie am besten geeignete Aktivierungswort zu wählen", heißt es schriftlich.

Privatsphäre-Modus könnte eine Lösung sein

Eine Lösung für das versehentliche aufzeichnen könnte aus Sicht der Forscher ein einfacher Sprachbefehl sein: "Alexa, ignoriere mich". Alles Gesprochene soll dann privat bleiben - ausschalten könnte man diesen Privatsphäre-Modus dann mit einem Sicherheitssprachbefehl, in dem man drei Mal das Aktivierungswort laut ausspricht, als würde man den Hollywood-Film-Geist Beetlejuice rufen: "Alexa, Alexa, Alexa".

