Datenanalyse: Wer ist besser, Werder Bremen oder St. Pauli? Satte zehn Punkte liegt Zweitliga-Tabellenführer FC St. Pauli vor Werder Bremen und steht im DFB-Pokal im Achtelfinale. Am Sonnabend (13.30 Uhr) treffen die Nordclubs aufeinander. Anhand der Daten von Global Soccer Network (GSN) vergleicht der NDR in jedem Mannschaftsteil die Schlüsselspieler miteinander.

Tor, Abwehr, Mittelfeld und Sturm: Welche Akteure prägen das Spiel von Werder Bremen und des FC St. Pauli und wie geht der direkte Vergleich aus? Sticht Guido Burgstaller im Duell der Angreifer Marvin Ducksch aus? Und wer ist eigentlich der bessere Torhüter: Michael Zetterer oder Nikola Vasilj?

Maßgeblich bei der Spielerbewertung ist vor allem der sogenannte GSN-Index. In diesem werden mehrere Zehntausend Einzeldaten aus der gesamten Karriere kategorisiert und gewichtet. Ein Algorithmus generiert anhand dieser Daten einen Wert auf einer Skala von 0 bis 100, der die Leistungsstärke des Spielers beschreibt.

Das steckt hinter dem GSN-Index Vier-Säulen-Prinzip:

1. "fußballerische Eigenschaften": Technik, Spielübersicht oder der erste Kontakt: Einschätzungen über 130 fußballspezifische Eigenschaften von mehr als 300 Scouts weltweit.

2. "fußballerisches Potenzial": Wo werden Spieler besser, wo stagnieren sie oder entwickeln sich zurück? Ein Algorithmus analysiert Daten aus der ersten Säule und vergleicht Spielertypen.

3. "Performance auf dem Spielfeld": Tore, Pässe, Fouls, Schüsse oder auch Abseitspositionen: die Spiel-Basisdaten und weiterführende Analysen wie "Expected goals" oder "Action scores" werden durch einen Algorithmus in einen übergeordneten Kontext gesetzt - zum Beispiel positionsbezogen.

4. "Spielniveau": Jede Mannschaft oder Liga hat einen Zahlenwert, der ihre Stärke bemisst. Oberliga oder Champions League: Umso höher das Spielniveau des Gegners, desto positiver wirkt es sich auf den GSN-Index aus. Bewertungs-Skala:

85 - 100: Weltklasse

70 - 85: internationale Klasse

60 - 70: Durchschnitt Bundesliga bzw. der Top 5 Ligen

50 - 60: Durchschnitt 2. Bundesliga

40 - 50: Durchschnitt 3. Liga

30 - 40: Durchschnitt Regionalliga Zwei GSN-Index-Werte:

aktueller GSN-Index: zeigt die aktuelle, allumfassende Qualität eines Spielers basierend auf den Daten der vier Säulen und Algorithmus-Berechnungen.

möglicher GSN-Index: Künstliche Intelligenz ermittelt anhand der Daten das bestmögliche, zukünftige Leistungsniveau eines Spielers.

Die Werte sind objektiv miteinander vergleichbar. Ein Spieler mit einem GSN-Index von 60 repräsentiert beispielsweise unteren Bundesliga-Durchschnitt. Eine Zweitliga-Spitzenmannschaft sollte also viele Spieler in ihren Reihen haben, die diesen Wert oder einen nur wenig geringeren erreichen, wenn sie um den Aufstieg mitspielen will. Wie sieht es bei Werder und St. Pauli aus? Welche Spieler sind die Leistungsträger?

Tor: Michael Zetterer vs. Nikola Vasilj

Zetterer ist überraschend in dieser Saison Werder Bremens Nummer eins. Zunächst profitierte er von der Verletzung des langjährigen Stammkeepers Jiri Pavlenka. Doch seit einigen Wochen ist der Tscheche wieder fit und kommt trotzdem nicht an Zetterer vorbei.

Anhand der Qualität der Torschüsse ermittelt GSN den Wert "Expected goals on target". Heißt: Wie viele Gegentreffer hätte ein Keeper rechnerisch bekommen dürfen. Im Falle Zetterers liegt dieser Wert bei 13,67, tatsächlich hat er jedoch 17 Gegentore hinnehmen müssen. Der 26-Jährige hat demnach drei Treffer mehr bekommen, als er hätte bekommen dürfen. Bei Vasilj beträgt diese Differenz lediglich 0,47. Er hat also fast alle Bälle gehalten, die er halten musste.

Der GSN-Index fällt bei Vasilj entsprechend höher aus. Er hat einen Wert von 63,31 verglichen mit Zetterers 51,42.

Das "Expected goals"-Modell "Expected goals" sind "zu erwartende Tore" und werden anhand eines Datenmodells berechnet, in das eine Vielzahl von Faktoren einfließt - unter anderem von wo auf dem Platz der Abschluss erfolgte, wie der Winkel zum Tor war und wie viele Gegenspieler noch zwischen Ball und Tor standen. Jede Torchance erhält dabei einen Wert zwischen 0 und 1, um die Wahrscheinlichkeit zu bestimmen, mit der der Ball von diesem Punkt aus im Tor landet. "Expected goals"-Werte sind so aussagekräftiger als die normale Torschuss-Statistik, die alle Abschlüsse gleich behandelt.

Abwehr: Lars Lukas Mai vs. Jakov Medic

Ein (statistisches) Duell auf Augenhöhe liefern sich die beiden Innenverteidiger. Mai hat bislang mehr Spiele auf Bundesliga- und Zweitliga-Niveau bestritten als Medic. Deshalb ist sein GSN-Index (64,75) höher als der von Medic (53,82). Die relevanten Werte für diese Saison sind bei den Defensivspielern jedoch annähernd identisch.

Beide gewinnen mehr als zwei Drittel ihrer Zweikämpfe (Mai: 66,67, Medic: 68,75 Prozent), wobei Medic bessere Werte bei Kopfballduellen (65,71 zu 58,33 Prozent) hat. Dafür ist die Passquote von Mai mit gut 90 Prozent um knappe fünf Prozentpunkte besser als die des Hamburger Defensivmannes.

Einen Treffer haben beide in dieser Saison in der Liga noch nicht erzielt, Medic schaltet sich aber häufiger in die Offensive ein als Mai. Zwei Assists verbuchte der Kroate bereits, zudem hat er statistisch gesehen in jedem zweiten Spiel eine Torchance. Der Werder-Verteidiger tritt offensiv hingegen so gut wie gar nicht in Erscheinung.

Mittelfeld: Romano Schmid vs. Daniel-Kofi Kyereh

Kyereh ist mit acht Assists der beste Vorlagengeber der Zweiten Liga - ein Spieler, der das Risiko liebt, eingeht und dafür belohnt wird. St. Pauli ist das Team, das am häufigsten ins Dribbling geht (27,5 pro Spiel) und Kyereh (7) hat einen erheblichen Anteil daran. Gute 60 Prozent dieser Duelle gewinnt der 25-Jährige dabei.

Die Kehrseite der riskanten Spielweise: Kyereh verliert in jeder Partie durchschnittlich elf Mal den Ball. Doch einem Freigeist wie ihm verzeiht Trainer Timo Schultz dies sicherlich, schließlich hat Kyereh nicht nur acht Tore vorbereitet, sondern auch drei geschossen. Sein GSN-Index von 60,02 (unterer Bundesliga-Durchschnitt) zeigt, dass er in der Zweiten Liga ein sehr guter Spieler ist.

Was ist Global Soccer Network (GSN)? 2013 gegründet ist GSN eine der führenden Datenscouting-Agenturen weltweit mit ca. 100 Klienten auf allen fünf Kontinenten, darunter RB Leipzig, Inter Mailand, Chelsea London, Manchester City, Paris Saint Germain oder Atletico Madrid. Gründer und Geschäftsführer ist Dustin Böttger, der früher als Talentscout unter anderem für TSG Hoffenheim und den SV Sandhausen gearbeitet hat. Was macht GSN? Hauptbestandteil der Arbeit von GSN ist das Analysieren und Einschätzen von ca. 500.000 Fußballspielern weltweit sowie aller relevanten Clubs und Wettbewerbe basierend auf Einschätzungen von Scouts, Big Data, Algorithmen und künstlicher Intelligenz. Was steckt genau hinter den GSN-Daten? Die GSN-Datenbank greift in seinen Analysen mittlerweile auf ungefähr 35 Milliarden einzelne Datenpunkte zurück. Grob zusammengefasst gibt es dabei vier Bereiche:

"Persönliche Basisdaten": Daten wie Größe, Gewicht oder Alter der Spieler werden erfasst.

"Scoutingdaten": Ein weltweites Scoutingnetzwerk liefert Einschätzungen zu ca. 130 fussballspezifischen Eigenschaften (technisch, taktisch, physisch, mental) von Spielern.

"Performance-Daten": Jede Aktion jedes Spielers während eines Spiels wird erfasst - u.a. Pässe, Torschüsse, Sprints oder auch Fouls.

"Advanced analytics": Damit sind Datenmodelle gemeint, die auch mit Hilfe von künstlicher Intelligenz berechnet werden. Diese Modelle sollen den "Performance-Daten" Kontext verleihen. Ein Beispiel ist der sogenannte "Action score", bei dem berechnet wird, wie positiv oder negativ jede Aktion eines einzelnen Spielers für das jeweilige Team ist.

Werders Mittelfeld strahlt hingegen zu wenig Torgefahr aus. Insgesamt drei Treffer gehen auf das Konto der Mittelfeldakteure. Romano Schmid konnte sich noch gar nicht in die Torschützenliste eintragen. Deshalb verwundert es nicht, dass seine Offensivwerte schlechter ausfallen als bei Kyereh.

Ganz anders sieht es jedoch bei einem Blick auf die Zweikampfstatistik aus. Hier ist Schmid besser als der St.-Paulianer. Er gewinnt die Hälfte seiner Duelle (Kyereh nur 42,33 Prozent). Vor allem aber ist der Bremer, dessen GSN-Index bei 63,81 liegt, im Defensivzweikampf klar besser (47,83 zu 31,38 Prozent) und so auf andere Art und Weise wertvoll für sein Team.

Sturm: Marvin Ducksch vs. Guido Burgstaller

Burgstaller ist erst seit einem guten Jahr beim FC St. Pauli, firmiert bei den Fans aber bereits als "Fußballgott" - mit einigem Recht, wenn man auf seine Leistungsdaten schaut: Zehn Treffer und drei Assists sprechen an sich schon eine deutliche Sprache. Ein detaillierter Blick untermauert seine ganze Klasse aber noch einmal: Burgstaller hat 39,57 Prozent seiner Torchancen verwertet: ein überragender Wert, der sogar besser ist als der von Bayern Münchens Tor-Maschine Robert Lewandowski (39,35). Wobei Schalkes Simon Terodde und Phillip Tietz (Darmstadt 98) in Liga zwei eine noch bessere Quote haben als Burgstaller.

Im Vergleich zu Ducksch ist die herausragende Chancenverwertung der große Vorteil des St.-Paulianers. Der Bremer hat zwar mehr Torgelegenheiten als der Österreicher, aber nur 15,52 Prozent auch verwertet. Deshalb stehen beim Werder-Angreifer auch erst fünf Saisontreffer in der Statistik.

Auffällig ist zudem, dass Burgstallers Spiel physischer ist. Er bestreitet durchschnittlich deutlich mehr Zweikämpfe pro Partie (17 zu 10) und hat die bessere Zweikampfquote (35,29 zu 32 Prozent). Noch deutlicher ist sein Vorteil im Kopfballspiel. Er gewinnt 33,9 Prozent seiner Luftduelle, Ducksch lediglich 22,78 Prozent.

Burgstallers herausragenden Leistungen in dieser Saison und seine langjährige Erfahrung in der Bundesliga und Zweiten Liga resultieren in einem GSN-Index von 67,89. Das ist oberer Bundesliga-Durchschnitt. Duckschs Wert liegt knapp darunter (64,01).

Auch wenn St. Pauli als Zweitliga-Spitzenreiter klar favorisiert in das Nordduell geht, hat Werder reichlich individuelle Klasse in den eigenen Reihen. Im Teamvergleich liegt der Tabellenzehnte mit den Hamburgern fast gleichauf. Hinzu kommt, dass Werder bisher zu Hause punkt- und torgleich mit den St. Paulianern auf fremden Plätzen ist - beide Mannschaften haben bei 8:7 Treffern sieben Zähler geholt. Es dürfte also ein enges Match werden.

