Bundesliga-Start

Wie Daten den Ausgang der Bundesliga-Saison vorhersagen

Thomas Müller vom FC Bayern hat in der Bundesliga den höchsten Goalimpact-Wert.

Foto: dpa

Thomas Müller vom FC Bayern hat in der Bundesliga den höchsten Goalimpact-Wert.

Ein Algorithmus errechnet schon vor dem ersten Spieltag die Bundesliga-Abschlusstabelle - und prognostiziert Langeweile an der Spitze.

Berlin. Der Mann, der die Zukunft des Fußballs kennt, hat eigentlich nicht besonders viel Ahnung vom Spiel. Wenn Jörg Seidel eine Partie sieht, und das kommt nur bei den großen vor, dann kann er nicht erkennen, welcher Spieler gut ist und warum. Der 45-Jährige schaut dann in seine Datenbank, in der 400.000 Profis aus über 100 Ländern katalogisiert sind, und findet dort, was schwer zu beschreiben ist: den wahren Wert eines Spielers für sein Team. Da steht dann zum Beispiel, dass Salomon Kalou der wichtigste Profi für Hertha BSC ist, und dass Stuttgarts Benjamin Pavard, der gerade Weltmeister mit Frankreich wurde und für den die Bayern bereit sein sollen, in einem Jahr 35 Millionen Euro auszugeben, überbewertet wird.

Jörg Seidel ist Physiker und hat früher Handball gespielt. Heute arbeitet er als Manager eines Hamburger Energieunternehmens. Nebenbei aber hat Seidel eine Firma gegründet, die nicht nur gute von schlechten Fußballern unterscheidet, sondern auch den Ausgang einer ganze Saison voraussagt. Goalimpact (englisch für Toreinfluss) heißt das Unternehmen, und so heißt auch die Einheit, in der die Stärke eines Spielers und mithin einer Mannschaft gemessen wird. In den moderne Fußball haben allerhand Daten Einzug erhalten. Von „Packing“, wobei es um die überspielten Spieler geht, bis „Expected Goals“ über alle möglichen erhobenen Lauf-, Zweikampf- und Passstatistiken wird das Spiel komplett vermessen. Aber anders als die viele andere Analyse-Werkzeuge ermittelt Goalimpact nicht nur den Istzustand, sondern erstellt auch eine Zukunftsprognose. „Wir sagen nicht, Thomas Müller war letztes Jahr gut. Wir sagen: Müller wird nächstes Jahr gut“, erzählt Seidel. Und das auf einer zunächst einfachen Basis.

Nur der BVB besitzt eine kleine Chance

Seidel hat einen Algorithmus auf mathematischen Formeln entworfen, der misst, wie viele Tore eine Mannschaft schießt und kassiert, wenn ein bestimmter Spieler auf dem Feld steht. „Wenn eine Mannschaft mit einem Spieler viele Treffer erzielt und wenige bekommt, dann hat dieser Spieler einen hohen Goalimpact“, erklärt Seidel. Aus allen Karrierepartien dieses Spielers wird ein Durchschnittswert ermittelt. Weil dabei aber ohne Erklärungsparameter bisweilen Unsinn herauskäme, passt Seidel seinen Algorithmus an: Wie stark waren die Mitspieler? Wie stark der Gegner? Hatte der Spieler Heimvorteil? Und wie alt ist er? Alles zusammen ergibt einen Wert, der am besten mit dem Handicap eines Golfspielers vergleichbar ist. Der Goalimpact aller Profis im Kader wird addiert und der Durchschnitt gebildet. Daraus entsteht der Gesamtwert einer Mannschaft, und damit erstellt Seidel die Abschlusstabelle der Bundesliga.

Für die am Freitag beginnende Bundesligasaison prognostiziert der Algorithmus Langeweile an der Spitze, den Fastabsteiger VfL Wolfsburg als Überraschungsteam und eine Spielzeit im harten Kampf gegen den Abstieg für Hertha BSC. Zu 89,2 Prozent wird der FC Bayern erneut Deutscher Meister. Der einzige andere Klub, der eine kleine Chance auf den Titel besitzt, ist laut Goalimpact Borussia Dortmund. Allerdings nur zu 5,4 Prozent wird die Schale an den BVB gehen. Wolfsburg, letztes Jahr noch in der Relegation, hat eine errechnete Punkteprognose von 50,1 Zählern und könnte damit in die Champions League einziehen. Hertha hingegen landet mit 39 Punkten auf dem vorletzten Platz. Aber Seidel relativiert: „Vom vorletzten Platz bis zu Rang zehn sind fast alle Teams gleich gut. Es kann also sein, dass Hertha auch Zehnter wird – das hängt von Glück, gutem Teamgeist und Verletzungspech ab. Aber es ist eben auch Abstiegskampf möglich. Ein Abschneiden besser als Platz zehn jedenfalls legen die Daten nicht nahe“, sagt der Analyst.

Für Hertha wiegt hier der Verlust von Mitchell Weiser schwer (er ging für zwölf Millionen Euro nach Leverkusen). Der U21-Europameister hatte mit einem Goalimpact von sehr guten 140 einen der höchsten im Berliner Kader. Der beste Herthaner aber ist Stürmer Kalou mit 144. Danach folgt Vladimir Darida mit 136. Arne Maier, Herthas 19 Jahre junger Stratege, hat laut Algorithmus eine Karriereprognose um die 140 Punkte, bis er 26 Jahre alt ist. Maier wird also mal ein ziemlich guter Bundesligaspieler. Wie die Prognose funktioniert, dazu später mehr.

Götze ist für den BVB sehr wertvoll

In der Liga den höchsten Wert hat Thomas Müller mit etwa 195 Punkten. Das ist erstaunlich, da Müller nach der schwachen WM heftig in der Kritik steht. Aber mit ihm schießen die Bayern mehr Tore und kassieren weniger. Auch Dortmunds Mario Götze, den Bundestrainer Joachim Löw nicht einmal mit nach Russland nahm, kommt auf den Weltklassewert von 192 – wogegen Marco Reus nur einen Wert von 140 besitzt. Das bedeutet nicht, dass Götze besser ist als Reus, sondern nur für den BVB wertvoller. Stürmer allerdings werden ohnehin oft in der öffentlichen Wahrnehmung überbewertet, sagt Seidel. Den allerhöchsten Wert im Weltfußball hat übrigens der Franzose Paul Pogba von Manchester United mit einem Goalimpact um 200. Der beste Torwart ist der Belgier Thibaut Courtois von Real Madrid.

Mit seiner Methode gewann Seidel 2004 eine Tipprunde unter Freunden zur EM in Portugal, ohne sich bis dahin für Fußball zu interessieren. Der Algorithmus hatte Griechenland als Geheimfavoriten ausgespuckt. Auch erkannte er schon 2005 den damals erst 17 Jahre alte Mesut Özil als kommenden Weltstar. Seidel bloggte zunächst darüber und schrieb auf seinem Twitteraccount. Bis ihn eines Tages ein Topvierklub aus England kontaktierte. Wer sein erster Kunde war, darf Seidel nicht verraten. Aber 2011 gründete er Goalimpact und beliefert seither vor allem Vereine aus der Premier League, wo man deutlich innovativer ist beim Thema Datenanalyse, Polen, China, aber auch Dritt- und Viertligaklubs in Deutschland. „Wir bieten den Vereinen an, ihre Kader zu analysieren, damit sie sehen können, wo sie im Vergleich zur Konkurrenz stehen“, sagt Seidel.

Zudem setzt er den Algorithmus im Scouting bis in den Jugendbereich ein. Sucht ein Verein einen fähigen Linksverteidiger, kann Seidel ihm diejenigen mit den weltweit besten Werten nennen und greift dabei auf Daten zurück, die bis hinab reichen in die zweite Liga auf den Färöer. 1500 Ergebnisse werden pro Woche vollautomatisch in die Datenbank eingepflegt – auch mit dem Ziel, den Spieler zu finden, den heute noch keiner kennt, der morgen aber schon ein Star sein wird.

Datenanalyse widerlegt Hoeneß-Urteil über Mesut Özil

Das funktioniert mittels einer Alterskurve. Der Algorithmus hat anhand der unzähligen Daten die durchschnittliche Leistungssteigerung von Spielern bis zu einem bestimmten Alter errechnet. Die Kurve wird an den Wert angelegt, den Spieler x bereits in jungen Jahren hat und rechnet dann hoch, welchen Wert er mit 26 haben wird, wenn alles nach Plan läuft. So diagnostizierte Seidels System schon den 17 Jahre alten Cristiano Ronaldo als kommenden Weltstar, als er noch in Portugal spielte. Thilo Kehrer, das 21 Jahre alte Abwehrtalent aus der Schalke-Jugend, hatte bereits mit 16 eine Weltklasseprognose. In diesem Sommer zahlte Paris St. Germain 37 Millionen Euro Ablöse für den Verteidiger.

Der Algorithmus sagt aus, dass Spieler durchschnittlich mit 26 ihren Leistungshöhepunkt erreichen und ihn dann bis etwa 30 halten. Ausnahmetalente wie Ronaldo, die immer noch besser werden, gibt es natürlich. Und er legt Vereinen nahe, vor allem auf gute Torhüter zu setzen: „Die haben oft einen hohen Goalimpact und sind verhältnismäßig günstig“, sagt Seidel.

Aber seine Datenanalyse kann noch mehr. Sie kann das Urteil von Bayerns Präsident über Özil widerlegen, wonach der zurückgetretene Nationalspieler seit Jahren „nur noch Dreck“ gespielt haben soll. „Die Daten zeigen, dass Özil seit 2014 konstant auf einem hohen Niveau spielt“, so Seidel. Auch kann der Algorithmus der Bundesliga die Angst vor dem Niedergang nach dem WM-Debakel nehmen. „Es gibt keine massive Abwertung“, sagt Seidel. Vielmehr sei es so, dass die Bundesliga abseits des FC Bayern in der Spitze zwar schwächer sei als die spanische oder die englische Liga, „aber in der Breite ist sie besser. Das ist unverändert so“, sagt Seidel. Demnächst will er den Goalimpact für Trainer errechnen: In der Bundesliga traut er Werders Florian Kohfeldt einen hohen zu.

Bliebe die Frage, wer laut Daten ein kommender Weltstar wird. Seidel nennt einen Namen, den man kürzlich schon gehört hat: Alphonso Davies. Der 17 Jahre alte Kanadier mit ghanaischen Wurzeln, der für Vancouver in der US-Liga spielt, hatte bis Mai noch einen Marktwert von 800.000 Euro. Im Juli zahlte der FC Bayern für ihn eine Ablöse von 19 Millionen Euro.

© Hamburger Abendblatt 2018 – Alle Rechte vorbehalten.