Statistisch onderzoek voorspelt: Frankrijk wordt Europees kampioen voetbal

(07-06-2021) Na het winnen van het WK voetbal in 2018, ligt Frankrijk ook in poleposition om Europees kampioen te worden. Nà Frankrijk maken Engeland en Spanje volgens de prognoses het meeste kans om zich tot Europees kampioen te kronen.

Een internationaal team van onderzoekers kroont Frankijk met een winstkans van 14,8% tot Europees kampioen.

De voorspelling combineert verschillende statistische modellen die de sterkte van de teams inschatten met informatie over de teamstructuur (zoals de marktwaarde, de leeftijd, de prestaties van de spelers bij hun club, …) en sociaal- economische factoren van het land van herkomst (bevolkingsgrootte en bruto binnenlands product).

100.000 simulaties 

De onderzoekers simuleerden het hele EK maar liefst 100.000 keer: wedstrijd voor wedstrijd, volgens de trekking van het toernooi en alle UEFA-regels.  Voor elk team resulteert dit in kansen om door te stromen naar de verschillende toernooirondes en uiteindelijk het kampioenschap te winnen.  De favoriet is Frankrijk met een winstkans van 14,8 procent, gevolgd door Engeland (13,5%) en Spanje (12,3%). 
"Het ligt in de natuur van voorspellingen dat ze ook fout kunnen zijn, speciaal met een sport zoals voetbal die door mensen gespeeld wordt – dit maakt voetbaltoernooien ook zo spannend. In dit jaar komt nog de onzekerheid door de COVID-19 situatie erbij. Ons model levert kansen, geen zekerheden". Christophe Ley, UGent.  

Ook in 2018 werd door de onderzoekers een model opgesteld om het WK te voorspellen. Dat model kwam toen als tweede sterkste uit een internationale voorspellingscompetitie. Dit jaar ontwikkelden de onderzoekers een nog uitgebreider model.

België in het toernooi

 De fans van de Rode Duivels hoeven voorlopig nog niet zenuwachtig te worden. Ook België maakt kans om het EK te winnen, al liggen die winstkansen (8.3%) iets lager dan bij de eerder genoemde landen.

 Op basis van de wedstrijdresultaten in de afgelopen jaren, zouden ze tot de absolute topfavorieten behoren, maar er lijkt meer individuele kwaliteit te zijn bij de concurrenten zoals Frankrijk, Engeland, Spanje en Duitsland”. Hans Van Eetvelde, UGent.

 Machine Learning 

De berekening van de onderzoekers is gebaseerd op vier informatiebronnen:  

  1. Een statistisch model voor de sterkte van elk team op basis van alle interlands van de afgelopen acht jaar (Universiteit Gent) 
  2. Een tweede statistisch model voor de sterkte van de teams op basis van de wedkansen van 19 internationale bookmakers (Universiteit van Innsbruck). 
  3. Informatie over de teams, bijvoorbeeld marktwaarde, en hun landen van herkomst, zoals bevolkingsomvang (TU Dortmund en TU München). 
  4. Gedetailleerde beoordelingen van de individuele spelers en hun individuele prestaties zowel in hun thuisclubs als in nationale teams (Molde University College).

Een machine learning-model combineert de vier informatiebronnen en optimaliseert de voorspellingen stap voor stap. De onderzoekers trainden het model op de gegevens van de vorige 4 Europese kampioenschappen.

Hoe goed het model presteerde, weten we in ieder geval uiterlijk op de avond van 11 juli. 

Meer info 

De volledige voorspelling met interactieve graphics is hier beschikbaar.  

Christophe Ley,
Vakgroep Toegepaste Wiskunde, Informatica en Statistiek, UGent

christophe.ley@ugent.be