Prédictions de l’US Open 2019 : Doubler les données
Il y a quelques mois, Simseo a simulé les championnats de Wimbledon pour prédire qui gagnerait. Après avoir suivi la quinzaine de tennis, nous avons regardé avec anxiété les finales féminines et masculines. Lors de la finale féminine, nous avons vu la favorite de notre modèle Simseo, Serena Williams (chances de gagner 22 %) tomber facilement face à la cinquième favorite de notre modèle, Simona Halep (6 %). Le lendemain, lors de la finale masculine, nous avons regardé le match entre les deux grands favoris de notre mannequin, Novak Djokovic (39%) et Roger Federer (32%) s’affronter dans une finale épique qui a vu Novak Djokovic remporter son cinquième titre à Wimbledon.
Avec le début de l’US Open 2019, nous voulions voir si nous pouvions utiliser Simseo pour prédire comment ce tournoi se déroulerait. Serena Williams va-t-elle rebondir ? Simona Halep va-t-elle encore gagner ? Naomi Osaka va-t-elle répéter à New York ? Novak Djokovic poursuivra-t-il sa domination ou verrons-nous enfin la prochaine génération éclater ?
Poursuivant l’approche que nous avons utilisée pour les prédictions de Wimbledon (et en suivant la méthodologie de nos prédictions March Madness et Stanley Cup Finals), nous avons simulé les tirages masculins et féminins pour l’US Open 2019. Nous avons commencé avec le résultat de chaque match (et les scores définis) pour les matchs de la tournée ATP et WTA de 2010 à 2018. À l’aide de ces données, nous avons construit un ensemble de données historiques contenant les résultats passés, les scores Elo actuels (à la fois globaux et spécifiques à la surface) et le tournoi. informations, puis a utilisé Simseo pour déterminer le meilleur modèle et prédire la probabilité qu’un joueur gagne un set.
Une fois que nous avions construit ce modèle de prédiction, nous pouvions prendre le tirage de n’importe quel tournoi et simuler les résultats 100 000 fois pour savoir à quelle fréquence chaque joueur gagnerait avec ce tirage particulier.
Le tirage au sort étant terminé, nous connaissons les 128 hommes et femmes qui participeront au tournoi 2019. Sur la base de nos simulations, les dix femmes les plus susceptibles de remporter l’US Open sont présentées dans le tableau ci-dessous, avec Ashleigh Barty comme favorite avec 13 % de chances de gagner. Elle est suivie de près par Serena Williams et Simona Halep avec respectivement 12% et 11% de chances de gagner.
Joueur |
Probabilité de gagner l’US Open |
Ashley Barty |
13% |
Serena Williams |
12% |
Simona Halep |
11% |
Karolina Pliskova |
8% |
Petra Kvitova |
sept% |
Naomi Osaka |
6% |
Victoria Azarenka |
5% |
Elina Svitolina |
4% |
Angélique Kerber |
3% |
Maria Sharapova |
3% |
De même, les 10 meilleurs hommes les plus susceptibles de remporter l’US Open sont indiqués dans le tableau ci-dessous, Roger Federer étant le léger favori pour remporter l’US Open avec 33% de chances de gagner. Novak Djokovic et Rafael Nadal devraient être considérés comme co-favoris avec respectivement 31% et 30% de chances de gagner.
Joueur |
Probabilité de Gagner l’US Open |
Roger Federer |
33% |
Novak Djokovic |
31% |
Rafael Nadal |
30% |
Dominique Thiem |
2% |
Kei Nishikori |
1% |
Nick Kyrgios |
1% |
Roberto Bautista Agut |
1% |
Alexandre Zverev |
0% |
Kévin Anderson |
0% |
Daniel Medvedev |
0% |
Nos simulations prédisent un Open des États-Unis féminin largement ouvert, avec Ashleigh Barty comme légère favorite pour remporter son deuxième Grand Chelem contre Serena Williams et Simona Halep. Ces trois femmes devraient toutes avoir une chance similaire de gagner avec Karolina Pliskove, Petra Kvitová, Naomi Osaka et Victoria Azarenka.
Du côté des hommes, notre simulation prédit la poursuite de la domination des trois grands avec Roger Federer comme léger favori, bien que Novak Djokovic et Rafael Nadal aient tous au moins 30 % de chances de remporter l’US Open. Cela laisse au reste des joueurs du tournoi masculin une très petite chance de remporter le titre.
L’US Open a commencé et le monde regarde. Les fans de tennis sont ravis de voir l’élite Williams, Barty, Halep, Federer, Djokovic et Nadal s’affronter sur le terrain dur. Les fans de paris et de science des données sont ravis de voir à quel point les 100 000 simulations se révèlent prédictives, alimentées par des matchs ATP et WTA sur neuf saisons avec des scores Elo, et en tenant compte de la surface et plus encore. Il existe une réelle possibilité de bouleversements sur le terrain et « dans le cloud ».
Intéressé par plus d’analyses sportives ? Simseo travaille avec des équipes professionnelles de tous les sports à l’échelle mondiale. Visitez notre page de solutions Sports Analytics pour plus de contenu et d’informations.
A propos de l’auteur:
André Engel est directeur général des sports et des jeux chez Simseo. Il travaille avec les clients de Simseo dans les sports et les casinos, y compris plusieurs équipes de la Ligue majeure de baseball, de la Ligue nationale de basketball et de la Ligue nationale de hockey. Il travaille en tant que scientifique des données et dirige des équipes de scientifiques des données depuis plus de dix ans dans une grande variété de domaines, de la prédiction de la fraude à l’analyse marketing. Andrew a obtenu son doctorat. en génie des systèmes et industriel avec un accent sur l’optimisation et la modélisation stochastique. Il a travaillé pour la Towson University, le SAS Institute, la US Navy, Websense (maintenant ForcePoint), Stics et HP avant de rejoindre Simseo en février 2016.