La révolution de la data dans le football
L’analyse de la data est largement utilisée de nos jours pour améliorer les performances des clubs de football. Les exemples positifs sont multiples. Brentford est passé de la League One en 2014 a une place de solide club de milieu de tableau de Premier League aujourd’hui. De même, le Toulouse FC est monté en Ligue 1 et a gagné la Coupe de France 2023 avec une équipe recrutée avec une large utilisation de la data. L’accès à la data dans le football est un enjeu stratégique. Certaines solutions sont spécialisées dans ce secteur, c’est le cas de Wyscout, présenté dans cet article, qui est un des leaders dans le domaine.
Wyscout, une banque de données riche et internationale
Wyscout est une entreprise italienne spécialisée dans l’analyse du football fondée en 2004 à Gênes. La solution offre des outils d’analyse vidéo et d’analyse de données pour améliorer le recrutement et les analyses de match. L’entreprise fournit des données approfondies sur les performances des joueurs, les tactiques d’équipe et les schémas de match pour les entraîneurs, les équipes et les joueurs.
Elle constitue l’une des plus grandes bibliothèques de vidéos et de données sur le football au monde, puisqu’elle couvre plus de 600 compétitions à l’international. Par exemple, la A-League australienne, la Liga MX mexicaine, la Serie A brésilienne ou encore la Bundesliga allemande sont couvertes. Un grand nombre de tournois de jeunes sont aussi disponibles.
Wyscout permet de développer le scouting de joueurs à distance. Il est particulièrement utile pour les équipes qui se trouvent dans une zone géographique « isolée du point de vue footballistique ». Les Urawa Reds, équipe de la J-League japonaise gagnante de l’AFC Champions League 2022, utilisent Wyscout de manière intensive par exemple. L’outil leur permet de scouter largement en Europe ou en Amérique du Sud en restant au Japon.
En effet, des vidéos de joueurs réalisant des actions spécifiques sont disponibles à la demande. L’expérience de scouting peut se faire 100% à distance en combinant data et vidéo. Ce type d’analyse a distance a aussi été boosté par le COVID. Il est possible par exemple de rechercher tous les tacles d’un défenseur lors d’une période déterminée. Les gains de temps et de ressources sont colossaux avec ce type de solution.
Les Wolverhampton Wanderers utilisent largement Wyscout pour leur scouting comme cela est décrit dans la vidéo en fin d’article. Le club est beaucoup plus efficace dans son scouting et la solution lui permet en particulier :
- Des gains de temps : En faisant une première analyse sur Wyscout, il est facile de faire un premier tri des joueurs à suivre et d’éviter des déplacements inutiles.
- Des gains d’argent : En réalisant un grand nombre d’actions à distance, il n’y a plus forcément besoin d’envoyer des recruteurs en déplacement. Dans la vidéo, l’exemple d’une compétition de jeunes au Brésil est pris. Avec Wyscout, le club peut analyser tous les matchs de la compétition sans avoir besoin de payer tous les frais liés au voyage d’un groupe de recruteurs.
- Des gains d’information : Avec les supports vidéos et statistiques de Wyscout, les recruteurs peuvent dresser le profil complet avec vidéo à l’appui d’un joueur pour le présenter au coach ou au management du club. Cela n’était pas possible auparavant, cette possibilité est un vrai gain d’information lors de la prise de décision finale qui est faite le plus souvent par la direction.
Ces gains sont particulièrement intéressants pour des clubs de taille plus modeste. Avant l’existence de ce type de solution, ils étaient vraiment limités par leurs ressources et leur budget. Aujourd’hui il peuvent faire beaucoup plus malgré des effectifs réduits.
L’importance des données pour l’analyse
Les données sont très précises et nombreuses avec plus de 100 données collectées par joueur a chaque match telles que :
- Passes réussies – Passes progressives – Passes vers le dernier tiers
- Faute de gain de temps – Faute de protestation – Faute de simulation – Faute violente
Cette précision permet d’affiner le scouting. Un joueur ayant fait 10 fautes de gain de temps doit en effet être différencié d’un joueur à l’origine de 10 fautes violentes. De même, un très haut taux de passes réussies peut être intéressant combiné à un nombre de passes dans le dernier tiers. Sans cette précision sur les passes, il n’y a pas moyen de connaître la tendance à la prise de risque et la verticalité du jeu d’un joueur.
Ci-dessous un exemple des données présentées pour le latéral droit du Real Madrid Dani Carvajal lors de son match contre Manchester City en 2020 (données issues du site de Wyscout).
A partir de tous les événements, des métriques sont calculées pour chaque joueur. Les expected goals (xG : buts attendus) ou expected assists (xA : passes décisives attendues) sont calculés en particulier. Ces métriques ne sont plus des événements qui se réalisent mais des estimations du nombre de fois ou un événement doit arriver en fonction des actions faites par le joueur. Les expected goals sont basés sur un modèle de pré-tir qui estime la probabilité qu’un tir aboutisse à un but. Il est basé sur des facteurs tels que la distance et l’angle du tir par rapport au but, le type de passe et la pression adverse. Par exemple, un penalty à un xG de 0.76 car il a 76% de chances d’être marqué.
Ces données ont monté en popularité dans les années 2010 car elles offrent une vision différente de la réalité parfois tout en y étant fortement corrélé. Leur utilité est notamment de gommer le facteur hasard et aléatoire. En effet, le facteur aléatoire est assez important dans le football qui est un sport avec un faible nombre de buts comparé au basketball ou handball par exemple. Le 14 septembre 2024, Nottingham Forest a créé la surprise en s’imposant à Anfield contre Liverpool 0-1. Les expected goals étaient pourtant de 1.17 à 0.59 pour Liverpool. En s’appuyant sur cette stat, Liverpool peut blâmer le manque d’efficacité de ses attaquants. Si le match avait été rejoué un grand nombre de fois, Liverpool aurait gagné 52% du temps selon Understat et perdu 15% des fois. La remise en cause de la tactique de Liverpool doit donc être limitée après ce match car les ingrédients étaient globalement réunis pour une victoire.
La même logique s’applique aux joueurs avec des buteurs qui peuvent surperformer ou sous-performer leur expected goals. Lors de la saison 2022-2023 en Ligue 1 par exemple, deux buteurs ont explosé : Elye Wahi avec 19 buts et Folarin Balogun avec 21 buts. Mais les deux joueurs ont accumulé 14.5 xG pour Wahi avec Montpellier contre 26 xG pour Balogun avec Reims. Ainsi, Wahi a fait preuve de plus d’efficacité que Balogun lors de la saison mais il s’est aussi créé beaucoup moins d’occasions. En fonction des besoins d’une équipe, le recrutement de l’un ou l’autre pourrait être privilégié.
Nous voyons ainsi que la data permet d’apporter une nouvelle vision sur le football. Elle est maintenant essentielle pour prendre les meilleures décisions possibles.
Les limites du scouting avec la data
Même si la data est très importante, des limites existent à son utilisation. Tout d’abord, certains éléments ne peuvent être observés qu’en étant présent sur place. On peut penser au comportement en dehors du terrain d’un joueur avec son attitude sur le banc par exemple. Ensuite, le scouting à distance peut avoir un côté déshumanisé. Le scouting est la base d’un recrutement. C’est une rencontre entre un joueur et un club à travers ses représentants. Cette partie est cruciale pour mieux comprendre l’environnement d’un joueur en rencontrant ses proches par exemple. Il sera plus facile de convaincre un joueur de signer s’il a déjà rencontré des membres du club. Enfin, le facteur international et déracinement d’un joueur est à prendre en compte. Avec ce type de solution, il est facile d’oublier comment le cadre autour d’un joueur est différent de celui du club dans lequel il est désiré. Les joueurs étant recrutés de plus en plus jeune, il est important de mettre en place une procédure d’accueil et d’acclimatation adéquate.
L’intelligence artificielle, la prochaine étape ?
Ainsi, Wyscout est une solution permettant d’améliorer le scouting sur de multiples aspects. Avec des bases de données aussi complètes, des modèles d’intelligence artificielle peuvent être développés. D’une certaine manière, certaines statistiques comme les expected goals sont déjà des formes d’IA prédictives. Des solutions de ce type existent déjà comme Sentients Sports qui permet de calculer des scores de compatibilité tactique, d’entente avec les autres joueurs ou de potentiel grâce à ces données multiples.
Ci-dessous vous trouverez un interview de John Marshall, Head of Recruitment des Wolves, sur l’utilisation de Wyscout dans son club.
Pour en savoir plus sur l’utilisation de l’IA dans la tactique, consultez notre article sur la collaboration entre TacticAI et Liverpool.
Pour toute question sur l’utilisation de la data ou de l’IA dans le football, contactez notre équipe.
Source :