Le football, un terrain propice pour le machine learning
L’environnement du football regorge de données structurées (par exemple, les statistiques des joueurs) et non structurées (par exemple, les vidéos des matchs), ce qui en fait un terrain propice au développement de solutions de machine learning.
Le machine learning se définit comme l’utilisation d’un programme informatique qui apprend par l’expérience (les données) pour modéliser, prédire ou contrôler une situation. Il s’agit d’un type d’intelligence artificielle.
Le machine learning est particulièrement efficace pour les tâches de classification et de prédiction.
La classification avec le machine learning
Prenons l’exemple de l’identification des équipes représentées dans la librairie de photo de la Premier League. Après une phase d’apprentissage, un algorithme de machine learning pourrait facilement classer de nouvelles photos qu’on lui soumettrait dans une des 20 catégories de clubs. L’algorithme va par lui-même trouver les points communs et les points discriminants lui permettant d’établir quel maillot d’équipe est représenté sur l’image. Par l’expérience, le machine learning sera donc ici capable de distinguer le maillot d’Arsenal de celui de Chelsea sans problème, mais aussi celui de Liverpool de celui de Manchester United même s’ils sont de la même couleur.
Pour gérer la phase d’apprentissage, il faut choisir une méthode. Les deux plus connus sont l’apprentissage supervisé et l’apprentissage non supervisé:
- L’apprentissage supervisé consiste à mettre un label sur les données utilisé par l’algorithme pour apprendre. Il permet de prédéfinir les catégories recherchées. Nous allons donc bien expliciter à l’algorithme que tel maillot est celui de West Ham, tel maillot celui d’Aston Villa, etc.
- L’apprentissage non supervisé laisse l’algorithme identifier et créer ses propres catégories en fonction des éléments de différence remarquées.
Pour notre cas, l’apprentissage supervisé nous donnera 20 catégories, une par club de Premier League. Par contre, l’apprentissage non supervisé nous donnera probablement 40 catégories, deux par club de Premier League, car il ne fera pas le rapprochement entre les maillots domicile et extérieur du club. Le choix de la méthode de machine learning utilisé a donc son importance et dépend du cas.
Ici, l’apprentissage supervisé est plus intéressant, mais pour d’autres cas l’apprentissage non supervisé peut être un meilleur choix notamment lorsque nous voulons créer une classification à partir de données sans catégories pré-établies.
De multiples déclinaisons de ces types d’apprentissage existent comme l’apprentissage semi-supervisé par exemple. Si nous avons un ensemble de données d’apprentissage de 1000 photos, mettre un label sur chacune des photos est une tâche fastidieuse. Nous pouvons nous limiter à mettre un label sur 10 photos par club à la fois pour les maillots domicile et extérieur. L’algorithme sera capable de lui-même de mettre un label sur les autres photos avec la méthode semi-supervisée.
La prédiction avec le machine learning
Le machine learning est particulièrement utile pour réaliser des tâches de prédiction. Pour un club de football, un modèle prédictif pourrait être appliqué à la boutique officielle en ligne du club. Le but sera de savoir lors de l’achat d’un produit dans la boutique quel est le produit le plus intéressant à proposer au client pour augmenter sa satisfaction et le panier moyen. Par exemple, si un client achète des places pour la première fois sur le site, une écharpe du club peut lui être proposé à l’achat.
L’algorithme va apprendre à partir d’une partie des données historiques de la boutique. Par exemple, ces données peuvent être :
- Jour et heure de la commande
- Proximité de la commande avec un match à domicile
- Lieu, âge et genre du client
- Valeur du initiale du panier
- Articles dans le panier
Après une analyse de toutes ces données, un modèle va pouvoir être identifié et proposer les meilleures suggestions de produits au client. Le machine learning fait alors une prédiction du produit le plus adéquat.
Pour en savoir plus : L’utilisation par Liverpool de l’IA pour optimiser ses corners.
L’image illustrant cet article a été réalisé avec une intelligence artificielle de génération d’image appelé Leonardo.ai, cette application n’est pas spécialisée dans le contenu lié au football et pourtant elle arrive très vite à des résultats intéressants.