Qu'est-ce que le Machine Learning ?

Pour avoir un aperçu des mots à la mode utilisés lors d’une discussion sur le Machine Learning (l’apprentissage automatique), un sous-ensemble de l’intelligence artificielle qui se concentre sur la capacité des machines à recevoir un ensemble de données et à apprendre par elles-mêmes à partir des données qu’elles traitent, voici une simple explication non technique, sur les principaux concepts du Machine Learning avec des exemples d’applications.

Le Machine Learning n’est pas un robot intelligent qui résout des équations mathématiques sur un tableau de verre sur la photo de couverture ! – crédit image

Globalement, le Machine Learning peut être classé en 4 catégorie :

1 — Apprentissage supervisé (Supervised Learning)

Sur un ensemble d’observations étiquetées, trouvez une fonction f qui peut être utilisée pour attribuer une classe ou une valeur à des observations invisibles.

Dans l’apprentissage supervisé, nous comparons des étiquettes réelles avec des étiquettes prédites. Les prédictions doivent être similaires aux vraies étiquettes.

1.1 — Classification

Supervised Learning: Classification – crédit image

Dans un problème de classification, nous essayons de prédire les résultats par un “discrete outpout”. En d’autres termes, nous essayons de cartographier les variables d’entrée en catégories “discrete”.

Sur la base d’observations prédéfinies antérieures, imaginez un classificateur dont le but est de prédire la catégorie d’une nouvelle observation (qualitative output).

Unseen Data → Classificateur → Classe

Exemples :

Diagnostic médical : malade, pas malade.
Reconnaissance d’animaux : chien, chat, cheval.
Filtrage de spam e-mail.
Pour un patient atteint d’une tumeur, il faut prédire si la tumeur est maligne ou bénigne.

Animation montrant un algorithme de classification prédisant un animal à partir d’image – crédit image

1.2 — Régression

Supervised Learning: Regression – crédit image

Dans un problème de régression, nous essayons plutôt de prédire les résultats en “continuous output”, ce qui signifie que nous essayons de mapper des variables d’entrée à une fonction continue.

Sur la base des observations précédentes d’entrées-sorties, imaginez une fonction de régression dont le but est d’essayer d’estimer une valeur réelle et pas seulement une classe (quantitative / continuous output).

Predictors → Regression function → Response

Exemples :

Compte tenu de la taille et du poids, la corrélation est-elle linéaire, si c’est le cas, prédisez une taille en fonction du poids.
À partir de la photo d’une personne, nous devons prédire son âge en fonction de l’image donnée.

La régression est utilisée pour prédire l’âge d’une personne et la classification est utilisée pour prédire son genre Homme ou Femme – crédit image

2 — Apprentissage non supervisé (Unsupervised Learning)

L’étiquetage peut être fastidieux (trop long, trop lent) et souvent effectué par des humains. Au cas où il n’y aurait pas de véritables étiquettes à comparer, l’apprentissage non supervisé nous permet d’aborder les problèmes avec peu ou pas d’idée de ce à quoi devraient ressembler nos résultats.
Nous pouvons dériver une structure à partir de données dont nous ne connaissons pas nécessairement l’effet des variables. Nous pouvons dériver cette structure en regroupant les données en fonction des relations entre les variables des données.
Avec un apprentissage non supervisé, il n’y a pas de rétroaction basée sur les résultats de la prédiction.

2.1 — Regroupement (Clustering)

Unsupervised Learning: Clustering – crédit image

Objectif : Regrouper les objets en clusters, similaires au sein du cluster, différents entre les clusters. Il n’y a pas d’étiquettes, pas de bon ou de mauvais, et de nombreux clusters possibles.

Exemples :

Regrouper des éléments similaires.
Regroupement des actualités avec Google News.
Analyse des réseaux sociaux.
Segmentation du marché.

Animation montrant un K-means (un algorithme de clustering) regroupant automatiquement les éléments – crédit image

2.2 — Réduction de dimensionnalité (Dimensionality reduction)

Unsupervised Learning: Dimensionality Reduction – crédit image

Objectif : réduire les dimensions du jeu de données

Exemples :

Compression de données.
Visualisation Big Data (c’est-à-dire de la dimension n à la 2D / 3D).

Animation montrant la réduction de dimensionnalité à l’aide d’un algorithme appelé T-SNE – crédit image

2.3 — Détection d’anomalie (Anomaly detection)

Objectif : identifier les éléments rares (valeurs aberrantes) qui soulèvent des soupçons en différant significativement de la majorité des données.

Exemples :

Détection de la fraude.
Comportement anormal des ordinateurs d’un centre de détection de données.

Animation illustrant la détection d’activités suspectes – crédit image

2.4 — Système de recommandation (Recommender System)

Objectif : prédire la note ou la préférence qu’un utilisateur attribuerait à un élément.

Exemples :

Recommander un film à un utilisateur en fonction des films qu’il a déjà notés.
Recommander des produits aux acheteurs.

Recommander un soda au cycliste car il pourrait probablement être intéressé si on le compare à un profil similaire – crédit image

3 — Apprentissage semi-supervisé (Semi-supervised Learning)

En réalité, les choses ne sont pas toujours noires ou blanches. Lorsque nous avons beaucoup d’observations non étiquetées et peu étiquetées, une technique à utiliser serait de regrouper des observations similaires en utilisant le clustering (apprentissage non supervisé), puis en utilisant des informations de regroupement et des classes d’observations étiquetées pour affecter une classe à des observations non étiquetées (apprentissage supervisé).

4 — Apprentissage renforcé (Reinforcement learning)

Reinforcement learning – crédit image

Objectif : prendre des mesures qui maximisent certaines récompenses cumulatives.

Exemples :

Systèmes de prise de décision en temps réel.
Jeu vidéo (robot / IA)

Un agent formé pour jouer à Pac-Man en utilisant l’apprentissage par renforcement profond – crédit image

Merci d’avoir lu cet article ! Tels sont les principaux concepts du Machine Learning !

J’espère avoir réussi à vous éclairer un peu plus sur le sujet en démystifiant le Machine Learning pour vous.

Si vous souhaitez commencer à créer certains des algorithmes d’apprentissage automatique les plus courants à partir de zéro en Python, consultez mon projet GitHub pour une implémentation vectorisée à partir de zéro.

Je partage quotidiennement sur le Machine Learning sur mon profil LinkedIn que je vous invite à suivre 👉 https://www.linkedin.com/in/hamed-zitoun/

Et si vous avez besoin des services de IA C’EST MON DADA pour un projet de développement de Machine Learning, prenez contact !

CONTACTEZ-NOUS

23 février 2021

SE CONNECTER

Qu’est-ce que le Machine Learning ?

Globalement, le Machine Learning peut être classé en 4 catégorie :

1 — Apprentissage supervisé (Supervised Learning)

1.1 — Classification

1.2 — Régression

2 — Apprentissage non supervisé (Unsupervised Learning)

2.1 — Regroupement (Clustering)

2.2 — Réduction de dimensionnalité (Dimensionality reduction)

2.3 — Détection d’anomalie (Anomaly detection)

2.4 — Système de recommandation (Recommender System)

3 — Apprentissage semi-supervisé (Semi-supervised Learning)

4 — Apprentissage renforcé (Reinforcement learning)