C’est quoi les réseaux neuronaux et à quoi servent-ils ?

Les réseaux neuronaux sont au cœur de l’intelligence artificielle. Ils sont utilisés par des organisations du monde entier pour innover, automatiser les tâches et pour devenir plus compétitifs. Dans cet article, je vais vous expliquer en termes simples et non mathématiques ou techniques ce qu’ils sont et comment vous pouvez les utiliser pour innover dans votre domaine.

 

Il n’y a rien d’intelligent dans l’intelligence artificielle

Lorsque le terme « intelligence artificielle » (IA) entre dans une conversation, la plupart des gens pensent probablement à un cerveau robotique fait de parties électroniques qui est capable de se réveiller d’un moment à l’autre… J’ai récemment écrit un billet sur la vérité étonnante et ennuyeuse sur l’intelligence artificielle, où j’explique en termes simples pourquoi il n’y a rien d’intrinsèquement intelligent au sujet de l’IA… C’est juste un logiciel informatique utilisant les maths pour faire des calculs compliqués. Les réseaux de neurones sont l’un des moyens les plus populaires de faire du Machine Learning. Mais il s’avère que nous leur avons donné ce nom, simplement parce que l’architecture du logiciel qui fait tous les calculs a été inspirée par notre compréhension du cerveau humain.

 

Comment fonctionne le cerveau humain

Le cerveau humain est l’unité de traitement centrale du corps humain et il est constitué d’environ 86 milliards de cellules appelées neurones. Chaque neurone a un noyau et se connecte à d’autres neurones par des axones qui forment des synapses. Nous avons environ un quadrillion de synapses dans notre cerveau qui transportent des signaux électriques. Chaque neurone fonctionne comme une «passerelle» qui décide si le courant électrique qu’il reçoit doit passer à la neurone suivant ou non.

 

 

Chaque fois qu’il y a une “entrée”, disons par exemple que notre main touche une surface brûlante, un signal électrique est envoyé de la main à notre cerveau et dans un très court laps de temps, le signal électrique voyagera du neurone vers un neurone, traitant l’information, jusqu’à ce qu’un signal “de sortie” soit renvoyé à la main, lui disant de s’éloigner de la surface brûlante dès que possible.

 

Le perceptron

À la fin des années 1950, un physicien américain du nom de Frank Rosenblatt, a inventé le concept du perceptron. Le perceptron est un algorithme d’apprentissage supervisé qui a été modélisé d’après le neurone humain et en tant que tel, il a :

  • plusieurs canaux d’entrée (différents courants électriques)
  • une unité de traitement (le noyau du neurone)
  • une sortie (le courant électrique passe à la neurone suivante ou non)

Le processus se répète plusieurs fois et les sorties deviennent de nouvelles entrées pour d’autres unités de traitement.

 

 

Une secrétaire virtuelle alimentée par l’IA

Disons que je suis une personne très célèbre et que chaque jour je reçois dans mon courrier des centaines d’invitations à participer à des événements. Je perds trop de temps à lire chaque invitation et à décider si je devrais participer ou non à l’événement. Je décide que je veux former une secrétaire virtuelle et lui fournir un réseau de neurones afin qu’elle puisse faire le travail pour moi.
La secrétaire pourra filtrer les futures invitations et m’envoyer seulement celles qui valent la peine d’y consacrer mon temps et mon attention.

 

Classification binaire

Par souci de simplicité, disons qu’il y a seulement deux facteurs que je veux prendre en considération lorsque je décide de participer à un événement :

  • l’intérêt du sujet
  • la distance de mon domicile

Si le sujet est très intéressant et que l’événement est proche de chez moi, je vais certainement y assister. Si au contraire, l’événement est ennuyeux et qu’il est aussi très loin de chez moi, je ne vais certainement pas y aller. Le réseau neuronal ressemblerait à ceci :

 

 

Disons que je vais passer du temps avec ma secrétaire virtuelle afin de lui apprendre à filtrer correctement mes invitations. Si je prends 20 exemples, je peux lui enseigner les bonnes réponses pour chaque exemple.
Si je trace tous les exemples sur un graphique en deux dimensions, les résultats ressembleraient à ceci :

 

 

Le but ultime du Machine Learning est de découvrir l’équation mathématique qui représente le plus précisément la ligne de décision de limite, de sorte qu’il peut prédire correctement si je vais assister à un événement futur ou non sur de nouvelles données que je vais lui fournir.
Avec les données du dataset d’entraînement, nous pouvons voir que c’est un exemple classique de classification binaire, où la frontière qui sépare ma prise de décision est une simple ligne droite.

 

 

Régression non linéaire

Parfois, l’ensemble de données ne correspond pas nécessairement à une ligne droite…
Que se passerait-il par exemple si le sujet de l’événement est intéressant mais très éloigné de chez moi, disons par exemple dans une autre ville ?
Il est très probable qu’il existe une distance maximale que je suis prêt à parcourir pour assister à un événement donné, peu importe son intérêt.
Dans ce cas, nous aurions besoin d’adapter notre équation mathématique afin qu’elle puisse fournir des résultats plus précis et le résultat ressemblerait un peu à ceci :

 

Ceci est connu comme une “régression non-linéaire” et c’est probablement une représentation plus correcte de la réalité. La régression non linéaire peut être appliquée à un nombre différent d’ensembles de données pour tracer avec précision la prédiction ou la « classification » d’une décision.

 

Régression multivariable

Dans notre exemple, nous avons seulement utilisé deux paramètres pour prédire un résultat, mais en réalité, il y a plusieurs critères qui pourraient influencer ma décision, tels que :

  • la météo
  • le coût de l’événement
  • ma santé
  • mes disponibilités
  • etc

Toutes les entrées n’ont pas le même poids sur la sortie. Par exemple, un événement peut être très intéressant et proche de chez moi, mais si je suis très malade, il n’y a aucun moyen de sortir de mon lit.
Dans ce cas, l’entrée “santé” a un poids très élevé (impact) sur la sortie.

 

 

Réseaux neuronaux multicouches

Parfois, il est simplement impossible de classer toutes les données avec une ligne et en 1989, le mathématicien George Cybenko, a postulé la Théorie de l’approximation universelle. La théorie a montré que les réseaux de neurones multicouches étaient des données de classification plus précis.
Les réseaux multicouches ont différentes couches “cachées” d’entrées qui sont utilisées comme étapes supplémentaires dans le calcul final de la sortie.
Il n’est pas nécessairement simple de comprendre ce que ces unités cachées signifient. Plus les couches sont cachées dans un réseau de neurones, plus elles deviennent des concepts abstraits.

 

 

Dans l’apprentissage supervisé, le but ultime est de trouver la bonne équation mathématique qui sera en mesure de prédire ou de classer un résultat. Pour cela, le chercheur en Machine Learning aura besoin à la fois de définir l’architecture du réseau neuronal (nombre d’entrées, nombre de couches cachées, etc) et d’entraîner son modèle, pour lui apprendre les “bons paramètres” ou les poids pour chaque entrée. Pour cela, il implémentera quelque chose appelé “back propagation”, un sujet que je couvrirai probablement dans un article différent.

 

Ok, alors que puis-je faire avec les réseaux de neurones ?

Vous pouvez oublier la secrétaire virtuelle 🙂
Maintenant que nous avons couvert les bases des réseaux neuronaux, imaginez que les sources d’entrée pour un modèle peuvent être celles que vous voulez. Ça peut être des données financières, des chiffres du marché, des statistiques salariales ou tout ce que vous pourriez imaginer.
Les entrées peuvent également être des pixels d’une image et cela ouvre la porte à des applications très intéressantes comme la reconnaissance faciale, la conduite autonome et les diagnostics médicaux, juste pour en nommer quelques-uns.
Les applications des réseaux de neurones sont infinies et la seule limite est notre imagination.

 

En fin de compte, c’est juste un tas de calculs

Comme je l’ai mentionné auparavant, il n’y a rien d’intrinsèquement intelligent au sujet de l’IA. Les réseaux neuronaux ont été vaguement calqués sur notre compréhension actuelle du cerveau humain et de ses synapses, mais c’est un domaine où de nombreuses recherches sont actuellement en cours et il reste encore beaucoup à découvrir.
En fin de compte, c’est juste un tas de mathématiques appliquées pour prédire un résultat. C’est qui est génial, c’est que le “Cloud computing” nous donne la possibilité de faire tous ces calculs pour un prix très bas.

 

IA C’EST MON DADA et MLAB.AI, les spécialistes du Machine Learning, à votre service !

Si le Machine Learning vous inspire et que vous pensez que vous souhaitez implémenter un cas d’usage dans votre organisation, contactez-nous. Nous sommes agnostiques et nous recommandons et intégrons la technologie qui s’adapte le mieux à vos besoins. Si les technologies disponibles ne répondent pas à vos besoins, nous pouvons toujours former un modèle personnalisé adapté à votre projet.

CONTACTEZ-NOUS

23 février 2021
© 2020 IA cest mon dada - Tous droits réservés
X