Qu'est-ce-que-le-machine-learning
Kevin Ngaleu

Qu'est ce que le machine learning ?

L’apprentissage automatique (en anglais, Machine Learning) est un type d’intelligence artificielle qui confère aux ordinateurs la capacité d’apprendre sans être explicitement programmés.

Pour apprendre et se développer, les ordinateurs ont besoin de données à analyser et sur lesquelles s’entraîner. De ce fait, le Big Data est l’essence du Machine Learning, et  c’est la technologie qui permet d’exploiter pleinement le potentiel du Big Data.

L’objectif de cet article est de simplifier la compréhension du Machine Learning, de fournir une vue d’ensemble sur les principes fondamentaux de de ce concept, de présenter les défis et les limitations de cette forme d’intelligence artificielle ainsi que certains problèmes abordés aujourd’hui dans l’apprentissage profond ou Deep Learning (la «frontière» du Machine learning) et les principaux éléments à retenir pour développer des applications d’apprentissage automatique.

Cet article sera organisée de la manière suivante:

Contenu

Machine Learning: Définition

Le Machine Learning  est la science qui consiste à amener les ordinateurs à apprendre et à agir comme les êtres humains, et à améliorer leur apprentissage de manière autonome, en se nourrissant de données.

le machine learning

Comme avec n’importe quel concept, le Machine Learning peut avoir une définition légèrement différente. Nous avons parcouru Internet pour trouver d’autres définitions intéressantes provenant de sources réputées:

  1. Pour Nvidia, le Machine Learning, à la base, consiste à utiliser des algorithmes pour analyser des données, en tirer des enseignements, puis déterminer ou prédire quelque chose. 
  2. Pour Stanford, c’ est la science qui consiste à faire en sorte que les ordinateurs agissent sans être explicitement programmés.
  3. L’université de Washington décrit les algorithmes de Machine comme étant capable de comprendre comment effectuer des tâches importantes en généralisant à partir d’exemples.

Le Machine Learning est idéal pour exploiter les opportunités cachées du Big Data. Cette technologie permet d’extraire de la valeur des sources de données volumineuses et variées sans avoir besoin de compter sur un humain.

Des formations de Machine Learning sont disponibles sur le Web. Ils permettent notamment de débuter le Machine Learning à partir du langage de programmation R ou Python.

On peut assimiler l’apprentissage automatique à l’agriculture. Les semences sont les algorithmes, les engrais, l’eau et d’autres éléments pouvant nourrir les plantes sont les données, le planteur est vous et les plantes sont les programmes.

Qu'est ce que le machine learning

Concepts de base de l’apprentissage Machine

Il existe de nombreux types d’algorithmes de Machine Learning, de multiples autres types naissent tous les jour, et ils sont généralement regroupés par style d’apprentissage (apprentissage supervisé, apprentissage non supervisé, apprentissage semi-supervisé) ou par similarité de forme ou de fonction (classification, régression, arbre de décision, regroupement, apprentissage profond etc.). 

Quels que soient le style ou la fonction d’apprentissage, toutes les combinaisons d’algorithmes de Machine Learning consistent en ceci:

Il existe de nombreux types d’algorithmes de Machine Learning, de multiples autres types naissent tous les jour, et ils sont généralement regroupés par style d’apprentissage (apprentissage supervisé, apprentissage non supervisé, apprentissage semi-supervisé).

Ils sont aussi repartis par similarité de forme ou de fonction (classification, régression, arbre de décision, regroupement, apprentissage en profondeur etc.). 

Quels que soient le style ou la fonction d’apprentissage, toutes les combinaisons d’algorithmes de Machine Learning consistent en ceci:

  • Représentation

La représentation renvoie à la formulation du problème en tant que problème d’apprentissage automatique. Il s’agit généralement d’un problème de régression ou de classification. 

Alors, pour un problème de classification, la question est de savoir quel est exactement votre classificateur. Les réponses pourraient être l’une d’entre elles – un arbre de décision, un réseau de neurones, une machine à vecteurs de support, un hyperplan séparant les deux classes, etc.

  • Évaluation

Il s’agit d’une fonction objective ou une fonction de notation pour distinguer les bons modèles des mauvais modèles. Il est possible que la fonction d’évaluation utilisée par un algorithme particulier soit différente de la fonction externe que le classifieur doit optimiser. 

Pour un problème de classification, nous avons besoin de cette fonction pour savoir si un classificateur donné est bon ou mauvais

Une fonction typique peut être basée sur le nombre d’erreurs commises par le classificateur sur un ensemble de test. Pour un problème de régression, il peut s’agir d’une probabilité.

  • Optimisation

Il faut nécessairement une méthode pour rechercher parmi les modèles celui le plus performant.

Le tableau ci-dessous montre quelques exemples courants de chacun de ces trois composants. Par exemple, la régression logistique est une technique prédictive. 

Elle vise à construire un modèle permettant de prédire les valeurs prises par une variable cible qualitative (le plus souvent binaire, on parle alors de régression logistique binaire).

L’objectif fondamental des algorithmes d’apprentissage automatique est de généraliser au-delà des échantillons d’apprentissage, c’est-à-dire d’interpréter avec succès des données qu’il n’a jamais acquises auparavant.

Les types d’apprentissage automatique

Il existe quatre types d’apprentissage automatique:

  • Apprentissage supervisé (Supervised learning)

Les données d’entraînement de la machine incluent les résultats souhaités. Ceci est un spam ce n’est pas, l’apprentissage est fait de manière supervisée.

  • Apprentissage non supervisé (Unsupervised learning)

Les données d’entraînement n’incluent pas les résultats souhaités. Exemple: clustering. Il est difficile de distinguer ce qui est bon et ce qui ne l’est pas.

  • Apprentissage semi-supervisé (Semi-supervised learning)

Les données d’entraînement incluent quelques extrants souhaités.

  • Apprentissage par renforcement (Reinforcement learning)

Il consiste à apprendre les actions à prendre, à partir d’expériences, de façon à optimiser une récompense quantitative au cours du temps. Les types d’intelligence artificielle comme elle, c’est le type d’apprentissage le plus ambitieux.

Qu'est ce que le machine learning? les types d'algorithme d'apprentissage

Big Data, essence de l’apprentissage automatique

Le Machine Learning est idéal pour exploiter les opportunités cachées du Big Data. Cette technologie permet d’extraire des informations de valeur en provenance de sources de données massives et variées sans la mainmise d’un opérateur  humain

Il est dirigée par les données, et convient à la complexité des immenses sources de données du Big Data. Contrairement aux outils analytiques traditionnels, il peut également être appliqué aux ensembles de données générées en temps réel. 

Plus les données injectées à un système Machine Learning sont nombreuses, plus ce système peut apprendre et dériver des insights de qualité meilleure. 

Le Machine Learning permet ainsi de découvrir les patterns enfouies dans les données avec plus d’efficacité et de précision que l’intelligence humaine.

big data essence du machine learning

Sans le Big Data, le Machine Learning ne seraient rien. Selon lebigdata.fr, les données sont l’instrument qui permet de comprendre et d’apprendre à la manière dont les humains pensent

C’est le Big Data qui permet d’accélérer la courbe d’apprentissage et permet l’automatisation des analyses de données. Plus un système Machine Learning reçoit de données, plus il apprend et plus il devient précis.

Comme exemple, les concepteurs d’objets connectés peuvent analyser la température du logement afin de comprendre la présence et l’absence des occupants pour couper le chauffage et le rallumer quelques minutes avant leur retour.

Machine Learning en Pratique

Les algorithmes de Machine Learning ne constituent qu’une infime partie de l’utilisation concrète de l’apprentissage automatique. En pratique, le processus ressemble souvent à:

  • Début de la Boucle

Comprendre le domaine, les connaissances préalables et les objectifs. Parlez à des experts du domaine. Souvent, les objectifs ne sont pas clairs. Ici les objectifs doivent être fixés.

Intégration, sélection et nettoyage des données. C’est d’habitude la phase qui prend le plus de temps. Il est important d’avoir des données de haute qualité. Plus vous avez de données, plus la qualité baisse, car elles sont sales. Cette phase consiste donc à enlever toutes les impuretés dans les données.

Modèles d’apprentissage. Cette partie est assez simple. Les outils utilisés sont généraux.

Interprétation des résultats. De fois, le fonctionnement du modèle importe peu tant qu’il donne des résultats. D’autres domaines exigent que le modèle soit compréhensible.

Consolidation et déploiement des informations découvertes. La majorité des projets réussis en laboratoire ne sont pas utilisés dans la pratique. 

  • Fin de boucle

Ce n’est pas un processus ponctuel, c’est un cycle. La boucle jusqu’à obtenir un résultat que vous pouvez utiliser dans la pratique. De plus, les données peuvent changer, nécessitant une nouvelle boucle. Vous pouvez consulter cet article qui montrera comment débuter dans ce domaine.

Applications du Machine Learning

Applications du Machine Learning

Recherche Web: Classement des informations en fonction de ce sur quoi vous êtes le plus susceptible de cliquer. 

Finance: Décidez à qui envoyer les offres de cartes de crédit. Evaluation du risque sur les offres de crédit. Comment décider où investir de l’argent. 

E-commerce: Prédire le désabonnement des clients. Qu’une transaction soit frauduleuse ou non. Afficher les produits en fonction des préférences de chaque utilisateur.

Robotique: La gestion des incertitudes dans les nouveaux environnements. 

Autonome. Voiture autonome. 

Extraction d’informations: Poser des questions à bases de données sur le Web. 

Réseaux sociaux: Données sur les relations et les préférences.

Conclusion

L’ apprentissage automatique intervient dans nos vies de tous les jours. C’est un domaine de plus en plus populaire à ne pas louper si l’on souhaite faire carrière dans les domaines de la Data afin de devenir ingénieur Machine Learning. 

Cet article pourrait vous aider à démarrer votre carrière. Ce sont les concepts de base abordés dans l’introduction à la plupart des cours de Machine Learning et dans les premiers chapitres de tout bon manuel sur le sujet.

Partager sur facebook
Partager sur twitter
Partager sur linkedin
Abonnez vous pour recevoir les notifications sur mes nouvelles publications.

Ces publications pourraient vous interesser.

Bienvenue sur SuperDataCamp!

Abonnez vous à la newsletter pour recevoir les notifications sur nos publications.