FORMATIONS

Introduction aux statistiques, à l’analyse de données et à l’intelligence artificielle

Introduction aux méthodes statistiques, aux algorithmes de prédiction et aux techniques d’analyse de données. Avec le parcours de ces méthodes, il s’agit d’une préparation à leurs applications dans le domaine de l’intelligence artificielle. Ce module est indispensable afin de fournir aux participants non-initiés aux statistiques, à la manipulation de la donnée ou à l’IA, toutes les bases et les outils nécessaires pour être autonomes dans le développement de uses cases de data science par les méthodes spécifiques qui seront acquises au cours des modules suivants.

Méthodologie de conduite d’un projet de Data Science de bout en bout

La conduite d’un projet de Data Science se fait à travers plusieurs étapes. De la formalisation d’un besoin métier jusqu’à la restitution des résultats. Ce module est l’opportunité de découvrir par des cas concrets les différentes étapes de mise en place d’un projet de Data Science en faisant appel à des algorithmes d’Intelligence Artificielle. Les cas pratiques sont adaptés en fonction des profils et des besoins individuels. Le projet peut être conduit dans le domaine du Marketing, de la Finance ou de la Logistique par exemple.

La Régression et les mesures de performances

La régression linéaire et non linéaire sont les méthodes indispensables pour résoudre certains problèmes de Machine Learning. Les hypothèses sous-jacentes sont étudiées ainsi que les méthodes pour remédier à leurs non conformités. Les méthodes de contraintes sur les paramètres sont également parcourues pour résoudre des problèmes plus complexes. Enfin, les méthodes de mesures de performance des modèles sont également détaillées.

La Classification et le Clustering

Les méthodes de classification (supervisées) ou de clustering (non supervisées) sont nécessaires pour réaliser des études telles que la segmentation ou l’analyse de groupes par isolation. Plusieurs algorithmes statistiques permettent d’appliquer ces techniques. Chaque algorithme possède ses avantages et ses inconvénients. Nous étudions par des exemples pratiques leurs mises en oeuvre, l’interprétation des résultats obtenus, leurs limites et leurs valeurs ajoutées aux problématiques posées par les métiers d’entreprise.

Les arbres de décision et méthodes de sous-espaces aléatoires

Une autre approche nécessaire pour répondre à certaines difficultés métiers. Les arbres de décisions (CART, …), les méthodes de sous espaces-aléatoires ou bagging/boostrap et les algorithmes tels que les forêts aléatoires (random forest) sont abordés dans ce module. Une attention particulière est apportée à la manière d’interpréter les résultats et à optimiser ces arbres par l’élagage notamment. Les arbres de décisions sont une approche différente et complémentaire aux autres méthodes précédentes.