Aller au contenu
Langage & Développement informatique

Python – Data Science : manipuler et visualiser les données

Cette formation de 21 heures permet d’apprendre à manipuler, analyser et visualiser des données avec Python. Elle s’appuie sur les bibliothèques pandas, numpy, matplotlib et seaborn pour réaliser des analyses…

21h
Avancé
Blended

Description de la formation

Manipulation de données avec pandas

  • Présentation de la data science et de pandas
  • Lecture de fichiers (CSV), exploration de DataFrames
  • Nettoyage : valeurs manquantes, typage, renommage
  • Filtres, tris, regroupements, description statistique

Analyse numérique avec numpy & pandas

  • Utilisation de numpy (tableaux, fonctions statistiques)
  • Création de colonnes calculées
  • Agrégations, regroupements avancés (groupby)
  • Recodage, mapping, conditions multiples

Visualisation avec matplotlib & seaborn

  • Diagrammes (barres, lignes, histogrammes)
  • Boxplots, heatmaps, pairplots avec seaborn
  • Mise en forme de graphiques (titres, légendes, couleurs)
  • Projet final : analyse visuelle d’un jeu de données réel

Objectifs pédagogiques

  • Charger, nettoyer et structurer des jeux de données avec pandas
  • Réaliser des traitements numériques et statistiques avec numpy et pandas
  • Créer des visualisations de données (histogrammes, courbes, boxplots…)
  • Explorer les relations entre variables et restituer une analyse complète

Programme détaillé

Module 1 Manipulation de données avec pandas
  • Présentation de la data science et de pandas
  • Lecture de fichiers (CSV), exploration de DataFrames
  • Nettoyage : valeurs manquantes, typage, renommage
  • Filtres, tris, regroupements, description statistique
Module 2 Analyse numérique avec numpy & pandas
  • Utilisation de numpy (tableaux, fonctions statistiques)
  • Création de colonnes calculées
  • Agrégations, regroupements avancés (groupby)
  • Recodage, mapping, conditions multiples
Module 3 Visualisation avec matplotlib & seaborn
  • Diagrammes (barres, lignes, histogrammes)
  • Boxplots, heatmaps, pairplots avec seaborn
  • Mise en forme de graphiques (titres, légendes, couleurs)
  • Projet final : analyse visuelle d’un jeu de données réel

Prérequis

  • Bonne maîtrise de Python (structures, fonctions, boucles, fichiers)
  • Connaissances de base en statistiques appréciées

Public visé

  • Toute personne souhaitant s’initier à la Data Science via Python : analystes, techniciens, professionnels en reconversion, développeurs ou étudiants

Modalités de la formation

  • ⏱ Durée : 21h
  • 📍 Format : Mixte (présentiel + distanciel)
  • 📊 Niveau d'entrée : Avancé
  • 👥 Effectif : 4 à 12 stagiaires (groupe restreint)
  • 🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
  • ♿ Accessibilité : Formations accessibles aux personnes en situation de handicap. Contactez notre référent handicap.