Langage & Développement informatique

Web Scraping – Récolter des données sur le web avec Python

Cette formation de 28 heures permet d’apprendre à collecter automatiquement des données depuis le web en utilisant Python. Les participants apprendront à cibler, extraire, structurer et exploiter des données publiques,…

28h

Intermédiaire

Mixte

Description de la formation

Cette formation Web Scraping avec Python s’adresse aux développeurs, data analysts et professionnels IT souhaitant maîtriser l’extraction automatisée de données web. En 28 heures, vous apprenez à scraper efficacement des sites, gérer les données structurées, respecter l’éthique du web et optimiser vos scripts Python pour des projets data-driven.

Au programme : fondamentaux du web scraping, bibliothèques essentielles (BeautifulSoup, Selenium, Scrapy), gestion des données JSON et CSV, contournement des obstacles techniques, et bonnes pratiques légales. Cette formation mixte (distanciel et présentiel) combine théorie et travaux pratiques pour une montée en compétences immédiate.

ESIC, organisme certifié Qualiopi, accompagne chaque apprenant individuellement. La formation est éligible CPF et finançable via l’OPCO de votre secteur ou France Travail. Un suivi personnalisé garantit votre réussite et votre employabilité sur le marché de la data.

Objectifs pédagogiques

Extraire des données structurées depuis des pages HTML avec Python
Naviguer sur des sites dynamiques ou paginés pour collecter de l’information
Utiliser `requests`, `BeautifulSoup` et `Selenium` pour automatiser la récupération de contenu
Structurer, stocker et exploiter les données collectées dans le respect de la réglementation

Programme détaillé

Module 1 Introduction & premiers scrapers

Notions essentielles du web : HTML, DOM, HTTP
Librairies Python : `requests`, `BeautifulSoup`
Scraping d’éléments simples (titres, paragraphes, liens, tableaux)
Structuration et stockage basique (CSV, JSON)

Module 2 Scraping structuré et multipage

Utilisation des sélecteurs CSS et XPath
Gestion de la pagination (URLs dynamiques, liens « suivant »)
Scraping de données tabulaires
Stockage dans SQLite

Module 3 Sites dynamiques et robustesse

Scraping de contenu dynamique avec `Selenium`
Gestion des délais, exceptions, cookies et headers
Navigation avec drivers headless, aléatoire, anti-bot
Authentification simple simulée (formulaire, session)

Module 4 Projet final, éthique & RGPD

Projet fil rouge : extraction complète d’un site web
Structuration et nettoyage des données (finalisation CSV/SQLite)
Bonnes pratiques légales : robots.txt, CGU, RGPD
Présentation et documentation du projet

Prérequis

Bases solides en Python (boucles, fonctions, dictionnaires, fichiers).
Notions HTML utiles mais non indispensables.

Public visé

Développeurs Python, analystes, chargés de veille ou professionnels de la donnée souhaitant automatiser la collecte d’informations web.

Modalités de la formation

⏱ Durée : 28h
📍 Format : Mixte (présentiel + distanciel)
📊 Niveau d'entrée : Intermédiaire
🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
🗓️ Délai d'accès : variable selon le mode de financement, généralement de 11 jours ouvrés à 1 mois après l'inscription. En savoir plus.
♿ Accessibilité : Chaque demande émanant d'une personne en situation de handicap fait l'objet d'une étude de faisabilité et d'adaptation. Contactez notre référent handicap.

🏆

Passage de la certification obligatoire

Cette formation se conclut par le passage d'une certification officielle, indispensable à la validation de votre parcours.

Certification(s) : TP – Assistant de vie aux familles

Équipe pédagogique

Nos formations sont conçues et animées par une équipe de formateurs experts, sélectionnés pour leur double compétence : une expertise métier acquise sur le terrain et une réelle expérience pédagogique. Le suivi de chaque apprenant est assuré par un référent pédagogique dédié.

Formateurs professionnels spécialistes de leur domaine, en veille permanente sur les évolutions du secteur
Référent pédagogique dédié, disponible tout au long du parcours
Contenus régulièrement actualisés et adaptés au niveau de chaque participant
Référent handicap pour l'accueil et l'adaptation des personnes en situation de handicap

Ressources pédagogiques

Support de cours PDF
Scripts d’exemples annotés (scraping de base, avancé, dynamique)
Fiches mémo (requests, BeautifulSoup, Selenium)
Modèle de projet complet commenté

Suivi de l'exécution et évaluation

Exercices pratiques à chaque session
Évaluation du projet final (fonctionnalité + conformité)
Feuille de présence
Questionnaire de satisfaction

Accessibilité

Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.

Fiche mise à jour le 7 juillet 2026.

Web Scraping – Récolter des données sur le web avec Python

Description de la formation

Objectifs pédagogiques

Programme détaillé

Prérequis

Public visé

Modalités de la formation

Équipe pédagogique

Ressources pédagogiques

Suivi de l'exécution et évaluation

Accessibilité

Cette formation prépare à

TP – Assistant de vie aux familles

Formations similaires

RGAA – Auditer l’accessibilité d’un site web ou d’une application mobile

Git / GitHub

Flutter – Développement d’applications mobiles

Les apprenants ont aussi consulté

Préparation à la certification LILATE Test d’aptitude à travailler en portugais (RS7317)

Exploiter les fonctionnalités de Microsoft Excel pour la gestion et l’analyse des données (Tosa)

Améliorer l’efficacité de sa TPE à l’aide de l’IA