IA | Extraction de données structurées et non structurées – Data Engineering & Architecture des données – Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle

129 heures sur 30 jours
Distanciel
Sur-mesure

Programme de la formation

Module 1 – Automatiser l’extraction de données non structurées et/ou structurées
  • Extraire des données non structurées depuis un service web et une page web (scraping).
  • Extraire des données structurées depuis un fichier et une base de données.
  • Interagir avec un système big data.
  • Programmer le script adapté afin de pérenniser la collecte des données nécessaires au projet.
Module 2 – Développer des requêtes SQL d’extraction depuis un système de gestion de base de données
  • Appliquer le langage SQL propre au système de gestion de base de données.
  • Développer des requêtes d’extraction complexes.
  • Interroger un système big data via un langage de requête adapté.
  • Préparer la collecte des données nécessaires au projet.
Module 3 – Nettoyer des données en développant des règles d’agrégation et d’homogénéisation des données
  • Agréger des données issues de différentes sources.
  • Programmer la suppression des entrées corrompues.
  • Programmer l’homogénéisation des formats des données.
  • Structurer le jeu de données final prêt au stockage.
Module 4 – Créer une base de données dans le respect du RGPD
  • Élaborer les modèles conceptuels des données.
  • Élaborer les modèles physiques des données.
  • Programmer l’import des données préparées.
  • Appliquer les principes du RGPD au stockage du jeu de données.
Module 5 – Développer une API REST mettant à disposition le jeu de données
  • Concevoir une architecture REST.
  • Développer une API permettant l’exploitation du jeu de données.
  • Mettre à disposition les données pour les autres composants du projet.
  • Documenter les endpoints.

Objectifs de formation

  • Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier, une base de données et un système big data.
  • Développer des requêtes SQL d’extraction adaptées au système de gestion de base de données.
  • Développer des règles d’agrégation et d’homogénéisation des données issues de différentes sources.
  • Créer une base de données dans le respect du RGPD à partir des données préparées.
  • Développer une API REST mettant à disposition le jeu de données.

Taux de satisfaction des apprenants

Non disponible à ce jour sur 2026.

Public cible

  • Pour tout candidat sans prérequis de diplôme ou d'expérience professionnelle.
  • Tous secteurs d’activité.
  • Pour les entreprises qui innovent et imaginent les cas d'usages de l'intelligence artificielle : les industries, les startup, les TPE, les PME, et les majors du numériques.
  • Pour les entreprises qui vendent des services d'intelligence artificielle : les agence web, les ESN, les majors du numériques, les éditeurs de services.
  • Pour les entreprises qui exploitent l'intelligence artificielle pour leur développement ou leur stratégie : les grands comptes, les banques et assurances, la grande distribution et le transport.
  • La compréhension du métier de développeur en intelligence artificielle.

Prérequis

  • Avoir un Bac+2 scientifique, informatique ou tertiaire,
  • La maîtrise des compétences informatiques fondamentales : utilisation d'un système de fichiers d'un système d'exploitation, navigation internet, installation d'applications ;
  • La maîtrise du français au niveau B2 ;
  • Avoir une bonne connexion internet
  • Avoir un ordinateur, une webcam et un micro

Équipe pédagogique

• Intervenants : professionnels dans le domaine et aguerris aux méthodes pédagogiquesPersonnes en charge du suivi :
• Coordinatrice des relations clients et des inscriptions : Mélanie Garinet
• Coordinatrice des examens et des certifications : Allison Foulon
• Responsable technique et pédagogique : Jean-Denis Coindre
• Tel : 06 89 44 06 97
• Email : contact@evolution5.frOutils techniques de la visio :
Lors de la convocation, vous recevrez la procédure pour vous connecter (logiciel, lien et accès pour la visio)

Ressources pédagogiques

  • Exercices / Cas pratiques
  • Livret de formation
  • Les vidéos E-Learning seront accessibles sur notre plateforme Digiforma

Modalités d'évaluation

  • Cas pratiques et mises en situation professionnelle, faisant l'objet d'une soutenance orale devant le jury de certification ainsi que d'un rendu de livrables en amont de la soutenance orale.
  • Evaluation de connaissances au démarrage
  • Formation à distance en visio avec exercices en inter-sessions. (Pour les entreprises : la formation peut se dérouler intra-entreprise et dans leurs locaux)
  • Certificat de réalisation de formation
  • Jury devant des professionnels

Modalités de certification

Résultats attendus à l'issue de la formation
C1 Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet. C2 Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet. C3 Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final. C4 Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet. C5 Développer une API mettant à disposition le jeu de données en utilisant l’architecture REST afin de permettre l’exploitation du jeu de données par les autres composants du projet.
Modalité d'obtention
Cas pratiques et mises en situation professionnelle, faisant l'objet d'une soutenance orale devant le jury de certification ainsi que d'un rendu de livrables en amont de la soutenance orale.
Détails sur la certification

RNCP 37827 BC01
"Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle"
Centre de formation : EVOLUTION5
Centre Certificateur : SIMPLON

Accessibilité

Accessibilité ou possibilités d’adaptation des modalités proposées aux apprenants en situation de handicap. Nos formations sont accessibles aux personnes en situation de handicap, nous contacter. Nous étudions toutes les situations pour envisager une intégration dans la formation, pour cela n’hésitez pas à nous faire part de vos besoins au moment de votre inscription. Si malgré tous nos efforts, il nous était impossible d’adapter notre accueil, nous prévoyons une orientation vers des organismes appropriés.

Délai d'accès

15 jours

IA | Extraction de données structurées et non structurées - Data Engineering & Architecture des données - Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle

Capacité 6

Prix 4500 € net de TVA

Durée 129 heures sur 30 jours

Vous êtes intéressé par cette formation ?

Créé le 11 février 2026 ● dernière mise à jour le 09 juin 2026