Formation Data-Analyst
-
Niveau : initiation
-
Durée : 10 jours (cours en direct et pratique) + 5 jours (mise en situation professionnelle)
-
Dates : Nous contacter
-
Nombre de participant : 7 maximum
-
Prérequis : Savoir naviguer sous Windows.
-
Modalités d’évaluation : Exercices évalués tout le long de la formation. Cas pratiques évalués. (Potentiellement avec des QCM)
-
Accessibilité aux personnes handicapées : Cette formation est accessible aux personnes en situation de handicap, nous contacter.
-
Prérequis : Apprécier les mathématiques est un plus
-
Financements : Pôle emploi / OPCO / La Région / CPIR
OBJECTIFS :
· Interroger des bases de données afin de récupérer les données pertinentes
· Maîtriser les concepts mathématiques clés permettant l’analyse de données
· Initiation au langage Python et aux modules du data
· Explorer des données, tester des hypothèses statistiques et modéliser des phénomènes
· Rédiger un rapport impactant permettant de présenter votre analyse
– S’initier aux éléments du langage Python nécessaires aux data analyst. Savoir installer Jupyter Notebook. S’initier aux statistiques descriptives et inférentielles.
– S’initier aux modules Numpy, Pandas, Matplolib, Seaborn et Scikit-learn, bibliothèques phares du data permettant les calculs statistiques, algébriques et la visualisation de données.
– Apprendre à repérer et rectifier les erreurs présentes dans les données support autrement dit apprendre à nettoyer les données.
– S’initier à l’algèbre relationnelle avec le langage SQL. Manipuler de l’information à l’aide de différentes opérations. Composer des requêtes simples.
– Découvrir les mesures de tendance centrale. Comprendre les mesures de dispersion. Appréhender les mesures de forme.
– Rechercher et analyser les corrélations entre deux variables. Comprendre le modèle ANOVA. Effectuer le test du khi-2.
– Concevoir un plan de rapport statistique impactant. Représenter graphiquement des données statistiques.
– Appréhender les espaces vectoriels euclidiens. Réaliser une réduction de dimension. Interpréter une analyse en composantes principales.
– Utiliser un algorithme de clustering pour réaliser une catégorisation de données. Réaliser une classification hiérarchique.
– Appliquer et interpréter une régression linéaire simple, une régression linéaire multiple, une régression logistique et une analyse de la variance pour effectuer des prédictions.