Data scientist
Objectifs, programme, validation de la formation
Objectifs
Activités visées :
Le Data scientist est en mesure d’exercer les missions suivantes :
- agréger un ensemble de données pour ensuite les nettoyer et les structurer ;
- explorer ces données afin d’en déterminer la valeur et y repérer des motifs récurrents ou des irrégularités significatives ;
- produire de la valeur à partir des données par la création de modèles prédictifs ;
- modéliser le phénomène à l’origine des données pour répondre à un problème de l’entreprise ;
- évaluer et améliorer les performances d’un modèle d’apprentissage automatique (machine learning) ;
- rendre les données visuelles pour communiquer ses résultats ;
- établir des recommandations pour orienter les décisions stratégiques de l’entreprise.
Description, programmation
La certification permet d’attester l’acquisition des compétences suivantes :
BLOC 1 - Prétraiter et analyser des données structurées pour répondre à un problème métier.
- Déterminer les objectifs d’une analyse de données à partir d’un problème métier.
- Effectuer des opérations de nettoyage sur des données structurées.
- Effectuer une analyse statistique univariée à partir de données structurées et nettoyées.
- Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.
- Représenter des données grâce à des graphiques clairs et pertinents.Formuler des préconisations pour un traitement automatisé des données.
BLOC 2 - Entraîner un modèle d’apprentissage automatique supervisé pour réaliser une analyse prédictive. - Sélectionner et/ ou transformer les variables pertinentes pour la modélisation (feature engineering).
- Sélectionner et mettre en place un modèle d’apprentissage supervisé adapté à une problématique métier.
- Évaluer les performances d’un modèle d’apprentissage supervisé.
- Adapter les paramètres d’un modèle d’apprentissage supervisé afin de l’améliorer.BLOC 3 - Entraîner un modèle d’apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données.
- Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).
- Sélectionner et mettre en place un modèle d’apprentissage non supervisé adapté une problématique métier.
- Évaluer les performances d’un modèle d’apprentissage non supervisé.
- Adapter les paramètres d’un modèle d’apprentissage non supervisé afin de l’améliorer.BLOC 4 - Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable.
- Collecter des données répondant à des critères définis via une interface de programmation (API).
- Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.
- Prétraiter des données sous forme d’images non structurées pour obtenir un jeu de données exploitable.
- Réduire la dimension de données de grande dimension afin d’optimiser les temps de calcul.
- Représenter graphiquement des données à grandes dimensions afin d’en réaliser l’analyse exploratoire.BLOC 5 - Présenter et déployer un modèle d’apprentissage automatique auprès de ses utilisateurs finaux.
- Déployer un modèle via une interface de programmation (API) dans le web.
- Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.
- Réaliser la présentation orale d’une démarche de modélisation à un client interne/ externe.
- Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.
- Assurer
Validation et sanction
Autre titre inscrit sur demande au RNCP (niveau 7)
Type de formation
Certification
Niveau de sortie niveau I (supérieur à la maîtrise)
Métiers visés
Durée, rythme, financement
Durée 60 heures en centre
Modalités de l'alternance Se rapprocher du centre pour ces modalités
Conventionnement Oui
Conditions d'accès
Niveau d'entrée niveau I (supérieur à la maîtrise)
Conditions spécifiques et prérequis Aucune
Inscription
Contact renseignement Madame Mélanie LABRUYERE
Téléphone 03 21 60 37 00
Éligibilité de cette formation au compte personnel de formation pour les salariés
Code CPF 329069 - Validité du 07/04/2020 au 31/12/2115
Périodes prévisibles de déroulement des sessions
Session débutant le : 01/09/2021
Adresse d'inscription
Site de Lens (IUT) rue de l'université 62300 Lens
Lieu de formation
Organisme de formation responsable
Université d'Artois
Adresse
9 rue du Temple BP 10665 62000 Arras
Téléphone
Site web
http://www.univ-artois.fr/