Big Data : récolte et analyse de données volumineuses module Spark
Objectifs, programme, validation de la formation
Objectifs
- Comprendre le Big Data et ses enjeux
- Identifier les besoins et la problématique des directions métiers
- Construire des modèles prédictifs pour répondre à la problématique
- Construire des algorithmes pour améliorer les résultats de recherches et de ciblage
- Trouver et rassembler l’ensemble des sources de données structurées ou non structurées nécessaire à l’analyse pertinente
- Faire des recommandations business qui vont servir à la prise de décision et influencer la stratégie de l’entreprise
- Développer des métriques pertinentes d’aide à la décision
- Développer une vision globale des risques et des outils
- Identifier les opportunités à travers l’open data et les cas d’usage métiers
- Acquérir le vocabulaire lié à cet écosystème complexe
- Adapter la stratégie d’entreprise
- Concevoir un projet Big Data et acquérir les technologies (acquisition et stockage des données, traitement distribué, analyse de données à large échelle)
- Maîtriser les technologies par des études de cas concrètes
- Maîtriser les enjeux juridiques et liés à la protection des données
Description, programmation
Jour 1
Comprendre les fondamentaux de Spark et du développement Scala
* Scala Ramp up
* Introduction à Spark
* RDDs et Spark Architecture
Jour 2
Savoir créer une application spark et utilisez Dataset/ DataFrame/ Spark SQL pour traiter efficacement les données structurées
* DataSets/ DataFrames et Spark SQL
* Création d’application Spark
* Spark Streaming
Jour 3
Optimisation de Spark et utilisation des outils associés
* Caractéristiques de performance et optimisation
* (Facultatif) : Aperçu de Spark GraphX
* (Facultatif) : Apercu MLLib
Validation et sanction
Certification
Type de formation
Perfectionnement, élargissement des compétences
Métiers visés
Durée, rythme, financement
Durée
21 heures en centre
Durée indicative : 3 jours
Modalités de l'alternance -
Conventionnement Non
Conditions d'accès
Niveau d'entrée information non communiquée
Conditions spécifiques et prérequis -
Inscription
Contact renseignement Madame Laurence FAGUIER
Téléphone 04 42 16 60 70
Éligibilité de cette formation au compte personnel de formation pour les salariés
Code CPF 236441 - Validité du 02/01/2019 au 31/12/2115
Périodes prévisibles de déroulement des sessions
Session débutant le : 01/01/2020
Adresse d'inscription
255 avenue Galilée
Parc de la Duranne 13100 Aix-en-Provence
Session débutant le : 07/05/2021
Adresse d'inscription
255 avenue Galilée
Parc de la Duranne 13100 Aix-en-Provence