Big Data - Le développement d'applications et la Data visualisation



Objectifs, programme, validation de la formation

Objectifs

Développer des applications avec Spark Streaming
Utiliser la programmation parallèle sur un cluster
Exploiter des données avec Spark SQL
Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec Graphx.

Description, programmation

Big Data overview

Introduction au Big Data : de quoi s’agit-il ?
Exemples pratiques
Les technologies concernées
Les outils
Les langages :

Hortonworks
MapR
Cloudera
IBM Watson...

Démystification du Big Data
Les acteurs principaux
Les différents métiers du Big Data

Rappel

Le langage Python (application de la MapReduce)
Les mathématiques de base (algèbre, statistiques, probabilités)
Le langage SQL

Les algorithmes et analyse de données

Les concepts du Machine Learning
Les données supervisées ou non supervisées ? Quelles différences ?
Régression
Modèles linéaires
Classification
Naive Bayes
K-NN
K-Means clustering
Réseaux de neurones
Arbres de décisions et de régression
Support vector machines
Méthodes ensemblistes

Machine Learning avec : Spark et Spark Streaming

Introduction à Apache Spark
Faire du Machine learning avec Apache Spark MLlib
Traiter les données en temps réel avec Apache Spark Streaming
Faire des requêtes en format SQL avec Apache Spark SQL
Créer des graphes avec Apache Spark GraphX
Stockage basé sur les graphes

Visualisation

La valeur de la visualisation
Modèles de données et images
Données multidimensionnelles
Principes de design
Perception graphique

Restitution et pilotage

Couleurs
Itérations sur la perception
Techniques d’interactions
Exemples d’analyses : efficacité des antibiotiques
Visualisation Big Data

Certification (en option)

Nos tests de validation des compétences font partie intégrante du processus d’apprentissage car ils permettent de développer différents niveaux d’abstractions.
Solliciter l’apprenant à l’aide de nos QCM, c’est lui permettre d’étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d’ancrage mémoriel.
L’examen sera passé à la fin de la formation.

Niveau de sortie information non communiquée

Métiers visés

M1403 :

M1801 :

M1802 :

M1805 :


Durée, rythme, financement

Durée 35 heures en centre

Modalités de l'alternance -

Conventionnement Non

Conditions d'accès

Modalités de recrutement et d'admission Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Java ou Python.

Niveau d'entrée sans niveau spécifique

Conditions spécifiques et prérequis Aucune

Inscription

Contact renseignement RICHIR Agnès

Téléphone 0557190765


Éligibilité de cette formation au compte personnel de formation pour les salariés


Code CPF 235758 - Validité du 02/01/2019 au 31/12/2115


Périodes prévisibles de déroulement des sessions

Session débutant le : 23/11/2020

Adresse d'inscription
15 Bis Allée James Watt 33700 Mérignac

Lieu de formation


Organisme de formation responsable