Big Data - Le développement d'applications et la Data visualisation
Objectifs, programme, validation de la formation
Objectifs
Développer des applications avec Spark Streaming
Utiliser la programmation parallèle sur un cluster
Exploiter des données avec Spark SQL
Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec Graphx.
Description, programmation
Big Data overview
Introduction au Big Data : de quoi s’agit-il ?
Exemples pratiques
Les technologies concernées
Les outils
Les langages :
Hortonworks
MapR
Cloudera
IBM Watson...
Démystification du Big Data
Les acteurs principaux
Les différents métiers du Big Data
Rappel
Le langage Python (application de la MapReduce)
Les mathématiques de base (algèbre, statistiques, probabilités)
Le langage SQL
Les algorithmes et analyse de données
Les concepts du Machine Learning
Les données supervisées ou non supervisées ? Quelles différences ?
Régression
Modèles linéaires
Classification
Naive Bayes
K-NN
K-Means clustering
Réseaux de neurones
Arbres de décisions et de régression
Support vector machines
Méthodes ensemblistes
Machine Learning avec : Spark et Spark Streaming
Introduction à Apache Spark
Faire du Machine learning avec Apache Spark MLlib
Traiter les données en temps réel avec Apache Spark Streaming
Faire des requêtes en format SQL avec Apache Spark SQL
Créer des graphes avec Apache Spark GraphX
Stockage basé sur les graphes
Visualisation
La valeur de la visualisation
Modèles de données et images
Données multidimensionnelles
Principes de design
Perception graphique
Restitution et pilotage
Couleurs
Itérations sur la perception
Techniques d’interactions
Exemples d’analyses : efficacité des antibiotiques
Visualisation Big Data
Certification (en option)
Nos tests de validation des compétences font partie intégrante du processus d’apprentissage car ils permettent de développer différents niveaux d’abstractions.
Solliciter l’apprenant à l’aide de nos QCM, c’est lui permettre d’étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d’ancrage mémoriel.
L’examen sera passé à la fin de la formation.
Niveau de sortie information non communiquée
Métiers visés
Durée, rythme, financement
Durée 35 heures en centre
Modalités de l'alternance -
Conventionnement Non
Conditions d'accès
Modalités de recrutement et d'admission Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Java ou Python.
Niveau d'entrée sans niveau spécifique
Conditions spécifiques et prérequis Aucune
Inscription
Contact renseignement RICHIR Agnès
Téléphone 0557190765
Éligibilité de cette formation au compte personnel de formation pour les salariés
Code CPF 235758 - Validité du 02/01/2019 au 31/12/2115
Périodes prévisibles de déroulement des sessions
Session débutant le : 23/11/2020
Adresse d'inscription
15 Bis Allée James Watt 33700 Mérignac
Lieu de formation
Adresse :
Organisme de formation responsable
M2I FORMATION MERIGNAC
Adresse
15 B allée James Watt 33700 Mérignac
Téléphone