Data science : programmation en langage R
Objectifs, programme, validation de la formation
Objectifs
Être capable, dans une démarche de data science menée par son organisation, de créer une fonction en langage R, sous forme de package, en respectant les bonnes pratiques de développement pour permettre son usage par d’autres utilisateurs dans l’environnement R
Factoriser du code pour concevoir des fonctions
Intégrer ses fonctions dans un package R
Documenter des fonctions dans les règles de l’art
Utiliser les outils de debug de fonction
Mettre en place des tests unitaires
Réussir à passer les tests de check du CRAN
Versionner son code avec git
Connaitre les bonnes pratiques de diffusion d’ un package R
Comprendre les principes de base de l’intégration continue
Découvrir la programmation fonctionnelle
Encapsuler des données
Description, programmation
Comprendre la notion de factorisation
Comprendre la notion de paramètre
Automatiser la génération de rapports Rmarkdown
Concevoir ses propres fonctions
Factoriser son code pour le réutiliser
Comprendre la notion de portée de variables
Respecter les conventions de style
Définir des paramètres par défaut
Déboguer ses fonctions
Manipuler des fichiers et des dossiers
Créer un package R
Mettre en package des fonctions simples
Utiliser devtools et usethis pour gérer les dépendances de fonctions ‘complexes’
Utiliser roxygen2 pour créer la documentation
Inclure des données dans un package
Vérifier bon fonctionnement du programme grâce aux tests unitaires
Comprendre et utiliser les tests unitaires
Choisir les bons tests
Vérifier la conformité d’un package
Auditer son package grâce aux checks du CRAN
Généraliser l’audit sur tous les systèmes d’exploitation avec rhub
Corriger les erreurs de conformité les plus fréquentes
Versionner son code avec git
Comprendre le principe de versionnage
Intégrer git dans Rstudio
Mettre en oeuvre les commandes commit, push et pull
Restaurer son projet à une version antérieure
Découvrir les principes de l’intégration continue
Comprendre les principes et enjeux de l’intégration continue
Tester automatiquement son package avec git
Publier et communiquer sur son package
Diffuser un package
Rédiger les fichiers README, NEWS, CoC ...
Découvrir la programmation fonctionnelle
Comprendre le principe de fonction pure
Itérer avec purrr
Validation et sanction
Data science : programmation en langage R ;Attestation de suivi de présence
Type de formation
Professionnalisation
Niveau de sortie sans niveau spécifique
Durée, rythme, financement
Durée
35 heures en centre
Durée indicative : 39 jours
Modalités de l'alternance FOAD : 35 h
Conventionnement Non
Conditions d'accès
Niveau d'entrée niveau III (BTS, DUT)
Conditions spécifiques et prérequis Être utilisateur quotidien ou hebdomadaire de R. Savoir compiler un document RMarkdown dans un projet RStudio. Avoir un niveau équivalent la certification analyse de données avec R.
Inscription
Contact renseignement Mme Diane Beldame
Téléphone 01 85 09 14 03
Éligibilité de cette formation au compte personnel de formation pour les salariés
Code CPF 328447 - Validité du 01/02/2020 au 31/12/2115
Périodes prévisibles de déroulement des sessions
Session débutant le : 13/09/2021
Adresse d'inscription
50 Rue Arthur Rimbaud 93300 Aubervilliers